CPUアーキテクチャについて語れ 38at JISAKU
CPUアーキテクチャについて語れ 38 - 暇つぶし2ch317:Socket774
17/07/21 18:01:28.61 wQyd8Rmf.net
K40 1.6TFlops GDDR5 24GB
S9170 2.5TFlops GDDR 32GB
囲い込みがなけりゃ普通に使うでしょ

318:Socket774
17/07/21 18:39:16.14 kpQetUQX.net
実用的じゃ無かっただけだろ

319:Socket774
17/07/21 18:56:54.01 bXziR1C7.net
EPYCにはCUDAの囲い込みを無効化する謎の機能が積んであるらしいな。

320:Socket774
17/07/21 19:04:24.29 HgxbDnV0.net
控えめな実装ながら完成度が高いEPYCのFLOATING POINTユニット、EPYCの実力はHPCでも発揮されるか
URLリンク(www.weblog-tech.nagoya)

321:Socket774
17/07/21 19:17:33.07 wQyd8Rmf.net
何で低性能なTeslaと無能なCUDAを使わないといけないかな
最適化が仕事のサーバーのプロ連中ならGCNやHBCCの対応は問題ないでしょ
サーバーレベルなら、メモリ量もメモリ空間も大きければ大きいほどいいのはCPUと一緒
CUDAの弱点は正にそこで、狭いメモリで四苦八苦しなけりゃならん、面倒が多い
その面倒さがOpenCLより楽というだけ
GCNやVegaならそんな問題ほぼ無くなる、まあローカルで32GBや、HBCCで500TBとかだからね

322:Socket774
17/07/21 19:23:40.36 bXziR1C7.net
>>309
それだとホストがXeonでも関係ないしEPYCを待つまでもなくS9170はとっくに売れているはずですよね?

323:Socket774
17/07/21 19:44:55.23 hLQIKO+W.net
cudaはpascalからubifiedメモリがかなり使えようになったので、だいぶコードの実装は楽になったよ。

324:,,・´∀`・,,)っ-○○○
17/07/21 19:50:59.73 fmd2QO6P.net
ソケット版Knights Landingの一番安い64コアのが1700ドル程度だしS9170は演算用としては今更感

325:Socket774
17/07/21 20:12:36.85 803FF18t.net
EPYC+VEGAが凄い事になったりしてw
隠しコマンド満載で

326:Socket774
17/07/21 20:16:24.21 O2+SeVyL.net
自爆コマンドか

327:Socket774
17/07/21 20:22:33.66 wQyd8Rmf.net
>>310
CUDAで囲い込まれて、そういうことにも気づかない馬鹿ばかりになったからでしょ
CPUとの面倒なメモリ間のやり取りや、少ないローカルメモリだけでどうやってやりくりするかがGPGPUには当たり前とか思い込まされてる
IntelのPhiはそこの解消を利点にしてる
演算だけならPhiは理想にかなり近い
ただ、グラフィック処理ができないから一般向けには使えないけど

328:Socket774
17/07/21 20:25:49.10 wQyd8Rmf.net
>>311
あくまでソフト的なシェアードだから内部じゃ面倒な処理をしていて、コードは楽になっても実際の処理時間は変わらないよ
それを根本的に解決するためにNVLinkを作ってる
まあ、IntelもAMDも無視してるけど

329:Socket774
17/07/21 20:31:39.80 bXziR1C7.net
>>315
CPUをXeonからEPYCにするだけで何故か馬鹿の目が覚めると?

330:Socket774
17/07/21 20:41:52.88 wQyd8Rmf.net
> ソケット版Knights Landingの一番安い64コアのが1700ドル程度だしS9170は演算用としては今更感
ソケットにはメモリ8ch 1TB、PCIe 128レーン対応のEPYC刺すだろ、それにVegaやS9170を4枚位刺すだけの簡単な仕事
あくまで倍精度対応のVega20 HBM2 32GBが来るまでの繋ぎとしてだけど

331:Socket774
17/07/21 20:47:10.19 wQyd8Rmf.net
>>317
EPYCとFireProやVegaの組合せでね
ハードウェアは揃ってるし、環境もOpenCL2.x使えば基本的な対応はできる
あとは時間とコストの問題だな

332:Socket774
17/07/21 20:56:41.82 wQyd8Rmf.net
CPUだけ、GPUだけの性能向上がもう限界近いのは、まあ大体薄々気付いてるでしょ
CPUはシングル性能と熱/電力、GPUはメモリ帯域と容量
その辺の壁を超える方法が他にあるなら逆に教えてほしいところ
もちろんx86とWindows/Linuxで対応できる範囲かつ、ツクモとかで買えるくらい一般的になる方法で

333:Socket774
17/07/21 20:59:26.83 X8MYxcis.net
CPUもGPUもGlobalFoundriesの7LPで限界突破する
なんせ今3GHzをターゲットにした製造プロセスを7LPは一気に5GHzをターゲットしてんだからな

334:Socket774
17/07/21 21:03:51.14 RhYyxNkc.net
いきなり5GHzってちょっとキナ臭いよなw
まぁGPUの方はコンスタントに向上するだろう
ただ、CPUもGPUみたいにコア数増やしてクロック下げるぐらいしか無さそうなんだよな
正直このままだといつかはARMに追い越されると思う

335:Socket774
17/07/21 21:05:53.59 dlinmgdc.net
5GHzはIBMが作るCPU向けの数字だろう
今でも5GHzは余裕で超えてるからな
Zenはそこまでクロックを伸ばす設計になってない

336:Socket774
17/07/21 21:25:06.85 wQyd8Rmf.net
今よりはクロック上がるということでしょ
OC限界が5GHz位になるんじゃないかな

337:Socket774
17/07/21 21:25:57.86 X8MYxcis.net
見てみろ
URLリンク(www.globalfoundries.com)

338:Socket774
17/07/21 21:29:35.68 803FF18t.net
ペン4は10Gなんてホラってたなぁ(遠い目

339:Socket774
17/07/21 21:37:55.89 tmkYrc1S.net
消費電力を抑えられるならクロック上げるのが確実だからな
Netburstはある意味速すぎたw
その後IBMやSCE、AMDもNetburstの後を追ったわけで
Zenの革新性の無さ、CoreやAVX、AppleとARMの行き詰まりを見るに結局消費電力抑えてクロック上げるかアクセラレータてんこ盛りヘテロしか道がない

340:Socket774
17/07/21 22:27:27.32 dRe9CMpW.net
ならItanium買い支えてやれよ
あっちのが革新的だろ
さあ、買え

341:,,・´∀`・,,)っ-○○○
17/07/21 22:52:13.81 r3KCSozw.net
>>318
EPYC(笑)は倍精度最大560GFLOPSとPhiの3割未満の性能なのでお呼びではない

342:Socket774
17/07/21 22:58:25.01 vGwf95yi.net
また訳のわからんことを言い始める

343:Socket774
17/07/21 23:14:57.92 wQyd8Rmf.net
とうとうCPUとアクセラレーターで比べるようになった
怖がりすぎだろ
Xeon Phi 7290 6ch 最大384GB MCDRAM 16GB PCIe 36レーン、Vt-d、Vt-x非対応
セキュリティーと信頼性はAES以外非対応(SGX、MPX)
URLリンク(ark.intel.com)
メモリ少なすぎる、PCIe 少なすぎる、セキュリティ弱すぎ、仮想化非対応
これXeonの代わりに使うとか冗談でしょ?

344:Socket774
17/07/21 23:34:34.33 e2md/MqE.net
EPYCとPhiかなり相性良いはずだから団子がAMD嫌いすぎて逆神くる気がする

345:,,・´∀`・,,)っ-○○○
17/07/21 23:50:30.69 kqgozqPW.net
TXTやSGX対応してないのがダメだと言ったらものすごいブーメラン食らう企業があってだな…
Phiは100GB/sのDDR4と480GB/sをシームレスにデータ交換できるのが売りなんだけどな

ちなみにこの構成だとPCIeレーン数32本も出せないぞ
URLリンク(www.tweaktown.com)


346:-spotted-features-32-cores/index.html



347:,,・´∀`・,,)っ-○○○
17/07/21 23:51:56.42 kqgozqPW.net
>>332
LGA3647に刺さらないEPYCとPhiの相性ってなに?
IntelからOmni-Pathライセンスしてもらったの?

348:Socket774
17/07/22 00:12:59.22 FPjMMyKZ.net
Xeon Phiは基本ソケットタイプ
PCIeに刺すコプロタイプの一番いいやつ
URLリンク(ark.intel.com)
7120A 61C/244T 1.2TFlops GDDR5 16GB
S9170の半分以下の性能、正直ショボい
もうすぐ出るのがコレ
URLリンク(www.intel.co.za)
7220A 68C/272T 3.5TFlops 1.4GHz MCDRAM 16GB 500GB./s
S9170よりは多少マシ、倍精度以外はVega10の半分くらい

349:Socket774
17/07/22 00:20:06.20 FPjMMyKZ.net
団子はソケットタイプとコプロタイプの2種類あるの知らないのかな?
どっちも本職には勝てない中途半端な代物なんだよね
CPU性能はXeonやEPYCにボロ負け、GPGPU性能はS9170よりマシな程度でP100やV100やVegaにはボロ負け
Intelの政治力である程度数を売れてシェア取れるけど、そこから先には行けない
スマフォ向けのAtomと一緒、売れてるように見えるだけ、スペックで負けてるから先がない

350:,,・´∀`・,,)っ-○○○
17/07/22 00:35:15.42 a4Nu/Pop.net
>>336
で?「相性」ってなんだ?
PCIeカード版はDDR4メモリを載せられない劣化版で、HPC界隈でもほぼ存在無視されてるレベルなんですけど?

351:,,・´∀`・,,)っ-○○○
17/07/22 00:36:24.34 a4Nu/Pop.net
GPGPU性能(笑)ってGPUじゃないものには当てはまらないよ。強いて言えばGPU以外は0だ

352:Socket774
17/07/22 00:52:00.27 RiKuRaha.net
CUDAはプログラムが組みにくい部分があるが、それでも通常のCPU実行に比べて
100倍1000倍とか場合によってはそれ以上の高速化ののメリットがあるから、
つかわれてるんだよ
また10年以上のソフトウェア資産がある
フリーや商用含めいろんなプログラムがあるし、
サンプルコードも多いので車輪の再発名をしなくていい

353:Socket774
17/07/22 01:00:41.32 FPjMMyKZ.net
> で?「相性」ってなんだ?
相性って何の話?
> GPGPU性能(笑)ってGPUじゃないものには当てはまらないよ。強いて言えばGPU以外は0だ
揚げ足取りとか、そんなツマラン返ししか出来ないのか

354:,,・´∀`・,,)っ-○○○
17/07/22 01:01:20.36 a4Nu/Pop.net
逆にRadeonのGPGPU開発環境に10年の歴史がない理由を考えてみよう

355:Socket774
17/07/22 01:06:36.48 c5hFHACK.net
Apple相手の商売してるからユーザーに負担押し付けてしないお前らが悪いんだという悪習に染まっている

356:,,・´∀`・,,)っ-○○○
17/07/22 01:08:12.20 a4Nu/Pop.net
>>340
>>332

まあ、Xeonと繋いで分散処理したいなら、メモリ容量に制限のあるPCIe版よりも、DDR4使えるソケット版でOmni-PathやInfinibandで繋いだ方がはるかにいいけどな
東大やNERSCのそれはXeonすら不要でやってるが

357:Socket774
17/07/22 01:17:30.05 kKgHtFFO.net
>>343
phiなんかDDR4があってもなくても変わらんぞ。
キャッシュモードで使うとレイテンシがでかいし、
quadrantモードで使うと16Gを超えたら遅くて意味ないしな。何よりタイルの割り当てをしっかりやらんとパフォーマンスが出ないからな。
だったらヘテロなPCIE経由で使う方がまだマシだよ。

358:Socket774
17/07/22 01:22:33.79 FPjMMyKZ.net
>>339
GPGPU自体がCPUとは別物だから難しいのは仕方ない
高速化はRadeonでも�


359:翌スようなもの 10年程度の資産じゃ大したことないな 何十年も資産があるx86だってARMの進出に怯えてる程度、歴史あるPowerなんかとっくにシェア数%しか無い http://news.mynavi.jp/series/pascal/004/ 明示的にPrefetchを行わせることもできるようになった。 何よりも、ページ単位ではCPUとGPUのメモリのコヒーレンスが維持できるようになり、両者のデータアクセスが容易になるというメリットが生まれる。 Nvidiaの次世代の肝がこのNVlinkなのは、まあ誰もが疑わないだろうね やろうとしてることはAPUやHSAやGCNと全く一緒、ただしPower9限定



360:Socket774
17/07/22 01:36:41.14 FPjMMyKZ.net
> まあ、Xeonと繋いで分散処理したいなら、メモリ容量に制限のあるPCIe版よりも、DDR4使えるソケット版でOmni-PathやInfinibandで繋いだ方がはるかにいいけどな
Vega「メモリ容量に制限?そんなのあるんだな、メインメモリもSSDも含めて512TBまで使える自分には関係ないな、
それに繋げるのなんかPCIeでCPU直結でいいだろ」
EPYC 2Pで4TB、Vega10x4でHBM2 64GB、NVMe SSD 最大24個、全部仮想メモリとして使える

361:,,・´∀`・,,)っ-○○○
17/07/22 05:30:30.63 a4Nu/Pop.net
HDDやSSDが何百倍遅いかも知らないなんて

362:Socket774
17/07/22 05:32:42.18 UxeNCzD8.net
>>347
詳しく

363:Socket774
17/07/22 05:52:40.98 IGv/57Js.net
おそいけど
結局HBM2コピーして処理するキャッシュ

364:Socket774
17/07/22 06:30:49.43 KoK+XTRR.net
>>347
HMCディスるのはやめろ

365:,,・´∀`・,,)っ-○○○
17/07/22 07:09:36.35 a4Nu/Pop.net
VEGA世代のGPUのメモリ帯域、結局KNLに勝ててるものないよね

366:,,・´∀`・,,)っ-○○○
17/07/22 07:23:07.96 NvgX1DN+.net
PCIe 3.0の帯域はx16で片方向でたったの16GB/sですけど

TBクラスのDIMM積むと必然的にメモコンのクロックも1866MHzになるし、InfinityFabricホストの帯域も1ダイ30GBちょっとしか出なくなる

GPU間メモリの同期なんてやり始めた日には…アイタタタタ
ファンボーイの頭の悪さはInfinity
EPYCは頭打ち

367:Socket774
17/07/22 07:24:20.37 gL/j5gKo.net
でもKNLじゃDirectX対応してないから絵に描いた餅ですよね?

368:,,・´∀`・,,)っ-○○○
17/07/22 07:25:31.85 NvgX1DN+.net
DirectXでスパコンのプログラム書くの?
なつやすみのしゅくだいはにちゃんねるのもうそうですか?

369:Socket774
17/07/22 07:26:10.74 X3/CEOS5.net
この人は嫌いな物ディスることしか出来ないんですかね…
そんなんで生きてて楽しい?

370:Socket774
17/07/22 07:26:47.21 pJPuyj8E.net
>>352
USB3.1は何GB/秒なの?

371:Socket774
17/07/22 07:27:49.10 m+3JwrZS.net
>>354
でもお前自身スパコン持ってないんでしょ?
絵に描いた餅を語ってるのは同じだねw

372:,,・´∀`・,,)っ-○○○
17/07/22 07:34:46.30 NvgX1DN+.net
>>356
10ギガ[ビット]毎秒

373:,,・´∀`・,,)っ-○○○
17/07/22 07:35:36.10 NvgX1DN+.net
単発IDが捗るな

374:,,・´∀`・,,)っ-○○○
17/07/22 07:36:11.70 NvgX1DN+.net
>>350
コレ意味不明

375:Socket774
17/07/22 07:38:32.48 6z50kFPD.net
>>355
妄執が酷いパラノイアだから楽しいんやろ

376:Socket774
17/07/22 07:45:13.18 /JBujUXZ.net
ZenもVegaも14LPPと言う不利な条件で戦わされてるだけで
Zen2とNaviでは状況が変わって製造プロセスで初めて優位な戦い出来るわけで競争力が全く違うからな

377:Socket774
17/07/22 07:51:44.11 EOK035uz.net
AMDのHPCはHPC向けAPUというのをさっさと出してくれんとなんとも言えん。
日本勢はPEZYがMIPS+メニーコア、富士通がSPARC+ARMたくさんなので、
メインプロセッサ+多コアという意味で


378:はAPUも近いかもしれん。



379:Socket774
17/07/22 07:54:59.14 6z50kFPD.net
早くAPUはでてほしいね
自作的にも面白いと思うし

380:,,・´∀`・,,)っ-○○○
17/07/22 07:56:38.21 NvgX1DN+.net
自分でその状況選んでおけば世話ないだろ
一番の問題はソフト開発に行き詰まってすぐ投げ出すことだ
Brook+/CALも10年続けてれば立派なソフト資産の蓄積になっただろうに、すぐに投げ出すし、ソフトベンダーに開発支援もしない

381:,,・´∀`・,,)っ-○○○
17/07/22 08:01:11.33 NvgX1DN+.net
>>363
富士通がSPARCとARMの混載ってどこ発信のデムパだよ
ポスト京はARMのホモジニアスアーキテクチャだってとっくに確定してんぞ
URLリンク(journal.jp.fujitsu.com)

382:,,・´∀`・,,)っ-○○○
17/07/22 08:17:09.50 NvgX1DN+.net
>>362はPolarisが28nmのKepler/Maxwellにも劣ってたことを忘れているらしい

十分熟成してから出さないと不良品を出荷しまくって交換しまくる羽目になるぞ

383:Socket774
17/07/22 08:26:10.93 /JBujUXZ.net
>>367
お前のその妄想癖すげぇはw

384:,,・´∀`・,,)っ-○○○
17/07/22 08:43:05.03 NvgX1DN+.net
お仲間の妄想に違和感を感じないのは単発自演だからですか?

385:Socket774
17/07/22 09:05:32.36 X6aAtf9h.net
VEGAとPhiのメモリ帯域ってVEGA FEは480GB/sだけどPhiって実効で500GB/s超えないくらいでしょ。VEGAは今後32GBが見えてるから帯域倍増がある。
EPYCがPCIe版のPhiと相性がいいのは下位モデルでもレーン数が多いからとりあえずいっぱいさせるところでしょ。

386:Socket774
17/07/22 09:40:20.61 EOK035uz.net
小規模なシミュレーションならそれでいいだろうが、EPYCのインターコネクトってどうなってんの?

387:Socket774
17/07/22 09:48:20.78 FPjMMyKZ.net
SSDやHDDの仮想メモリ馬鹿にするとか、コンピューター自体を馬鹿にしてるのと一緒
あとキャッシュやTempフォルダとかもキャッシュの一種だから似たようなもの

388:Socket774
17/07/22 09:57:52.51 FPjMMyKZ.net
Xeon Phi(MCDRAM 16GB)
URLリンク(prohardver.hu)
Vega10(HBM2 16GB)
URLリンク(www.4gamer.net)
まあ、フル実装でこんなんじゃHMC(MCDRAM)がHBM2に勝てるわけないよな

389:Socket774
17/07/22 10:03:36.38 FPjMMyKZ.net
> VEGA世代のGPUのメモリ帯域、結局KNLに勝ててるものないよね
Vega20 4スタック 1TB/s 32GB
KNL 8スタック? 512GB/s 16GB

390:Socket774
17/07/22 10:38:16.66 h1wS6NNV.net
アクセラレータを一杯積みたいだけなら1PのEPYCで十分だな
ダイあたり32レーンで2Pと同じく128レーン出せるしね

391:Socket774
17/07/22 10:46:02.56 WICBR6OG.net
ダイあたりじゃなくて
ワンパッケージで128レーン

392:,,・´∀`・,,)っ-○○○
17/07/22 10:46:10.82 5BPAjhLK.net
レーンあたり1GB/s/片方向しか出ないんですがそれは

393:,,・´∀`・,,)っ-○○○
17/07/22 10:48:56.85 5BPAjhLK.net
>>374
そのVega20は7nm(ただしGF公称)だろう

394:Socket774
17/07/22 10:53:34.20 WICBR6OG.net
>>377
それで良いじゃん
団子はそれの何が不満なの?
GPUのメモリー帯域とPCIeのバス帯域は、かなりかけ離れてるけどPCIeのバス帯域足りないわけじゃ無いからPCIe3.0でつなごうが2.0でつなごうが速度差は無いんだけど?
あるならソース貼ってみ
>>378
お前はいつの話をしてるんだ?
さすがにそれは情弱過ぎるぞ

395:Socket774
17/07/22 10:55:11.90 h1wS6NNV.net
AMD憎しでEPYCをディスるがSkylake-Xの足回りが弱いのは棚に上げる団子さん

396:Socket774
17/07/22 11:04:21.22 BPJrhTvJ.net
>>378
しね、嘘つきの無知男

397:,,・´∀`・,,)っ-○○○
17/07/22 11:04:53.30 5BPAjhLK.net
HMCは2GBで160GB/sだが


398:Xeon Phiのそれは1モジュールあたり60GB/s程度しか出てないので少なくとも8Hiではないな



399:,,・´∀`・,,)っ-○○○
17/07/22 11:06:10.22 5BPAjhLK.net
>>379
ポエマーくんの言うような4GPUで64GBみたいな使い方するには帯域が圧倒的に足りないぞ

400:,,・´∀`・,,)っ-○○○
17/07/22 11:07:36.45 5BPAjhLK.net
>>381
シッカタくんもちゃんと調べてくれよ
URLリンク(www.tweaktown.com)

401:Socket774
17/07/22 11:09:45.44 GS1Nixho.net
真に賢い消費者は自分の要求に合わせて買うだけだ
デュアルコアで良ければインテルで良いし、クアッド以上必要なら実質的にRyzen一択だろ

402:Socket774
17/07/22 11:17:16.95 WICBR6OG.net
翻訳スレ読んだら、どうやらインテルは失敗したようだなw

403:Socket774
17/07/22 11:18:03.95 FPjMMyKZ.net
これだな
URLリンク(cdn.videocardz.com)
普通に考えて2018年に7nmのビッグダイなんか出せるわけ無いから、公式のフェイクだろうな
URLリンク(androgamer.net)
コレ見ると14nm世代はVega、7nm世代はNaviで名称分けてるから、多分こっちのほうが理にかなってて正しい
出すとしたら14nm+だろうし、来年予定ならそろそろサンプルくらい作ってそう

404:Socket774
17/07/22 11:25:33.17 FPjMMyKZ.net
> HMCは2GBで160GB/sだがXeon Phiのそれは1モジュールあたり60GB/s程度しか出てないので少なくとも8Hiではないな
唯一の搭載製品に積めてない以上8Hiは失敗したか、凄い遅れてるんだろう
32GBのHBM2を搭載したディープラーニング専用ASIC「Lake Crest」は2017年末に登場
URLリンク(pc.watch.impress.co.jp)
URLリンク(pc.watch.impress.co.jp)
MCDRAM 8Hi製品出るといいですね、応援してます

405:Socket774
17/07/22 11:26:19.22 h1wS6NNV.net
XeonSPでEPYCを上回るPCIeを確保しようと思ったら、団子の大好きな4P構成にしないといけないな
各CPU間はUPI一本で繋がないといけないからEPYCと状況は変わらん
(廉価なUPI2本モデルだとEPYCよりひどくなる)
各企業とも1PのEPYCに対する評価は高いね

406:,,・´∀`・,,)っ-○○○
17/07/22 11:29:47.26 5BPAjhLK.net
>>388
普通に富士通がFX100で使ってるが?
8HiがAMD独占供給とか言ってた妄想が自分の引用で否定されてんじゃん

407:Socket774
17/07/22 11:30:28.53 FPjMMyKZ.net
URLリンク(www.techpowerup.com)
francois-piednoelは、Katmai、Conroe、Penryn、Nehalem、Sandy Bridge、Ivy Bridge、Haswell、Broadwell、Skylake、Kaby LakeのSoCなどのCPUのアーキテクチャ開発に携わってきました。
Pentium 4からCoreへのIntelのAtomプロセッサー・ラインとIntelのマイクロアーキテクチャーの大幅な移行にも強く関わっていた
20年Intel在籍でCore2とSandyに関わってきた人が辞めるとのこと
Intel版ジムケラーみたいな人かな

408:Socket774
17/07/22 11:35:04.81 VCiWa3NO.net
おそらくTigar Lakeまではこの人の作品なのだろうな

409:Socket774
17/07/22 11:37:59.05 FPjMMyKZ.net
> 普通に富士通がFX100で使ってるが?
あっ、はい、すいません(FX100って何だ?)
> 8HiがAMD独占供給とか言ってた妄想が自分の引用で否定されてんじゃん
そりゃ一般規格品だからな、独占できるわけがない
今のところAMDしか製品化出来てないから、実質独占みたいだと言ってるだけ
Lake Crestは今年末出す予定ならサンプルくらい出せとは思うけど、そんな話欠片もないね

410:,,・´∀`・,,)っ-○○○
17/07/22 11:4


411:3:13.77 ID:5BPAjhLK.net



412:Socket774
17/07/22 11:50:20.45 h1wS6NNV.net
>>394
>EPYCはダイあたり16レーンを時分割ですが?
時分割ってなに?
もしかして物理的に32レーンがあることを知らないの?
>ソケットまたぎの別番号のダイに
EPYCについては1Pの話しかしてませんが

413:Socket774
17/07/22 11:52:54.21 v/O1RaoT.net
まあまあ
団子は2P買うのが決まってるんだから
情報知りたいのは当然だろ

414:,,・´∀`・,,)っ-○○○
17/07/22 11:55:39.32 5BPAjhLK.net
>>395
2ソケット時はPCIeとダイ間通信で半々ずつだが
パッケージ内のダイ同士の接続帯域はどこから湧いてくると思ってんだ?
時分割の意味わからない?

415:Socket774
17/07/22 11:56:39.98 RiKuRaha.net
AMDが自社専用の独自規格を作る→だれも使わない
AMD主導で標準規格を作る→その新規格でnvidiaが高い収益を上げる
毎度このパターン
nvidiaのためにわざわざ新規格を作って提供するAMDさん

416:,,・´∀`・,,)っ-○○○
17/07/22 11:58:36.55 5BPAjhLK.net
>>395
1Pのほうが厳しいなー
PCIeの公称128レーンとダイ間通信を各ダイ32レーンでやりくりしないといけないからな

417:Socket774
17/07/22 12:02:21.87 h1wS6NNV.net
>>397
>2ソケット時は
1Pの話をしてくれ
>パッケージ内のダイ同士の接続帯域はどこから湧いてくると思ってんだ?
SerDesとは別の専用パラレルインターフェースを使ってるけど
ちなみにダイ内部のIFの帯域はパッケージ内接続に使うIFの帯域より広いからね

418:Socket774
17/07/22 12:03:55.47 h1wS6NNV.net
>>399
うわ、こいつソケット間接続とパッケージ内接続で全く異なるインターフェースを使ってるの知らないのか
通りで話が通じないわけだ

419:Socket774
17/07/22 12:08:42.45 cuiBxDgH.net
FX100くらいは知っとけよ
海外でも使われてたはずだぞ
まあ次はHBMかHMCか知らんが

420:,,・´∀`・,,)っ-○○○
17/07/22 12:12:12.22 5BPAjhLK.net
>>400
EPYCの2ソケットでXeon4ソケット下位を相手取るのは分が悪いことは認めるんだね?
1ソケット対2ソケットでもそうそう変わらんけどな
ダイあたりのDRAM帯域と容量が3倍も差が出るし
EPYCは大容量メモリを積むほどメモリクロックが下がり、メモコンと同期してるIFのクロックも連動して落ちる

421:Socket774
17/07/22 12:15:13.39 FPjMMyKZ.net
団子が最早何言ってるかわかんない、迷走しすぎ
何をどう擁護しようがこの電力じゃどうにもならん
POV Rayがどうのじゃなく、高負荷時にこの消費電力だと選択肢としては厳しい
URLリンク(images.anandtech.com)
URLリンク(i.imgur.com)

422:Socket774
17/07/22 12:16:22.07 RiKuRaha.net
Xeon4Pは、EPYC対策で4P税値下げしたからEPYCと価格・コスパ的に戦えるようになったわけで、
すくなくともIntelがいままでのように殿様商売するのが不可能になるくらいにはEPYC性能・コスパがいい

423:,,・´∀`・,,)っ-○○○
17/07/22 12:17:01.99 5BPAjhLK.net
>>401
同じインターフェースだけど?
ControlとDataは分かれてるがダイ間やアクセラレータ間は32レーンをレーン分割か時分割かしかないよ

424:Socket774
17/07/22 12:17:56.57 h1wS6NNV.net
時分割とか言い出すから何言ってんだコイツと思ったけど、PCIeとIFを同じレーンで交互に通信するとか思ってたんだな
今までのレスにも違和感があったのはそのためか
でかい口叩くわりには情弱すぎでしょ

425:,,・´∀`・,,)っ-○○○
17/07/22 12:18:04.48 5BPAjhLK.net
>>404
商用利用不可能なPOVRayを持ち出さないといけないのは苦し�


426:「な



427:,,・´∀`・,,)っ-○○○
17/07/22 12:19:08.97 5BPAjhLK.net
>>407
じゃあお前の根拠出せよ

428:Socket774
17/07/22 12:21:36.42 FPjMMyKZ.net
>>402
一介の自作erが富士通のスパコンとか知るわけ無いだろ・・・
URLリンク(www.fujitsu.com)
正直SPARC V9 + HPC-ACE2とかいわれても凄いのかどうかよく分からない
EPYCやXeonで例えるとどの程度なんだろう
>メモリ容量   32GB(HMC)
>メモリバンド幅 240GB/s(read)+ 240GB/s(write)
バンド幅は笑うところ?

429:Socket774
17/07/22 12:26:52.36 cuiBxDgH.net
>>410
バンド幅はその程度だが、高速通信により実行率糞高いんだよ
というか日本の気象解析や海洋解析にも使われてんだし
何も自作erだから知らないという話でもないよ、機械翻訳君

430:,,・´∀`・,,)っ-○○○
17/07/22 12:27:45.90 5BPAjhLK.net
そもそもControl fabricはダイあたり32レーンしかないのになぜか4つMCMすると別の帯域が湧いてくる不思議
腹いてぇよ勘弁しろ

431:Socket774
17/07/22 12:48:04.56 pRrJnZ2O.net
本当に良くわかってないんやなって
物理仕様の名称じゃ無いのにね

432:Socket774
17/07/22 12:50:00.70 VCiWa3NO.net
>>411
IDが違う奴を機械翻訳君呼ばわりw

433:,,・´∀`・,,)っ-○○○
17/07/22 13:00:05.72 5BPAjhLK.net
Scalable Data fabricか
内実は4QAM伝送可能な「高速なFSB」のもよう

434:Socket774
17/07/22 13:01:23.54 iygCrPQa.net
正しい情報と正しい根拠に基づいて公正にAMDを貶すんだったら
全然問題ないんだけどな
実際には思い込みと歪んだ根拠で叩いてるからな
機械翻訳くんやポエマーと戯れているのがお似合い

435:,,・´∀`・,,)っ-○○○
17/07/22 13:10:58.44 5BPAjhLK.net
たとえば、4ポートのUSBハブ使えば帯域が4倍スケールすると勘違いしてるレベル

436:Socket774
17/07/22 13:12:34.59 /z+P133G.net
内部通信に一々馬鹿でかい方のSERDES起こすと思ってるのは流石に機械翻訳とかポエマー以下だろ

437:,,・´∀`・,,)っ-○○○
17/07/22 13:21:09.88 5BPAjhLK.net
>>401
だれかこいつの言葉翻訳してくれ
どっちもSDFから分配してるGMIだぞ
SerDesとか意味不明だし(割り込みでスイッチするだけなのに

438:Socket774
17/07/22 13:24:29.53 FPjMMyKZ.net
>>411
> バンド幅はその程度だが、高速通信により実行率糞高いんだよ
> というか日本の気象解析や海洋解析にも使われてんだし
インターコネクト Tofuインターコネクト2
インターコネクトバンド幅 12.5GB/s × 2(双方向) / リンク
PCIe3のx16(16GB/s)と比べてもそれほど凄いようには見えない
URLリンク(www.iwavejapan.co.jp)
機械翻訳ってなんのことだろう?

439:Socket774
17/07/22 13:27:36.79 FPjMMyKZ.net
EPYC「ごちゃごちゃうるさいな、CPU内蔵でPCIe3 128レーン対応したら相手してやるよ」

440:,,・´∀`・,,)っ-○○○
17/07/22 13:35:28.39 5BPAjhLK.net
SDFのルート帯域がメモコンのクロック×512ビットぶんの帯域しかない事実を忘れてて全部のコントローラが同時に動かせると勘違いしてんのか。納得

441:Socket774
17/07/22 14:37:09.72 iM+dy8Lf.net
相変わらず意味不明な事言ってるな

442:Socket774
17/07/22 14:41:27.84 Cab770Ex.net
>>422
しね、嘘つき

443:,,・´∀`・,,)っ-○○○
17/07/22 14:52:02.00 5BPAjhLK.net
バカの解釈「Infinity fabricの帯域は無限大!」

444:Socket774
17/07/22 14:55:57.63 OIfto5OO.net
>>425
死ね嘘つき

445:Socket774
17/07/22 15:13:11.23 EiN8kUO/.net
バカの解釈「メッシュバスの帯域は無限大!」

446:Socket774
17/07/22 15:14:56.49 FPjMMyKZ.net
まあ、落ち着け
コレについて一言どうぞ
URLリンク(tech4gamers.com)
E5 2697v4はTDP


447:145W、それとの電力差が約130W



448:,,・´∀`・,,)っ-○○○
17/07/22 15:16:48.64 5BPAjhLK.net
画像だけ貼られてもわからん

449:Socket774
17/07/22 16:27:32.32 h1wS6NNV.net
昼飯食いに外出てたわ
>.409
マジで知らんのな
後藤氏の記事でも読んで勉強してくれ
URLリンク(cloud.watch.impress.co.jp)
URLリンク(cloud.watch.impress.co.jp)
URLリンク(cloud.watch.impress.co.jp)
パッケージ内接続とソケット間接続は全く別のインターフェース

450:Socket774
17/07/22 16:30:12.58 h1wS6NNV.net
URLリンク(en.wikichip.org)
ダイ内部のブロックダイヤグラム
GMIというのがパッケージ内接続用のパラレルIFインターフェース
xGMIというのがソケット間接続用のインターフェースでこれは汎用SerDesにつながってる

451:Socket774
17/07/22 16:40:33.80 FPjMMyKZ.net
URLリンク(www.tomshardware.co.uk)
全部構成違う、x2 CPUだな、最低構成みたいだし、まあ参考値というところか
件の電力グラフの説明はこんなん
Linux-Benchテストでは、1秒間だけ出現した多数のハイドローバーストをキャプチャし、711Wでクレストしました。
私たちのLinpackテストでは同じ粒度が使われていますが、8176のAVX周波数が低いため、670Wのピークしか記録しませんでした。
AVX512以外は大して向上して無さそう、ワッパは少し良くなった程度かね

452:,,・´∀`・,,)っ-○○○
17/07/22 16:45:36.38 MqAoxSiu.net
>>431
USBハブの例えが理解できなかったか?
根っこが同じでそこが時分割ならそこで頭打ちなんだよ

453:Socket774
17/07/22 16:52:19.81 KoK+XTRR.net
>>431
URLリンク(en.wikichip.org)
URLリンク(en.wikichip.org)
ほいさ

454:Socket774
17/07/22 16:58:39.71 h1wS6NNV.net
>>433
>>399
> PCIeの公称128レーンとダイ間通信を各ダイ32レーンでやりくりしないといけないからな
まずPCIeとダイ間通信を32レーンでやりくりするってことの意味を教えてくれw
レーンってことはSerDesのことだろ
ダイ内部ののSDFに32レーンなんて単位は無いからな

455:Socket774
17/07/22 18:38:42.68 /z+P133G.net
まさかのバックプレーンと表の分別が付いてないパターンか
これは想像しなかったなぁ
見てるこっちが恥ずかしくなってくる

456:Socket774
17/07/22 19:08:09.90 Hkvre7bF.net
団子がどんどん馬鹿になっていくぞ!

457:Socket774
17/07/22 19:45:24.42 a/3yN7r8.net
>>433
荒らしは去れ

458:Socket774
17/07/22 20:11:32.86 UIaiiCXx.net
l 417 ,,・´∀`・,,)っ-○○○ sage 2017/07/22(土) 13:10:58.44 ID:5BPAjhLK
たとえば、4ポートのUSBハブ使えば帯域が4倍スケールすると勘違いしてるレベル
名言頂きました
もはや迷言だけど

459:,,・´∀`・,,)っ-○○○
17/07/22 20:23:30.48 a4Nu/Pop.net
>>435
おまえさー
GMIが全ポート同時に39GB/sで通信できてPCIeもフルスピード出ると勘違いしてるだろ
こっちが恥ずかしいわ

460:Socket774
17/07/22 20:28:26.71 CPaSvxXf.net
Intelのウェアラブル開発チームが撤退。
URLリンク(www.gizmodo.jp)

461:Socket774
17/07/22 20:48:54.59 Xy/SpR7u.net
翻訳スレのが早いな

462:Socket774
17/07/22 21:03:39.59 h1wS6NNV.net
>>440
ダイ内部のSDFを高速なFSBなんて言ってる奴には理解不可能かもね
そんなことより>>435の疑問に答えてくださいな
答えられないなら、大口叩いてたくせにパッケージ内接続用のパラレルIFインターフェース
の存在を知らなかった情弱、という扱いになりますがw

463:Socket774
17/07/22 21:32:34.01 EOK035uz.net
ちょっと知らない事があったら情弱なのか……
まあコテハンの人にとっては致命的だろうけど。

464:Socket774
17/07/22 21:37:02.26 RgRwG1BV.net
>>442
はい

465:Socket774
17/07/22 21:39:06.


466:55 ID:seq6zCo7.net



467:Socket774
17/07/22 22:14:08.35 FPjMMyKZ.net
128レーンが常にフルスピード動作とか専用のベンチでもないと無理だろ
頑張って動かしても半分ぐらいが関の山でしょ

468:Socket774
17/07/22 22:33:07.25 h1wS6NNV.net
>>444
別に普通の人にはここまで言うつもりはないけど、相手は団子だからね
散々、EPYCはMCMだから糞と言い放ってたのに、肝心要のファブリックの構造を知りませんでした、って言うんだからからかいたくもなるでしょ

469:Socket774
17/07/23 01:33:36.30 IqCuj8Oh.net
>>440
"何が"フル帯域だって?
まだそんな事言ってるのか、本当にアホだな
お前にHW設計やらせたら大層な産廃が出来そうだ
何でIntelがリングバスだメッシュだと悪戦苦闘し始めた?
RadeonがATI時代に通った道でも有るが
ではGPUではどうやっているか
そしてタカが44mm^2のCCX二個が何で200mm^2を超えるクソでかいサイズに膨れ上がったか
バスって言葉に踊らされ過ぎなんだよ

470:,,・´∀`・,,)っ-○○○
17/07/23 01:44:19.06 F4g4lShW.net
>>443
強情だないい加減にしろ
おまえはUSBハブに繋がってるデバイスが全部同時にフルスピード動かせるって言ってるのと同レベルの発言してる

471:,,・´∀`・,,)っ-○○○
17/07/23 02:28:32.00 F4g4lShW.net
URLリンク(www.anandtech.com)
ここのPinned Memory Bandwidthの
> 8 threads on the first 8 cores same socket
がGMI超えのペナルティをよくあわらしてると思うけどね

472:Socket774
17/07/23 03:13:06.99 A4xanZ/T.net
あぼーん

473:Socket774
17/07/23 03:38:53.27 K0EF3+4A.net
Skylake-SPのAVXの伸びが良いな
それでもEPYCには負けてるが

474:,,・´∀`・,,)っ-○○○
17/07/23 07:44:17.01 F4g4lShW.net
Stream TriadはただのDRAMベンチですが
Pinned Memory Bandwidthはスレッドあたりで帯域制限かけてるような気はするね

475:,,・´∀`・,,)っ-○○○
17/07/23 08:40:18.11 F4g4lShW.net
>>451で言及したのは6chと2ch×4の同一ダイのCCX0がメモリアクセスしている間CCX1がGMIを経由して他のダイのメモリにアクセス、みたいな例だな
DDR4-2400なら1200MHz動作になるのでInfinity Fabricの理論帯域は38400MB/sだ
2つのCCXと各コントローラの経路がそれぞれごとにクロスバーで並列化されてるならCCX0-MCHとCCX1-GMIとは同時にアクセスできるはずで、それ以上の数字が出て然るべきだ
しかし結果からは少なくとも2つのCCXとコントローラ間のアクセス経路は二重化されてないようにしか見えない

476:Socket774
17/07/23 09:08:24.86 wC1WcFjl.net
>>455
お前の願望なんて興味ないので死ね

477:Socket774
17/07/23 09:09:43.63 5RY6yeH2.net
Skylake-SPとBroadwell-EPの方はDDR4-2666使ってるって事でしょ?

478:,,・´∀`・,,)っ-○○○
17/07/23 09:14:01.29 F4g4lShW.net
SkylakeのUPIよりもGMI/xGMIのほうが実行性能出るとか主張してる基地外がいるのでその検証は必要でしょ
EPYCのメモリアクセス特性もファンボーイ知識レベルも「2chの寄せ集め」

479:Socket774
17/07/23 09:19:06.20 5+6Nbx3+.net
Epycではfirst 8 coresというのはシングルダイ内アクセスであり
続くcore 0,4,8,12...という8コア指定がソケット内全ダイ�


480:ヨの並列アクセス こちらが1スレッドの3.6倍の帯域なので理屈通りです この帯域計測はフィジカルインターコネクトよりもネットワークトポロジの話だと思います



481:Socket774
17/07/23 09:19:39.01 hRNxXwjS.net
ていうかその俺は絶対間違ってない という自信はどこからくるのか

482:Socket774
17/07/23 09:34:21.28 R7TfrBC4.net
numactlで別ダイのメモリへのアクセスねぇ
本当にFSBみたいなシェアードバスだったりUSBみたいな仕組みだったら、時分割でアクセスしたときに実効帯域が減りこそすれ、増えることはないと思うけどね
団子の持ってきたデータは団子の主張を否定してるようにしか見えない
Anandtechの表の1,2行目は一つのコアから同じダイのメモコンへのアクセス
3,5行目は一つのCCXから同じダイのメモコンへのアクセス
6行目は二つのCCXから同じダイのメモコンへのアクセス
を計ってるようにしか見えないな

483:,,・´∀`・,,)っ-○○○
17/07/23 09:45:19.63 ea7xmwEd.net
> 8 threads on the first 8 cores same socket
問題はこっちな
これだとdie0の各CCXごとに4スレッド割り振られる
スコアはECCつきDDR4 2chぶんの帯域は超えてるようなので別ダイのメモリにアクセスしてるようだがIFのバンド幅は下回ってる

484:,,・´∀`・,,)っ-○○○
17/07/23 09:46:54.94 ea7xmwEd.net
38400MBはMiBではないので必要に応じて1.024で2回割ってね

485:,,・´∀`・,,)っ-○○○
17/07/23 09:48:55.67 ea7xmwEd.net
>>461
同じメモコンなら実効帯域増える理由ねーだろアホ

486:,,・´∀`・,,)っ-○○○
17/07/23 09:55:02.21 ea7xmwEd.net
同じメモコンならECCつきDDR4-2chの理論帯域を超えることはありえない

487:,,・´∀`・,,)っ-○○○
17/07/23 10:00:20.79 ea7xmwEd.net
簡単な掛け算です

488:Socket774
17/07/23 10:08:38.36 53obDGLF.net
団子の貼ったソース見てみろ
Broadwell-EPに何でSkylake-SPがいくつか負けてるのかが問題だろ?
どっちもドライバーが最適化されとらんのかって話で終わりでしょ?
違うの?とうしても優劣つけたいの?

489:,,・´∀`・,,)っ-○○○
17/07/23 10:12:05.11 ea7xmwEd.net
ロードバランスとるためにコアあたりの帯域にわざとリミットかけてるだけだと思うけどね。
そこはBIOS設定項目じゃねーの?

490:Socket774
17/07/23 10:28:01.05 53obDGLF.net
実際、Ryzenはドライバーのアップデートでメモリー周り改善したって聞くぞ
上がったり下がったりな箇所もあるけどさ
出たばっかりのベンチマークのみ見てるとまた情報に置いてかれるぞ

491:,,・´∀`・,,)っ-○○○
17/07/23 10:29:56.35 ea7xmwEd.net
DDR4 2400 with ECC × 2ch = 29297MiB / s
Infinity Fabric @ 1200MHz = 36621MiB / s

んで、6つめのテストでは少なくともメモコンは複数動いてるのは確実なんだが
クロスバーの並列動作ではありえないほどスループットが低く、IFの帯域を超えていない

492:,,・´∀`・,,)っ-○○○
17/07/23 10:38:11.33 ea7xmwEd.net
>>469
FPGAじゃねーんだからファブリックの構造は書き換えられねーよ

493:Socket774
17/07/23 10:41:38.47 53obDGLF.net
>>471
Windows7だと速いの聞いたことないのか?

494:,,・´∀`・,,)っ-○○○
17/07/23 10:44:30.01 ea7xmwEd.net
> Windows7でEPYCが動く

まで読んだ

495:Socket774
17/07/23 10:49:09.87 nVKHDtMZ.net
Haswell-Tuned Binaries Are Still Sometimes Faster On AMD Ryzen Than Znver1 Tuning
URLリンク(www.phoronix.com)
LLVM/Clang 5.0でx86-64、znver1、haswellのそれぞれの設定でコンパイルしたら、znver1が高性能というわけでもなかったとのこと
特にScimarkだとHaswell設定の方が倍くらい早かった
URLリンク(openbenchmarking.org)


496:=2 znver1が一番遅いというのもあった http://openbenchmarking.org/embed.php?i=1707201-TR-CLANGZNVE41&sha=7712ada&p=2 Ryzenは基本性能は高いが、癖が強くて最適化には時間がかかりそう



497:Socket774
17/07/23 10:52:06.79 53obDGLF.net
最適化されたのがZen+かもな
本命はZen2なのは変わらんが

498:Socket774
17/07/23 11:00:02.04 5+6Nbx3+.net
>>462
記事にはAMDがフルシステムで250GB/sを記録したと語ってると書いてるので
単純にECCビットが付かない計測をしてるんでしょう
帯域増はダイのCCXが両方機能することでより近いメモリコントローラが割り当てられることと
多スレッド化による効率向上分じゃないですか?
もし複数ダイのメモリコントローラアクセスなら最低でも50GB/s程度になるでしょう

499:Socket774
17/07/23 11:01:16.41 nVKHDtMZ.net
InfinityFabricはコヒーレンシで設計や実装が楽というのがポイントで、レイテンシや帯域は思ってたより高性能くらいなものでしょ
メモリクロックの半分のクロック動作だし、何かしらのネックは発生してると思う
Intelとは逆で、クロック制限、バス制限で、性能抑えて省電力でワッパ優先にしているんだと思う
InfinityFabricをメモリと同じクロックにする設定でもあれば、OCするより性能上がりそう

500:Socket774
17/07/23 11:01:52.40 nVKHDtMZ.net
>>475
Zen3が公表されてる以上Zen2が本命なんてありえないよ

501:Socket774
17/07/23 11:07:04.17 5+6Nbx3+.net
>>477
クロックと同速では?
メモリのデータレートはクロックの倍なのでそれと勘違いしてません?

502:Socket774
17/07/23 11:13:34.76 4hgZZ+ag.net
団子の帯域計算がマジで分からんwww

503:Socket774
17/07/23 11:20:06.75 53obDGLF.net
>>478
Zen2が本命な理由はいくつかある
来年Intelは10nmに行かず14nm++のCascade Lakeと言うのを出す
ノート向けに最新の製造プロセスを回しまくってサーバー向けは劣った製造プロセスで出す為切り替えるのに時差が生じる
Zen2はアーキテクチャを大幅に改良してくるIPCが飛躍的に向上する
だけでなく10nmスキップして7nmプロセスを使う
出てくる情報集めるとこの製造プロセスは性能向上や消費電力やコスト削減等のあらゆる指標で革新が起こせる
Intelの10nmプロセスを上回る性能が出せると思ってる

504:Socket774
17/07/23 11:22:08.08 vBIN6+Vi.net
epicのメモリってソケット跨いでインターリーブされるの?

505:Socket774
17/07/23 11:37:15.46 vBIN6+Vi.net
メモリの実効帯域的に競合より性能出てるし全コアにジョブ振るなら問題ないんじゃない?

506:Socket774
17/07/23 11:44:07.10 nVKHDtMZ.net
>>479
調べてみたら、メモコンと同クロックだった
DDR4 2400だと、メモコンは1200MHzでInfinityも1200MHz

507:Socket774
17/07/23 11:48:17.58 4hgZZ+ag.net
> DDR4 2400 with ECC × 2ch = 29297MiB / s
29297 MiB/s * 1.024^2 = 30720 MB/s
これは38400 MB/sのちょうど0.8倍
8b/10bエンコーディングで実効0.8倍計算?
4bitに1bitのパリティが付くので実効0.8倍計算?
マジでわかんないんで誰か説明してください

508:Socket774
17/07/23 11:52:01.45 nVKHDtMZ.net
>>481
Zen2で分かってるのは7nmプロセスで2019年くらいに出てくるということくらい
アーキテクチャや性能は不明、多少の改良はあってもどの程度かは不明
そもそも日進月歩のCPU業界では本命やら前座やらは意味がない
あえて言うなら、現時点ではZen系の完成形らしい7nm EUVのZen3が本命
まあ、その後に5nm Zen4か新アーキテクチャが控えてるから、すぐに本命じゃなくなるけど

509:Socket774
17/07/23 12:00:30.44 pa+5lIrn.net
>>473
死ねってなんども言わせん納屋早くしね

510:,,・´∀`・,,)っ-○○○
17/07/23 12:07:55.85 ea7xmwEd.net
>>476
おいらが指摘してるのは同一ダイの別CCXの


511:スレッドからメモリに同時アクセスしたときのスループットですよ? 別ダイでそれぞれローカルのメモリ叩いた時にスケールするのは数字見ればわかるよ いずれにしても同一ダイでは1200MHz駆動時のIFのバンド幅の理論値36621MiB/sを超えてない時点で、同一ダイでクロスバーによる並列動作は確認できない



512:Socket774
17/07/23 12:08:17.67 eEnaYu4q.net
>>470
出るわけないだろw
NUMAを勘違いしてないか?
2400ならRawは1200で、GMI間の32Bを考慮して38.4
実に帯域効率95%
そしてUMCだろうが何だろうが32Bで繋がってる、例え先が16Bに落ちるUMCですら倍の32Bで繋がってる
よく似た機器は知ってるよな?
USBじゃないぞ、各ポートが送って来たモノを分配するんだ
しかしGMIが4本有るのは何だろうな
4本あればFCのまま5ダイ構成が可能だけど

513:,,・´∀`・,,)っ-○○○
17/07/23 12:20:27.37 ea7xmwEd.net
>>489
事実上水子になったEHPだろ
4本のGMIでGPUとリンクする図を見たぞ

514:Socket774
17/07/23 12:31:04.76 4hgZZ+ag.net
発言者の団子も説明してくれないのか…

515:,,・´∀`・,,)っ-○○○
17/07/23 12:35:56.95 ea7xmwEd.net
>>489
あと前半は俺もそう思ったしIFの上流帯域に縛られるってしてきしたんたがネイティブの6chより確実に弱いって指摘したんだがコントローラが独立してるから並列動作する、の一点張りですよ?

異なるダイのPCieコントローラにつながったGPU間のデータ交換とかやるとこういう経路になるよな?
GPU---PCIe-IF-GMI---GMI-IF-PCIe---GPU
頼むからGPU間だけでもNVlinkみたいなダイレクトリンク作ってくれよとは思うんだが、それはそれとして
この状態でホストCPUはメモリとかなんの処理の停滞もなく動作するんだろうか?

516:Socket774
17/07/23 12:36:39.29 eEnaYu4q.net
じゃ最後の一本はGPUでもはっつけるのか
デカいソケットが必要ってか既にデカいな
19.2GB/s x2で38.4GB/s
95.3%
どうやって2UMCでこれ以上出せと?

517:Socket774
17/07/23 12:41:31.58 nVKHDtMZ.net
>>489
GMI(PCIe)x4はチップセット用でしょ
URLリンク(rog.asus.com)

518:Socket774
17/07/23 12:41:45.20 aJGpRMRa.net
URLリンク(i.imgur.com)
いやGPUと4GMIで繋ぐって2年前からリークしてるし
GreenlandってのはVEGAの旧コードネームね

519:,,・´∀`・,,)っ-○○○
17/07/23 12:53:13.46 ea7xmwEd.net
NVIDIAのPascalとVoltaの頭文字に合わせてリネームとかプライドなさすぎて泣けるわ~

520:Socket774
17/07/23 12:53:27.21 aJGpRMRa.net
URLリンク(i.imgur.com)
同時期にリークした資料を見るにこの接続はAM4ではなくTR4のスリッパ以上がターゲットになってる
(16core、memory 4ch、 PCIe 64lane等)
ここらの都合がスリッパとVEGAをSIGGRAPHで同時にプレゼンする理由だろう

521:Socket774
17/07/23 12:57:47.38 nVKHDtMZ.net
GMIやPCIeで考えるから、よくわからなくなるんだと思う
全部ひっくるめてダイ辺りInfinityFabric 32レーンで考えればいい
Ryzenは4レーンはチップセット、残り28レーン
スリッパは計64レーン、4レーンはチップセット、4x2=8レーンはMCM、残り52レーン
EPYCは計128レーン、4x3x4=48レーンがMCM、残り80レーン
EPYCx2は計256レーン、48+4x4x2=80レーンがダイ間、残り176レーン
EPYCだとGMIx3はMCMで、残り1つはDual EPYC時に使われてるね
それ以外だとタダのPCIeとして使われるだけだろう

522:,,・´∀`・,,)っ-○○○
17/07/23 13:00:09.86 ea7xmwEd.net
スリッパってなんだよSread Lipperじゃねーんだぞ

523:,,・´∀`・,,)っ-○○○
17/07/23 13:11:43.23 ea7xmwEd.net
バカ「インターフェースが別なら帯域を食い合わない!」

524:Socket774
17/07/23 13:14:41.97 nVKHDtMZ.net
Threadripperもスレッドリッパーも打ち込むの面倒だろ
安物のスリッパに大層な略称はいらんよ、スリッパで十分
大層な略称は高級品のSKylake-Xにでも付ければいい

525:,,・´∀`・,,)っ-○○○
17/07/23 13:16:26.55 ea7xmwEd.net
TRでええやん
surippa→変換

526:Socket774
17/07/23 13:19:36.53 4hgZZ+ag.net
DDR4-2400の2chの帯域がUnbufferedだと38400MB/sで
ECC付きのRegistered DIMMだと30720MB/sになる
正直、団子がトンデモ計算してる疑惑しか無いんだが…

527:,,・´∀`・,,)っ-○○○
17/07/23 13:24:26.75 ea7xmwEd.net
MiBって書いたろ

528:Socket774
17/07/23 13:25:56.89 4hgZZ+ag.net
変換したよ

529:,,・´∀`・,,)っ-○○○
17/07/23 13:34:36.33 ea7xmwEd.net
スレッド数を増やせばメモリキューの充填率はあがるがデータの連続性がなくなるのでバースト転送もしにくくなる

530:Socket774
17/07/23 13:45:18.50 /1N2o+ks.net
でけぇ
URLリンク(i.redd.it)

531:Socket774
17/07/23 13:49:49.60 nVKHDtMZ.net
InfinityFabricフル稼働時の実行性能とか、この構成(GPUx6)で高負荷GPGPUベンチかけるくらいしか測定できないだろうな
URLリンク(pc.watch.impress.co.jp)
何やればそんな高負荷がかけられるのやら
1ダイ辺りは32レーン、32GB/sになるけど、DDR4-2133 2ch の34GB/sよりは少ないから、それほど大変というわけでもなさそう
PCIeとメモリ両方の負荷が100%とか、何やればいいんだろう

532:Socket774
17/07/23 13:52:16.71 4hgZZ+ag.net
>>506
バースト転送なんて今は関係ないよね?
30720 MB/s (>>470の値から変換) がECC付きDDR4-2400 2chの理論帯域(>>465)で、
>>451
> 8 threads on the first 8 cores same socket
の速度が32703 MB/sと、上記の理論帯域より大きくなってるから、この測定は同じダイの
メモコンだけでなく、GMI経由で別ダイのメモコンにもアクセスしてるに違いない。
そして、別のダイのメモコンにアクセスしてる割には速度が極端に遅いから、
(理想的には同じダイのメモコンと別のダイのメモコンで4ch分の帯域は出ていて欲しい)
これはダイ内部のIFがボトルネックになっている。
つまり、ダイ内部のIFはクロスバー(あるいは他のトポロジーかもしれないが)のような
並列アクセス可能な高級なインターコネクトではなく、もっと単純なものだ。
というのが団子の主張でしょ?
そこで、ECC付きDDR4-2400 2chの理論帯域が30720MB/sであるというのが
本当にどう計算したら出てくるのか分からないから説明して欲しいと言ってるの

533:Socket774
17/07/23 13:52:45.91 ddYD+7MI.net
特性違いのベンチを同時に回したスコアを競合と比較するくらいしか

534:Socket774
17/07/23 14:00:13.43 vzluijZM.net
>>499
Liezenとか言ってたヤツが何言ってんだ
THとSは区別できるけどRとLは区別出来ないのか?

535:Socket774
17/07/23 14:09:24.81 nVKHDtMZ.net
そもそもCPUコアが相手するのは100GB/s余裕で超えるL1やL2やL3だからね、
30GB/s程度のメモリやPCIeとかアクビが出るほど遅くて待ち時間だらけだろ
URLリンク(tpucdn.com)

536:Socket774
17/07/23 14:27:40.12 vzluijZM.net
フランス語か

537:,,・´∀`・,,)っ-○○○
17/07/23 14:42:23.38 +4gOeFND.net
>>511
なぜLie-に置き換えたのかもわからんのか

538:Socket774
17/07/23 14:45:55.86 vzluijZM.net
>>514
RとLの区別が付かないからだろ
AMDの情報は嘘ではなかったわけだから

539:Socket774
17/07/23 14:49:09.75 bvvX63b/.net
団子は本当にバカだなー

540:Socket774
17/07/23 14:51:32.68 aJGpRMRa.net
ほんと、Ryzenの性能が嘘だったらよかったのにね

541:Socket774
17/07/23 15:04:38.75 zcnmFzQe.net
Zenは20nmプロセスのFinFET化したものだしな
しかもスマホ向けのチップだから

542:Socket774
17/07/23 17:09:18.28 SVJmlPmc.net
966


543:名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/09/25(日) 20:43:33.19 ID:39JCDkTM [2/3] これは同クロック同コア数のApolloLakeといい勝負もありうるな>喘 460 名前:,,・´∀`・,,)っ-○○○@KD106154083144.au-net.ne.jp[sage] 投稿日:2016/10/03(月) 00:49:47.13 ID:5rXEaRtx 君がどうでもいいです ApolloLakeにすらシングルスレッド性能負けたZenでも拝んでなさい 937 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/19(水) 01:01:14.78 ID:cj5KV656 [4/16] 別にソルダリングのEもあるんですけど消費者が選んでるのがグリスのほうなんですよ 安いが正義なんですよ あとExcavatorを1.4倍しても所詮はApolloLake Pentium並 481 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/24(月) 20:13:25.88 ID:k71cr2Hg [3/17] いくら消費電力改善してもIPCはAtomとどっこいレベルの初代Bulldozerから横ばい そこから1.4倍してもApolloLake並



544:Socket774
17/07/23 17:10:36.47 SVJmlPmc.net
540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21]
Zenが高くないと買えない自分を正当化できないもんな
大丈夫だよ、8コア最上位でも3万円切るから
お前みたいな無職大貧民には大金だけどな
545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21]
最上位で3万円切るって宣言した俺の発言ログとっとけよ
148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9]
まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ
351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU 9WJv [4/7]
リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ

545:Socket774
17/07/23 17:14:58.73 SVJmlPmc.net
213 ,,・´∀`・,,)っ-○○○[sage] 2017/07/09(日) 13:11:27.81 ID:gJGagwd6
>> 211
口先八寸のリサスーが工場ライン向けAPU撤退しただろwww
AtomのSoCにはCPUコアより巨大なカメラ用プロセッサが載っててこれがRealSenseの深度情報解析などの重い処理のアクセラレーションに対応してる

546:Socket774
17/07/23 18:36:30.64 UGnobwrb.net
>>507
コラを疑うレベルw

547:Socket774
17/07/23 18:37:06.63 uCGCX1Ra.net
>>495
GMIが付くのはVEGA20だぞ
しかもGPU間のインターコネクトにげんていされるから
それができるのはNavi以降だろうね

548:Socket774
17/07/23 19:37:09.52 xvmI1xXn.net
メモリや拡張スロットI/Fに、16QAMとか64QAMとかをつかって
通信速度を高速化できないの?

549:,,・´∀`・,,)っ-○○○
17/07/23 19:38:35.51 8eryh20n.net
>>522
URLリンク(www.startlr.com)

550:Socket774
17/07/23 19:48:57.98 4hgZZ+ag.net
>>525
さっさとECCが付くとメモリの理論帯域が2割も減るという根拠について説明してくれ
恐らく物凄い勘違いをしたままトンデモ計算をしていたことに気づいて、答えるに答えられないんだろうけど

551:Socket774
17/07/23 19:56:16.68 pp3jWlMx.net
団子はXeonplatinum 買うんだからそっとしといてやれよ
200万は下らないだろう淫厨の頂だぜ

552:Socket774
17/07/23 19:57:03.80 xvmI1xXn.net
通常ECCがついたらその分ピン数も増やしたりするので帯域幅は減らない
が、実装によっては帯域が減るのもある

553:Socket774
17/07/23 19:57:54.70 pp3jWlMx.net
そう言えば8ソケット対応するんだ�


554:チけ? 400~500万円ってとこかな ちなみにコレCPUだけの価格



555:Socket774
17/07/23 20:04:24.88 UGnobwrb.net
>>527
まずEPYC2Pだろw

556:Socket774
17/07/23 20:07:09.49 58hkOWkW.net
Xeon Goldは熱変換効率が違います
90パーセントの電気が熱に変換されます

557:Socket774
17/07/23 20:16:24.56 UGnobwrb.net
物理法則超えたあああ

558:,,・´∀`・,,)っ-○○○
17/07/23 20:22:45.18 W2EDjrOH.net
暖房専用器具として革新的だな

559:Socket774
17/07/23 20:24:37.33 4hgZZ+ag.net
>>528
今問題にしてるのはDDR4-2400のECC付きRDIMMだから、ピン数が増えて帯域は変わらないが正解だね
ECC無しだと64bit幅だけどECC付きは72bit幅でアクセス
増えた8bit分がECC用のbitなので、実際のデータ転送に使えるメモリ帯域はECCの有無で変わらない

正直、団子がECC付きメモリで帯域が2割も減るとか言い出した時はどんな勘違いをしてるんだと目を疑ったよ
72bit幅に増えてるのを知らず、64bitで計算した帯域を8/9倍してるのかと色々考えてみたけどさっぱりわからなかったw

560:Socket774
17/07/23 20:25:40.90 IqCuj8Oh.net
>>531
逆に残り1割はどうなるんだ
電磁放射で無線機器使えませんとか勘弁だぞ、仮に100wで一割放射して10w
10wって遠距離通信余裕レベルなんですけど

561:Socket774
17/07/23 20:35:08.70 MLAmo3Kv.net
bitcoinが死んだようだな

562:Socket774
17/07/23 20:43:47.55 pp3jWlMx.net
>>535
よく読め、逆だぞ

563:Socket774
17/07/23 20:46:05.90 nVKHDtMZ.net
ECCだとエラーチェックする時間が増えるから、その分帯域もちょっとは減るんじゃないかな

564:,,・´∀`・,,)っ-○○○
17/07/23 20:48:13.40 vg1M4vvi.net
>>526
別に構わんが
Infinity Fabricの帯域を下回っていることにはかわりないだろう
細切れのアクセス複数でトラフィックを埋めるとコマンドのフットプリントが相対的に大きくなり実効レートは落ちる
そもそもクロスバースイッチだろうが時分割には違いないし、1ダイだけ使った時のトータルスループットが38.4GBを下回ってる事実は消えない

565:Socket774
17/07/23 21:19:41.00 MJubrPTUJ
>>524
まだPAM4の多値化がせいぜいで、そんなに16QAMとか64QAMなんてものは
変調・復調が追いつかないでしょう。それ以前に回路がとんでもないことになるでしょう。

566:Socket774
17/07/23 21:24:04.52 MJubrPTUJ
>>534
ちょっと前のteslaはネイティブにECCが使えなかったから、
帯域が減っていたんだよね。それと混同したのでは?

567:Socket774
17/07/23 21:19:30.69 4hgZZ+ag.net
>>539
あらら、さすがに言い逃れ出来ないと思ったのかトンデモ計算してたことを黙認しちゃったね

でも俺が理解してる団子の論理組み立ては>>509の通りだから
ECC付きDDR4-2400 2chの理論帯域が38400 MB/sあると認めたからには
その後の論理は全部砂上の楼閣にしかならないんだけど?
それにnumactlでコアに動作スレッドを割り当てれば、そのコアに一番近いメモリを
確保するのが普通だから、わざわざ遠い別のダイのメモリにアクセスする、
なんて考える時点で違和感があるのだけれど
(そんな動作をさせるなら記事に注釈付けるでしょ)
38.4GB/sを超えてないのはGMI linkを経由して別のダイのメモリにアクセスしてる
んじゃなくて単に同じコアのメモリにアクセスして�


568:サこがサチってるってだけでしょ 通信経路が重ならなければ同時にアクセス可能なクロスバーと、シェアードバスのFSBや ホストが常に通信を司るUSBを十把一絡げに時分割と言ってしまうのもミスリードだね



569:,,・´∀`・,,)っ-○○○
17/07/23 21:26:19.65 AOdro4e3.net
数字が全てだろ
極端な話をすれば上りと下りの2chしかなくてもクロスバーだ

570:,,・´∀`・,,)っ-○○○
17/07/23 21:28:07.39 AOdro4e3.net
↑むしろこれが正解だと思ってる

571:Socket774
17/07/23 21:30:29.98 4hgZZ+ag.net
誰か翻訳お願いしまーす

572:,,・´∀`・,,)っ-○○○
17/07/23 21:31:07.61 AOdro4e3.net
ダイをまたいでGPU間通信でPCIe-GMIフル稼働中にCPUのメモリアクセスやってフル帯域使えるなら多重化されてるといえるしそうでなければただの双方向化したFSBにすぎん

573:Socket774
17/07/23 21:45:52.77 ax5wD/r5.net
>>546
死ね

574:Socket774
17/07/23 22:09:30.17 nVKHDtMZ.net
InfinityFabricがFSBだとしても、広帯域で低レイテンシの上に、多数のレーン数だから別に問題ないな
1000MHz以上256bitで約40GB/s、それがCCX間で約80GB/s、ダイ間やCPU間は1Link辺り約40GB/s
PCIe3モードだと1レーン辺り1GB/sに大幅ダウン(x16で16GB/s)
InfinityFabricの1レーン(片方向)の帯域計算はコレでいいんだっけ?
DDR4 2400の場合:1200MHz x 256bit / 8 = 38.4GB/s

575:,,・´∀`・,,)っ-○○○
17/07/23 23:09:01.55 ws0oNk8Q.net
物理層はPCIeと同等で双方向128レーンあってQAM4で2倍の伝送レートにしてる

576:Socket774
17/07/23 23:47:35.94 4hgZZ+ag.net
また適当なこと言ってら

577:Socket774
17/07/23 23:56:43.59 tH+AUmZY.net
二割減るという法則や仕様はないのに
デマカセほざいたのかね?

578:Socket774
17/07/24 00:06:28.00 SCFAndBV.net
そう
デマカセにデマカセを重ねて論理を構築しようとしたけど土台から崩れたところ

579:Socket774
17/07/24 00:11:17.44 SCFAndBV.net
Infinity Fabricの使用が誤解されてるのは
次世代サーバーCPU「Naples」をRyzenのコア構造から推測
URLリンク(ascii.jp)
この記事の影響も大きいと思うわ
正直この記事の内容はほとんど合ってないんだけどね
大原の予想が外れるのは毎度のこととは言え罪作りな奴よ

580:Socket774
17/07/24 00:12:28.72 Fyk2v70D.net
ECCは空冷なみにやらかしたな

581:Socket774
17/07/24 00:51:00.45 P8R3yWJ2.net
>>548
リンク幅も中身もわからんのに帯域計算なんて無理ですがね
SDFのポート接続帯域幅に関してはそれで合ってると思うけど
同時にメモリ帯域限界も似た様なもんなので、マジな所製品版でL3同士の参照、、、
じゃ足りなくて、L3がその幅で繋がってるし全域その帯域になってるので
よって片方のCCXでローカルメモリにフルアクセスしつつもう片方のCCXでリモートを同時に参照しなきゃ
実際は色々と考慮しなくて良いワークロードだけどさ(NUMAでは避けるべき使い方か、CPUでは避けるべき使い方になる)

582:Socket774
17/07/24 00:52:55.93 9AuF5PWV.net
>>549
PAM4だろ。

583:Socket774
17/07/24 02:13:33.28 HXCPio6v.net
>>555
色々勘違いしてた
RyzenダイのIFは外部向け32本、MCM用GMI4本(1本あたり約40GB/s)
EPYCでは内部は6本(170GB/s)、外向け128本(最大256GB/s)
URLリンク(www.techpowerup.com)
2PだとCPU毎に64本(4XGMI、150GB/s)をプロセッサ間、64本を外部(最大128GB/s)に使う
URLリンク(www.servethehome)


584:.com/wp-content/uploads/2017/04/AMD-Naples-Server-Block-Diagram.jpg 以上から推測するに、 1 GMI = Infinity(PCIe) 4本 1本あたり Infinityモード10GB/s、PCIe3モード1GB/s



585:Socket774
17/07/24 02:19:57.16 Ko6bmODs.net
まあ団子にも間違いはあるさ
問題は間違いを認めて訂正もせず毎度毎度論点ずらして痛い意見はスルーして頭を下げない事と屁理屈こねて32コアデュアルEPYC機買う宣言を反古にしようとしてる所

586:Socket774
17/07/24 02:23:20.14 PGV+ipt5.net
メモリはやっぱりECC Part6
スレリンク(jisaku板)

587:Socket774
17/07/24 02:31:43.01 PGV+ipt5.net
GDDR5のnVIDIA TeslaはECC enable で帯域が減る実装だな。
CPUでそういうのは思い浮かばない
自作板でECCで容量、帯域が減ると言えばこれ
 【ANS-9010】RAMストレージ総合48枚目【i-RAM】
 スレリンク(jisaku板)

588:Socket774
17/07/24 02:43:14.33 x8QPJv21.net
メモリーセルのキャパシタの容量が減ってエラーレートが上がってきたのでECCを標準装備にしようなんて話があったけどどうなるんだろう

589:Socket774
17/07/24 05:03:52.57 P8R3yWJ2.net
>>557
PCIe及びxGMIのPhyにはE12Gって書いてある
SERDESユニットには違いないと思うから
平たく考えりゃ12GのSERDESなんだけど
どう考えても帯域が足らん、12Gbpsx16の192Gbpsを単純に8b/10b使えば19.2GB/s
そこでEの文字、Enhancedでも何でも良いけど
仮にHTみたいにDDRにしたら丁度38.4GB/s
元々HTXなんてものもあったから不思議じゃ無いしな
多分コイツはLclkが丁度600だったからその倍速同期、つまりDDRの600で実効1200っつー寸法
詰まる所外部向けxGMIことIFの正体は多分コイツで、必ずそいつが限度
但し、Mod00h-0Fh限定でさらに同期してない保証はない
まぁ最低でもこんくらい
じゃGMIは何だっつー話だが、コイツはSCFが噛んで無い
つまり完全HW実装の独立した系統という事までは良い
GreenlandとMCMのリークが正確なら4GMIで100GB/sって書いてあったのと、そん時のZeppelinは4chDDR4-3200で100GB/sとある
レイテンシネックを解消したともGPUフル帯域アクセスとも書いてある
トータルで実装されてるGMIは8本
USBとE12Gの書き方から言ってこいつはRxTx両方入ってると見れる
となれば簡単で、一本当たり1600MHz時25.6GB/s
つまりメモリのRawクロック同期で16B/cycleがダイ間に二本づつ掛かってるってこったな
正体がよくわからんが今んとこ手に入る情報じゃこんくらいが限度
IFのレイテンシが内部でさえ割とデカいから、そのまんま電気的に隔離した上で変換無しで出してる/出せるってのもあり得なくはないけどさ
俺ならSDFの中身までシリアライズした上で内部まではブロードキャストし各ポートPCSにノード振って宛先をそのまま当てて直に送ったり受けたりさせると思うけど
実装コストとの兼ね合いだな

590:Socket774
17/07/24 05:26:56.44 pVDyw4iN.net
>>561
度々出てるような気がするな

591:Socket774
17/07/24 05:40:34.77 SCFAndBV.net
>>557,562
URLリンク(cloud.watch.impress.co.jp)
これが一番わかり易いと思うよ

592:Socket774
17/07/24 05:49:07.70 ojuYQmJn.net
>>564
URLリンク(en.wikichip.org)


593:9/AMD_Naples_SoC.svg こっちじゃない?



594:Socket774
17/07/24 05:51:09.39 SCFAndBV.net
URLリンク(en.wikichip.org)
この図はAMDの技術文書に載ってるものだが、これを見る限りMCM用の
インターフェースであるGMI PCSはIO HubではなくSDFに直接繋がってる
その点だけ後藤氏の作った図 (>>564) とは違うから注意

>>562
SerDesを使ったxGMIの転送レートは9.45Gtps
PCIe3.0から128b/130bエンコーディングに変わってるので、上記の転送レートは
実際のデータ転送レートとほぼ等しい
xGMI1リンクあたりの速度は以下の通り
9.45[Gtps] x 16[bit] / 8[bit/byte] x 2[Bi-direction] = 38 GB/s
たぶん12Gtpsまで動かせるSerDesを積んでるけど、PCIe3.0のときは8Gtps動作、
xGMIのときは9.45Gtps動作ということ

595:Socket774
17/07/24 05:52:17.83 SCFAndBV.net
>>565
そっちでも良いね
後藤氏の記事も読んでほしかったからそっちを選んだんだけど

596:Socket774
17/07/24 05:55:57.57 xIptHHQc.net
>>562
むしろシリアル化自体がレイテンシと電力消費の元になるから
ノイズに弱い高周波シングルエンド信号をMCMリンクに限ってそのまま使えるようにしただけっしょ

597:Socket774
17/07/24 05:57:10.88 x8QPJv21.net
IDがSCFだ

598:Socket774
17/07/24 07:39:03.96 1jzv2Ksl.net
EPYCやThreadRipperはどのコアでもほぼDDR4-2ch分の帯域が確保できているということで、
コアが増えてもスケールしやすいのか。遠いコアのレイテンシが気になるところだな。
メモリアクセスはインターリーブの方が良いのかね?

599:Socket774
17/07/24 08:42:47.50 5U4XHE6Z.net
USBハブ君息してる?

600:,,・´∀`・,,)っ-○○○
17/07/24 08:59:55.31 6ETNZvvo.net
GMIがクロスバーによる並列動作という珍説を証明しないまま揚げ足をとる見事な論点逸らしでしたね

601:Socket774
17/07/24 09:04:17.88 HG12rCmv.net
団子君おめでとう
Platinum 8つで1000万円だよ
さあ、買え

602:Socket774
17/07/24 09:14:43.57 /xGnXJcV.net
ガバガバ理論を臆面もなく出してきた団子の自爆劇

603:,,・´∀`・,,)っ-○○○
17/07/24 09:17:26.13 6ETNZvvo.net
構成依存なのに「クロスバーだから並列に動作する」もたいていガバガバですけどね
それこそECC関係ないがメモリコマンドによるオーバーヘッドで8割くらいの実効レートに落ち着くのは結果的には確からしい

604:Socket774
17/07/24 09:20:48.50 F3swe3m3.net
>>575
またそうやって嘘をつくのか

605:,,・´∀`・,,)っ-○○○
17/07/24 09:31:27.62 6ETNZvvo.net
URLリンク(wccftech.com)
Sandra Multimediaで3x以上差がついてるね

606:Socket774
17/07/24 09:32:05.30 Y80ZogH2.net
ECCで理論帯域が2割減w

607:,,・´∀`・,,)っ-○○○
17/07/24 09:35:33.77 6ETNZvvo.net
たとえば120GB超あるはずなのに4ダイにばらけたときですら90GB/sちょっとのスループットしかでてなかったりね

608:Socket774
17/07/24 09:58:13.72 tWB5Qpzg.net
>>579
>>451
8 threads on different dies
(core 0,4,8,12...) same socket
EPYCはNUMA 8chの理論153.6GB/sに対して計測値98.7GB/sで効率0.643
Skylake-SPはモノリシックダイ6chの理論128GB/sに対して計測値77.9GB/sで効率0.608
また団子がガバってしまったか……(遠い目

609:Socket774
17/07/24 10:01:47.13 PcdoMcvC.net
Intel16コアが定格2.5GHzってマジか?
8コアが定格3.6GHz
4コアが定格4.3GHz
コア数増えてもクロック下げてくから性能がリニアに伸びて行かねえなw

610:Socket774
17/07/24 10:24:30.98 n7y5hvKB.net
団子さんのAVX512


611:称賛レスが入るに一票↓



612:Socket774
17/07/24 10:45:13.72 fcqbANMa.net
7900xが尋常じゃなく盛ってるのがおかしいだけで
何か技術革新がない限りコア増えるほどXeonの出来損ないになってくのは当たり前だろ

613:,,・´∀`・,,)っ-○○○
17/07/24 11:20:06.31 W/d2UsJJ.net
クロックが下がってもAVX512の方が速いから問題ない。同じことはAVX512を削ってAVX2を2サイクルで実行するZenには出来ない。

614:Socket774
17/07/24 11:25:05.49 fcqbANMa.net
むしろXeonレベルまでクロック落ちてないといったん下げる手間かけてからAVX回さんと壊れるわけで
本末転倒よな

615:Socket774
17/07/24 11:27:10.74 ju5KZwAA.net
>>584
爆熱で死んでるがな

616:Socket774
17/07/24 12:23:11.53 HXCPio6v.net
通常とAVX2とAVX512で、別々のクロック制御をしてるし、クロックや電力制御とかクソ面倒な仕組みなんだろうな
性能向上がAVX頼みになって、その分熱的に厳しくなるから、個別に制御して性能を稼ぐ
完全に悪循環に陥ってるわ

617:Socket774
17/07/24 13:53:45.81 mgTUaKZm.net
糞団子ちゃんガバって弱気www
AVX512ガー

618:,,・´∀`・,,)っ-○○○
17/07/24 14:19:19.85 6ETNZvvo.net
>>584
似てねーからお前

619:,,・´∀`・,,)っ-○○○
17/07/24 14:28:20.04 6ETNZvvo.net
>>585
パワーゲーティングって知ってる?
256ビット,512ビットSIMD検出時すぐには有効にならない。
上位レーンが起きるまでは下位128ビットないし256ビットユニットで2回/4回回すようになってる。

620:Socket774
17/07/24 14:44:21.78 fcqbANMa.net
それが言うほどうまくいかねーからあれなんかパフォーマンス下がってんぞって
いわゆるファントムスロットリングとか言われてる状態になるんやろ?

621:,,・´∀`・,,)っ-○○○
17/07/24 14:48:07.55 6ETNZvvo.net
選別落ちを昇圧してるi9と、Xeonを混同するなよ

622:Socket774
17/07/24 14:53:12.18 PcdoMcvC.net
Xeonの消費電力が異常でEPYCのTDPが再評価されとるわ

623:Socket774
17/07/24 14:54:46.39 fcqbANMa.net
xeonは元から低いから問題じゃないとはわしも言うとるやんけ

624:,,・´∀`・,,)っ-○○○
17/07/24 14:56:56.99 6ETNZvvo.net
>>593
2-2.2GHzだとXeon Dと変わんねーんですけど

625:Socket774
17/07/24 15:01:22.43 LhXEfEyT.net
XeonDが最後の希望か

626:Socket774
17/07/24 15:25:34.79 HlI9Mt3l.net
Sandyに絶対性能で負けるはずだったZen
なお結果は

627:Socket774
17/07/24 15:30:00.20 P8R3yWJ2.net
>>566
あぁ、その上の図が>562予想のベースな
想定クロックも書いてない公式資料以外の資料は一切使わなかった
確証が無いからな
xGMIに関してそれ計算おかしくね?
俺はそんな半端な値をセット出来るクロック及びその構成が見当たらなかった
16本のSerDesを協調させて各々がRxTxを持つ
PCIeが一緒だから必ず変動しないクロックが必要(これは他のも一緒)
仮に9.75とすればインアウト均等に分配(片方向半分)すれば説明が付く数字にはなるけど、これも整数倍じゃ無いクロックが必要だ
他でそういった構成の説明にはしていない事と、何より56GのSerDes迄14LPPのオプションに有るのに、態々メモリ帯域を半分以下に割る値にするかという
それに9G程度で良いなら一々面積を犠牲にしてまで妙な12Gを実装する必要は無いだろう、PCIe3の8Gそのままで良い

628:Socket774
17/07/24 15:30:31.32 HXCPio6v.net
高負荷だと+100W以上で酷い電力だな
URLリンク(i.imgur.com)
団子いわく無意味なPOV Ray相手に何を必死になってるんだろうな



629:POV Ray以外は省電力とでも言うつもりかな



630:,,・´∀`・,,)っ-○○○
17/07/24 15:34:44.13 6ETNZvvo.net
そういえばIntel ArkにXeon DのQuickAssist搭載モデル(モデルナンバーの末尾N)が追加されててな
ローンチが2017Q3とかいてある
どうもこれらしい。4x 10GbE対応
URLリンク(www.anandtech.com)

631:Socket774
17/07/24 15:36:03.62 F3swe3m3.net
団子アホ過ぎ

632:,,・´∀`・,,)っ-○○○
17/07/24 15:42:41.31 6ETNZvvo.net
>>599
実際MySQLのほうはEPYCの消費電力を下回ってかつ1.7倍のスコア発揮してるが一般的なデータセンターで必要な性能はむしろこっちだろう

633:,,・´∀`・,,)っ-○○○
17/07/24 15:49:41.28 6ETNZvvo.net
Googleの検索エンジンのDBも独自チューンしたMySQLといわれる

634:Socket774
17/07/24 15:58:10.75 HXCPio6v.net
URLリンク(i.imgur.com)
Ryzenダイ中身の公式資料が見当たらないから予想だけど
1:なんかのバッファ(メモリかCCX間?)
2:不明
3:GMI x4 1個あたり約40GB/s、チップセットやダイ間、CPU間の接続に使う
5:PCIe 16 x2(上下)で計32本 1GB/s
ただこれだと、2xCPU時もPCIeは使わないでGMIだけで出来るし、その場合256本のPCIeを使えることになる
2Pの場合はPCIeを半分無効化してるんじゃないだろうか

635:,,・´∀`・,,)っ-○○○
17/07/24 15:58:17.18 6ETNZvvo.net
こんなコードシーケンスじゃAVX-512なんて効きようがない
URLリンク(github.com)

636:,,・´∀`・,,)っ-○○○
17/07/24 15:59:44.99 6ETNZvvo.net
>>604
無効化せざるを得ないルート側のボトルネックがあると見るべきですな

637:Socket774
17/07/24 16:00:09.86 HG12rCmv.net
>>604
64本ずつで互いに接続してるぞ

638:,,・´∀`・,,)っ-○○○
17/07/24 16:03:49.21 6ETNZvvo.net
バカめ
PCIeコントローラではなくxGMIだぞ
そしてコントローラが独立してるなら並列動作できるというのがどっかのアホの主張

639:Socket774
17/07/24 16:09:47.99 HXCPio6v.net
データセンター向けなら、メモリ8chで2TB、PCIe 128やSATAたくさん使えるから、SSDやHDDもたくさん積める
そっち方面での需要を見越してるんだろう
演算性能だけ見て、IO性能無視とか、まともなサーバー設計や運用ではありえないな
対応メモリやディスク容量は少ないけど、演算性能は高いですとか、データセンターやビッグデータじゃ魅力薄いよな
CPUなんかいくらでも取替できるけど、データの容量や蓄積で劣るのは情報化社会では致命的だろう
7700k+8GB+1TB HDD
1800X+16GB+2TB HDD
多分SQLベンチだと上のほうが速いだろうね、でも実運用での利便性はどうだろうね

640:,,・´∀`・,,)っ-○○○
17/07/24 16:11:38.81 6ETNZvvo.net
Infinity Fabricの構造は128レーンが複数あるんじゃなくて、128レーンを分配して処理してるんじゃねーの?って言ってるわけで。

641:Socket774
17/07/24 16:14:54.89 HXCPio6v.net
>>607
そうだと思うけど、GMIx4は2P構成時にどう使われてるのか考えると、PCIeじゃ繋げてないように思えるんだよね
GMI x3はパッケージ内、残り1はCPU間の方が、帯域や接続方法として違和感がないし
そもそも、CPU間は150GB/sだけど、PCIe 64本だと64GB/sで半分以下の帯域しかないことになって計算が合わない

642:,,・´∀`・,,)っ-○○○
17/07/24 16:15:49.18 6ETNZvvo.net
>>609
メモリ積むならなおのこと4P以上の構成できるXeon有利だろ

643:,,・´∀`・,,)っ-○○○
17/07/24 16:19:22.05 6ETNZvvo.net
64GBのRedistered DIMMだと1866しかない(コントローラ933MHz駆動でInfinity Fabric低


644:速化不可避)しな



645:Socket774
17/07/24 16:21:27.71 SCFAndBV.net
>>598
SerDesだからクロックの設定にそれほど制約はないでしょ
同じレーンをPCIeとIFで共用して使うわけではなく、それぞれで専有させるわけだから
8G以上必要なのはPCIe以外のプロトコルもサポートしてるからだと思うよ
PCIe3.0より高速に動作させる必要があるものも載せてるしね
確証は無いけどRambusのIPを使ってるんじゃないかなと思う
TSMCのみならずGlobalfoundriesもサポートしてるようなので
URLリンク(www.rambus.com)

>>604
以前もどこかで書き込んだけど個人的に行ったダイ分析
URLリンク(i.imgur.com)
ラベルは>>566の資料に準拠してます

646:Socket774
17/07/24 16:25:52.63 HXCPio6v.net
GMI 1本は約40GB/s→4本で約160GB/s
PCIe 1本は1GB/s→128本でも128GB/s
どっちもInfinityFabricの流用なら、GMIの方が本来の性能に近いというか、Infinityそのものを使ってそう

647:Socket774
17/07/24 16:32:56.30 HXCPio6v.net
> 64GBのRedistered DIMMだと1866しかない(コントローラ933MHz駆動でInfinity Fabric低速化不可避)しな
3.5GHzと1200MHzで釣り合ってる感じだから、2.2GHzと933MHzの方が近い分バランス的には優れてると思うよ

648:,,・´∀`・,,)っ-○○○
17/07/24 17:03:26.28 6ETNZvvo.net
Infinity Fabricは32lane/dieでクロックあたり各方向8ビット(PCIe 3.0は4倍)と伝送レート
タイムスライスで各コントローラに各レーンを割り当てるが、32レーンが多並列にあるわけではないと。
これでOKね

649:,,・´∀`・,,)っ-○○○
17/07/24 17:08:14.34 6ETNZvvo.net
○PCIeは4bit/clk

650:Socket774
17/07/24 17:16:43.69 SCFAndBV.net
全く理解して無くてワロタ

651:,,・´∀`・,,)っ-○○○
17/07/24 17:24:10.37 6ETNZvvo.net
どうしても40GB/sを超えるスループットが叩き出せることにしたい病気の人がいますね

652:Socket774
17/07/24 17:31:52.72 HXCPio6v.net
InfinityFabricは256bitの双方向クロスバー
URLリンク(www.techpowerup.com)
URLリンク(www.techpowerup.com)
DDR4 2400だと、1200MHz*256bit/8bit=38.4GB/s
PCIe3.0は8Gb/s=1GB/s

653:,,・´∀`・,,)っ-○○○
17/07/24 17:34:49.64 6ETNZvvo.net
大体に占有じゃなくて排他だろうしな

654:Socket774
17/07/24 17:37:01.91 HXCPio6v.net
> どうしても40GB/sを超えるスループットが叩き出せることにしたい病気の人がいますね
URLリンク(i.gzn.jp)
1Linkあたり42.6GB/s

655:Socket774
17/07/24 17:40:18.55 ojuYQmJn.net
どうしても40GB/sを超えるスループットが叩き出せないことにしたい病気の人が居るね

656:,,・´∀`・,,)っ-○○○
17/07/24 17:47:09.50 6ETNZvvo.net
現に叩き出せてないじゃん

657:Socket774
17/07/24 17:48:18.86 HXCPio6v.net
団子の妄想は見てて面白いな
どうせシェアと売り上げしか誇れるところ無いから止めればいいのに

658:Socket774
17/07/24 17:51:21.26 SCFAndBV.net
ネットワーク機器の例に従えば、スループットというよりはスイッチング容量と言ったほうが良いかもね

659:Socket774
17/07/24 18:00:58.27 ojuYQmJn.net
DDR4 3200だと1600MHz*256bit/8bit=51.2GB/s

660:Socket774
17/07/24 18:03:56.03 HXCPio6v.net
少しググっただけで崩せるようなのは、知識とは言わないよね

661:Socket774
17/07/24 18:05:28.98 HXCPio6v.net
>>628
一瞬DDR4 3200のメモリが51.2GB/sも帯域ある様に見えてしまった

662:Socket774
17/07/24 18:22:02.98 GWc//fDm.net
>>630
実際2個あれば理論帯域はそうなるぞ
それに全域の速度を合わせてあるからSDFはUMC等速且つメモリバス半速な訳で

663:Socket774
17/07/24 19:17:10.39 RS1NsEuP.net
AMDはきちんとESを提供しなかったからな
その点がすごく残念
大小みな、ブルより2~3割り良いだけだと思ってたんだけど、違ったから大慌てだよ

664:Socket774
17/07/24 20:28:28.25 Aqzlaffo.net
ZenがES品Zen2が本命の製品

665:Socket774
17/07/24 20:34:28.73 HXCPio6v.net
Intelに大ダメージを与えるには、ギリギリまで秘密


666:にする必要があったからね 10nmのTigerまで開発計画立てさせてからの発表だから、今後数年を見ても修正が殆ど出来なくなる今のタイミングがベストだった



667:Socket774
17/07/24 21:41:04.55 ZpvAwNLJ.net
>>633
完成してから出せよ!

668:Socket774
17/07/24 21:41:58.85 qpvVhugz.net
AMD Mac はよ

669:,,・´∀`・,,)っ-○○○
17/07/24 22:02:19.27 6ETNZvvo.net
未完成品出して交換対応で経費嵩んで赤字展開すか?

670:Socket774
17/07/24 22:34:32.08 4KfSUkH9.net
ツマラン叩きしか出来ない糞コテwww

671:Socket774
17/07/24 22:37:47.01 fcqbANMa.net
Appleはサンボルと心中する勢いだから少なくとも航海されるまではAMDCPUは論外だ

672:Socket774
17/07/24 22:39:40.40 5AQxyXf9.net
>>637
インテルは最近
リコールしないからな(笑)

Atom C2000ファミリに18カ月前後の動作で起動できなくなるエラッタ
URLリンク(pc.watch.impress.co.jp)

673:,,・´∀`・,,)っ-○○○
17/07/24 23:23:24.63 6ETNZvvo.net
>>639
USB3.xの規格に取り込まれそうな気もしないでもないね
URLリンク(gigazine.net)

674:Socket774
17/07/24 23:33:39.56 w8LzB68R.net
>>641
お前の嘘松はもうあきた

675:,,・´∀`・,,)っ-○○○
17/07/24 23:36:28.90 6ETNZvvo.net
お前のシッカタはもう飽きた

676:Socket774
17/07/24 23:39:28.85 +plWY2rZ.net
自分がどれだけ知ったかぶりをしていたのかは覚えてない模様w

677:,,・´∀`・,,)っ-○○○
17/07/24 23:41:07.47 6ETNZvvo.net
UPIがEPICの内部接続より遅いとかデタラメ言ってたファンボーイが息してないんだが

678:Socket774
17/07/24 23:54:23.15 PH9n7bRZ.net
団子がガバガバで笑いすぎて息が出来ないんでしょうね

679:Socket774
17/07/25 00:03:03.32 frilmJCE.net
>Thunderbolt 3は最大40Gbps。USB 3.1(Gen 2)が最大10Gbpsで4倍の高速データ伝送が可能
10Gbps(1.2GB/s)で十分、それ以上が必要な一般的用途が思いつかない
>Thunderbolt 3規格はDisplayPortを内包する
USB3でも出来る

URLリンク(www.eizo.co.jp)
USB Type-CにはAlt Mode(Alternate Mode)と呼ばれるモードがある。
DisplayPort Alt Mode
 DisplayPort 1.4にも対応→最高8K/60 Hz, 4K/120Hzやハイダイナミックレンジ(HDR)信号にも対応
MHL Alt Mode
 SuperMHLにも対応→HDMIの次世代、モバイル向けから8Kテレビまでカバーするスケーラビリティ
HDMI Alt Mode
 HDMI 1.4bに対応→4k/30Hzまで対応

>給電性能は最大100W(端末へのバスパワーでは最大15W)
コンセント使うわ

>Intelは今後はCPU内にThunderbolt 3チップを内蔵していく方針
>2018年にThunderbolt 3のプロトコル仕様をロイヤリティフィリーでサードパーティに提供する予定
Ryzen売れまくってて、Core系やHEDTが微妙になった今、虚しい囲い込みだな

サンボル3は要らないな、Intel CPUの中でひっそりと息絶えて、気付いたら削除されてる気しかしない

680:Socket774
17/07/25 00:06:19.61 amXtDZYH.net
UPIって1リンク20.8GB/sだよね?
ソケット間通信速度はEPYCが75.6GB/s、XeonがUPI x3で62.4GB/sか

681:Socket774
17/07/25 00:09:57.05 frilmJCE.net



682:USB-C + この辺の変換ケーブル(2000円くらい)で大体何でも出来るようになる https://www.amazon.co.jp/s/ref=bl_dp_s_web_2127209051?ie=UTF8&node=2127209051&field-brandtextbin=AIER



683:Socket774
17/07/25 00:18:40.22 frilmJCE.net
>>648
EPYCのソケット間は150GB/s
パッケージ内のRyzenダイ間が42GB/s
GMI(InfinityFabric) 1リンク辺り約40GB/s
URLリンク(www.4gamer.net)

684:Socket774
17/07/25 00:25:37.39 ghZZESLo.net
ダイ間のリンクがGMIで
ソケット間のリンクがxGMI

685:,,・´∀`・,,)っ-○○○
17/07/25 00:38:05.43 YCXoBxL3.net
>>648
Infinity Fabricのレーンを分配して時分割で処理してるだけだからほかのI/Oと同時に使えない

686:Socket774
17/07/25 00:47:16.76 uFbO74Zi.net
まだ言ってるよコイツ

団子の言うInfinity Fabricのレーンってどこのことを指してるんだろうねぇ
レーンと言うからには普通はシリアル通信部のことを指すんだけど
ほんと謎ですわ

687:Socket774
17/07/25 00:56:26.60 frilmJCE.net
InfinityFabricって、メモリクロックと同期することでデータの送受信をスムーズにすることが目的だから、帯域がどうのこうので競うのがそもそも間違い
AMDの偉い人も言ってるね、設計が楽になってコストも安く出来て、更に予想以上にレイテンシが低く使い勝手がいいって

688:,,・´∀`・,,)っ-○○○
17/07/25 01:00:07.29 LFr0tGZg.net
>>653
うわー恥の上塗り

689:Socket774
17/07/25 01:07:29.18 jECKalXq.net
俺は団子の言うことを信じるね。
EPYC×2買って実測した結果だろうし。

690:,,・´∀`・,,)っ-○○○
17/07/25 01:14:06.45 LFr0tGZg.net
>>654
アホが認めたがらないけど垂直分割ないし時分割して使うもので「256ビット双方向バス」がダイ内で多重化されてるわけじゃないんだよね


URLリンク(pc.watch.impress.co.jp)


この図には出てこないがGMIもxGMIがどこにぶら下がってるか考えればDDR4-2400で40GB/sオーバーのI/Oスループットなんて出しようがないことはわかる

691:Socket774
17/07/25 01:15:01.30 zHauPIpJ.net
Thunderbolt 3って40Gbps を名乗ってるが
PCI-E 3.0x4 のLSIしかないんじゃなかったっけ

692:Socket774
17/07/25 01:15:30.58 uFbO74Zi.net
AMDはK7でもFSBのようなシェアードバスではなくP2P型のバスを採用し、
K8ではCPUコアとHT、メモリなどをクロスバーで接続するほどに
CPUとIO間のアクセスがボトルネックにならないような設計を心がけてきた

なのに、なぜZenでは20年も時代を遡るような設計をしてると考えるのかが理解できないわ
信じたくないが団子はクロスバーというものの仕組みを全く理解できてないとしか思えない

693:,,・´∀`・,,)っ-○○○
17/07/25 01:17:30.90 LFr0tGZg.net
>>659
願望はいらないし前世代のOpteronにもボトルネックは存在したぞ

694:Socket774
17/07/25 01:26:19.25 rBfy3Tb5.net
寝ずにID真っ赤な糞団子ちゃんwww
どんだけ張り付いてるんだよwww

695:Socket774
17/07/25 01:27:43.86 uFbO74Zi.net
>>660
高速なFSBだのUSBだのと言ってた団子の願望は否定されてますねw
実際にクロスバー使ってるし>>621

696:,,・´∀`・,,)っ-○○○
17/07/25 01:34:00.20 LFr0tGZg.net
IOコントローラが64バイト双方向でない時点で2CCXでIOを操作できんのくらい図を見ればわかるだろ

697:Socket774
17/07/25 01:48:28.28 uFbO74Zi.net
ダイ内部のSDFとIO Hub間の帯域がDDR4-2666使用時に双方向で85.3GB/s
IO Hubの先に付いてるSerDes32レーンをPCIe3.0で動かしたときの帯域は双方向で64GB/s
SDFとIO Hubの接続部の帯域は十分確保されてるね

698:,,・´∀`・,,)っ-○○○
17/07/25 01:48:54.89 6xIvBiUc.net
強いて言えばCCX間のデータ交換にメモリやIOHubを経由せずにダイレクトにデータ交換できる程度にはクロスバーだろうけどね
IOHubに繋がったコントローラ同士で32Bの帯域の同時並列化は構造上どう考えても無理筋だよ
モノリシックダイのXeonでは発生しないGMIを経由したCCX同士のデータ交換やFar Memory AccessでIOHubの帯域を食われるうえPCIeやUSBを捌かないといけない。

699:,,・´∀`・,,)っ-○○○
17/07/25 01:51:09.26 6xIvBiUc.net
>>664
xGMIとGMIはどうした?
カタログ上のピークスループット確保するのにIOHubに合計160GB/sの帯域が必要だぞ

700:,,・´∀`・,,)っ-○○○
17/07/25 01:53:46.92 6xIvBiUc.net
それでXeonのUPIより優れてるとかガバすぎるだろ
8コアで細切れにした時点でIOが相対的にネックになるのは自明

701:Socket774
17/07/25 01:54:55.98 uFbO74Zi.net
>>666
xGMIとGMIはIO Hubを経由せず、SDFに直接つながってるけど?

702:Socket774
17/07/25 01:56:07.44 uFbO74Zi.net
またしょーもない勘違いをしてたみたいだな

703:Socket774
17/07/25 01:58:25.49 rBfy3Tb5.net
涙目ガバ団子ちゃんwww
フルボッコwww

704:,,・´∀`・,,)っ-○○○
17/07/25 02:00:33.68 6xIvBiUc.net
道順は間違っても結論は変わらんけどな

705:Socket774
17/07/25 02:01:31.89 uFbO74Zi.net
迷子になって全然違うところ行っちゃったねw

706:,,・´∀`・,,)っ-○○○
17/07/25 02:05:17.80 6xIvBiUc.net
残念だがGMIで継ぎ接ぎしただけのダイではデータ共有型のマルチスレッドを効率的に処理できないね

EPYCが大差で負けたMySQLのベンチの結果も分析して見ればそうなんじゃないの?
(Xeon Goldの16コアあたりにも負けそう)

707:Socket774
17/07/25 02:09:58.53 frilmJCE.net
InfinityFabricは調べれば調べるほど奥が深くて良い設計されてることに毎回驚くな
しかもRyzenだけじゃなくVegaにも使われてるみたいで、少し考えてみたら、そっちでも結構良さそうな感じだった

ジムケラーマジ天才過ぎる、未来人か宇宙人としか思えない
CPUコアのアーキテクチャどころの話じゃなく、ヘテロジニアスシステムそのものの根幹に関わるような重要な技術に見える
メッシュバスで喜んでるIntelじゃ逆立ちしても追いつけない技術の差みたいなのを感じる
コレパクられたら相当やばいから、多分特許で囲い込んでると思うよ

708:Socket774
17/07/25 02:10:49.86 rBfy3Tb5.net
思い込み
ウソ
大げさ
~じゃないの
~そう

wwwwww

709:Socket774
17/07/25 02:15:20.94 uFbO74Zi.net
結局なーんにも理解してなかったことが改めて判明したね
これであれだけ偉そうな口を利けるんだから驚くよ

710:Socket774
17/07/25 02:15:34.09 rBfy3Tb5.net
では団子ちゃん、どうぞ(笑)

711:Socket774
17/07/25 02:16:12.82 BdmERIT/.net
データベースソフトに関しては、ソフトをEPYCの内部構造にあわせてチューニングしないと
パフォーマンスは出ないときもあるでしょう

EPYCが普及すれば、データベースソフトベンダーや、オープンソースの場合はその開発者も無視できなくなり、
EPYC向けのチューニングが入るのでましになるのでは?

712:,,・´∀`・,,)っ-○○○
17/07/25 02:16:24.81 LFr0tGZg.net
ゴミが偉そうだな
妄想にふける前に時分割ではなく並列動作する証拠でもだせよ

713:,,・´∀`・,,)っ-○○○
17/07/25 02:18:31.36 LFr0tGZg.net
>>678
AVX-512最適化が既に入ってるので128ビットは無理筋
伸び代がないからソフトがintelに最適化される前に売り逃げないといけないクソアーキだよ

714:Socket774
17/07/25 02:22:58.23 rBfy3Tb5.net
ほら吹きが証拠出せってwwww
自問自答かよwww

715:Socket774
17/07/25 02:38:07.77 NK10mqdN.net
>>679
せんせー
どーやって内部回線でTDD使うんですかー?

716:,,・´∀`・,,)っ-○○○
17/07/25 02:40:04.27 YCXoBxL3.net
普及すればソフトが対応するって考え方が既にオープンソースに寄生するゴミクズでしょ
企業がコードを寄贈して金銭的支援して成り立ってんだよ
C-RayもPOV-Rayも企業にとって無価値だからいくらオープンにしても支援されないしSSEにすら対応して貰えない

717:,,・´∀`・,,)っ-○○○
17/07/25 02:41:56.45 YCXoBxL3.net
>>682
TDDができないならクロスバーも実現できないんだけど

718:Socket774
17/07/25 02:55:49.85 v1le+bYR.net
URLリンク(www.servethehome.com)

 なかなか面白い記事。やはりAMDは魔法を使ったわけじゃなくて、
構造相応のレイテンシは発生するってことだね。あとは用途次第か。

719:,,・´∀`・,,)っ-○○○
17/07/25 03:18:54.73 YCXoBxL3.net
ソケット内通信でもUPIより高レイテンシとか、ファンボーイにブーメラン突き刺さりまくりでしょこれ
GMI/xGMIまたぎのメモリスループットも半分近くまで落ちてるし
(これはそれこそ「時分割」で説明できてしまうな)

やっぱりRyzen 4つの分散コンピューティングに毛が生えたような使い方が一番得意ってことだな

720:Socket774
17/07/25 05:53:51.40 5A5ACL7N.net
>>641
gigazineじゃねーか

721:Socket774
17/07/25 05:57:38.73 GQGPkAxE.net
こいつなんでこんなに必死なんだろうか

722:Socket774
17/07/25 06:35:49.38 NaIQaRvH.net
Broadwell-EP(intel Broadwell) VS Skylake-SP(intel Skylake) VS EPYC(AMD Zen)

デュアルXeon E5-2699v4 VS デュアルXeon 8176 VS デュアルEPYC 7601

メモリーサブシステム帯域幅
URLリンク(images.anandtech.com)

マルチスレッド整数パフォーマンス
URLリンク(images.anandtech.com)

Javaのパフォーマンス「販売時点リクエスト、オンライン購入、およびデータ・マイニング・オペレーションのミックスを扱うITインフラストラクチャと世界的なスーパーマーケットの会社に基づいて使用モデル」
MultiJVM SPECJbbテストの最大スループット数
URLリンク(images.anandtech.com)
応答時間制約の下でのスループット数
URLリンク(images.anandtech.com)

浮動小数点パフォーマンス
浮動小数点C線4K
URLリンク(images.anandtech.com)
浮動小数点:POV-Ray 3.7
URLリンク(images.anandtech.com)

浮動小数点:NAMD
このベンチマークの最初のショットでは、古いデータセットと比較できるようにバージョン2.10を使用しました。
URLリンク(images.anandtech.com)

バージョン2.12は「インテルのコンパイラのベクトル化を利用し、自動ディスパッチはAVX命令をサポートするIntelプロセッサのパフォーマンスを向上させている」と思われます。だからもう一度試してみましょう
URLリンク(images.anandtech.com)

システム消費電力比較
SKU TDP
アイドル消費電力
最低のレスポンスでの消費電力
100%CPU負荷での消費電力
デュアルXeon E5-2699 v4 2×145W 106 412 425
デュアルXeon 8176 2x165W 190 300 453
デュアルEPYC 7601 2x180W 151 321 327
URLリンク(www.anandtech.com)

デュアルXeon 8176 TDP165Wが453WでTDPよりかなり高めの消費電力で詐欺が判明
デュアルEPYC 7601 TDP180Wが327WでTDPよりかなり低めの消費電力が判明


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch