17/07/19 23:19:00.34 KM5VyKi5.net
速くて安くて旨いのは
AVX512 VS GPGPU
さてどっちでしょうか?(笑)
104:,,・´∀`・,,)っ-○○○
17/07/19 23:29:48.38 YqLi15+X.net
>>100
PS4でAVXを使わないってことは単精度をスカラで扱うということだ
128ビット幅でももちろん単純計算で4倍、divssをrcp*で代用したりパイプライン化も含めればそれ以上
SSEからAVX-512にマイグレーションするのもベクトル幅で4倍、FMAでその倍の8倍、更にbroadcastやマスク演算も込み込みで考えれば実性能は格段に上がるな
105:,,・´∀`・,,)っ-○○○
17/07/19 23:31:10.51 YqLi15+X.net
>>101
あんたSkylake-XのBIOS知ってんの?詳しく教えろよ(ニヤリ
106:Socket774
17/07/19 23:41:05.14 CNmoRgMc.net
>>104
どっかのアフィブログ管理人と同じ勘違いしてるよ。
Skylake云々以前の問題だな。
107:Socket774
17/07/19 23:46:10.41 yXOU9des.net
ApollolakeやCore系のCeleron、Pentiumを間接的にディスるとは(笑)
今までAVX対応CPU/APUをAVX非対応CPUで散々ディスっていたのに(笑)
ここに来てAVX押しですか?本当にこの人はダブスタですね(笑)
108:,,・´∀`・,,)っ-○○○
17/07/19 23:51:24.44 YqLi15+X.net
4コアで6Wしか食わないGoldmontはZenよりはるかに電力効率いいけど?
絶対性能を諦めれば電力効率は上げられるからな
バックエンドが128ビット実装でデコーダがAVXに対応するのはそれほど意味はない
使わない理由も成立するからだ
毒(AVX)を食らわば皿(512)まで
109:Socket774
17/07/20 00:03:16.24 wdbKy85U.net
>>103
そういうのは否定してないが
ほんの数年前まで「128bitニコイチじゃだめんなんですよ(ドヤァ」
とか言ってた人の言うことじゃない
ま、JaguarのFPあげのついでにzenのFPあげもすれば今回のことは水に流してあげる
少なくともJaguarと同じ以上の恩恵をzenも得られてるわけだから
110:,,・´∀`・,,)っ-○○○
17/07/20 00:08:13.63 atZFZImU.net
毒を食らわば~はKnights HillがGoldmont+AVX512拡張と目されてるからこそ言ってる
111:Socket774
17/07/20 00:17:22.06 KZ9En3/S.net
>>102
セレペンにはSSEかGPGPUしか無いんや
AVX512はHEDTかサーバーでしか使われないんや
HEDTだとベンチしか無いし爆熱なんや
GPGPU対応増やせばセレペンも性能アップするけど、APU無双が明らかなんや
結局のところ、SSE対応が楽でデメリット少ないからそれで抑えるしか無いんや
112:Socket774
17/07/20 00:21:47.93 p1wvPdwa.net
長い目で見ればヘテロジニアス環境はAPUと同じになる(と言うかAPUが路線を決定付けた)のでインテルもヌビも手を出せば出すほど辛くなっていく
ヌビはシュリンクの恩恵が受けられるからまだ保っているがインテルはもう無理だろうな
113:,,・´∀`・,,)っ-○○○
17/07/20 00:24:18.61 atZFZImU.net
SSE対応は楽じゃないよ
苦労した過去の資産があればこそそれを使えるだけだ
大規模演算におけるAVX-512の活用はコンパイラが進化した今は格段に楽
114:,,・´∀`・,,)っ-○○○
17/07/20 00:37:18.30 atZFZImU.net
機械学習の導き出したパターンマッチングのルーチンは半固定化されCortex-M0クラスのマイコンにも移植されてまたIoTデバイスとして出回り、ビッグデータを生み出していく
消費者が触れるところにAPU(笑)の活用の場所などありはしない
せめてラズパイサイズのボード出してから出直せ
いつまでも
あると思うな
Windows
115:Socket774
17/07/20 00:37:43.01 wdbKy85U.net
> 大規模演算におけるAVX-512
まったくその通りだろうけど元は次期新コアの話だし
命令とアーキテクチャ、コンシューマ/鯖、スパコン(メニ―コア)と性格の違うものをごっちゃにしてまで
AVXあげに勤しむ必要はないと思うんだけどね
とりあえず上のJaguarのAVXサポートによる恩恵などは
zenのFPU実装を貶したときに揚げ足取れるから誰かコピっとくべし
116:Socket774
17/07/20 00:41:16.11 wdbKy85U.net
AVX512を実装するskylake-xを爆熱と言われてることが我慢ならないんだろうが
見境なくAVXあげしないと自我が保てないあたりAMDerのHSAあげコピペ並みに滑稽である
117:Socket774
17/07/20 01:13:45.00 KZ9En3/S.net
最近AMDはHSAって言わないだけで、やってることはHSAそのものだけどね
最近はCPUやGPU単体にフォーカスしてるけど、InfinityFabricはコヒーレントバスで、HBCCは仮想アドレス対応広範囲メモコンだし
根っこの部分はHSA対応の強化になってる
118:Socket774
17/07/20 01:18:02.50 S8gq09wS.net
Goldmontは効率良い(キリッ
とかドヤ顔されてもwww
性能良かったハズのRambusって
どうなったんだっけ???
さて現在、周りから梯子を外されかけているのは何処でしょう…(笑)
119:Socket774
17/07/20 01:36:24.47 cKF798xH.net
団子はいい加減、Skylake-Xを持ち上げるためにAVX512を出すのはやめろよ
MCDRAMがついてないんだからメモリ帯域が圧倒的に足りないって自分でも認めてたじゃないか
884 名前:,,・´∀`・,,)っ-○○○ (アウアウウー Saaf-rvCH)[sage] 投稿日:2017/04/16(日) 19:39:21.09 ID:2vlHy48ca [2/2]
(略)
Skylake-XeonはそもそもDDR4-6chだけではAVX-512を実行するのに致命的に帯域が足りないはずだ
120:Socket774
17/07/20 01:58:10.45 V2M9tN/t.net
>>112
馬鹿じゃないのアンタ
そんなのはGPGPUに任せた方が楽
121:Socket774
17/07/20 02:50:40.00 lzkIbvuK.net
浮動小数点演算をGPUに投げるってのはいいアイデアだけど今の状況だとNVIDIAの売り上げに貢献してしまうので
AMDはもうちょっとSIMDを頑張ってくだちい
122:Socket774
17/07/20 03:06:57.14 xqXvJz0o.net
MSが次のwindowsでavx必須化、intelもamdも全x86プロセッサをavx対応
とかやればもっと普及するでしょう
123:Socket774
17/07/20 03:16:58.77 hc0HrwSQ.net
Pentiumとi3の差別化が出来なくなるので駄目です
124:Socket774
17/07/20 03:31:11.48 xqXvJz0o.net
celeronとかpentiumは、わざと遅く実行して半速avxでいいじゃん
消費電力も少なくできるしね
125:Socket774
17/07/20 05:32:07.27 2xEuI4MG.net
>>116
URLリンク(www.openfabrics.org)
HSAfoundation.とXilinxの協業でCCIX、Gen-Z、OpenCAPIに昇華したのでは
足りてないHSA要素はopenCL関係だけど
OpenCL 2.2でvulkanにマージされるの決まってるし後から追加されそうな気もする
とりあえずINTELはAlteraを買ったのは間違いだったと身をもって知る事になるとは思う
126:,,・´∀`・,,)っ-○○○
17/07/20 05:49:36.56 ZJUSu1XQ.net
HSA総合スレ【part 3】
スレリンク(tech板)
そもそも技術求めてる奴がいないんだもの
なにかと勘違いした連投が続いてスレが伸び大方プログラムもかけもしない奴のAMD賛美(わざわざ自作PC板から出張お疲れ様です)とか
本当に求められてるプログラム技術は質問や意見、不満の交換が活発だ。このスレの需要がAMDの未来そのものだろ?
127:,,・´∀`・,,)っ-○○○
17/07/20 05:55:30.57 a71cnnA6.net
HSA Foundationの代表が突然AMD退社してNVIDIAに逃げ込みはしたけどまだ活動はしてるだろ?え?
って、今サイト見たら504で大草原
128:,,・´∀`・,,)っ-○○○
17/07/20 05:59:33.33 a71cnnA6.net
URLリンク(github.com)
こっちは1年以上も更新ない
QualcommもMediaTekも関わってるプロジェクトだドヤアしてたけど結局AMD関係者以外コードコミットしない公開(処刑)レポジトリだったな
129:Socket774
17/07/20 06:04:05.58 xqXvJz0o.net
OpenGL以前のAMDのGPGPUで、実用コード書いてたのって、
商用DVD・BD再生ソフトくらいしか知らない
OpenGL以降は、ちょこちょこみかけるが
130:,,・´∀`・,,)っ-○○○
17/07/20 06:06:13.29 a71cnnA6.net
HSAILなんてOpenCLにSPIRあるからだれも必要としてねーよってバカにしてたよな3年前
なんでまともに動くもの作る前に活動停止してんだ?
俺は逆神だからHSAILはどんどん活用されるんだろ???AMDファンボイ様よお~
(種蒔きしても収穫まで育てないってこういうことを言ってる)
131:Socket774
17/07/20 06:10:21.46 UA7LtEoM.net
>>129
つROCm
132:,,・´∀`・,,)っ-○○○
17/07/20 06:13:57.63 a71cnnA6.net
QualcommやMediaTekはどこに行った????
AMDが勝手に諦めて終了かよHSAは
133:Socket774
17/07/20 06:21:45.29 xqXvJz0o.net
OpenGLでHSA相当のことをできるようにすればそれでいいし、現にそうなってるな
ディープラーニングもAMD独自規格つくるより、OpenGLにディープラーニング拡張でもしたほうがいい
134:Socket774
17/07/20 06:22:10.52 xqXvJz0o.net
タイプミスでOpenCLのまちがいね
135:Socket774
17/07/20 06:26:54.90 2xEuI4MG.net
早起きしたんなら散歩でもしてきたら
May 11, 2017 HSA Foundation Establishes China Regional Committee to Enhance Global Awareness of Heterogeneous Computing
URLリンク(www.marketwired.com)
July 09, 2017 Heterogeneous Computing Standards & International AI Conference Paving the Way Towards Global HSA Specifications
URLリンク(www.marketwired.com)
136:,,・´∀`・,,)っ-○○○
17/07/20 06:33:46.70 a71cnnA6.net
URLリンク(github.com)
この人
HSAのレポジトリのメンテやめてROCmやってるのは�
137:墲ゥるが1ヶ月くらいなんのコミットもしてないな
138:Socket774
17/07/20 06:50:22.74 0N8j91U8.net
AVX512普及させると
非対応が糞遅くなる諸刃の剣
139:,,・´∀`・,,)っ-○○○
17/07/20 07:01:08.60 a71cnnA6.net
>>132
SPIRとは別のレイヤーで共存するもんだっていってたはずだけど
URLリンク(pc.watch.impress.co.jp)
ちなみにSPIR-Vの仕様、NVIDIAのPTXのデッドコピーだし実際ワーキンググループの3名がNVIDIA所属(AMDは1名)
URLリンク(www.khronos.org)
HSAILをサポートしかけてたOpenCLランタイムのプログラムスタックごっそり捨ててROCm開発してるからそのままではHSAILは動かないだろうし移植も行われないだろう
そうやってAMDが自社も含めて誰も使わない誰も保守しないオープンソースを量産してる間にもNVIDIAやIntelはエンプラ用途でヘテロジニアスコンピューティングの足場を固めてるわけ
140:,,・´∀`・,,)っ-○○○
17/07/20 07:03:09.01 a71cnnA6.net
>>136
ああ、たとえばGCPの早期評価プログラムでAVX-512対応を既に済ませてしまったソフトにとっては非対応(EPYC)がクソ遅くなるね
141:,,・´∀`・,,)っ-○○○
17/07/20 07:09:57.26 a71cnnA6.net
URLリンク(cloud.google.com)
ここに名の上がってるソフトベンダーは少なくともEPYCの電力効率ははるかに低いとみなすだろうね
142:Socket774
17/07/20 07:33:16.97 1n7pzVD0.net
そこには最高20%の高速計算能力と書いてあるだけな
143:,,・´∀`・,,)っ-○○○
17/07/20 07:43:10.12 a71cnnA6.net
Xeon Gold 6130($1894-1900)は定格2GHzで16コア,AVX-512 FMAユニットが2基
3割落ちのクロックでTDPと釣り合うならAVX512のOffsetを1.4GHzに設定すればいい。
それで倍精度716.8GFLOPSで125W
かつこれが4ソケット構成可能
$4000超えのEPYC7601は563.2GFLOPSで180W
GoogleやAWSがEPYC選ぶ理由がない
144:,,・´∀`・,,)っ-○○○
17/07/20 07:55:53.87 a71cnnA6.net
>>140
ビジネスアプリで+20%なら十分だが
そしてより重要なのは客にとっての費用対効果
> Run more, save more; up to 30% monthly discount automatically with Google Cloud Platform.
Googleは分単位課金で、コアあたりの性能がいいので自動的に(Broadwell比)最大30%の節約になる
もちろんこの料金体系下ではAVXが遅いEPYCを使う理由が客にとってまったく無い
もちろんGoogleにとっても無いから電力効率も費用対効果も悪いEPYCは採用しないことにしているだけでは?
145:Socket774
17/07/20 07:59:25.15 1n7pzVD0.net
EPYCが出る前に書いた記事だろw
146:,,・´∀`・,,)っ-○○○
17/07/20 08:01:33.49 a71cnnA6.net
GoogleはEPYCのESの評価もしてたはずだ
Radeon Instrictもだけどな
GPUも現状Tesla P/Vの効率に及んでないので使う理由がない
147:Socket774
17/07/20 08:02:53.00 1n7pzVD0.net
>>144
ばーかそんな事出来るわけねえだろ?
148:,,・´∀`・,,)っ-○○○
17/07/20 08:05:46.16 a71cnnA6.net
採用する理由もないけどな
SIMDなしで使うならXeon Dの方が電力効率いいし
149:,,・´∀`・,,)っ-○○○
17/07/20 08:06:24.68 a71cnnA6.net
ありで(AVX2)使っても最大2倍の性能差か
150:Socket774
17/07/20 08:07:47.16 NMz0zQOD.net
Xeon Dの効率が良い何て言ってるのは団子1人しかいないよ
151:Socket774
17/07/20 08:11:42.89 6OhTKJ/r.net
カタログスペックばかり言ってないでAVX2の有効と無効の具体的なベンチマーク見せてやれよw
Ryzen 7 1800X(TDP95W) VS Core i7-596
152:0X(TDP140W) http://pc.watch.impress.co.jp/img/pcw/docs/1047/474/l04.png
153:Socket774
17/07/20 08:23:02.07 v3mZWZHE.net
団子曰く、帯域足らずのうんこ製品を鯖やスパコン向けに売ってるintel
154:Socket774
17/07/20 08:27:07.56 HOZMypMC.net
団子ちゃんもっとがんばれ��
URLリンク(hissi.org)
155:,,・´∀`・,,)っ-○○○
17/07/20 08:29:32.22 a71cnnA6.net
>>149
へえ
URLリンク(images.anandtech.com)
URLリンク(images.anandtech.com)
156:,,・´∀`・,,)っ-○○○
17/07/20 08:33:24.70 a71cnnA6.net
C++版はEmbreeベースでAVX-512にも既に対応済み
157:Socket774
17/07/20 08:35:02.47 4KEtTGdK.net
AMDもAVX2は将来はネイティブ256にする気のあるような発言してたけどインテルは512のあとどうする気なんだろうな。
富士通も最大2048まで定義はしてるけどキャッシュラインどうする気なんだ。
158:Socket774
17/07/20 08:41:49.27 sc8koHb5.net
>>152
2chのryzenと4chのcorei7の比較だと、キャッシュを含むメモリ周りが影響するから、フェアな比較じゃないような気がする。threadripperとの比較が妥当なんだろうけど。
159:,,・´∀`・,,)っ-○○○
17/07/20 08:42:29.61 a71cnnA6.net
CoronaもEmbreeベースだったような
URLリンク(images.anandtech.com)
160:Socket774
17/07/20 08:47:38.85 6OhTKJ/r.net
>>153
その中にAVX512に対応してるCPUどれ?
161:Socket774
17/07/20 08:48:26.34 6OhTKJ/r.net
>>156
Intelの主張するような4倍になってねぇな?
162:Socket774
17/07/20 08:51:20.27 0tF/FpJi.net
へんなベンチ回路増やすよりコア増やしたほうがいい
163:,,・´∀`・,,)っ-○○○
17/07/20 09:02:31.22 a71cnnA6.net
>>154
256を8回ないし512を4回まわすからだよ
あれはオペランドが5ビット、すなわちレジスタ32本しかなくてアンロール用のレジスタ本数が足りないから幅で補うためのものだ
これはPhiが4wayのマルチスレッド対応してるのと同じ理由で、富士通は電力コストの高いアウトオブオーダー実行やキャッシュ効率を下げるHWマルチスレッドに頼る気がないからベクトル長を演算ユニットの数倍に増やしたいんだ
164:Socket774
17/07/20 09:10:29.85 6OhTKJ/r.net
Ryzen 7 1700のコスパとワッパと絶対性能の良すぎるベンチマーク結果しか出せてない
Skylake-X何か勧めたらThreadripperにしようと考えてる人に笑われるだけ
165:,,・´∀`・,,)っ-○○○
17/07/20 09:35:37.90 a71cnnA6.net
>>158
追加のFMAついてるのは7900Xだけだぜ?
それ以外はAVX2までの2つの256ビットFMAを1つの512ビットFMAとして動かしてる
つまりネイティヴ512ビットでなくてもAVX-512のレジスタ増加やその他の命令密度向上効果で10%上の性能を実現してるということ
7900XもDDR4 4chの割には伸びてるし、ポート5にポン付けしただけのコスト増は十分ペイできてると思うけどな
当たり前だが並列化できない部分は512使ってもスケールしない
166:,,・´∀`・,,)っ-○○○
17/07/20 09:44:20.85 a71cnnA6.net
>>161
JavaScriptの性能が2割くらい低いんだよなあ
URLリンク(www.anandtech.com)
同じV8ベースのNode.js使ったWebサーバでも同じ傾向ならサーバでもダメダメじゃん
もちろんAVXのきかないベンチだ
167:Socket774
17/07/20 09:46:28.47 lHnKItRI.net
>>163
死ね
168:Socket774
17/07/20 10:02:40.62 6OhTKJ/r.net
>>163
Threadripperのベンチマーク持ってきたのかと思ったらi9-7900Xのベンチマークかよw
例を挙げると12コア24スレッド
Threadripper 19
169:20Xが3.5GHz 799ドル Skylake-X i9-7920Xが2.9GHz 1199ドル でもRyzen7と同じ8コアのi7-7820Xは3.6GHzだったのに コア数増やすほどクロックが劣化して行くのがSkylakeの特徴 intelの14nm+期待外れと言わざるを得ない
170:Socket774
17/07/20 10:09:02.69 cKF798xH.net
884 名前:,,・´∀`・,,)っ-○○○ (アウアウウー Saaf-rvCH)[sage] 投稿日:2017/04/16(日) 19:39:21.09 ID:2vlHy48ca [2/2]
(略)
Skylake-XeonはそもそもDDR4-6chだけではAVX-512を実行するのに致命的に帯域が足りないはずだ
致命的とは一体…
いつも通りその場で口から出まかせ言ってるだけだな
171:Socket774
17/07/20 10:12:12.17 ARvI+sYp.net
>>165
コア数を増やすとクロックが落ちていく
クロックを維持しようとすると爆熱
この問題をなんとかしないと厳しいよな
やっぱMCMは正義か
172:,,・´∀`・,,)っ-○○○
17/07/20 10:18:00.07 a71cnnA6.net
単に電圧を落としてるからでしょ
そのかわりに結構高い頻度でSEGVする個体が含まれるが検品で弾けてないと
173:Socket774
17/07/20 10:32:31.96 VcSBRSgL.net
>>168
プププ 2.9GHz セレロン12コア(プ
174:Socket774
17/07/20 10:36:27.84 6OhTKJ/r.net
Xeon Gold 6150が18コア36スレッドで6ch DDR4で絶対有利な条件下にも関わらずCinebenchは2900でしかない
URLリンク(gw.alicdn.com)
Threadripper 1950Xは16コア32スレッドで4ch DDR4でハンデありなのに3062ある
1コアあたりの性能も逆転してるな
175:Socket774
17/07/20 12:45:58.40 Yask8MLK.net
>>168
また出任せかよ
176:,,・´∀`・,,)っ-○○○
17/07/20 12:58:41.60 MSSUnA7X.net
事実だから反論できまい
史上空前の不良率
177:Socket774
17/07/20 13:19:40.95 Q/1AKxSN.net
SEGVの原因特定しちゃうスーパーエンジニア団子ちゃん
178:Socket774
17/07/20 13:33:06.80 /XmC9il7.net
Xeon Gold 6150(18コア36スレッド)の値段っていくらなのか?
Xeon Gold 6150のPCIe3.0のレーン数っていくつなのか?
なぜ999ドルのThreadripper 1950X(16コア32スレッド)の性能に負けてるのか?
179:Socket774
17/07/20 13:39:19.20 p1wvPdwa.net
インテルが本当に取るべき政策はAVX512何て作る事ではなくて、celeronからXeonまで全てのラインナップにAVX128を搭載する事だし
お偉いさんを一新しないとゴミを作り続けるだろうよ
ネームブランドにしがみ付くだけでマーケティングのマの字も無い
180:,,・´∀`・,,)っ-○○○
17/07/20 14:19:44.65 wJRPnYKH.net
デコーダだけで1W食うものを1.5W/coreの石には載せられないだろ(数字は適当
181:,,・´∀`・,,)っ-○○○
17/07/20 14:20:38.24 wJRPnYKH.net
>>173
特定できてないことが救いだとでも思ったか?
いまだに販売してることが倫理的におかしいよ
182:Socket774
17/07/20 14:42:31.86 WXVTCdcV.net
>>175
ほんこれ
183:,,・´∀`・,,)っ-○○○
17/07/20 14:51:09.21 wJRPnYKH.net
無効にしてる石で有効にするかどうかならまだしもデコーダを載せろという発想はおかしい
QuarkなんてAVXどころかMMXすらないぞ
184:Socket774
17/07/20 15:01:40.77 KZ9En3/S.net
セレロンがAVX対応するとi3の存在価値がなくなってしまう、多分それが一番のネック
それにICELakeまではテープアウトしてるし、10nm++のタイガーレークまで開発が進んでいる
お偉いさんを一掃しても方向転換するには当分待たないといけない
185:Socket774
17/07/20 15:03:56.99 RIyDzRv/.net
>>180
段階的に対応するバス幅を増やすとかじゃない?
i3からはAVX256にするとか
現状だとcudaとかOpenCLで十分だし
186:Socket774
17/07/20 15:12:13.21 Yask8MLK.net
>>179
どの面下げてスレに書き込んでんだよ糞が
187:,,・´∀`・,,)っ-○○○
17/07/20 15:17:26.48 wJRPnYKH.net
そもそもお前の想定するアプリはSSEすら対応してないか
188:保守自体しないまま放置されてるだろ いくらCeleronでAVX対応してもケツは叩けないよ そんな手間かけるくらいならAndroidアプリの工数かけたほうがマシだもの
189:,,・´∀`・,,)っ-○○○
17/07/20 15:22:01.68 wJRPnYKH.net
AMDが自社で専用アプリでも作ればいいじゃないか
Celeronのシェア奪えるぞ
190:,,・´∀`・,,)っ-○○○
17/07/20 15:28:08.03 wJRPnYKH.net
CeleronでAVXを使えないことをAVX使わない言い訳してるソフト開発者なんて架空の存在は想定する必要はないし
Windows10ですらSSE2以上対応なのでどのみちSSE2~SSE4世代のCPUの個別対応は必要
191:Socket774
17/07/20 15:52:38.37 xXfU5yKP.net
>>180
Ice Lakeはテープアウトじゃなくてテープインだよ
192:Socket774
17/07/20 16:00:47.80 KZ9En3/S.net
テープインって何?
ググったけど見つからず
193:Socket774
17/07/20 17:15:11.81.net
説明
URLリンク(www.guru3d.com)
194:Socket774
17/07/20 17:18:12.52.net
>>187
テープアウトが設計完了とかだから、設計開始じゃね?
そんなワード聞いたこともないけど
195:Socket774
17/07/20 17:24:06.90.net
テープインは物理設計に入った事じゃなかったかな
テープアウトが物理設計上がりだから
196:Socket774
17/07/20 17:35:07.16.net
>>189
テープアウトは。テープ媒体で出荷(OUT)ってこと、
時代はテープ→フロッピ→光学媒体→フラッシュメモリ、ネット経由と進化しただけ。
自分が1987年ぐらいに上司の話として上司が納品するとき現実にテープアウトをテープでやっていたと教えてもらった。
197:Socket774
17/07/20 17:41:23.23.net
初めて聞く用語で誰もよくわからないみたいだし気にしなくていいということかな
198:Socket774
17/07/20 17:41:47.23.net
>>121
Microsoft、一部Atomに対するWindowsの大型アップデート提供を打ち切り
URLリンク(pc.watch.impress.co.jp)
Clover TraillってBonnelとPowerVRSGX545の産廃がドライバサポートの問題で消えるらしいからSandyBrdgeもHD3000と一緒にAVXも巻き添えでそのうち消えそうだな
199:Socket774
17/07/20 17:44:44.61.net
AVX等の拡張命令の有無でラインナップの差別化をはかる戦略、ほんとやめるべきだね
200:Socket774
17/07/20 17:47:57.79.net
>>185
お前の意見は結構ですから
どうぞ消えてください
201:Socket774
17/07/20 17:55:12.80.net
AVXはともかく
SSE2以上の対応が進まないのがね
K10が事実上SSE3まででPrescott互換な問題もあるしCeleron/Pentium/AtomはSSE4.2でWestmere互換だしな
UEFI対応なりDX11サポートなりで
IvyBridge/HD4000・TrinityAPU/HD8000とかそれ以外の要素でサポートを区切らない限り進まないと思う
202:,,・´∀`・,,)っ-○○○
17/07/20 17:58:46.81.net
仮想化とAESはどの系統の現行Celeronにもついてるけど
じゃあAESガンガン使ってるソフトどんだけあるの?って話
仮想化も出荷時無効にしてるPC多いしね
203:Socket774
17/07/20 18:05:56.57.net
どうせ対応したって特定分野の処理が3割増し程度だから
そのためにSSE世代を切る必要性はない
どうせやるならCore2未満のIPCなプロセッサの切り捨てのほうをやるべき
(ちなみにwinの動作環境の話)
204:Socket774
17/07/20 18:30:10.34.net
Core2互換SSSE3だとBonnellのAtomも対象になるよ
205:Socket774
17/07/20 18:32:05.52.net
G4560買う層はAVXの有無よりもコスパ重視
AVX必要な性能重視の層は最初からi3なんて見てない
ラインナップが本当に�
206:�
207:Socket774
17/07/20 18:50:21.60.net
そんな差別化してれば流行らんわなw
208:Socket774
17/07/20 18:52:45.07.net
何が問題かって、penG以外に魅力が全然ない事だな
そのくせラインナップだけは一丁前に沢山ある
209:Socket774
17/07/20 19:10:47.55.net
>>197
死ねよぶっ殺されろよ
210:Socket774
17/07/20 19:21:27.82.net
AVXを使う処理はメモリー帯域がボトルネックになりがちなので下位モデルでAVXを有効にするとお得になりすぎる
211:Socket774
17/07/20 19:27:22.07.net
XeonPhiみたいに4スレッドSMTを実装して
Celeronを1C/2T AVX2
pentiumGを 1C/4T TurboBoost AVX2にすればいい
212:,,・´∀`・,,)っ-○○○
17/07/20 19:29:55.97.net
>>204
せれろんがシングルチャネルにされてしまいますよ
213:Socket774
17/07/20 19:36:23.04.net
メモリチャネル数を減らしたら
Celeronグレードですらグラフィックス性能低下だし
ローエンドマザーボードに
シングルチャネルのクソ仕様が出回る弊害がでるだろ
AVX2/AVX512と採用と引き換えにコア数を減らしてCPUだけで帯域を切れないようにするのが望ましい
214:Socket774
17/07/20 19:48:39.36.net
歩留まりの関係上仕方がないのかもしれないが、インテルはラインナップが多すぎ。
215:,,・´∀`・,,)っ-○○○
17/07/20 19:51:03.44.net
むしろPentium, Celeronはノートに限ればAPL/GMLで十分なのでは
216:Socket774
17/07/20 20:00:45.36.net
性能が飽和気味だから機能制限で差をつけるしか無いんだろうな
217:,,・´∀`・,,)っ-○○○
17/07/20 20:20:07.45.net
ディスパッチルーチン書いて分岐すりゃいいんだからやる気のある奴はやってるよ
そもそもIntelコンパイラ使えばコンパイラ引数指定で勝手に生成されるしなあ
やらない言い訳やる奴はその原因がなくなれば別の言い訳を考えてやらないだけ
CUDAなんて非対応環境でCUDART.DLL読ませないために動的ロードのルーチン自前で作らないと駆使しないといけないしな
218:,,・´∀`・,,)っ-○○○
17/07/20 20:26:25.73.net
>>210
EPYCの2P版のソケット税廃止したら見直してやるよ
機能差で暴利を貪りやがって
219:Socket774
17/07/20 20:29:28.42.net
やっとEPYCには性能で勝てないと分かったか
220:,,・´∀`・,,)っ-○○○
17/07/20 20:31:54.60.net
Xeon 4ソケットのほうが安いし速いって言ってるんだが
221:Socket774
17/07/20 20:37:05.14.net
わかりやすい
毎回NGID登録して共有化
222:Socket774
17/07/20 21:00:07.90.net
1C/2T AVX2 5GHz のセレロンが出たら「シングルがー」が大喜びしそうだな
223:Socket774
17/07/20 21:12:52.54.net
>>214
馬鹿かおまえ
224:Socket774
17/07/20 21:52:05.86.net
>>214
いやいや4ソケットの方が高いよ。
225:,,・´∀`・,,)っ-○○○
17/07/20 22:24:31.65.net
>>218
Dell Inc. PowerEdge R940 (Intel Xeon Gold 5120, 2.20 GHz)
SPECint®_rate2006 =2610
SPECint_rate_base2006 = 2460
URLリンク(www.spec.org)
SPECfp®_rate2006 = 2100
SPECfp_rate_base2006 = 2050
URLリンク(www.spec.org)
EPYC7601はそれぞれ2360と1840
URLリンク(www.amd.com)
Xeon GoldはE5時代のように2Pと4Pの価格差はないんだよね
5120を4個でも6000ドルちょい、EPYC7601は2個で8000ドル超え
226:,,・´∀`・,,)っ-○○○
17/07/20 22:31:04.70.net
最大2ソケットしかくめないくせに、8ソケットのミッションクリティカル用途のPlatinumと比べて安いとか、AMDは真性のアホですかと
227:Socket774
17/07/20 23:01:18.64.net
思うんだけど14nm+使ってても20nmのZen2個相手に4個も無きゃ
228:勝てないのか? 惨め過ぎるぞそれw 来年Zen2来たらどうする気よ?
229:Socket774
17/07/20 23:09:06.49.net
>>221
つRename & Discount
230:,,・´∀`・,,)っ-○○○
17/07/20 23:19:29.44.net
>>221
情けないのは4ダイMCMしてまでXeonと争いたいハリボテCPUだろ
ネイティヴじゃなきゃだめなんですよ
231:,,・´∀`・,,)っ-○○○
17/07/20 23:22:02.38.net
56コア vs 64コアなんだよな
大手クラウド全滅の理由わかるだろ
232:Socket774
17/07/20 23:29:31.74.net
4000ピン2ソケットのMBは3600ピン2ソケットのMBより価格が遥かに高いらしいから
3600ピン4ソケットのMBなんてとんでもなく高いだろうなw
233:,,・´∀`・,,)っ-○○○
17/07/20 23:34:18.41.net
EPYCはメモリ8chぶんとPCIe128レーンぶん引き出してるから多層基板要求されてマザーがクソ高いだけだろ
ソケット数が増えるだけなら基板の層を増やす必要はない
234:Socket774
17/07/20 23:35:55.04.net
コア数じゃなくてシステム全体の消費電力が知りたいんですけど?
EPYC2個でシステム全体の消費電力は331Wでしょ?
XeonのSkylakeはTDPの1.5倍以上の消費電力じゃん
235:Socket774
17/07/20 23:36:50.68.net
俺的将来予測
1.Ryzen.EPYCの猛攻に敗れハイエンド、サーバーシェアを奪われます
2.ローエンドの利益を当てにするもpentium君のせいでi3が全く売れません
3.WindowsがARMに対応し、業務用の大量受注が終わります
結論
インテル終わってる
236:Socket774
17/07/20 23:37:07.67.net
せっかく4CPUも載せてるのにメモリchもPCIeレーンも増えないのか
糞だなw
237:,,・´∀`・,,)っ-○○○
17/07/20 23:40:16.50.net
>>229
AMDのことじゃん
当然メモリは24chになるしソケット数ぶんのPCIeレーンは使えるよ
238:,,・´∀`・,,)っ-○○○
17/07/20 23:46:43.16.net
AWSに不採用食らったEPYCプギャー
239:Socket774
17/07/20 23:48:06.37.net
EPYCのMBはメモリchやPCIeが増えてコストも増えるけど
XeonのMBはメモリchやPCIeが増えてもコストは増えないのか
すげー思い込みだなw
4ソケットにすれば部品点数だって増えるし、2ソケットの2倍の面積
で済ますわけにはいかないから高密度化されるのが普通なのになw
まぁ全部団子の思い込みで根拠は無いけどな
240:,,・´∀`・,,)っ-○○○
17/07/20 23:55:05.67.net
Dellからサーバの予価書かれたパンフもらってねーの?
これでEPYC買う奴アホだよ
241:,,・´∀`・,,)っ-○○○
17/07/20 23:57:02.27.net
スパコン全滅のうえAWSにもGCPにも不採用、それがEPYCの悲惨な現実
242:Socket774
17/07/20 23:58:36.13.net
しかし見てると本当に可哀想に見えてくるコテだよな
人を馬鹿にしたり悪いと思う所を書くより良いことを書こうぜ
243:,,・´∀`・,,)っ-○○○
17/07/20 23:58:46.86.net
ついでにIIJやさくらなどの国内DC大手もEPYC導入予定なし
244:Socket774
17/07/20 23:59:23.68.net
スパコン用途じゃねぇしw
しつこいよお前はw
1番需要ある1ソケットと2ソケットの製品相手に
245:Socket774
17/07/21 00:00:41.89.net
以前はどこにも採用されないって言ってたけど最近はトーンダウンしてるねw
246:Socket774
17/07/21 00:26:45.85.net
サーバーやスパコンで重要なのは、コア数、メモリ量、PCIe数、ワッパだろ
たくさんのコア使って大量のデータを処理するのが本業で、
それを如何に少ないソケットと電力で実現するかが課題みたいなもんだ
EPYCなら全部CPU直結だから、量も性能もXeonを圧倒できる
CPUが爆熱でチップセット経由でも少ないXeonとかお話にならない
247:Socket774
17/07/21 00:31:05.33.net
ぼくのかんがえた最強のCPUが実物化してて意味わからんな何か
248:Socket774
17/07/21 00:39:09.74.net
ごちゃごちゃうるせーからパンフ持ってこなかっただったら笑う
249:Socket774
17/07/21 00:41:03.27.net
Xeonはダイあたりのメモリ帯域に対�
250:オてUPIの帯域が狭いのがネック チップの性能向上に対して足回りの強化が追いついてない
251:Socket774
17/07/21 01:50:50.25.net
Intelが4P実質値下げしたのはEPYC対策もあるでしょ?
Zenの出来がブルドーザみたいながっかり性能なら、4P値下げとかやってこなかった
252:Socket774
17/07/21 02:17:16.98.net
たりめーじゃん
本当はもっと高く売りつけたかった
253:Socket774
17/07/21 02:39:21.93.net
EPYCはあくまで古いXEON機の安い代替安であって大規模サーバー市場はターゲットじゃないのは始めからAMDも言ってるのに
254:Socket774
17/07/21 04:43:42.64.net
結局団子はインテル信者じゃなくアップル狂信者でしかないのを考慮しろ
アポくそが代用する以上xeonとVegaは神器なんだ
255:Socket774
17/07/21 05:56:11.45.net
人工知能(AI)が文明にとって脅威となり、手遅れになる前に、AIを開発する企業を規制してほしいーー
TeslaおよびSpaceXの最高経営責任者(CEO)であるElon Musk氏が米知事らにそう訴えた。
Musk氏がAIを警戒していることは、よく知られている。
実際に、より安全なAIの開発を目指す非営利団体OpenAIも創設している。
全米知事協会の会合で講演を行った同氏は、知事らに対して、AIは「人類の文明存続に対する重大なリスク」であり、事前の規制監督が必要だと述べた。
Musk氏は知事らに対して、
「私は最先端のAIに触れられる立場にある。人々はAIを本当に懸念すべきだと思う。
私は警鐘を鳴らし続けているが、ロボットが通りを歩いて人間を殺戮するのを実際に目にするまで、
人々はどのように反応すればいいのか分からない。こうした脅威は現実感が非常に希薄であるように思えるからだ」と述べた。
「AIは、事後ではなく事前に対策を講じる必要があると私が考える、極めてまれなケースである。
事後に規制しても手遅れだと考えているからだ」(同氏)
URLリンク(japan.cnet.com)
256:Socket774
17/07/21 06:28:27.80.net
人間が通を歩いてて人間を殺戮するシーンが頻繁に見られる人間社会において
AIなんて別に脅威でもなんでもないでしょ
もっと人間の現実を見ろよ、イーロン・マスク。
257:Socket774
17/07/21 06:31:30.51.net
AVXとかバス幅とか団子の理想ってEPYCじゃね?
258:Socket774
17/07/21 06:37:44.97.net
IBM、新世代メインフレーム「IBM z14」を発表 データ保護機能を大幅強化
URLリンク(www.atmarkit.co.jp)
>IBM z14では、APIを用いてデータやアプリケーションへアクセスする際の暗号化処理を、x86ベースの代替技術と比べて3倍近い速さで実行できるようになる。
259:Socket774
17/07/21 06:51:13.56.net
そのうち「AMDが全ラインナップでAVX搭載済みなのはインテルに対してアドバンテージ」って言われるようになるぜ
260:Socket774
17/07/21 07:06:27.39.net
>>250
そこよりも、こっちでしょ
>IBM z14では、暗号化アルゴリズム専用の回路を4倍に増やし、暗号化処理性能を前モデルのIBM z13比で最大7倍に増強。その結果、クラウド規模のバルク暗号化も可能となった。
要するにトランジスタ数を増やして高速化しただけ。
そりゃ速くなるわな。
261:,,・´∀`・,,)っ-○○○
17/07/21 07:20:15.27.net
>>251
むしろ全ラインナップAVX要らないじゃん
性能にメ�
262:潟bトがある機種だけAVX搭載でいい
263:Socket774
17/07/21 07:55:01.97.net
>>253
Intelは搭載してるけど無効化してるだけでしょ?
i9-7900Xなかなか良いじゃん消費電力
URLリンク(img1.mydrivers.com)
264:Socket774
17/07/21 07:56:12.03.net
i9-7900X
ワットチェッカー
URLリンク(img1.mydrivers.com)
265:Socket774
17/07/21 07:58:05.47.net
>>253
だから?なんなん?
266:,,・´∀`・,,)っ-○○○
17/07/21 08:44:19.87.net
>>243
BroadwellでもDPサーバのメインストリームは14~16コア前後で、22コアで割高な2699v4を選んでるクラウド業者はほとんどいないんだわ
EPYCの32コアは1P版が2ソケットのXeonのミッドレンジ対抗なのと同様に本来4ソケットと競合するための製品と考えたほうがいいのでは?
そして4Pにソケット税のあったBroadwell対抗ならまだしもSkylakeより後発になってしまった以上、価格見直しも含めて売り方考えないとね
4Pより割高な2Pにクラウド業界は価値を見出さない
267:Socket774
17/07/21 08:58:40.76.net
ソコソコの規模の企業でServerの導入を担当しているけど、4Pの方が割安だとしても、2PのEPYCの安いグレードで構築した2Uの方が安いのでは?電気代もEPYC の方が安いみたいだし。
あんまり高密度になると故障した時が嫌だなあ。
正直末端の企業にはEPYCの情報なんて全くなかったからなあ。skylakeは出る出る言われていたけどね。
268:Socket774
17/07/21 09:34:42.92.net
>>257
お前の価値観なんざ誰も興味ない
269:Socket774
17/07/21 09:39:35.86.net
>>253
性能にメリットがある機種とは何でしょうか?
性能はあって困るものじゃなし、↓のようにAVX128のままでも得られる効用もあるみたいだし
スレリンク(jisaku板:103番)
Intelの方針の無条件肯定は見苦しい
270:,,・´∀`・,,)っ-○○○
17/07/21 09:50:01.61.net
PS4ではそもそもレガシーないのでSSEを使うという前提がそもそもないでしょ
AVXを使わないと言ったら無条件でスカラ運用を意味する
64ビットモード前提なので32ビットのアセンブリコード流用なんて論外だし
271:,,・´∀`・,,)っ-○○○
17/07/21 10:02:14.67.net
あとBulldozer時代はサーバではFPは利用頻度が低いので共有でも構わないと言ったのにFP性能(128ビットSIMD以下限定)を推してくるダブスタ具合とか
使う分野はあるけど利用者がAVX-512避ける理由はないよね、とか
SPECint_rateでも403.gccなどはコアあたりXeonのが1.4xくらい引き離してるでしょ、とか
SPECintシングル公開してない時点で少数コアブースト効き悪いのお察しですな、とか
272:Socket774
17/07/21 10:29:59.80.net
FP64 HPCは多Byte SIMDを欲する分野の一つだが
MP Xeon のシェアは非常に小さい。ほとんどDP Xeon。
top500に乗ってるx86 の平均単価
> 2007/11 およそ$840 (約57万ソケットの平均)
> 2011/11 およそ$1100 (約80万ソケットの平均)
> 2015/11 およそ$1350 (約153万ソケットの平均)
スレリンク(jisaku板:776番)
273:,,・´∀`・,,)っ-○○○
17/07/21 10:33:47.59.net
2Pと4Pの価格統合したOpteronは4Pの採用の方が多くね?というかTitan
274:なんだけど
275:Socket774
17/07/21 10:48:15.31.net
> BroadwellでもDPサーバのメインストリームは14~16コア前後で、22コアで割高な2699v4を選んでるクラウド業者はほとんどいないんだわ
> EPYCの32コアは1P版が2ソケットのXeonのミッドレンジ対抗なのと同様に本来4ソケットと競合するための製品と考えたほうがいいのでは?
> そして4Pにソケット税のあったBroadwell対抗ならまだしもSkylakeより後発になってしまった以上、価格見直しも含めて売り方考えないとね
> 4Pより割高な2Pにクラウド業界は価値を見出さない
4ソケットで最大64コアとかいうゴミみたいなシステムが自慢とか
そりゃ2ソケットで64コアには勝てんわ
Broadwell-EXは最大24コア/48スレッド動作!Xeon E7-8800/4800 v4が登場
URLリンク(ascii.jp)
4ソケット向けはE7-4800シリーズだな
16コア $3000、14コア $2000とかコスパ悪すぎ
EPYC 32コア $4200の足元以下
276:Socket774
17/07/21 10:50:05.10.net
逆に考えるんだ
EPYCの導入を検討している事業者は良いアンテナ持ってるって事よ
277:Socket774
17/07/21 10:54:02.30.net
うちなんてEPYCのために見積もりやり直しw
上層はコスト&性能のためだってさw
めんどくさい
278:,,・´∀`・,,)っ-○○○
17/07/21 10:54:07.31.net
>>265
そのソケット税撤廃したからEPYCの存在価値揺らいでるという話なんだが
Gold5000番台は14コアで1500ドルちょい、6000番台の16コアでも2000ドルを割る
279:Socket774
17/07/21 10:57:59.70.net
>>267
有能な上司で良いじゃん
倒産して露頭に迷うよりマシだろ?
280:Socket774
17/07/21 10:59:27.60.net
何をはしゃいでるのか知らんけどAMDのおかげでxeonの値段が下がってるなら
良いことじゃんね
今まで競争すらなかったんだから
281:Socket774
17/07/21 11:00:00.98.net
そもそもZen2が最強だしな
282:Socket774
17/07/21 11:00:34.81.net
> PS4ではそもそもレガシーないのでSSEを使うという前提がそもそもないでしょ
> AVXを使わないと言ったら無条件でスカラ運用を意味する
> 64ビットモード前提なので32ビットのアセンブリコード流用なんて論外だし
SSE2対応はAMD64の必須要件なんですが
AMD64使うのにSSE2以降使わないとか頭悪いんですか?
283:,,・´∀`・,,)っ-○○○
17/07/21 11:03:32.19.net
全部165Wとか200Wとか思いたいんだろうがGold 5120は105Wだ
180W×2と比べれば60Wほど電力は不利になるが、1年間フル稼働して14000円差が出る程度だぞ
5120x4より2000ドル高いEPYC7601の価格を正当化するには10年以上は稼働しないといけない
284:,,・´∀`・,,)っ-○○○
17/07/21 11:06:59.35.net
>>272
用意されてるからって必ず使わなければいけないものではないのわからないの?
かつSSEをサポートせずAVXのみをサポートする実装も作れる
KNCはどっちもサポートせず512ビットSIMDのみ
285:,,・´∀`・,,)っ-○○○
17/07/21 11:11:50.96.net
AVXが効く処理ではむしろEPYCより速く処理を終わらせてアイドルに移行できるから安く済むかもね
GoogleやAWSがEPYCに見向きもしないのはそういう打算もあるだろう
286:Socket774
17/07/21 11:13:13.93.net
>>273
分かった分かった
i9-7900XはTDP140Wだ>>254-255
を見る限り消費電力は532W行っとるがなw
287:,,・´∀`・,,)っ-○○○
17/07/21 11:17:20.85.net
ワークロードが違うのでなんの参考にもならないな
288:Socket774
17/07/21 11:18:10.63.net
流石にi9は性急すぎるなこれ
んで12コアになると3GHz割るという話だしな
289:,,・´∀`・,,)っ-○○○
17/07/21 11:20:34.37.net
5120は2.2GHzでTurboも抑えめだよ
290:Socket774
17/07/21 11:27:27.82.net
> そのソケット税撤廃したからEPYCの存在価値揺らいでるという話なんだが
> Gold5000番台は14コアで1500ドルちょい、6000番台の16コアでも2000ドルを割る
上位CPU 2Pより下位CPU 4Pの方が使いやすくて安いとか、PlatinumやGold死亡宣言ですか?
言ってることはG4650でi3死亡と一緒
291:,,・´∀`・,,)っ-○○○
17/07/21 11:31:08.76.net
Platinumは8ソケットのRASシステム組めるからこそあの価格が許される
292:Socket774
17/07/21 11:39:56.16.net
> 全部165Wとか200Wとか思いたいんだろうがGold 5120は105Wだ
> 180W×2と比べれば60Wほど電力は不利になるが、1年間フル稼働して14000円差が出る程度だぞ
MaxだとAMD 180Wx2(327W) < Intel 145Wx2(425W) で100W差なんだ…
URLリンク(i.imgur.com)
105Wだと同じくらいになりそう
> 用意されてるからって必ず使わなければいけないものではないのわからないの?
ゲーム機は低性能な分、ハードの機能使い切るのが普通なんだが
> KNCはどっちもサポートせず512ビットSIMDのみ
そりゃサポートされない機能は使えないわ
293:,,・´∀`・,,)っ-○○○
17/07/21 11:46:09.29.net
>>282
ハードの機能使い切るならな�
294:ィさらSSEじゃなくて上位互換のAVX使うだろ
295:,,・´∀`・,,)っ-○○○
17/07/21 11:48:18.11.net
POV-Rayなんて商用利用禁止で効率も悪いものを商用サーバで使うのは非現実的だし
むしろMySQLのほうがリアルワークロードだろう
296:Socket774
17/07/21 11:49:12.49.net
> Platinumは8ソケットのRASシステム組めるからこそあの価格が許される
Platinumは8ソケット用w
EPYCのサーバー戦略のハードルだだ下がりですわ
同じソケット数じゃ勝負にならないって、敗北宣言にしか見えない
297:,,・´∀`・,,)っ-○○○
17/07/21 11:53:14.15.net
8Pサーバを2Pに詰め込んだ時点で敗北だろう
298:Socket774
17/07/21 11:53:36.47.net
> ハードの機能使い切るならなおさらSSEじゃなくて上位互換のAVX使うだろ
開発環境がAVXに最適化されてるならな
未整備な最初の頃はSSEで作ってただろうな、整備されてきた最近はAVXばかり使ってそうだけど
299:,,・´∀`・,,)っ-○○○
17/07/21 11:56:10.62.net
PS4のコンパイラはLLVMベースでデフォルトでAVX有効でコンパイルされますが
300:,,・´∀`・,,)っ-○○○
17/07/21 12:00:34.18.net
逆にSSEなんてアセンブラ直叩きでしか使えん
301:Socket774
17/07/21 12:28:47.41.net
> PS4のコンパイラはLLVMベースでデフォルトでAVX有効でコンパイルされますが
コンパイル前のソースコードはどうするんだろうな
対応ミドルウェアやノウハウが豊富なSSEと、出たばかりのAVXじゃどっち使うか明白だろう
AVXの登場は2011年、PS4の発売は2013年、たった2年差じゃ成熟も対応も無理
302:,,・´∀`・,,)っ-○○○
17/07/21 12:32:43.90.net
スパコンで相手にされないEPYCのお話
URLリンク(www.top500.org)
303:,,・´∀`・,,)っ-○○○
17/07/21 12:33:45.04.net
>>290
だから128ビットSSE組み込み関数で書いてたコードはすべてVEXエンコードになる
そんなことも知らないシッタカみっともね
304:Socket774
17/07/21 12:47:57.05.net
>>292
黙れ殺されろ早く死ね糞カス
305:Socket774
17/07/21 13:03:48.66.net
なぜにゲーム機の話題に・・
306:Socket774
17/07/21 13:16:10.84.net
AMDは異常に秘密にしてたからじゃね
307:Socket774
17/07/21 14:22:43.74.net
EPYCの演算性能はVega込みでやるべきだろ
そっちに任せるからAVX性能を削ってるんだから
308:Socket774
17/07/21 16:51:18.73 Aj/Ehohb.net
HPCではシンプルコア+SIMD512をめいっぱい積む、に日米ともなってる事を考えると、
Jaguar路線終了させたAMDにはGPGPUしか道はないだろうね。
309:Socket774
17/07/21 16:53:12.23 IurwsgLJ.net
>>296
別にGPUは好きなの使えばいいわけで、nVidiaのGPU使ってCUDAでもええんやで。
PCI-Eの太さは魅力だろ
310:Socket774
17/07/21 16:56:30.73 3oj3RSyM.net
Phiがいっぱい刺せる安いプラットフォームでもあるぞ
どっちに転んでも美味しい
311:Socket774
17/07/21 17:11:17.76 wQyd8Rmf.net
>>297
> HPCではシンプルコア+SIMD512をめいっぱい積む、に日米ともなってる事を考えると、
一般的に普及させるには、その構成での供給量が少なすぎると思う
ARMサーバーの提供元やシステムの特殊性を考えると、シェア的にx86サーバーが独占状態なのは当分変わらないと思う
AMDやIntelは、サーバー向けのプラットフォームがたくさんあるし、HEDT系を多少手を加えて流用とかも出来る、それがx86の最大のメリットだと思う
312:Socket774
17/07/21 17:16:01.86 wQyd8Rmf.net
>>298
P100は製造量が少なくてEPYCに搭載できる気がしないし、K40とか化石すぎて使えない
倍精度ならFirepro S9170、それ以外ならVega搭載するのが高性能だし楽
313:Socket774
17/07/21 17:28:26.61 kME6ZtCE.net
>>301
P100登場前からS9170押してるけど
化石のK40にすら勝てずにまったく売れてないんだから諦め�
314:�よ。
315:Socket774
17/07/21 17:30:33.73 Aj/Ehohb.net
>>300
もちろん一般向けじゃないでしょ。HPC市場オンリー向けの話。
316:Socket774
17/07/21 17:36:21.49 wQyd8Rmf.net
>>302
CUDAの囲い込みが強力すぎるからな
EPYCプラットフォームにCUDAの囲い込みとか関係ないし、性能は圧倒してるから使われるだろ
317:Socket774
17/07/21 18:01:28.61 wQyd8Rmf.net
K40 1.6TFlops GDDR5 24GB
S9170 2.5TFlops GDDR 32GB
囲い込みがなけりゃ普通に使うでしょ
318:Socket774
17/07/21 18:39:16.14 kpQetUQX.net
実用的じゃ無かっただけだろ
319:Socket774
17/07/21 18:56:54.01 bXziR1C7.net
EPYCにはCUDAの囲い込みを無効化する謎の機能が積んであるらしいな。
320:Socket774
17/07/21 19:04:24.29 HgxbDnV0.net
控えめな実装ながら完成度が高いEPYCのFLOATING POINTユニット、EPYCの実力はHPCでも発揮されるか
URLリンク(www.weblog-tech.nagoya)
321:Socket774
17/07/21 19:17:33.07 wQyd8Rmf.net
何で低性能なTeslaと無能なCUDAを使わないといけないかな
最適化が仕事のサーバーのプロ連中ならGCNやHBCCの対応は問題ないでしょ
サーバーレベルなら、メモリ量もメモリ空間も大きければ大きいほどいいのはCPUと一緒
CUDAの弱点は正にそこで、狭いメモリで四苦八苦しなけりゃならん、面倒が多い
その面倒さがOpenCLより楽というだけ
GCNやVegaならそんな問題ほぼ無くなる、まあローカルで32GBや、HBCCで500TBとかだからね
322:Socket774
17/07/21 19:23:40.36 bXziR1C7.net
>>309
それだとホストがXeonでも関係ないしEPYCを待つまでもなくS9170はとっくに売れているはずですよね?
323:Socket774
17/07/21 19:44:55.23 hLQIKO+W.net
cudaはpascalからubifiedメモリがかなり使えようになったので、だいぶコードの実装は楽になったよ。
324:,,・´∀`・,,)っ-○○○
17/07/21 19:50:59.73 fmd2QO6P.net
ソケット版Knights Landingの一番安い64コアのが1700ドル程度だしS9170は演算用としては今更感
325:Socket774
17/07/21 20:12:36.85 803FF18t.net
EPYC+VEGAが凄い事になったりしてw
隠しコマンド満載で
326:Socket774
17/07/21 20:16:24.21 O2+SeVyL.net
自爆コマンドか
327:Socket774
17/07/21 20:22:33.66 wQyd8Rmf.net
>>310
CUDAで囲い込まれて、そういうことにも気づかない馬鹿ばかりになったからでしょ
CPUとの面倒なメモリ間のやり取りや、少ないローカルメモリだけでどうやってやりくりするかがGPGPUには当たり前とか思い込まされてる
IntelのPhiはそこの解消を利点にしてる
演算だけならPhiは理想にかなり近い
ただ、グラフィック処理ができないから一般向けには使えないけど
328:Socket774
17/07/21 20:25:49.10 wQyd8Rmf.net
>>311
あくまでソフト的なシェアードだから内部じゃ面倒な処理をしていて、コードは楽になっても実際の処理時間は変わらないよ
それを根本的に解決するためにNVLinkを作ってる
まあ、IntelもAMDも無視してるけど
329:Socket774
17/07/21 20:31:39.80 bXziR1C7.net
>>315
CPUをXeonからEPYCにするだけで何故か馬鹿の目が覚めると?
330:Socket774
17/07/21 20:41:52.88 wQyd8Rmf.net
> ソケット版Knights Landingの一番安い64コアのが1700ドル程度だしS9170は演算用としては今更感
ソケットにはメモリ8ch 1TB、PCIe 128レーン対応のEPYC刺すだろ、それにVegaやS9170を4枚位刺すだけの簡単な仕事
あくまで倍精度対応のVega20 HBM2 32GBが来るまでの繋ぎとしてだけど
331:Socket774
17/07/21 20:47:10.19 wQyd8Rmf.net
>>317
EPYCとFireProやVegaの組合せでね
ハードウェアは揃ってるし、環境もOpenCL2.x使えば基本的な対応はできる
あとは時間とコストの問題だな
332:Socket774
17/07/21 20:56:41.82 wQyd8Rmf.net
CPUだけ、GPUだけの性能向上がもう限界近いのは、まあ大体薄々気付いてるでしょ
CPUはシングル性能と熱/電力、GPUはメモリ帯域と容量
その辺の壁を超える方法が他にあるなら逆に教えてほしいところ
もちろんx86とWindows/Linuxで対応できる範囲かつ、ツクモとかで買えるくらい一般的になる方法で
333:Socket774
17/07/21 20:59:26.83 X8MYxcis.net
CPUもGPUもGlobalFoundriesの7LPで限界突破する
なんせ今3GHzをターゲットにした製造プロセスを7LPは一気に5GHzをターゲットしてんだからな
334:Socket774
17/07/21 21:03:51.14 RhYyxNkc.net
いきなり5GHzってちょっとキナ臭いよなw
まぁGPUの方はコンスタントに向上するだろう
ただ、CPUもGPUみたいにコア数増やしてクロック下げるぐらいしか無さそうなんだよな
正直このままだといつかはARMに追い越されると思う
335:Socket774
17/07/21 21:05:53.59 dlinmgdc.net
5GHzはIBMが作るCPU向けの数字だろう
今でも5GHzは余裕で超えてるからな
Zenはそこまでクロックを伸ばす設計になってない
336:Socket774
17/07/21 21:25:06.85 wQyd8Rmf.net
今よりはクロック上がるということでしょ
OC限界が5GHz位になるんじゃないかな
337:Socket774
17/07/21 21:25:57.86 X8MYxcis.net
見てみろ
URLリンク(www.globalfoundries.com)
338:Socket774
17/07/21 21:29:35.68 803FF18t.net
ペン4は10Gなんてホラってたなぁ(遠い目
339:Socket774
17/07/21 21:37:55.89 tmkYrc1S.net
消費電力を抑えられるならクロック上げるのが確実だからな
Netburstはある意味速すぎたw
その後IBMやSCE、AMDもNetburstの後を追ったわけで
Zenの革新性の無さ、CoreやAVX、AppleとARMの行き詰まりを見るに結局消費電力抑えてクロック上げるかアクセラレータてんこ盛りヘテロしか道がない
340:Socket774
17/07/21 22:27:27.32 dRe9CMpW.net
ならItanium買い支えてやれよ
あっちのが革新的だろ
さあ、買え
341:,,・´∀`・,,)っ-○○○
17/07/21 22:52:13.81 r3KCSozw.net
>>318
EPYC(笑)は倍精度最大560GFLOPSとPhiの3割未満の性能なのでお呼びではない
342:Socket774
17/07/21 22:58:25.01 vGwf95yi.net
また訳のわからんことを言い始める
343:Socket774
17/07/21 23:14:57.92 wQyd8Rmf.net
とうとうCPUとアクセラレーターで比べるようになった
怖がりすぎだろ
Xeon Phi 7290 6ch 最大384GB MCDRAM 16GB PCIe 36レーン、Vt-d、Vt-x非対応
セキュリティーと信頼性はAES以外非対応(SGX、MPX)
URLリンク(ark.intel.com)
メモリ少なすぎる、PCIe 少なすぎる、セキュリティ弱すぎ、仮想化非対応
これXeonの代わりに使うとか冗談でしょ?
344:Socket774
17/07/21 23:34:34.33 e2md/MqE.net
EPYCとPhiかなり相性良いはずだから団子がAMD嫌いすぎて逆神くる気がする
345:,,・´∀`・,,)っ-○○○
17/07/21 23:50:30.69 kqgozqPW.net
TXTやSGX対応してないのがダメだと言ったらものすごいブーメラン食らう企業があってだな…
Phiは100GB/sのDDR4と480GB/sをシームレスにデータ交換できるのが売りなんだけどな
ちなみにこの構成だとPCIeレーン数32本も出せないぞ
URLリンク(www.tweaktown.com)
346:-spotted-features-32-cores/index.html
347:,,・´∀`・,,)っ-○○○
17/07/21 23:51:56.42 kqgozqPW.net
>>332
LGA3647に刺さらないEPYCとPhiの相性ってなに?
IntelからOmni-Pathライセンスしてもらったの?
348:Socket774
17/07/22 00:12:59.22 FPjMMyKZ.net
Xeon Phiは基本ソケットタイプ
PCIeに刺すコプロタイプの一番いいやつ
URLリンク(ark.intel.com)
7120A 61C/244T 1.2TFlops GDDR5 16GB
S9170の半分以下の性能、正直ショボい
もうすぐ出るのがコレ
URLリンク(www.intel.co.za)
7220A 68C/272T 3.5TFlops 1.4GHz MCDRAM 16GB 500GB./s
S9170よりは多少マシ、倍精度以外はVega10の半分くらい
349:Socket774
17/07/22 00:20:06.20 FPjMMyKZ.net
団子はソケットタイプとコプロタイプの2種類あるの知らないのかな?
どっちも本職には勝てない中途半端な代物なんだよね
CPU性能はXeonやEPYCにボロ負け、GPGPU性能はS9170よりマシな程度でP100やV100やVegaにはボロ負け
Intelの政治力である程度数を売れてシェア取れるけど、そこから先には行けない
スマフォ向けのAtomと一緒、売れてるように見えるだけ、スペックで負けてるから先がない
350:,,・´∀`・,,)っ-○○○
17/07/22 00:35:15.42 a4Nu/Pop.net
>>336
で?「相性」ってなんだ?
PCIeカード版はDDR4メモリを載せられない劣化版で、HPC界隈でもほぼ存在無視されてるレベルなんですけど?
351:,,・´∀`・,,)っ-○○○
17/07/22 00:36:24.34 a4Nu/Pop.net
GPGPU性能(笑)ってGPUじゃないものには当てはまらないよ。強いて言えばGPU以外は0だ
352:Socket774
17/07/22 00:52:00.27 RiKuRaha.net
CUDAはプログラムが組みにくい部分があるが、それでも通常のCPU実行に比べて
100倍1000倍とか場合によってはそれ以上の高速化ののメリットがあるから、
つかわれてるんだよ
また10年以上のソフトウェア資産がある
フリーや商用含めいろんなプログラムがあるし、
サンプルコードも多いので車輪の再発名をしなくていい
353:Socket774
17/07/22 01:00:41.32 FPjMMyKZ.net
> で?「相性」ってなんだ?
相性って何の話?
> GPGPU性能(笑)ってGPUじゃないものには当てはまらないよ。強いて言えばGPU以外は0だ
揚げ足取りとか、そんなツマラン返ししか出来ないのか
354:,,・´∀`・,,)っ-○○○
17/07/22 01:01:20.36 a4Nu/Pop.net
逆にRadeonのGPGPU開発環境に10年の歴史がない理由を考えてみよう
355:Socket774
17/07/22 01:06:36.48 c5hFHACK.net
Apple相手の商売してるからユーザーに負担押し付けてしないお前らが悪いんだという悪習に染まっている
356:,,・´∀`・,,)っ-○○○
17/07/22 01:08:12.20 a4Nu/Pop.net
>>340
>>332
まあ、Xeonと繋いで分散処理したいなら、メモリ容量に制限のあるPCIe版よりも、DDR4使えるソケット版でOmni-PathやInfinibandで繋いだ方がはるかにいいけどな
東大やNERSCのそれはXeonすら不要でやってるが
357:Socket774
17/07/22 01:17:30.05 kKgHtFFO.net
>>343
phiなんかDDR4があってもなくても変わらんぞ。
キャッシュモードで使うとレイテンシがでかいし、
quadrantモードで使うと16Gを超えたら遅くて意味ないしな。何よりタイルの割り当てをしっかりやらんとパフォーマンスが出ないからな。
だったらヘテロなPCIE経由で使う方がまだマシだよ。
358:Socket774
17/07/22 01:22:33.79 FPjMMyKZ.net
>>339
GPGPU自体がCPUとは別物だから難しいのは仕方ない
高速化はRadeonでも�
359:翌スようなもの 10年程度の資産じゃ大したことないな 何十年も資産があるx86だってARMの進出に怯えてる程度、歴史あるPowerなんかとっくにシェア数%しか無い http://news.mynavi.jp/series/pascal/004/ 明示的にPrefetchを行わせることもできるようになった。 何よりも、ページ単位ではCPUとGPUのメモリのコヒーレンスが維持できるようになり、両者のデータアクセスが容易になるというメリットが生まれる。 Nvidiaの次世代の肝がこのNVlinkなのは、まあ誰もが疑わないだろうね やろうとしてることはAPUやHSAやGCNと全く一緒、ただしPower9限定
360:Socket774
17/07/22 01:36:41.14 FPjMMyKZ.net
> まあ、Xeonと繋いで分散処理したいなら、メモリ容量に制限のあるPCIe版よりも、DDR4使えるソケット版でOmni-PathやInfinibandで繋いだ方がはるかにいいけどな
Vega「メモリ容量に制限?そんなのあるんだな、メインメモリもSSDも含めて512TBまで使える自分には関係ないな、
それに繋げるのなんかPCIeでCPU直結でいいだろ」
EPYC 2Pで4TB、Vega10x4でHBM2 64GB、NVMe SSD 最大24個、全部仮想メモリとして使える
361:,,・´∀`・,,)っ-○○○
17/07/22 05:30:30.63 a4Nu/Pop.net
HDDやSSDが何百倍遅いかも知らないなんて
362:Socket774
17/07/22 05:32:42.18 UxeNCzD8.net
>>347
詳しく
363:Socket774
17/07/22 05:52:40.98 IGv/57Js.net
おそいけど
結局HBM2コピーして処理するキャッシュ
364:Socket774
17/07/22 06:30:49.43 KoK+XTRR.net
>>347
HMCディスるのはやめろ
365:,,・´∀`・,,)っ-○○○
17/07/22 07:09:36.35 a4Nu/Pop.net
VEGA世代のGPUのメモリ帯域、結局KNLに勝ててるものないよね
366:,,・´∀`・,,)っ-○○○
17/07/22 07:23:07.96 NvgX1DN+.net
PCIe 3.0の帯域はx16で片方向でたったの16GB/sですけど
TBクラスのDIMM積むと必然的にメモコンのクロックも1866MHzになるし、InfinityFabricホストの帯域も1ダイ30GBちょっとしか出なくなる
GPU間メモリの同期なんてやり始めた日には…アイタタタタ
ファンボーイの頭の悪さはInfinity
EPYCは頭打ち
367:Socket774
17/07/22 07:24:20.37 gL/j5gKo.net
でもKNLじゃDirectX対応してないから絵に描いた餅ですよね?
368:,,・´∀`・,,)っ-○○○
17/07/22 07:25:31.85 NvgX1DN+.net
DirectXでスパコンのプログラム書くの?
なつやすみのしゅくだいはにちゃんねるのもうそうですか?
369:Socket774
17/07/22 07:26:10.74 X3/CEOS5.net
この人は嫌いな物ディスることしか出来ないんですかね…
そんなんで生きてて楽しい?
370:Socket774
17/07/22 07:26:47.21 pJPuyj8E.net
>>352
USB3.1は何GB/秒なの?
371:Socket774
17/07/22 07:27:49.10 m+3JwrZS.net
>>354
でもお前自身スパコン持ってないんでしょ?
絵に描いた餅を語ってるのは同じだねw
372:,,・´∀`・,,)っ-○○○
17/07/22 07:34:46.30 NvgX1DN+.net
>>356
10ギガ[ビット]毎秒
373:,,・´∀`・,,)っ-○○○
17/07/22 07:35:36.10 NvgX1DN+.net
単発IDが捗るな
374:,,・´∀`・,,)っ-○○○
17/07/22 07:36:11.70 NvgX1DN+.net
>>350
コレ意味不明
375:Socket774
17/07/22 07:38:32.48 6z50kFPD.net
>>355
妄執が酷いパラノイアだから楽しいんやろ
376:Socket774
17/07/22 07:45:13.18 /JBujUXZ.net
ZenもVegaも14LPPと言う不利な条件で戦わされてるだけで
Zen2とNaviでは状況が変わって製造プロセスで初めて優位な戦い出来るわけで競争力が全く違うからな
377:Socket774
17/07/22 07:51:44.11 EOK035uz.net
AMDのHPCはHPC向けAPUというのをさっさと出してくれんとなんとも言えん。
日本勢はPEZYがMIPS+メニーコア、富士通がSPARC+ARMたくさんなので、
メインプロセッサ+多コアという意味で
378:はAPUも近いかもしれん。
379:Socket774
17/07/22 07:54:59.14 6z50kFPD.net
早くAPUはでてほしいね
自作的にも面白いと思うし
380:,,・´∀`・,,)っ-○○○
17/07/22 07:56:38.21 NvgX1DN+.net
自分でその状況選んでおけば世話ないだろ
一番の問題はソフト開発に行き詰まってすぐ投げ出すことだ
Brook+/CALも10年続けてれば立派なソフト資産の蓄積になっただろうに、すぐに投げ出すし、ソフトベンダーに開発支援もしない
381:,,・´∀`・,,)っ-○○○
17/07/22 08:01:11.33 NvgX1DN+.net
>>363
富士通がSPARCとARMの混載ってどこ発信のデムパだよ
ポスト京はARMのホモジニアスアーキテクチャだってとっくに確定してんぞ
URLリンク(journal.jp.fujitsu.com)
382:,,・´∀`・,,)っ-○○○
17/07/22 08:17:09.50 NvgX1DN+.net
>>362はPolarisが28nmのKepler/Maxwellにも劣ってたことを忘れているらしい
十分熟成してから出さないと不良品を出荷しまくって交換しまくる羽目になるぞ
383:Socket774
17/07/22 08:26:10.93 /JBujUXZ.net
>>367
お前のその妄想癖すげぇはw
384:,,・´∀`・,,)っ-○○○
17/07/22 08:43:05.03 NvgX1DN+.net
お仲間の妄想に違和感を感じないのは単発自演だからですか?
385:Socket774
17/07/22 09:05:32.36 X6aAtf9h.net
VEGAとPhiのメモリ帯域ってVEGA FEは480GB/sだけどPhiって実効で500GB/s超えないくらいでしょ。VEGAは今後32GBが見えてるから帯域倍増がある。
EPYCがPCIe版のPhiと相性がいいのは下位モデルでもレーン数が多いからとりあえずいっぱいさせるところでしょ。
386:Socket774
17/07/22 09:40:20.61 EOK035uz.net
小規模なシミュレーションならそれでいいだろうが、EPYCのインターコネクトってどうなってんの?
387:Socket774
17/07/22 09:48:20.78 FPjMMyKZ.net
SSDやHDDの仮想メモリ馬鹿にするとか、コンピューター自体を馬鹿にしてるのと一緒
あとキャッシュやTempフォルダとかもキャッシュの一種だから似たようなもの
388:Socket774
17/07/22 09:57:52.51 FPjMMyKZ.net
Xeon Phi(MCDRAM 16GB)
URLリンク(prohardver.hu)
Vega10(HBM2 16GB)
URLリンク(www.4gamer.net)
まあ、フル実装でこんなんじゃHMC(MCDRAM)がHBM2に勝てるわけないよな
389:Socket774
17/07/22 10:03:36.38 FPjMMyKZ.net
> VEGA世代のGPUのメモリ帯域、結局KNLに勝ててるものないよね
Vega20 4スタック 1TB/s 32GB
KNL 8スタック? 512GB/s 16GB
390:Socket774
17/07/22 10:38:16.66 h1wS6NNV.net
アクセラレータを一杯積みたいだけなら1PのEPYCで十分だな
ダイあたり32レーンで2Pと同じく128レーン出せるしね
391:Socket774
17/07/22 10:46:02.56 WICBR6OG.net
ダイあたりじゃなくて
ワンパッケージで128レーン
392:,,・´∀`・,,)っ-○○○
17/07/22 10:46:10.82 5BPAjhLK.net
レーンあたり1GB/s/片方向しか出ないんですがそれは
393:,,・´∀`・,,)っ-○○○
17/07/22 10:48:56.85 5BPAjhLK.net
>>374
そのVega20は7nm(ただしGF公称)だろう
394:Socket774
17/07/22 10:53:34.20 WICBR6OG.net
>>377
それで良いじゃん
団子はそれの何が不満なの?
GPUのメモリー帯域とPCIeのバス帯域は、かなりかけ離れてるけどPCIeのバス帯域足りないわけじゃ無いからPCIe3.0でつなごうが2.0でつなごうが速度差は無いんだけど?
あるならソース貼ってみ
>>378
お前はいつの話をしてるんだ?
さすがにそれは情弱過ぎるぞ
395:Socket774
17/07/22 10:55:11.90 h1wS6NNV.net
AMD憎しでEPYCをディスるがSkylake-Xの足回りが弱いのは棚に上げる団子さん
396:Socket774
17/07/22 11:04:21.22 BPJrhTvJ.net
>>378
しね、嘘つきの無知男
397:,,・´∀`・,,)っ-○○○
17/07/22 11:04:53.30 5BPAjhLK.net
HMCは2GBで160GB/sだが
398:Xeon Phiのそれは1モジュールあたり60GB/s程度しか出てないので少なくとも8Hiではないな
399:,,・´∀`・,,)っ-○○○
17/07/22 11:06:10.22 5BPAjhLK.net
>>379
ポエマーくんの言うような4GPUで64GBみたいな使い方するには帯域が圧倒的に足りないぞ
400:,,・´∀`・,,)っ-○○○
17/07/22 11:07:36.45 5BPAjhLK.net
>>381
シッカタくんもちゃんと調べてくれよ
URLリンク(www.tweaktown.com)
401:Socket774
17/07/22 11:09:45.44 GS1Nixho.net
真に賢い消費者は自分の要求に合わせて買うだけだ
デュアルコアで良ければインテルで良いし、クアッド以上必要なら実質的にRyzen一択だろ
402:Socket774
17/07/22 11:17:16.95 WICBR6OG.net
翻訳スレ読んだら、どうやらインテルは失敗したようだなw
403:Socket774
17/07/22 11:18:03.95 FPjMMyKZ.net
これだな
URLリンク(cdn.videocardz.com)
普通に考えて2018年に7nmのビッグダイなんか出せるわけ無いから、公式のフェイクだろうな
URLリンク(androgamer.net)
コレ見ると14nm世代はVega、7nm世代はNaviで名称分けてるから、多分こっちのほうが理にかなってて正しい
出すとしたら14nm+だろうし、来年予定ならそろそろサンプルくらい作ってそう
404:Socket774
17/07/22 11:25:33.17 FPjMMyKZ.net
> HMCは2GBで160GB/sだがXeon Phiのそれは1モジュールあたり60GB/s程度しか出てないので少なくとも8Hiではないな
唯一の搭載製品に積めてない以上8Hiは失敗したか、凄い遅れてるんだろう
32GBのHBM2を搭載したディープラーニング専用ASIC「Lake Crest」は2017年末に登場
URLリンク(pc.watch.impress.co.jp)
URLリンク(pc.watch.impress.co.jp)
MCDRAM 8Hi製品出るといいですね、応援してます
405:Socket774
17/07/22 11:26:19.22 h1wS6NNV.net
XeonSPでEPYCを上回るPCIeを確保しようと思ったら、団子の大好きな4P構成にしないといけないな
各CPU間はUPI一本で繋がないといけないからEPYCと状況は変わらん
(廉価なUPI2本モデルだとEPYCよりひどくなる)
各企業とも1PのEPYCに対する評価は高いね
406:,,・´∀`・,,)っ-○○○
17/07/22 11:29:47.26 5BPAjhLK.net
>>388
普通に富士通がFX100で使ってるが?
8HiがAMD独占供給とか言ってた妄想が自分の引用で否定されてんじゃん
407:Socket774
17/07/22 11:30:28.53 FPjMMyKZ.net
URLリンク(www.techpowerup.com)
francois-piednoelは、Katmai、Conroe、Penryn、Nehalem、Sandy Bridge、Ivy Bridge、Haswell、Broadwell、Skylake、Kaby LakeのSoCなどのCPUのアーキテクチャ開発に携わってきました。
Pentium 4からCoreへのIntelのAtomプロセッサー・ラインとIntelのマイクロアーキテクチャーの大幅な移行にも強く関わっていた
20年Intel在籍でCore2とSandyに関わってきた人が辞めるとのこと
Intel版ジムケラーみたいな人かな
408:Socket774
17/07/22 11:35:04.81 VCiWa3NO.net
おそらくTigar Lakeまではこの人の作品なのだろうな
409:Socket774
17/07/22 11:37:59.05 FPjMMyKZ.net
> 普通に富士通がFX100で使ってるが?
あっ、はい、すいません(FX100って何だ?)
> 8HiがAMD独占供給とか言ってた妄想が自分の引用で否定されてんじゃん
そりゃ一般規格品だからな、独占できるわけがない
今のところAMDしか製品化出来てないから、実質独占みたいだと言ってるだけ
Lake Crestは今年末出す予定ならサンプルくらい出せとは思うけど、そんな話欠片もないね
410:,,・´∀`・,,)っ-○○○
17/07/22 11:4
411:3:13.77 ID:5BPAjhLK.net
412:Socket774
17/07/22 11:50:20.45 h1wS6NNV.net
>>394
>EPYCはダイあたり16レーンを時分割ですが?
時分割ってなに?
もしかして物理的に32レーンがあることを知らないの?
>ソケットまたぎの別番号のダイに
EPYCについては1Pの話しかしてませんが
413:Socket774
17/07/22 11:52:54.21 v/O1RaoT.net
まあまあ
団子は2P買うのが決まってるんだから
情報知りたいのは当然だろ
414:,,・´∀`・,,)っ-○○○
17/07/22 11:55:39.32 5BPAjhLK.net
>>395
2ソケット時はPCIeとダイ間通信で半々ずつだが
パッケージ内のダイ同士の接続帯域はどこから湧いてくると思ってんだ?
時分割の意味わからない?
415:Socket774
17/07/22 11:56:39.98 RiKuRaha.net
AMDが自社専用の独自規格を作る→だれも使わない
AMD主導で標準規格を作る→その新規格でnvidiaが高い収益を上げる
毎度このパターン
nvidiaのためにわざわざ新規格を作って提供するAMDさん
416:,,・´∀`・,,)っ-○○○
17/07/22 11:58:36.55 5BPAjhLK.net
>>395
1Pのほうが厳しいなー
PCIeの公称128レーンとダイ間通信を各ダイ32レーンでやりくりしないといけないからな
417:Socket774
17/07/22 12:02:21.87 h1wS6NNV.net
>>397
>2ソケット時は
1Pの話をしてくれ
>パッケージ内のダイ同士の接続帯域はどこから湧いてくると思ってんだ?
SerDesとは別の専用パラレルインターフェースを使ってるけど
ちなみにダイ内部のIFの帯域はパッケージ内接続に使うIFの帯域より広いからね
418:Socket774
17/07/22 12:03:55.47 h1wS6NNV.net
>>399
うわ、こいつソケット間接続とパッケージ内接続で全く異なるインターフェースを使ってるの知らないのか
通りで話が通じないわけだ
419:Socket774
17/07/22 12:08:42.45 cuiBxDgH.net
FX100くらいは知っとけよ
海外でも使われてたはずだぞ
まあ次はHBMかHMCか知らんが
420:,,・´∀`・,,)っ-○○○
17/07/22 12:12:12.22 5BPAjhLK.net
>>400
EPYCの2ソケットでXeon4ソケット下位を相手取るのは分が悪いことは認めるんだね?
1ソケット対2ソケットでもそうそう変わらんけどな
ダイあたりのDRAM帯域と容量が3倍も差が出るし
EPYCは大容量メモリを積むほどメモリクロックが下がり、メモコンと同期してるIFのクロックも連動して落ちる
421:Socket774
17/07/22 12:15:13.39 FPjMMyKZ.net
団子が最早何言ってるかわかんない、迷走しすぎ
何をどう擁護しようがこの電力じゃどうにもならん
POV Rayがどうのじゃなく、高負荷時にこの消費電力だと選択肢としては厳しい
URLリンク(images.anandtech.com)
URLリンク(i.imgur.com)
422:Socket774
17/07/22 12:16:22.07 RiKuRaha.net
Xeon4Pは、EPYC対策で4P税値下げしたからEPYCと価格・コスパ的に戦えるようになったわけで、
すくなくともIntelがいままでのように殿様商売するのが不可能になるくらいにはEPYC性能・コスパがいい
423:,,・´∀`・,,)っ-○○○
17/07/22 12:17:01.99 5BPAjhLK.net
>>401
同じインターフェースだけど?
ControlとDataは分かれてるがダイ間やアクセラレータ間は32レーンをレーン分割か時分割かしかないよ
424:Socket774
17/07/22 12:17:56.57 h1wS6NNV.net
時分割とか言い出すから何言ってんだコイツと思ったけど、PCIeとIFを同じレーンで交互に通信するとか思ってたんだな
今までのレスにも違和感があったのはそのためか
でかい口叩くわりには情弱すぎでしょ
425:,,・´∀`・,,)っ-○○○
17/07/22 12:18:04.48 5BPAjhLK.net
>>404
商用利用不可能なPOVRayを持ち出さないといけないのは苦し�
426:「な
427:,,・´∀`・,,)っ-○○○
17/07/22 12:19:08.97 5BPAjhLK.net
>>407
じゃあお前の根拠出せよ
428:Socket774
17/07/22 12:21:36.42 FPjMMyKZ.net
>>402
一介の自作erが富士通のスパコンとか知るわけ無いだろ・・・
URLリンク(www.fujitsu.com)
正直SPARC V9 + HPC-ACE2とかいわれても凄いのかどうかよく分からない
EPYCやXeonで例えるとどの程度なんだろう
>メモリ容量 32GB(HMC)
>メモリバンド幅 240GB/s(read)+ 240GB/s(write)
バンド幅は笑うところ?
429:Socket774
17/07/22 12:26:52.36 cuiBxDgH.net
>>410
バンド幅はその程度だが、高速通信により実行率糞高いんだよ
というか日本の気象解析や海洋解析にも使われてんだし
何も自作erだから知らないという話でもないよ、機械翻訳君
430:,,・´∀`・,,)っ-○○○
17/07/22 12:27:45.90 5BPAjhLK.net
そもそもControl fabricはダイあたり32レーンしかないのになぜか4つMCMすると別の帯域が湧いてくる不思議
腹いてぇよ勘弁しろ
431:Socket774
17/07/22 12:48:04.56 pRrJnZ2O.net
本当に良くわかってないんやなって
物理仕様の名称じゃ無いのにね
432:Socket774
17/07/22 12:50:00.70 VCiWa3NO.net
>>411
IDが違う奴を機械翻訳君呼ばわりw
433:,,・´∀`・,,)っ-○○○
17/07/22 13:00:05.72 5BPAjhLK.net
Scalable Data fabricか
内実は4QAM伝送可能な「高速なFSB」のもよう
434:Socket774
17/07/22 13:01:23.54 iygCrPQa.net
正しい情報と正しい根拠に基づいて公正にAMDを貶すんだったら
全然問題ないんだけどな
実際には思い込みと歪んだ根拠で叩いてるからな
機械翻訳くんやポエマーと戯れているのがお似合い
435:,,・´∀`・,,)っ-○○○
17/07/22 13:10:58.44 5BPAjhLK.net
たとえば、4ポートのUSBハブ使えば帯域が4倍スケールすると勘違いしてるレベル
436:Socket774
17/07/22 13:12:34.59 /z+P133G.net
内部通信に一々馬鹿でかい方のSERDES起こすと思ってるのは流石に機械翻訳とかポエマー以下だろ
437:,,・´∀`・,,)っ-○○○
17/07/22 13:21:09.88 5BPAjhLK.net
>>401
だれかこいつの言葉翻訳してくれ
どっちもSDFから分配してるGMIだぞ
SerDesとか意味不明だし(割り込みでスイッチするだけなのに
438:Socket774
17/07/22 13:24:29.53 FPjMMyKZ.net
>>411
> バンド幅はその程度だが、高速通信により実行率糞高いんだよ
> というか日本の気象解析や海洋解析にも使われてんだし
インターコネクト Tofuインターコネクト2
インターコネクトバンド幅 12.5GB/s × 2(双方向) / リンク
PCIe3のx16(16GB/s)と比べてもそれほど凄いようには見えない
URLリンク(www.iwavejapan.co.jp)
機械翻訳ってなんのことだろう?
439:Socket774
17/07/22 13:27:36.79 FPjMMyKZ.net
EPYC「ごちゃごちゃうるさいな、CPU内蔵でPCIe3 128レーン対応したら相手してやるよ」
440:,,・´∀`・,,)っ-○○○
17/07/22 13:35:28.39 5BPAjhLK.net
SDFのルート帯域がメモコンのクロック×512ビットぶんの帯域しかない事実を忘れてて全部のコントローラが同時に動かせると勘違いしてんのか。納得
441:Socket774
17/07/22 14:37:09.72 iM+dy8Lf.net
相変わらず意味不明な事言ってるな
442:Socket774
17/07/22 14:41:27.84 Cab770Ex.net
>>422
しね、嘘つき
443:,,・´∀`・,,)っ-○○○
17/07/22 14:52:02.00 5BPAjhLK.net
バカの解釈「Infinity fabricの帯域は無限大!」
444:Socket774
17/07/22 14:55:57.63 OIfto5OO.net
>>425
死ね嘘つき
445:Socket774
17/07/22 15:13:11.23 EiN8kUO/.net
バカの解釈「メッシュバスの帯域は無限大!」
446:Socket774
17/07/22 15:14:56.49 FPjMMyKZ.net
まあ、落ち着け
コレについて一言どうぞ
URLリンク(tech4gamers.com)
E5 2697v4はTDP
447:145W、それとの電力差が約130W
448:,,・´∀`・,,)っ-○○○
17/07/22 15:16:48.64 5BPAjhLK.net
画像だけ貼られてもわからん
449:Socket774
17/07/22 16:27:32.32 h1wS6NNV.net
昼飯食いに外出てたわ
>.409
マジで知らんのな
後藤氏の記事でも読んで勉強してくれ
URLリンク(cloud.watch.impress.co.jp)
URLリンク(cloud.watch.impress.co.jp)
URLリンク(cloud.watch.impress.co.jp)
パッケージ内接続とソケット間接続は全く別のインターフェース
450:Socket774
17/07/22 16:30:12.58 h1wS6NNV.net
URLリンク(en.wikichip.org)
ダイ内部のブロックダイヤグラム
GMIというのがパッケージ内接続用のパラレルIFインターフェース
xGMIというのがソケット間接続用のインターフェースでこれは汎用SerDesにつながってる
451:Socket774
17/07/22 16:40:33.80 FPjMMyKZ.net
URLリンク(www.tomshardware.co.uk)
全部構成違う、x2 CPUだな、最低構成みたいだし、まあ参考値というところか
件の電力グラフの説明はこんなん
Linux-Benchテストでは、1秒間だけ出現した多数のハイドローバーストをキャプチャし、711Wでクレストしました。
私たちのLinpackテストでは同じ粒度が使われていますが、8176のAVX周波数が低いため、670Wのピークしか記録しませんでした。
AVX512以外は大して向上して無さそう、ワッパは少し良くなった程度かね
452:,,・´∀`・,,)っ-○○○
17/07/22 16:45:36.38 MqAoxSiu.net
>>431
USBハブの例えが理解できなかったか?
根っこが同じでそこが時分割ならそこで頭打ちなんだよ
453:Socket774
17/07/22 16:52:19.81 KoK+XTRR.net
>>431
URLリンク(en.wikichip.org)
URLリンク(en.wikichip.org)
ほいさ
454:Socket774
17/07/22 16:58:39.71 h1wS6NNV.net
>>433
>>399
> PCIeの公称128レーンとダイ間通信を各ダイ32レーンでやりくりしないといけないからな
まずPCIeとダイ間通信を32レーンでやりくりするってことの意味を教えてくれw
レーンってことはSerDesのことだろ
ダイ内部ののSDFに32レーンなんて単位は無いからな
455:Socket774
17/07/22 18:38:42.68 /z+P133G.net
まさかのバックプレーンと表の分別が付いてないパターンか
これは想像しなかったなぁ
見てるこっちが恥ずかしくなってくる
456:Socket774
17/07/22 19:08:09.90 Hkvre7bF.net
団子がどんどん馬鹿になっていくぞ!
457:Socket774
17/07/22 19:45:24.42 a/3yN7r8.net
>>433
荒らしは去れ
458:Socket774
17/07/22 20:11:32.86 UIaiiCXx.net
l 417 ,,・´∀`・,,)っ-○○○ sage 2017/07/22(土) 13:10:58.44 ID:5BPAjhLK
たとえば、4ポートのUSBハブ使えば帯域が4倍スケールすると勘違いしてるレベル
名言頂きました
もはや迷言だけど
459:,,・´∀`・,,)っ-○○○
17/07/22 20:23:30.48 a4Nu/Pop.net
>>435
おまえさー
GMIが全ポート同時に39GB/sで通信できてPCIeもフルスピード出ると勘違いしてるだろ
こっちが恥ずかしいわ
460:Socket774
17/07/22 20:28:26.71 CPaSvxXf.net
Intelのウェアラブル開発チームが撤退。
URLリンク(www.gizmodo.jp)
461:Socket774
17/07/22 20:48:54.59 Xy/SpR7u.net
翻訳スレのが早いな
462:Socket774
17/07/22 21:03:39.59 h1wS6NNV.net
>>440
ダイ内部のSDFを高速なFSBなんて言ってる奴には理解不可能かもね
そんなことより>>435の疑問に答えてくださいな
答えられないなら、大口叩いてたくせにパッケージ内接続用のパラレルIFインターフェース
の存在を知らなかった情弱、という扱いになりますがw
463:Socket774
17/07/22 21:32:34.01 EOK035uz.net
ちょっと知らない事があったら情弱なのか……
まあコテハンの人にとっては致命的だろうけど。
464:Socket774
17/07/22 21:37:02.26 RgRwG1BV.net
>>442
はい
465:Socket774
17/07/22 21:39:06.
466:55 ID:seq6zCo7.net
467:Socket774
17/07/22 22:14:08.35 FPjMMyKZ.net
128レーンが常にフルスピード動作とか専用のベンチでもないと無理だろ
頑張って動かしても半分ぐらいが関の山でしょ
468:Socket774
17/07/22 22:33:07.25 h1wS6NNV.net
>>444
別に普通の人にはここまで言うつもりはないけど、相手は団子だからね
散々、EPYCはMCMだから糞と言い放ってたのに、肝心要のファブリックの構造を知りませんでした、って言うんだからからかいたくもなるでしょ
469:Socket774
17/07/23 01:33:36.30 IqCuj8Oh.net
>>440
"何が"フル帯域だって?
まだそんな事言ってるのか、本当にアホだな
お前にHW設計やらせたら大層な産廃が出来そうだ
何でIntelがリングバスだメッシュだと悪戦苦闘し始めた?
RadeonがATI時代に通った道でも有るが
ではGPUではどうやっているか
そしてタカが44mm^2のCCX二個が何で200mm^2を超えるクソでかいサイズに膨れ上がったか
バスって言葉に踊らされ過ぎなんだよ
470:,,・´∀`・,,)っ-○○○
17/07/23 01:44:19.06 F4g4lShW.net
>>443
強情だないい加減にしろ
おまえはUSBハブに繋がってるデバイスが全部同時にフルスピード動かせるって言ってるのと同レベルの発言してる
471:,,・´∀`・,,)っ-○○○
17/07/23 02:28:32.00 F4g4lShW.net
URLリンク(www.anandtech.com)
ここのPinned Memory Bandwidthの
> 8 threads on the first 8 cores same socket
がGMI超えのペナルティをよくあわらしてると思うけどね
472:Socket774
17/07/23 03:13:06.99 A4xanZ/T.net
あぼーん
473:Socket774
17/07/23 03:38:53.27 K0EF3+4A.net
Skylake-SPのAVXの伸びが良いな
それでもEPYCには負けてるが
474:,,・´∀`・,,)っ-○○○
17/07/23 07:44:17.01 F4g4lShW.net
Stream TriadはただのDRAMベンチですが
Pinned Memory Bandwidthはスレッドあたりで帯域制限かけてるような気はするね
475:,,・´∀`・,,)っ-○○○
17/07/23 08:40:18.11 F4g4lShW.net
>>451で言及したのは6chと2ch×4の同一ダイのCCX0がメモリアクセスしている間CCX1がGMIを経由して他のダイのメモリにアクセス、みたいな例だな
DDR4-2400なら1200MHz動作になるのでInfinity Fabricの理論帯域は38400MB/sだ
2つのCCXと各コントローラの経路がそれぞれごとにクロスバーで並列化されてるならCCX0-MCHとCCX1-GMIとは同時にアクセスできるはずで、それ以上の数字が出て然るべきだ
しかし結果からは少なくとも2つのCCXとコントローラ間のアクセス経路は二重化されてないようにしか見えない
476:Socket774
17/07/23 09:08:24.86 wC1WcFjl.net
>>455
お前の願望なんて興味ないので死ね
477:Socket774
17/07/23 09:09:43.63 5RY6yeH2.net
Skylake-SPとBroadwell-EPの方はDDR4-2666使ってるって事でしょ?
478:,,・´∀`・,,)っ-○○○
17/07/23 09:14:01.29 F4g4lShW.net
SkylakeのUPIよりもGMI/xGMIのほうが実行性能出るとか主張してる基地外がいるのでその検証は必要でしょ
EPYCのメモリアクセス特性もファンボーイ知識レベルも「2chの寄せ集め」
479:Socket774
17/07/23 09:19:06.20 5+6Nbx3+.net
Epycではfirst 8 coresというのはシングルダイ内アクセスであり
続くcore 0,4,8,12...という8コア指定がソケット内全ダイ�
480:ヨの並列アクセス こちらが1スレッドの3.6倍の帯域なので理屈通りです この帯域計測はフィジカルインターコネクトよりもネットワークトポロジの話だと思います
481:Socket774
17/07/23 09:19:39.01 hRNxXwjS.net
ていうかその俺は絶対間違ってない という自信はどこからくるのか
482:Socket774
17/07/23 09:34:21.28 R7TfrBC4.net
numactlで別ダイのメモリへのアクセスねぇ
本当にFSBみたいなシェアードバスだったりUSBみたいな仕組みだったら、時分割でアクセスしたときに実効帯域が減りこそすれ、増えることはないと思うけどね
団子の持ってきたデータは団子の主張を否定してるようにしか見えない
Anandtechの表の1,2行目は一つのコアから同じダイのメモコンへのアクセス
3,5行目は一つのCCXから同じダイのメモコンへのアクセス
6行目は二つのCCXから同じダイのメモコンへのアクセス
を計ってるようにしか見えないな
483:,,・´∀`・,,)っ-○○○
17/07/23 09:45:19.63 ea7xmwEd.net
> 8 threads on the first 8 cores same socket
問題はこっちな
これだとdie0の各CCXごとに4スレッド割り振られる
スコアはECCつきDDR4 2chぶんの帯域は超えてるようなので別ダイのメモリにアクセスしてるようだがIFのバンド幅は下回ってる
484:,,・´∀`・,,)っ-○○○
17/07/23 09:46:54.94 ea7xmwEd.net
38400MBはMiBではないので必要に応じて1.024で2回割ってね
485:,,・´∀`・,,)っ-○○○
17/07/23 09:48:55.67 ea7xmwEd.net
>>461
同じメモコンなら実効帯域増える理由ねーだろアホ
486:,,・´∀`・,,)っ-○○○
17/07/23 09:55:02.21 ea7xmwEd.net
同じメモコンならECCつきDDR4-2chの理論帯域を超えることはありえない
487:,,・´∀`・,,)っ-○○○
17/07/23 10:00:20.79 ea7xmwEd.net
簡単な掛け算です
488:Socket774
17/07/23 10:08:38.36 53obDGLF.net
団子の貼ったソース見てみろ
Broadwell-EPに何でSkylake-SPがいくつか負けてるのかが問題だろ?
どっちもドライバーが最適化されとらんのかって話で終わりでしょ?
違うの?とうしても優劣つけたいの?
489:,,・´∀`・,,)っ-○○○
17/07/23 10:12:05.11 ea7xmwEd.net
ロードバランスとるためにコアあたりの帯域にわざとリミットかけてるだけだと思うけどね。
そこはBIOS設定項目じゃねーの?
490:Socket774
17/07/23 10:28:01.05 53obDGLF.net
実際、Ryzenはドライバーのアップデートでメモリー周り改善したって聞くぞ
上がったり下がったりな箇所もあるけどさ
出たばっかりのベンチマークのみ見てるとまた情報に置いてかれるぞ
491:,,・´∀`・,,)っ-○○○
17/07/23 10:29:56.35 ea7xmwEd.net
DDR4 2400 with ECC × 2ch = 29297MiB / s
Infinity Fabric @ 1200MHz = 36621MiB / s
んで、6つめのテストでは少なくともメモコンは複数動いてるのは確実なんだが
クロスバーの並列動作ではありえないほどスループットが低く、IFの帯域を超えていない
492:,,・´∀`・,,)っ-○○○
17/07/23 10:38:11.33 ea7xmwEd.net
>>469
FPGAじゃねーんだからファブリックの構造は書き換えられねーよ
493:Socket774
17/07/23 10:41:38.47 53obDGLF.net
>>471
Windows7だと速いの聞いたことないのか?
494:,,・´∀`・,,)っ-○○○
17/07/23 10:44:30.01 ea7xmwEd.net
> Windows7でEPYCが動く
まで読んだ
495:Socket774
17/07/23 10:49:09.87 nVKHDtMZ.net
Haswell-Tuned Binaries Are Still Sometimes Faster On AMD Ryzen Than Znver1 Tuning
URLリンク(www.phoronix.com)
LLVM/Clang 5.0でx86-64、znver1、haswellのそれぞれの設定でコンパイルしたら、znver1が高性能というわけでもなかったとのこと
特にScimarkだとHaswell設定の方が倍くらい早かった
URLリンク(openbenchmarking.org)
496:=2 znver1が一番遅いというのもあった http://openbenchmarking.org/embed.php?i=1707201-TR-CLANGZNVE41&sha=7712ada&p=2 Ryzenは基本性能は高いが、癖が強くて最適化には時間がかかりそう
497:Socket774
17/07/23 10:52:06.79 53obDGLF.net
最適化されたのがZen+かもな
本命はZen2なのは変わらんが
498:Socket774
17/07/23 11:00:02.04 5+6Nbx3+.net
>>462
記事にはAMDがフルシステムで250GB/sを記録したと語ってると書いてるので
単純にECCビットが付かない計測をしてるんでしょう
帯域増はダイのCCXが両方機能することでより近いメモリコントローラが割り当てられることと
多スレッド化による効率向上分じゃないですか?
もし複数ダイのメモリコントローラアクセスなら最低でも50GB/s程度になるでしょう
499:Socket774
17/07/23 11:01:16.41 nVKHDtMZ.net
InfinityFabricはコヒーレンシで設計や実装が楽というのがポイントで、レイテンシや帯域は思ってたより高性能くらいなものでしょ
メモリクロックの半分のクロック動作だし、何かしらのネックは発生してると思う
Intelとは逆で、クロック制限、バス制限で、性能抑えて省電力でワッパ優先にしているんだと思う
InfinityFabricをメモリと同じクロックにする設定でもあれば、OCするより性能上がりそう
500:Socket774
17/07/23 11:01:52.40 nVKHDtMZ.net
>>475
Zen3が公表されてる以上Zen2が本命なんてありえないよ
501:Socket774
17/07/23 11:07:04.17 5+6Nbx3+.net
>>477
クロックと同速では?
メモリのデータレートはクロックの倍なのでそれと勘違いしてません?
502:Socket774
17/07/23 11:13:34.76 4hgZZ+ag.net
団子の帯域計算がマジで分からんwww
503:Socket774
17/07/23 11:20:06.75 53obDGLF.net
>>478
Zen2が本命な理由はいくつかある
来年Intelは10nmに行かず14nm++のCascade Lakeと言うのを出す
ノート向けに最新の製造プロセスを回しまくってサーバー向けは劣った製造プロセスで出す為切り替えるのに時差が生じる
Zen2はアーキテクチャを大幅に改良してくるIPCが飛躍的に向上する
だけでなく10nmスキップして7nmプロセスを使う
出てくる情報集めるとこの製造プロセスは性能向上や消費電力やコスト削減等のあらゆる指標で革新が起こせる
Intelの10nmプロセスを上回る性能が出せると思ってる
504:Socket774
17/07/23 11:22:08.08 vBIN6+Vi.net
epicのメモリってソケット跨いでインターリーブされるの?
505:Socket774
17/07/23 11:37:15.46 vBIN6+Vi.net
メモリの実効帯域的に競合より性能出てるし全コアにジョブ振るなら問題ないんじゃない?
506:Socket774
17/07/23 11:44:07.10 nVKHDtMZ.net
>>479
調べてみたら、メモコンと同クロックだった
DDR4 2400だと、メモコンは1200MHzでInfinityも1200MHz
507:Socket774
17/07/23 11:48:17.58 4hgZZ+ag.net
> DDR4 2400 with ECC × 2ch = 29297MiB / s
29297 MiB/s * 1.024^2 = 30720 MB/s
これは38400 MB/sのちょうど0.8倍
8b/10bエンコーディングで実効0.8倍計算?
4bitに1bitのパリティが付くので実効0.8倍計算?
マジでわかんないんで誰か説明してください
508:Socket774
17/07/23 11:52:01.45 nVKHDtMZ.net
>>481
Zen2で分かってるのは7nmプロセスで2019年くらいに出てくるということくらい
アーキテクチャや性能は不明、多少の改良はあってもどの程度かは不明
そもそも日進月歩のCPU業界では本命やら前座やらは意味がない
あえて言うなら、現時点ではZen系の完成形らしい7nm EUVのZen3が本命
まあ、その後に5nm Zen4か新アーキテクチャが控えてるから、すぐに本命じゃなくなるけど
509:Socket774
17/07/23 12:00:30.44 pa+5lIrn.net
>>473
死ねってなんども言わせん納屋早くしね
510:,,・´∀`・,,)っ-○○○
17/07/23 12:07:55.85 ea7xmwEd.net
>>476
おいらが指摘してるのは同一ダイの別CCXの
511:スレッドからメモリに同時アクセスしたときのスループットですよ? 別ダイでそれぞれローカルのメモリ叩いた時にスケールするのは数字見ればわかるよ いずれにしても同一ダイでは1200MHz駆動時のIFのバンド幅の理論値36621MiB/sを超えてない時点で、同一ダイでクロスバーによる並列動作は確認できない
512:Socket774
17/07/23 12:08:17.67 eEnaYu4q.net
>>470
出るわけないだろw
NUMAを勘違いしてないか?
2400ならRawは1200で、GMI間の32Bを考慮して38.4
実に帯域効率95%
そしてUMCだろうが何だろうが32Bで繋がってる、例え先が16Bに落ちるUMCですら倍の32Bで繋がってる
よく似た機器は知ってるよな?
USBじゃないぞ、各ポートが送って来たモノを分配するんだ
しかしGMIが4本有るのは何だろうな
4本あればFCのまま5ダイ構成が可能だけど
513:,,・´∀`・,,)っ-○○○
17/07/23 12:20:27.37 ea7xmwEd.net
>>489
事実上水子になったEHPだろ
4本のGMIでGPUとリンクする図を見たぞ
514:Socket774
17/07/23 12:31:04.76 4hgZZ+ag.net
発言者の団子も説明してくれないのか…
515:,,・´∀`・,,)っ-○○○
17/07/23 12:35:56.95 ea7xmwEd.net
>>489
あと前半は俺もそう思ったしIFの上流帯域に縛られるってしてきしたんたがネイティブの6chより確実に弱いって指摘したんだがコントローラが独立してるから並列動作する、の一点張りですよ?
異なるダイのPCieコントローラにつながったGPU間のデータ交換とかやるとこういう経路になるよな?
GPU---PCIe-IF-GMI---GMI-IF-PCIe---GPU
頼むからGPU間だけでもNVlinkみたいなダイレクトリンク作ってくれよとは思うんだが、それはそれとして
この状態でホストCPUはメモリとかなんの処理の停滞もなく動作するんだろうか?
516:Socket774
17/07/23 12:36:39.29 eEnaYu4q.net
じゃ最後の一本はGPUでもはっつけるのか
デカいソケットが必要ってか既にデカいな
19.2GB/s x2で38.4GB/s
95.3%
どうやって2UMCでこれ以上出せと?
517:Socket774
17/07/23 12:41:31.58 nVKHDtMZ.net
>>489
GMI(PCIe)x4はチップセット用でしょ
URLリンク(rog.asus.com)
518:Socket774
17/07/23 12:41:45.20 aJGpRMRa.net
URLリンク(i.imgur.com)
いやGPUと4GMIで繋ぐって2年前からリークしてるし
GreenlandってのはVEGAの旧コードネームね
519:,,・´∀`・,,)っ-○○○
17/07/23 12:53:13.46 ea7xmwEd.net
NVIDIAのPascalとVoltaの頭文字に合わせてリネームとかプライドなさすぎて泣けるわ~
520:Socket774
17/07/23 12:53:27.21 aJGpRMRa.net
URLリンク(i.imgur.com)
同時期にリークした資料を見るにこの接続はAM4ではなくTR4のスリッパ以上がターゲットになってる
(16core、memory 4ch、 PCIe 64lane等)
ここらの都合がスリッパとVEGAをSIGGRAPHで同時にプレゼンする理由だろう
521:Socket774
17/07/23 12:57:47.38 nVKHDtMZ.net
GMIやPCIeで考えるから、よくわからなくなるんだと思う
全部ひっくるめてダイ辺りInfinityFabric 32レーンで考えればいい
Ryzenは4レーンはチップセット、残り28レーン
スリッパは計64レーン、4レーンはチップセット、4x2=8レーンはMCM、残り52レーン
EPYCは計128レーン、4x3x4=48レーンがMCM、残り80レーン
EPYCx2は計256レーン、48+4x4x2=80レーンがダイ間、残り176レーン
EPYCだとGMIx3はMCMで、残り1つはDual EPYC時に使われてるね
それ以外だとタダのPCIeとして使われるだけだろう