CPUアーキテクチャについて語れ 31at JISAKU
CPUアーキテクチャについて語れ 31 - 暇つぶし2ch964:,,・´∀`・,,)っ-○○○
16/06/22 21:24:44.73 dkHVQ5Tr.net
IntelはPurley世代では最大8ソケット・メモリ最大3TBのビッグノードを構築して
それをOmni-Pathで繋げるというアプローチを採るので
Tofu Interconectほどノード間接続の帯域・レイテンシの依存度は高くない

965:Socket774
16/06/22 21:28:44.84 gV383EyC.net
まぁぼくはtegra�


966:ノ興味津々です



967:Socket774
16/06/22 21:51:50.05 mw51RIVe.net
次はTegra P1になるのかな?
あんまりかっこいい名前ではないね

968:Socket774
16/06/22 21:54:30.80 gV383EyC.net
x2らしい
URLリンク(emit.tech)

969:Socket774
16/06/22 22:35:52.74 qRpbXQiO.net
開発中止してたと思ってたけど、Denver2出すのね

970:Socket774
16/06/23 01:11:04.60 CuaaZZ8C.net
SPECfp_rate2006
Phi 7250 842 215W 3.91/w 1.2/mm2  700mm2 $4876
2699 V4 550 145W 3.79/w 1.18/mm2  465mm2  $4115


>>919
ほとんどダイがでかいだけで無意味だからな
開発コストの無駄

971:Socket774
16/06/23 01:41:54.46 vGhnxf8R.net
Atomはオワコン

972:Socket774
16/06/23 01:44:44.28 D00qiJii.net
ARMv8のHPC拡張の詳細はHotChipsで出てくる、らしい
URLリンク(community.arm.com)

973:,,・´∀`・,,)っ-○○○
16/06/23 02:04:34.54 CAiTDlJ6.net
>>929
Xeonの粗利率は60%を優に超えるが、まさかそれを下回ったら赤字だとでも思い込んでるの?
Xeon PhiをなくしたらXeonが売れるわけではなくGPGPUクラスタにとられるだけ
4U筐体で1~2ソケットだけコントロール用にXeonを使ってもらったところで
結局ラック占有率も下がるしFabのキャパも埋められない

それで「赤字」だっていってたらPC向けなんてとてもやれませんよ
最下位モデルなら72コア中8コアまで不良が認められるから面積あたり効率では
PC向けのチップよりはるかに儲かるわけよ

974:,,・´∀`・,,)っ-○○○
16/06/23 02:39:48.20 CAiTDlJ6.net
Phiはダイ上に固定機能の割合が少なくコアもキャッシュもほとんどが冗長化されてるので
1割近くのコアの不良が認められる700mm^2程度のダイは実質的に100mm^2程度のスマホチップ並か
それ以上の歩留まり率を実現できる

その点富士通のSPARC64なんか全コア完動のチップしか出荷しないじゃん
あれで儲かるならIntelは大黒字もいいところだよ


Xeon Dの8コアが120mm^2ちょっとで581ドルくらいだっけ?
それを6倍しても3500ドルちょっとにしかならないから、下手するとKnights Landingよりも売上高低いかもね
そもそもマイクロサーバってそんなに大きな市場じゃない
でもやらなきゃ飯の種が消えると思うからやるんだ。

それを踏まえて>>929についてはソースの変更が認められないSPECfpで随分検討してるなあという印象
そもそも統的にスパコン向けのXeonの平均価格は4000ドル越えの最上位モデルではなく
1000ドル台のミッドレンジモデルが多用されてるから面積あたり価格でPhiが極端に安いということもない

975:Socket774
16/06/23 02:53:17.57 CuaaZZ8C.net
700mm2の36コアXeon作るのと何が違うんだか
2699 V4も24コアのうち22コアしか使ってないし

976:,,・´∀`・,,)っ-○○○
16/06/23 02:55:08.82 CAiTDlJ6.net
36コア作っても倍精度3TFLOPSに届かないでしょ?
お前の人生無駄だったね

977:,,・´∀`・,,)っ-○○○
16/06/23 02:56:49.34 CAiTDlJ6.net
メインストリームサーバでもHPCでもXeonの売れ筋は1000~1300ドル程度のモデルです

978:,,・´∀`・,,)っ-○○○
16/06/23 03:19:29.00 CAiTDlJ6.net
↑とは限らないか。価格性能比のスイートスポットは世代ごとに変わるし

今回のTop500初登場でBroadwell世代のXeonも複数採用されてるのだけど
一番採用数の多いのはCray XC40の2695 v4

URLリンク(a)


979:rk.intel.com/ja/products/91316/Intel-Xeon-Processor-E5-2695-v4-45M-Cache-2_10-GHz $2424.00 これダイは2699 v4と全く同じだろう? 売れ筋でもないハイエンドモデルを持ち出してXeon Phiが赤字のように印象操作する まさに屑の極みですなあ



980:Socket774
16/06/23 03:25:55.32 CuaaZZ8C.net
GPUに勝てないピーク性能、xeon以下のspecint

せいぜいatomの時のように夢見てればって感じ

981:,,・´∀`・,,)っ-○○○
16/06/23 03:37:08.77 CAiTDlJ6.net
FPGAやASICに勝てないGPUのディープラーニング性能に期待するよりはましだろう

982:Socket774
16/06/23 03:44:13.29 CuaaZZ8C.net
ホストCPUにしたら地獄

URLリンク(news.mynavi.jp)

今後も22nmのv3としか比較できないだろうね
v4と比較したら効率悪いのばれるから

983:,,・´∀`・,,)っ-○○○
16/06/23 04:00:23.99 CAiTDlJ6.net
なんだ、Xeon 2ソケット対KNL1ソケットか
むしろAtom72コアの割に健闘してるじゃん

稟議書書きたくなっちゃったじゃないか

984:Socket774
16/06/23 04:19:58.17 XVVYdrXB.net
AVX-512が付いたE5 v5が出ると、存在価値がほぼなくなる

985:Socket774
16/06/23 04:25:50.05 6mt18PpI.net
ディープラーニング見てると暗号通貨採掘を思い出す
CPU→GPGPU→FPGA→ASICと進化していった

986:Socket774
16/06/23 04:33:11.31 XfMQc344.net
しかもCPUからASIC化まで5年かからなかった
5年後にはCPUとGPUでディープラーニングやってる企業なんて無くなってるだろう

987:Socket774
16/06/23 06:04:58.70 IOdApqtp.net
そう?
君らの頭は固定機能なの?

988:Socket774
16/06/23 06:29:40.88 XfMQc344.net
メモリーは割と自由に書き換えられるけどロジックは固定っぽい

989:,,・´∀`・,,)っ-○○○
16/06/23 09:03:26.17 CAiTDlJ6.net
>>942
Purleyは理論値1TFLOPS(倍精度)に届くかどうかのレベルだし
MCDRAMを混載しないのでPhiでいうとFar Memoryしか存在しないようなもの
BYTES/FLOPSが釣り合ってなさすぎて科学技術計算には向かないよ

強いて言うなら1バイト・2バイト単位の整数演算や3入力のビット論理演算を
サポートするのでFPGA代替用途で多少

990:Socket774
16/06/23 09:15:19.21 Lffayl6z.net
>>923
日本も丸パクリでいいなら簡単よ、nVやAMDでほとんどを占めるGPUの特許もガン無視なら国産ハイエンドGPUだってすぐ実現できる

991:Socket774
16/06/23 09:17:49.50 wIT2HP1/.net
700mm2とか基地外だなww
Itaniumでも400~600mm2くらいだったろ(Tukwila除き)

992:Socket774
16/06/23 23:40:33.82 2hvNWDqE.net
Nehalem-EXが684mm2だった

993:Socket774
16/06/23 23:42:21.30 PWKimYLS.net
誰かが、割に合うなら1000mm2だろうが作るよwって言ってたなw

994:Socket774
16/06/24 02:24:08.35 JEW6btFj.net
ステッパーで一度に露光できる範囲が26mm*33mmなのでそれ以上大きいチップは作れない
分割露光って裏技もあるけどCPUでは使わないと思う

995:Socket774
16/06/24 02:29:03.39 o4+YPhEf.net
分割露光すれば最大で30センチウェハーのサイズまでのチップは制作可能

996:Socket774
16/06/24 02:31:58.98 o4+YPhEf.net
>>952
微細化プロセス向けのステッパではその範囲までしか露光できなくても、
そうでない旧世代プロセスじゃもっとでかい範囲を露光できるのはあるんじゃね?

とくに光学センサー用途等で、そのサイズよりでかいダイが当たり前のように製造されている

997:Socket774
16/06/24 03:07:58.36 WmCYlusv.net
>>917
HPLですら性能でないPhiよりマシじゃね


998: Stampede-KNL - Intel S7200AP Cluster, Intel Xeon Phi 7250 68C 1.4GHz http://top500.org/system/178914 inpack Performance (Rmax) 817.847 TFlop/s Theoretical Peak (Rpeak) 1,474.46 TFlop/s 484ソケットシステム、実効効率55%



999:,,・´∀`・,,)っ-○○○
16/06/24 12:45:05.81 hJbR3PVh.net
HPLの理論性能比なんてチップ依存ではなくソフトの最適化やネットワーク構成によるところが大きく、商用のデータセンターではXeonサーバで3割切って登録されてるものも珍しくない
ましてDellが納入したスパコンで実効性能比8割超えたことなんて一度もないんだが

ところで、先日富士通が発表した資料によれば、今回のXeon Phiは実用的な流体演算でBroadwell-Xeonの4倍の性能という数字が出てる

URLリンク(jp.fujitsu.com)

これはspec.orgにも公式スコアとして申請しているそうだ
既存のCPUコードをPhi向けにコンパイルするだけで動くのはGPUには出来ない芸当だが仮にできたとしても効率はたかが知れているだろう
この分野の流体演算はGPGPU使っても実効性能比一桁%出れば御の字と言われるレベルだから。

なんにせよ広帯域と大容量の両立は今後のスパコンのトレンドになるでしょうね
スループット特化型コアが広帯域メモリと大容量メモリを両立するのは単方向16GB/s程度しか出ないPCIeを経由してしかDDR4にアクセスできないGPUよりも遥かに優れたソリューション

AMDはCPU-GPU間に100GB/sの広帯域バスを付けることでKNL同等のNear/Farメモリモデルを実現しようとしてる
とりあえずx86サーバではNVIDIAはこの分野もう無理だからNVLinkでホストと接続できるPowerで頑張ってくれとしか

別にPCIeカード上にDDR4の拡張スロットつけてもいいと思うけどね?幅取るけど4枚くらいなら行けそうじゃない?

1000:,,・´∀`・,,)っ-○○○
16/06/24 19:38:45.74 qqqNL0o4.net
Bluecrab - Dell PowerEdge R730, Xeon E5-2680v3 12C 2.5GHz, Infiniband FDR14, NVIDIA Tesla K80
URLリンク(www.top500.org)

> Linpack Performance (Rmax) 505.1 TFlop/s
> Theoretical Peak (Rpeak) 874.56 TFlop/s

12コア×2ソケット×676ノード+GPUで実効効率57%
やっぱりDell先生だ、ものすごいブーメランを見たぜ


ところでPascalはKeplerよりBytes/FLOPS悪化してるから
Dell先生のシステムなら実効50%割れ普通に達成しそうだね

1001:,,・´∀`・,,)っ-○○○
16/06/24 19:58:09.71 qqqNL0o4.net
理論性能当たりの実効性能が高いのが素晴らしい(笑)という理屈に照らし合わせるなら
倍精度の性能が単精度の1/8しかなかった初代Teslaが最強のGPUということになるね

1002:Socket774
16/06/26 15:13:29.82 B0BDWvZb.net
$599 Softiron Overdrive 1000 Server is Powered by AMD Opteron A1100 64-bit ARM Processor
URLリンク(www.cnx-software.com)

1003:Socket774
16/06/26 15:14:42.17 B0BDWvZb.net
Softiron_Overdrive_1000Softiron Overdrive 1000 server specifications:

SoC – AMD Opteron A1100 series quad core ARM Cortex A57 processor
System Memory – 2x RDIMM slots fitted with 8GB DDR4 DRAM and expandable


1004: to 64GB Storage – 2x SATA 3.0 connector with one fitted with a 1TB HDD Connectivity – 1x GBase-T Ethernet USB – 2x USB 3.0 ports



1005:Socket774
16/06/26 19:35:53.95 9RE8Wu5g.net
amdのarmは化石だな

1006:Socket774
16/06/26 21:10:24.60 G7pDSHub.net
試作品作った時期がダメだったのに、更にそれから2年ぐらい引っ張ってる。
やる気があるならさっさとK12の16コアでも出せ。

1007:,,・´∀`・,,)っ-○○○
16/06/27 17:28:08.44 i1bN9U/u.net
逆に考えるんだ
大口の客がつかなかったからこそ28nmプロセスが値下がりするまで量産できなかったと

まあAMDに限らずARM系サーバSoCは大体そんな感じだよね

1008:Socket774
16/06/29 23:23:15.75 vFiM22KB.net
富士通、次期スパコンで「SPARC」ではなく「ARM」を選択
URLリンク(blog.livedoor.jp)

1009:Socket774
16/06/29 23:28:26.29 4ooO8qm7.net
>>964
さらばSPARC・・・

1010:Socket774
16/06/29 23:48:45.33 vFiM22KB.net
まあ1年前に話題になってたネタではあるんだけどね
スレリンク(jisaku板:87-番)n

1011:Socket774
16/06/29 23:55:12.09 F5LGI7Jw.net
まさにそこに書いてある94になったな

1012:Socket774
16/06/30 00:11:49.86 upyG7ZnC.net
HPC用に作るってのが間違いなんだよなぁ
ソフトウェア資産や生産性で一般向けチップに勝てない
cortexを使う方が良いんだよなぁ

1013:Socket774
16/06/30 00:25:26.67 QrPfIS8P.net
>>968
言いたいことはわかるがぶっといSIMD持ったコアを山程並べてる昨今のマルチコアHPCを見ると
Cortexが現状持ってるSIMDでは力不足でHPCベンダー側から動かないとどうにもならない。

1014:Socket774
16/06/30 00:28:29.26 JK7KzMFS.net
Sunwayは帯域よりレイテンシ重視で意図的にDDR3使ってるとか設計思想的に面白い話が出てきたな。

1015:Socket774
16/06/30 01:01:02.37 xrM41pG8.net
いくらコアをシンプルにしようとDP SIMD性能だけはアホみたいに上げなきゃいけない
さらにそれに見合ったL1Dの設計をしなきゃいけない
要はHPC向け専用命令とコアの専用設計は必須なのだ

1016:Socket774
16/06/30 03:52:22.91 wYZAcuaf.net
久々に後藤せんせの筆が走ってる

>後藤弘茂のWeekly海外ニュース
FinFET時代のAMDのGPU「Polaris」アーキテクチャ
URLリンク(pc.watch.impress.co.jp)

 Polarisのハードウェアスケジューラは、GPUの進化の次のステップだ。これまでのGPUは、CPUに制御されるコプロセッサで、タスクスケジューリング1つ取っても自立性がなかった。
それに対して、AMDアーキテクチャでは、Polaris世代でグラフィックスもコンピュートも、並列に柔軟にスケジュールできるようになっている。

 この先には、フルに自立制御できるGPUというゴールがあり、AMDは着実にその方向へと向かっている。
Polarisでのハードウェアスケジューラの拡張は、GPUというプロセッサの進化の次の段階を示す重要なステップだ。

1017:Socket774
16/06/30 04:13:56.90 aXREhEqB.net
HPC用CPUには、16chDDR4やそれ以上のHMC、HBM2、GDDR等の高帯域メモリを埋めるだけの
SIMD拡張命令の性能が必要

現状のcortexではまったく対応できない

1018:Socket774
16/06/30 04:19:18.63 aXREhEqB.net
>>972
で、高性能高ワッパ高コスパな"GPU"を求める客に
そんなの売って需要があるのかな?

汎用性を高めれば高めるほどワッパが悪くなるんだし

1019:Socket774
16/06/30 06:40:59.41 A0iSa6Lt.net
>汎用性を高めれば高めるほどワッパが悪くなるんだし

GPUの世代交代で毎回のように言われてる話じゃないかな
印象に残ってるのは
 GeForce4 → GeForce FX (2003年)
 G7x → G80 (2006年)
 G9x → GT200 (2008年)
RADEONも何回か言われてた気がする

1020:Socket774
16/06/30 07:35:56.11 PHWtj7g6.net
CPU組み込めばいいんじゃねぇのって毎回思うんだけど

1021:Socket774
16/06/30 07:56:15.09 aXREhEqB.net
次スレたてました

CPUアーキテクチャについて語れ 32
スレリンク(jisaku板)

1022:Socket774
16/06/30 08:53:14.91 dsnm5F22.net
GPU版Cellみたいになってきたな

西川善司の3DGE:「Polaris」世代のRadeonは何が新しいのか(1)GPUアーキテクチャを丸裸にする

URLリンク(www.4gamer.net)

従来,ほとんどドライバ内で行われていた(≒CPUで実行処理されてきた)GPUスレッドのスケジューリングと発行を,PolarisではGPU内部に新設された「Hardware Scheduler」(以下,HWS)で実行するようになった。

このHWS,「Hardware」とは言うものの,実のところ,GPU内部に実装された専用CPUにプログラムを実行させる仕様であることが明らかになっている。AMDによれば,この実装のため,ドライバなどのアップデートによって,HWSソフトウェアは適宜アップデートが可能だという。
 なお,HWS専用としてCPUコアにどんなプロセッサを実装しているかまでは,AMDは明らかにしていない。

TrueAudio NextではGPUで音響処理をソフトウェア実行することに

1023:Socket774
16/06/30 09:33:09.84 PHWtj7g6.net
R600のころはコマンドプロセッサにmips系積んでるって言ってた記憶

1024:,,・´∀`・,,)っ-○○○
16/06/30 22:15:49.94 dlnXdOkc.net
NVIDIAに対抗してARMコアでも使ってるんじゃない?

1025:Socket774
16/07/01 12:21:34.61 48AdYhf5.net
うめ

1026:Socket774
16/07/01 15:36:51.90 jxzH/L/Y.net
デバッグはどうするんだろうね。

1027:Socket774
16/07/02 08:49:52.68 Qx6qR5cS.net


1028:YAMAGUTIseisei
16/07/02 18:30:03.43 wKpjPrX2.net
>>916
面積

1029:Socket774
16/07/03 07:43:01.93 uQgZb6dl.net
うめてんてー

1030:Socket774
16/07/04 10:18:13.28 3nGSnWyj.net
うめうめ

1031:Socket774
16/07/05 10:00:27.02 AmO47g17.net
すごい雨

1032:Socket774
16/07/06 04:57:00.49 uDGXQ8/6.net
うめ。

1033:Socket774
16/07/07 02:57:01.68 w8QElZbj.net
ume

1034:Socket774
16/07/07 03:14:13.13 w8QElZbj.net
990get

1035:Socket774
16/07/09 06:51:16.41 Xc5SIa24.net
上っ面の数値にとらわれて本質を見られない
だからお前はいつまでたってもだめなんだよ

1036:Socket774
16/07/09 20:50:48.35 XBuvKtuK.net
突発性発狂か

1037:Socket774
16/07/10 21:47:44.43 Vo1Rwmx5.net
うめよふやせよ

1038:Socket774
16/07/10 23:58:13.05 9jcN77v8.net


1039:Socket774
16/07/17 23:15:25.45 /mHT8vqe.net
バッテリーの革命まだかよ
先端プロセスの製造で寿命1000倍に上げてくれよ
充電は年1回で済ませたいんよ

1040:Socket774
16/07/18 11:25:12.19 e09QMJ4C.net
空気中の酸素と湿度と化学物質で発電する方が現実的では

うめうめ

1041:レトリック君
16/07/18 22:00:35.45 JL7rUcDD.net
もう、ワロタ ワロタw

【国際】ソフトバンク、約3.3兆円で英ARM Holdingsを買収―CNBCが伝える★4©2ch.net

1042:Socket774
16/07/18 22:18:32.96 4bLMJT8K.net
アカギだかカイジだかで「倍々で賭けていけば今までの負けを全部取り返せる」みたいなアホな話があったの思い出した
まあそれを実行できるうちはええけど倍々で買えるもの無くなった時どーすんのっつー

1043:Socket774
16/07/18 22:21:42.02 T31ha0gU.net
よろしい、ならば戦争だ

1044:Socket774
16/07/18 22:27:25.36 iMwDsaaG.net
はげ

1045:1001
Over 1000 Thread.net
1台のマシンが組み上がりました。。。
新しい筐体を用意してくださいです。。。。

         自作PC板@2ch URLリンク(anago.2ch.net)

life time: 244日 11時間 35分 4秒

1046:1002
Over 1000 Thread.net
2ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


──────────
《プレミアム会員の主な特典》
★ 2ちゃんねる専用ブラウザからの広告除去
★ 2ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
──────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
URLリンク(premium.2ch.net)
URLリンク(pink-chan-store.myshopify.com)


1047:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch