CPUアーキテクチャについて語れ 31at JISAKU
CPUアーキテクチャについて語れ 31 - 暇つぶし2ch730:Socket774
16/05/04 03:13:09.67 YrifuBiC.net
キチガイ同士のプロレスは他でやれよ三名ほど

731:,,・´∀`・,,)っ-○○○
16/05/04 04:17:24.98 0GkeV3Rm.net
MMX Pentiumの最適化について記述されてる公式マニュアルってこのへんだと思うけど
MMX Pentium固有の最適化なんてそのすぐ後に出たPentium IIではほぼ通用しないレベルのものだったからな
URLリンク(www.intel.co.jp)
もちろんPentium IIすら今のプログラマは忘れていいレベルのことしか書いてないんだけどな

732:,,・´∀`・,,)っ-○○○
16/05/04 04:38:35.62 0GkeV3Rm.net
パパに初めて買ってもらったぱちょこんがMMX Pentium搭載だったけど
Pentium IIIノートでCDリッピングしてMP3エンコードした音楽再生しようとしたら
スペック不足でガクガク

733:Socket774
16/05/04 04:45:22.37 NuYdhdXe.net
なんだ? ホモ援交か?

734:Socket774
16/05/04 07:21:11.97 0acNcLpO.net
ペンプロの巨大セラミックスパッ�


735:Pージは男のロマン



736:,,・´∀`・,,)っ-○○○
16/05/04 12:43:55.06 0GkeV3Rm.net
> ソフバンのmmx本
これ多分菅原清文の「MMXテクノロジオフィシャルガイド」のこと言ってると思うんだけど
レイテンシとかスループットの表はIntelの最適化マニュアルの丸写しのひどい内容な
こんな既に何の役にも立たないクソ本の知識に閉じこもってでドヤ顔とか
老害って生きてる価値ないなー

737:Socket774
16/05/04 14:20:59.42 VozyMQDs.net
そもそも、IT関係の本は、英語の原書・良書を日本語化しただけのが価値がある

738:,,・´∀`・,,)っ-○○○
16/05/04 14:28:57.68 0GkeV3Rm.net
菅原清文ってIntel関連の技術本をそっくりそのまま日本語化しただけの本が多い著者な
CPUベンダーのプロパガンダでない第三者の解析による真の解析データがほしいってなら
Agnerせんせいの解析資料を読めって話だが

x86やC++の最適化関連の話題に関してはAgnerせんせいは(まともな話なら)メール送ったら
真摯に回答してくれるよ

739:,,・´∀`・,,)っ-○○○
16/05/04 20:57:50.29 DMJk5acK.net
Pentium II以降まったく役に立たないMMX Pentium固有の最適化情報が
「本に書いてあったから」なんて意味不明な理由で以後のx86全てに当てはまると勘違いして
まる20年、無自覚な生き恥を晒し続けてきたのはたいしたものだと思いますけどね

740:Socket774
16/05/04 23:35:09.50 qwWM/T2w.net
連休中に他に考えること無いのかよw

741:,,・´∀`・,,)っ-○○○
16/05/05 04:29:02.09 1wbmqE9q.net
> そもそも、IT関係の本は、英語の原書・良書を日本語化しただけのが価値がある
IT関連の本は、原著が名著なのに日本語訳がクソすぎてゴミ本扱いされてる本も
珍しくはありません

742:Socket774
16/05/05 22:39:32.89 1jCEZq9b.net
>>696
CPUって三角関数の専用ハードウェアって積んでるの!?
どんなロジックなんだろう?
C言語のmath.hのやつをコールするだけで使ってくれる?

743:,,・´∀`・,,)っ-○○○
16/05/05 23:47:43.67 JrPQIQjB.net
そもそも専用ハードなんて積んでないよ
マイクロコードで実行してるだけ
そんなおじいちゃんの妄想真に受けるな

744:714
16/05/06 20:33:55.83 ae7U4Uzh.net
>>715
だよねw
団子さん、ありがとー。

745:Socket774
16/05/06 21:07:33.46 5egqSIYJ.net
ふつうのソーラー電卓とか、足し算なら一瞬で計算できるのに、
複雑なのは0.5秒くらいかかったりするよね
クロック周波数数百キロヘルツとかのマイコンで
一生懸命ソフトウェア演算してるんだなっていうのが感じ取れる
ところが関数電卓は案外高性能なCPU積んでる
複雑な関数も一瞬で計算する

746:,,・´∀`・,,)っ-○○○
16/05/06 22:26:05.45 NG8DsYYk.net
ついでにいうとマイクロコードで実装された命令はその実行が完了するまで
パイプラインを止めるので、高速化の弊害になるのことが知られてる
要するにMMX Pentiumの特性すら理解してないってこと

747:Socket774
16/05/07 03:31:53.97 VfWuKDju.net
それでも必要だから実装されている

748:Socket774
16/05/07 10:48:14.52 dz7Wi32s.net
いまどき直接アセンブラでプログラミングする人なんていないし、
主要言語には三角関数ライブラリがついてるので、
マイクロコード実装されてなくても問題ない

749:,,・´∀`・,,)っ-○○○
16/05/07 10:58:58.05 Jxknixma.net
というか、それすら今はSSE*/AVX*のソフトウェア実装を推奨してるんだが
処理を並列化できるし

750:Socket774
16/05/08 03:59:10.34 WDia/2XK.net
次期.NETではSSE/AVXによる並列化がサポートって話だけどやっぱその辺の実行の遅さも問題になってたのかね

751:,,・´∀`・,,)っ-○○○
16/05/08 04:50:53.39 RqaJ7jP7.net
どっちかっ�


752:ツーとJavaのStream APIでは?



753:Socket774
16/05/08 10:47:12.01 RB/xAF+1.net
GTX1080がGDDR5X 10Gbps
HBM2のコストはやはりまだ高いんだな
価格がGTXの数倍のTeslaにしか使えない

754:Socket774
16/05/08 11:19:30.87 RB/xAF+1.net
三角関数補助命令(SPARC64 VIIIfx)
URLリンク(www.ssken.gr.jp)
URLリンク(www.ssken.gr.jp)

755:Socket774
16/05/11 02:05:46.52 7fLwoI9I.net
Oakforest-PACS 2016年12月
 Knights Landing 8208ノード
 Omni-Path、Fat Tree
 25PFLOPS、900TByte
URLリンク(www.cc.u-tokyo.ac.jp)

756:,,・´∀`・,,)っ-○○○
16/05/11 02:29:59.23 ZLJAoh+u.net
京をあっさりダブルスコアで超えたな

757:,,・´∀`・,,)っ-○○○
16/05/11 02:48:47.59 ZLJAoh+u.net
牧野先生が今回のPostT2Kの顛末その他についてTwitterで語ってるが
(PostT2Kの稼働は2014年を予定してた云々も含め)

Jun Makino ?@jun_makino 7時間7時間前
TSMC の 40nm 以降の開発ロードマップの予定と実際を調べてみた。
(中略)
Jun Makino ?@jun_makino 7時間7時間前
つまり: 32, 20G, 16FF が実質キャンセル。
その結果当初のスケジュー ルから 2年(32->28)、1年(16FF+)、6ヶ月(28, 20)遅れた。
Jun Makino ?@jun_makino 7時間7時間前
言い換えると、2回に1回はキャンセルになる上 6ヶ月以上遅れなかったプロセスはない。

758:Socket774
16/05/11 02:54:28.02 7fLwoI9I.net
2Uに8ノード
URLリンク(itpro.nikkeibp.co.jp)
3.6MW(京12.7MW)
URLリンク(www.nikkei.com)
Oakforest-PACS は57ラック(京864ラック)、1ラックの消費電力が
約63kWで京の4.3倍。冷却、かなり頑張らないとだな

759:Socket774
16/05/11 03:12:49.29 7fLwoI9I.net
メモリー
Of  898TB
    0.167Byte/FLOP、(16GB Near)/(3TFLOPS node)
    0.033Byte/FLOP、(96GB DDR4)/(3TFLOPS node)
京 1296TB
    0.5Byte/FLOP、 16GB /(128GFLOPS node)

760:,,・´∀`・,,)っ-○○○
16/05/11 03:14:50.15 ZLJAoh+u.net
グリコがなんか面白そうなもの作ったぞ
URLリンク(youtu.be)

761:,,・´∀`・,,)っ-○○○
16/05/11 03:18:10.55 ZLJAoh+u.net
33gの時点で釣りだな
俺の予想だとプリッツのP

762:Socket774
16/05/11 03:20:53.48 7fLwoI9I.net
合計メモリバンド幅  Of 4.1PB/s  京 5.3PB/s

763:Socket774
16/05/11 09:09:22.17 kqoOeYe9.net
Oakforest-PACSは、TFLOPSでは京を超えてるが、
実際の処理速度では、京を超えてないアプリのほうが多いのでは?

764:,,・´∀`・,,)っ-○○○
16/05/11 10:08:56.26 ZLJAoh+u.net
京(約8万ノード)より一桁少ないノード数に収まってるぶん
HPCGなどのアプリケーションではむしろ理論性能比以上の
差をつけると思ってるのだが

765:Socket774
16/05/11 16:40:45.29 7fLwoI9I.net
Of (3TFLOPS KNL) ― 32+32GB/s ― (2x[100+100Gbit/s] Storm Lake) ― 48port switch Fat tree
京 (128GFLOPS CPU) ― 40+40GB/s ― (10x[5+5GByte/s] ICC) ― 6D torus(3D loop 3D non-loop)


766:



767:Socket774
16/05/11 17:03:14.45 a4sspCK1.net
Omni-Path
   64node   5x[48port switch] latency 339ns
 2048node 220x[48port switch] latency 565ns
 8208node ?x[48port switch] latency ?ns
 URLリンク(news.mynavi.jp)
京 ICC-ICC → ICC-ICC-ICC +0.1us

768:Socket774
16/05/11 17:19:45.16 a4sspCK1.net
Oakforest-PACS:東大と筑波大で別々に調達せず、共同で大型化
京に対して一部から向けられた批判:同じ規模でも複数台に分割した方がいいのではないか

769:,,・´∀`・,,)っ-○○○
16/05/11 19:36:07.48 ZLJAoh+u.net
国外から買い手もつかないようなガラパゴススパコンに対する批判と
同列にされてもなあ
かかってるコストからして桁が違うし

770:Socket774
16/05/11 22:13:15.47 zyhpp+vI.net
分割して安くなるならより一層安い方がいいだろ。
まあこの場合安くならないんだろうけど。

771:,,・´∀`・,,)っ-○○○
16/05/12 00:30:24.23 6BU96Nw+.net
>>740
ノードを分けてシェアすることはできるけど、別々の場所にある複数のスパコンを束ねて
1つのメモリ空間を実現することは不可能(に近いレベルで困難)
そもそも日本がスパコンを持つことを反対してる識者なんていないんだよ
米国は1システム1億ドル未満でPFスケールのスパコンを複数作ってるのに
1000億円もかけてなんで10PFLOPS級のスパコンを1基しか作れないのか?
外国の研究機関や企業が買いたがらないようなガラパゴスのアーキテクチャに
拘ったせいで余分にコストかかってるんじゃないですか?
・・・なんてことは起こるべくして起こる批判じゃないか
そもそもツリー構造のファブリックじゃ、4000ノード×2と8000ノード×1の間に
そんなに実装コストに差はない筈で、別々に持つより共同で1システムを持ったほうが
規模によるメリットが大きいはずだ

別に東大・筑波だけに限らず今後複数の研究機関が導入を計画してるし
導入時期や規模的にも米NERSCのCoriと事実上の姉妹機に近く
多くの技術を共有できるだろう
その点、ガラパゴススパコンの技術は所詮ガラパゴスの中でしか役に立たないからな

772:Socket774
16/05/12 00:40:35.66 iY9y+7K/.net
スパコンの費用とやらは、算出方法に世界統一基準があるわけではなく、
各国それぞれいろんな方法で算出してる
日本の場合、開発費・運用人員・土地建物・ハードソフト電力・保守とか全部入れた
複数年のプロジェクトトータル費用で出してるから高く感じる
単純に他国と公表されてる金額で比べるのは不可能
むしろ性能に比べてかなり割安だと思うよ

773:,,・´∀`・,,)っ-○○○
16/05/12 00:45:06.14 6BU96Nw+.net
稼働開始時点で世界1位を取れたのは事実だし、
FFTを含めたトータル性能では未だひけを取らないから、その性能が必要な用途に
貢献できたのであれば京も全く無駄ではないだろう。
ただ極端に高い買い物だったなという話で。

774:,,・´∀`・,,)っ-○○○
16/05/12 00:53:14.99 6BU96Nw+.net
>>742
ポートアイランドの用地なら、神戸市が格安で提供してる
いまだに空き地いっぱいあるだろ?
埋め立て地だから地盤も緩いし、そんなに好き好んで民間企業が入りたがるような
土地じゃないわな
あの建物の近くに神戸学院大学が全面移転したろ?あれも結局神戸市が斡旋したの。



775:ナ、巨大なキャンパスに比べてはるかに小さい建物に、何百億もかかってるの? 建物の地下かどこかにナントカ還元水とかSTAP細胞の製造プラントでもあるんですか?



776:Socket774
16/05/12 01:22:52.62 n0Fq0MUl.net
>そもそもツリー構造のファブリックじゃ、4000ノード×2と8000ノード×1の間に
>そんなに実装コストに差はない筈で、別々に持つより共同で1システムを持ったほうが
>規模によるメリットが大きいはずだ
要するに>>740に書いたように安くならないんだろ。

777:Socket774
16/05/12 01:30:58.01 lxZBDjJV.net
全く無駄ではないが
相当無駄だわな

778:,,・´∀`・,,)っ-○○○
16/05/12 01:32:56.80 6BU96Nw+.net
おまいさんの試算をしめしてみなよ
分割することによる経費削減効果はおいくら?

779:Socket774
16/05/12 01:41:24.49 lxZBDjJV.net
分割したらピーク性能も細分化されるから
性能が成果というならば
どのみち相当の無駄に変わりは無い

780:,,・´∀`・,,)っ-○○○
16/05/12 01:46:13.26 6BU96Nw+.net
あとストリートビューに2009年時点の京コン前の交差点の画像あったよ
URLリンク(goo.gl)
当然ながら京の入れ物はまだ工事中
ほんとなんもない
まあ、京の誘致が、神戸市が不毛な公共工事を続ける動機づけになったことは
確かかもしれないね(≒山口組の財源)

781:,,・´∀`・,,)っ-○○○
16/05/12 01:57:02.94 6BU96Nw+.net
当初は日本のスパコン技術を世界に輸出して外貨を稼ぐとまで豪語したのに
国内の国立大学にミニ京をごり押しで導入させて終わりというのが現実だから
成功か失敗かの二択なら失敗だろう圧倒的に

782:Socket774
16/05/12 02:26:15.76 n0Fq0MUl.net
>>747
この場合安くならないと言ってるわけで、削減できないが正解でしょ。
京はトーラスなので事情が違うけど、トーラスでも劇的に安くなったりしないんじゃないか。
むしろそっちの試算があるなら見てみたい。

783:,,・´∀`・,,)っ-○○○
16/05/12 03:02:50.41 6BU96Nw+.net
まだ空き地いっぱいあるから電力供給さえ許せば「垓」くらいは作れるかもしれないね(こなみかん
URLリンク(www.google.co.jp)

784:Socket774
16/05/12 04:43:36.86 jxQGfPnZ.net
>>741
富士通と役人にいってやれ

785:Socket774
16/05/12 14:59:34.67 0l8oBB2d.net
URLリンク(cloud.watch.impress.co.jp)
E5-2699v4 18コア、2.2GHzの価格が$4115
URLリンク(pc.watch.impress.co.jp)
E7-8890v3 18コア、2.5GHzの価格が$7175
今のXeonは昔ほどは安くなくなってるな
ちなみに$7175を京と同じ8万個使うと
5億7400万ドル
1ドル110円とすると631億4000万円かかるね

786:Socket774
16/05/12 15:09:57.96 2DICiCyx.net
Xeonはtop500で最大シェアだが使われているCPUはほとんど$1000台、
$2000を超えるXeonのシステムはまれ

787:,,・´∀`・,,)っ-○○○
16/05/12 15:20:47.07 6BU96Nw+.net
なんでわざわざ8ソケットサーバ向けで割高なE7を使う必要があるんだ
Top500の大半のシステムで使われてるXeonは2ソケットサーバ用

788:Socket774
16/05/12 15:25:00.85 0l8oBB2d.net
>>755
だからそれが崩れてきてる
京の後継の最新版のSPARC64 XIfxは2.2GHzの34コアで
これに対抗しなくちゃいけない
Hot Chips 26 - 富士通の100PFlops級スパコン向けプロセサ「SPARC64XIfx」
URLリンク(news.mynavi.jp)

789:,,・´∀`・,,)っ-○○○
16/05/12 15:29:05.91 6BU96Nw+.net
というか京のVenus(8コア・2GHz)程度とのFP性能比較なら



790:X頭価格3万円台のE5-2604 v4ですら勝てるだろ 後発の製品のほうが性能が高いのは当たり前なんだから老朽機は無理せず次のアップグレードを待てとしか



791:Socket774
16/05/12 15:36:12.44 0l8oBB2d.net
>>755
安いE5を使うとしても
E5-2699v4 18コア、2.2GHzの価格が$4115
8万個使うと3億2920万ドル
1ドル110円ならCPUだけで362億1200万円
CPUだけでスパコンが動作するわけもなく
昔ほどXeonは安くはない
>>758
Intelは最新のモデルで京は8年前のモデルで比較してどうするの?

792:,,・´∀`・,,)っ-○○○
16/05/12 15:36:21.42 6BU96Nw+.net
> 京の後継の最新版のSPARC64 XIfxは2.2GHzの34コアで
> これに対抗しなくちゃいけない
お前はバカなのか。
東大・筑波が導入したKnights Landingは2.6GHzの72コアで
1ソケットあたり倍精度3TFLOPS
(もちろんコプロじゃなくてホスト版)
Atomベースなんで整数演算性能のほうはXeonより見劣りお察しだが
その点に関してはSPARC64のほうも大概ポンコツなんで欠点にはならないだろう
まあ、正直ガラバゴスの窮地極まれりといったところかな

793:Socket774
16/05/12 15:36:41.42 0l8oBB2d.net
京はというよりSPARC64はだな

794:,,・´∀`・,,)っ-○○○
16/05/12 15:38:54.06 6BU96Nw+.net
KNLの開発機は $4,887.45からお求め可能です
URLリンク(dap.xeonphi.com)

795:Socket774
16/05/12 15:41:41.52 0l8oBB2d.net
開発機をいくらつなげたってスパコンにはならないな

796:,,・´∀`・,,)っ-○○○
16/05/12 15:42:55.32 6BU96Nw+.net
別にポートアイランドの南側に空き地がまた増えたところでもともとあの辺空き地なんだから
無理しなくていいんだけどな

797:Socket774
16/05/12 15:43:42.72 1PQnuDDd.net
まとめ買いでさらにお得

798:Socket774
16/05/12 15:52:46.87 n0Fq0MUl.net
>>760
なんか2000年頃のSIMDの時代が再びやってきたような気がするな。
当時は動画再生とかだったけど今はHPCで。

799:,,・´∀`・,,)っ-○○○
16/05/12 15:59:51.22 6BU96Nw+.net
当時はSIMDの活用がPCのコスト削減に直結してたからですね
少なくとも「サウンドブラスター互換音源」というハードウェア市場が消滅する程度には

今のIntelプロセッサはそっち方面はQSVとかRealSenseの出来合いのライブラリ
たたいとけば大抵のメディア処理はできてしまうからね

800:,,・´∀`・,,)っ-○○○
16/05/12 18:40:40.43 6BU96Nw+.net
fx100がポスト京に使われると勘違いしてるバカがいるが当のポスト京は2020年稼働で
しかも富士通はSPARC64じゃ達成できないからARMでやるとか言っている

ARMもたいがいアレな命令セットなんですがね
しかしながら命令セットの普及はSPARCよりは見込みがあるのは
俺も認めざるを得ない

801:Socket774
16/05/12 19:04:10.43 n0Fq0MUl.net
>>768
ポスト京は度々使われてるので2020年稼働のエクサスケールだけがポスト京なわけではないと思う。
(ただモノを示さずにポスト京と言った場合はエクサスケールの事だろうけど。)

富士通のARM転向は日経の飛ばし記事しかソースがない。
鯖とスパコンをやりたいのならARMよりOpenPOWERにでも転向した方がいいんじゃないか。

802:,,・´∀`・,,)っ-○○○
16/05/12 19:12:13.08 6BU96Nw+.net
広い意味じゃなくてまずはポートアイランドのあの建物の乗せ換え予定のシステムでしょう
100PFが目標とのことだけど既存の京の電力供給キャパを超えずに100PFを達成するには
FX100(SPARC64 XIfx)とてほぼ不可能、Knights Hillでなんとか間に合いそうかというレベル
10nmまで独自アーキテクチャやるんですかねえ?

803:Socket774
16/05/12 19:52:49.05 n0Fq0MUl.net
>>770
だからその通りだと思う。
fx100がポスト京だと言ってる人の中で「広い意味で」ポスト京だと言ってる人は
間違いではない。
だけど通常はポスト京は2020年のヤツの事を言っているので、だいたいの場合間違い。

ARMの既存コアで目標達成はより一層困難なので、ARM(あるいはPower)転向にせよ
SPARC維持にせよ富士通は独自設計でやるでしょ。

804:Socket774
16/05/12 20:01:38.45 0l8oBB2d.net
>>768
別に次期京に採用されるなんて考えてないぞ
SPARC64の最新版で、
SPARC64が搭載の富士通のHPCで使われてるCPUだから例に挙げただけ
次期京の詳細な情報はまだ出てないしね

805:Socket774
16/05/12 20:14:34.28 0l8oBB2d.net
SPARC64XIfxは富士通のHPCのFX100に搭載されて稼働中
URLリンク(www.icts.nagoya-u.ac.jp)
理研、新スパコン「HOKUSAI GreatWave」を稼働開始
~理論演算性能は1PFLOPS
URLリンク(pc.watch.impress.co.jp)

806:Socket774
16/05/12 20:18:11.65 0l8oBB2d.net
URLリンク(www.mri-jma.go.jp)

807:,,・´∀`・,,)っ-○○○
16/05/12 20:37:23.47 RkVYP7XA.net
理研で考案したインターコネクトを理研の案件で使ってるだけで
海外の研究機関はどこも欲しがらない
これぞガラパゴスだな

まだ民間主導でやってるPEZYのほうが額面スペックで圧倒するぶん
海外からオファー来る可能性高いという皮肉

808:Socket774
16/05/13 12:06:18.20 dAteotqX.net
>757
高価なXeonは昔からある。だが以前も今も使われる例は少ない

intel x86 highend | top500 Xeon(アクセラレータなし)
 1995 $2675
 1999 $3692
 2002 $3692
 2003 $3692
 2004 $3692
 2005 $3692
 2007 $2622   2007/11 およそ$840(約57万ソケットの平均)
 2008 $2729
 2010 $3692
 2011 $4616   2011/11 およそ$1100(約80万ソケットの平均)
 2014 $6841
 2015 $7174   2015/11 およそ$1350(約153万ソケットの平均)

・TOP500_201511.xls などから集計
・ハイエンドの単価が低下している2007、2008はOpteronの
HyperTransportに対してSocket604が不利を託っていた時期

809:Socket774
16/05/17 03:14:23.11 FuuFCOn8.net
TOP500 Xeonシステム アクセラレータなし
     ソケット総数 平均コア数 平均クロック周波数
2007/11  約57万    2.79コア   2.68GHz
2011/11  約80万    5.03コア   2.73GHz
2015/11  約153万    8.37コア   2.47GHz

Xeon 多コア      高クロック
2007  4コア(3.2GHz) 3.4GHz(2コア)
2011 10コア(2.4GHz) 3.6GHz(4コア)
2015 18コア(2.6GHz) 3.7GHz(6コア)

810:Socket774
16/05/23 15:37:08.51 /AbnoWZK.net
今一番楽しみなのはDrive PX2に搭載されるTegra
コールドコードをA57で、ホットコードをDenverでやるでしょこれ

811:Socket774
16/05/23 20:06:06.15 vlkNGvlp.net
日米エンジニアの異なる特長
URLリンク(eetimes.jp)

812:Socket774
16/05/23 20:10:25.13 vlkNGvlp.net
ひた隠しにしてきたプロジェクト:
GoogleからAI用プロセッサ「TPU」が登場
URLリンク(eetimes.jp)

>TPUは既存のFPGAやGPUに比べて1ワット当たりの性能が10倍高い

>Googleは、“TPUは他社の3世代先を行く”と主張している

>TPUは特定用途向けに、16ビット浮動小数点あるいはそれ以下の精度の演算用に最適化していると思われる

813:Socket774
16/05/23 20:55:15.01 RFIWARSW.net
ASIC

814:Socket774
16/05/27 22:19:51.88 jiBMmTPj.net
>>780
3世代先ってことは5nmで作ったのかな?

815:,,・´∀`・,,)っ-○○○
16/05/29 18:40:24.63 1f38op7G.net
URLリンク(www.fool.com)
ところでVoltaの両側面のチップってDDR4かなんか?

816:Socket774
16/05/29 19:28:02.05 TmEhiMEd.net
それはインダクタです

817:Socket774
16/05/29 20:11:25.82 XS2+EruP.net
さすがに恥ずかしすぎるだろその勘違い

818:Socket774
16/05/30 14:59:54.92 Cja9+DvL.net
>>780
人工知能の、
CPU実装→GPU実装→FPGA実装→ASIC実装
という流れは、暗号通貨採掘を思い出す
暗号通貨も最初CPUで採掘されてたが、GPU採掘、FPGA採掘となって最後はASIC採掘になった

819:Socket774
16/05/30 15:36:46.71 PWe+7jJR.net
ASIC化しても採算が取れるほど市場が大きくなってきたってことだろう
でも昔から人工知能に執着していた日本企業の名前がさっぱり出てこないのがちと寂しいが…

820:Socket774
16/05/30 17:35:55.83 4pgfsjfU.net
華々しいものとは言えないが、三菱が成果出してると思う。

821:Socket774
16/05/30 17:47:09.31 Cja9+DvL.net
産業用機器の運転・保守に人工知能つかいましたとかいわれても一般人に見えないんだよな
一般人が、これが人工知能だってわかるところの事業をやってほしい

822:Socket774
16/05/30 18:16:53.39 /fAuAkD3.net
The ARM Cortex A73 - Artemis Unveiled
URLリンク(www.anandtech.com)

A73はA72の拡張って感じじゃないみたい
テストチップでクロックが控えめだったのもそのせいか

823:Socket774
16/05/30 20:04:28.03 81BVKir1.net
クロック控えめだったのはArtemisアーキじゃなくて
10FFプロセスが低電力特化のためらしいよ?
ArtemisはA72と同じプロセスならhigher frequencyってARMが言ってる
URLリンク(images.anandtech.com)

824:Socket774
16/05/30 21:58:53.62 81BVKir1.net
しかしA72の後継が3命令→2命令に進化とはな
なんということでしょう

825:,,・´∀`・,,)っ-○○○
16/05/30 22:15:11.65 pVEdhWQg.net
A12→A17の系譜だろこれ
省電力方面では期待できるかも

826:Socket774
16/05/30 22:25:17.49 PWe+7jJR.net
先端プロセスはクロックを上げにくいと聞いて低クロック高IPC路線に行くと思ってたので意表を突かれたぞ
アップルは6ウェーイとか相変わらず無茶やってるけど

827:Socket774
16/05/30 22:58:37.45 81BVKir1.net
デコーダはシンプル化して各ALUを重視する設計に変えたみたいね
この方向は実質的にA57路線の切り捨てじゃない?

828:Socket774
16/05/31 07:35:43.13 GDDu9dZK.net
A15->A57-A72は熱すぎた

829:Socket774
16/05/31 09:12:07.17 jtsmhYBP.net
A73の方向性は正しいと思うよ

AMDのK12の名前が出なくなって久しく、NVもDenverのようなサーバー展開を睨んだ製品展開が見られない

Googleは高性能ビッグダイのPOWERを選んだ

結局後藤せんせが声高に叫んだARMサーバーの時代は訪れなかった

830:Socket774
16/05/31 09:53:53.59 jvu/NBnQ.net
A73の現物もまだまだ先だし断言はできないが、
A73は互換コア開発に水をさす事になったりしないかね。
Qualcommは止めないだろうし、Qualcommさえあればいいのかもしれないが。

831:Socket774
16/05/31 09:59:39.95 GDDu9dZK.net
なってもいいんじゃないの別に
独自コア作るのが目的じゃないんだから

832:Socket774
16/05/31 10:19:35.02 jvu/NBnQ.net
ARM側からすると互換コア作る所が出てきて
ARM陣営全体が盛り上がる�


833:フが理想じゃないの? まあサーバー向けには盛り上がっておらず、 モバイル向けはQualcommとAppleしかないのだから気にする必要はないかも。



834:Socket774
16/05/31 10:23:59.93 GDDu9dZK.net
820も爆熱っぽいから、830でも中途半端にフロントエンド複雑化させるくらいなら
A73まで待ってもいいじゃない
Appleは別格で

あるいはnvのようにintelの遺産であるPARROTを突き進むか
新tegraはコールドコードをA57,ホットコードをdenver2でやるでしょ

835:Socket774
16/05/31 12:06:14.80 GDDu9dZK.net
URLリンク(pc.watch.impress.co.jp)
ARMが10nm世代の新CPUコア「Cortex-A73」と新GPUアーキテクチャ「Bifrost」を発表

836:Socket774
16/05/31 15:25:23.30 wsFHsVAp.net
>>794
TSMCの16nmのハイパフォーマンスプロセスは、
従来のTSMCの28nmよりかなりクロック上げれるっぽいね

nvidiaの新GPUのクロックがびっくりするほど上がってるから

ただしdGPUと違ってモバイル用は省電力プロセスだから

837:Socket774
16/05/31 18:40:56.12 tRMSi/00.net
URLリンク(pc.watch.impress.co.jp)
Cortex-A72とA73の最大の違いはエンタープライズ向け機能の有無

サーバー向けの新コアは当分出ないというオブラートに包んだ敗北宣言ですな。

838:Socket774
16/05/31 18:52:24.50 wsFHsVAp.net
エンタープライズ向け機能って、ECCとかそっち系かな?
L2$、L3$およびメインメモリにはECC無いとエンタープライズ向けは名乗れない

メインフレームやらそういったのはさらに高度なのが必要

839:Socket774
16/05/31 18:54:14.15 wsFHsVAp.net
ECCとかのサーバ系機能は、対応はしてるが無効化してる、とかは結構ある
価格差つけて売るためだったり、サーバ系機能の評価・デバッグが終わってないとかね

840:Socket774
16/05/31 18:58:33.88 tRMSi/00.net
「サーバーやネットワーク機器向けで必要になる信頼性の機能やECCへの対応などの機能は省かれている。
これらの機能はモバイルには必要がなく、かつ電力効率の阻害要因となり得るからだ」

対応してないと明言してるな。

841:Socket774
16/05/31 19:03:51.97 Yx1wJgzO.net
無効化しているのではなく最初から載ってない可能性が高い
ARMはFPUだけ取り除くとか器用なカスタマイズが出来るので

842:Socket774
16/05/31 19:39:24.76 yBHEVKs1.net
仕方ない
ARM鯖導入を検討してた顧客、Intelに取られちゃったもんな

745 Socket774 2016/04/12(火) 23:01:43.20 ID:oZOUYsUR
Xeon DってばARMサーバーぶっ潰すために用意したものだったのか
道理で10GbE×2内蔵とかいう仕様になっとったわけね

Facebook is the first to jump into ARM servers
URLリンク(semiaccurate.com)
Facebook's monster PHP engine ready to muscle into ARM server chips
URLリンク(m.theregister.co.uk)



Intel gives Facebook the D Xeons thrust web pages at the masses
URLリンク(m.theregister.co.uk)
Xeon D Shows How ARM Can Beat Intel
URLリンク(www.nextplatform.com)


843:xeon-d-shows-arm-can-beat-intel/



844:Socket774
16/06/01 01:38:54.84 MBaR8AuX.net
Cavium Flexes ARM Server Upgrade
14nm ThunderX2 will pack 54 cores
URLリンク(www.eetimes.com)

100GbEで10倍ドン!

845:Socket774
16/06/03 06:00:42.49 BIqiftSi.net
HPE、オラクルに30億ドルの賠償請求--「Itanium」のサポート終了で
URLリンク(japan.cnet.com)

846:Socket774
16/06/07 10:30:18.67 AjMDdhaf.net
Xeon vs. POWER(Intel調べ)
URLリンク(www.4gamer.net)

省電力やコスト面でのアピールだけでピーク性能はPOWERのほうが高い?

847:Socket774
16/06/07 10:31:04.82 a46KkltJ.net
お金は大事だよ

848:Socket774
16/06/07 10:46:48.09 tPms+rUq.net
>>812
なんで勝てると思ったし

849:Socket774
16/06/07 12:33:28.85 8GZKMTIl.net
URLリンク(www.4gamer.net)
左のHIGHER PERFORMANCEが見えない?

今のPOWERって8スレッドSMTが完全に埋まる時だけIntelと比較できる程度のスループットにはなるけど
そうじゃない場合はアホみたいに遅いぞ
電力効率は言わずもがな

850:Socket774
16/06/08 16:36:16.85 8yHC1pBf.net
Macがintel系からまたPOWER系に戻ってくれないかな

851:Socket774
16/06/08 16:52:14.07 7GTBwfxD.net
むしろARMになるんじゃ・・・
Appleが作ったカスタムARMに

852:Socket774
16/06/08 17:02:35.25 RyLcUALH.net
AppleはARMとx86でラインナップを分けてるから
単なるアーキテクチャー変更ではなく相当な戦略転換だと思うぞ。

853:Socket774
16/06/08 19:14:43.51 64f/C+QX.net
POWER陣営は任天堂が撤退したら大きな顧客はGoogleぐらいしか残らないんじゃない?

ああ、NVIDIAがいるのか

854:Socket774
16/06/08 19:24:31.00 cd7sC50A.net
>>819
IBMしかPower作ってないと思ってんのか…

855:Socket774
16/06/08 19:46:08.20 7GTBwfxD.net
組み込み用の旧世代の低性能POWERはともかく、
それなりの性能を求めるPOWERユーザーは少なくなるね

すでに任天堂自体旧世代の低性能POWER組だけど

それなりの性能のPOWERの需要は、もはやIBM・Google・nvidiaだけでは?
日立もいるか?

856:,,・´∀`・,,)っ-○○○
16/06/08 22:25:47.70 vCaTsm+g.net
Freescaleも今やARMチップの会社だしなあ

857:Socket774
16/06/10 16:09:52.69 aIZPgatB.net
iPhoneのCPUはなぜARMだったのか?
MIPSだったらいまごろどうなってただろと妄想

858:Socket774
16/06/10 16:15:25.91 nEhqPG2d.net
Super-Hだったらよかったのに

859:Socket774
16/06/10 18:02:58.25 kP/4FFn2.net
>>823
APIも自前で用意できるAppleならいけたかもしれないけど、iPodからの系譜でARMしかなかったかと

860:Socket774
16/06/10 18:12:31.87 VkdbWim7.net
AppleがMIPSとかSuper-H採用した事がかつてあったか?
ARMじゃなければPowerPCだろう。

861:Socket774
16/06/10 18:50:36.43 Qli57Toq.net
appleがimaginationを買収するんじゃないかって話がちょっと前に出たけど結局没になったらしい
この話が本当ならMIPS版iphoneを検討していた可能性がある

862:Socket774
16/06/10 19:23:19.88 zVzR9e+S.net
>>827
PowerVRじゃねーの?

863:Socket774
16/06/10 22:57:58.09 n9b4lfdD.net
armは低消費電力でのパフォーマンスが高い
mipsはもう少し電力があればパフォーマンスが高くなる

864:Socket774
16/06/10


865:23:39:21.29 ID:kP/4FFn2.net



866:Socket774
16/06/11 01:15:18.13 0qgs2OIC.net
ARMより低消費電力でハイパフォーマンスなSuper-Hの新型を出して欲しいな。

867:Socket774
16/06/11 02:03:58.82 Ct+nmtqc.net
以前は自分もそういう希望はしていたが、
今ではルネサスはそういうの全部RXで置き換えるつもりなんだと理解した。

868:Socket774
16/06/11 14:29:28.20 wpiGH6et.net
iPodやiPhoneにPowerPCという選択肢は無かったのだろうか
組込PowerPCとPowerVRの組み合わせだったら…

869:Socket774
16/06/11 14:41:15.24 un+pd6Ci.net
国際半導体技術ロードマップ活動終了の波紋
URLリンク(techon.nikkeibp.co.jp)

870:Socket774
16/06/11 15:26:25.93 jSKIbW6H.net
スマート端末にPowerPCは㍉

かろうじて任天堂がWiiUでも採用したけど化石のように古いアーキのままで爆熱、NXではx86かARMに移るというのがもっぱらの噂

MSがXbox OneでA2を使っていれば望みはあったかもしれん

>>834
ムーアの法則終了のお知らせ、いよいよIBMが予期していたテヘロの時代へ突入か?!

871:Socket774
16/06/11 16:13:04.67 Ct+nmtqc.net
それはIBMが大型機やらサーバ機向けにコア開発していたからじゃないかね。
かといってPWRficientは買収遅かったし使い物になるか不明だし
やっぱりビジネスにならん気はするけど。

872:Socket774
16/06/11 17:49:19.14 xbvbjcSp.net
>>833
音楽再生(のDSP管理)程度に新型Powerを開発するのはコスパが悪すぎる
iPhoneのプロセッサのオファーをIntelに行っていたのは有名だが
やっぱり初めからPowerプロセッサの新規開発に乗り出すのはハードルが高すぎる
んで消去法で残ったのがARM

873:Socket774
16/06/11 20:27:16.46 MX5CRpuW.net
AppleがなぜARMを採用したかって
その話はiPhoneじゃなくてニュートンまで遡るだろ?

AppleはまだARM社設立前の80年台から協業しててARM6共同開発
91年に初のPDAニュートンにこれを採用

iPhoneのARM採用も消去法どころか第一候補、超鉄板の既定路線だろ

874:Socket774
16/06/11 20:42:36.83 xbvbjcSp.net
関係が深いのは事実だけど
Appleにとって高速なプロセッサの自社開発自体にはなんの価値もない

875:Socket774
16/06/11 21:04:01.30 MX5CRpuW.net
何言ってんの?

876:,,・´∀`・,,)っ-○○○
16/06/11 21:09:07.58 Gl8BH/oW.net
わざわざPOWERアーキテクチャの省電力設計やってる新興企業買収して
ARM設計チームに転換してるんだからまずARMありきだろ

877:Socket774
16/06/11 21:24:22.23 7YFO43LD.net
ARMはそもそもAppleがナレッジナビゲーターを実現するための省電力CPUとして
開発を促してたものだから当然といえば当然

878:Socket774
16/06/11 21:47:43.35 Ct+nmtqc.net
>>838
それは事実だけど、今のアーキテクチャ選択にどの程度影響しているのか少し疑問。

879:Socket774
16/06/11 22:10:25.91 xbvbjcSp.net
>>841
Intelにオファーを蹴られたからARMへ行ったと思ってたけど違う?

初代iPhone: 2007年6月に発売
PA Semi買収: 正確な日時は分からないけどmnaviの記事は2008/04/24

URLリンク(ja.wikipedia.org)
URLリンク(news.mynavi.jp)

Intelがオファーを蹴った記事は検索してないが
Appleがそれ以前からARMを採用しようとしたソースはあるの


880:?



881:Socket774
16/06/11 22:36:23.66 MX5CRpuW.net
何?当時1W以下のレンジの製品にx86を使おうとしてたって言ってるの?

882:Socket774
16/06/11 23:39:04.84 xbvbjcSp.net
ちょっとはググれば?
当時のCEOかなんかが「蹴った」と言ってるんだからそうなんだろう
もっとも蹴ったからにはPemMの最新プロセスへの移植とかを要請したと妄想

883:Socket774
16/06/12 00:53:00.87 CB1wvUa5.net
んな訳無い
intelは当時Xscaleの流れからもうARMはやらんってだけだろ

884:Socket774
16/06/12 00:55:34.94 KEYfsPNR.net
PA Semiは自社設計するための買収でしょ
ARMなんてHDD iPodの時代からずっと使ってるんだから

885:Socket774
16/06/12 02:58:38.05 nfz2N99N.net
2007年のiPhoneのためなら、接触した時期は2006年にIntelが
XScaleを手放すよりも前だろうな

886:Socket774
16/06/12 04:54:18.86 B1g6I2KY.net
あーすっかり忘れてたけどARM作ってたのね
atom系しか頭になかった
まあ、それならIntelが蹴ったのも納得

887:Socket774
16/06/12 09:27:09.00 HyMF/wiT.net
個人的には遠い昔の事のように思えるな。
IntelがXscale手放したの。
やっと10年なのか。

888:Socket774
16/06/12 13:33:48.90 kKsjI2pz.net
>>846
docomo「iPhoneは蹴った」

889:,,・´∀`・,,)っ-○○○
16/06/12 14:18:40.33 Po5h1GII.net
>>844
違うよ
そもそもお前さんはAppleがIntelに依頼した内容が設計からなのか
設計は自前でやるけど生産委託なのか、それすら正確な情報を
持ってないように見える

890:Socket774
16/06/12 17:30:34.85 HyMF/wiT.net
>AppleがIntelに依頼した内容が設計からなのか
>設計は自前でやるけど生産委託なのか、それすら正確な情報を
どっちなん?
大体予想つきそうではあるけど、正確な情報あるなら聞きたい。

891:,,・´∀`・,,)っ-○○○
16/06/12 18:26:58.73 P0fMudEj.net
指摘した通りだって返答すればそれでよろしい
要するにお前の発言には何の根拠もないということ

892:Socket774
16/06/12 19:31:37.92 HyMF/wiT.net
俺の発言というと>>851,854か。
……根拠もクソもないような事しか言ってないんだが。

893:Socket774
16/06/12 19:52:52.05 xj45QZGi.net
なんでAppleはiPodやiPhoneに
MIPSとPowerVRの組み合わせにしなかったのかねー
MIPSでも魔改造したらARMに負けなかっただろうに

894:,,・´∀`・,,)っ-○○○
16/06/12 20:47:14.76 P0fMudEj.net
まあiPodとの互換重視だからARMになるのは必然性があったのは事実だろうね
なおかつIntelの当時の技術(65~45nm)でx86をARM同等の消費電力に
抑え込むのは到底無理だから必然的にARMということ

論理的に考えればARMしかないのは明白

895:,,・´∀`・,,)っ-○○○
16/06/12 20:54:57.44 P0fMudEj.net
ARMのプレディケートビットは分岐予測ついてからはゴミもいいところだが
MIPSのディレイスロットは更にゴミだぞ

896:Socket774
16/06/12 21:47:05.28 KEYfsPNR.net
そもそもAppleは最初からカスタムコア使ってたわけじゃないし
ARMからMIPSのカスタムコアに移行するのは無駄な手間を増やすだけ

897:Socket774
16/06/12 21:48:08.32 B1g6I2KY.net
846とかで間違った前提で上から目線で書いたのは私で>854ではないです
850でXScale作ってたことを忘れてたと書いて終わらせたつもりだった
(けどAppleの意図を読み解ける情報があるなら知りたいところ)

898:Socket774
16/06/12 21:50:52.51 f1UIIPQ4.net
>>860
話しても無駄

899:Socket774
16/06/13 00:21:02.39 aExWSgno.net
ARMは糞。

900:Socket774
16/06/13 01:05:19.05 0sAmcA0o.net
>>861
ちょっとはググればって上からで言われたのは俺
直後にXscaleって書いたきり
後はもう争いたい人たちが争ってるだけだろ多分

901:Socket774
16/06/14 08:59:43.54 HoWAc+lL.net
今世代P


902:S4にぼろ負けしてるXboxが、いち早く高性能な新世代機を投入するみたいだね



903:Socket774
16/06/14 09:58:38.28 nGDYHBWJ.net
競争原理マンセー

904:Socket774
16/06/15 16:16:53.37 1XlrMizn.net
ルータのcpuがどんどんmipsからarmに変わってるな
ベンチ見るとmipsと大差無いのに
安いのだろうか
URLリンク(www.7-cpu.com)

905:Socket774
16/06/15 18:57:14.51 tFkh56wF.net
ソフトウェア開発者の母数の問題じゃない?

906:Socket774
16/06/15 19:12:53.68 qGUUG+Pv.net
昔はPowerPCもあったのにね

907:Socket774
16/06/15 19:14:34.09 2takbKfQ.net
PowerPC SoCなんて腐るほどあったしな

908:Socket774
16/06/16 02:01:09.78 ONKRntGf.net
国内メーカーの家庭用ルーターではかなり信頼されてたSuperOPTは
SuperHだったけど今はどうなんかな。

909:Socket774
16/06/16 02:29:46.49 7imlwwoQ.net
PEZY-SC2の開発が佳境
独自コア 4096コア、MIPS64 12コア、
磁界結合ThruChip Interface DRAM 32GB 4.1TB/sec、DDR4 256GB

URLリンク(news.mynavi.jp)
URLリンク(accc.riken.jp)

910:Socket774
16/06/16 02:42:17.42 7imlwwoQ.net
ThruChip Interface
URLリンク(news.mynavi.jp)

911:Socket774
16/06/16 03:16:57.21 hXKYhFQz.net
PEZYはアーキテクチャが特殊すぎて、FLOPS数やLinpackが早いからと言って
他の計算まで速いのかどうかわからん

HPCG・Graph500のデータ(とそれらのベンチ時の電力効率)も併せて発表してくれ

912:Socket774
16/06/16 04:21:39.55 hXKYhFQz.net
Intelが、XeonCPUコア+Xeon Phi+Tofuインターコネクトみたいなのを1ダイに集積して、
メインメモリはHBM2なりHMCなりGDDR5Xなり採用したHPC用チップを出せば世界最強のHPCが出来ると思う

京のIntel版みたいなの

913:Socket774
16/06/16 04:41:30.78 ONKRntGf.net
>>874
それはGPUと在来型マルチコアの間のどこかになるんじゃないかね。
GPUがカタログスペックで威勢がいいから結局メニーコア不要になるかもしれんけど。

914:Socket774
16/06/16 07:18:57.05 9GRKxXDx.net
PEZY、量子アニーリングをシミュレートするプログラムを開発
URLリンク(news.mynavi.jp)

性能をフルに使ったXeonやPhiとの比較も見てみたいな

915:Socket774
16/06/16 15:59:46.28 NpKhOhuE.net
続々誕生する中国の300mm半導体工場 - GFも中国に300mm工場の建設を決定
URLリンク(news.mynavi.jp)

916:Socket774
16/06/19 02:29:33.95 aqyhTwHP.net
>>874
わからんて
察しろよw

917:Socket774
16/06/19 17:04:30.53 jDVXjCY5.net
>>867
オイラの2ch専用マシンとなってる
セレロンG440の性能はどんなもんですか?

918:,,・´∀`・,,)っ-○○○
16/06/19 17:16:26.44 Ydq0V+qr.net
>>880
自分のマシンの性能くらい自分で計測しろよ
URLリンク(www.7-cpu.com)

919:Socket774
16/06/19 21:23:04.75 w420Bahw.net
ルータ用CPUっていっても、完全にソフトウェアベースのルータから、
ハードウェアベースのルータまであるからな

ソフトウェアベース+VPN等の暗号化処理はハードウェアで行う、
ルータ兼ファイアウォール券VPNのが多い気がするが

920:Socket774
16/06/20 21:12:50.19 6a0NaY+V.net
top500の1位のやつ
中国産cpuなのかalpha改?

921:Socket774
16/06/20 21:21:39.90 nMx0xW+W.net
1チップ64+1コアで倍精度3TFLOPS らしい

922:Socket774
16/06/20 21:33:14.77 NvGOGOpY.net
一時期、ルータ等につかわれる既存の組み込み


923:CPUのパフォーマンスが遅いので、 Intelのx86プロセッサのルータやファイアウォール・ロードバランサが流行った時があったよな そのうちマルチコアARMでかつ暗号化アクセラレーション対応の組み込みコアがでてきて、 マルチコアARMが多くなった印象がある



924:Socket774
16/06/20 21:33:56.13 6a0NaY+V.net
中国やばい

925:Socket774
16/06/20 21:41:52.00 NvGOGOpY.net
中国は、mipsだかalphaだか知らんが既存のコアをベースに、
京のSPARC64みたいにHPC用命令、レジスタ、それにインターコネクトを載せて拡張した
HPC用CPU作ってたはず

こんどのがそのHPC用CPUかもしれないね

仮に京みたいなやつなら、Linpackだけじゃなく他の計算も高速で、
中国が重電・重工・航空宇宙の研究開発にいちばん欲しかった流体演算や各種CFD解析がものすごく高速化するので、
おそらくそっち方面の競争力がかなり上がるのでは?

日本がそっち方面でそこそこ強くなったのも、地球シミュレータやその後継機、京があるからってのもある

926:Socket774
16/06/20 21:48:30.16 nMx0xW+W.net
ShenWeiてのがAlphaベースにSIMD拡張したチップをずっと作ってたところだから
今回のもそれ系なのではという話は出ている

927:Socket774
16/06/20 22:01:19.37 nMx0xW+W.net
申告された性能が本当ならGreen500でも6Gflops/Wと結構なスコアが出てるのが凄いと思う
Linpack以外が気になる...

928:Socket774
16/06/21 00:12:01.05 BIK26sZC.net
flops指標で語っているうちは
真の脅威に気が付かない

929:,,・´∀`・,,)っ-○○○
16/06/21 00:27:33.84 sqIqcRHh.net
軍事利用が目的だから核兵器開発や日本侵略のシミュレーションができればいいんでない?

930:Socket774
16/06/21 00:30:11.02 GjNNTZf3.net
中国の新型スパコンは、気候モデリングにも使うとかいってる
気候モデリングといえば、地球シミュレータや京の得意分野

だから、今回のやつは、Linpackモンスターじゃなくて、
京みたいな総合力の高いスパコンだと予想される

931:Socket774
16/06/21 00:58:44.75 H6P4inv1.net
インターコネクトとかメモリとかも見ないとわからんと思うけど、
その辺は割と平凡っぽいな。
もちろんHPCの世界ではの話で、平凡だからこそ信頼できるのかもしれんけど。

932:,,・´∀`・,,)っ-○○○
16/06/21 01:18:15.62 g8dq3tML.net
別にその分野で最速を目指すとも言ってないし
HPCGだって理論FLOPSあたりの実効性能は京より劣ったが結局物量の差で
天河2号が1位取っただろ

当面は輸出差し止め食らったXeon Phiの置き換えで、「天河3号」はまた別の話じゃないかな

933:Socket774
16/06/21 04:27:32.20 9eSBmsR+.net
1 Sunway TaihuLight SW26010       40960cpu HPL/理論値 74.2%
4 Sequoia        BG/Q         98304cpu HPL/理論値 85.3%
5 K computer      SPARC64 VIIIfx  88128cpu HPL/理論値 93.2%
7 Trinity         Xeon(Cray XC40) 18816cpu HPL/理論値 73.1%
9 Hazel Hen       Xeon(Cray XC40) 15424cpu HPL/理論値 76.2%

934:Socket774
16/06/21 04:39:01.19 9eSBmsR+.net
260core 3TFLOPSのプロセッサにもしも現在の平凡なメモリーだとしたら
Xeon PhiやGPUが不得意な計算は不得意なハードウェアということに

935:Socket774
16/06/21 05:16:08.15 9eSBmsR+.net
URLリンク(bestthenews.com)

この記事が正しければ、Sunwayのメモリバンド幅は全然だめみたい
 Sunway 22.4Flops/Byte
 nv GP100 7.4Flops/Byte
 intel KNL 7.2Flops/Byte

936:Socket774
16/06/21 08:21:41.41 qPOUUrsz.net
内部メモリは


937:?



938:Socket774
16/06/21 09:11:30.62 VGwflrzQ.net
また、日経がポスト京はARMって書いてる

939:Socket774
16/06/21 09:43:49.26 9eSBmsR+.net
ニアメモリが充実しているわけでもなし
 MPE(x1) L1I 32KB、L1D 32KB、L2 256KB
 CPE(x64) L1I 16KB、skratch pad 64KB、特権レベル1レベル

むしろこれで74.2%に届いたなら、HPLのカスタマイズで頑張った?

940:Socket774
16/06/21 11:49:32.67 fteec7cF.net
>>899
ISCで正式発表されたよ?
URLリンク(pbs.twimg.com)

941:Socket774
16/06/21 12:21:12.50 H6P4inv1.net
きっとVENUSみたいなARMv8を作るんだろう。
SPARC鯖は段階的終了か。

942:,,・´∀`・,,)っ-○○○
16/06/21 12:30:30.97 W9IKu92p.net
NEONの256ビット拡張でもするのかな
レジスタ数はどうするんだろ?

943:Socket774
16/06/21 13:14:53.26 GjNNTZf3.net
ソフトウェア互換性からして、HPC-ACE2をARMに持って行ったほうがいいだろ
HPC-ACE3とかで

そうすれば、富士通が頑張ってつくった最適化コンパイラとか各種ソフトウェアを使いまわせる

HPC-ACE2とアセンブラレベルで互換性が高い仕様にすればいい

944:Socket774
16/06/21 15:49:47.39 Rpek0cN5.net
URLリンク(newsroom.intel.com)
Xeon Phi processor 7250、GPUより2.3倍高速
なお相手はMaxwellな模様

同量の計算
4 M40 25時間
4 Phi 10.5時間
8 P100 2時間


ホストCPUでこれじゃ、もう無理だわ
atomの二の舞だな

945:Socket774
16/06/21 17:04:54.46 vnKipg0v.net
たぶんSIMDの拡張はしない
SIMDは素のNEONのままでコアを乗せられるだけ乗せる方針だろう

946:,,・´∀`・,,)っ-○○○
16/06/21 18:49:51.82 g8dq3tML.net
>>905
むしろ苦しいのはGPUじゃね?

固定的なタスクはFPGAやASICのほうがはるかに効率が優れるし
細粒度の動的最適化を伴うネットワークはCPUのほうが分がある
GPUは1GPUで1タスクのデータを何千並列で動かすことしかできないが
Xeon Phiは60コア240スレッドに全部別々のタスクを振れる

もちろんPhiはStratixやArriaのホストになれるのでプログラマビリティと
スループットの両立が可能だ

947:Socket774
16/06/21 19:46:17.42 ViDLplFj.net
DL需要が旺盛なのはわかるけど、phiでこの土俵に上がるのはアホだろ

948:Socket774
16/06/21 23:23:57.22 9eSBmsR+.net
深層学習はFP32どころかFP16で大部分がカバーできるという話になってるので
KNLは6TFLOPS(32bit)でGP100 21.2TFLOPS(16bit)に挑むことになる。

949:,,・´∀`・,,)っ-○○○
16/06/22 01:44:12.02 +falCzIX.net
ディープラーニングにも使える汎用CPUと
ディープラーニング以外の用途には全く何の役にも立たないのとは
決定的に差があるだろ

950:Socket774
16/06/22 04:30:12.72 sQvqB/bK.net
倍精度5.3TFLOPSあってもディープラーニング以外の用途に全く何の役にも立たないの?

951:Socket774
16/06/22 08:14:54.32 8m8MBY12.net
Sunway SW26010ってCellだよなこれ、引き抜きはパクリかはともかく特許はガン無視な予感

952:Socket774
16/06/22 08:47:06.17 PtZvRiGW.net
PowerXCell 32ivの夢は叶わなかったが、まさかそれ以上のテヘロが出てくるとは

953:Socket774
16/06/22 08:58:35.57 HuctgJjv.net
64coreで3tflopsだと1coreあたりは16要素?
1.5GHzで

954:Socket774
16/06/22 10:28:11.04 eK//LvSd.net
256コアが8


955:flops/cycle、1.45GHzで2969.6Gflops 4コアが16flops/cycle、1.45GHzで92.8Gflops、合計3062.4Gflops scienceplusといいここといいURL(>897)があるのに読みに行かないやつ多すぎ。 newsplusやbizplusよりはましだけど



956:Socket774
16/06/22 10:56:11.34 8m8MBY12.net
CellはLSがCPUの周波数と同じ速度だから早かったけど容量が少なかった(時代的にしょうがないけど)
でもSW26010はそれを改善せずコア数増やして力技でやってるだけじゃね?

957:Socket774
16/06/22 13:13:17.44 norqEwtU.net
URLリンク(www.users.csbsju.edu)
HPCGがショボすぎるから、やっぱり国威発揚目的のHPL専用機だったでござる

958:Socket774
16/06/22 14:18:56.43 m+QKSj9o.net
>>911
ORNL、LLNLのフラグシップがIBM&NVIDIAになった時点でお察し
あとKNLは700mm2以上あるね

959:Socket774
16/06/22 18:51:55.26 HmMwIx/Z.net
Phiはコスパが低くてIntelにとって利益出ない商売だからなあ。
内定貰ってるKNHまでは出すだろうけど7nm以降は通常のXeonに統合されるだろうね。

960:,,・´∀`・,,)っ-○○○
16/06/22 19:46:35.20 dkHVQ5Tr.net
>>917
ORNLはCrayとIBMを交互に採用してて今回はIBMのターンだっただけと思ってるけどな
んでもってIBMはx86事業そのものをやめてるからPOWERしか用意できない

DOEのPre-Exa世代4つのうち最大となるのはANLのAuroraで
これは第3世代のXeon Phiを採用し最大450PFLOPSまでの拡張計画がある
そしてArgonneのもう一つのスパコンのThetaとNERSCのCoriがKNLを採用

URLリンク(wccftech.com)
もはや妄想乙としか

961:,,・´∀`・,,)っ-○○○
16/06/22 19:47:08.21 dkHVQ5Tr.net
>>919
まるでPOWERが利益出せるような言い草ですな

962:,,・´∀`・,,)っ-○○○
16/06/22 20:05:11.22 dkHVQ5Tr.net
あと、「利益が出ない」とする根拠は?

72コアのうち4コア無効にできるだけの冗長性を確保して利益が出ない理由もないと思うけど
オフダイで最大のコスト要因となるシリコンインターポーザも使っていない
年内10万ユニット出荷予定だけど50~60万くらい

「DGX-1」のようなGPUサーバだと1台につきXeon2個しか売れないが
Xeon Phiなら同じ4Uのスペースあれば8ノード詰め込める。

963:Socket774
16/06/22 21:13:52.41 XS/0h17i.net
中国の最新のを叩いてる奴もいるが、国産1号機でここまでやれれば十分で大成功でしょ?
当然今後は改良版を出してくるから、linpackモンスターじゃないのも出てくるでしょう

アメリカは、IBMかインテルに、
SPARC64XIfxみたいなチップ作れって言って予算つければ、
それを使ってgraph500/hpcg等がものすごい性能の
HPCを作れるのでは?

さすがにlinpackじゃ中華機には勝てないかもしれないが、それ以外のいろんなベンチで勝てそう

964:,,・´∀`・,,)っ-○○○
16/06/22 21:24:44.73 dkHVQ5Tr.net
IntelはPurley世代では最大8ソケット・メモリ最大3TBのビッグノードを構築して
それをOmni-Pathで繋げるというアプローチを採るので
Tofu Interconectほどノード間接続の帯域・レイテンシの依存度は高くない

965:Socket774
16/06/22 21:28:44.84 gV383EyC.net
まぁぼくはtegra�


966:ノ興味津々です



967:Socket774
16/06/22 21:51:50.05 mw51RIVe.net
次はTegra P1になるのかな?
あんまりかっこいい名前ではないね

968:Socket774
16/06/22 21:54:30.80 gV383EyC.net
x2らしい
URLリンク(emit.tech)

969:Socket774
16/06/22 22:35:52.74 qRpbXQiO.net
開発中止してたと思ってたけど、Denver2出すのね

970:Socket774
16/06/23 01:11:04.60 CuaaZZ8C.net
SPECfp_rate2006
Phi 7250 842 215W 3.91/w 1.2/mm2  700mm2 $4876
2699 V4 550 145W 3.79/w 1.18/mm2  465mm2  $4115


>>919
ほとんどダイがでかいだけで無意味だからな
開発コストの無駄

971:Socket774
16/06/23 01:41:54.46 vGhnxf8R.net
Atomはオワコン

972:Socket774
16/06/23 01:44:44.28 D00qiJii.net
ARMv8のHPC拡張の詳細はHotChipsで出てくる、らしい
URLリンク(community.arm.com)

973:,,・´∀`・,,)っ-○○○
16/06/23 02:04:34.54 CAiTDlJ6.net
>>929
Xeonの粗利率は60%を優に超えるが、まさかそれを下回ったら赤字だとでも思い込んでるの?
Xeon PhiをなくしたらXeonが売れるわけではなくGPGPUクラスタにとられるだけ
4U筐体で1~2ソケットだけコントロール用にXeonを使ってもらったところで
結局ラック占有率も下がるしFabのキャパも埋められない

それで「赤字」だっていってたらPC向けなんてとてもやれませんよ
最下位モデルなら72コア中8コアまで不良が認められるから面積あたり効率では
PC向けのチップよりはるかに儲かるわけよ

974:,,・´∀`・,,)っ-○○○
16/06/23 02:39:48.20 CAiTDlJ6.net
Phiはダイ上に固定機能の割合が少なくコアもキャッシュもほとんどが冗長化されてるので
1割近くのコアの不良が認められる700mm^2程度のダイは実質的に100mm^2程度のスマホチップ並か
それ以上の歩留まり率を実現できる

その点富士通のSPARC64なんか全コア完動のチップしか出荷しないじゃん
あれで儲かるならIntelは大黒字もいいところだよ


Xeon Dの8コアが120mm^2ちょっとで581ドルくらいだっけ?
それを6倍しても3500ドルちょっとにしかならないから、下手するとKnights Landingよりも売上高低いかもね
そもそもマイクロサーバってそんなに大きな市場じゃない
でもやらなきゃ飯の種が消えると思うからやるんだ。

それを踏まえて>>929についてはソースの変更が認められないSPECfpで随分検討してるなあという印象
そもそも統的にスパコン向けのXeonの平均価格は4000ドル越えの最上位モデルではなく
1000ドル台のミッドレンジモデルが多用されてるから面積あたり価格でPhiが極端に安いということもない

975:Socket774
16/06/23 02:53:17.57 CuaaZZ8C.net
700mm2の36コアXeon作るのと何が違うんだか
2699 V4も24コアのうち22コアしか使ってないし

976:,,・´∀`・,,)っ-○○○
16/06/23 02:55:08.82 CAiTDlJ6.net
36コア作っても倍精度3TFLOPSに届かないでしょ?
お前の人生無駄だったね

977:,,・´∀`・,,)っ-○○○
16/06/23 02:56:49.34 CAiTDlJ6.net
メインストリームサーバでもHPCでもXeonの売れ筋は1000~1300ドル程度のモデルです

978:,,・´∀`・,,)っ-○○○
16/06/23 03:19:29.00 CAiTDlJ6.net
↑とは限らないか。価格性能比のスイートスポットは世代ごとに変わるし

今回のTop500初登場でBroadwell世代のXeonも複数採用されてるのだけど
一番採用数の多いのはCray XC40の2695 v4

URLリンク(a)


979:rk.intel.com/ja/products/91316/Intel-Xeon-Processor-E5-2695-v4-45M-Cache-2_10-GHz $2424.00 これダイは2699 v4と全く同じだろう? 売れ筋でもないハイエンドモデルを持ち出してXeon Phiが赤字のように印象操作する まさに屑の極みですなあ



980:Socket774
16/06/23 03:25:55.32 CuaaZZ8C.net
GPUに勝てないピーク性能、xeon以下のspecint

せいぜいatomの時のように夢見てればって感じ

981:,,・´∀`・,,)っ-○○○
16/06/23 03:37:08.77 CAiTDlJ6.net
FPGAやASICに勝てないGPUのディープラーニング性能に期待するよりはましだろう

982:Socket774
16/06/23 03:44:13.29 CuaaZZ8C.net
ホストCPUにしたら地獄

URLリンク(news.mynavi.jp)

今後も22nmのv3としか比較できないだろうね
v4と比較したら効率悪いのばれるから

983:,,・´∀`・,,)っ-○○○
16/06/23 04:00:23.99 CAiTDlJ6.net
なんだ、Xeon 2ソケット対KNL1ソケットか
むしろAtom72コアの割に健闘してるじゃん

稟議書書きたくなっちゃったじゃないか

984:Socket774
16/06/23 04:19:58.17 XVVYdrXB.net
AVX-512が付いたE5 v5が出ると、存在価値がほぼなくなる

985:Socket774
16/06/23 04:25:50.05 6mt18PpI.net
ディープラーニング見てると暗号通貨採掘を思い出す
CPU→GPGPU→FPGA→ASICと進化していった

986:Socket774
16/06/23 04:33:11.31 XfMQc344.net
しかもCPUからASIC化まで5年かからなかった
5年後にはCPUとGPUでディープラーニングやってる企業なんて無くなってるだろう

987:Socket774
16/06/23 06:04:58.70 IOdApqtp.net
そう?
君らの頭は固定機能なの?

988:Socket774
16/06/23 06:29:40.88 XfMQc344.net
メモリーは割と自由に書き換えられるけどロジックは固定っぽい

989:,,・´∀`・,,)っ-○○○
16/06/23 09:03:26.17 CAiTDlJ6.net
>>942
Purleyは理論値1TFLOPS(倍精度)に届くかどうかのレベルだし
MCDRAMを混載しないのでPhiでいうとFar Memoryしか存在しないようなもの
BYTES/FLOPSが釣り合ってなさすぎて科学技術計算には向かないよ

強いて言うなら1バイト・2バイト単位の整数演算や3入力のビット論理演算を
サポートするのでFPGA代替用途で多少

990:Socket774
16/06/23 09:15:19.21 Lffayl6z.net
>>923
日本も丸パクリでいいなら簡単よ、nVやAMDでほとんどを占めるGPUの特許もガン無視なら国産ハイエンドGPUだってすぐ実現できる

991:Socket774
16/06/23 09:17:49.50 wIT2HP1/.net
700mm2とか基地外だなww
Itaniumでも400~600mm2くらいだったろ(Tukwila除き)

992:Socket774
16/06/23 23:40:33.82 2hvNWDqE.net
Nehalem-EXが684mm2だった

993:Socket774
16/06/23 23:42:21.30 PWKimYLS.net
誰かが、割に合うなら1000mm2だろうが作るよwって言ってたなw

994:Socket774
16/06/24 02:24:08.35 JEW6btFj.net
ステッパーで一度に露光できる範囲が26mm*33mmなのでそれ以上大きいチップは作れない
分割露光って裏技もあるけどCPUでは使わないと思う

995:Socket774
16/06/24 02:29:03.39 o4+YPhEf.net
分割露光すれば最大で30センチウェハーのサイズまでのチップは制作可能

996:Socket774
16/06/24 02:31:58.98 o4+YPhEf.net
>>952
微細化プロセス向けのステッパではその範囲までしか露光できなくても、
そうでない旧世代プロセスじゃもっとでかい範囲を露光できるのはあるんじゃね?

とくに光学センサー用途等で、そのサイズよりでかいダイが当たり前のように製造されている

997:Socket774
16/06/24 03:07:58.36 WmCYlusv.net
>>917
HPLですら性能でないPhiよりマシじゃね


998: Stampede-KNL - Intel S7200AP Cluster, Intel Xeon Phi 7250 68C 1.4GHz http://top500.org/system/178914 inpack Performance (Rmax) 817.847 TFlop/s Theoretical Peak (Rpeak) 1,474.46 TFlop/s 484ソケットシステム、実効効率55%



999:,,・´∀`・,,)っ-○○○
16/06/24 12:45:05.81 hJbR3PVh.net
HPLの理論性能比なんてチップ依存ではなくソフトの最適化やネットワーク構成によるところが大きく、商用のデータセンターではXeonサーバで3割切って登録されてるものも珍しくない
ましてDellが納入したスパコンで実効性能比8割超えたことなんて一度もないんだが

ところで、先日富士通が発表した資料によれば、今回のXeon Phiは実用的な流体演算でBroadwell-Xeonの4倍の性能という数字が出てる

URLリンク(jp.fujitsu.com)

これはspec.orgにも公式スコアとして申請しているそうだ
既存のCPUコードをPhi向けにコンパイルするだけで動くのはGPUには出来ない芸当だが仮にできたとしても効率はたかが知れているだろう
この分野の流体演算はGPGPU使っても実効性能比一桁%出れば御の字と言われるレベルだから。

なんにせよ広帯域と大容量の両立は今後のスパコンのトレンドになるでしょうね
スループット特化型コアが広帯域メモリと大容量メモリを両立するのは単方向16GB/s程度しか出ないPCIeを経由してしかDDR4にアクセスできないGPUよりも遥かに優れたソリューション

AMDはCPU-GPU間に100GB/sの広帯域バスを付けることでKNL同等のNear/Farメモリモデルを実現しようとしてる
とりあえずx86サーバではNVIDIAはこの分野もう無理だからNVLinkでホストと接続できるPowerで頑張ってくれとしか

別にPCIeカード上にDDR4の拡張スロットつけてもいいと思うけどね?幅取るけど4枚くらいなら行けそうじゃない?

1000:,,・´∀`・,,)っ-○○○
16/06/24 19:38:45.74 qqqNL0o4.net
Bluecrab - Dell PowerEdge R730, Xeon E5-2680v3 12C 2.5GHz, Infiniband FDR14, NVIDIA Tesla K80
URLリンク(www.top500.org)

> Linpack Performance (Rmax) 505.1 TFlop/s
> Theoretical Peak (Rpeak) 874.56 TFlop/s

12コア×2ソケット×676ノード+GPUで実効効率57%
やっぱりDell先生だ、ものすごいブーメランを見たぜ


ところでPascalはKeplerよりBytes/FLOPS悪化してるから
Dell先生のシステムなら実効50%割れ普通に達成しそうだね

1001:,,・´∀`・,,)っ-○○○
16/06/24 19:58:09.71 qqqNL0o4.net
理論性能当たりの実効性能が高いのが素晴らしい(笑)という理屈に照らし合わせるなら
倍精度の性能が単精度の1/8しかなかった初代Teslaが最強のGPUということになるね

1002:Socket774
16/06/26 15:13:29.82 B0BDWvZb.net
$599 Softiron Overdrive 1000 Server is Powered by AMD Opteron A1100 64-bit ARM Processor
URLリンク(www.cnx-software.com)

1003:Socket774
16/06/26 15:14:42.17 B0BDWvZb.net
Softiron_Overdrive_1000Softiron Overdrive 1000 server specifications:

SoC – AMD Opteron A1100 series quad core ARM Cortex A57 processor
System Memory – 2x RDIMM slots fitted with 8GB DDR4 DRAM and expandable


1004: to 64GB Storage – 2x SATA 3.0 connector with one fitted with a 1TB HDD Connectivity – 1x GBase-T Ethernet USB – 2x USB 3.0 ports



1005:Socket774
16/06/26 19:35:53.95 9RE8Wu5g.net
amdのarmは化石だな

1006:Socket774
16/06/26 21:10:24.60 G7pDSHub.net
試作品作った時期がダメだったのに、更にそれから2年ぐらい引っ張ってる。
やる気があるならさっさとK12の16コアでも出せ。

1007:,,・´∀`・,,)っ-○○○
16/06/27 17:28:08.44 i1bN9U/u.net
逆に考えるんだ
大口の客がつかなかったからこそ28nmプロセスが値下がりするまで量産できなかったと

まあAMDに限らずARM系サーバSoCは大体そんな感じだよね

1008:Socket774
16/06/29 23:23:15.75 vFiM22KB.net
富士通、次期スパコンで「SPARC」ではなく「ARM」を選択
URLリンク(blog.livedoor.jp)

1009:Socket774
16/06/29 23:28:26.29 4ooO8qm7.net
>>964
さらばSPARC・・・

1010:Socket774
16/06/29 23:48:45.33 vFiM22KB.net
まあ1年前に話題になってたネタではあるんだけどね
スレリンク(jisaku板:87-番)n

1011:Socket774
16/06/29 23:55:12.09 F5LGI7Jw.net
まさにそこに書いてある94になったな

1012:Socket774
16/06/30 00:11:49.86 upyG7ZnC.net
HPC用に作るってのが間違いなんだよなぁ
ソフトウェア資産や生産性で一般向けチップに勝てない
cortexを使う方が良いんだよなぁ

1013:Socket774
16/06/30 00:25:26.67 QrPfIS8P.net
>>968
言いたいことはわかるがぶっといSIMD持ったコアを山程並べてる昨今のマルチコアHPCを見ると
Cortexが現状持ってるSIMDでは力不足でHPCベンダー側から動かないとどうにもならない。

1014:Socket774
16/06/30 00:28:29.26 JK7KzMFS.net
Sunwayは帯域よりレイテンシ重視で意図的にDDR3使ってるとか設計思想的に面白い話が出てきたな。

1015:Socket774
16/06/30 01:01:02.37 xrM41pG8.net
いくらコアをシンプルにしようとDP SIMD性能だけはアホみたいに上げなきゃいけない
さらにそれに見合ったL1Dの設計をしなきゃいけない
要はHPC向け専用命令とコアの専用設計は必須なのだ

1016:Socket774
16/06/30 03:52:22.91 wYZAcuaf.net
久々に後藤せんせの筆が走ってる

>後藤弘茂のWeekly海外ニュース
FinFET時代のAMDのGPU「Polaris」アーキテクチャ
URLリンク(pc.watch.impress.co.jp)

 Polarisのハードウェアスケジューラは、GPUの進化の次のステップだ。これまでのGPUは、CPUに制御されるコプロセッサで、タスクスケジューリング1つ取っても自立性がなかった。
それに対して、AMDアーキテクチャでは、Polaris世代でグラフィックスもコンピュートも、並列に柔軟にスケジュールできるようになっている。

 この先には、フルに自立制御できるGPUというゴールがあり、AMDは着実にその方向へと向かっている。
Polarisでのハードウェアスケジューラの拡張は、GPUというプロセッサの進化の次の段階を示す重要なステップだ。

1017:Socket774
16/06/30 04:13:56.90 aXREhEqB.net
HPC用CPUには、16chDDR4やそれ以上のHMC、HBM2、GDDR等の高帯域メモリを埋めるだけの
SIMD拡張命令の性能が必要

現状のcortexではまったく対応できない

1018:Socket774
16/06/30 04:19:18.63 aXREhEqB.net
>>972
で、高性能高ワッパ高コスパな"GPU"を求める客に
そんなの売って需要があるのかな?

汎用性を高めれば高めるほどワッパが悪くなるんだし

1019:Socket774
16/06/30 06:40:59.41 A0iSa6Lt.net
>汎用性を高めれば高めるほどワッパが悪くなるんだし

GPUの世代交代で毎回のように言われてる話じゃないかな
印象に残ってるのは
 GeForce4 → GeForce FX (2003年)
 G7x → G80 (2006年)
 G9x → GT200 (2008年)
RADEONも何回か言われてた気がする

1020:Socket774
16/06/30 07:35:56.11 PHWtj7g6.net
CPU組み込めばいいんじゃねぇのって毎回思うんだけど

1021:Socket774
16/06/30 07:56:15.09 aXREhEqB.net
次スレたてました

CPUアーキテクチャについて語れ 32
スレリンク(jisaku板)

1022:Socket774
16/06/30 08:53:14.91 dsnm5F22.net
GPU版Cellみたいになってきたな

西川善司の3DGE:「Polaris」世代のRadeonは何が新しいのか(1)GPUアーキテクチャを丸裸にする

URLリンク(www.4gamer.net)

従来,ほとんどドライバ内で行われていた(≒CPUで実行処理されてきた)GPUスレッドのスケジューリングと発行を,PolarisではGPU内部に新設された「Hardware Scheduler」(以下,HWS)で実行するようになった。

このHWS,「Hardware」とは言うものの,実のところ,GPU内部に実装された専用CPUにプログラムを実行させる仕様であることが明らかになっている。AMDによれば,この実装のため,ドライバなどのアップデートによって,HWSソフトウェアは適宜アップデートが可能だという。
 なお,HWS専用としてCPUコアにどんなプロセッサを実装しているかまでは,AMDは明らかにしていない。

TrueAudio NextではGPUで音響処理をソフトウェア実行することに

1023:Socket774
16/06/30 09:33:09.84 PHWtj7g6.net
R600のころはコマンドプロセッサにmips系積んでるって言ってた記憶

1024:,,・´∀`・,,)っ-○○○
16/06/30 22:15:49.94 dlnXdOkc.net
NVIDIAに対抗してARMコアでも使ってるんじゃない?

1025:Socket774
16/07/01 12:21:34.61 48AdYhf5.net
うめ

1026:Socket774
16/07/01 15:36:51.90 jxzH/L/Y.net
デバッグはどうするんだろうね。

1027:Socket774
16/07/02 08:49:52.68 Qx6qR5cS.net


1028:YAMAGUTIseisei
16/07/02 18:30:03.43 wKpjPrX2.net
>>916
面積

1029:Socket774
16/07/03 07:43:01.93 uQgZb6dl.net
うめてんてー

1030:Socket774
16/07/04 10:18:13.28 3nGSnWyj.net
うめうめ

1031:Socket774
16/07/05 10:00:27.02 AmO47g17.net
すごい雨

1032:Socket774
16/07/06 04:57:00.49 uDGXQ8/6.net
うめ。

1033:Socket774
16/07/07 02:57:01.68 w8QElZbj.net
ume

1034:Socket774
16/07/07 03:14:13.13 w8QElZbj.net
990get

1035:Socket774
16/07/09 06:51:16.41 Xc5SIa24.net
上っ面の数値にとらわれて本質を見られない
だからお前はいつまでたってもだめなんだよ

1036:Socket774
16/07/09 20:50:48.35 XBuvKtuK.net
突発性発狂か

1037:Socket774
16/07/10 21:47:44.43 Vo1Rwmx5.net
うめよふやせよ

1038:Socket774
16/07/10 23:58:13.05 9jcN77v8.net


1039:Socket774
16/07/17 23:15:25.45 /mHT8vqe.net
バッテリーの革命まだかよ
先端プロセスの製造で寿命1000倍に上げてくれよ
充電は年1回で済ませたいんよ

1040:Socket774
16/07/18 11:25:12.19 e09QMJ4C.net
空気中の酸素と湿度と化学物質で発電する方が現実的では

うめうめ

1041:レトリック君
16/07/18 22:00:35.45 JL7rUcDD.net
もう、ワロタ ワロタw

【国際】ソフトバンク、約3.3兆円で英ARM Holdingsを買収―CNBCが伝える★4©2ch.net

1042:Socket774
16/07/18 22:18:32.96 4bLMJT8K.net
アカギだかカイジだかで「倍々で賭けていけば今までの負けを全部取り返せる」みたいなアホな話があったの思い出した
まあそれを実行できるうちはええけど倍々で買えるもの無くなった時どーすんのっつー

1043:Socket774
16/07/18 22:21:42.02 T31ha0gU.net
よろしい、ならば戦争だ

1044:Socket774
16/07/18 22:27:25.36 iMwDsaaG.net
はげ

1045:1001
Over 1000 Thread.net
1台のマシンが組み上がりました。。。
新しい筐体を用意してくださいです。。。。

         自作PC板@2ch URLリンク(anago.2ch.net)

life time: 244日 11時間 35分 4秒

1046:1002
Over 1000 Thread.net
2ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


──────────
《プレミアム会員の主な特典》
★ 2ちゃんねる専用ブラウザからの広告除去
★ 2ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
──────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
URLリンク(premium.2ch.net)
URLリンク(pink-chan-store.myshopify.com)


1047:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch