CPUアーキテクチャについて語れ 31at JISAKU
CPUアーキテクチャについて語れ 31 - 暇つぶし2ch879:Socket774
16/06/11 22:10:25.91 xbvbjcSp.net
>>841
Intelにオファーを蹴られたからARMへ行ったと思ってたけど違う?

初代iPhone: 2007年6月に発売
PA Semi買収: 正確な日時は分からないけどmnaviの記事は2008/04/24

URLリンク(ja.wikipedia.org)
URLリンク(news.mynavi.jp)

Intelがオファーを蹴った記事は検索してないが
Appleがそれ以前からARMを採用しようとしたソースはあるの


880:?



881:Socket774
16/06/11 22:36:23.66 MX5CRpuW.net
何?当時1W以下のレンジの製品にx86を使おうとしてたって言ってるの?

882:Socket774
16/06/11 23:39:04.84 xbvbjcSp.net
ちょっとはググれば?
当時のCEOかなんかが「蹴った」と言ってるんだからそうなんだろう
もっとも蹴ったからにはPemMの最新プロセスへの移植とかを要請したと妄想

883:Socket774
16/06/12 00:53:00.87 CB1wvUa5.net
んな訳無い
intelは当時Xscaleの流れからもうARMはやらんってだけだろ

884:Socket774
16/06/12 00:55:34.94 KEYfsPNR.net
PA Semiは自社設計するための買収でしょ
ARMなんてHDD iPodの時代からずっと使ってるんだから

885:Socket774
16/06/12 02:58:38.05 nfz2N99N.net
2007年のiPhoneのためなら、接触した時期は2006年にIntelが
XScaleを手放すよりも前だろうな

886:Socket774
16/06/12 04:54:18.86 B1g6I2KY.net
あーすっかり忘れてたけどARM作ってたのね
atom系しか頭になかった
まあ、それならIntelが蹴ったのも納得

887:Socket774
16/06/12 09:27:09.00 HyMF/wiT.net
個人的には遠い昔の事のように思えるな。
IntelがXscale手放したの。
やっと10年なのか。

888:Socket774
16/06/12 13:33:48.90 kKsjI2pz.net
>>846
docomo「iPhoneは蹴った」

889:,,・´∀`・,,)っ-○○○
16/06/12 14:18:40.33 Po5h1GII.net
>>844
違うよ
そもそもお前さんはAppleがIntelに依頼した内容が設計からなのか
設計は自前でやるけど生産委託なのか、それすら正確な情報を
持ってないように見える

890:Socket774
16/06/12 17:30:34.85 HyMF/wiT.net
>AppleがIntelに依頼した内容が設計からなのか
>設計は自前でやるけど生産委託なのか、それすら正確な情報を
どっちなん?
大体予想つきそうではあるけど、正確な情報あるなら聞きたい。

891:,,・´∀`・,,)っ-○○○
16/06/12 18:26:58.73 P0fMudEj.net
指摘した通りだって返答すればそれでよろしい
要するにお前の発言には何の根拠もないということ

892:Socket774
16/06/12 19:31:37.92 HyMF/wiT.net
俺の発言というと>>851,854か。
……根拠もクソもないような事しか言ってないんだが。

893:Socket774
16/06/12 19:52:52.05 xj45QZGi.net
なんでAppleはiPodやiPhoneに
MIPSとPowerVRの組み合わせにしなかったのかねー
MIPSでも魔改造したらARMに負けなかっただろうに

894:,,・´∀`・,,)っ-○○○
16/06/12 20:47:14.76 P0fMudEj.net
まあiPodとの互換重視だからARMになるのは必然性があったのは事実だろうね
なおかつIntelの当時の技術(65~45nm)でx86をARM同等の消費電力に
抑え込むのは到底無理だから必然的にARMということ

論理的に考えればARMしかないのは明白

895:,,・´∀`・,,)っ-○○○
16/06/12 20:54:57.44 P0fMudEj.net
ARMのプレディケートビットは分岐予測ついてからはゴミもいいところだが
MIPSのディレイスロットは更にゴミだぞ

896:Socket774
16/06/12 21:47:05.28 KEYfsPNR.net
そもそもAppleは最初からカスタムコア使ってたわけじゃないし
ARMからMIPSのカスタムコアに移行するのは無駄な手間を増やすだけ

897:Socket774
16/06/12 21:48:08.32 B1g6I2KY.net
846とかで間違った前提で上から目線で書いたのは私で>854ではないです
850でXScale作ってたことを忘れてたと書いて終わらせたつもりだった
(けどAppleの意図を読み解ける情報があるなら知りたいところ)

898:Socket774
16/06/12 21:50:52.51 f1UIIPQ4.net
>>860
話しても無駄

899:Socket774
16/06/13 00:21:02.39 aExWSgno.net
ARMは糞。

900:Socket774
16/06/13 01:05:19.05 0sAmcA0o.net
>>861
ちょっとはググればって上からで言われたのは俺
直後にXscaleって書いたきり
後はもう争いたい人たちが争ってるだけだろ多分

901:Socket774
16/06/14 08:59:43.54 HoWAc+lL.net
今世代P


902:S4にぼろ負けしてるXboxが、いち早く高性能な新世代機を投入するみたいだね



903:Socket774
16/06/14 09:58:38.28 nGDYHBWJ.net
競争原理マンセー

904:Socket774
16/06/15 16:16:53.37 1XlrMizn.net
ルータのcpuがどんどんmipsからarmに変わってるな
ベンチ見るとmipsと大差無いのに
安いのだろうか
URLリンク(www.7-cpu.com)

905:Socket774
16/06/15 18:57:14.51 tFkh56wF.net
ソフトウェア開発者の母数の問題じゃない?

906:Socket774
16/06/15 19:12:53.68 qGUUG+Pv.net
昔はPowerPCもあったのにね

907:Socket774
16/06/15 19:14:34.09 2takbKfQ.net
PowerPC SoCなんて腐るほどあったしな

908:Socket774
16/06/16 02:01:09.78 ONKRntGf.net
国内メーカーの家庭用ルーターではかなり信頼されてたSuperOPTは
SuperHだったけど今はどうなんかな。

909:Socket774
16/06/16 02:29:46.49 7imlwwoQ.net
PEZY-SC2の開発が佳境
独自コア 4096コア、MIPS64 12コア、
磁界結合ThruChip Interface DRAM 32GB 4.1TB/sec、DDR4 256GB

URLリンク(news.mynavi.jp)
URLリンク(accc.riken.jp)

910:Socket774
16/06/16 02:42:17.42 7imlwwoQ.net
ThruChip Interface
URLリンク(news.mynavi.jp)

911:Socket774
16/06/16 03:16:57.21 hXKYhFQz.net
PEZYはアーキテクチャが特殊すぎて、FLOPS数やLinpackが早いからと言って
他の計算まで速いのかどうかわからん

HPCG・Graph500のデータ(とそれらのベンチ時の電力効率)も併せて発表してくれ

912:Socket774
16/06/16 04:21:39.55 hXKYhFQz.net
Intelが、XeonCPUコア+Xeon Phi+Tofuインターコネクトみたいなのを1ダイに集積して、
メインメモリはHBM2なりHMCなりGDDR5Xなり採用したHPC用チップを出せば世界最強のHPCが出来ると思う

京のIntel版みたいなの

913:Socket774
16/06/16 04:41:30.78 ONKRntGf.net
>>874
それはGPUと在来型マルチコアの間のどこかになるんじゃないかね。
GPUがカタログスペックで威勢がいいから結局メニーコア不要になるかもしれんけど。

914:Socket774
16/06/16 07:18:57.05 9GRKxXDx.net
PEZY、量子アニーリングをシミュレートするプログラムを開発
URLリンク(news.mynavi.jp)

性能をフルに使ったXeonやPhiとの比較も見てみたいな

915:Socket774
16/06/16 15:59:46.28 NpKhOhuE.net
続々誕生する中国の300mm半導体工場 - GFも中国に300mm工場の建設を決定
URLリンク(news.mynavi.jp)

916:Socket774
16/06/19 02:29:33.95 aqyhTwHP.net
>>874
わからんて
察しろよw

917:Socket774
16/06/19 17:04:30.53 jDVXjCY5.net
>>867
オイラの2ch専用マシンとなってる
セレロンG440の性能はどんなもんですか?

918:,,・´∀`・,,)っ-○○○
16/06/19 17:16:26.44 Ydq0V+qr.net
>>880
自分のマシンの性能くらい自分で計測しろよ
URLリンク(www.7-cpu.com)

919:Socket774
16/06/19 21:23:04.75 w420Bahw.net
ルータ用CPUっていっても、完全にソフトウェアベースのルータから、
ハードウェアベースのルータまであるからな

ソフトウェアベース+VPN等の暗号化処理はハードウェアで行う、
ルータ兼ファイアウォール券VPNのが多い気がするが

920:Socket774
16/06/20 21:12:50.19 6a0NaY+V.net
top500の1位のやつ
中国産cpuなのかalpha改?

921:Socket774
16/06/20 21:21:39.90 nMx0xW+W.net
1チップ64+1コアで倍精度3TFLOPS らしい

922:Socket774
16/06/20 21:33:14.77 NvGOGOpY.net
一時期、ルータ等につかわれる既存の組み込み


923:CPUのパフォーマンスが遅いので、 Intelのx86プロセッサのルータやファイアウォール・ロードバランサが流行った時があったよな そのうちマルチコアARMでかつ暗号化アクセラレーション対応の組み込みコアがでてきて、 マルチコアARMが多くなった印象がある



924:Socket774
16/06/20 21:33:56.13 6a0NaY+V.net
中国やばい

925:Socket774
16/06/20 21:41:52.00 NvGOGOpY.net
中国は、mipsだかalphaだか知らんが既存のコアをベースに、
京のSPARC64みたいにHPC用命令、レジスタ、それにインターコネクトを載せて拡張した
HPC用CPU作ってたはず

こんどのがそのHPC用CPUかもしれないね

仮に京みたいなやつなら、Linpackだけじゃなく他の計算も高速で、
中国が重電・重工・航空宇宙の研究開発にいちばん欲しかった流体演算や各種CFD解析がものすごく高速化するので、
おそらくそっち方面の競争力がかなり上がるのでは?

日本がそっち方面でそこそこ強くなったのも、地球シミュレータやその後継機、京があるからってのもある

926:Socket774
16/06/20 21:48:30.16 nMx0xW+W.net
ShenWeiてのがAlphaベースにSIMD拡張したチップをずっと作ってたところだから
今回のもそれ系なのではという話は出ている

927:Socket774
16/06/20 22:01:19.37 nMx0xW+W.net
申告された性能が本当ならGreen500でも6Gflops/Wと結構なスコアが出てるのが凄いと思う
Linpack以外が気になる...

928:Socket774
16/06/21 00:12:01.05 BIK26sZC.net
flops指標で語っているうちは
真の脅威に気が付かない

929:,,・´∀`・,,)っ-○○○
16/06/21 00:27:33.84 sqIqcRHh.net
軍事利用が目的だから核兵器開発や日本侵略のシミュレーションができればいいんでない?

930:Socket774
16/06/21 00:30:11.02 GjNNTZf3.net
中国の新型スパコンは、気候モデリングにも使うとかいってる
気候モデリングといえば、地球シミュレータや京の得意分野

だから、今回のやつは、Linpackモンスターじゃなくて、
京みたいな総合力の高いスパコンだと予想される

931:Socket774
16/06/21 00:58:44.75 H6P4inv1.net
インターコネクトとかメモリとかも見ないとわからんと思うけど、
その辺は割と平凡っぽいな。
もちろんHPCの世界ではの話で、平凡だからこそ信頼できるのかもしれんけど。

932:,,・´∀`・,,)っ-○○○
16/06/21 01:18:15.62 g8dq3tML.net
別にその分野で最速を目指すとも言ってないし
HPCGだって理論FLOPSあたりの実効性能は京より劣ったが結局物量の差で
天河2号が1位取っただろ

当面は輸出差し止め食らったXeon Phiの置き換えで、「天河3号」はまた別の話じゃないかな

933:Socket774
16/06/21 04:27:32.20 9eSBmsR+.net
1 Sunway TaihuLight SW26010       40960cpu HPL/理論値 74.2%
4 Sequoia        BG/Q         98304cpu HPL/理論値 85.3%
5 K computer      SPARC64 VIIIfx  88128cpu HPL/理論値 93.2%
7 Trinity         Xeon(Cray XC40) 18816cpu HPL/理論値 73.1%
9 Hazel Hen       Xeon(Cray XC40) 15424cpu HPL/理論値 76.2%

934:Socket774
16/06/21 04:39:01.19 9eSBmsR+.net
260core 3TFLOPSのプロセッサにもしも現在の平凡なメモリーだとしたら
Xeon PhiやGPUが不得意な計算は不得意なハードウェアということに

935:Socket774
16/06/21 05:16:08.15 9eSBmsR+.net
URLリンク(bestthenews.com)

この記事が正しければ、Sunwayのメモリバンド幅は全然だめみたい
 Sunway 22.4Flops/Byte
 nv GP100 7.4Flops/Byte
 intel KNL 7.2Flops/Byte

936:Socket774
16/06/21 08:21:41.41 qPOUUrsz.net
内部メモリは


937:?



938:Socket774
16/06/21 09:11:30.62 VGwflrzQ.net
また、日経がポスト京はARMって書いてる

939:Socket774
16/06/21 09:43:49.26 9eSBmsR+.net
ニアメモリが充実しているわけでもなし
 MPE(x1) L1I 32KB、L1D 32KB、L2 256KB
 CPE(x64) L1I 16KB、skratch pad 64KB、特権レベル1レベル

むしろこれで74.2%に届いたなら、HPLのカスタマイズで頑張った?

940:Socket774
16/06/21 11:49:32.67 fteec7cF.net
>>899
ISCで正式発表されたよ?
URLリンク(pbs.twimg.com)

941:Socket774
16/06/21 12:21:12.50 H6P4inv1.net
きっとVENUSみたいなARMv8を作るんだろう。
SPARC鯖は段階的終了か。

942:,,・´∀`・,,)っ-○○○
16/06/21 12:30:30.97 W9IKu92p.net
NEONの256ビット拡張でもするのかな
レジスタ数はどうするんだろ?

943:Socket774
16/06/21 13:14:53.26 GjNNTZf3.net
ソフトウェア互換性からして、HPC-ACE2をARMに持って行ったほうがいいだろ
HPC-ACE3とかで

そうすれば、富士通が頑張ってつくった最適化コンパイラとか各種ソフトウェアを使いまわせる

HPC-ACE2とアセンブラレベルで互換性が高い仕様にすればいい

944:Socket774
16/06/21 15:49:47.39 Rpek0cN5.net
URLリンク(newsroom.intel.com)
Xeon Phi processor 7250、GPUより2.3倍高速
なお相手はMaxwellな模様

同量の計算
4 M40 25時間
4 Phi 10.5時間
8 P100 2時間


ホストCPUでこれじゃ、もう無理だわ
atomの二の舞だな

945:Socket774
16/06/21 17:04:54.46 vnKipg0v.net
たぶんSIMDの拡張はしない
SIMDは素のNEONのままでコアを乗せられるだけ乗せる方針だろう

946:,,・´∀`・,,)っ-○○○
16/06/21 18:49:51.82 g8dq3tML.net
>>905
むしろ苦しいのはGPUじゃね?

固定的なタスクはFPGAやASICのほうがはるかに効率が優れるし
細粒度の動的最適化を伴うネットワークはCPUのほうが分がある
GPUは1GPUで1タスクのデータを何千並列で動かすことしかできないが
Xeon Phiは60コア240スレッドに全部別々のタスクを振れる

もちろんPhiはStratixやArriaのホストになれるのでプログラマビリティと
スループットの両立が可能だ

947:Socket774
16/06/21 19:46:17.42 ViDLplFj.net
DL需要が旺盛なのはわかるけど、phiでこの土俵に上がるのはアホだろ

948:Socket774
16/06/21 23:23:57.22 9eSBmsR+.net
深層学習はFP32どころかFP16で大部分がカバーできるという話になってるので
KNLは6TFLOPS(32bit)でGP100 21.2TFLOPS(16bit)に挑むことになる。

949:,,・´∀`・,,)っ-○○○
16/06/22 01:44:12.02 +falCzIX.net
ディープラーニングにも使える汎用CPUと
ディープラーニング以外の用途には全く何の役にも立たないのとは
決定的に差があるだろ

950:Socket774
16/06/22 04:30:12.72 sQvqB/bK.net
倍精度5.3TFLOPSあってもディープラーニング以外の用途に全く何の役にも立たないの?

951:Socket774
16/06/22 08:14:54.32 8m8MBY12.net
Sunway SW26010ってCellだよなこれ、引き抜きはパクリかはともかく特許はガン無視な予感

952:Socket774
16/06/22 08:47:06.17 PtZvRiGW.net
PowerXCell 32ivの夢は叶わなかったが、まさかそれ以上のテヘロが出てくるとは

953:Socket774
16/06/22 08:58:35.57 HuctgJjv.net
64coreで3tflopsだと1coreあたりは16要素?
1.5GHzで

954:Socket774
16/06/22 10:28:11.04 eK//LvSd.net
256コアが8


955:flops/cycle、1.45GHzで2969.6Gflops 4コアが16flops/cycle、1.45GHzで92.8Gflops、合計3062.4Gflops scienceplusといいここといいURL(>897)があるのに読みに行かないやつ多すぎ。 newsplusやbizplusよりはましだけど



956:Socket774
16/06/22 10:56:11.34 8m8MBY12.net
CellはLSがCPUの周波数と同じ速度だから早かったけど容量が少なかった(時代的にしょうがないけど)
でもSW26010はそれを改善せずコア数増やして力技でやってるだけじゃね?

957:Socket774
16/06/22 13:13:17.44 norqEwtU.net
URLリンク(www.users.csbsju.edu)
HPCGがショボすぎるから、やっぱり国威発揚目的のHPL専用機だったでござる

958:Socket774
16/06/22 14:18:56.43 m+QKSj9o.net
>>911
ORNL、LLNLのフラグシップがIBM&NVIDIAになった時点でお察し
あとKNLは700mm2以上あるね

959:Socket774
16/06/22 18:51:55.26 HmMwIx/Z.net
Phiはコスパが低くてIntelにとって利益出ない商売だからなあ。
内定貰ってるKNHまでは出すだろうけど7nm以降は通常のXeonに統合されるだろうね。

960:,,・´∀`・,,)っ-○○○
16/06/22 19:46:35.20 dkHVQ5Tr.net
>>917
ORNLはCrayとIBMを交互に採用してて今回はIBMのターンだっただけと思ってるけどな
んでもってIBMはx86事業そのものをやめてるからPOWERしか用意できない

DOEのPre-Exa世代4つのうち最大となるのはANLのAuroraで
これは第3世代のXeon Phiを採用し最大450PFLOPSまでの拡張計画がある
そしてArgonneのもう一つのスパコンのThetaとNERSCのCoriがKNLを採用

URLリンク(wccftech.com)
もはや妄想乙としか

961:,,・´∀`・,,)っ-○○○
16/06/22 19:47:08.21 dkHVQ5Tr.net
>>919
まるでPOWERが利益出せるような言い草ですな

962:,,・´∀`・,,)っ-○○○
16/06/22 20:05:11.22 dkHVQ5Tr.net
あと、「利益が出ない」とする根拠は?

72コアのうち4コア無効にできるだけの冗長性を確保して利益が出ない理由もないと思うけど
オフダイで最大のコスト要因となるシリコンインターポーザも使っていない
年内10万ユニット出荷予定だけど50~60万くらい

「DGX-1」のようなGPUサーバだと1台につきXeon2個しか売れないが
Xeon Phiなら同じ4Uのスペースあれば8ノード詰め込める。

963:Socket774
16/06/22 21:13:52.41 XS/0h17i.net
中国の最新のを叩いてる奴もいるが、国産1号機でここまでやれれば十分で大成功でしょ?
当然今後は改良版を出してくるから、linpackモンスターじゃないのも出てくるでしょう

アメリカは、IBMかインテルに、
SPARC64XIfxみたいなチップ作れって言って予算つければ、
それを使ってgraph500/hpcg等がものすごい性能の
HPCを作れるのでは?

さすがにlinpackじゃ中華機には勝てないかもしれないが、それ以外のいろんなベンチで勝てそう

964:,,・´∀`・,,)っ-○○○
16/06/22 21:24:44.73 dkHVQ5Tr.net
IntelはPurley世代では最大8ソケット・メモリ最大3TBのビッグノードを構築して
それをOmni-Pathで繋げるというアプローチを採るので
Tofu Interconectほどノード間接続の帯域・レイテンシの依存度は高くない

965:Socket774
16/06/22 21:28:44.84 gV383EyC.net
まぁぼくはtegra�


966:ノ興味津々です



967:Socket774
16/06/22 21:51:50.05 mw51RIVe.net
次はTegra P1になるのかな?
あんまりかっこいい名前ではないね

968:Socket774
16/06/22 21:54:30.80 gV383EyC.net
x2らしい
URLリンク(emit.tech)

969:Socket774
16/06/22 22:35:52.74 qRpbXQiO.net
開発中止してたと思ってたけど、Denver2出すのね

970:Socket774
16/06/23 01:11:04.60 CuaaZZ8C.net
SPECfp_rate2006
Phi 7250 842 215W 3.91/w 1.2/mm2  700mm2 $4876
2699 V4 550 145W 3.79/w 1.18/mm2  465mm2  $4115


>>919
ほとんどダイがでかいだけで無意味だからな
開発コストの無駄

971:Socket774
16/06/23 01:41:54.46 vGhnxf8R.net
Atomはオワコン

972:Socket774
16/06/23 01:44:44.28 D00qiJii.net
ARMv8のHPC拡張の詳細はHotChipsで出てくる、らしい
URLリンク(community.arm.com)

973:,,・´∀`・,,)っ-○○○
16/06/23 02:04:34.54 CAiTDlJ6.net
>>929
Xeonの粗利率は60%を優に超えるが、まさかそれを下回ったら赤字だとでも思い込んでるの?
Xeon PhiをなくしたらXeonが売れるわけではなくGPGPUクラスタにとられるだけ
4U筐体で1~2ソケットだけコントロール用にXeonを使ってもらったところで
結局ラック占有率も下がるしFabのキャパも埋められない

それで「赤字」だっていってたらPC向けなんてとてもやれませんよ
最下位モデルなら72コア中8コアまで不良が認められるから面積あたり効率では
PC向けのチップよりはるかに儲かるわけよ

974:,,・´∀`・,,)っ-○○○
16/06/23 02:39:48.20 CAiTDlJ6.net
Phiはダイ上に固定機能の割合が少なくコアもキャッシュもほとんどが冗長化されてるので
1割近くのコアの不良が認められる700mm^2程度のダイは実質的に100mm^2程度のスマホチップ並か
それ以上の歩留まり率を実現できる

その点富士通のSPARC64なんか全コア完動のチップしか出荷しないじゃん
あれで儲かるならIntelは大黒字もいいところだよ


Xeon Dの8コアが120mm^2ちょっとで581ドルくらいだっけ?
それを6倍しても3500ドルちょっとにしかならないから、下手するとKnights Landingよりも売上高低いかもね
そもそもマイクロサーバってそんなに大きな市場じゃない
でもやらなきゃ飯の種が消えると思うからやるんだ。

それを踏まえて>>929についてはソースの変更が認められないSPECfpで随分検討してるなあという印象
そもそも統的にスパコン向けのXeonの平均価格は4000ドル越えの最上位モデルではなく
1000ドル台のミッドレンジモデルが多用されてるから面積あたり価格でPhiが極端に安いということもない

975:Socket774
16/06/23 02:53:17.57 CuaaZZ8C.net
700mm2の36コアXeon作るのと何が違うんだか
2699 V4も24コアのうち22コアしか使ってないし

976:,,・´∀`・,,)っ-○○○
16/06/23 02:55:08.82 CAiTDlJ6.net
36コア作っても倍精度3TFLOPSに届かないでしょ?
お前の人生無駄だったね

977:,,・´∀`・,,)っ-○○○
16/06/23 02:56:49.34 CAiTDlJ6.net
メインストリームサーバでもHPCでもXeonの売れ筋は1000~1300ドル程度のモデルです

978:,,・´∀`・,,)っ-○○○
16/06/23 03:19:29.00 CAiTDlJ6.net
↑とは限らないか。価格性能比のスイートスポットは世代ごとに変わるし

今回のTop500初登場でBroadwell世代のXeonも複数採用されてるのだけど
一番採用数の多いのはCray XC40の2695 v4

URLリンク(a)


979:rk.intel.com/ja/products/91316/Intel-Xeon-Processor-E5-2695-v4-45M-Cache-2_10-GHz $2424.00 これダイは2699 v4と全く同じだろう? 売れ筋でもないハイエンドモデルを持ち出してXeon Phiが赤字のように印象操作する まさに屑の極みですなあ



980:Socket774
16/06/23 03:25:55.32 CuaaZZ8C.net
GPUに勝てないピーク性能、xeon以下のspecint

せいぜいatomの時のように夢見てればって感じ

981:,,・´∀`・,,)っ-○○○
16/06/23 03:37:08.77 CAiTDlJ6.net
FPGAやASICに勝てないGPUのディープラーニング性能に期待するよりはましだろう

982:Socket774
16/06/23 03:44:13.29 CuaaZZ8C.net
ホストCPUにしたら地獄

URLリンク(news.mynavi.jp)

今後も22nmのv3としか比較できないだろうね
v4と比較したら効率悪いのばれるから

983:,,・´∀`・,,)っ-○○○
16/06/23 04:00:23.99 CAiTDlJ6.net
なんだ、Xeon 2ソケット対KNL1ソケットか
むしろAtom72コアの割に健闘してるじゃん

稟議書書きたくなっちゃったじゃないか

984:Socket774
16/06/23 04:19:58.17 XVVYdrXB.net
AVX-512が付いたE5 v5が出ると、存在価値がほぼなくなる

985:Socket774
16/06/23 04:25:50.05 6mt18PpI.net
ディープラーニング見てると暗号通貨採掘を思い出す
CPU→GPGPU→FPGA→ASICと進化していった

986:Socket774
16/06/23 04:33:11.31 XfMQc344.net
しかもCPUからASIC化まで5年かからなかった
5年後にはCPUとGPUでディープラーニングやってる企業なんて無くなってるだろう

987:Socket774
16/06/23 06:04:58.70 IOdApqtp.net
そう?
君らの頭は固定機能なの?

988:Socket774
16/06/23 06:29:40.88 XfMQc344.net
メモリーは割と自由に書き換えられるけどロジックは固定っぽい

989:,,・´∀`・,,)っ-○○○
16/06/23 09:03:26.17 CAiTDlJ6.net
>>942
Purleyは理論値1TFLOPS(倍精度)に届くかどうかのレベルだし
MCDRAMを混載しないのでPhiでいうとFar Memoryしか存在しないようなもの
BYTES/FLOPSが釣り合ってなさすぎて科学技術計算には向かないよ

強いて言うなら1バイト・2バイト単位の整数演算や3入力のビット論理演算を
サポートするのでFPGA代替用途で多少

990:Socket774
16/06/23 09:15:19.21 Lffayl6z.net
>>923
日本も丸パクリでいいなら簡単よ、nVやAMDでほとんどを占めるGPUの特許もガン無視なら国産ハイエンドGPUだってすぐ実現できる

991:Socket774
16/06/23 09:17:49.50 wIT2HP1/.net
700mm2とか基地外だなww
Itaniumでも400~600mm2くらいだったろ(Tukwila除き)

992:Socket774
16/06/23 23:40:33.82 2hvNWDqE.net
Nehalem-EXが684mm2だった

993:Socket774
16/06/23 23:42:21.30 PWKimYLS.net
誰かが、割に合うなら1000mm2だろうが作るよwって言ってたなw

994:Socket774
16/06/24 02:24:08.35 JEW6btFj.net
ステッパーで一度に露光できる範囲が26mm*33mmなのでそれ以上大きいチップは作れない
分割露光って裏技もあるけどCPUでは使わないと思う

995:Socket774
16/06/24 02:29:03.39 o4+YPhEf.net
分割露光すれば最大で30センチウェハーのサイズまでのチップは制作可能

996:Socket774
16/06/24 02:31:58.98 o4+YPhEf.net
>>952
微細化プロセス向けのステッパではその範囲までしか露光できなくても、
そうでない旧世代プロセスじゃもっとでかい範囲を露光できるのはあるんじゃね?

とくに光学センサー用途等で、そのサイズよりでかいダイが当たり前のように製造されている

997:Socket774
16/06/24 03:07:58.36 WmCYlusv.net
>>917
HPLですら性能でないPhiよりマシじゃね


998: Stampede-KNL - Intel S7200AP Cluster, Intel Xeon Phi 7250 68C 1.4GHz http://top500.org/system/178914 inpack Performance (Rmax) 817.847 TFlop/s Theoretical Peak (Rpeak) 1,474.46 TFlop/s 484ソケットシステム、実効効率55%



999:,,・´∀`・,,)っ-○○○
16/06/24 12:45:05.81 hJbR3PVh.net
HPLの理論性能比なんてチップ依存ではなくソフトの最適化やネットワーク構成によるところが大きく、商用のデータセンターではXeonサーバで3割切って登録されてるものも珍しくない
ましてDellが納入したスパコンで実効性能比8割超えたことなんて一度もないんだが

ところで、先日富士通が発表した資料によれば、今回のXeon Phiは実用的な流体演算でBroadwell-Xeonの4倍の性能という数字が出てる

URLリンク(jp.fujitsu.com)

これはspec.orgにも公式スコアとして申請しているそうだ
既存のCPUコードをPhi向けにコンパイルするだけで動くのはGPUには出来ない芸当だが仮にできたとしても効率はたかが知れているだろう
この分野の流体演算はGPGPU使っても実効性能比一桁%出れば御の字と言われるレベルだから。

なんにせよ広帯域と大容量の両立は今後のスパコンのトレンドになるでしょうね
スループット特化型コアが広帯域メモリと大容量メモリを両立するのは単方向16GB/s程度しか出ないPCIeを経由してしかDDR4にアクセスできないGPUよりも遥かに優れたソリューション

AMDはCPU-GPU間に100GB/sの広帯域バスを付けることでKNL同等のNear/Farメモリモデルを実現しようとしてる
とりあえずx86サーバではNVIDIAはこの分野もう無理だからNVLinkでホストと接続できるPowerで頑張ってくれとしか

別にPCIeカード上にDDR4の拡張スロットつけてもいいと思うけどね?幅取るけど4枚くらいなら行けそうじゃない?

1000:,,・´∀`・,,)っ-○○○
16/06/24 19:38:45.74 qqqNL0o4.net
Bluecrab - Dell PowerEdge R730, Xeon E5-2680v3 12C 2.5GHz, Infiniband FDR14, NVIDIA Tesla K80
URLリンク(www.top500.org)

> Linpack Performance (Rmax) 505.1 TFlop/s
> Theoretical Peak (Rpeak) 874.56 TFlop/s

12コア×2ソケット×676ノード+GPUで実効効率57%
やっぱりDell先生だ、ものすごいブーメランを見たぜ


ところでPascalはKeplerよりBytes/FLOPS悪化してるから
Dell先生のシステムなら実効50%割れ普通に達成しそうだね

1001:,,・´∀`・,,)っ-○○○
16/06/24 19:58:09.71 qqqNL0o4.net
理論性能当たりの実効性能が高いのが素晴らしい(笑)という理屈に照らし合わせるなら
倍精度の性能が単精度の1/8しかなかった初代Teslaが最強のGPUということになるね

1002:Socket774
16/06/26 15:13:29.82 B0BDWvZb.net
$599 Softiron Overdrive 1000 Server is Powered by AMD Opteron A1100 64-bit ARM Processor
URLリンク(www.cnx-software.com)

1003:Socket774
16/06/26 15:14:42.17 B0BDWvZb.net
Softiron_Overdrive_1000Softiron Overdrive 1000 server specifications:

SoC – AMD Opteron A1100 series quad core ARM Cortex A57 processor
System Memory – 2x RDIMM slots fitted with 8GB DDR4 DRAM and expandable


1004: to 64GB Storage – 2x SATA 3.0 connector with one fitted with a 1TB HDD Connectivity – 1x GBase-T Ethernet USB – 2x USB 3.0 ports



1005:Socket774
16/06/26 19:35:53.95 9RE8Wu5g.net
amdのarmは化石だな

1006:Socket774
16/06/26 21:10:24.60 G7pDSHub.net
試作品作った時期がダメだったのに、更にそれから2年ぐらい引っ張ってる。
やる気があるならさっさとK12の16コアでも出せ。

1007:,,・´∀`・,,)っ-○○○
16/06/27 17:28:08.44 i1bN9U/u.net
逆に考えるんだ
大口の客がつかなかったからこそ28nmプロセスが値下がりするまで量産できなかったと

まあAMDに限らずARM系サーバSoCは大体そんな感じだよね

1008:Socket774
16/06/29 23:23:15.75 vFiM22KB.net
富士通、次期スパコンで「SPARC」ではなく「ARM」を選択
URLリンク(blog.livedoor.jp)

1009:Socket774
16/06/29 23:28:26.29 4ooO8qm7.net
>>964
さらばSPARC・・・

1010:Socket774
16/06/29 23:48:45.33 vFiM22KB.net
まあ1年前に話題になってたネタではあるんだけどね
スレリンク(jisaku板:87-番)n

1011:Socket774
16/06/29 23:55:12.09 F5LGI7Jw.net
まさにそこに書いてある94になったな

1012:Socket774
16/06/30 00:11:49.86 upyG7ZnC.net
HPC用に作るってのが間違いなんだよなぁ
ソフトウェア資産や生産性で一般向けチップに勝てない
cortexを使う方が良いんだよなぁ

1013:Socket774
16/06/30 00:25:26.67 QrPfIS8P.net
>>968
言いたいことはわかるがぶっといSIMD持ったコアを山程並べてる昨今のマルチコアHPCを見ると
Cortexが現状持ってるSIMDでは力不足でHPCベンダー側から動かないとどうにもならない。

1014:Socket774
16/06/30 00:28:29.26 JK7KzMFS.net
Sunwayは帯域よりレイテンシ重視で意図的にDDR3使ってるとか設計思想的に面白い話が出てきたな。

1015:Socket774
16/06/30 01:01:02.37 xrM41pG8.net
いくらコアをシンプルにしようとDP SIMD性能だけはアホみたいに上げなきゃいけない
さらにそれに見合ったL1Dの設計をしなきゃいけない
要はHPC向け専用命令とコアの専用設計は必須なのだ

1016:Socket774
16/06/30 03:52:22.91 wYZAcuaf.net
久々に後藤せんせの筆が走ってる

>後藤弘茂のWeekly海外ニュース
FinFET時代のAMDのGPU「Polaris」アーキテクチャ
URLリンク(pc.watch.impress.co.jp)

 Polarisのハードウェアスケジューラは、GPUの進化の次のステップだ。これまでのGPUは、CPUに制御されるコプロセッサで、タスクスケジューリング1つ取っても自立性がなかった。
それに対して、AMDアーキテクチャでは、Polaris世代でグラフィックスもコンピュートも、並列に柔軟にスケジュールできるようになっている。

 この先には、フルに自立制御できるGPUというゴールがあり、AMDは着実にその方向へと向かっている。
Polarisでのハードウェアスケジューラの拡張は、GPUというプロセッサの進化の次の段階を示す重要なステップだ。

1017:Socket774
16/06/30 04:13:56.90 aXREhEqB.net
HPC用CPUには、16chDDR4やそれ以上のHMC、HBM2、GDDR等の高帯域メモリを埋めるだけの
SIMD拡張命令の性能が必要

現状のcortexではまったく対応できない

1018:Socket774
16/06/30 04:19:18.63 aXREhEqB.net
>>972
で、高性能高ワッパ高コスパな"GPU"を求める客に
そんなの売って需要があるのかな?

汎用性を高めれば高めるほどワッパが悪くなるんだし

1019:Socket774
16/06/30 06:40:59.41 A0iSa6Lt.net
>汎用性を高めれば高めるほどワッパが悪くなるんだし

GPUの世代交代で毎回のように言われてる話じゃないかな
印象に残ってるのは
 GeForce4 → GeForce FX (2003年)
 G7x → G80 (2006年)
 G9x → GT200 (2008年)
RADEONも何回か言われてた気がする

1020:Socket774
16/06/30 07:35:56.11 PHWtj7g6.net
CPU組み込めばいいんじゃねぇのって毎回思うんだけど

1021:Socket774
16/06/30 07:56:15.09 aXREhEqB.net
次スレたてました

CPUアーキテクチャについて語れ 32
スレリンク(jisaku板)

1022:Socket774
16/06/30 08:53:14.91 dsnm5F22.net
GPU版Cellみたいになってきたな

西川善司の3DGE:「Polaris」世代のRadeonは何が新しいのか(1)GPUアーキテクチャを丸裸にする

URLリンク(www.4gamer.net)

従来,ほとんどドライバ内で行われていた(≒CPUで実行処理されてきた)GPUスレッドのスケジューリングと発行を,PolarisではGPU内部に新設された「Hardware Scheduler」(以下,HWS)で実行するようになった。

このHWS,「Hardware」とは言うものの,実のところ,GPU内部に実装された専用CPUにプログラムを実行させる仕様であることが明らかになっている。AMDによれば,この実装のため,ドライバなどのアップデートによって,HWSソフトウェアは適宜アップデートが可能だという。
 なお,HWS専用としてCPUコアにどんなプロセッサを実装しているかまでは,AMDは明らかにしていない。

TrueAudio NextではGPUで音響処理をソフトウェア実行することに

1023:Socket774
16/06/30 09:33:09.84 PHWtj7g6.net
R600のころはコマンドプロセッサにmips系積んでるって言ってた記憶

1024:,,・´∀`・,,)っ-○○○
16/06/30 22:15:49.94 dlnXdOkc.net
NVIDIAに対抗してARMコアでも使ってるんじゃない?

1025:Socket774
16/07/01 12:21:34.61 48AdYhf5.net
うめ

1026:Socket774
16/07/01 15:36:51.90 jxzH/L/Y.net
デバッグはどうするんだろうね。

1027:Socket774
16/07/02 08:49:52.68 Qx6qR5cS.net


1028:YAMAGUTIseisei
16/07/02 18:30:03.43 wKpjPrX2.net
>>916
面積

1029:Socket774
16/07/03 07:43:01.93 uQgZb6dl.net
うめてんてー

1030:Socket774
16/07/04 10:18:13.28 3nGSnWyj.net
うめうめ

1031:Socket774
16/07/05 10:00:27.02 AmO47g17.net
すごい雨

1032:Socket774
16/07/06 04:57:00.49 uDGXQ8/6.net
うめ。

1033:Socket774
16/07/07 02:57:01.68 w8QElZbj.net
ume

1034:Socket774
16/07/07 03:14:13.13 w8QElZbj.net
990get

1035:Socket774
16/07/09 06:51:16.41 Xc5SIa24.net
上っ面の数値にとらわれて本質を見られない
だからお前はいつまでたってもだめなんだよ

1036:Socket774
16/07/09 20:50:48.35 XBuvKtuK.net
突発性発狂か

1037:Socket774
16/07/10 21:47:44.43 Vo1Rwmx5.net
うめよふやせよ

1038:Socket774
16/07/10 23:58:13.05 9jcN77v8.net


1039:Socket774
16/07/17 23:15:25.45 /mHT8vqe.net
バッテリーの革命まだかよ
先端プロセスの製造で寿命1000倍に上げてくれよ
充電は年1回で済ませたいんよ

1040:Socket774
16/07/18 11:25:12.19 e09QMJ4C.net
空気中の酸素と湿度と化学物質で発電する方が現実的では

うめうめ

1041:レトリック君
16/07/18 22:00:35.45 JL7rUcDD.net
もう、ワロタ ワロタw

【国際】ソフトバンク、約3.3兆円で英ARM Holdingsを買収―CNBCが伝える★4©2ch.net

1042:Socket774
16/07/18 22:18:32.96 4bLMJT8K.net
アカギだかカイジだかで「倍々で賭けていけば今までの負けを全部取り返せる」みたいなアホな話があったの思い出した
まあそれを実行できるうちはええけど倍々で買えるもの無くなった時どーすんのっつー

1043:Socket774
16/07/18 22:21:42.02 T31ha0gU.net
よろしい、ならば戦争だ

1044:Socket774
16/07/18 22:27:25.36 iMwDsaaG.net
はげ

1045:1001
Over 1000 Thread.net
1台のマシンが組み上がりました。。。
新しい筐体を用意してくださいです。。。。

         自作PC板@2ch URLリンク(anago.2ch.net)

life time: 244日 11時間 35分 4秒

1046:1002
Over 1000 Thread.net
2ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


──────────
《プレミアム会員の主な特典》
★ 2ちゃんねる専用ブラウザからの広告除去
★ 2ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
──────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
URLリンク(premium.2ch.net)
URLリンク(pink-chan-store.myshopify.com)


1047:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch