16/01/13 23:07:17.66 z1l0da8g.net
> Bulldozerも出した当時はハイエンドだったし
> むしろFP性能は最初から大敗が確定してるという意味では相対的に最低性能の新CPUです
たかだか350mm2程度のダイサイズでハイエンドはねーよw
実際のハイエンドはMCMして16コアにしたOpteronだしな
今回ポラリスはFury後継のエンスージ向けを最初から出すのが確定してるし、Zenも一般向けでも8コア、Opteron向けだと32コアを出すのを最初から公言している
オマケに16コア+8Tfops GPU+HBM2 32GBのHPC向けAPUも今度の年末年始で出してくる
1020:Socket774
16/01/13 23:08:15.31 212LAzWu.net
>>975
AVXの巨大版がGPGPUでは?
ただ、共有メモリでなかったことで、メモリー間のデータコピーに時間がかかったのと、cpuに標準装備されてなかったから、あまり使われてなかっただけで
HSA準拠でその欠点がなくなるので、AVXよりは小回りは効かないが大きな問題ならApuが生きてくる。
1021:Socket774
16/01/13 23:09:40.03 z1l0da8g.net
> これが売れなかったらなんやねんこれ、なっちまうからな
Maxwell2の倍以上のワッパでHBM2も先に対応する時点で売れまくるのは確定している
1022:,,・´∀`・,,)っ-○○○
16/01/13 23:11:46.72 mVlkSU0m.net
> AVXの巨大版がGPGPUでは?
ぜ~んぜん違うよ
> ただ、共有メモリでなかったことで、メモリー間のデータコピーに時間がかかったのと、
> cpuに標準装備されてなかったから、あまり使われてなかっただけで
いくらメモリ空間を統合しようが
CPUコアに内蔵されてて並列タスク起こすのに0サイクルで処理できるCPUと
オフコアのGPUじゃ使い勝手がまるで別物ですが
1023:Socket774
16/01/13 23:12:18.18 ZV1Z09YY.net
>>981
NVの排斥はINTELとの協調路線だと思うがね
IRISがあるからNVはもういらない、Apple製品にも積まれてない
HPCでもバッティングしてるしな
とはいえASUSやMSIなどのグラボメーカーとの繋がりは強力だね
まぁ一蓮托生だしな
1024:Socket774
16/01/13 23:13:18.31 /NpROeu1.net
だからメモリー間のデータコピーに時間がかかるからGPGPUは使われてない!とか寝言言ってるのはファンボーイだけだって
1025:Socket774
16/01/13 23:14:11.75 z1l0da8g.net
AVX vs GPGPUとかアホな議論だよな
APUならどちらも高性能に実行できるし、DX12やOpenCLなら有効に活用されていく
排他じゃなくて連携して動作させていくようにIntelもNvidiaも動いている
1026:Socket774
16/01/13 23:17:16.33 212LAzWu.net
>>986
違う根拠は?
ソース付きでね?
バーストデータ転送からの超並列処理という点では同じだろ?
1027:,,・´∀`・,,)っ-○○○
16/01/13 23:17:43.29 mVlkSU0m.net
IntelのIvy Bridge以降ではRDRAMD命令が加わり、オフコアのハードウェア乱数ユニットを
共有してるけど1回呼び出すだけでも200サイクルくらいかかっちゃいますね。
SIMD実装したMersenne Twisterだと1個の整数値あたり一桁サイクルで処理できるので
モンテカルロ法用途では基本的にCPUのソフト処理のほうがはるかに速い。
1028:Socket774
16/01/13 23:18:13.44 t1XWmjLF.net
>>989
>APUならどちらも高性能に実行できるし
どちらも低性能だから売れなかったわけだが
APUは、もう少しどっちかに振った製品造ったほうが勝てるんじゃないのかねえと思った
1029:,,・´∀`・,,)っ-○○○
16/01/13 23:19:59.95 mVlkSU0m.net
>>990
x86命令列に直接埋め込めて汎用レジスタから直あるいはL1Dでダイレクトにデータ交換できるのと
何万サイクルかけてドライバ経由でタスク起こすのと同じになるわけがないだろ
1030:Socket774
16/01/13 23:21:26.37 212LAzWu.net
>>988
画像や音声のリアルタイム処理なら、GPGPUを使ったディープラーニングで使われるよ?
1031:,,・´∀`・,,)っ-○○○
16/01/13 23:23:30.21 mVlkSU0m.net
メディアエンコードやレイトレーシングは分岐が必要な処理はスカラで処理して並列化はSIMDで処理
ベストケースでもLLC経由でしかデータのやりとりができないGPUなんかと投げ合うより
CPUコア内で完結したほうが遥かに速い。
もう結論は出てるの。
いくら内蔵GPUが早くなろうがそういった分野でCPUから分けられる仕事はない
1032:Socket774
16/01/13 23:23:46.24 212LAzWu.net
>>993
だから大きな処理と言ってる。
小さな問題ならレイテンシーうんねんはわかるが。
1033:,,・´∀`・,,)っ-○○○
16/01/13 23:24:16.95 mVlkSU0m.net
> 画像や音声のリアルタイム処理なら、GPGPUを使ったディープラーニングで使われるよ?
全然わかってない
1034:Socket774
16/01/13 23:25:06.40 212LAzWu.net
>>995
だからSIMDのところを置換できるだろ?
1035:,,・´∀`・,,)っ-○○○
16/01/13 23:26:00.28 mVlkSU0m.net
>>996
大きな処理なんて増えないと思うよ?クラウド活用したほうが合理的だし
積極的にデスクトップPC向けにソフト開発するベンダーもすくない。
1036:Socket774
16/01/13 23:27:01.08 iI/NF27L.net
>>992
>どちらも低性能だから売れなかったわけだが
まずCPUが自作では性能低すぎてあんまり使う奴いないi3なみの性能
そして、GPUはGDDR5のエントリVGAより性能劣るし
1037:1001
Over 1000 Thread.net
1台のマシンが組み上がりました。。。
新しい筐体を用意してくださいです。。。。
自作PC板@2ch URLリンク(anago.2ch.net)
1038:1002
Over 1000 Thread.net
2ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
──────────
《プレミアム会員の主な特典》
★ 2ちゃんねる専用ブラウザからの広告除去
★ 2ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
──────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
URLリンク(premium.2ch.net)
URLリンク(pink-chan-store.myshopify.com)
1039:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています