10/05/03 10:28:17 HxA7+t56
でっかいシングルスレッド特化のコアとちっさいマルチスレッド特化のコアをくっつけてOpenCLとかを使って状況に応じて処理してくれる
そんな夢のようなMPU?Fusion?はいつになるのやら・・・
836:,,・´∀`・,,)っ-○○○
10/05/03 10:34:20 IS3+pcsX
>>835
カーネルの設計がめんどくさいことになるので世界的OSメーカーが嫌がる、に9000ゲイツ
837:Socket774
10/05/03 10:41:25 HxA7+t56
ありもので作ったLlanoやSandyBridgeみたいに、とりあえずくっつけましたじゃつまんないんだよなー
ヘテロジニアス時代に突入するにあたり、OpneCLやDirectComputeが鍵をにぎっているんじゃないかなーと思う
838:,,・´∀`・,,)っ-○○○
10/05/03 10:59:33 IS3+pcsX
だからそれAMDじゃなくてIntelのメニーコア計画そのまんまじゃねーか
839:Socket774
10/05/03 11:04:31 /Hlqh1v0
くっつけましたじゃつまらんからAVXやLNIが来るんだよ
840:Socket774
10/05/03 11:05:55 HxA7+t56
でもHavok飼い殺しだぞ?大丈夫かいな
841:Socket774
10/05/03 11:10:58 j16ZFihn
HavokはAMDへの嫌がらせで買ったんだろw
842:Socket774
10/05/03 11:16:58 EIMq3gvg
いずれにせよ、ただCPUとGPUの距離が変化することと
プログラミングモデルをの変革を同一視してた脳足りんアム虫が消えるのはよいことだ
843:Socket774
10/05/03 11:17:58 HxA7+t56
AVXやLNIでGPUとCPUの処理の分担ができればおもしろいな
SandyとIvyにはそういったことは期待してないが可能性のあるHaswellに期待しておこう
844:Socket774
10/05/03 11:25:22 HxA7+t56
>>842
MACオタ君、いつおれが同一視したんだ!
845:Socket774
10/05/03 11:29:24 JEBObePC
CPUとGPUの距離が変化することと命令セットの変革を
同一視してたやつ編虫はいっぱいいたよな。SSE5(笑)
846:Socket774
10/05/03 11:38:47 ZM2vHUci
それは某知的障害者のいつもの妄想だろう
847:Socket774
10/05/03 11:38:50 HxA7+t56
AVXがでるまではそう思っていたやつ多かっただろうな~
848:,,・´∀`・,,)っ-○○○
10/05/03 11:45:59 IS3+pcsX
より正確に言うとAVX互換路線を受け入れるまでは沸いてた
849:Socket774
10/05/03 11:47:17 HxA7+t56
AVX互換路線によってFusion構想の遅れに拍車がかかったともいえるな
850:Socket774
10/05/03 11:56:29 ZM2vHUci
SSE5でシェーダ向けの命令を採用と発表
↓
ゴキブリが「SSE5を使うとGPUがx86コアに吸収される」とお花畑
↓
「それはアム厨 ◆Fh2IQtNvbw の妄想だ」と同一人物コテ内でなすり合い
↓
「アム厨はいっぱい居ます」さらなる譫妄
こういうことか
851:Socket774
10/05/03 12:10:45 HxA7+t56
つーか単発多くねーか?
いままでダラダラ妄想なり予想なり反論なり戯れ言なり書いてきたがけっこうかんにさわっちゃった気がするなw
はずれたら、さえないジョークとして流してもらいたいよ
852:Socket774
10/05/03 12:34:42 1FVTTEaY
>超古代技術
あぁ、AMDのvery low performance wordね
853:,,・´∀`・,,)っ-○○○
10/05/03 12:37:23 IS3+pcsX
「AVXは転ける」とまで吹いてた奴すらいたが
あの例の発表で一気にスレの空気が変わったな
まさにオソウシキシヨ オソウシキシヨ(by ヨドバシカメラ)
854:Socket774
10/05/03 12:42:59 HxA7+t56
DX11は転ぶとか言ってたやつらもいまやマンセーだからなー
人の心変わりのなんとはやいことよ
855:Socket774
10/05/03 12:56:29 ZM2vHUci
Intel
場つなぎでAVXを作るもすぐにLNIに進めて一家心中
AMD
場つなぎでAVXに対応するもGPGPU隆盛と共にゴミ箱行き
結論
AVXはコケる
856:Socket774
10/05/03 13:01:49 1FVTTEaY
>GPGPU隆盛
へ?
857:,,・´∀`・,,)っ-○○○
10/05/03 13:03:49 IS3+pcsX
隆盛(笑)
858:Socket774
10/05/03 13:09:06 HxA7+t56
Intel・・・CPUだけでごりごりいきたい
AMD・・・CPUとGPUをバランスよく共存させたい
NVIDIA・・・死にたい
Intelが一番させたくないのは下二つが推し進めるGPGPUの台頭でしょ
だからLNIやAVXをつくったんだと思ったんだが
859:Socket774
10/05/03 13:10:07 ZM2vHUci
ゴキブリは何がしたいんだか解らん
まあいつも通りなんだけど・・・
大阪語はどうか知らんが一応日本語での意味↓
URLリンク(dic.yahoo.co.jp)
860:Socket774
10/05/03 13:23:51 G24S9EcF
AVXもGPGPUもどう転ぶか分からんしなあ
まあAMDはどっちにでも動ける結構良いポジションを取ってるとは思う
861:,,・´∀`・,,)っ-○○○
10/05/03 13:41:19 IS3+pcsX
LNIとAVXはエンコードフォーマットも主用途も全く別物だよ
たとえばゲームの物理演算結果を分岐条件としてリアルタイムにフィードバックしたい場合どうする?
GPUでやったら、飛び散った破片にCPU側で当たり判定をくわえたい場合にいちいちCPU-GPU間で同期とらんといかん。
当たり判定を行うCPUコア自身が物理演算をやったほうがいいが、物理演算をこなせるだけの相応のスループットは必要。
だからこそCPUのベクタ演算性能を引き上げる意味が生まれる。
隆盛(たかもり)くんはそんなこともわからないんだからクズなんだな
862:,,・´∀`・,,)っ-○○○
10/05/03 13:52:40 IS3+pcsX
ゲームに限った話じゃないが、GPGPUなんて一方通行のトランザクションを何百並列もこなすような用途でしか使い物にならんよ。
クロックサイクル単位ですぐに分岐にフィードバックできるCPU内蔵のSIMDとは全然使い勝手が違う。
863:Socket774
10/05/03 13:53:24 dVn7MQgP
>>852
おまえが「超古代技術」を理解していないことはわかった。
864:Socket774
10/05/03 14:04:36 ZM2vHUci
ゴキブリはLNI=GPU New Instruction だとか何かだとしたいようだが
これはIntelの作ったものだから勝手に変えるなよ
ウンコ「俺がIntelだ」 違います
URLリンク(pc.watch.impress.co.jp)
Gelsinger氏は次のように語る。
「アーキテクチャ上は、どちら(Larrabeeコアを統合する方法とPC&サーバー向けCPUコアにLNIを実装する方法)も可能だ。Larrabeeで小さなコアを選んだのは、コア数を増やすためだ。我々が、LNIを、より大きなCPUコアの製品に加えることもできることは明白だ。
GPGPUの役割も勝手に変えてるし
ウンコ「俺がAM・NVだ」 違います
865:Socket774
10/05/03 14:09:22 LPfTtt3d
日本語が不自由な方の書き込みはご遠慮願います
866:Socket774
10/05/03 14:28:40 HxA7+t56
整数演算が2/3、か
867:,,・´∀`・,,)っ-○○○
10/05/03 14:36:29 IS3+pcsX
LNIは8ビットや16ビットのパックドオペレーションが省かれているので少なくとも従来SSEやAVXでできるような
文字列処理なんかには向かないからな。
SAD命令なんかも用意されてないのでMPEG2/H.264のエンコなんかには向かんね。
ただ一部のフィルタ処理くらいならできそう。
てかあの説明聞いた人少ないのかな?
Intel自身、WindowsホストからLarrabeeコアを直接触るようなプログラミングモデルは想定してないんだよね。
ホストとは独立したデバイス専用のOS(BSDベースらしい)がx86-GPUコアに仕事を割り振る。
メモリ空間もホストとは論理的に独立。
問題は統合後だが、OSのハイパーバイザ機能を使ってゲストOSとして動かすんだろう。
仮想マシン間のデータ通信は例のSVMでね。
というわけで、Larrabeeがロードマップに再浮上しても、AVXは従来コア/従来OS用、LNIはLRB/LRB-OS専用の
SIMD命令としてしばらくは併存する。
そもそもAVXで256ビット化されてる命令はまだ全然少ないのに512ビットの話をするなんて気が早い。
868:Socket774
10/05/03 14:48:33 dVn7MQgP
>>866
陰厨最後の心の拠り所だな。
869:Socket774
10/05/03 14:50:21 jJStLJOx
>そもそもAVXで256ビット化されてる命令はまだ全然少ないのに512ビットの話をするなんて気が早い。
1024bit拡張まで嬉々として論じてた団子がそれを言うか
870:Socket774
10/05/03 15:09:58 1FVTTEaY
>おまえが「超古代技術」を理解していないことはわかった。
おいおい、キモオタ脳はやめてくれよ
871:Socket774
10/05/03 18:08:36 HxA7+t56
あったあったこれだこれ
URLリンク(pc.watch.impress.co.jp)
> 「BulldozerはAPUになる能力を持っている。つまり、ヘテロジニアスコンピューティング機能を統合できる」(Akrout氏)。
> おそらく、AMDの戦略は次のようなものだ。今後のワークロードで、増えることが予想される浮動小数点演算のニーズの多くは、CPUに載せる
>GPUのようなデータ並列型エンジンで吸収する。その方が効率的だからだ。CPUコア側の浮動小数点演算機能の拡張は、APU化を前提として、や
>や控え目に抑える。Bulldozerのもう1つの重要なコンセプトはヘテロジニアス化にあることを考えると、アーキテクチャの選択が納得できる。
Bulldozer+GPUになるだろうねって書き込んだら団子に馬鹿にされたのを思い出したよ
872:Socket774
10/05/03 18:17:46 1FVTTEaY
どうやってつかうの?
873:Socket774
10/05/03 18:26:21 HxA7+t56
将来的にどうやって使うかを模索中だろう
874:Socket774
10/05/03 18:36:50 ZM2vHUci
隆盛(たかもり)くんに熱を上げ過ぎて
日本語の辞書も読めなくなった異次元ホモには
何を言っても理解出来まい
875:Socket774
10/05/03 18:37:26 HxA7+t56
URLリンク(tech.ascii.jp)
•Horizontal integer add/subtract AVXはあくまで浮動小数点演算で、整数演算はサポートしていないのでこれを追加。SSSE3で定義されたHorizontal Addition/Subtractionとは機能が異なる。
•Integer multiply/accumulate 整数のMAC(積和演算)命令
•Shift/Rotate レジスターに対するビット操作命令
•Integer compare 整数の比較命令
•バイト置換 レジスター内のデータ置き換え命令
•条件分岐 ビット単位での条件分岐命令
•数値変換 浮動小数点と整数の変換命令
•半精度浮動小数点変換 GPUなどで使われる16bit浮動小数点と32bitの単精度浮動小数点の変換
どうやって使っていくかはこの中にはない?
876:Socket774
10/05/03 19:03:16 HxA7+t56
URLリンク(pc.watch.impress.co.jp)
> GPUなどのSIMD型アクセラレータの上での実行に適した文法記述のみを処理し、それ以外の記述は一般的なCコンパイラへ渡して、汎用CPU向
>けにコンパイルする。既存のプログラムをアクセラレータへ移植する際に、必要となるソースコードの変更を最小限に抑えられるという。
ん?これなのか?よくわからん・・・
877:Socket774
10/05/03 19:06:49 qJGfLvAB
最近は便利な時代になったもんだねぇ。
昔は掛け算や割り算すら自力で組んだものなのに。
878:Socket774
10/05/03 19:11:21 ZM2vHUci
どうやって使っていくかってったって
昔x87でコプロ等を動かしたように
x86ベクタ命令でGPUを使うようにしていくってだけだろう
んで半精度浮動小数点変換がGPU向けシェーダ向け命令と言われてるらしいけど
今のところはDirectXや>876みたいにx86とそれ以外が混在する形でも特に問題無いだろうし
879:Socket774
10/05/03 20:00:45 qJGfLvAB
>>875
まんまじゃん
880:Socket774
10/05/03 20:07:53 1FVTTEaY
GPUで整数演算?
881:Socket774
10/05/03 20:34:56 HxA7+t56
>半精度浮動小数点変換がGPU向けシェーダ向け命令と言われてるらしいけど
>•半精度浮動小数点変換 GPUなどで使われる16bit浮動小数点と32bitの単精度浮動小数点の変換
URLリンク(ja.wikipedia.org)
>ポインタ渡しおよびfloat型との相互変換関数経由でのアクセスに限定されるIEEE 754-2008準拠の半精度浮動小数点数(half型)
できすぎだろ。だれか「同一視すんな脳足りんあむ虫(笑)」ってつっこんでくれ
882:Socket774
10/05/03 20:46:31 BqlxumSv
もっと親しみ易い名前にしてください。
それから、モデルナンバーは矛盾が無いよう、フカシ過ぎないようもお願いします。
883:Socket774
10/05/03 21:05:16 qJGfLvAB
>>880
うーん、微妙だね。
>>871に記述されている
>GPUのようなデータ並列型エンジンで吸収する。
と言うのがGPUそのものを指しているのかBulldozerでは別途その様なエンジンを積むのか、
はたまたどちらとも対応出来る様にするのかがこの文言からでは見て取れない。
まぁ、そんな感じのもをBulldorzer内に積むって事で、使う側は余りその辺の事を意識しなくてもいいんじゃない?
884:Socket774
10/05/03 21:09:07 NXAR4h6O
後藤の記事でどっかにいまのラデオンのアーキだと
汎用的ではないから
新しいものを考えてるのかもしれない的な発言があったな
885:Socket774
10/05/03 21:13:51 dVn7MQgP
速攻HD6000とかその次のHD7000とかに移行するだろ。
886:Socket774
10/05/03 21:16:35 rAkTch9B
NI既に発表してるし
買収後初の新アーキ
887:,,・´∀`・,,)っ-○○○
10/05/03 21:32:29 IS3+pcsX
>>877
x86は16ビット時代はおろかご先祖様の時代から乗除の命令ありますが何を言ってるやら。
888:Socket774
10/05/03 21:35:52 5NMNMLRl
S.Islandsはゲーム性能落ちそうだな
AMDはダイサイズを大きくても300mm^2前半に落ち着けてきそうだし
889:Socket774
10/05/03 21:36:45 qJGfLvAB
>>887
何をそんな最近の話をしているの?
890:,,・´∀`・,,)っ-○○○
10/05/03 21:36:46 IS3+pcsX
>>881
専用命令じゃなくてICC11あたりからIntelでも組み込み関数として提供してるけど
それ要はメモリ帯域の節約が目的でGPU云々は関係ない
半精度だと同じバンド幅なら単精度の2倍のデータをフェッチできる。
それ以上でもそれ以下でもない。
891:Socket774
10/05/03 21:40:31 6erCVigD
Southern Islandsはシェーダー部は据え置きでアンコア部のみの刷新
性能が大きく上がることはないにしても性能が下がることはないだろう
Northern Islandsでシューダー部に手が入るが
28nmでの投入みたいだからSouthern Islandsより性能が下がるとは考えづらい
892:Socket774
10/05/03 21:55:24 ZM2vHUci
>>869
昨日は統合GPUの帯域帯域うるさかったのに今日は無関係と言い
今日の隆盛(たかもり)くん以前にはどこだったかPCレビューサイトの記者で一喜一憂してたり
こういうのがゴキブリの「反論してるようで同意」系の日課なんだろう
893:Socket774
10/05/03 22:04:32 qJGfLvAB
>>887
>x86は16ビット時代はおろかご先祖様の時代から乗除の命令ありますが何を言ってるやら。
16ビット時代以前の御先祖様ってZ80や8080の事を言ってるの?
へぇ~、俺は当時6502を使ってたから余り詳しくは無いけど因みに何て命令?知ってたら教えて欲しいわ
894:Socket774
10/05/03 22:04:38 hE/vqcl6
Bulldorzer(8コア,3GHz,65W,32nm,quadチャンネル)これで5万円。
895:Socket774
10/05/03 22:10:25 x0WO28it
妄想乙
896:,,・´∀`・,,)っ-○○○
10/05/03 22:17:01 IS3+pcsX
>>869
簡単なことだよ、AVXのVEXプリフィクスは拡張は将来的に1024ビットまで拡張するキャパがあるが(それはそれで遠い先の話)
そもそもSSEをベースとしないLNIはその延長線にないってこと。
AVXはSSEのOpcode Mapを再利用してる。
(66|F3|F2) 0F~が拡張オペランドなどの情報を含んだVEXになっただけで表引きの方法はSSEのそれと共用している。
LarrabeeのSIMD命令のOpcode Mapはシェーダ・ストリームプロセッサ用に0から組まれてる。
もちろんVEXフォーマットである必要もないわけだ。
そもそもVEXのエンコードルールじゃそのまんまでは1オペランド当たり5ビット+3ビットのマスクレジスタを表現できない。
つまりAVXではなく新たにLNI用のプリフィクスが用意される。
#x87のOpcode表ってさ、2バイト目にかなり余裕があるの知ってた?
897:Socket774
10/05/03 22:24:17 qJGfLvAB
>>896
>>893
あれだけの事言っといて返事無しは無いでしょ?
898:,,・´∀`・,,)っ-○○○
10/05/03 22:27:42 IS3+pcsX
>>893
10進演算補助命令あったじゃん。
あれって末尾の「0A」(=10)の部分を別の数字に替えれば任意の即値との商/剰余が求められるよ。
899:Socket774
10/05/03 22:31:21 gGqwngh7
NGネームに見る価値はないが、それに噛み付きたいだけの奴も見苦しいな。
消しやすいようにいっそコテでも使ってくれ。
900:Socket774
10/05/03 22:32:33 P3rkQN/h
そしたらこのスレが更地になっちゃう><
901:,,・´∀`・,,)っ-○○○
10/05/03 22:36:25 IS3+pcsX
そうだな何の見る価値もないアホスレ化だな
902:Socket774
10/05/03 22:36:50 qJGfLvAB
>>898
へぇー、そうなんだ。で、乗算は?
903:,,・´∀`・,,)っ-○○○
10/05/03 22:42:38 IS3+pcsX
定数の割り算ができるってことは逆数使うことで掛け算もできるね。
ま、普通はやらないが。
くれぐれも年寄り自慢はやめてくれ。
904:Socket774
10/05/03 22:43:51 5NMNMLRl
AMDの次世代CPU/GPUについて語ろう 第36世代
で、立ててみるか
905:Socket774
10/05/03 22:46:09 NXAR4h6O
VLIWはやめるのかな…
906:,,・´∀`・,,)っ-○○○
10/05/03 22:48:14 IS3+pcsX
まあ、それでなくともZ80互換で乗算・除算命令が備わってる8ビットCPUは数多く存在、と
もちろんIntelは8086からだが
907:Socket774
10/05/04 00:02:12 /igD5oSR
>>904
AMDの次世代APUについて語ろう
でいいんじゃない?
908:Socket774
10/05/04 00:06:24 6aiCbZNj
>>894
それはないな
8コアはシングルダイで2chだよ
12/16コアがMCMで4chになる
他は大体合ってる
909:Socket774
10/05/04 00:31:00 XC4Kfdmf
>>904
>>907
この二つを踏まえると、スレタイ変更は無しでOKじゃね?
910:Socket774
10/05/04 03:53:34 4Py0QhOB
AMDの次世代について語ろう
911:,,・´∀`・,,)っ-○○○
10/05/04 04:24:34 gNo/9BNI
>>871
その数週間後の記事面白いよ。
整数パフォーマンスを犠牲にする? AMDの「Bulldozer」
URLリンク(pc.watch.impress.co.jp)
整数重視なのか犠牲なのかどっちだよっていうww
民主党のごとくぶれる後藤の論調
912:Socket774
10/05/04 04:37:40 G6l9bFoo
整数演算を犠牲にして、浮動小数点演算は控えめなんだろ。
見事なヴェイパーウェアだと関心はするがどこもおかしくはない。
913:Socket774
10/05/04 08:08:57 9FrH3Gp5
intelはnvidiaみたいに今後良いとこ取りしてコアが複雑化しすぎて自爆しないのだろうか