【AMD】RadeonのGPGPUの整備を願うスレ【NVIDIA】at JISAKU
【AMD】RadeonのGPGPUの整備を願うスレ【NVIDIA】 - 暇つぶし2ch644:,,・´∀`・,,)っ-○○○
09/12/13 01:46:04 Gw3F5ZKy
>>642
ばーかばーか
URLリンク(software.intel.com)

645:Socket774
09/12/13 01:46:45 yKnayMSN
>>641
さっきから独り言を言っているようにしか見えない俺は団子をNG登録済み。
一々相手にする必要はない。殆どの住人は見限ってる。

646:Socket774
09/12/13 01:53:48 lViooUoI
>>643
どこら辺が妄想なのか指摘することぐらいは出来るよね。

647:,,・´∀`・,,)っ-○○○
09/12/13 01:54:22 Gw3F5ZKy
具体的な数字を示してない

648:,,・´∀`・,,)っ-○○○
09/12/13 01:57:01 Gw3F5ZKy
バタフライ演算用のロジックも備えてない(というかペナルティが生じる)し、CPUに差を詰められるばかりで先がない。
まさか公称1.2GFLOPSが出せると思ってる訳じゃあるまい?



649:Socket774
09/12/13 01:58:10 UcM+1jOt
>>644
で、そのページのどこに実機でも200GFLOPS近い数字が出せるって書いてあるんだ?

650:,,・´∀`・,,)っ-○○○
09/12/13 01:59:00 Gw3F5ZKy
>>649
お前には公開されてないよ

651:Socket774
09/12/13 02:00:27 0aJajCkK
ID:Gw3F5ZKy

652:,,・´∀`・,,)っ-○○○
09/12/13 02:04:39 Gw3F5ZKy
SIMD演算でFFTやる上でネックになりがちなのは俗にバタフライ演算といわれる水平方向の値移動。
URLリンク(upload.wikimedia.org)

しかしまさにこの通りのオペレーションを実行する命令があるんだわAVXには

653:Socket774
09/12/13 02:20:29 lViooUoI
随分進んでしまったようで。

>>647
Cypressは32KBのLDSとアドレッシング可能なレジスタをSIMD Core毎に持ってるから
4000点FFTを同時に20並列実行出来るんじゃねってことで。

>>648
> バタフライ演算用のロジックも備えてない
アドレッシング可能なレジスタ、CPUのSIMDと違って別々の処理が出来るStream Core。
別に要らなくね?

654:,,・´∀`・,,)っ-○○○
09/12/13 02:22:48 Gw3F5ZKy
たぶんRadeonが一番苦手なオペレーションじゃないかな。
CUDAでも同期プリミティブ使いつつShared MemoryにストアしてロードとかしないといけないのでLoad/Storeネック。

LarrabeeでのFFTはかなり素直に書けたんだぜ。おまいらはバカにしてるけど。
4近傍要素に限れば積和演算1命令にswizzle操作を畳み込める。L1キャッシュへのストアなしでな。

655:,,・´∀`・,,)っ-○○○
09/12/13 02:23:31 Gw3F5ZKy
> > バタフライ演算用のロジックも備えてない
> アドレッシング可能なレジスタ、CPUのSIMDと違って別々の処理が出来るStream Core。
> 別に要らなくね?

やっぱわかってないな

656:,,・´∀`・,,)っ-○○○
09/12/13 03:12:55 Gw3F5ZKy
一応書いておくか。

要素数が少ないほどベクトル内の要素移動の頻度が相対的に高くなりその分の演算リソースを
FP演算にまわせなくなるので、原理的にFLOPS数は落ちる。
しかも、最初の数ステージは積和か積差かでプレディケートしないといけない。

こういう要素があるゆえに、一般的にはSIMD演算器のベクトル長が長いほど相対的に不利で、
FFTの要素数がSIMD長を大きく超えてはじめて実効効率があがっていく。
(ただしメモリ帯域がネックにならない範囲で)

174GFLOPSでるのはベストケースで、これより短いと、あからさまにネックになる。

何故こうなるかは仕様書読んでみればわかる。
というかシミュレータなり実機なりで動かしてみれば良い。

657:,,・´∀`・,,)っ-○○○
09/12/13 03:17:55 Gw3F5ZKy
プレディケートっていうか定数パターンとのXORで符号反転すれば十分か。
それでもその分だけはFLOPS数は殺がれることは間違いないが。


658:Socket774
09/12/13 05:52:40 U9qni5tE
スレ開けたら団子だらけでふいたwww

659:Socket774
09/12/13 06:37:51 g7dw5jYu
とりあえず10240bitじゃデカスギル
chromeを見習って出直せ

660:Socket774
09/12/13 08:08:47 00KLpItY
chromeは32bit spを8個まとめたものを1グループとして
その中にcommon register fileとL1 cacheがある
これがnv的に言うとSMだな

それが4つあるのがchrome400/500シリーズ
S3はこれをshader poolと呼ぶ、更にこれに直結する形で
L2 cacheとstream bufferが着く
ちなに固定機能群と、shader poolの演算群は独立の並列構造

粒度は特に語られてはいないが、32bit*8sp*4cycleとしても最大でも1024bit
5400Eで書かれてるように128bit(32*4sp)単位でなら512bit
ま、サイクルは4以下の可能性もあるので、もっと小さいかもな
クソ長い固定機能パイプラインから外れた構造だとレイテンシも短かろう
元がSSEなのが理由かは知らんが、1サイクルでの積和算はサポートしない

この構造だと、何気にcacheはライトバックっぽいんだが
あの高効率はそれが原因か?

661:Socket774
09/12/13 10:57:45 u5EvRrBG
目立たないけど凄いやつ

特にアピールもしない
分かるやつだけが寄っていく

662:Socket774
09/12/13 22:12:40 5ni2gXrg
Google Chromeの話かと思って頭ひねってしまった・・・
Chromeって、S3の方かよw

663:Socket774
09/12/14 00:26:58 YDh/0X6R
名前が一番かっこいいのもChrome。

664:Socket774
09/12/14 01:42:50 XK+8IS33
タクロー

665:Socket774
09/12/14 09:24:11 J64TBleT
団子って基本的に妄想前提で理論付けしてくるよね

666:,,・´∀`・,,)っ-○○○
09/12/14 23:12:59 kgBSmHff
だから実測してみろよ

667:ラデ厨 ◆TX.Dz2qTUo
09/12/14 23:45:37 ZF/7D2OO
10240bitじゃ紙芝居よりも遅いだろうね(・´ω`・)

668:,,・´∀`・,,)っ-○○○
09/12/14 23:48:55 kgBSmHff
ソフトが存在してないこと自体が競争力がないことの証明


669:Socket774
09/12/15 08:06:12 hGxQ/WOZ
団子さんお元気ですか?
ララビーが失敗した今、あなたは何の味方で何を敵にしているんですか?

670:,,・´∀`・,,)っ-○○○
09/12/15 08:33:55 7VClrwiG
消去法でCUDA

671:Socket774
09/12/15 08:44:17 4XaGvXFR
逆神だな。
HPC向けのララビー残るのに乗り換える意味が分からん。


672:Socket774
09/12/15 11:27:37 R6Wx7Qr6
存在しないから俺の理論が正しいとかどこの厨房ですか?
まぁどこにでもいる俺が知らないから有名(実行可能)とかありえないとか本気で思ってる池沼なんだろうけど

673:Socket774
09/12/15 12:45:26 e+JQJy8W
じゃあ存在させてみせろよ。
絵に描いた餅など美味くはないぞ。

674:Socket774
09/12/15 12:59:16 B8geLIZN
>>672
じゃあお前はカタログスペックに釣られて存在してもいないアプリ性能の最強を唱えるマンチキンか。
発想がCellマンセーしてたゲハ坊レベル。


675:Socket774
09/12/15 13:12:41 R6Wx7Qr6
毎回この手の煽りする奴湧くけどまだ発展途上の技術に妄想で決め付けてるのがオカシイって書いてるだけだぞ
自分じゃ技術開発も出来ないくせに文句だけは一人前だな
とくに>>674なんてどこにマンセーしてる意見が載ってると言うんだ?
ホントケチつけるのだけが生き甲斐なんだな

676:Socket774
09/12/15 13:23:08 e+JQJy8W
> 発展途上の技術
要するに現時点では使い物にならないってことだろ

677:Socket774
09/12/15 13:26:25 e+JQJy8W
言い出しっぺが動かないんじゃ発展もしようがないよ?>ID:R6Wx7Qr6


678:Socket774
09/12/15 13:27:21 pXJGMsEM
つまり団子さんの敵はOpenCLとDirectX11ということですか?
それともCUDA Cのことではないから敵ではなく、環境としてのCUDAということで、
敵はATI Streamということですかね。

679:Socket774
09/12/15 17:10:44 cCvgrZeN
発展途上っていか
今のstreamは、真面目にCPU統合しようとした場合
切り捨て確実だよ

680:Socket774
09/12/15 19:12:42 98ViIECX

最高のバカ

681:Socket774
09/12/15 20:40:02 cCvgrZeN
阿保か
10240bitの演算粒度のまま統合してどうするw
CPUとの命令セットの統合はどうするの?
モッサリVLIWのままか?
有り得ないなからw
あ、お絵かき専用だから良いのか
スマンね

682:Socket774
09/12/15 20:58:38 4XaGvXFR
なんだ10240bitの人か。

683:Socket774
09/12/15 21:14:12 cCvgrZeN
10240bitは単なる事実

684:Socket774
09/12/15 21:24:54 nT/l3bnJ
VILWが続くと本気で思ってるんだ

685:Socket774
09/12/15 21:34:31 4XaGvXFR
VLIWは今の密度で演算器を詰め込むためには必要だろ。
粒度変えるのは簡単だが、VLIW構成変えるのは
結局シェーダの新規設計になる。



686:Socket774
09/12/15 21:48:05 cCvgrZeN
当たり前だろ
はっきり言って統合に際しては
AMDのGPUは全て作り替える必要がある
真っ先に捨てられるのがモッサリVLIW

687:Socket774
09/12/15 21:54:40 15x8MbSR
いつも文章一緒だから
もう10240bit乙とでも書いておけw

688:Socket774
09/12/15 21:55:07 8+1RVXjN
逆にすぐにでも統合できそうな構造なのはS3だね

689:Socket774
09/12/15 22:07:31 cCvgrZeN
まだ10240bitが理解出来てないのね

じゃ64要素(単位Pixel)でいいやw

690:ラデ厨 ◆TX.Dz2qTUo
09/12/15 22:47:14 hZmYQfIy
アムダはS3とフュージョンすれば大勝利だね(・´ω`・)

691:Socket774
09/12/15 23:00:34 r1WSeCB3
ID変えてまで主張することなのか

692:,,・´∀`・,,)っ-○○○
09/12/15 23:46:02 7VClrwiG
>>679
お前はバカですか?アホですか?屑ですか?
好きか嫌いかではなく、使えるか使えないかだ。
CUDAは比較的マシなだけだ。

693:Socket774
09/12/16 00:51:29 0YJkovHT
火曜日の最高の馬鹿はID:cCvgrZeNか。OK.把握

694:Socket774
09/12/16 01:42:18 HTvzrumj
ATIVideoConverter使ってみたけど謳い文句は嘘つきとしか言いようが無い出来だな
GPUloadは10%以下でCPU使用率が上がるし、大体読み込めるファイルに限りがありすぎだろ特定のaviとwmvぐらいしか読み込まないとかなんだよこれは・・・
まだbadaboom使ってた方がマシ読み込めるファイルもまあまあ多いし進行速度がプレビュー画面で表示されるしなにより複数起動できて同時進行でエンコ出来るのがいい
と俺は思った

695:Socket774
09/12/16 05:42:48 NKB5iRrP
>692はアンカーミスだろ
>678への

696:Socket774
09/12/16 06:07:32 B63RfcW3
URLリンク(pc.watch.impress.co.jp)
>Bulldozerの実質的な開発リーダーだったMoore氏が、現在、APU(Accelerated Processing Unit=FUSION)を担当しているところも意味深だ。
>AMDの現在のGPUは、NVIDIAと比べると、ずっと既存グラフィックスに最適化している。AMDの勇ましいヘテロジニアスコンピューティングのかけ声とは裏腹に、
>GPUアーキテクチャ自体は保守的だ。もしかすると、AMDは現在のGPU開発チームとは別に、CPUのアーキテクトが中心になったデータ並列コアの開発を進めているのかもしれない。

これってcentaurがS3の演算器作ったのとおなじだな

697:Socket774
09/12/16 06:24:10 NKB5iRrP
いつも後追いだな
今のGPUも切り捨て確定

698:Socket774
09/12/16 07:21:58 gMUebggu
そんな苛めんなよ

699:Socket774
09/12/16 07:33:49 NKB5iRrP
単なる事実

700:Socket774
09/12/16 08:06:53 33JD+Gs6
↑最高のバカ

701:Socket774
09/12/16 09:05:24 FViH9jtf
次は新しいアーキテクチャって言われてるのに

どこまでも今の状況にこじつけたいのね

702:Socket774
09/12/16 09:17:00 Tcct9O59
いいものを作ってくれるなら後追いでもいいよ。
作れもしないよりは遥かにね。

703:Socket774
09/12/16 09:24:20 BFP7Qysj
おっとLarrabeeの悪口はそこまでだ

704:Socket774
09/12/16 10:09:38 NKB5iRrP
今のままで使い物になると思い込んでる
馬鹿が多いこと

705:Socket774
09/12/16 10:27:17 FViH9jtf
単純にGPUの延長じゃ厳しいからね

706:Socket774
09/12/16 11:32:16 Y+dhuOrf
コード一行も書かないニートが巨額の研究資金と最高級の頭脳の結晶たるGPU/CPUを語るのってかっこいい。

707:Socket774
09/12/16 11:39:49 Tcct9O59
Fermiが順調に延期しまくってるけど、大量受注にはどう対応するんだろう。
中には今年中の発売で契約していたものもあるだろうに。

708:Socket774
09/12/16 12:03:31 FViH9jtf
延期のお知らせを出すだけでしょ

709:Socket774
09/12/16 12:05:00 4vG9ObY4
鳩山乙

710:Socket774
09/12/16 16:33:31 Tcct9O59
毎月延期のお知らせしてそうだ。

711:Socket774
09/12/17 20:20:04 Ett78KgA
GT200シリーズはDirectX10.1対応!11なんて対応しても今の時点で恩恵なんか全くないからいいんだよ!消費電力?そんなものは何枚も積まなければ気にしなくていいよ!ベンチマーク?そんなのキチガイの趣味でしょ!?

そうだ!今流行りのGPGPUだけどなんちゃらストリームはへぼいし対応ソフトも少ないらしいね!それに比べてCUDA!やっぱりGPGPU使うならCUDAだよね!

だからラデなんかよりゲロが一番いいんだよ!わかった?もう一度言うよ!?ゲロが一番いいんだよ!

ゲロ最高!ゲロ最高!ゲロ!ゲロ!ゲロ!

ゲロゲロゲロゲロゲロゲロゲロおおおおおお!!!!!

712:ラデ厨 ◆TX.Dz2qTUo
09/12/18 22:36:51 9ICG0znu
カエルの鳴き声がやかましいね(・´ω`・)

713:Socket774
09/12/18 22:43:54 +n/Ky674
もう止めて!!
ゲフォのライフはマイナスよおおおおおおお!!!!
そこまで進化したら、プーアルを最終形態のフリーザが、ガチボコリするようなもんだよ・・・

714:Socket774
09/12/19 00:05:02 MTNmnj8o
とあるスレで見つけた
URLリンク(www.comtec.daikin.co.jp)

MachStudioは3Dワークステーションのグラフィックアクセラレータとして
最適なパフォーマンスをもたらすATI FirePro V8750と共に出荷されます。

V8750=HD4870

715:ラデ厨 ◆TX.Dz2qTUo
09/12/20 21:55:42 YlA+yxnL
それで?(・´ω`・)

716:Socket774
09/12/20 23:15:06 ZRBXC3MJ
>>715
枯れたゲボ使うお前にゃ無縁だよww

717:Socket774
09/12/21 23:21:29 giTSEqYb
今のメッセージは「おにいちゃん」と「まんこ」
を高校生に言わせたかっただけのメッセージだな!

718:Socket774
09/12/22 01:15:41 Oo9tMpw5
やっとβがとれたがHD2xxxと3xxxは切り捨てか

719:Socket774
09/12/22 02:03:02 vutx6JxQ
>>571
Cata9.12でHD4830でDirectCompute動くようになった
D104665

720:Socket774
09/12/22 18:47:43 6GybTGqN
rtgenがラデ上で動くようにならないかなー

721:ラデ厨 ◆TX.Dz2qTUo
09/12/24 17:55:58 IttyBCgq
無理無理(・´ω`・)

722:Socket774
09/12/25 21:50:08 DPFKFvOj
スパイウェア解析ツールとな

rtgenを使うのではなく自分でビルドすればいいのに


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch