GPGPU#2

GPGPU#2at TECH

GPGPU#2 - 暇つぶし2ch1:デフォルトの名無しさん
07/08/29 17:08:58
いつの間にやらCPUを超える演算性能を持ってしまったGPUに計算させてみるという
GPGPUについて語りましょう

前スレ
GPGPU
ｽﾚﾘﾝｸ(tech板)

関連スレ
ｽﾚﾘﾝｸ(tech板)

参考リンク
総本山? gpgpu.org
URLﾘﾝｸ(www.gpgpu.org)
CUDA
URLﾘﾝｸ(developer.nvidia.com)
GPUをCPU的に活用するGPGPUの可能性
URLﾘﾝｸ(pcweb.mycom.co.jp)

2:デフォルトの名無しさん
07/08/29 19:13:45
イチオツ

3:デフォルトの名無しさん
07/08/29 21:13:23
人がいまだに固定シェーダでうろうろしてる間に、Cで叩けるようになっていたなんて。
あまりにも話がCUDA

4:デフォルトの名無しさん
07/08/31 12:07:10
CUDAはCから手軽に移植できて、割と簡単にGPUに計算させることができて便利ではある。
しかし、いざチューニングしようとするとどこをどう調整すればいいのか判り難くて困る。

ってことで、理想速度が出せれば別だけどそうでないならWoodcrestの方が大抵速くて余り役に立たない。
尤も、CPUがある程度遅いとなるとこれはかなり強力なツールと言えよう。
なんせ、Woodcrestより遥かに安い(8600GTS搭載ボードなら3万弱)わけだし。

一方CBEと較べてみても、(8600GTでさえ)PS3のメインメモリと同じだけのメモリをボード上に積んでいるわけだ。
おまけにSPEで動くプログラムは作るだけでも結構手間が掛かる。それを考えると、もうPS3はどうでもいいやw

5:デフォルトの名無しさん
07/09/01 23:53:31
CellBEの方が遥かに自由度が高い，っつーか
GPGPUは当にアクセラレータでしかないだろ

6:デフォルトの名無しさん
07/09/02 02:30:58
超越関数が使えないのがなぁ。只のアクセラレータでしかないGPUでさえ使えるのに。
それだけで、移植の手間が随分違ってしまう。

7:デフォルトの名無しさん
07/09/02 05:40:54
晒しage

8:デフォルトの名無しさん
07/09/02 11:55:53
ぜんぜん伸びねぇなｗｗｗ

9:デフォルトの名無しさん
07/09/02 17:36:39
おーっし、俺がGPU利用したアプリ書いてやる
今からパソコン屋行ってフレームバッファ買ってくるから、ちょっと待ってろ

10:デフォルトの名無しさん
07/09/02 17:41:22
わ～い10ゲットだ！
>>9がんばって～！

11:デフォルトの名無しさん
07/09/03 04:27:27
どっかにCUDAのサンプルソースの森とか、CにおけるK&R
みたいな入門書無いの～？

12:デフォルトの名無しさん
07/09/03 09:09:35
>>11
CUDAのSDKについてくるサンプルソースじゃダメか?
あれはある意味、宝の山だぞ。

まぁ、私程度でよければ知りたい内容によってはここで回答しても構わんが。

13:デフォルトの名無しさん
07/09/03 13:38:19
CUDAでの基本をまとめてくだしあ

14:デフォルトの名無しさん
07/09/03 14:26:49
>>13
・元のプログラムがあるなら移植前にきちんと整理
・GPU上で動く関数からはメインメモリを参照できない。どのデータをGPUに渡すか熟考すべし
・変数名に工夫するなどして、CPU側メモリかGPU側メモリか常に意識するように
・仮令GPUボードを持っていようとも、馴れないうちはエミュレータも活用しよう
・その為にもデバッガを含めて開発環境にも慣れておこう
・サンプルからノウハウまで、それなりに資料はそろっているからきちんと読めば途は拓ける

15:デフォルトの名無しさん
07/09/03 17:27:24
>サンプルからノウハウまで、それなりに資料はそろっている
URLをお願い

16:デフォルトの名無しさん
07/09/03 19:07:40
>>15
URLﾘﾝｸ(developer.nvidia.com)

サンプルはSDKに含まれている。
取り敢えず、bitonicSortとかsimpleTexture辺りは短いから読みやすいかと。
ノウハウはCUDA Programming Guide 1.0に詳しい。
英語が苦手だったら勉強するチャンスだと思ってがんばってくれ。
そうそう、用語の偏りが激しいので要注意で。

17:デフォルトの名無しさん
07/09/03 19:13:15
CUDAなんかやってもMUDA

18:デフォルトの名無しさん
07/09/03 23:53:16
CUDAできるカードCUDAさい。
ていうか、どの型番のカード（GPU）からCUDAできるの？

19:デフォルトの名無しさん
07/09/04 00:27:28
>>18
GeForceならこの辺。
--
Core Clock (MHz) Memory Clock (MHz) Auxiliary Power Connectors Number of Slots
GeForce 8800 Ultra 684 1161 2 2
GeForce 8800 Ultra 612 1080 2 2 ←リファレンス
GeForce 8800 GTX 575 900 2 2 ←リファレンス
GeForce 8800 GTS 540 840 1 2
GeForce 8800 GTS 500 800 1 2 ←リファレンス
GeForce 8600 GTS 710 1000 1 1
GeForce 8600 GTS 675 1000 1 2
GeForce 8600 GTS 675 1000 1 1 ←リファレンス
GeForce 8600 GT 590 900 0 1
GeForce 8600 GT 540 700 0 2
GeForce 8600 GT 540 700 0 1 ←リファレンス
GeForce 8500 GT 450 400 0 1
GeForce 8500 GT 450 400 0 1 ←リファレンス
--
QuadroFXは忘れた。

で、お値段は8600GTSで3万弱、8600GTなら1.5万くらいからメモリ増強版の2.5万程度まで。
それより上にしても並列数は増えるけどクロックは速くならないからピーク性能を狙わないなら
コストパフォーマンス的にもサイズ的にも8600GTS/GTでいいかと。
尚、電源に余裕がなくて補助電源コネクタからの供給ができないなら8600GT以下で。

20:デフォルトの名無しさん
07/09/04 01:11:14
CUDAらん! 実にCUDAらん!

21:デフォルトの名無しさん
07/09/04 11:26:30
個人的には
>ていうか、どの型番のカード（GPU）からCUDAできるの？
っていう質問が出てくること自体、凄く不思議なんだが。
おもいっきり、プログラミングガイドにかいてあるけど。

22:デフォルトの名無しさん
07/09/04 11:37:45
プログラミングガイドを読んでないから出てくるんだろ
何が不思議なんだよ

23:デフォルトの名無しさん
07/09/04 16:08:48
英語って時点でばっくれる奴がいることも忘れんでください

致命的だけどな

24:デフォルトの名無しさん
07/09/04 16:36:38
>>23
英語だからよく判らないってのは納得できるのだけど、
全体眺めるだけでAppendixAにスペック書いてあるの位は目に留めてほしいなぁ。

25:デフォルトの名無しさん
07/09/04 16:43:52
英語→うわっめんどくせ→2chで聞いたほうがはえーや

という奴だろうな
似たような奴が研究室にいて

「なー、この関数の使い方教えてよ」
とググれば済むことまで効いてくる。俺が必死こいて組んでるときに
それで一度ケンカになったが

ググれば済むことを効いてくるやつの神経わかんねーぐちすまね

26:デフォルトの名無しさん
07/09/04 17:02:45
ぐぐるのも面倒いんだろうきっと

27:デフォルトの名無しさん
07/09/04 21:27:49
B型？

28:デフォルトの名無しさん
07/09/06 11:13:19
血液型と性格に関係はありません。

それはそうと、CUDAでBitslice DES実装したのないかな。

29:デフォルトの名無しさん
07/09/06 12:42:19
>>28
そうとも言えないよ。アイザック・アジモフに拠れば、「そういうもんだ」という環境で育てばそうなるそうだから。

30:デフォルトの名無しさん
07/09/06 17:08:22
B型だと思ったらA型でしたー

でもそんなの関係ねぇ！

31:デフォルトの名無しさん
07/09/06 18:11:38
血液型信仰（笑）

32:デフォルトの名無しさん
07/09/07 04:32:57
ベクトルプロセッサというのが良く分からん
マルチプロセッサと何が違うの?

33:デフォルトの名無しさん
07/09/07 04:48:32
ベクトルプロセッサは同時に複数のデータを並列して処理するプロセッサ
それに対して一つのデータを処理するのがスカラープロセッサ
マルチプロセッサは一つのコンピュータ内にプロセッサを複数搭載している事

34:デフォルトの名無しさん
07/09/07 04:49:57
っ[SIMD]

35:デフォルトの名無しさん
07/09/07 04:51:51
SIMDはプロセッサ内におけるベクトルプロセッサ的な要素

36:デフォルトの名無しさん
07/09/07 05:07:52
>>33
>ベクトルプロセッサは同時に複数のデータを並列して処理するプロセッサ
>それに対して一つのデータを処理するのがスカラープロセッサ
>マルチプロセッサは一つのコンピュータ内にプロセッサを複数搭載している事

こんな夜中にレス付いて吹いた
スカラープロセッサ*マルチプロセッサ=ベクトルプロセッサ
にはならないの?

>>34
>SIMD
Single Instructionってどのくらいまでならsingleなの?
50行くらいの関数までならsingleなの?
まさか、addとかmovとかxorというレベル?

37:デフォルトの名無しさん
07/09/07 05:16:54
＞スカラープロセッサ*マルチプロセッサ=ベクトルプロセッサ
＞にはならないの?
ならない
＞まさか、addとかmovとかxorというレベル?
うん

38:デフォルトの名無しさん
07/09/07 06:05:18
あらかじめ大量のデータを用意しておいて、
その大量のデータを別の大量のデータに変換する事が一発で出来るという事?

うーん、逐次処理には向かないのかなぁ?

39:デフォルトの名無しさん
07/09/07 07:53:54
まぁ大体そういう事だね。
最近のほとんどのパソコンのプロセッサにはスカラーとベクトル両方の仕組みが搭載されていて、
適材適所で使い分けられるようになってる。

40:デフォルトの名無しさん
07/09/07 08:00:18
>>38
高々4つずつ同時に処理してもSIMD。

41:デフォルトの名無しさん
07/09/07 08:39:31
8192bit VLIWとかならベクトル処理も並列処理も同じアーキテクチャで
実現できるな。並べる命令が同じものならベクトル処理、違うものなら
並列処理。

42:デフォルトの名無しさん
07/09/07 11:06:59
GPUでzip解凍すればよくね？

43:デフォルトの名無しさん
07/09/07 15:14:46
違う命令が並べられるならMIMD

44:デフォルトの名無しさん
07/09/07 16:18:32
GPGPUはSPMD

45:デフォルトの名無しさん
07/09/12 11:34:54
うへぇ、CUDAの文法がまるっきりCのそれだからつい、騙されて梃子摺ったぜ。
デバイス側のメモリを巧く使うのは難しいな。
しかも、それが動かしてみないと判らないし、エラーメッセージもunspecified failureだし……

46:デフォルトの名無しさん
07/09/12 14:06:51
昨日の洗脳集会に参加した人は素直に挙手しなさい。

47:デフォルトの名無しさん
07/09/12 15:19:24
行きたかったけど行けませんでした。
資料ください

48:デフォルトの名無しさん
07/09/12 15:25:56
>>46
申し込んだのに定員オーバーで断られた俺が来ましたよ

49:デフォルトの名無しさん
07/09/12 21:36:10
tokyo-uのやつ？どんな話だったん？

50:デフォルトの名無しさん
07/09/12 22:09:05
>>49
簡単なレポならここに
URLﾘﾝｸ(pc.watch.impress.co.jp)

51:デフォルトの名無しさん
07/09/12 22:18:23
全く行く価値が無かった
単なる宣伝に終始

家でUIUCのコースをﾏﾀｰﾘ聞いたほうが何倍もマシ
URLﾘﾝｸ(courses.ece.uiuc.edu)

52:デフォルトの名無しさん
07/09/12 22:40:07
>>45
kwsk
資料がプログラミングガイドしかないからどんな情報でも欲しい。

53:デフォルトの名無しさん
07/09/14 00:20:58
URLﾘﾝｸ(journal.mycom.co.jp)

>これをTeslaではWarp(ワープ)と呼んでいる。

ワープ（笑

54:デフォルトの名無しさん
07/09/14 00:35:45
日本語ではワープでもいいんじゃないか。

55:デフォルトの名無しさん
07/09/14 00:57:39
>>53
どこが笑いどころなの？

56:デフォルトの名無しさん
07/09/14 01:07:59
>>53が笑い者

57:デフォルトの名無しさん
07/09/14 01:20:03
OS/2でも笑えるんじゃないか。うらやましいヤツメ

58:デフォルトの名無しさん
07/09/14 02:32:34
ヲープ（笑）

59:デフォルトの名無しさん
07/09/14 10:34:46
まぁ外人相手にワープと言ってもﾊｧ?な顔されるだろうな

60:デフォルトの名無しさん
07/09/14 11:18:49
トレッキーに通じないわけが無かろうが。

61:デフォルトの名無しさん
07/09/14 20:58:34
CUDAって結局8800以外に何で使えるの？
この後出る予定の8700とか対応するんだろうか。話題ぜんぜん出てこないし

62:デフォルトの名無しさん
07/09/14 21:05:23
個人的には
>CUDAって結局8800以外に何で使えるの？
っていう質問が出てくること自体、凄く不思議なんだが。
おもいっきり、プログラミングガイドにかいてあるけど。

63:デフォルトの名無しさん
07/09/14 21:18:16
俺もそれ見たけど、8600では使えないと書いてるところがあった

64:デフォルトの名無しさん
07/09/14 23:25:41
CUDAはそもそも研究者のオナペットなんだから8800くらい買えよ、安いもんだろ
まさかCUDAが一般に普及するとでも思ってるとか？ねーよｗ

65:デフォルトの名無しさん
07/09/15 00:16:06
8800だけならすぐ廃れるのか

66:19
07/09/15 01:25:26
正直、8800GTXの消費電力と占有スペースを考えたら8600GTSか、いっそ補助電源も要らない8600GTでいいと思う。
#テストするだけならね。コストパフォーマンスも高いことだし。
勿論、チャンピオンデータ狙いなら8800Ultraで頑張ればいいと思うが。
つーか、このスレにも一覧書いておいたのになぁ……

67:19
07/09/15 01:26:52
って>63や、どこに8600はダメと書いてあったのかね?

68:デフォルトの名無しさん
07/09/15 07:38:54
>>66
>>19は実際に動かした情報を基にした一覧なのか？

69:19
07/09/15 08:36:22
>>68
ドキュメントに基づいた情報。

実際に動かしたのは次のボード。
--
ELSA 988GTX
ELSA 988GTS
ELSA 786GTS
ELSA 786GT
--
ちなみにTeslaボードも入荷次第テストする方向。

70:デフォルトの名無しさん
07/09/15 11:08:22
常駐者だったのか。つか、ここ何人くらいで回ってるんだろうw

71:19
07/09/15 13:51:44
常駐というより、巡回しているだけだけどね。
折角だから、nvccの出力(ptx)でも張ってみようか。先ずはソース。
--
#include <cstdio> // WIN版だとリンクにvcを使う所為かiostreamを巧く使えない
const int NofThreads = 256; // 32以下なら1warp内で完結、最大512
const int NofBlocks = 256; // 物理ブロック数をオーバーしたら時分割処理される
// device側コード
#include <cuda_runtime.h>
__device__ float dVals[NofBlocks * NofThreads]; // >45も書いている、device側のメモリ
__global__ void foo(float ratio)
{
float vs, vc;
unsigned offset = blockIdx.x * blockDim.x + threadIdx.x; // この右辺の変数で何番目のデータスレッドか判る
__sincosf(offset * ratio, & vs, & vc); // sincosf()の組み込み命令版
dVals[offset] = vs * vs + vc * vc;
}
// host(CPU)側コード
const float M_PI = 3.14159265358979323846f;
int main()
{
foo<<<NofBlocks, NofThreads>>>(M_PI / (NofBlocks * NofThreads)); // ここで並列起動
float hVals[NofBlocks * NofThreads]; // host(CPU)側メモリ
// この場合はcudaMemcpyFromSymbol()を使用(cudaMalloc()した場合はcudaMemcpy())
cudaMemcpyFromSymbol(hVals, dVals, sizeof(* hVals) * NofBlocks * NofThreads);
for (unsigned ic = 0; ic < NofBlocks * NofThreads; ++ic) {
printf("%g ", hVals[ic]);
}
fputchar('\n');
return 0;
}
// 所要時間はCore2Duo 6320 @ 1.86GHzで1秒掛からない程度
// シンプルすぎて時間測定には不向きなので要注意

72:19
07/09/15 13:53:50
んで、こっちがnvcc -ptx -O3した出力の抜粋
--
.global .align 4 .b8 dVals[262144];

.entry foo
{
.reg .u32 $r1,$r2,$r3,$r4,$r5,$r6,$r7,$r8;
.reg .f32 $f1,$f2,$f3,$f4,$f5,$f6,$f7;
.param .f32 __cudaparm_ratio;
.loc 12 10 0
$LBB1_foo:
.loc 12 15 0
cvt.u32.u16 $r1, %ctaid.x; //
cvt.u32.u16 $r2, %ntid.x; //
mul.lo.u32 $r3, $r1, $r2; //
cvt.u32.u16 $r4, %tid.x; //
add.u32 $r5, $r4, $r3; //
cvt.rn.f32.u32 $f1, $r5; //
ld.param.f32 $f2, [__cudaparm_ratio]; // id:31 __cudaparm_ratio+0x0
mul.f32 $f3, $f2, $f1; //
cos.f32 $f4, $f3; //
sin.f32 $f5, $f3; //
mul.f32 $f6, $f5, $f5; //
mad.f32 $f7, $f4, $f4, $f6; //
mov.u32 $r6, dVals; //
mul.lo.u32 $r7, $r5, 4; //
add.u32 $r8, $r6, $r7; //
st.global.f32 [$r8+0], $f7; // id:32 dVals+0x0
exit; //
} // foo
--
# 解説要るなら言っとくれ

73:デフォルトの名無しさん
07/09/15 14:33:50
8800だと、128の演算が並列で行われるのでしょうか？

74:デフォルトの名無しさん
07/09/15 15:22:58
>>73
warpを理解しろ

75:デフォルトの名無しさん
07/09/19 18:13:38
cudaで遊ぼうとしてまして、8400GSでサンプルを動かして速さを実感したのですが、
cudaを使ったフリーソフトとかソフトを集めてるサイトとかありませんか？
手始めにmp3エンコーダーのlameのDCT部分をCUFFTで置き換えられないかなと
勉強中なのですが、すでに誰かやってそうで。
公式フォーラムで、Diracデコーダーを実装した人が20倍速くなったと書いてるのでわくわく

76:デフォルトの名無しさん
07/09/19 18:46:15
あー、8400GSでも動くのか。
しかし、WoodcrestXeonだと恐らく速くなりそうもない罠。

77:デフォルトの名無しさん
07/09/21 23:03:28
Cgのことはこちらで聞いて言いのでしょうか
URLﾘﾝｸ(up-sv.ath.cx)
こういうコードがサンプルであったのですが、中のfor文は動くのでしょうか？

現在GPUが無いところでソースだけ打ち込んでいたのですが少々気になって

78:デフォルトの名無しさん
07/09/22 00:21:54
>>75
x264に手を入れてくれｗ

79:デフォルトの名無しさん
07/09/25 01:08:16
CUDA死亡確認
URLﾘﾝｸ(pc.watch.impress.co.jp)

80:デフォルトの名無しさん
07/09/25 02:11:48
PS3でリアルタイムレイトレーシング、デモアプリ公開

IBM：Interactive Ray Tracer for Cell Broadband Engine
URLﾘﾝｸ(www.alphaworks.ibm.com)

IBMより、Cell Broadband Engineで動作するインタラクティブレイトレーシングのデモアプリがリリースされました。
PS3もしくはIBM QS20 Cell blade上のLinuxで動作します。

リアルタイムレイトレーシングのデモ動画はすでに4月に公開されていたものですが、今回デモアプリが公開されたことで、家庭のPS3でも（Linuxの知識があれば）手軽？に試すことが出来るようになりました。

パフォーマンスは、QS20 1台で1080p 1.6M Triangles時にフレームレート2.7fps程度、QS20を7台使って17fpsとなっています。
ということはPS3を1台使用した場合のフレームレートは1.0fpsぐらいでしょうか、公開されている動画ではPS3を3台使用しています。

URLﾘﾝｸ(pocketnews.cocolog-nifty.com)

81:デフォルトの名無しさん
07/09/25 02:47:39
今後数年以内に産業資本主義自体が滅びるからcudaとかps3とか無駄

82:デフォルトの名無しさん
07/09/25 07:04:10
Larrabeeの行く末ってCellが示してる気がするわ。
描画は遅くて使えない
FahじゃX1650XTにも勝てない

83:デフォルトの名無しさん
07/10/02 14:52:31
>>80
PS3を3台ってどうやってデータ渡してんの?
先を予測して時分割でやってんのか。

84:デフォルトの名無しさん
07/10/02 15:08:24
>>83
スレ違い。どう見てもCELLスレ向けです。
--
Cellプログラミングしちゃいなよ2
ｽﾚﾘﾝｸ(tech板)

85:デフォルトの名無しさん
07/10/09 20:50:22
最近CUDAで遊び始めた者です。
ひとつの変数に複数のスレッドから値を足し込むことをうまくやりたいのですが、
スレッド間の同期が取れていないためか、おかしな値が出てしまいます。
（例えば C = A[ty][tx] * B[tx][ty] ）
for文を使うとうまくいくのですが、このfor文がボトルネックになってしまい
困っています。

何かうまい方法を知っている方いれば教えていただきたいです。

86:デフォルトの名無しさん
07/10/09 21:50:00
>>85
【GPGPU】NVIDIA CUDA質問スレッド
ｽﾚﾘﾝｸ(tech板)

そのAやBは、ReadOnlyなのか? だったら読み込みに問題はないと思うんだが。

87:デフォルトの名無しさん
07/10/10 18:21:34
85です。
例に挙げた式、間違ってました。
C += A[ty][tx] * B[tx][ty] でした。申し訳ない。
for文を使う場合は for(i=0;i<BS;i++) C += A[ty][i] * B[i][ty]; こんな感じです。
iはint型変数、BSはブロックサイズです。
for文を使わないと、各スレッドがそれぞれのタイミングでCの値を参照し、計算結果
を足しこんでいるのでしょうか、Cの値が毎度おかしなものになります。
AとBはReadOnlyです。

86さんの誘導先に似たような事例がありましたので参考にしようと思います。
それにしても、スレッドの並列処理に比べてfor文があまりにも遅くて驚きました。

88:デフォルトの名無しさん
07/10/10 22:57:16
すいませんCgのことでちょっとお聞きしたいのですが

3次元テクスチャを使ってデータをやりとりしてるのですが
どうもメモリが解放されていなくて、徐々にメモリ使用率が上がっていってしまいます

普通CPUで3次元テクスチャを使った場合はメモリ使用量は一定なので
GPU側の問題と踏んでいるのですが

同じような症状の方いましたら、解決方法教えてください

89:デフォルトの名無しさん
07/10/10 23:19:54
すいません↑のは

普通にCPUで～
です

nvidiaのサンプル（opengl two texture sample）を実行してみたところ
animationをさせるとメモリが増加していきました。。。
これは仕方が無いのでしょうか…

90:デフォルトの名無しさん
07/10/10 23:43:41
>>87
Cが一箇所だとどうしても並列動作できないねぇ。

もしできるのであれば乗算の結果を(その場で積算せず)リニアにグローバルメモリに保存しておき、
別の関数でその値をまとめるとかいっそ、CPUに転送してCPUで集計するとか。

ぶっちゃけ、そういう積算が必要なくなるようにアルゴリズムを見直すのが一番だけどね。

# どうせなら誘導先に書いて欲しかった。

91:デフォルトの名無しさん
07/10/11 15:22:23
Intel 「GPGPUは失敗する（笑）」
URLﾘﾝｸ(pc.watch.impress.co.jp)

92:デフォルトの名無しさん
07/10/14 18:16:45
二分木で足しこんで行く手はある

93:デフォルトの名無しさん
07/10/30 21:06:02
市販GPUを使ってパスワードを高速クラック
URLﾘﾝｸ(japanese.engadget.com)

94:デフォルトの名無しさん
07/11/13 18:28:19 BE:10105373-2BP(1)
GF8500GT-P256H使うか

95:デフォルトの名無しさん
07/11/13 21:55:28
CUDA 1.1betaが会員に公開されたみたいね。
x64をサポート、しかしVistaはまだだそうだ。

96:デフォルトの名無しさん
07/11/14 09:45:29
Linuxは？できれば*BSDもサポートして欲しいが。

97:デフォルトの名無しさん
07/11/15 21:57:28
GPUつかって
描画と物理演算の二つをやりたいのですが、可能でしょうか。

GPUで物理演算したものを、GPUレイキャスで行う
という感じなのですが

Cgで片方・片方は出来たのですが、それを同時にするのって見当がつかなくて

98:デフォルトの名無しさん
07/11/18 17:05:58
AMDの3800シリーズのデモ（PingPong）では玉の動きを物理処理させつつ高度な光源処理を行っています。

99:デフォルトの名無しさん
07/11/18 23:52:33
>>98
そのサンプルとかありますか？

実際にどう実装しているのか。まだvertex fragmentのシェーダー一つを扱うのにいっぱいいっぱいで

100:デフォルトの名無しさん
07/11/19 12:29:12
URLﾘﾝｸ(ati.amd.com)
URLﾘﾝｸ(www.4gamer.net)
DX10.1の発表と同時位に公開されるんじゃないかな？
これはDX10.1のデモだし。
ソースが出るとすればATI SDKのページかな。
URLﾘﾝｸ(ati.amd.com)
システムメモリにアクセス頻発するようなゲーム物理だと
WDDM2.1（DX10.1）未対応の場合、GPUがストールしまくりで
実用的ではないらしいけどね。

101:デフォルトの名無しさん
07/11/21 12:55:42
CUDA 1.1 beta が表に出てきましたよ。
x64サポートされてますよ。
Vis未サポートですよ。

102:デフォルトの名無しさん
07/12/08 12:30:19
ゲフォ8kって、AGPは無くてPCI-eに移行しないといけない
のな。すると連動してS-ATAに移行させられてdebian系が
起動しない罠。
FreeBSDでCUDAしたい…。

103:デフォルトの名無しさん
07/12/09 21:08:47
>debian系が起動しない罠。
いつの時代の人？

104:デフォルトの名無しさん
07/12/09 23:32:31
woodyでも使ってんのかね

105:デフォルトの名無しさん
07/12/12 10:42:27
>>102
【GPGPU】NVIDIA CUDA質問スレッド
ｽﾚﾘﾝｸ(tech板)

106:デフォルトの名無しさん
07/12/24 13:17:16
AMDもCALとBrook+きたようだ
URLﾘﾝｸ(ati.amd.com)

107:デフォルトの名無しさん
07/12/24 13:51:35
vistaだとランタイムたりねぇって怒られる・・

108:デフォルトの名無しさん
07/12/25 22:09:12
URLﾘﾝｸ(pc.watch.impress.co.jp)

109:デフォルトの名無しさん
07/12/26 08:12:57
べつにハード的な統合は一番最後で構わんのだし
CALとBrook+が出たことで、今後将来的なAMD GPUでもサポートされる
今はこっちを一般的にするほうが課題だな

110:デフォルトの名無しさん
07/12/29 12:02:21
次世代（nVIDIA、AMDどっちでも良い）は、奮発して高いGPU買いたいよね。

111:デフォルトの名無しさん
08/01/13 00:20:16
あけおめ、CUDAのWorldCommunityGrid　Boincクライアント用のアプリを誰か書いてくれ

112:デフォルトの名無しさん
08/01/15 10:17:49
>>111
kwsk

113:デフォルトの名無しさん
08/02/05 09:17:50
流れが止まったな

114:デフォルトの名無しさん
08/02/05 14:45:38
今だから聞きたいんだが、

お前らAMDとNvidiaのどっちが優れている、又はスタンダードになると思う？

GPUのシェーダー性能はAMDが優れていて、開発環境としてはNvidiaのCUDAのほうが普及している。

DX10.1対応で先行しているAMD、今度Phsixを買収するNvidia。

ぱっと見、抜きつ抜かれつでいい勝負しているように見えるが、どうなんだろうか。

115:デフォルトの名無しさん
08/02/05 21:50:23
犬VidiaがCPUも開発すれば良いよ。
犬糞動けば良いんだからさ。

116:デフォルトの名無しさん
08/02/06 03:19:55
ゲーム屋からみると、開発リソースはnVidiaが勝っているように思えるな。
結局今は様子見しかない。
GPGPU か、 hyper parallel coprocessor かは、先が見えるまでに何年もかかるんじゃない？

117:デフォルトの名無しさん
08/02/07 14:13:03
extern　__shared__　int　shared[];
でsharedメモリを使えますが、複数の配列を使いたい場合はどのようにすればよいのでしょうか？

118:デフォルトの名無しさん
08/02/07 14:24:39
>>117
cudaの話ならCUDAスレでどうぞ。
ｽﾚﾘﾝｸ(tech板)

119:デフォルトの名無しさん
08/02/09 21:31:27
もうさ、GPUを直接プログラミングしたほうが早くね？

120:デフォルトの名無しさん
08/02/09 22:13:13
公開されていれば…

121:デフォルトの名無しさん
08/02/09 22:40:49
intel全部公開? URLﾘﾝｸ(intellinuxgraphics.org)
amd準備中らしい?
nvidia ?

cryptにひっかかる回りはどうなってるかしらないが、
その部分はブラックボックスになるんだろう。

122:デフォルトの名無しさん
08/02/09 22:56:30
いや、こんなしょぼいの公開されてもやる気茄子

123:デフォルトの名無しさん
08/02/09 23:03:56
結局ハード仕様書がないことにはAPIの速度は測れても
どの部分がどの程度動くかを定量的に測るのは難しいってことだろう。

124:デフォルトの名無しさん
08/02/17 12:10:57
GPGPUの研究ってどこの機関が一番進んでるの？
企業名とか機関名とか教えて

大学でGPGPUやってたけど大学レベルはどこもダメだった

125:デフォルトの名無しさん
08/02/17 12:18:28
>>124
NVIDIA

126:デフォルトの名無しさん
08/02/17 12:23:54
駄目ならむしろチャンスなんじゃないのか。
設備的にもパソコン程度で済むものだし個人のアイデアレベルでも世界に出られるぜ、素養は必要だけどさ

127:デフォルトの名無しさん
08/02/17 14:44:18
cutCreateTimerなどタイマー関係のリファレンスってどこにあるの？

128:デフォルトの名無しさん
08/02/17 15:35:20
>>127
CUDAについては隔離スレがあるからそちらで。
cutなんちゃらはドキュメントが無かったと思うけど、大したことしていないからソースを読めばいいよ。

>>124
大学で結構真面目に取り組んでいるところもあるよ。
今度産学共同でやることになるかもしれないから名前は出さないけど。

129:デフォルトの名無しさん
08/02/17 16:12:12
普通にstanfordが一番進んでるだろ

130:デフォルトの名無しさん
08/02/17 19:20:32
AMD（旧ATI）のカードは何でプログラムを書けばいいの？CUDAみたいのはないの？

131:デフォルトの名無しさん
08/02/17 21:50:19
CALとBrook+を使うんじゃないかな？

132:デフォルトの名無しさん
08/02/22 06:40:35
GeForce　9600　GTは64ビット計算できますか？

133:デフォルトの名無しさん
08/02/22 10:10:29
出来ません

134:デフォルトの名無しさん
08/02/22 11:16:14
改良するんじゃなかったっけ?

135:デフォルトの名無しさん
08/02/22 12:19:14
口先だけのfudです

136:デフォルトの名無しさん
08/02/22 13:52:32
FireStreamは倍精度が使えるらしいけど、HD38x0で使えなきゃ意味がないよな。

137:デフォルトの名無しさん
08/02/22 23:40:24
意外かもしれないが、限定条件付で64ビット実数もCUDAで計算できる罠。
それはさておき、9600GTでCUDAが使えると言うアナウンスが未だないんですが。

138:デフォルトの名無しさん
08/02/23 07:19:06
あれ、両社とも倍精度実装するんじゃないんか？
現世代買わずに待ってたのに。

139:デフォルトの名無しさん
08/02/23 12:05:37
Brook+でdouble使おうとしたらストリームデータとしては使えませんと言われたよ。

140:デフォルトの名無しさん
08/02/23 13:07:08
それは「Brook+」とやらが対応していないと言うことだろ。GPUが対応しているかどうかとは別の問題だ。

141:デフォルトの名無しさん
08/02/26 18:56:43
>>128
灯台のK塚研？
あそこってK塚さんよりも、その他の学生・助手の天才が
GPUを扱ってるんでしょ？

あの大学の産学プロジェクトは、でかい花火をばーっと揚げて
中身が伴わないから好かん。

つーか、GPGPUやGPUを扱うためのTIPが少ない…
JAPANは当然だけど、海外の論文も上っ面だけで
いざ実装の部分がまったくない。

周りも聞けないのばっかだし、みんなどこで情報得てるんだ？

142:128
08/02/26 23:44:10
>>141
どことは言えないけれど、そこじゃないよ。

どことは言わないけれどCUDAを使った高速化を商売にしている会社があるんだけど、
そこが組んだロジックよりも私が組んだロジックの方が速かったりする事実。
どこも苦労しているんだろうねぇ。

143:デフォルトの名無しさん
08/02/27 00:04:24
どこも暗中模索・切磋琢磨してるんだねぇ

つーか大学の研究室じゃなくて
今、それをやってる研究者を知りたいわ
教授レベルじゃなくて、学生・ドクター・助手レベルで
論文も数が少ないし、ノウハウなんて個人が所有してるのしか無い
仲が悪くなれば、脱走して終了なんていくらでもあるしなぁ

というか128のロジックをうｐってくれｗ

144:128
08/02/27 00:13:21
>>143
CUDAスレに、断片くらいなら載せてたかも知れず。
まぁ、落ち着いたら一般化できるノウハウはまとめるかも知れないけれど。

145:デフォルトの名無しさん
08/02/27 02:39:38
>>142
とあるシンポジウムに来ていたあの企業かしら…

146:128
08/02/28 11:51:55
>>145
私のことなら違いますよん。なんせ私はシンポジウムに出てないし、
私のつとめる会社でCUDAをまともに使えるのは私だけだし。

147:デフォルトの名無しさん
08/02/28 22:33:41
これはwwwww

148:デフォルトの名無しさん
08/03/05 21:00:59
さて明日はCUDA祭ですね

149:デフォルトの名無しさん
08/03/05 23:43:28
なんで？

150:デフォルトの名無しさん
08/03/06 00:45:39
そのまんま。これでしょ。
URLﾘﾝｸ(www.loopinc.jp)

151:デフォルトの名無しさん
08/03/06 19:27:01
CUDA プログラミングガイドの日本語訳版が出たけど
急いで作ったんだなぁというのがよく分かるなこれ…

とりあえず乙ということで

152:デフォルトの名無しさん
08/03/06 22:53:30
どこ？どこ？

153:デフォルトの名無しさん
08/03/06 23:07:33
URLﾘﾝｸ(www.sei.buaa.edu.cn)
Workshop on Architectures and Languages for Throughput Applications

Program Committee
Carmean Douglas Intel Corporation
Tom Conte North Carolina State University
Mike Houston AMD
Michael McCool RapidMind Inc.
Michael Garland Nvidia
Sun Chan Simplight Nanoelectronics
Xiaohua Shi Beihang University

154:デフォルトの名無しさん
08/03/07 00:10:34
>>152
URLﾘﾝｸ(www.nvidia.co.jp)
ほい

155:デフォルトの名無しさん
08/03/07 01:09:59
カンファレンス行ってきました
受付のお姉さん方皆様綺麗でスタイル良くて大満足でした

156:デフォルトの名無しさん
08/03/07 01:12:09
宣伝しないと言ってましたがやっぱり少しだけ宣伝入ってましたね

157:デフォルトの名無しさん
08/03/07 01:17:39
宣伝は仕方ないかなって感じかなぁ
vista対応はいつすんだ？の質問はわらた

158:デフォルトの名無しさん
08/03/07 04:23:49
マルチ・コアが非常に高いメモリ帯域幅によって動作されている状態で、今日のGPUはグラフィックスと非グラフィックス処理の両
方のための信じられないリソースを提案します。

なんじゃこりゃ

159:デフォルトの名無しさん
08/03/07 06:04:15
>>155
うpれ！

160:デフォルトの名無しさん
08/03/07 15:12:29
Mike Houstonか

161:デフォルトの名無しさん
08/03/19 06:28:41
誰かGeForce　9800　GX2買った？

162:デフォルトの名無しさん
08/03/19 07:49:55
えーと、8800GTS*2?

163:デフォルトの名無しさん
08/03/19 09:19:42
9600GTを買おうと思っている。
Geforce　9　って公式にはCUDAはまだサポートされていないけれど
使おうと思えば使えるの？

164:デフォルトの名無しさん
08/03/19 09:43:17
フォーラムには使えるような事が書いてあったきがす

165:デフォルトの名無しさん
08/03/19 10:55:11
俺は 9800GTX 狙い。
期待はずれな気もするけど・・・

166:デフォルトの名無しさん
08/03/19 22:10:37
G90世代を買うなら、8800GTか8800GTS(512MB)でいい希ガス。
そろそろ在庫処分だから値段も崩れると思うし。
と言うのも、夏にはG100世代が待っているからなんだけど。
プロセッサ数も然ることながら、倍精度も来るようだしね。

167:デフォルトの名無しさん
08/03/22 12:09:57
AMD Stream SDK v1.0 beta
XP 32bit版/64bit版

168:デフォルトの名無しさん
08/03/22 16:14:34
>>166
それだと、ComputeCapabilityが1.0だろ
どうせなら、1.1のやつを選んだほうがいいよ

もうすぐ、1.5がでるという噂もあるけど

169:デフォルトの名無しさん
08/03/22 19:29:16
>>168
その2つは1.1なはず

170:デフォルトの名無しさん
08/03/23 23:49:59
>>167
ソース、キボンヌ。
てかLinux版は無いの？

171:デフォルトの名無しさん
08/03/24 01:33:47
このスレの住人なら知っていますね、あの糞開発ツールのことを

・自分のプログラムのバグなのかコンパイラのバグなのかわからない
・他の仕事に応用できない糞開発ツールの独自世界を必死に学習している
・テキストエディタで書いたほうが効率的なのに糞UIツールを懸命に使っている
・糞開発ツールを批判すると「性格が悪いから糞ツールを批判するんだ」と言われる

糞だけど、政治的な理由で無理やり使わされているんですよね。
もう、あんな厨の作った糞ツールを我慢して使うのはやめましょう。

・糞開発ツールを部下に押し付ける上司の命令は無視しましょう。
　上司は糞開発ツールが使われる実績を作ることであの会社のごきげんをとっているのです。
・糞開発ツールを使わせる上司の下では働けません、と上司の上司に直訴しましょう。
・あの糞開発ツール提供会社には「おたくの糞開発ツールは話にならない」と突き放しましょう。
　バグレポートなどしてはいけません。改善要求などもってのほかです。
　あの会社はあなたたちのことをテスター/モルモットとしか思っていません。
・あの会議で「糞開発ツールを使ったら生産性がxx％アップしました」
　なんて話が出たら力強く机を叩き、会議室を出ましょう。
　あの人たちは糞開発ツールをマンセーすることで立場を確保しているのです。

糞な開発ツールを糞だと言える、そんな当たり前の環境をみんなの力で取り戻しましょう。

172:デフォルトの名無しさん
08/03/24 01:39:03
知らんがな

173:デフォルトの名無しさん
08/03/24 01:41:47
>>171
PS2のgccの事かｗ

174:デフォルトの名無しさん
08/03/24 04:56:28
マ板のコピペだろ。
統合開発環境なんて、どれもあてはまりまくりだが。

175:デフォルトの名無しさん
08/03/24 05:40:37
>>170
URLﾘﾝｸ(ati.amd.com)

176:デフォルトの名無しさん
08/03/24 10:46:34
>>168
CUDAスレに載ってる一覧表参照。
少なくとも、8800GTは1.1。使用チップが同じと言う点からの類推で8800GTS(512MB)も同様。
# 8800GTSは、320MB/640MBがG80なのでそちらは1.0だから要注意。

1.5がもうすぐって言ってもなぁ。少なくとも数ヶ月は先な悪寒。

閑話休題、CUDAスレの件の一覧表見て、「手元の一覧表を更新できる♪」と思ったら
どうも内容に見覚えがある。出所はどう見ても私です。本当にありｇ（ｒｙ……（：；

177:デフォルトの名無しさん
08/03/24 10:54:19
Dominik の GPGPU tutorial 読んで重力相互作用シェーダ(fp40用)を書いたん
だが、2つ問題があった。

* for { for { 相互作用計算 } } ループで 128 x 128 など大きな値にすると
途中で抜ける →各テクスチャブロック 64 x 64 ごとの ping-pong (swap)
技で解決
* ブロックを 4 x 4 = 16 回など swap を増やすと計算結果が変になる→ swap時
に glFinish() 待ちで解決

glFinish を glFlush に変えると全然だめだった。計算順序が守られてかつ
glFlush みたいに軽い方法ないかな

178:デフォルトの名無しさん
08/03/25 10:12:44
>>170
URLﾘﾝｸ(forum.beyond3d.com)

We are working on Linux support. Getting all the i's dotted and t's crossed
with different kernel/driver/chipset combinations is more "interesting" on linux than XP/Vista.

mhouston
System Architect, AMD

179:デフォルトの名無しさん
08/03/27 20:16:35
URLﾘﾝｸ(folding.stanford.edu)

> The client runs on all hardware supported by the AMD Compute Abstraction Layer (CAL),

> The client runs on Windows XP 32-bit/64-bit and Vista 32-bit/64-bit.

どうやらVista対応は間違いなさそうだ

180:デフォルトの名無しさん
08/04/03 01:49:03
radeonじゃ動かないかね？

181:デフォルトの名無しさん
08/04/03 07:09:54
2400以上なら動くよ

182:デフォルトの名無しさん
08/04/10 23:39:47
NL-Means filter
URLﾘﾝｸ(kishibe.dyndns.tv)

Ver0.01からはGPUによる並列計算処理に対応いたしました

183:デフォルトの名無しさん
08/04/12 18:53:49
そういやR600向けFah来てたな

184:デフォルトの名無しさん
08/04/15 02:02:32
CAL1.00.2 beta、RV670で倍精度演算でけたよー

185:デフォルトの名無しさん
08/04/17 21:40:09
CUDA 2.0 beta来たね。Vistaで動いてるそうな。
CALもFAH GPU2でVista対応のDLLがおまけで付いて来るから
これ使うと1.00.2 betaのサンプルが動いたりする。
両社ともあとは正式公開を待つばかりだ。

で、Linux版CALはまだですか？
Catalyst来月号でfglrxが大きく変わるって話だけどこいつですかね？それともCrossFire？adlってなんぞー

186:デフォルトの名無しさん
08/04/21 17:15:44
CUDA2.0 for Linuxはドコー？？

187:デフォルトの名無しさん
08/04/21 19:17:28
2.0になって何が新しくなったとか言うドキュメントはないの？

188:デフォルトの名無しさん
08/04/21 19:17:35
Linuxはここだ
URLﾘﾝｸ(forums.nvidia.com)

189:デフォルトの名無しさん
08/04/22 00:18:52
情報THX! CUDAスレにも転載させてもらいま。

190:デフォルトの名無しさん
08/04/27 22:48:52
AMD Stream SDK v1.0
ってドキュメントどこにあるの？

概念情報しか載ってなくて困ってる
あとWindowsしか対応しとらんの？

191:デフォルトの名無しさん
08/04/27 23:37:22
> ってドキュメントどこにあるの？
インストールしろ。まずはそれからだ。

> あとWindowsしか対応しとらんの？
いまんとこそう。

192:デフォルトの名無しさん
08/04/27 23:41:36
>>191
何それって感じだなｗ
CUDAですら当初からLinuxサポートしてたのに

193:デフォルトの名無しさん
08/04/28 02:11:53
> CUDAですら
CUDAとCTM以外になにかあったっけ？

194:デフォルトの名無しさん
08/04/28 12:26:12
GCC,spice

195:デフォルトの名無しさん
08/04/28 22:25:44
CTMのLinux版出すのか問い合わせたけど
ドライバの問題で無理って回答を貰った
半年後はどうかと聞いたがそこまで先の
ことは言えないっぽいｗ

196:デフォルトの名無しさん
08/04/29 09:13:39
CTMなんて、もう作ってないが？

197:デフォルトの名無しさん
08/04/29 19:09:02
良いスレsage

198:デフォルトの名無しさん
08/04/29 19:15:54
sage

199:デフォルトの名無しさん
08/05/09 15:48:49
AMDのStreamSDKをVista x64で使えたって人います？

200:デフォルトの名無しさん
08/05/09 17:38:59
Folding@HomeのGPUクライアントに付いて来るCALのDLL使えばいける

201:デフォルトの名無しさん
08/05/09 17:52:12
Linux版のSDKもそろそろ出るとさ

202:199
08/05/09 18:23:54
Windows: V6 Beta GPU2 (ATI 26xx, 3xxx, and later) clients の 6.11 beta3を入れてみたけど
dllファイルは一切なかったです。以前と変わったのかな…
Stream SDKにあるサンプルをプロンプトで実行してみたんだけど、エラーは出ないのだけど
結果も何も出ないから実行できてるのかどうかよく分からない。

203:デフォルトの名無しさん
08/05/09 19:34:49
一度実行するとWUと一緒にDLLがダウンロードされる。
スタートメニューにデータフォルダへのショートカットがあるから開いてみ。

204:デフォルトの名無しさん
08/05/09 20:08:59
見つかりました。こんなところにあったとは…

しかし、CALのlibフォルダにFolding@Homeのdllつっこんで
AMDのデモ実行したらamdcalcl.dllが見つからないと言われちゃった。
（ってことは、ちゃんと今までは実行できていたってことか？）

う～ん難しいな～
βだからこんなものなのだろうか…

205:デフォルトの名無しさん
08/05/09 21:00:18
それもセットでDLされてない？
俺がやった時はついてきたんだがな。

206:デフォルトの名無しさん
08/05/09 21:05:01
ああいや、付いて来てたのかな。
だとしたらamdcalclだけか、両方とも実行ファイルと同じ
ディレクトリにたたき込んでみ

207:デフォルトの名無しさん
08/05/11 19:49:19
ノートPCでCUDAに向いてる機種って何？
浦島太郎なので、グラフィックchipの型番
とかワカンネ。
出張用に、軽くて携帯性と電池の持ちが良い
方が嬉しいけど。

あっ、もちろんLinux動くこと。

208:デフォルトの名無しさん
08/05/11 20:13:56
>>207
軽くて大きくなくて消費電力も少なめで、できればNVIDIAのGeForce8600MGS以上のVGAを搭載している機種。

209:デフォルトの名無しさん
08/05/12 05:38:10
＞VGAを搭載している機種。

そんなｽﾍﾟｯｸ作ってﾈｰﾖ

210:デフォルトの名無しさん
08/05/12 07:30:43
VideoGraphicAdapterですね。

211:デフォルトの名無しさん
08/05/12 09:46:54
Acceleratorとも言う

212:199
08/05/12 14:22:56
Folding@Homeのdllではなぜか駄目で元のsdkについてきたものに戻すと、
とりあえずエラーはでないみたいです。
VisualStudioでx64としてBrook+のGuideにあるサンプル(Sum.br)をコンパイルすることはできているのですが、
実行をしてもプロンプトが一瞬現れるだけでなんの結果も得られない状況です。
（他の元から入っているサンプルの.exeを実行しても同じ）

printfの結果さえプロンプトに表示されていないので、どう見ても実行されていないように見えるのですが
どうなんでしょうか…

213:デフォルトの名無しさん
08/05/12 14:36:07
プロンプトが一瞬現れるのなら、結果も一瞬現れているのではないか?
ダブルクリックで起動せずに、コマンドプロンプトから実行してみては?

214:199
08/05/12 14:40:22
コマプロ上からもやってみたのだけれど、一切のエラー・警告もなく静かに終わるんです。
Sum.br内のreturn 0; の前にprintf("test");　を入れてるのでちゃんと実行されてるなら
最低testが表示されるはずなのにされないんですよ。

ドウナッテルノ？

215:デフォルトの名無しさん
08/05/12 18:00:30
Brook+の中かCALの中でexitでも呼んでるんでしょ。

俺のやった方法は以下の通り
1.64ビット版Vista SP1をセットアップ,ドライバインストール
2.F@Hをインストール
3.F@Hを起動してamdcalrt.dll,amdcalcl.dllがDLされていることを確認したら終了する
4.適当にディレクトリを作成してXP64にインストールしたSDKからサンプルのバイナリ,Brook+のdllをコピー
　（VistaにSDKは入れてない）
5.F@Hのamdcalrt.dll,amdcalcl.dllもコピー
6.実行

216:199
08/05/12 19:07:05
４.の（VistaにSDKは入れてない）というところが違う所ではあるのですが、
Vista x64　SP1にSDKをインストールして、後はそこから１～６に沿ってやってみましたが
真っ黒なプロンプトが一瞬立ち上がるだけで前と変わらないみたいです。
（コマンドプロンプト上から実行しても同じ）

手詰まりなので、正式版でるまでしばらく待ってみます。
アドバイスして頂き、ありがとうございます。

217:デフォルトの名無しさん
08/05/12 21:40:50
>>216
多分SDKをインストールすると環境変数を頼りにSDKのdllを参照しに行かされてるんじゃないかなぁ。
コマンドプロンプトから
>set CALROOT=
>hoge.exe
でやってみたらいけそうな匂いがするけど。もしくはSDKの方のdllをリネームしておくとか。
あとはCatalystのバージョンくらいか。役に立てずすまんね。

218:199
08/05/12 22:43:37
インストールフォルダのlib中にあるdllファイルをF@Hのものに置き換えると
dllが見つからないというエラーがでるようになったので駄目な気がします。
>217　のようにしてプロンプトから実行してみましたがやはり駄目でした…
Catalystは現最新の8.4なのですが、どうでしょう。

ちなみに、VisualStudio上から強引にCPUエミュレートでコードを走らせるように設定したら
想定どうりの動きをしたのでコードの間違いや.brファイルの変換までは問題ない
と思われます。たぶん

ムゥ～

219:デフォルトの名無しさん
08/05/12 23:59:40
うーん、何で俺の環境だと動いてんだろ。むしろこっちがおかしいのか？
なんか特別なことやったかなぁ。

220:デフォルトの名無しさん
08/05/13 12:26:10
>>214
問題の切り分けがヘタだな。
printf() だけなら表示されるのか？ダメならそれ以前の問題。
printf() を先頭に持っていって表示されるか？されないならちょっと面倒かも。
表示されるなら、printf() の位置を移動して、表示されなくなる境界を探すとその近辺に（間接的かもしれないが）問題がある。

221:199
08/05/13 14:34:48
>220
printf()のみソースに記述した場合も変数宣言直後にprintf()をした場合ともに、状況は
変わらないようでした...

CPUエミュの場合と、GPUの場合とでログをとってみました、こんな感じです。
CPU:
Runtime::CreateInstance((null), 0000000000000000, 1)
Brook Runtime starting up
Runtime::Runtime()
stream::stream(000000014001C228, ...)
Runtime::GetInstance((null), 0000000000000000, 0)
Runtime::GetInstanceRef()
CPURuntime::CreateStream(1, 000000000027A360, 2, 000000000027A440, 0)
CPUStream::CPUStream(1, 000000000027A360, 2, 000000000027A440)
StreamInterface::getElementSize()
CPUStream::getFieldCount()
........続く

GPU:
Runtime::CreateInstance((null), 0000000000000000, 1)
Brook Runtime starting up
CALRuntime::create(0000000000000000)
Runtime::Runtime()
CALRuntime::CALRuntime()
CALContext::create(0000000000000000)
CALContext::CALContext()
CALContext::initialize(0000000000000000, 0)
これだけ
GPUの方は、初期化処理で止まってしまっていたので、やはり環境面で何かありそうな感じです。

CPUStream::getIndexedFieldType(0)
getElementSize(1)

222:199
08/05/13 14:38:46
>221 の下の２行はミスです。

ちなみに、GPUはRadeon HD3470を使っています。（Vista HomePremium x64 SP1)

223:デフォルトの名無しさん
08/05/21 00:46:01
brook+ってなんでLinuxじゃ使えないの？

224:デフォルトの名無しさん
08/05/21 01:24:19
Brook+のrelease-notes-mar-08.txtより

> Compiler Support
> ----------------
>
> We only support Visual Studio 2005 (for Windows builds) and gcc 4.1.2 (for
> Linux builds).

225:デフォルトの名無しさん
08/05/21 02:59:59
>>207
ｽﾚﾘﾝｸ(notepc板)

226:デフォルトの名無しさん
08/05/21 15:32:05
cudaはGeforce８ｘｘｘ以上だよ
８系でオンボードチップってあるんかいな

227:デフォルトの名無しさん
08/05/21 17:50:08
URLﾘﾝｸ(cudacontest.nvidia.com)
MP3 LAME Encoder

228:デフォルトの名無しさん
08/05/21 20:37:49
何でこのご時世にMP3・・・
せめてAACにしろよ

229:デフォルトの名無しさん
08/05/21 21:44:19
コンテストってことは
最適化か何かかね
めざせUS$5,000.00
と思ったら人種差別化ね

Resident in the United States or Canada

230:デフォルトの名無しさん
08/05/21 22:21:53
>>226
オンボードかどうかは知らんが、GeForce8系を積んだノートPCなら腐るほどある。

231:デフォルトの名無しさん
08/05/22 01:25:47
>>227
既にhydrogenaudioのスレでも指摘されてるけど、LAMEで大半の時間を食ってるのは
ベクトル化の難しい心理音響解析であって、最適化の効果が大きいFFTやらMDCTではないんだよな
あまり最適化に向いた問題じゃない

232:デフォルトの名無しさん
08/05/22 15:11:57
>>226
8100と8200のチップセットが出たがな

233:デフォルトの名無しさん
08/05/22 23:17:04
月刊Catalyst2008年5月号では現行のAMD Stream SDK、F@HのCAL共に動きません。
気をつけましょう。

234:デフォルトの名無しさん
08/05/22 23:50:55
Catalyst腐りすぎ
だんだんコード悪くなってる
なぜNvidiaが金出してコンサル
してやるって言うのに応諾しねーのよ？

235:デフォルトの名無しさん
08/05/23 00:13:24
Vistaじゃ動くそうだよ。

> だんだんコード悪くなってる
お前はAMDの中の人なのか？ｗ

236:デフォルトの名無しさん
08/05/23 07:05:54
fahはvistaだと問題ないな8.5は

237:デフォルトの名無しさん
08/05/25 11:57:17
AMD Stream SDK v1.1-betaきてた

238:デフォルトの名無しさん
08/05/25 12:00:04
Linuxまだ対応してねーよ
もうAMDなんていらねーから
業界標準をCudaにしろ

239:デフォルトの名無しさん
08/05/25 12:08:46
Linux向けSDK公開されてますけど？

240:デフォルトの名無しさん
08/05/25 12:10:14
URLﾘﾝｸ(journal.mycom.co.jp)
希望的観測ぽいけど、GPGPU以外でも使えるモデルと思ってるみたい

241:デフォルトの名無しさん
08/05/25 13:21:55
キター！
URLﾘﾝｸ(forums.amd.com)

242:デフォルトの名無しさん
08/05/25 13:37:27
キターーー
LinuxキタけどこれDebianはいらねーじゃん
AMD shitだな

243:デフォルトの名無しさん
08/05/25 13:48:20
入るよ。
URLﾘﾝｸ(forums.amd.com)

244:デフォルトの名無しさん
08/05/25 17:10:46
>>243
どうもありがとう
debian 4
ubuntu 7.10
ubuntu 8.04
knopix 最新版

この4つならとりあえずインストールまで行く

245:デフォルトの名無しさん
08/05/25 18:46:25
Xenの上でも動く?

246:デフォルトの名無しさん
08/05/25 18:50:40
debian用のパッチ作ったぉ

だれもいらんよね

247:デフォルトの名無しさん
08/05/25 18:57:59
>>246
いらねーよ消えろボケ

248:デフォルトの名無しさん
08/05/25 20:25:29
まぁ待て、煽るんじゃない。

でも俺も要らんわ。

249:デフォルトの名無しさん
08/05/25 20:35:26
>>246
俺もいらねーよ
ゴミ作るなよ市ねｗ

250:デフォルトの名無しさん
08/05/25 21:08:04
要る

251:デフォルトの名無しさん
08/05/25 22:39:34
>>246
まじキモイ
うぜーから消えろ

252:デフォルトの名無しさん
08/05/27 11:43:25
Core2Quad Q9450でPS2エミュをやると、実機と違い処理オチせず、激ムズになることが判明
ｽﾚﾘﾝｸ(news板)l50

253:デフォルトの名無しさん
08/05/28 00:08:53
AMDの方言語って
CUDAと比較して半端じゃなく
使い勝手悪くない？

254:デフォルトの名無しさん
08/05/28 05:13:09
いやゼンゼン

255:デフォルトの名無しさん
08/05/28 17:15:13
言語はAMDが作った仕様ってわけじゃないんだよな

256:デフォルトの名無しさん
08/05/28 23:08:16
AMDの奴ってなんていうか
学生向け言語って感じで
実用性まったくない言語
になってるね

もともとが学生向けのおもちゃ
言語をベースにしているのが原因かもしれないけど

257:デフォルトの名無しさん
08/05/28 23:38:15
同じ問題を解いた時ほぼ100%
CUDAに負けるね

Radeon 3870と
Geforce 9800GTXでやってるけど
Radeon遅すぎてお話にならない

258:デフォルトの名無しさん
08/05/29 05:51:48
必死な奴が常駐してるな

259:デフォルトの名無しさん
08/05/29 07:39:16
N社の工作員なの？

260:デフォルトの名無しさん
08/05/29 12:31:16
こんなとこでやっても見てるやつがどれだけいることやら・・

261:デフォルトの名無しさん
08/05/29 15:13:10
価格帯違うGPUで比べたらそりゃ遅いわな

262:デフォルトの名無しさん
08/06/01 12:33:25
CUDAとAMDのSDKってどっちが
簡単ですか？
OpenMPみたいにらくらくにできますか？

263:デフォルトの名無しさん
08/06/01 13:24:31
AMD Stream SDKのv1.1betaって登録しないと落とせないの？
不便だなぁ

264:デフォルトの名無しさん
08/06/01 14:34:51
は？

265:デフォルトの名無しさん
08/06/01 14:41:20
>>264
>>241のページからFTPのリンククリックしても入れないんだけど
鯖落ちてるのかな

266:デフォルトの名無しさん
08/06/01 14:57:59
普通に落とせるよ

267:デフォルトの名無しさん
08/06/01 15:20:54
普通に落とせるよ

268:デフォルトの名無しさん
08/06/02 15:03:01
>>262
OpenMPが楽だと思うのなら、CUDAへの移植も楽だと思うよ。
チューニングしだすと面倒だけど。

269:デフォルトの名無しさん
08/06/02 21:27:45
>>268
そうなんですか
再来週Radeonを買い付けにいくので
AMDの方の使い勝手も知りたいのですが
どうなんでしょうか？

270:デフォルトの名無しさん
08/06/02 21:50:38
CALを生で使う根性があればAMDの方は自由度高いし面白いと思うよ。
グローバルバッファとか使えるし、適用できる問題の幅も広い。
ただCAL側のリソースをテクスチャにしたり頂点バッファにするみたいな
DirectXやOpenGLとの協調はまだ未実装だから、完全に計算しか出来ないけど。

Brook+ははっきり言ってまだ使い物にならない。CPUコード吐かせると
数値リテラルが全部floatになって生成されたcppファイルがコンパイルできないとか。
CALコードだけにすればまぁ何とか使えなくもないけど、CUDAの方が実用的。

271:デフォルトの名無しさん
08/06/02 23:12:37
>>270
CALちょっといじったことあるけど
あれ使うのは大変だったなぁ

Brook+はやっぱダメなのかぁ。上に
釣りで学生のおもちゃとか書いてあったけど
どうやら本当なんだね

272:デフォルトの名無しさん
08/06/02 23:22:28
まぁ機能すらフルに実装されていないβVerだから速度に期待するのは酷だね

273:デフォルトの名無しさん
08/06/02 23:33:07
速度やバグあるのはまぁCUDAも
0.xxxははんぱねぇｗ状態だったから
別段いいんだけど

Brook+の自由度がどの程度なのか
いまいち図りきれないのが残念
すぐコンパイルエラーばっかり

274:デフォルトの名無しさん
08/06/03 00:44:32
>>271
まぁちと言い過ぎだけどね。
言語としてはシンプルでそれほど悪いわけじゃないし（でも3DAPIと協調するときどーすんだって気はする。ドキュメントにすら記載ないし）
CALコードだけならとりあえず動くコードは吐いてくれる。遅いけど。
v1.1-betaなんてバージョンにしちゃったから印象が悪いわけで、実際のところは熟成待ち。

>>373
秋葉原で3850が1万チョイって話もあるし、とりあえず3xxx1枚買ってbrcc -p calオススヌ。

CALバックエンドなCUDAコンパイラを誰かが作ってくれないもんかねぇ

275:デフォルトの名無しさん
08/06/03 00:47:51
おっと、書き込んでから思い出した。
ドキュメントにはないけどVC用のusertype.datにこんな文字列があったんだった。
streamToD3D
streamFromD3D
streamToGL
streamFromGL
一応Brook+と3DAPIのやり取りを実装する気ではいる様だ。いつになるか知らないけどｗ

276:デフォルトの名無しさん
08/06/03 00:50:48
>>274
今買うより10日に新板でるからそれ
待ってから買った方がいいと思ってます。

277:デフォルトの名無しさん
08/06/03 12:17:43
4850は18日

278:デフォルトの名無しさん
08/06/03 13:06:50
ときに次のPhotoshopがGPU使うそうですが。

279:デフォルトの名無しさん
08/06/05 03:12:09
URLﾘﾝｸ(techreport.com)
でもCUDAだーよ
ATIの人ｶﾜｲｿｽ

280:デフォルトの名無しさん
08/06/05 07:28:21
みんなCUDAで200Wとか280W
電力消費すれよｗ

281:デフォルトの名無しさん
08/06/05 10:05:45
>>279
β版の開発環境でプラグイン作るなんてAdobeもATiも迷惑だろ

282:デフォルトの名無しさん
08/06/05 16:49:45
CUDAは上位互換が保障されてます

283:デフォルトの名無しさん
08/06/05 21:44:13
CUDAは全ての変更が上位と将来版で
継承されることが保障されている
Computexで聞いてきたがAMDの方は
1.5からまた全く違う内容になる。
CLIの実装方式が変更されるから意味
ないんだよな

284:デフォルトの名無しさん
08/06/05 23:49:12
つまり大幅なハードの変更がある訳かね？

285:デフォルトの名無しさん
08/06/06 00:17:19
また変な改行の人か

286:デフォルトの名無しさん
08/06/06 02:10:54
この流れでいくとCUDAが圧勝するわけだけど
そうなると当然対応ソフトの多さによってnVidiaカードのシェアが伸びる
下手すれば完全に独占してしまうかもしれない
AMDはCUDAに対応させるために改造するのだろうか
そうなるとｎVidiaがすべての仕様をこれから先ずっと作っていくことになってしまう
使い勝手の悪いものが出来たり、上位互換を自分勝手に切り捨てたりするかもしれん
ISOのような公式な機関が介入出来る情勢でもないし
混沌としてきそうで嫌だね
洗練された仕様がどのメーカーのVGAでも一様に動作するというのが
ユーザーとしては最も望ましいわけだけど
このままだとそれは永遠に無いかもね

287:デフォルトの名無しさん
08/06/06 07:36:28
>>286
いやそれは無い。もう、Intel互換のチプセトも
AMD互換のチプセトも作らせて貰えない可能性
高い。本業のグラボも１のつの巨大コアで全部
ぶん回す旧世代のアーキテクチャだよ
弱ったら買い叩かれるのがオチだよ

288:デフォルトの名無しさん
08/06/06 12:33:06
だから今余裕のあるうちに逃げ道を探して奔走してる訳だね

289:デフォルトの名無しさん
08/06/06 16:04:53
＞本業のグラボも１のつの巨大コアで全部
＞ぶん回す旧世代のアーキテクチャだよ

新世代のアーキテクチャのグラボはどれですか？

290:デフォルトの名無しさん
08/06/06 16:09:56
RadeonはデュアルコアGPUの4870X2が次世代のフラッグシップモデル
性能もnVidia最上位のGTX280より上らしい
URLﾘﾝｸ(www.vr-zone.com)

これでStream SDKさえ完成版が出ていたら…

291:デフォルトの名無しさん
08/06/06 18:44:28
Streaming　Computing用途の性能なら
単精度で2倍あるはずだしな。

292:デフォルトの名無しさん
08/06/06 19:11:06
Stream SDKは1.0β→1.1βまで2か月しか掛かってないし、
4870X2が出る予定の8月までには完成できるんじゃないかな

293:デフォルトの名無しさん
08/06/06 19:58:57
4870X2ってただのCrossFire接続だろ？
新世代なんて程のもんじゃ無いな。

294:デフォルトの名無しさん
08/06/06 20:02:34
>>293
1枚の板に2つのGPUコア
ただのCrossFire接続だったら誰だって4870やGTX280を2枚買うわｗ

295:デフォルトの名無しさん
08/06/06 20:03:26
いや、ただのCrossFireだって・・・
二重にメモリ積んでるし。

296:デフォルトの名無しさん
08/06/06 20:10:03
>>295
メモリ共有でソフト側からは1GPU扱いという話だったが、
メモリ2枚積みのソースは？

297:デフォルトの名無しさん
08/06/06 20:16:24
URLﾘﾝｸ(northwood.blog60.fc2.com)

＞Radeon HD 4870X2はATiの次世代ハイエンドカードである。
＞このカードは2つのGPUを1つの基板に搭載したものである。
＞Radeon HD 4870X2はATiのMulti-GPUソリューションである
＞CrossFire Xによる2つのGPUをリンクさせるのでドライバのできによって性能が大きく左右される。

298:デフォルトの名無しさん
08/06/06 20:48:26
俺らでCLIの開発してやるから
ATI仕様さらせよ

今Linux版解析してるが
実装がヒドイこれやばいだろってもんじゃないなぁ

299:デフォルトの名無しさん
08/06/06 20:49:07
>>297
ただのCrossFireとCrossFireXは世代が違う技術だっての…メモリ非共有ともどこにも書いてないしな
少なくとも単なる大型化のGTX280とは全く別世代のアーキテクチャだ

URLﾘﾝｸ(a96sj096.cocolog-nifty.com)
URLﾘﾝｸ(northwood.blog60.fc2.com)

300:デフォルトの名無しさん
08/06/07 19:36:02
800SPの1.2Tflopsだってさ4870

あと4870X2がオンボードCFなのかどうかは不明
PLXじゃない専用ブリッジを乗せるとのうわさもある

301:デフォルトの名無しさん
08/06/07 19:39:40
>>300
それあってねーよ騙されるな
おめぇ一度自作板に勉強しに来いよ

302:デフォルトの名無しさん
08/06/07 19:54:12
どれが？

800SP?
ブリッジ？

ちなみに800SPの資料
4850で1Tflops
URLﾘﾝｸ(img68.imageshack.us)

303:デフォルトの名無しさん
08/06/07 20:00:28
つまり今まで一番もっともらしく出回ってた
480SPってのが単なる妄想スペックだったわけだ

304:デフォルトの名無しさん
08/06/07 20:30:00
実製品のFLOPSが妄想スペックを20％近く上回るとか…
逆にこっちの方がフェイクじゃないかと思ってしまうな

305:デフォルトの名無しさん
08/06/07 20:39:12
フェイクだったりして

306:デフォルトの名無しさん
08/06/07 20:42:53
4850とりあえずもう予約したから
初日にベンチしてやるから
何やってほしいか晒せ

307:デフォルトの名無しさん
08/06/07 20:52:51
>>306
H.264エンコード

308:デフォルトの名無しさん
08/06/07 21:13:07
>>302
よくここまで仕様を隠し通してたなｗ
NVIDIAの方がとっくに発表されてたのに

309:デフォルトの名無しさん
08/06/07 21:40:52
まぁ、フェイクとしても4870はいずれ1Tflops超えか

310:デフォルトの名無しさん
08/06/07 22:11:20
AでもNでもどっちでもいいからはよH.264エンコーダ作ってクレー

311:デフォルトの名無しさん
08/06/08 17:40:29
どうでもいいけどラデはム板的に意味なし

312:デフォルトの名無しさん
08/06/08 17:43:46
CALがあるじゃない

313:デフォルトの名無しさん
08/06/08 18:36:05
いっこうにCALの話題が無いｗ
誰かが試したという報告すら聞かない
CUDAはかなり普及してきてる

314:デフォルトの名無しさん
08/06/08 18:40:29
ところでDX10はストリーム演算が出来るとか聞くけど
サンプルとかぜんぜん見当たらないんだけど
DX9と比較して何がどう違うの？
DX１０を使ったフレームワークとかあるの？

315:デフォルトの名無しさん
08/06/08 20:15:25
4870X2のCFで4.8Tflopsとかわけわかんねぇ
パフォーマンス

316:デフォルトの名無しさん
08/06/08 20:17:24
X2で1.2TF
48レーンのPCI-EXってかなり
限定されるな

317:デフォルトの名無しさん
08/06/08 20:39:08
いや、多分そうはならない

318:デフォルトの名無しさん
08/06/08 22:40:09
CALのドキュメントどれ読めばいいの？

319:デフォルトの名無しさん
08/06/08 22:46:22
ProgrammingGuide.pdfとcal_platform_spec.pdfとil.pdf

320:デフォルトの名無しさん
08/06/09 17:55:47
URLﾘﾝｸ(www.pczilla.net)

According to some insiders, Compute Shader technology in
DirectX1 11 will possibly terminate the future of NVIDIA's CUDA technology.

統一が望ましいわな
当然

321:デフォルトの名無しさん
08/06/09 21:01:12
Linuxはどうなるのさ?

322:デフォルトの名無しさん
08/06/09 22:02:54
何そのいらない子

323:デフォルトの名無しさん
08/06/11 05:05:11
結局１１が出るまで何も普及しないし実験に付き合わされただけかｗ

324:デフォルトの名無しさん
08/06/11 05:10:09
ATIの１０．１とかもう何の為にあるのかさえ分からんｗ
ATI詐欺にまた引っかかったなそこの君ｗｗｗ

325:デフォルトの名無しさん
08/06/11 07:40:27
Windowsの方がどんな場合でも
処理性能300％上なのになぜ
Linuxなんて存在するんだろう

326:デフォルトの名無しさん
08/06/11 09:07:49
OpenCLってどうよ？

327:デフォルトの名無しさん
08/06/11 12:39:40
>>325
タダだから。

328:デフォルトの名無しさん
08/06/11 14:22:25
>>325
Linusが作りたいからじゃろ

329:デフォルトの名無しさん
08/06/11 15:34:51
>>325
きみはビル・ゲイツの処理能力の0.0000000000000000000000000001%なのに
同じ人間として存在してるほうが不思議だろ。

330:デフォルトの名無しさん
08/06/11 20:29:50
>>324
ばか

331:デフォルトの名無しさん
08/06/11 23:05:00
10.1は知らんけど、Stream SDKが死産になりそうな感じではあるな

332:デフォルトの名無しさん
08/06/11 23:12:23
Intelの奴が2009年の始めにでるけど
それは1枚のカードで４TFらしいね

333:デフォルトの名無しさん
08/06/12 01:04:38
Intel（）笑

334:デフォルトの名無しさん
08/06/12 06:18:45
なんだその関数

335:デフォルトの名無しさん
08/06/12 14:14:08
>>334
ﾜﾗﾀ

336:デフォルトの名無しさん
08/06/12 16:59:50
void intel()
{
　delete palestinian;
}

337:デフォルトの名無しさん
08/06/12 17:10:52
AMDはhavokか

338:デフォルトの名無しさん
08/06/12 17:17:42
URLﾘﾝｸ(pc.watch.impress.co.jp)
AMDとHavok、物理演算をAMDプラットフォームに最適化

最適化はAMD Phenom X4を含むx86プロセッサが対象で、
将来的なATI Radeon GPUでの利用についても取り組む。

339:デフォルトの名無しさん
08/06/12 20:03:17
またAMD詐欺か

340:デフォルトの名無しさん
08/06/12 20:04:15
どうでもいいがこのまま消費電力増え続けると地球と家計が爆発するぞ

341:デフォルトの名無しさん
08/06/12 20:24:35
詐欺も何もCCCにはR600のころから物理処理に関するヘルプが入っていて
havokがintelに買収されてから延々と活かされないままになっていた

342:デフォルトの名無しさん
08/06/12 22:12:36
俺のRadeon4870がねぇええええ

悪SKせいだ

343:デフォルトの名無しさん
08/06/12 22:46:01
vistaにcuda2.0入れてサンプルを試しているんだけど
simpleD3Dでコンパイルエラーが起きます。
エラーメッセージは以下です。
1>------ ビルド開始: プロジェクト: simpleD3D9, 構成: Debug Win32 ------
1>カスタムビルドステップを実行しています。
1>simpleD3D9_kernel.cu
1>C:\Program Files\Microsoft SDKs\Windows\v6.0\Include\winnt.h(11241): warning:
1> expression has no effect
1>C:\Program Files\Microsoft SDKs\Windows\v6.0\Include\winnt.h(12857): warning:
1> expression has no effect
1>C:\Program Files\Microsoft SDKs\Windows\v6.0\Include\objbase.h(240): error:
1> identifier "IUnknown" is undefined
1>1 error detected in the compilation of "C:\Users\ookawara\AppData\Local\Temp/tmpxft_000016a8_00000000-6_simpleD3D9_kernel.cpp1.ii".
1>ビルドログは "file://c:\Program Files\NVIDIA Corporation\NVIDIA CUDA SDK\projects\simpleD3D9\Debug\BuildLog.htm" に保存されました。
1>simpleD3D9 - エラー 1、警告 2
========== ビルド: 0 正常終了、1 失敗、0 更新、0 スキップ ==========
誰か教えてください。

344:デフォルトの名無しさん
08/06/12 23:41:43
>>343
まさかとは思うが、VC6なんぞを使ってはいないだろうな。つーか、CUDAスレに逝け。

345:デフォルトの名無しさん
08/06/12 23:59:11
割れ物のVSだとなるようなｗ

おっといけね

346:デフォルトの名無しさん
08/06/13 00:20:42
>>344、345
vs2005expressです。

347:デフォルトの名無しさん
08/06/13 11:55:15
>>346
だから、ちゃんと隔離用に作ってあるんだからCUDAスレに逝け。

348:デフォルトの名無しさん
08/06/16 17:47:08
TESLA、Firestreamといったボードは、3DCGでレンダーファームとして今すぐに利用できるのでしょうか？

349:デフォルトの名無しさん
08/06/16 18:17:35
URLﾘﾝｸ(pc.watch.impress.co.jp)
AMD、1TFLOPSの演算性能を持つGPGPU
「FireStream 9250」
使用スロットは1スロットのみで、消費電力は150W以下

350:デフォルトの名無しさん
08/06/18 06:36:23
AMDのHD4850が２万５千円だって
ゲフォの次のやつは７万円だって
CUDAの一人勝ちかと思ったけどそうでもないかもｗ

351:デフォルトの名無しさん
08/06/18 08:50:24
HavokがAMD対応を発表しててFireStream 9250が第3四半期…
その頃にはさすがにSDKもβが取れてるだろうからどうなるか分からんね
Photoshop CS4も10月頃だから年内にRadeon対応ソフトが現れたらそれほど差は付かない

352:デフォルトの名無しさん
08/06/18 09:07:34
URLﾘﾝｸ(www.amd.com)
AMDもOpenCL採用

353:デフォルトの名無しさん
08/06/18 10:51:26
まぁ、安いのはいいことだよなぁ
貧乏学生多そうだしな！ｗ

354:デフォルトの名無しさん
08/06/18 11:01:43
値段はともかく発熱量を下げてもらわんと、
ラック当たりの計算量が上がらない。

355:デフォルトの名無しさん
08/06/18 19:51:59
FireStream 9250は値段半額で発熱同じ、性能2倍じゃん

356:デフォルトの名無しさん
08/06/18 22:37:44
ゲロビディア氏ね

357:デフォルトの名無しさん
08/06/18 23:35:37
GPU2 6.12 beta 6 for ATIに付いて来るCALランタイムで
今までのドキュメントとは異なるDirectX協調用拡張関数確認。

calD3D9UnmapTexture
calD3D9MapTexture
calD3D9UnmapVertexBuffer
calD3D9MapVertexBuffer
calD3D9Associate（これは今まで通り）

引数が判らないしDisassociateはどうしたとツッコミ入れたいけど、とりあえず実装したみたい。

358:デフォルトの名無しさん
08/06/20 14:14:46
URLﾘﾝｸ(pc.watch.impress.co.jp)
RadeonHD 4850/4870　22,980円/34,980円
6月20日より順次発売

RadeonHD 4870
160sp * 2issue * 750MHz = 240GFLOPS

RadeonHD 4850/FireStream 9250
160sp * 2issue * 625MHz = 200GFLOPS

Tesla C1060
30sp * 2issue * 1500MHz = 90GFLOPS

GeForceGTX 280
30sp * 2issue * 1296MHz = 78GFLOPS

GeForceGTX 260
24sp * 2issue * 1242MHz = 60GFLOPS

359:デフォルトの名無しさん
08/06/20 14:30:14
何その変な計算

360:デフォルトの名無しさん
08/06/20 17:34:08
謎だな
つーか、800SPだよな

361:デフォルトの名無しさん
08/06/21 07:24:51
倍精度だろ

362:デフォルトの名無しさん
08/06/21 09:36:09
単精度で800だよ

363:デフォルトの名無しさん
08/06/21 10:06:34
だから>>358の算式は倍精度のパフォーマンス出す式だろ

364:デフォルトの名無しさん
08/06/21 13:07:45
URLﾘﾝｸ(forums.nvidia.com)

CUDAこんなに仕事速くて対応もすごい多いのにAMD何やってるのですかね？
やる気あるの？

365:デフォルトの名無しさん
08/06/21 14:32:36
PowerDirectorがAMDのビデオカードに対応するらしいから、モノ自体はあるんだろうけどね
開発環境も早く公開してくれるといいなぁ、倍精度考えると性能は段違いなんだから

366:デフォルトの名無しさん
08/06/21 17:13:37
CALのIL.PDFもってる人どこか
うぷっていただけませんか？

リンク切れててとれない

367:デフォルトの名無しさん
08/06/21 17:20:25
SDKに入ってるからインスコしろ。

368:デフォルトの名無しさん
08/06/21 17:24:08
>>367
そうなのかありがとう
ちょっとRadeon4850もう2枚買ってくる

369:デフォルトの名無しさん
08/06/23 23:42:11
CALのためだけに
Radeon4850買ってきますた

370:デフォルトの名無しさん
08/06/23 23:54:48
マゾだなぁ

371:デフォルトの名無しさん
08/06/24 00:03:47
ふひひｗありがと

372:デフォルトの名無しさん
08/06/25 00:45:00
AMDの奴って専用ドライバ入れないと開発できないんだな
めんどいな
Nvidiaは別になんもいらんのにしょぼい

373:デフォルトの名無しさん
08/06/25 03:39:04
逆ですよ。

374:デフォルトの名無しさん
08/06/26 23:13:34
URLﾘﾝｸ(japan.renesas.com)
組み込み向けだから絶対性能はGPUには勝てないけど、消費電力はずっと低そう
個人が簡単に購入できるものじゃないけど

375:デフォルトの名無しさん
08/06/26 23:16:13
CALってなんで ATI Catalyst? 8.6では動かないの？

376:デフォルトの名無しさん
08/06/26 23:51:49
しかもCALってドキュメント全部VisualStudio用なんだな
やる気なさ杉だな

AMDつぶれねーかなぁまじで

377:デフォルトの名無しさん
08/06/26 23:54:42
しかもCALのILドキュメントの記法がISOの
記述を遵守していない。ここの会社はドキュメントの
書き方もしらんのか？

378:デフォルトの名無しさん
08/06/27 00:16:08
このスレ監視してるラデ房うぜーなぁ
ほんとATIの奴等ってキモイ

379:デフォルトの名無しさん
08/06/27 00:18:07
元NDIVIAユーザーですが、なんだか情けなくてしょうがない。
そんなに必死になるなよ。
考えが偏ってて、客観的に見て痛いぞ。
性能の良い製品を使えばいい。ただそれだけ。

380:デフォルトの名無しさん
08/06/27 00:21:14
>>379
お前の発言の方が痛いぞｗ

381:デフォルトの名無しさん
08/06/27 00:23:11
下らんアオリしてないでプログラムの話しろよ

382:デフォルトの名無しさん
08/06/27 00:24:58
>>381
糞CALじゃなんもできませーん

383:デフォルトの名無しさん
08/06/27 00:25:06
>>380
どこが？
AMDつぶれろとか言ってる人よかマシじゃない？
考えが偏ってるからそんなことしか言えないんじゃない？ｗ
宗教レベルな信者ですね。考えが偏るわけですね、わかります。

384:デフォルトの名無しさん
08/06/27 00:26:03
本当にnVidia工作員は醜いな
自作PC板以外のスレを荒らす前に小売店の損失を補償してやれ

385:デフォルトの名無しさん
08/06/27 00:29:04
>>384
良いこと言った。
ってかNVIDIA工作員マジUZEEEE
性能が良く、コストパフォーマンスの取れるグラボを買うべきだろ？ふつうならな。
現状のNDIVIAで2.6万以下で4850よか良い製品俺に勧めてくれ。

386:デフォルトの名無しさん
08/06/27 00:30:15
>>385
9800GTX+来週買えばいいだろボケｗ

387:デフォルトの名無しさん
08/06/27 00:31:14
以後荒らしと工作員はスルーで

388:デフォルトの名無しさん
08/06/27 00:31:32
>>386
予価30K超える訳だが？
IDつけばNG出来るのに、ほんと工作員ウザイな

389:デフォルトの名無しさん
08/06/27 00:33:24
>>388
ゆとりちょっと消えてくれないか？
平行輸入品が26980円だが？

390:デフォルトの名無しさん
08/06/27 00:33:53
PCショップに勤めてるから、9800GTX+も9800GTXも刺して動かしたよ。
もうNVIDIA内で自爆するような製品の出し合いやめれｗ
一応感想だけど、9800GTX+は9800GTXとそんなにベンチマークしても思ってた通り、すばらしくなかった
その点値段的にも性能的にも4850は良かった。ファンだけ交換すれば申し分ないかな。
NVIDIAさん、店が損した分返してください

391:デフォルトの名無しさん
08/06/27 00:34:47
>>390
つーか自作板から流れてくるなよ屑どもが

392:デフォルトの名無しさん
08/06/27 00:36:39
cal_platofrm_spec.pdfが24ページしか無い件についてｗ
さすが半導体メーカの中でもっとも屑と言われたAMDの
仕事ですねｗ

393:デフォルトの名無しさん
08/06/27 00:38:20
GT200がコケたせいで、まだ正式リリースされていない開発環境の
ドキュメントに不備があると叩かなきゃならないほどに追い詰められてんのか…

394:デフォルトの名無しさん
08/06/27 00:38:49
いろいろなスレ見ちゃ悪いのか？
良い製品が違うメーカーから出て嫉妬してんじゃねーよ。
ATIをそんなに罵倒したいならNVIDIAがもっと良い製品出せよｗ
それからだなｗ
じゃあな

395:デフォルトの名無しさん
08/06/27 00:39:22
GPGPU的にはATIは無いわｗｗｗ

396:デフォルトの名無しさん
08/06/27 00:41:43
>>393
CALなんて絶対正式版リリースできないでしょう
CUDAは前回のバージョンから半年以内に2.0Βがでた
しかもその完成度はものすごいのに

まぁAMDは技術力ないから無理だろうけどねぇｗ

397:デフォルトの名無しさん
08/06/27 00:42:00
次はGT200+ですね、判ります。

398:デフォルトの名無しさん
08/06/27 00:43:48
4850がコスパや3D性能的に良いようだから、ATiのGPGPU環境とやらのドキュメントちょっと見てみたがなんか分かりづらいな
Brook+のドキュメントにのってるサンプルコード見た感じじゃ、まだシェーダ言語から脱却し切れてないようだし
演算器がVLIWってのもな。最適化面倒くせえぞあれ

個人的にはATi好きだし頑張って欲しいんだが、GPGPUとしてはまだ当分nVidia一択だな

399:デフォルトの名無しさん
08/06/27 00:44:07
つまりAdobeは正式版と永遠のβ版を比べて
それでもRadeonに対応する価値があると判断したわけだな…

URLﾘﾝｸ(www.4gamer.net)

400:デフォルトの名無しさん
08/06/27 00:45:35
いままでのNVIDIAの実力
昔：ATI新製品高性能→ゲフォ性能更新→ATIすぐ負ける
現在：ゲフォ新製品→ゲフォマイナーチェンジ（9800GTX+)で自爆→4850トドメ→ゲフォ新製品→ATIがまた出してゲフォ死亡

401:デフォルトの名無しさん
08/06/27 00:48:03
>>399
違うよ、AMD2万ドル、Adobe出資0で共同開発しているから
出してるだけ。まじな話Adobeの開発者が対応したのは
CUDAだけ、CALは金もらったからやるっていってるだけ
で対応するとはAdobe自身から一切発表は無い

402:デフォルトの名無しさん
08/06/27 00:48:42
2週間前だったらGPGPUはnVidiaの圧勝だろうと胸を張って言えたけど、
ここに来てAdobeのAMD製GPU対応とnVidiaの自爆が重なってどうなるか分からない模様になってきたな…

少なくとも信者論争とは無関係のスレで
他社製品を執拗に叩くのを営業戦略と勘違いしてる所は負けるだろうけど

403:デフォルトの名無しさん
08/06/27 00:48:44
>>399
まぁAdobeの事だし、どっちにもだすんじゃないか
それに開発環境はともかくとして、現状のGPU市場はnVidia/ATiの二強なんだし
ATiのに対応しないってのはさすがにデメリットがでかい

404:デフォルトの名無しさん
08/06/27 00:48:45
>>375
動くよ

>>376
VCに依存してないドキュメントの方が多いよ

>>377
ISOの記法って何？バックエンドでしかないCALをISOに承認させるわけ？

>>392
1ページ1関数のCudaReferenceManual.pdfを詰めて、3DAPIとの協調用関数をなくして、
ILの機能にあたる部分を削除して、CALでは分ける必要のない関数をまとめれば似たようなものになるね。

405:デフォルトの名無しさん
08/06/27 00:50:29
>>403
AdobeのnVidia対応はとっくに既出だよ
AMDのStreamSDKはまだ完成してないし、
このままCUDAが標準化するんじゃないか？と思われていた矢先にこの発表

406:デフォルトの名無しさん
08/06/27 00:52:03
2万ドルももらって出しませんとは本当でも言えんよな
ほんとうAMDってなりふりかまわず汚いですね

407:デフォルトの名無しさん
08/06/27 00:53:39
>>405
Adobeが対応するからといって、CUDAの優位は揺るがないだろｗ
確かにATiのはまだβ段階でしかないが、それを差し引いてもちょっと使いづらい
まぁ使う側としてはどっちでもいいからとっとと統一して貰いたいもんだが
トランスレーター作るっていうのでもいいけど

408:デフォルトの名無しさん
08/06/27 00:54:39
プログラマーが環境を選ぶんじゃなくて、
与えられた環境で組むのがプログラマーだろ
それを理解できないからと言ってだだをこねるのはタダの無能

409:デフォルトの名無しさん
08/06/27 00:55:18
お前ら自作板から援軍派兵するのやめろよｗ

410:デフォルトの名無しさん
08/06/27 00:55:36
>>407
CALは史上最悪の出来だぞ？
ハードの性能もベンチのみで実際のゲームはまともに
動作しないしな

411:デフォルトの名無しさん
08/06/27 00:56:59
nVidiaが勝てるように作られたVantageで負けちゃ世話無いわな

412:デフォルトの名無しさん
08/06/27 00:58:57
>>398
Brook+はBrookGPUをちょっと改造しただけの代物だから使いにくいよ。
未実装な部分が残ってたりでコンパイラがASSERTで落ちたりする。OpenCLが出ればそっちに統一でしょ。
VLIWはHLSLコンパイラの蓄積があるから差ほど大変じゃない。
今はBrook+ -> 独自拡張版HLSL -> CAL ILでコンパイルしてる。

>>401
Adobeからの「発表」であればCUDAを使うとは一言もなかったりする。
単にデモでGeForceを使っていて多分CUDAで書いたんだろうというだけ。
後はNVIDIAからの発表。

>>410
CALを使ったゲームが実際にあるなら教えてくれ。

413:デフォルトの名無しさん
08/06/27 01:04:51
OpenCLはAMD不参加だし
Intelから絶対参加することは認めないと
通告されてるしなｗ

まぁ捏造ベンチで喜ぶラデ房は本当おめでたいよｗ

414:デフォルトの名無しさん
08/06/27 01:05:05
頼みの綱はうんこCUDAだけか

415:デフォルトの名無しさん
08/06/27 01:06:32
>>413
大嘘こいて楽しい？

416:デフォルトの名無しさん
08/06/27 01:11:03
>>415
嘘じゃねーだろ、ATIのときの失敗で
Appleから未だに無視され続けてるの知らないのか？
IntelとAppleから絶対に参加させないって言われてるんだぞ？

417:デフォルトの名無しさん
08/06/27 01:13:37
妄想もココまでくると病気だな

418:デフォルトの名無しさん
08/06/27 01:15:19
>>416
ATiが嫌いなのはよく分かったから、後は日記帳にでも妄想書いとけ

419:デフォルトの名無しさん
08/06/27 01:16:26
Intel の誰が，Apple のどんな立場の人間がそんなこと言ってるんだ？ｗ

420:デフォルトの名無しさん
08/06/27 01:16:40
>>416
クロノスに投げてオープン規格目指してるのに拒否とかｗ
クロノスのプレスリリースでちゃんとIntelもAMDもNVIDIAもワーキンググループ入ってますよ。

421:デフォルトの名無しさん
08/06/27 01:17:54
今のMACに搭載されているVGA調べてみろ
どっちのVGAが載ってる？ん？

422:デフォルトの名無しさん
08/06/27 01:22:56
ここはム板なので、それ以上は自作PC板でやってくれ。
まぁ、元々プログラミングの話なんてほとんど出てないけどな。

423:デフォルトの名無しさん
08/06/27 01:24:05
CALなんてそもそも存在しないし

424:デフォルトの名無しさん
08/06/27 05:40:55
>OpenCLはAMD不参加だし

URLﾘﾝｸ(www.amd.com)
“We believe that OpenCL is a step in the right direction and we fully support this effort.
AMD intends to ensure that the AMD Stream SDK rapidly evolves to comply with open industry standards as they emerge.”

てか、なんでmacむけ3870が出たのか考えてみれば・・

ほんと必死だな

425:デフォルトの名無しさん
08/06/27 06:17:03
CUDA最強だなやっぱりCALなんてゴミもいいところ
所詮ATiの残党が作ったゴミ

426:デフォルトの名無しさん
08/06/27 08:13:24
URLﾘﾝｸ(ati.amd.com)

なんか更新された

427:デフォルトの名無しさん
08/06/27 08:20:00
>>426
嘘書くんじゃねーぼけ

このドキュメントは素晴らしいな
AMDには真似の出来ない品質だ
URLﾘﾝｸ(www.nvidia.co.jp)

428:デフォルトの名無しさん
08/06/27 08:22:40
理解もすごい進むしいい資料だ

429:デフォルトの名無しさん
08/06/27 08:37:09
ああ、誤訳だらけで鬱になれるね。
英語版を訳しながら読む方が未だましだし、それも前提となる知識があってのことだ。
それでも、ないよりはずっと有り難いのだけれどね。

430:デフォルトの名無しさん
08/06/27 08:38:00
>>429
>428のようにまともに日本語も扱えないような香具師には読んだ積もりになれるという点で丁度いいのだろ。

431:デフォルトの名無しさん
08/06/27 09:03:36
「エラー！ブックマークが定義されていません。」が多すぎてﾜﾛﾀ
こりゃAMDどころかどこも真似できんわｗ
これで正式版ｗｗｗｗｗ

432:デフォルトの名無しさん
08/06/27 09:35:09
>>427
更新されたよ。ちょっと前まではフォーラムへのリンクだけだった。

>>431
NVIDIAの日本語PDFにはよくあること。

433:デフォルトの名無しさん
08/06/27 09:43:37
どうせOpenCLになるんだろうし、どっちでもよかろうに・・・
今の乱立状態がユーザーにとってもデメリットしかないってのは確かなんだから
歓迎すべき事だと思うんだけどなぁ、各社の参加は

434:デフォルトの名無しさん
08/06/27 10:39:34
「OpenCLにはMicrosoftが加わっていない」
「DirectX11でGPGPUをサポートするらしい」
とかでOpenCLはOpenGLみたいな立場になるとか言われてるみたいｄ

435:デフォルトの名無しさん
08/06/27 10:47:04
問題は現状のリソースがそのまま利用出来るのか
買い替えが必要なのかだな

436:デフォルトの名無しさん
08/06/27 18:12:08
Microsoftは独自にDirectX用のCLを作るよ
OpenGLみたいに誰も使わない規格を使う
理由がないからねぇ

437:デフォルトの名無しさん
08/06/27 18:28:14
Radeonの存在意義も解らないよね？

438:デフォルトの名無しさん
08/06/27 18:42:06
ID出ない板だとほんと特定個人が暴れ放題だな…
そんなに必死になっても現実はNVのシェアが落ちていく一方ですよっと

439:デフォルトの名無しさん
08/06/27 18:52:34
>>438
FUD流して何面白いの？頭おかしいにもほどがあるな

440:デフォルトの名無しさん
08/06/27 19:55:23
これだからATI厨は困る・・・
捏造までして叩くのか・・・

441:デフォルトの名無しさん
08/06/27 20:15:05
アチは本当すぐ捏造するしねぇ
チートドライバ作り出すし

442:デフォルトの名無しさん
08/06/27 20:35:34
おまいら頼むから自作板のvsスレでやってください。

443:デフォルトの名無しさん
08/06/27 20:36:55
ベンチスコアは捏造。ドライバは糞。字も書けない。
ATI最悪！

444:デフォルトの名無しさん
08/06/27 20:51:43
>>442
俺らは悪くないニダ
悪いのはAMDニダ

445:デフォルトの名無しさん
08/06/27 20:56:20
Nvidiaさん、ボイド復帰型何よこれ？

446:デフォルトの名無しさん
08/06/27 21:02:18
>>444
当たり前だろ
ATIが4000シリーズを出さなきゃ、9800シリーズの値下げもなかった。
消費者もショップも被害はなかった。全てATIが原因。

447:デフォルトの名無しさん
08/06/27 21:08:50
nVidia工作員を装ったATi信者を装ったnVidia工作員を装ったATi信者を装った…（ｒｙ

以下無限ループ

448:デフォルトの名無しさん
08/06/28 11:49:55
ここの人間にとっては、描画性能では明らかに劣っているnVIDIAのカードが
描画性能相応に暴落してくれる、というのは非常にありがたい状況だな。

市販のHD 4xxxは倍精度演算を殺してるし、開発環境もnVIDIAの方が整っている。

他の板ではどんどんnVIDIAを叩いてほしい。
が、ここでは邪魔だから止めてね。

449:デフォルトの名無しさん
08/06/28 11:54:34
GPUで整数演算がしたいです。

450:デフォルトの名無しさん
08/06/28 11:59:09
整数演算ってどうやってするの？

451:デフォルトの名無しさん
08/06/28 12:15:06
別にnVIDIAの話は専用にスレあるからここではいくら暴れてくれも平気だよ

452:デフォルトの名無しさん
08/06/28 12:19:36
>>448
殺してるって証拠はある？

453:デフォルトの名無しさん
08/06/28 12:47:14
>>452
URLﾘﾝｸ(pc.watch.impress.co.jp)
って記事があるけど単精度1TFLOPS以上と書いてあるので使われてるコアはHD４xxx系のはず
BIOSレベルで隠蔽してるのか、回路焼いてるのかは不明

MODで倍精度ONに出来れば…　ゴクリ…

454:デフォルトの名無しさん
08/06/28 12:52:54
>>452
URLﾘﾝｸ(pc.watch.impress.co.jp)
>AMDはグラフィックス製品では倍精度は有効にせず、GPGPU向けの「FireStream」系列でのみ倍精度をサポートする見込みだ。これは、グラフィックス製品で倍精度をサポートするNVIDIAとの大きな戦略の違いだ。

455:デフォルトの名無しさん
08/06/28 12:58:35
>>453
それRV670でも同じこと言われてたけど、結局FireStream化どころか何もせずにHD3xxxで倍精度演算できるよ。

456:455
08/06/28 12:59:07
×>>453
○>>454

457:デフォルトの名無しさん
08/06/28 16:14:07
Nvidiaがハードレベルで圧倒的に優れている証拠を見せてやろう

URLﾘﾝｸ(www.4gamer.net)

Radeonなんてゴミもいいところｗ

458:デフォルトの名無しさん
08/06/28 16:28:45
>>457
Geforce最強すぎる

459:デフォルトの名無しさん
08/06/28 16:58:18
GTX280ってあんだけ高いのに8800GTより性能低いのか…
買う価値無いな

460:デフォルトの名無しさん
08/06/28 17:06:51
>>457-459
その画像はSP1個当たりの性能な
URLﾘﾝｸ(www.4gamer.net)

8800GTは112基
GTX280は240基
HD3650は120基
HD4850は800基だから
実際の演算能力は
HD4850＞GTX280＞8800GT＞HD3650

461:デフォルトの名無しさん
08/06/28 17:10:20
>>460
SP800？ダントツじゃん

462:デフォルトの名無しさん
08/06/28 17:30:53
その記事の誤差のところのHD3650どうなってるんだろ？
これって繰り返し計算の累積誤差じゃなくて、1回計算しただけの誤差かな？
赤と緑のグラフの意味もその記事じゃ分からんな。
（ググってみたら最大誤差と平均誤差らしい）

AMDがGPGPUに消極的だったのは、この辺が関係してそうだね。

463:デフォルトの名無しさん
08/06/28 17:33:47
とりあえずGeforce最強これは紛れも無い事実
そしてRadeonは捏造ベンチ+精度落とした偽造
ドライバ利用が確定した

464:デフォルトの名無しさん
08/06/28 17:37:29
とりあえず
GPGPUやってない奴は消えろ

465:デフォルトの名無しさん
08/06/28 17:38:57
やってるよー
倍精度も計算できない糞Radeonなんて使いませんがwwww

466:デフォルトの名無しさん
08/06/28 17:41:48
だから出来るってば。

467:デフォルトの名無しさん
08/06/28 17:43:35
できねーよ。ソース出してみろやｗ
嘘つくのやめてほしいなぁ

468:デフォルトの名無しさん
08/06/28 17:46:26
ほら出てこないｗ

469:デフォルトの名無しさん
08/06/28 17:50:18
出来ないソースを出す方が先だろ

470:デフォルトの名無しさん
08/06/28 17:56:58
>>467
これでいいか？
URLﾘﾝｸ(www1.axfc.net)

471:デフォルトの名無しさん
08/06/28 17:58:31
画像なんて合成できるしねぇ
おっと用事思い出した

472:デフォルトの名無しさん
08/06/28 18:00:50
はいさようなら。邪魔だからもう来なくていいよ。

473:デフォルトの名無しさん
08/06/28 18:48:17
これfloatで出してるだけじゃねーかｗ
危うく騙されるところだった

474:デフォルトの名無しさん
08/06/28 19:05:35
は？

475:デフォルトの名無しさん
08/06/28 19:07:35
そのうさんくせーサンプルで小数点7桁まで
出してみろやｗでねーだろ？謝っちまえよ？

476:デフォルトの名無しさん
08/06/28 19:16:18
> そのうさんくせーサンプルで小数点7桁まで
ソース読んだのならツッコミどころ間違ってると思うよ。

477:デフォルトの名無しさん
08/06/28 19:19:47
久しぶりに声出して笑えた
ありがとう

478:デフォルトの名無しさん
08/06/28 21:16:22
>>475
printfの内容は%fじゃないよな？

479:デフォルトの名無しさん
08/06/28 21:39:22
これだからNV厨はダメだね

480:デフォルトの名無しさん
08/06/28 22:35:52
CAL書きやすくね？とか思う俺は変態？

481:デフォルトの名無しさん
08/06/28 23:22:05
バイナリアンか何かですか？

482:デフォルトの名無しさん
08/06/28 23:57:51
まあどうせDX11までGPGPUは日陰の存在

483:デフォルトの名無しさん
08/06/28 23:59:50
焼き直しで古い論文実装するだけで
予算も付くし美味しいんだけどね

484:デフォルトの名無しさん
08/06/29 01:38:29
画像処理目的でAMDのStream SDKを触り始めたんだけど
1ピクセル=8ビット
でWidth x Heightみたいなデータを扱う事って出来ないのかな？？

なんかBrook+を使う時点で32ビット縛りで、CALを見てみたら非常に難しくて・・・

485:デフォルトの名無しさん
08/06/29 04:25:19
Cg≒HLSL見たいに上手く良くか
intelが横槍入れそうだな

Nvidiaの最高経営責任者（CEO）であるJen-Hsun Huang氏は先週インタビューで、
AppleにはWWDCを盛り上げるための一環として、NvidiaのCUDAテクノロジに関する計画があるかもしれないことを示唆した。
Huang氏は、「AppleはCUDAについて熟知している」と述べ、
同社が、Macでのグラフィックスチップの活用をより簡単にするため、
このNvidiaの技術を正式に採用する準備が整っている可能性を示唆した。
Appleは同技術を実装する際、「CUDAとは呼ばず、別の呼び名を付けるだろう」とHuang氏は、
4日にNvidiaの本社で行われたインタビューで述べた。
URLﾘﾝｸ(japan.cnet.com)

Apple社，「Mac OS X」の次期バージョン「Snow Leopard」も公開，GPGPUに対応へ
GPUで汎用計算を行うアプリケーション・ソフトウエアの開発には，
C言語を拡張した新しい言語「OpenCL（open computing language）」を利用する。
URLﾘﾝｸ(techon.nikkeibp.co.jp)

Khronos Groupが「Compute Working Group」を設置，メーカー非依存のGPGPUを目指す
Khronos Groupは既に米Apple Inc.が，さまざまな用途でGPUとマイクロプロセサの
計算資源を活用するためのC言語に基づくプログラミング言語
「Open Computing Language（OpenCL）」を提案済みであることを明らかにした。
URLﾘﾝｸ(techon.nikkeibp.co.jp)

ハードウェアベンダーと繋がり無くGPGPU対応は難しいから
MS単独で変な言語作ることはないだろう
AMDはOpenCLをバックアップしてるから
あとはCtを提唱してるintelがどうなるかだけ
MSがintelと組んだらややこしくなる

次ページ