OpenCLプログラミング#1

OpenCLプログラミング#1at TECH

OpenCLプログラミング#1 - 暇つぶし2ch2:デフォルトの名無しさん
08/12/10 15:57:47
ひとまずwgetじゃなくて2get
Mac界隈ではCore Imageみたいにかなり使われそうだけど他のプラットフォームではどうなるかな?

3:デフォルトの名無しさん
08/12/10 19:55:47
仕様策定にあたり、国内メーカはほとんどなし？

NやFなどのスパコンメーカは入っていてもよさそうなのに…

4:デフォルトの名無しさん
08/12/10 20:08:08
イマイチだなこりゃ
極一部で流行って終了の予感

5:a36 ◆K0BqlCB3.k
08/12/10 20:10:45
>>2
まだGPGPUでどんな事ができるのか模索している段階ですので、
キラーアプリが早い段階で出てこないとOpenCLを標準化するのは
難しくなっていくと思います。
Microsoftや他の団体が別の標準を作ってしまってからでは
OpenGLとDirectXのような亀裂を生んでしまうでしょう。

6:a36 ◆K0BqlCB3.k
08/12/10 20:12:58
とりあえず、仕様書の翻訳を始めるために許可とってきます。

7:デフォルトの名無しさん
08/12/10 20:27:22
SpursEngineが対応しそう。
URLﾘﾝｸ(www.watch.impress.co.jp)

8:デフォルトの名無しさん
08/12/10 20:49:11
>汎用API「Open CL」への対応も「好きな奴がいて、
>仕事の合間にやっている」（同氏）とのこと。これが実現すると、
>「同じプログラムがCPUでもGPUでもSpursでも動く」
>という環境になるが、進行状況については「上司からお金が
>もらえなくても、コツコツと（笑」なのだとか。

期待できるのかなw

9:デフォルトの名無しさん
08/12/10 21:27:51
金出してやれよ

10:デフォルトの名無しさん
08/12/10 22:04:54
Pixelmatorとか対応しそうじゃないか?
したらPhotoshopを超える最強アプリになる予感。

11:デフォルトの名無しさん
08/12/10 22:25:22
いまいち分からん。
CUDAとOpenCLって何が違うんだ?
誰か詳しい人説明頼む。
URLﾘﾝｸ(www.nvidia.com)

12:デフォルトの名無しさん
08/12/10 22:29:24
簡単に言うと、NVIDIAが独自にGPU用に作ったのがCUDAで、
GPU以外のデバイスも視野に入れられて作られようとしているのがOpenCL。

13:デフォルトの名無しさん
08/12/10 22:33:06
寿命短そうだな

14:デフォルトの名無しさん
08/12/10 22:34:08
>12
thx
GPU以外ってことはLarrabee(これでスペルあってる?)や>>7の言うようにCellか?

15:デフォルトの名無しさん
08/12/10 22:43:28
想像だけど、ClearCaseやTerareconのようなデバイスメーカも対応せざるを得なくなるかもね。
CPUでも実装可能だし、当然ララビーも対応してくるんじゃない?

16:デフォルトの名無しさん
08/12/10 22:52:56
iPhoneの例のスレと似たふいんき・・・何なの

17:a36 ◆K0BqlCB3.k
08/12/10 23:17:58
■Khronos Group発表ニュースリリースの抄訳
URLﾘﾝｸ(www.khronos.org)

■OpenCL 1.0 仕様書(英語)
URLﾘﾝｸ(www.khronos.org)

■cl.h - OpenCL 1.0 ヘッダファイル
URLﾘﾝｸ(www.khronos.org)

■cl_gl.h - OpenCL 1.0 OpenGLインテグレーションヘッダファイル
URLﾘﾝｸ(www.khronos.org)

■cl_platform.h - OpenCL 1.0 環境依存マクロ
URLﾘﾝｸ(www.khronos.org)

※まだ OpenCL 1.0 ツールキットはリリースされていません

18:デフォルトの名無しさん
08/12/10 23:30:05
さらっとサンプルソース見たけど
clCreateProgramWithSourceに渡すのはソースのテキストそのままだけど、
clCreateProgramWithBinaryに渡すバイナリって何だろ、
そのバイナリってデバイス間で互換性あんの？

19:デフォルトの名無しさん
08/12/10 23:36:32
CUDA向けに書いて少しいじればOpenCLでも動くのかな?
URLﾘﾝｸ(www.appleinsider.com)

20:デフォルトの名無しさん
08/12/11 00:25:28
少々スレ違いだけどKhnoros Groupって他の標準化もやってたのか。
OpenVG(オープンなベクターグラフィックスAPI)
URLﾘﾝｸ(journal.mycom.co.jp)

21:デフォルトの名無しさん
08/12/11 00:49:08
なんなのこのふざけた名前

22:デフォルトの名無しさん
08/12/11 03:46:32
>>14
重箱隅ですがspursはCell規格じゃないですよ。PPEねーし。

PS3以外のCellにOpenうんちゃらみたいな標準規格って需要あんのかな？
IBMのCellスパコンとかは、素人目には専門家がカリカリチューニングしてそうな印象あるし

OpenGL以外におけるKhronosをどこまで信用して良いのかもいまいち。
COLLADAとか半端仕事な印象拭えないんだよな……。使ってるとこは使ってんだろか？

23:デフォルトの名無しさん
08/12/11 21:38:21
>>22
PS3 みたいなガチガチに決まってる奴にこそ不要だろ。

例えばこういうの
URLﾘﾝｸ(www.hirax.net)
こそ、OpenCL的なものが実力を発揮しやすい。
で、この機能がDVカムとかに普及したとしよう。
OpenCL で実装しておけば、次のバージョンの製品の該当部分を、OpenCL 対応の別のチップに変更することも出来る。Cell から nVidia へというように。

これは一例だが、要するに標準規格への需要はある。
だけど、汎用性は効率とのトレードオフでもあるし、ネガティブな要素を数え上げればきりがない。

現段階で普及するかどうかを予測するのは無意味に近いが、今なら先行者利益に預かれるかも知れない。

24:デフォルトの名無しさん
08/12/12 21:58:03
組み込み関連の所が多いって所にやっぱメディア系の家電とかへの需要が期待されてるのかね
車載とか携帯電話もありうるのかな

25:デフォルトの名無しさん
08/12/13 06:17:58
>>24
ありうるけど、まだ高価すぎる。
PIC や DSP なみにコモディティ化したら、みんなが使うだろう。
組み込みにとっては、CUDA か CL かというのは、次かその次の世代の話だろう。

ま、現場はアレもコレも知っとかないとねｗ

26:デフォルトの名無しさん
08/12/13 08:55:49
これれは今出てるiPhoneでも使えるのかね

27:デフォルトの名無しさん
08/12/13 10:14:46
>>26
ARMはSIMDらしいよな。
Appleがやってくれるかもしれん。

28:デフォルトの名無しさん
08/12/15 02:44:31
DsPICってのも有るし、しかも最近clockがどんどん上がってる。
このPICに載ってるDSPの数が増えたら8bitのGPGPUって感じじゃね?

29:デフォルトの名無しさん
08/12/15 09:32:57
dsPIC m9（＾Д＾）ﾌﾟｷﾞｬｰｰｰｯ

30:デフォルトの名無しさん
08/12/17 03:23:32
なんでこのスレでdsPICの名前が
CLで叩く意味はちょっと見出せないw

31:デフォルトの名無しさん
08/12/18 03:06:23
これは楽しみだわ

32:デフォルトの名無しさん
08/12/22 21:22:09
spec読んだけどcudaに毛が生えたようなもんだね
メモリ階層もモデル化したと言うけど、ほぼ現行のGPUが前提。
興味なくなった。

33:デフォルトの名無しさん
08/12/22 21:51:48
1.0だからな・・・
Intel VTと同じで2.0からが本気なんだよｗｗｗ

34:デフォルトの名無しさん
08/12/23 14:09:23
Open CLって結局なんなんだよ

35:デフォルトの名無しさん
08/12/23 19:27:26
URLﾘﾝｸ(journal.mycom.co.jp)

36:デフォルトの名無しさん
09/02/15 19:12:01
2009年，本格始動するGPGPUの世界・後編～GPGPUのプラットフォーム動向
URLﾘﾝｸ(www.4gamer.net)

37:デフォルトの名無しさん
09/02/15 19:15:04
>>32
>OpenCLについて，「Direct3DにおけるDirectX Compute Shaderのようなもの？」
>というイメージを抱くかもしれないが，コンセプトや実現様式が微妙に違う。
>
>最大の違いは，OpenCLが，GPUだけを対象としているわけではないということだ。
>x86プロセッサやCellプロセッサといったCPU，あるいは DSP（Digital Signal Processor）
>のようなメディアプロセッサなどのプログラミングに対応するコンセプトを持っており，
>GPUに特化したDirectX Compute Shaderとは似て非なるものだといえる。

38:デフォルトの名無しさん
09/02/15 20:17:07
>>37
大丈夫、DSPがOpenCLに対応する可能性は限りなく低いから。
まして、x86プロセッサでOpenCL対応するくらいならCt使う方が遥かにまし。

39:デフォルトの名無しさん
09/02/15 22:24:19
つーかOpenCLってとりあえずMac用でしょ

40:デフォルトの名無しさん
09/02/15 22:27:21
なんで？

41:デフォルトの名無しさん
09/02/15 22:30:45
OpenCLの規格化作業を猛烈に推し進めたのがアップルだから

42:デフォルトの名無しさん
09/02/15 22:42:22
だからMac用？
どうして？

43:デフォルトの名無しさん
09/02/15 22:42:47
>>38
なんか理解できてないようだけど、
こいつの価値は並列処理にあると思う。
要するに今までのGPGPUは、GPUによる高速化
というのがメインだったけど、OpenCLの場合は、
CPUとGPUで並列処理が可能になる。

元々はAppleとNVIDIAが協力して、CUDAを基礎に
した（と思われる）ものを、さらに標準化の過程で
より汎用性を重視して、GPUに依存しないよう設計
にしたものがOpenCL。

44:デフォルトの名無しさん
09/02/15 22:48:46
>>42
大丈夫、Mac専用じゃないよ。
Appleが規格の孤立化を避けるのが目的だと思うけど、
最初からオープン標準化にこだわって作られた規格。

規格の策定作業のメンバーにはIntelやAMD、NVIDIA、
ソニーなど、MSを除く主要企業は全て参加しているし、
OpenGL（ES）との連携やスマートフォンへの対応もあるし、
これから先、携帯端末全盛の時代の最有力候補でもある。

45:デフォルトの名無しさん
09/02/15 22:50:10
>>44
あんたに聞いてないんだよ

46:デフォルトの名無しさん
09/02/15 23:06:31
>>45
あうごめんｗでも答えちゃうよ？

Mac OS X Snow Leopardに実装されるのがOpenCLで、
Windows7/vistaに実装されるのがDirectX Compute Shader。
どちらのGPGPU技術もまあ競合するものだわさ。

スマートフォンへの実装は別にして、DirectX系技術はWindows限定だし、
OpenCLにはオープンな技術というメリットがある。ただし、Windowsが市場を
ほぼ独占してるPC業界にとって、有力なのはやはりDirectX Compute Shader
の方になる。だから当面、OpenCLの主要プラットフォームがとりあえず
Macなのは致し方ない現実、という考え方じゃないのかな？

もちろんマルチプラットフォーム化を重視して、Windows環境下でも
OpenCLを採用する企業も当然存在するとは思うけど。

47:デフォルトの名無しさん
09/02/15 23:13:48
>>46
お前の意見なんてどうでもいい
マジで黙ってろクソ野郎

48:デフォルトの名無しさん
09/02/15 23:18:30
>>47
あうごめんｗでも答えちゃったよ？

49:デフォルトの名無しさん
09/02/16 18:57:22
で、まだかね？

50:デフォルトの名無しさん
09/02/17 11:40:11
マルチコア動作版くらいそろそろ出せよ　ｶﾞｵｰ

51:デフォルトの名無しさん
09/02/17 11:44:25
てかDirectXは独自に実装するみたいだが
MSは意地でも標準化を妨害したいらしいｗ

52:デフォルトの名無しさん
09/02/17 12:35:14
妨害つーか、OpenCLはOpenGLとは連携するが
Direct3Dとは連携しないので、MSが自前で作るしかない。

53:デフォルトの名無しさん
09/02/21 19:01:40
MSはどっちかっていうとマルチCore CPUをグラフィックに活かそうとしているよね。
逆。

54:デフォルトの名無しさん
09/02/21 19:03:43
>>52
MSはCompute Shaderを準備中。

55:デフォルトの名無しさん
09/02/26 00:45:30
言語はC99ベースだからいいかと思ったけど、再帰が使えないのは痛いな。
Cで書いてコンパイルしたバイナリと、OpenCLで書いてコンパイルしたバイナリを
リンクできればいいな。

56:デフォルトの名無しさん
09/02/26 11:20:43
.objが中間コード的なものだったら出来たかもね。

57:デフォルトの名無しさん
09/02/28 03:39:12
再帰なんていらね

58:デフォルトの名無しさん
09/04/02 08:17:35
並列化しやすい問題で結構使うぞ、再帰探索は
こっち方面はIntelに期待するしかないかもね

59:デフォルトの名無しさん
09/04/02 23:41:47
時間とメモリの使用量が不定になるからねぇ。
OpenCLの主戦場を考えるとどうなんでしょうか。

60:デフォルトの名無しさん
09/04/03 01:52:09
再帰するようなアルゴリズムの場合、命令ポインタの動きに一意性がないし
決してデータレベル並列ではないんだよな。
SIMDでは命令ポインタが要素ごとに独立、というわけにはいかない。
プレディケートをやるのは逆に言うと自由に分岐ができないことの現れだし。

61:デフォルトの名無しさん
09/04/11 13:13:33
ほしゅ

62:デフォルトの名無しさん
09/05/03 23:04:11
まだ？

63:デフォルトの名無しさん
09/06/14 18:31:47
>>55
残念だが OpenCL C は Java や .NET のような中間コードで
OS 上のドライバがリアルタイム翻訳するからリンクは無理。

だが OpenCL を利用する本体は何でもいいから
C や C++、Objective-C なんかで再帰検索すればいい。

64:デフォルトの名無しさん
09/06/20 18:47:32
企画書ってどこで読めるの？

65:デフォルトの名無しさん
09/06/20 20:41:46
>>64
OpenCL 1.0 仕様書
URLﾘﾝｸ(www.khronos.org)

66:デフォルトの名無しさん
09/06/21 04:07:00
Appleが用意したOpenCLの技術解説のpdfのリンク貼っとく
URLﾘﾝｸ(images.apple.com)

67:デフォルトの名無しさん
09/06/29 13:32:04
OpenCLのCPU動作版って公式で作るのか？
それとも誰か作ってる人が居る？

68:デフォルトの名無しさん
09/06/30 20:18:36
Intel か Apple が CPU 用 OpenCL ドライバを作成すれば問題ない。

Windows や Linux の他社 OS や
AMD などの他社 CPU などで動作するドライバは
やっぱり公式待ちかな。

個人で Java VM や GPU Direct3D/OpenGL ドライバを
作ってしまえる人が興味を持ってくれたら話は別だけど。

69:デフォルトの名無しさん
09/06/30 20:23:54
スノレパにはCPU用ドライバが付いてくるでしょ

GPUよりも数十倍から100倍以上は処理が遅いCPUで
Open CLを動かす価値が有るかはわからないけれど

70:デフォルトの名無しさん
09/06/30 20:34:15
>GPUよりも数十倍から100倍以上は処理が遅いCPU
という夢を見ている

71:デフォルトの名無しさん
09/06/30 20:46:55
Core 2 Quad QX9775： 102.4 GFLOPS
Radeon HD4870：1.2 TFLOPS（1200 GFLOPS）

一桁余分だな。

72:デフォルトの名無しさん
09/06/30 23:19:38
このスレで言うのもなんだが並列処理って知ってる？

73:デフォルトの名無しさん
09/07/01 00:44:41
CPU と GPU を並列に走らせて 10 が 11 になるよりも、
その１をUIやGPUが苦手な処理を与えたほうがいいんじゃね？

マルチタスク（プロセス）的にも CPU は空けておきたいかも

74:デフォルトの名無しさん
09/07/01 02:58:17
CPUよりGPUのが早いってことになってるけど
それは実は大嘘でちゃんとマルチコアで作りこんだらスピードは大差ない
GPUメーカー製のドライバはCPUでも動くような振りだけは実装するだろうけど
絶対にまともな実装はしない、ばれるから
だからちゃんとしたCPUメーカーか第三者が作ったものが必要

75:デフォルトの名無しさん
09/07/01 03:05:43
>>71
それは理論的な演算速度だけだとそうだけど
メインメモリからデータを取り出して結果を戻すのに要する時間で計算すると
遥かにCPUの方が早い

76:デフォルトの名無しさん
09/07/01 06:44:02
結局ワークロード次第なのだがGPUが明らかに速い分野なんて非常に限定的で馬鹿にされまくっているのが実情
GPGPUは過去のEPICと被るな

77:デフォルトの名無しさん
09/07/01 11:17:39
>>74
なんでGPUメーカーがCPU用ドライバを作るんだよ。
DirectXですらCPU用ドライバはＭＳが作ってるんだぜ？

>>75
特定分野に関してならメモリアクセスは速いでしょ。
じゃないと3Dレンダリングが使い物にならないものになる。

結局プログラマがどれだけ局所化を行えるかだろうね

78:デフォルトの名無しさん
09/07/01 14:42:50
>>77
３Dは転送する情報量は頂点座標だけなんだからCPUより早いのは当たり前でしょ
CPUのネックはメモリ転送速度だって言ってるでしょ
大量のデータを計算するような用途ではどんな工夫をしようがCPUには勝てない

79:デフォルトの名無しさん
09/07/01 14:45:50
しかも分散処理する部分は複雑に作りこんでないから
計算してる間は描画が止まるからな
計算してる間は文句なしに画面描画が止まる
CPUだと計算負荷に応じて外も動くけど

80:デフォルトの名無しさん
09/07/01 14:51:59
>>78
だからそのCPUでは勝てない分野でGPUを有効活用しようっていうのがGPGPUでしょ

映像のエンコードしかり、ゲノムの解析しかり超大量のデータ処理を肩代わりしたり、
またはAIなどの人工知能やMSのProject Natalみたいなものを実現するため、とか

81:デフォルトの名無しさん
09/07/01 14:57:20
>>79
だからGPUの仮想化とかマルチタスク処理とかがあるんでしょう

3Dゲームとかでもない限り 1/60 秒毎に画面描画を
挟むのはたいした負荷でもないレベルだし。

GPUでは小回りが利かない部分を管理するのがCPUの得意分野

82:デフォルトの名無しさん
09/07/01 17:58:11
>>80
だから今の構造だとCPUでは勝てない分野が３Dポリゴンの描画しかないのｗ

83:デフォルトの名無しさん
09/07/01 17:59:09
>>81
>>GPUでは小回りが利かない部分を管理するのがCPUの得意分野

現状と何も変わらない

84:デフォルトの名無しさん
09/07/01 18:03:26
本来ならGPUの機能はCPU内部にあるべきだが、
IBMやINTELはサーバとか大規模計算方面ばかり気にして3Dとかグラフィックとかを軽視していたから、
見るに見かねた人がGPUなんてものを作ったんだよね。

85:デフォルトの名無しさん
09/07/01 18:04:59
GPUって、本質的に見たらやってることはCPUと変わらないのに、
CPUとバスを経由して通信している分無駄があるんだよね。
だから将来的にGPUはCPUに飲み込まれるのが健全だと思うね。

86:デフォルトの名無しさん
09/07/01 18:11:33
行列積とか倍精度でもGPUの方が速いだろ。

87:デフォルトの名無しさん
09/07/01 18:23:10
>>86
そういう処理をするCPUの命令の一つにしてしまえば良い。

88:デフォルトの名無しさん
09/07/01 18:44:55
>>86
だから計算対象のデータをGPU側に引き渡してる間にCPUで計算出来るっつー話だわな

89:デフォルトの名無しさん
09/07/01 18:47:34
>>88
いや、まぁ実際にそういうことが多いわけだけど、俺が言いたいのそうじゃなくて、
GPUをCPUに統合するのが健全だと言っているだけであって・・
夢見がちな俺の願望でしかないわけだが。

90:デフォルトの名無しさん
09/07/01 21:55:32
>>89
今その方向に向かっているな。
AMDそのためにATIを買ったんだし、GPU専業のNvidiaは焦っている。

91:デフォルトの名無しさん
09/07/01 22:00:36
ハードだけ買ってもOpenCLはじめソフトがｇｄｇｄ
このままだとIntel最強ってゆー何時もの結論で終了する

92:デフォルトの名無しさん
09/07/02 01:07:12
マカーとして言わせてもらえばQuickTimeとAdobe CSくらいが対応してくれれば対応アプリとしては十分な気がするんだよな
OpenCLが一番活用できそうなのって結局画像動画関連だし
それにCoreImageやCoreVideoがCPUでも動いたようにOpenCLもCPU上で動かせるから未来がどっちに転んでも技術としては問題ないと思う

93:デフォルトの名無しさん
09/07/02 01:20:12
夜のお供に漫画ビューアにもな。

94:デフォルトの名無しさん
09/07/02 10:11:18
画像ビューアはCPUで処理したほうが速いだろ

>>89
Intel Larrabee というGPUは Pentium MMX というCPUに
GPU用のベクタプロセッサを沢山積んだモノになるよ。

で、そこで培った技術で後々 CPU 命令に GPU 命令が内蔵される。

>>92
Adobe CS4 はすでに CUDA や ATI Stream に対応しているから
下位互換でしかない OpenCL に対応する意味は余り無い。

95:デフォルトの名無しさん
09/07/02 12:51:12
DCのデモでも、CPUより早く動かすの苦労してたよ。
データ数が半端無く多くないとCPUを上回れない。

96:デフォルトの名無しさん
09/07/02 12:56:37
茸の左をひょいひょい躱した粟生と
リナレスの鬼速ジャブ…

この対決は興味深いぜ

97:デフォルトの名無しさん
09/07/02 16:12:28
CPUとは別に画像処理などに有用なコプロセッサが１つ
PCやMacで眠っているからそれも使おうって方向でいい。

98:デフォルトの名無しさん
09/07/02 19:12:15
昔はコプロって別売りだったな。

99:デフォルトの名無しさん
09/07/02 20:12:40
GPUの得意分野は浮動小数点数のベクタ演算だからなおさらコプロちっく

100:,,・´∀｀・,,）っ-○○○
09/07/02 20:52:46
Larrabeeって次世代の8087って位置づけなんだろうな

101:デフォルトの名無しさん
09/07/03 02:14:02
数年後にはCPUに統合されるのがわかりきっているけどな

102:デフォルトの名無しさん
09/07/03 02:15:26
そのさらに数年後には独立されるだろう

103:デフォルトの名無しさん
09/07/03 02:58:35
CPUだけじゃ最先端3Dレンダリングを処理しきれないｗって理由で、か

104:デフォルトの名無しさん
09/07/03 04:19:19
画期的なメモリバス技術でも開発されれば統合プロセッサのまま進化を続けるんじゃないかな

105:デフォルトの名無しさん
09/07/03 06:38:34
ワイドテレビでこんなに広く！→縦が伸びてこんなに広く！→ワイドになって（ｒｙ

106:デフォルトの名無しさん
09/07/03 22:50:21
CPUはある意味CELLの行く道が正しかったのか？

107:デフォルトの名無しさん
09/07/03 22:56:22
>>105
ますます家が狭くなるがな

108:デフォルトの名無しさん
09/07/04 15:37:52
OpenCL自体は普通にマルチスレッドのフレームワークに使えるから期待してるんだけど
出来ればクラスタリングとかにも対応して欲しいが

109:デフォルトの名無しさん
09/07/04 17:43:55
OpenCL って Direct3D のシェーダ言語同様にドライバによる
インタプリタだと認識しているけど並列計算のフレームワークとして使えるの？

OpenMP や Grand Central Dispatch じゃダメなのだろうか

110:デフォルトの名無しさん
09/07/04 18:47:02
演算シェーダ相当の抽象化レイヤと考えて問題ないよ
汎用的な並列計算はOpenMPやGCDの方が適切。そのままマルチコアCPUをターゲットにした方がいい
OpenCL適用できる分野は「並列計算」の中のさらに「GPUに適した」特殊なアルゴリズム分野になる
とにかくデータを小さなブロックに小分けして、延々と同じ処理繰り返すようなの

111:デフォルトの名無しさん
09/07/04 19:29:33
標準化されてることに意味がある

112:デフォルトの名無しさん
09/08/06 17:03:14
AMD、業界初のx86 CPU対応OpenCLソフト開発プラットフォームを無償提供
URLﾘﾝｸ(pc.watch.impress.co.jp)

米AMDは5日(現地時間)、ATI Stream SDK v2.0 Beta Programの一環として、
新たに「OpenCL for CPU Beta」を無償で提供開始すると発表した。

x86 CPUに対応する業界初のOpenCLソフト開発プラットフォーム。
これを利用することにより、GPUとマルチコアCPUの両方を活用した並列プログラムの開発が容易になるという。

OpenCLは、Khronos Groupが提供するパラレルコンピューティング用オープンスタンダード。
同グループにはNVIDIA、Intel、Appleなども加盟している。

113:デフォルトの名無しさん
09/08/07 13:07:44
やっと動きが

114:デフォルトの名無しさん
09/08/08 11:10:40
これRADONには対応しとらんのん？

115:デフォルトの名無しさん
09/08/08 11:13:29
ラドン…だと？新手の北朝鮮ミサイルか？

116:デフォルトの名無しさん
09/08/08 12:03:20
恐竜だろ

117:デフォルトの名無しさん
09/08/08 15:02:36
風呂かとおもった

118:デフォルトの名無しさん
09/08/08 19:53:25
サンプル動かしてもGPU全然関係ないな(´・ω・｀)
ATI StreamなのになんでCPUだけなんだよ

119:デフォルトの名無しさん
09/08/08 22:02:49
AMDの対応がまだなんじゃね。

120:デフォルトの名無しさん
09/08/08 23:16:43
ていうか Radeon の OpenCL ランタイムドライバが出来ていないとか？

121:デフォルトの名無しさん
09/08/11 09:48:44
CPU対応は優先度が一番高いんだろう
GPUはチップ毎に対応しないといけないし

CPUとGPUの比較をしたり両方使って同時処理するのにも必要

122:デフォルトの名無しさん
09/08/15 07:49:11
俺予想
OpenCLが動くということはnVidiaと同じ土俵でパフォーマンスが比較できるようになる。
現行のRADEONだとOpenCLでパフォーマンスが出ない。
nVidiaと比較されるのがいやなので今はドライバを出さずに
次のGPU(OpenCL向け機能拡張入り)を出すタイミングでドライバを出す。

123:デフォルトの名無しさん
09/08/15 19:05:49
>>122
萩原Obj-C(1.0のやつ)をみながらやっているもので。
Tiger使っているので2.0へはまだいけない。

124:デフォルトの名無しさん
09/08/15 19:07:04
ごめん間違えた。

125:デフォルトの名無しさん
09/08/17 10:37:46
>>122
DX11 Compute Shaderなら(機能は限定されるだろうけど)DX10以降のGPUで動くよ

126:デフォルトの名無しさん
09/08/18 00:53:33
はやくCLとDX10こねーかなー

127:デフォルトの名無しさん
09/08/18 00:54:40
11だったどんだけｗｋｔｋして待ってるとおもってんだ

128:デフォルトの名無しさん
09/08/24 13:36:00
URLﾘﾝｸ(pc.watch.impress.co.jp)
先にDirectComputeの方がきちまった

129:デフォルトの名無しさん
09/08/25 01:30:39
AMD DX11 Cypress is Radeon HD 5870 & HD 5850
URLﾘﾝｸ(vr-zone.com)

・1GB GDDR5 memory
・ATI Eyefinity technology with support for up to three displays
・ATI Stream technology,
・Designed for DirectCompute 5.0 and OpenCL
・Accelerated Video Transcoding (AVT)
・Compliant with DirectX 11 and earlier revisions
・Supports OpenGL 3.1
・ATI CrossFireX multi-GPU support for highly scalable performance6
・ATI Avivo HD video and display technology
・Dynamic power management with ATI PowerPlay? technology
・DL-DVI, DL-DVI, DisplayPort, HDMI
・PCI Express 2.0 support

130:デフォルトの名無しさん
09/08/25 07:51:29
AMDの場合、1月頃に出したGPUにも"OpenCL ready"ってスペック表にあったんだよな・・・（遠い目）

131:デフォルトの名無しさん
09/08/25 07:54:26
実際出してもまともに動かないATI

132:デフォルトの名無しさん
09/08/25 11:24:47
Snow Leopard(10.6)が28日に出るらしいぞ。
技術仕様の中に
「OpenCL
以下のグラフィックカードまたはグラフィックプロセッサのうち、いずれかひとつが必要です。
# ATI Radeon 4850、Radeon 4870」
ってあったから、こっち優先して他のは後回しにされてんじゃね？

133:デフォルトの名無しさん
09/08/25 11:52:01
AMDのOpenCL入門記事「Introductory Tutorial to OpenCL」
URLﾘﾝｸ(developer.amd.com)

134:デフォルトの名無しさん
09/08/25 21:19:55
>>132
ないない。
ATIのMac版は常に後。再生支援すらまともじゃない笑えない現実がある。

135:デフォルトの名無しさん
09/08/25 21:55:12
再生支援とは別としてOpenCLは力を入れてくるんじゃないか

136:デフォルトの名無しさん
09/08/26 08:51:22
>>135
ATIのOpenCL対応GPUが>>132の二つだけということからも極めて怪しい。

137:デフォルトの名無しさん
09/08/26 23:19:23
？よくわからんが後回しどころか4800シリーズの二つは既に対応してるんだよな？

138:デフォルトの名無しさん
09/08/27 00:17:44
後一両日中には分かることさ

139:デフォルトの名無しさん
09/08/27 11:05:51
>>137
nVidiaに比べてしょぼしょぼ。

URLﾘﾝｸ(netkas.org)
>Radeond OpenCL support is very poor, only few of many apple’s opencl
>demo run on it

140:デフォルトの名無しさん
09/08/28 20:25:46
だれかOSXで試してみたやつおる？

141:デフォルトの名無しさん
09/08/29 07:02:33
OSXでOpenCL使っているアプリが無い

142:デフォルトの名無しさん
09/08/29 08:49:38
ATIは宣伝文句ばっかりでやることはごみ
まさかこんな最新技術を扱うスレでRADEONなんて買ってる情弱はいないと思うが

143:デフォルトの名無しさん
09/08/29 10:25:26
>>141
そっちは今からじゃね?
次のiLife系列で対応してきそうだし

144:デフォルトの名無しさん
09/08/29 14:00:11
QTXがたいおうしていなかったっけ？

145:デフォルトの名無しさん
09/09/05 03:48:17
対応したところで現在のところ95%のMacに載ってるGPUは使い物にならない性能
Mac ProですらGT120 (9500GT相当) だからな

146:デフォルトの名無しさん
09/09/11 08:23:44
>ATI StreamSDK 2.0 beta(Windows, CPU 利用)の
>OpenCL 実装だと、8 秒近くもかかってとてつもなく遅い！
>(SnowLeopard だと 0.0001 秒なのに…)
URLﾘﾝｸ(lucille.atso-net.jp)

そもそもAMDの実装が糞という話が･･･

147:デフォルトの名無しさん
09/09/12 22:51:30
>>146
世に出すってレベルじゃねーな。何かの間違いだとは思うが。

148:デフォルトの名無しさん
09/09/13 02:25:23
つ AMD StreamSDK v.20 「ベータ」

149:デフォルトの名無しさん
09/09/13 10:34:43
1.0すらβな件

αの間違いじゃねーのか？ｗ

150:デフォルトの名無しさん
09/09/13 14:21:31
γはまだ～？

151:デフォルトの名無しさん
09/09/13 18:38:32
>>146
OpenCLって単に実行ファイルを一つにできるというだけで
結局各社のCPUなりGPUなりの特性にあったコードを別々に書かなくちゃ性能出ないの？

152:デフォルトの名無しさん
09/09/13 22:39:40
うん
CPUでも性能出そうと思ったら、CPUごとに最適化しないと駄目だし、しょうがないんじゃね

153:,,・´∀｀・,,）っ-○○○
09/09/13 22:44:14
曲がりなりにもC/C++が使えるCellがあんなことになってたりするけど
ハードウェアの特性の違いまでは言語・フレームワークで吸収できるものではありません。
OpenCLの実態も、まあお察し下さい。

154:,,・´∀｀・,,）っ-○○○
09/09/13 22:47:13
あと、Appleの実装はともかくAppleの力の及ばないWindowsやLinuxまで
NVIDIAとATIのOpenCLコードにバイナリレベルの互換性があるとは限らないぞ
OpenGLが各社独自拡張によってカオスなことになってるようにね。

155:デフォルトの名無しさん
09/09/13 22:51:24
OpenCLの互換性はソースレベルだろ。
それも最低限の仕様だけを使ったものなら
どれでも動くというレベル

ハードの特性を取得して、場合わけするなど
OpenGLとほぼ一緒

156:デフォルトの名無しさん
09/09/13 23:09:02
それじゃ結局各社が出してるGPGPU環境使ってそれぞれに開発した方が効率よくない・・・？

157:デフォルトの名無しさん
09/09/13 23:21:12
それでも同じコードで動くかどうかは重要だよ。
必ずしも全部を最適化する必要なんてないんだし。

158:デフォルトの名無しさん
09/09/13 23:57:09
でもカーネルのソース読み込んでオンライン･ビルドってのがなー
この仕様だと製品版でOpenCL対応しましたーって会社でないんじゃないかな？？

159:デフォルトの名無しさん
09/09/14 10:56:56
とりあえず標準仕様に合わせて書いておけば動くというのは心強いぞ。
現状Intelコンパイラの自動ベクトル化とか糞過ぎるから、今後こういうところで頑張らないと計算分野でGPUに水をあけられる可能性がある。
AMDは…お察し下さい。

160:デフォルトの名無しさん
09/09/14 17:57:33
将来のハードの進歩でって投げ技が使えていいんじゃないか？

161:デフォルトの名無しさん
09/09/14 21:00:45
>>155
>ハードの特性を取得して、場合わけするなど
そういった特性とか最適化を担っているのがLLVM。

OpenCL→LLVM→

162:,,・´∀｀・,,）っ-○○○
09/09/14 21:30:32
LLVM（笑）

そりゃそんな物に頼ってるからGPUに対応できないわけだ

LLVMは魔法のソフトじゃない。
未知のアーキテクチャに対応できるのはハードを知り尽くした人間だけだ。
ハード作った人間が対応投げてたら世話無いわ。

163:デフォルトの名無しさん
09/09/15 00:12:47
何でもいいからWindowsで動く処理系きてくれー

164:デフォルトの名無しさん
09/09/15 00:33:45
何でもいいなら半年ほど前からNVIDIAが出してる

165:デフォルトの名無しさん
09/09/15 00:52:23
>>162
> 未知のアーキテクチャに対応できるのはハードを知り尽くした人間だけだ。
> ハード作った人間が対応投げてたら世話無いわ。

あり得ない。コンパイラ技術を知らないアセンブラ人間？

166:デフォルトの名無しさん
09/09/15 01:14:34
団子には何言っても主張を曲げないよ
無駄な煽りでスレが荒れるだけ、NG推奨

167:デフォルトの名無しさん
09/09/15 01:47:02
両方とも言ってる事がおかしい

168:デフォルトの名無しさん
09/09/15 03:56:13
OS X ハッキング! 335 ついに姿を現した「OpenCL」、その実力
URLﾘﾝｸ(journal.mycom.co.jp)

169:,,・´∀｀・,,）っ-○○○
09/09/16 00:55:52
>>165
コンパイラはどうやってコード吐くんですか？
どの命令とどの命令が並列実行出来るとかって情報は誰が持ってるんですか？

ああ、今時Javaでもx86のJITフレームワーク触れますよ

170:,,・´∀｀・,,）っ-○○○
09/09/16 01:03:34
オープンソースの力を借りるのはある程度動くものができてからの話よ。
CPUだととんでもなく遅いです、GPUだと動きません、じゃ、話にならないでしょ。
そもそもStream 1.0の正式版を出さないうちに2.0のβ（笑）をでっちあげる神経を疑う。

ハードだけ出してソフト丸投げでは、どっかのCell（笑）と同じじゃないの。
それより更に悪い。

171:デフォルトの名無しさん
09/09/16 08:56:27
OpenCLもOSS化されたGrand Central Dispatch（Cへのブロック追加＋OSでの対応＋LLVM/Clang）も、
LLVM/Clangが鍵になってるけど、これは言語に対する低レベルなVMであって、
別にJavaなんかと同一視してVMだからどうこうと言っても理解できないかも。

因みにNvidiaもOpenCl実装にLLVM/Clangを利用してるし（今後その実装で続くのかは不明）、
GPU非依存化にはこういう仕組みは不可欠じゃね。

172:デフォルトの名無しさん
09/09/16 11:02:06
中間コードに落とし込むまではどうでもいいんだよ
実際にターゲットハードウェアで走るコード生成機
GNU開発ツールでいうところのbinutilsみたいなのは
ハードごとに用意しないといけない

それすら満足に作らないまま大風呂敷だけ広げてるから
馬鹿にされるんだって

173:デフォルトの名無しさん
09/09/17 01:35:08
はあ？

174:デフォルトの名無しさん
09/09/17 01:41:05
はぁ・・・

175:デフォルトの名無しさん
09/09/18 00:20:38
はぁ…っ

176:デフォルトの名無しさん
09/09/19 00:31:25
物分りが悪すぎるぞ
お前のパソコンでLLVMが動くのはLLVMにx86のコードジェネレータが組み込まれてるからであって
コードジェネレータが用意されてなければ動かしようが無い。

コードジェネレータが用意されて無いなら、0からでもそれを作らないと話にならんのよ。
AMDは用意して無い。
だからGPUで動かない。
当然の話だ。

177:デフォルトの名無しさん
09/09/19 00:39:22
してないの？
Q3中にGPU対応バージョン公開
Q4に正式版公開と公言しているのに。

178:デフォルトの名無しさん
09/09/19 03:27:54
当然もなにも、当たり前過ぎて。

179:デフォルトの名無しさん
09/09/19 09:38:17
この馬鹿は俺らを笑い殺すつもりか？

180:デフォルトの名無しさん
09/09/23 08:36:49
つまりベンダーは OpenCL ランタイムが載ったドライバ開発を急げと？

181:デフォルトの名無しさん
09/09/24 12:51:14
GPUメーカーに作らせたものなど性能を良く見せるためにCPUが遅くなるように細工してるに決まってるだろ

182:デフォルトの名無しさん
09/09/24 17:48:12
細工っていうか手を抜く

183:デフォルトの名無しさん
09/09/25 10:43:31
Khronos groupのOpenCL公式フォーラム
URLﾘﾝｸ(www.khronos.org)

184:デフォルトの名無しさん
09/09/29 21:30:53
OpenCL Download Page
URLﾘﾝｸ(developer.nvidia.com)

185:デフォルトの名無しさん
09/09/29 23:02:32
>>184
ＣＵＤＡより数倍遅いんだけど

186:デフォルトの名無しさん
09/09/29 23:03:22
俺に言われてもしらんがな

187:デフォルトの名無しさん
09/09/29 23:05:19
と思ったがＮ-Bodyのパーティクル数が違っただけだった

188:デフォルトの名無しさん
09/09/30 01:07:29
SDKぶっこんでみたら、DirectCompute用も入ってた

189:デフォルトの名無しさん
09/09/30 06:28:55
今OpenCLに対応してるのはヌビディアだけか

190:デフォルトの名無しさん
09/09/30 07:41:20
まあいつも通りの事だ
AMDは毎回ポーズだけ

191:デフォルトの名無しさん
09/09/30 12:47:44
openclって標準化されてるとはいうけど
NVIDIAでコンパイルしたバイナリをCPUやATIで動かせるようになるんかな？
それぞれ別々にバイナリを作って配布することになるんかな？

192:デフォルトの名無しさん
09/09/30 13:41:09
>>191
デバイス毎に定数を調整するとか実装を調整するとか必要になる希ガス。
なので、仮に一つのバイナリだとしても中身は別物になりそう。

193:デフォルトの名無しさん
09/09/30 20:31:44
>>191
だから無理だって

194:デフォルトの名無しさん
09/09/30 23:24:46
>>191
バイナリファイルにコンパイルできるのか
ずっとHLSLみたいに実行時コンパイルだと思っていた

195:デフォルトの名無しさん
09/10/01 00:23:16
>>194
どうもそうらしい

196:デフォルトの名無しさん
09/10/01 01:06:26
バイナリ状態でロードして実行も出来るし、実行環境で実行直前にコンパイルすることもできるよ。

197:デフォルトの名無しさん
09/10/01 10:06:41
>>196
そのバイナリってのは中間コードみたいなものなの？
それともハードウェア依存の完全なバイナリなの？

198:デフォルトの名無しさん
09/10/01 21:15:46
EarFluid: Experimental QC OpenCL iTunes visualizer
URLﾘﾝｸ(www.mutantquartz.com)

199:デフォルトの名無しさん
09/10/01 23:39:11
>>197
バイナリはハード依存でしょ。
Nvidiaが内部的に中間コード使ってるらしい？
でも当然AMDと互換性はない。

200:デフォルトの名無しさん
09/10/02 10:33:36
CUDAとOpenCL、言語によってパフォーマンスに差は出ますか？

201:デフォルトの名無しさん
09/10/02 19:20:28
>>200
現状OpenCLが桁違いに遅い。。。

202:デフォルトの名無しさん
09/10/02 21:15:18
>>199
llvmの中間コードを使っているのであれば
ポータブルではない。

203:デフォルトの名無しさん
09/10/03 00:38:14
>>200
最終的には同じになる、ってOpenCLプログラミングセミナーでnvidiaの偉い人が言ってた。

204:デフォルトの名無しさん
09/10/03 02:31:57
NVIDIAのOpenCLドライバ使ってるんだけど、カーネル実行って同期処理になってない？？
キューに入れてから戻るまで時間がかかりすぎで、マルチタスク的な動作が出来ないんですが。。。

>>203曰く、ちゃんと対応されるのかな？
それとも、俺がOpenCLの仕様を読み間違えてるだけ？（汗

205:デフォルトの名無しさん
09/10/03 13:40:35
>>198
GeForce9400だと5fpsくらいしか出ないけど面白いね
CPU負荷が全く上がらない

206:デフォルトの名無しさん
09/10/06 11:00:59
OpenCLはサザビーでも使えるの？

207:デフォルトの名無しさん
09/10/06 11:25:46
エゴだよそれは

208:デフォルトの名無しさん
09/10/08 03:02:00
>>204
内部でＣＵＤＡを使ってるだけだろうし原理としてはそうなる
基本的に同期処理が原則
だからカーネル実行は細分化してやらないとだめ
画像を処理するなら１行処理する関数をカーネル化してＣＰＵ側でループするみたいな
やりかたじゃないとだめ

209:デフォルトの名無しさん
09/10/10 03:43:44
SDK 2.3b released
OpenCL Download Page
URLﾘﾝｸ(developer.nvidia.com)

210:デフォルトの名無しさん
09/10/10 06:42:05
そのうちオライリーが一冊本を書くんじゃなかろうか
日本語翻訳版が出るかどうかは知らないけど

211:デフォルトの名無しさん
09/10/10 11:48:34
CUDAとATI Stream SDKとOpenCLの関係がいまいち分からんけど、
OpenCLの中のオプションとしてCUDAとかATI Stream SDKとか位置づけされるってことなのかな。

今CUDA用に記述してあるソースコードも、OpenCL用にちょこっと書き換えればAMDのGPUでも、
他のOpenCLに対応したGPGPUでも動作するってこと？

212:デフォルトの名無しさん
09/10/11 03:22:25
>>208
いやいや、CUDAの動作はそれであってるのけど、それはOpenCLの仕様違反だろ？
それに画像処理するならカーネルループとかあり得ないし。カーネル実行のオーバーヘッドの事を理解していないとしか思えないな。

213:デフォルトの名無しさん
09/10/11 10:06:30
OpenCL Tutorial - Shared Memory Kernel Optimization
URLﾘﾝｸ(www.macresearch.org)
OpenCL Tutorials
URLﾘﾝｸ(www.macresearch.org)
OpenCL Programming Guide for Mac OS X
URLﾘﾝｸ(developer.apple.com)

214:デフォルトの名無しさん
09/10/11 18:47:07
>>212
物理的にＧＰＵがマルチタスクに対応してないんだからどうしようもないな
オーバーヘッドも含めてＧＰＵ処理の性能の限界が現時点でそうなんだからしょうがない

215:デフォルトの名無しさん
09/10/19 21:09:31
>>213
思ったんだけど、もろにNVIDIA寄りの内容だよね

216:デフォルトの名無しさん
09/10/19 21:58:59
2009 LLVM Developers' Meeting
URLﾘﾝｸ(llvm.org)
↑OpenCLなどApple社員系の情報が非公開なのは残念だが参考に。

URLﾘﾝｸ(llvm.org)

217:デフォルトの名無しさん
09/10/22 01:41:00
>>211
違う。

C と C++ と Java みたいなモンで３つとも同じように
CPU 上で動くが各言語間でソースコードの互換性は……だろ？

CUDA は like C、ATI Stream は Book+、OpenCL は OpenCL C という別言語になる。
プログラマは自分の開発環境などに合わせた好きな言語が選べるってだけだ。

218:デフォルトの名無しさん
09/10/22 12:21:11
新iMacのGPUがRadeonなんだが、OpenCLの対応はどうなの？
SDKあるんだっけ？

219:デフォルトの名無しさん
09/10/29 23:09:47
なんか在庫買いあさったらしいからこれから最適化進めてくるんじゃない

220:デフォルトの名無しさん
09/10/31 11:17:42
誰かこの前、秋葉原で開催されたOpenCLセミナー行った人いる？
いたら、簡単な感想聞きたいです。

221:デフォルトの名無しさん
09/11/01 01:05:25
>>220
いったよ
・nVIDIAの人「Fermiアーキテクチャは凄いぞ！」まぁ凄いけどさ。
・FIXSTARSの人のプログラミング入門は参考になったけどあの内容だけだと即書くのはキツイ。
　最後には「ちゃんとやりたい人向けに終日の有料教室やってるよ！」だったしw
・Appleの話はOpenCLじゃなくて殆どCocoaの話…
・Dellは殆ど営業トーク

内容的にはそんなに深くなかったかなー…って感じ。

222:デフォルトの名無しさん
09/11/03 04:42:31
オープンクルとオープングルって何か共通点はあるの？

223:デフォルトの名無しさん
09/11/03 08:17:17
釣られないぞとつぶやいたそこのあなた。
既に釣られてますよ。

224:デフォルトの名無しさん
09/11/05 12:25:52
OpenCLはCPUのSIMD命令を置き換えられるようなものになるといいな
そのうちCPUにGPUも統合するんだからさ

225:デフォルトの名無しさん
09/11/05 19:47:54
バイナリが環境依存なのがなあ。
CUDAみたいに、中間コードがあればいいのに。

226:デフォルトの名無しさん
09/11/05 19:57:30
>>220
基本は221の通りだが、フィックスターズの人が1月に本来出すとか言ってた

227:デフォルトの名無しさん
09/11/23 18:23:10
URLﾘﾝｸ(www.alphaworks.ibm.com)

228:デフォルトの名無しさん
09/11/23 18:28:39
POWER6とcellもopenCLに対応

229:デフォルトの名無しさん
09/11/23 19:06:30
いろいろ対応してくれるのはいいけど、カーネル・ソースが第三者に丸見えなのは何とかならないの？

230:デフォルトの名無しさん
09/11/23 23:57:57
暗号化すればいいじゃない

231:デフォルトの名無しさん
09/11/24 05:03:17
見られて困るほど複雑なアルゴリズムはカーネルだけじゃ作れないから大丈夫だｗ

232:デフォルトの名無しさん
09/11/27 22:27:11
ATI Streamを落としてきたけどマニュアルないのな。
KronosにはCのはあるけどC++のはないね。
せっかくStreamにC++のサンプルがあって便利そうなのに。

233:デフォルトの名無しさん
09/11/27 23:31:48
とりあえず今持ってるコードを

FORTRAN→C→OpenCL C

って感じで進めてみるかなー

234:デフォルトの名無しさん
09/11/27 23:35:20
独り言は壁に向かってしてくれ

235:デフォルトの名無しさん
09/11/28 17:26:06
(´・ω・`)ショボーン

236:デフォルトの名無しさん
09/12/05 23:25:28
最初の世代のLarrabeeは一般には降りてずにHPC専業でいくようだ
たのしみにしてたのに(´・ω・`)

237:デフォルトの名無しさん
09/12/13 19:17:07
S3のGPUでOpenCL開発するためのSDKってどこ？

238:デフォルトの名無しさん
09/12/17 16:18:02
質問です

OpenCLを使ったプログラムのバイナリはRadeonでもGeForceでも使えますか？

239:デフォルトの名無しさん
09/12/17 17:35:20
まずは実際にやる事だ

240:デフォルトの名無しさん
09/12/18 00:39:28
ソースでも中間コードでもない、ただのバイナリをなんだと思っているんだ

241:デフォルトの名無しさん
09/12/23 20:27:30
フィックスターズから本出るよ
URLﾘﾝｸ(www.amazon.co.jp)

242:,,・´∀｀・,,）っ-○○○
09/12/23 20:55:25
三木聡しゃちょはんて何処担当してるの？

243:デフォルトの名無しさん
09/12/24 20:20:23
>>241
>著者からのコメント
>"The free lunch is over."

そんなこといわれてもな・・・

244:デフォルトの名無しさん
09/12/26 01:03:24
>>238
ソースレベルの互換性しかないので、バイナリは非互換。
ただしランタイムにカーネルのソースをコンパイル出来るので、恰もバイナリ互換があるかのようにコーディング出来る。
とはいえ、そうするとCELLみたいに特殊な構造だとパフォーマンスを発揮するようにコードを書くのがたいへんだろうけど。

245:デフォルトの名無しさん
09/12/26 13:46:36
Radeonの4650で遊んだ感じでいうとCellのが楽だな

246:デフォルトの名無しさん
09/12/28 09:34:55
>>242
そこには触れてやるな。みんなおかしいとは思っているがしゃちょーには逆らえない

247:デフォルトの名無しさん
09/12/28 19:37:20
>>245
URLﾘﾝｸ(techreport.com)

248:,,・´∀｀・,,）っ-○○○
09/12/30 03:30:14
今年（来年？）はプログラミングコンテスト開かないの？

249:デフォルトの名無しさん
10/01/01 10:53:23
うっせー糞して寝ろ

250:デフォルトの名無しさん
10/01/05 20:45:23
どっちかっていうと、OpenGL内部のメモリ内容を直接書き換えれるのが大きいな。
描画内容に変更加えて再描画とか、データの高速可視化とか。

個人的にCPUに付加かけずにリアルタイム可視化ができるのがいいな。

251:デフォルトの名無しさん
10/01/18 19:22:26
OpenCL並列プログラミングって本が25日に出るみたい。

252:デフォルトの名無しさん
10/01/18 22:04:56
しってるしってる、と思ったらフィクスターズのやつとは別か
ソースｷﾎﾞﾝﾇ

253:デフォルトの名無しさん
10/01/18 22:14:14
>>252
今日の日経の朝刊1面下の広告

254:デフォルトの名無しさん
10/01/18 22:18:22
出版社：カットシステム
著者：池田成樹
URLﾘﾝｸ(www.cutt.co.jp)

255:デフォルトの名無しさん
10/01/18 22:19:55
JAL株5円まで来たか
いよいよ明日はクライマックス

256:デフォルトの名無しさん
10/01/18 23:48:45
うっせー糞して寝ろ

257:デフォルトの名無しさん
10/01/19 00:15:14
便秘で出ないっす

258:デフォルトの名無しさん
10/01/19 20:00:15
ケツに目薬をさすと便秘が治るという噂を聞いたことがある

259:デフォルトの名無しさん
10/01/21 15:08:18
最近GPGPUを始めようと調べ始めたのですが、
cudaとCLの違いって、CUDAはCPU部分もカーネル部分も混在したプログラムを書いてnvccが両者を分離してくれる、
CLはプログラマ自身が最初からCPU用とカーネル用とを分けてプログラムを書く
という認識でよいですか。

カーネルとかグローバルメモリとかの概念はほぼ一緒と考えてよいのでしょうか。
CLの方が拡張言語っぽくないのと共通規格な分気持ちがいいですが、カーネルのコンパイルとか引数設定を明示的にしないといけない分どんくさい感じですね。

260:デフォルトの名無しさん
10/01/21 15:14:41
OpenCLはまだまともに動かないからCUDAにしとけ

261:250
10/01/21 18:20:06
cudaとopenclの決定的な違い？

cudaはGPGPU
openclは計算機資源API
GPUに限らず、CPU,(故)Cell/BE,DSPチップ等の演算装置を汎用的な計算機資源として使うためのAPIがCL
GPUを使うならメモリ概念はCUDAとだいたい同じ。

完全にホストプログラムとカーネルプログラムおよび両者間通信を手作業で作らないといけないどんくささ（？）はあるものの
「メインプログラムはホスト実行で,計算機資源だけ別のハードウェアを使う」設計APIなので自由度はかなり高い

ただOpen○○のくせにMac10.6以外はまともに動く環境が少ないとか
JITコンパイルなので実行するまでソースのバグがわからない上に資料がまだ充実してないとか、
けっこうまだまだ問題も多い。
>>260の言う通り今やるならCUDAが良いと思うぞ。

262:259
10/01/21 18:49:08
セルとかララビーとかアムドが本気を出すとか色々可能性があるからCLの方がいいかなと思ってたけど
CUDAの方がいいのかな。
拡張言語ってのが言語仕様的にOpenMPあたりと干渉しそうなのもCLを考えていた要素なんだけど。

263:デフォルトの名無しさん
10/01/21 22:57:22
どっちもたいして変わらんどっちもやれ

264:デフォルトの名無しさん
10/01/22 18:58:59
OpenMPとOpenCLが干渉？
ホスト管理スケジューリングぐらいじゃねーの？

265:デフォルトの名無しさん
10/01/22 23:44:42
radeonでCUDAって出来ないの？

266:デフォルトの名無しさん
10/01/23 01:25:03
無理。Stream使え。
でも、技術デモ程度ではなく実用したいならゲフォ使え。

267:デフォルトの名無しさん
10/01/23 10:59:33
スレ違い

268:デフォルトの名無しさん
10/01/26 01:24:10
ふぃくすたのOpenCL入門買ったぞ、LinuxでSDKについてきたサンプルコードがコンパイルできなくて死んだ
っていうか普通にアルゴリズムの勉強してからやれクズ

269:デフォルトの名無しさん
10/01/26 01:27:54
二行目どういう意味？

270:デフォルトの名無しさん
10/01/26 05:29:18
268 said s/he was kuzu.

271:デフォルトの名無しさん
10/03/10 22:33:57
>>266
GPGPU目的だと、ATI<nVidiaなの？

272:デフォルトの名無しさん
10/03/10 22:52:32
？

273:デフォルトの名無しさん
10/03/11 20:16:16
CUDA(nVIDIA)/Stream(AMD) = GPGPU環境
OpenCL = 計算資源利用API ≠ GPGPU

GPGPUのみのなら別スレへ。
とりあえずOpenCL<CUDA(nVIDIA)/Stream(AMD)
かつ開発環境の整備具や資料面ではGPGPUでもnVIDIAに軍配が上がるのが一般論

274:デフォルトの名無しさん
10/03/12 01:13:55
CUDAを使った実績はかなりあるけど、
OpenCLをつかってパフォーマンスが上がるって結果はあるのか？

275:デフォルトの名無しさん
10/03/12 13:56:03
FLOPSのベンチとか調べればちらほら（程度は）ある。ただFLOPSが高くても転送コストが重かったりする。
実行結果をそのままOpenGLとかで可視化するとか転送コストを挟まない場合には向いてる。レイトレとか。
ただ開発／デバグにかかる時間と労力はCUDAと比較にならないと思うぐらい悪い。慣れれば別。

俺はOpenCL好きだけどね。

276:デフォルトの名無しさん
10/03/13 13:19:47
昔の超不安定なRadeonのせいでRadeonを買うことにトラウマがあるから
GPGPUもGeForceしかしたくない

277:デフォルトの名無しさん
10/03/13 21:40:13
いまノートPCでRadeonHD3200
OpenCL使ってみたいけど、使える環境にするにはPC一式を新しく買うしかないよね？orz

278:デフォルトの名無しさん
10/03/13 22:12:04
ATIStream版OpenCLのCPUデバイスで我慢すれば

279:デフォルトの名無しさん
10/03/14 04:36:42
ATI、各GPUのドライバまで手が廻らな過ぎ。

280:デフォルトの名無しさん
10/03/14 10:20:38
正直どこのベンダもOpenCLにそんなに力入れてない気がしてきた。。。

281:デフォルトの名無しさん
10/03/14 12:58:43
いつまでnVidiaに夢見てんだよ

282:デフォルトの名無しさん
10/03/14 15:29:40
GeForce GT 240 でOpenCL SDK V2.3のサンプルが動かない。
というかSDKでビルドは成功するが全然動かない。
ドラバは最新の 196.21
GPU-Z.0.3.9で確認するとOpenCLはチェックが入っている。

283:デフォルトの名無しさん
10/03/14 15:41:44
現状CUDAで十分な気がする

284:デフォルトの名無しさん
10/03/14 18:08:04
CUDAもOpenCLもこのまま消えそうだね

285:デフォルトの名無しさん
10/03/14 21:15:50
ほかで何が残りそうなの

286:デフォルトの名無しさん
10/03/14 23:21:11
調べてないけど、OpenGL 4は、OpenCLと連携するようになってるらしいから
徐々にOpenCLも使われるようになっていくんじゃない

287:デフォルトの名無しさん
10/03/15 18:48:08
POWERVR SGX545を採用したモバイル機器での普及の方が先かも知れない。

288:デフォルトの名無しさん
10/03/15 20:09:26
>>286
既にOpenGLと連携できるよ。頂点バッファとかテクスチャとかだからGL2.x以降とかな？

289:デフォルトの名無しさん
10/03/18 17:36:26
NVIDIAのOpenCLのダウンロードから一通りダウンロードしてきたけど、
コンパイルとかは、どのコマンドを使うの？
OSはLinuxです。

290:デフォルトの名無しさん
10/03/18 19:40:13
何のコンパイル？

291:デフォルトの名無しさん
10/03/20 03:12:14
>>290
OpenCL file

292:デフォルトの名無しさん
10/03/20 05:50:48
nvcc

293:290
10/03/20 08:02:27
fileてのが何かよくわからんが
NVIDIAサンプルに含まれるホスト側のCソースなら/OpenCL/makeでいけるかと。
カーネル用のCLソースならclBuildProgram()関数でどうぞ。

294:デフォルトの名無しさん
10/03/20 17:29:53
CUDA 3.0 Downloads
URLﾘﾝｸ(developer.nvidia.com)

295:デフォルトの名無しさん
10/03/20 18:17:46
Mac　OS　X　10.6を手に入れたんだけど、OpenCLの使い方を教えてください
とりあえず、ドライバだけは入れました。

296:デフォルトの名無しさん
10/03/20 19:11:03
ソース書く→コンパイル→実行→happy

297:デフォルトの名無しさん
10/03/20 20:03:11
>>295
URLﾘﾝｸ(developer.apple.com)

298:デフォルトの名無しさん
10/03/20 20:08:14
あと
URLﾘﾝｸ(developer.apple.com)

299:デフォルトの名無しさん
10/03/21 13:14:54
LinuxでOpenCLやってるんだけど、倍精度は使えへんの？

300:デフォルトの名無しさん
10/03/21 14:28:18
282だけど
CUDA 3.0 Downloads
で上手くいきました。
ありがとう。＞294

301:デフォルトの名無しさん
10/03/22 12:45:47
Linuxと倍精度になんの関係が

302:デフォルトの名無しさん
10/03/22 13:16:38
CL C言語での倍精度浮動小数点はGPUベンダーにより任意サポート

303:デフォルトの名無しさん
10/03/26 00:59:44
よくわからんけど、倍精度を有効にするスイッチとかあるの？
CUDAだとsm13だけど

304:デフォルトの名無しさん
10/03/26 08:06:27
>>303

あるよ

対応しているかは実装依存だけど。

URLﾘﾝｸ(www.khronos.org)

305:デフォルトの名無しさん
10/04/01 22:53:00
struct {
int I;
} tA;

struct {
tA * pa;
} tB;

__kernel void Func (__global tB *b) {
int idx = get_global_id(0);

int B = b[idx].a->I;
}

みたいにすると、int B に値が入らないのってなんで？
書き方が悪いのかな？

教えてエロい人。

306:デフォルトの名無しさん
10/04/02 00:52:35
>>305
君にOpenCLは向いてないよ。。。

ちなみに
b[idx].pa　の参照先が不定もしくは管理領域外だと思われ

通常であればアクセス例外

307:デフォルトの名無しさん
10/04/02 01:07:15
これはコンパイル通るのか？

308:デフォルトの名無しさん
10/04/02 02:12:02
ｔAの実体はいずこ？
ｔBのメンバpaはポインタだぞ。
ポインタは実体ではないぞ。
やるなら、

__kernel void Func (__global tB *b) {
int idx = get_global_id(0);
ｔA　C;
C.I = 1;
b[idx].pa = (tA *)(&C);
int B = b[idx].pa->C;
}

じゃないか？
OpenCLより、ポインタを先に勉強した方がいいぞ。

309:デフォルトの名無しさん
10/04/02 02:33:18
>>308
あ、間違えた。
int B = b[idx].pa.I;
だった。
そもそも根本的におかしいね。
悪い、俺もポインタの勉強が必要だわ。
それ以前に構造体の勉強が必要だ。

310:デフォルトの名無しさん
10/04/02 08:10:34
305だけど、306の話で知りたいことはわかった。
変な質問でごめんね。みんなありがとう。

311:デフォルトの名無しさん
10/04/23 01:47:27
ラデですまんが、vista64でATI Stream 2.01にしたらopen CLのサンプルがVC++ Expressでコンパイルできても動かない(clGetPlatformIDsが-1001を返す）んだけど、こんなことなた人います？
2.0bだと動いたのだが。
Platform SDKの64bitコンパイラを使えばちゃんとサンプルも動かせるけど、MS流儀のコンパイルオプションやmakefileの書式が面倒くさい・・・
LinuxのCUDA機を購入する前にPCでOpen CLのお勉強をしようと思ったのにつまらんところで時間をくってしまった。

312:デフォルトの名無しさん
10/04/23 11:34:25
SDKサンプルのoclBandWidthTestやったらホスト・デバイス間で５３００MB/sくらいだったんだけど
この数値ってグラボだけじゃなくマザーとメインメモリも影響するよね？
GPGPUの処理がハードウェア的にどう依存してるのか良くイメージ出来てないんだけど
i7のQPIとかは影響するの？

313:デフォルトの名無しさん
10/04/23 12:28:21
>>311
URLﾘﾝｸ(developer.amd.com)

314:デフォルトの名無しさん
10/04/24 00:44:55
>>313
そこを読んだけど、それにはデフォルトを呼び出すんじゃなくてclGetPlatformIDsを呼び出してセレクトしろってことでしょ。
で、2.01の64bit版にはちゃんと32bit版のOpenCL.dllが入っているのに、32bitでコンパイルしたらclGetPlatformIDsがなにやら不明なエラーを返してしまうことが問題で・・・

315:デフォルトの名無しさん
10/04/24 01:01:40
SDKを削除＞再インストールしてみたらどう？
こんな話があるし↓

URLﾘﾝｸ(absolutearea.blogspot.com)

316:デフォルトの名無しさん
10/04/24 01:06:52
>>315
それはビルドができないってことでしょ。
ビルドはできるんだよねぇ。実行もできる。ただOpenCLの関数が怪しい物を返すので。
OpenCL.dllの日付は32bit版と64bit版も同じだからバージョン違いが残ってるわけでもないしなぁ。

317:デフォルトの名無しさん
10/04/24 03:20:56
>>316
中身読んでくれてないのね…
この人も-1001 返ってるって書いてあるし、
貴方とおんなじかなって思ったんだけど

> 「デバッグ」メニューから「デバッグなしで開始」を選択
> HelloCL!
> Getting Platform Information
> Platform::get() failed (-1001)
> 続行するには何かキーを押してください . . .
> ありゃ？なんでじゃ？
>
> ATI Stream SDK をインストーラでリペアしてもだめだった。
> しかたがないので、ATI Stream SDK をアンインストール後、再びインストールした。
> サンプルをコンパイルして動作確認。うまくいった。

318:デフォルトの名無しさん
10/04/24 03:37:42
>>317
あら、本当だ。
ごめんなさい。
ダラダラとビルドできないことが書いてあったからこれはちゃうなと。
-1001なら同じだわ。

319:デフォルトの名無しさん
10/04/24 10:55:01
ｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗ

320:デフォルトの名無しさん
10/04/24 15:07:22
そんなwwwとか書くなよ・・・実際のところ既にアンインストール後再インストールは試してるしなぁ。

321:デフォルトの名無しさん
10/04/24 17:53:49
なんで出されたもの読まずにコメント出来るのか理解不能ではある

322:デフォルトの名無しさん
10/04/25 01:04:34
>>320
後だし情報で言い訳ｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗ

323:デフォルトの名無しさん
10/05/09 03:00:01
>>321
出されたものを読まないでコメントするようだから
結局解決まで時間がかかる人なんだよ。理解できる。

324:デフォルトの名無しさん
10/05/09 09:39:11
ヤギだからじゃないのか？

325:デフォルトの名無しさん
10/05/14 23:31:43
GF9400　(CUDA 3.0)のマシンとHD4850 (ATI Stream 2.1)のマシン両方で起こっているのだけれど、
clEnqueueNDRangeKernelで実行したカーネルのイベントがclGetEventInfoで状態を見るとCL_QUEUEDのまま変わりません(queueはインオーダー実行にしてあります）。
kernel自体はきちんと実行終了して希望の結果が得られて、clEnqueueWaitForEventsにイベントを入れて待ってもきちんとCL_SUCCESSで戻ってくるのに、そのイベントの状態を見るとCL_QUEUEDのまま。
そのために、clGetEventProfilingInfoでカーネルの実行時間を調べようとしてもCL_PROFILING_INFO_NOT_AVAILABLEが返ってきて調べられない始末（CL_COMPLETEになっていない証拠）。
clEnqueueWriteBufferなどのイベントはちゃんとCL_COMPLETEになっている。

なんか再現する簡単なプログラムを付けたいけれど、OpenCLはカーネル動く例を書こうとしてもオマジナイが多すぎて改行多すぎで載せられないし・・・

・kernelは正しく実行されている
・WaitForEventも正しく戻る
・でもイベントはqueuedのまま

326:デフォルトの名無しさん
10/05/14 23:59:03
うｐろだに上げればよかろうよ

327:デフォルトの名無しさん
10/05/16 13:46:46
並列処理の基本であるキューにためつつキューの中身を取り出して処理するみたいなことは出来るの？

328:デフォルトの名無しさん
10/05/16 21:32:19
えっ

329:デフォルトの名無しさん
10/05/16 22:10:17
そのためのキューです

330:デフォルトの名無しさん
10/05/17 00:17:50
キューはＣＰＵ側で実装すればいいのか

331:325
10/05/17 10:55:56
clEnqueueWaitForEventなんか使ってちゃダメだな。
clWaitForEventで待機したらeventがCL_COMPLETEになりました。

queueのインオーダーだと勝手にブロッキングになると勘違いしていてwaitなんて入れても入れんでも一緒ダロとか思ってました。

ところで、アウトオブオーダーの時にclEnqueueWaitForEventなんか使ったらqueue内の順序無視してwaitを先にやっちゃって止まるなんてことにはならんのだろうか・・・

332:デフォルトの名無しさん
10/05/17 23:56:26
windowsのリモートデスクトップ経由でOpenCLのプログラムを実行するとplatformの取得に失敗するのな。
びっくりした。windows使えねぇｗ

333:デフォルトの名無しさん
10/05/18 00:18:59
それはNVIDIAのドライバのせいでは？
ATIのOpenCLでもそうなる？

334:デフォルトの名無しさん
10/05/18 00:39:34
そうなる。Windowsの仕様。
公式でもVNC使えって言ってる。
URLﾘﾝｸ(developer.amd.com)

335:デフォルトの名無しさん
10/05/18 05:11:24
NVIDIAのドライバのせいだなw

336:デフォルトの名無しさん
10/05/18 09:44:11
VNCは遅い上にリモートの画面のロックは解除されたりキーボードやマウスでいじり放題になるので目の届かないコンピュータをいじるもんじゃないわな。
迂闊にエロサイトなんて見てしまったら・・・

337:デフォルトの名無しさん
10/05/18 10:36:11
cygwinでsshdを起動してssh経由でやっても動かないぜ。
mpiでやっても当然ダメなんだろうな。
こんな状態でHPC市場を狙ってるんですかねマクソさんは。

338:デフォルトの名無しさん
10/05/19 13:04:33
スクリーンセーバーにしてしまおうかと真剣に考えたw

339:デフォルトの名無しさん
10/05/20 22:39:47
個人的な覚書

ATI Stream 2.1のcl_platform.hはこのままだとmingw-gccで使えない。
38行目の#include <stdint.h>を削除して
77行目 #else /* !_WIN32*/の次の行に入れる必要あり。

khrnosの配っているcl.hpp　(\date $Date: 2010-04-23 10:16:50 -0500 (Fri, 23 Apr 2010) $は
namespace cl　のなかでstd::pairと呼び出してる箇所を全て ::std::pairと修正、
#if defined(__CL_ENABVLE_EXCEPTIONS)
#include <exception>
#endif
をnamespace clの外側に移動する必要あり。

340:デフォルトの名無しさん
10/06/03 07:06:02
ワープって何よ。
亜空間跳躍となにか関係あるのか?

341:デフォルトの名無しさん
10/06/03 23:01:30
OpenCLはワープサイズやウェイブフロントサイズをとってこれないのが難点だな。
これが取れないとポータビリティのある最適化はできないよ～。

342:デフォルトの名無しさん
10/06/04 13:26:57
ワープとかの概念が無用なプラットフォームも OpenCL の対象範囲。
どうせハードウェアごとの最適化が入る部分は、CL がどうこうする部分じゃないよ。
その辺は #ifdef で。

343:デフォルトの名無しさん
10/06/04 22:55:03
ワープサイズに依存しない機種の場合はワープサイズ1でも返してくれればいいんだけど。

344:デフォルトの名無しさん
10/07/01 23:02:44
コードのコンパイル、デバイスの生成、データ転送に喰われてスケールしないんだが。
ありがた味のわかるサンプル教えてくれ。

345:デフォルトの名無しさん
10/07/01 23:05:51
コンパイルやデバイスの生成やデータ転送と比べものにならないくらい長時間のデータを計算させる。

346:デフォルトの名無しさん
10/07/03 00:48:14
openclでGPGPUするかどうかの判定ラインって何？
やってみないとわからんのか。

347:デフォルトの名無しさん
10/07/03 12:42:13
計算量がNの3乗くらいなら有効だと思うよ。
ループが3重にネストしているような奴。

348:デフォルトの名無しさん
10/07/24 22:38:24
水を差すようだけど，OpenCLだからと言ってO(N^3)がO(N^2)に落ちる訳ではないんだから
それだけでは何の基準にもならないよね．
滅茶重い計算だとNも単純に大きくてデバイスローカルなメモリに収まらなかったりするし
対象デバイスのwarp sizeを想定しながらブロック化とか，結局ifdef祭り．

349:デフォルトの名無しさん
10/07/24 23:00:12
うるせえだまってろ

350:デフォルトの名無しさん
10/07/25 08:00:33
でっていう

351:デフォルトの名無しさん
10/09/02 01:36:07
もう少しなんかあっても良いよね。

352:デフォルトの名無しさん
10/10/10 01:30:39
文字列処理のサンプルってないですか？

353:デフォルトの名無しさん
10/10/24 00:50:26
新しいMacBookPro買ったんだけど
clCreateContextFromTypeでGPU指定したら、そこからCL_SUCCESSが返ってこない・・・
Appleのサイト見てもGeForce GT 330Mはサポートされてるのに

354:デフォルトの名無しさん
10/10/24 01:04:56
>>353
nVidiaが公開してるCUDAドライバ入れた？

355:デフォルトの名無しさん
10/10/24 01:33:46
>>354
SnowLeopardはOSでサポートされてるんじゃないの？
ちょっとぐぐってきます・・・

356:デフォルトの名無しさん
10/10/24 10:40:54
ドライバもなしにハードを動かそうとな？

357:デフォルトの名無しさん
10/10/24 16:18:23
URLﾘﾝｸ(yanoshin.jp)
いつのバージョンかわからんけど
＞＊必ずToolkit、Driver、SDKの順にインストールすること！（なぜか？）

ドライバだけで、他は必要ないのかな？
URLﾘﾝｸ(journal.mycom.co.jp)
URLﾘﾝｸ(developer.apple.com)

358:デフォルトの名無しさん
10/10/24 16:21:17
今までRadeonユーザーにOpenCL使ってもらうには
SDKインストールしてもらわないといけなかったんだが、
最新ドライバから、OpenCLランタイムをインストールできるようになったらしい。
めでたいことだ。

359:デフォルトの名無しさん
10/10/24 17:39:16
Radeonって全然高速じゃないし使う意味ないよなぁ

360:デフォルトの名無しさん
10/10/24 18:35:46
Radeonユーザーの場合はDirectCompute使った方が良いね

361:デフォルトの名無しさん
10/10/24 18:41:34
Core i　……　RADEON HD 6xxx
Phenom II　……　GeForce GTX 4xx

362:デフォルトの名無しさん
10/10/24 19:48:56
RadeonだとN体 24Gぐらいしかでないしな
Geforceだと500Gぐらい平気で出るんだけどねぇ

363:デフォルトの名無しさん
10/10/24 23:22:24
>>356
秀和システムのOpenCL入門を読んだら
Mac：Xcodeあればいい
Win：ドライバダウンロード必要
としか書いてなかったからてっきり。
>>357
インストール順番さっそくミスった
実はMacは初めてだからアンインストールの仕方ぐぐらんと

364:363
10/10/27 09:01:28
やっぱり動かない・・・
よく見たらApple英語サイトはGeForceGT３３０M書いてあるけど
日本語のほうは載ってないし
URLﾘﾝｸ(www.apple.com)
URLﾘﾝｸ(www.apple.com)

365:デフォルトの名無しさん
10/10/27 11:20:00
それ、OSの必要条件じゃん。だから何?

366:デフォルトの名無しさん
10/10/29 07:17:55
URLﾘﾝｸ(developer.apple.com)
> __kernel square
を
> __kernel void square
に置換。

のサンプルも動かない？

367:デフォルトの名無しさん
10/10/29 16:50:26
>>365
ごめん　それは関係なかった
>>366
カーネル以前にclGetDeviceIDsでGPU指定だと止まる。CPUでは動く。。。
試しに>>357の参考してCUDAのサンプルも動かしてみたら
CUDA使用可能なデバイスが見つからないというエラーがでる(´･ω･`)
でも動くのもあって、oceanFFTとかnbodyとかは動いてくれるんだけど

368:デフォルトの名無しさん
10/10/29 19:14:57
そりゃ変だな。ちなみにこちらは Radeon HD 5670 の iMac だが普通に動いてる。
CUDAのドライバにSDKは入れてる（入れただけで放置してたが）。

369:デフォルトの名無しさん
10/11/06 16:01:55
gccはOpenCLに興味ないみたいだね
代わりにclang使うしかないのか?UNIXでは

370:デフォルトの名無しさん
10/11/07 00:02:23
>>369
gccは開発技術レベル落ちまくってて
本業のコンパイラもLLVM連中やMSに
抜き去られてやばいらしい

371:デフォルトの名無しさん
10/11/07 00:11:37
つってもGCC死んだらUNIX系が基盤から崩壊するから、
どうにかしなきゃいかんだろうしどうにかするだろ

372:デフォルトの名無しさん
10/11/07 00:29:49
マルチアーキ型のgccの最適化処理がx86特化型であるmsのソレ以上だったことなんてあったか？

373:デフォルトの名無しさん
10/11/07 00:30:00
GCCってそんな立ち位置だったっけ？
広く愚直にというイメージがあるんだが

374:,,・´∀｀・,,）っ-○○○
10/11/07 01:03:36
GNUソフトウェアはいつだって言いだしっぺの法則が適用されるんだぜ。
Cell B.E.だってSCEが自らABIを公開してGCCやLinuxカーネルのパッチをコミットした。

NVIDIAやAMDがGCCにコミットしない限り動かんだろ。

375:デフォルトの名無しさん
10/11/07 05:02:21
>>371
もうどうにもならん
ORACLEのせい

376:,,・´∀｀・,,）っ-○○○
10/11/07 05:21:45
なんだかんだでHPCなんて所詮はサーバ市場の１％未満のニッチ市場だよ。
そのなかのGPGPU用の言語の一つのために必死になる奴もそうそういない。
なんならRailsやZend使ってWebサービスを構築してるSIerにでもGPGPUの素晴らしさを説いてくれｗ

377:デフォルトの名無しさん
10/11/07 10:51:44
>>376
動画のエンコード・デコードはダメなの？？

378:デフォルトの名無しさん
10/11/07 13:34:36
ffmpegと同等の画質を達成すればGoogle様が興味を示す

かも

379:デフォルトの名無しさん
10/11/07 13:44:30
なんでGPUを使う→低画質という思考になるの？

380:デフォルトの名無しさん
10/11/07 14:24:23
馬鹿だから

381:,,・´∀｀・,,）っ-○○○
10/11/07 15:08:22
ブロックサイズを細かく分けて並列処理しないとGPUのスループットの強みを生かせないから。
CPUで処理するレベルの高画質エンコードは構造的に不向き。せいぜいフィルタだけやらせておけというレベル。

382:デフォルトの名無しさん
10/11/07 20:04:27
ブロックサイズ1ピクセル単位とかにでもしないとGPUの優位なんて出てこないんだろうなｗ

383:デフォルトの名無しさん
10/11/17 00:02:22
IntelがCoreプロセッサ向けOpenCL SDKのアルファ版を公開: 新 masafumi's Diary
URLﾘﾝｸ(masafumi.cocolog-nifty.com)

384:デフォルトの名無しさん
10/11/17 01:07:04
Windows Onlyか

385:デフォルトの名無しさん
10/11/17 15:57:12
Core2Duoなのに入れられない！と思ったら45nm版Core2以降かよ…SSE4使うのな

386:デフォルトの名無しさん
10/11/17 19:24:56
そろそろQ6600に引導渡してやるか・・・
Cougar Pointの仕様が色々と半端なので、GPUだけ強化してIvy Bridgeまで引っ張るつもりだったんだが

387:デフォルトの名無しさん
10/11/21 00:35:46
来年からAMDが大攻勢、NVは苦しくなるな。
もうグラフィックボードすら不要になってくる。

388:デフォルトの名無しさん
10/11/21 00:38:40
CPUで使う場合も、OpenCL的なメモリコピーを挟まないといけないのでしょうか？

389:デフォルトの名無しさん
10/11/27 07:53:49
OpenCLって、いつになったら動かせるようになるの？
組み込み向けにGPGPUしたいんだけど、CUDAだと発熱すごすぎグラフィックボード
がどうしても必要なんで、オンボードGPUをOpenCLで動かしたいのだが。

390:デフォルトの名無しさん
10/11/27 08:38:35
まるでオンボードGPUだと発熱しないと言わんばかりの意味不明な発言。

391:デフォルトの名無しさん
10/11/27 10:03:51
信頼性は違うだろ？

392:デフォルトの名無しさん
10/11/27 13:28:35
オンボードのチップの方が信頼性が高いの?
マザボ丸ごと道連れになるくらいならカード交換で済む方がいい気もするんだが。
今までの経験からすると、寧ろ電源が死ぬことのほうが多いけどね。

393:デフォルトの名無しさん
10/11/27 14:29:27
RadeonでもGeForceでもPhenomでもCore 2(45nm以下)以上でも動くよ>>OpenCL

394:,,・´∀｀・,,）っ-○○○
10/11/27 14:34:16
SSE4.1以上に限定する意味は一応あるのね。
insertps/extractpsがgather/scatterとして、vlendvpsがプレディケートに使えるから
SPMDのカーネルモデルを容易に実現できる。

395:デフォルトの名無しさん
10/11/29 14:16:12
OPENCLってグラフィックカードの計算につかうCPUで
普通のプログラミングも計算するってことですか？

396:デフォルトの名無しさん
10/11/29 19:38:51
日本語でおｋ

397:デフォルトの名無しさん
10/11/29 22:13:20
>>395
コストが無駄になるので特定の用途向けの計算に使います。

398:デフォルトの名無しさん
10/12/01 11:07:07
じゃあ、グラフィックカードの付いてないノートパソコンでは無意味ということだな。

399:デフォルトの名無しさん
10/12/02 01:56:33
C言語っぽく書いて、コンパイラがうまいことSIMDに変換してくれるから意味あるよ。

400:デフォルトの名無しさん
10/12/04 11:20:13
GPUでmalloc作った論文どこだっけ？

401:デフォルトの名無しさん
10/12/18 09:11:15
外付けと内蔵グラフィック切り替えるタイプのノートでopenCL使うとどうなるの
NVkernelそこまで対応してるのかな？

402:デフォルトの名無しさん
10/12/25 19:51:36
全ワークアイテムでは同期とれないんだね。ワークグループ内のみか。
さて、どうやって同期とるか・・・

403:デフォルトの名無しさん
10/12/31 18:12:58
OpenCLを始めようと思ってサンプルコードを動かしてみたんですが
コンテキストを作るところで躓いてしまいました。
何がいけないんでしょうか？

具体的には
cl_int status;
cl_context context = clCreateContextFromType(NULL, CL_DEVICE_TYPE_GPU, NULL, NULL, &status);
とやると、status に CL_INVALID_PLATFORM が返ってきます。

clGetPlatformInfo 関数は、たとえば CL_PLATFORM_VERSION を引数にして実行すると
"OpenCL 1.0 CUDA 3.2.1" という文字列が返ってくるので
OpenCLドライバが入ってないわけではなさそうなんですが・・・

環境はCore2Duo E8400、GeForce9600GT、Windows7 32bitです。

404:デフォルトの名無しさん
10/12/31 18:39:37
第一引数がNULLだとそうなるのがある
ならないのがあるのかは知らん
秀和の本読んでると思うけど公式から修正されたソース落としてこれるからそれを参考にしてくれ

今規制中で携帯からコード打つ気にならんｗ

405:403
10/12/31 20:39:19
>>404
秀和のサイトの修正済サンプルコードを参考にしたら、うまく動きました。
第一引数にNULLではなくコンテキストのプロパティを与えればいいみたいですね。

秀和の本で勉強してると言い当てられてビックリですｗ
この本わかりやすいですね。

大学の研究で何千枚の画像相関やってるんで、OpenCLで夢がひろがりんぐ。

406:デフォルトの名無しさん
11/01/01 10:51:11
グラフィックスドゥライヴァのヴァージョンは？

407:404
11/01/01 16:41:42
URLﾘﾝｸ(developer.download.nvidia.com)

408:デフォルトの名無しさん
11/01/04 05:00:19
openCLを使っています。
CL_DEVICE_TYPE_DEFAULTという値について質問があります。
この値はプラットフォームの標準デバイスを使うと書いてありました。
どのようにしたら、プラットフォームの標準デバイスがGPUなのか、CPU
なのかを知ることができるのでしょうか。

409:デフォルトの名無しさん
11/01/26 11:02:46
Radeon5850と6970を二本さして、FFTの負荷分散させたいと思ってcontextにデバイス２つのせてキューも2本立てたんだけど、
データ転送も並列実行も同時並列的に実行されないで逐次的に実行されてるみたいなんですよ。
コードは1GPUの場合のものをキューだけ変えて単純に2つ並べただけなんですけれども。

OpenCL StramSDKでマルチGPU?実行されてる方いらっしゃいます？

410:デフォルトの名無しさん
11/01/26 12:09:39
AMDからメール来た

AMD Accelerated Parallel Processing (APP) SDK | AMD Developer Central
URLﾘﾝｸ(developer.amd.com)
OpenCL? H.264/AVC: MainConcept
URLﾘﾝｸ(www.mainconcept.com)

411:409
11/01/28 13:15:14
OpenMP使えばいいんですね．自己解決しましたｗ

412:デフォルトの名無しさん
11/01/28 18:00:42
OpenCLはCUDAやTBBのラッパーという理解で宜しいか？

413:デフォルトの名無しさん
11/01/31 10:23:07
OpenMPはCPUしか並列化できない
GPUも並列化したいならOpenMPじゃなくてOpenCL使わなきゃだめだろ

414:デフォルトの名無しさん
11/01/31 21:48:44
>>413
レスあざす。
もともとOpenCLで組んでて、OpenCLだけでマルチデバイスで動作しないかなぁと思った悩んでいたもんで。一応ホストのスレッドを二本立てたら並列動作しました！

415:デフォルトの名無しさん
11/01/31 23:26:33
AMDのH264のSDKってどうなの？

416:デフォルトの名無しさん
11/02/01 20:28:57
>>415
んなもんあったっけ？？

417:デフォルトの名無しさん
11/02/02 01:05:26
>>416
話解らない奴だな
OpenCL H.264/AVC Encoder SDK Beta

どうなんだって聞いてるんだから答えろやクソが

418:デフォルトの名無しさん
11/02/02 15:44:26
>>417
それAMD製じゃないしAMD専用でも無いじゃん

URLﾘﾝｸ(www.mainconcept.com)

419:デフォルトの名無しさん
11/02/02 21:39:51
>>417
ぷｗ

420:デフォルトの名無しさん
11/02/03 00:23:39
>>414
OpenCLの関数ってほとんどノンブロッキングだから
OpenMP使わなくても並列に動作するんじゃないの？
試したことないからわからんけど

421:デフォルトの名無しさん
11/02/03 00:34:19
>>420
と思ったんですよ。とりあえず同じコンテクストにデバイス２つ乗っけて、キューを二本立ててやってみると計算はされるんだけど、プロファイラーで動作みてみると見事に逐次実行されてて。コンテクスト2つ立ててもダメでした。

ヘテロジニアスなんて謳ってるわりに面倒ですよねぇ^^;

422:デフォルトの名無しさん
11/02/04 03:56:08
>>421
OpenCLのコマンドキューはインオーダー実行がデフォだから
CL_QUEUE_OUT_OF_ORDER＿EXEC＿MODE_ENABLEやらないと必ず逐次実行されるよ

423:デフォルトの名無しさん
11/02/04 20:08:07
>>422
違うんですねー
OpenCLドライバは何故か初期から、OutOfOrderを付けても逐次実行されるんだわ。。。
いつか対応されるだろうと、一年くらい経過したけどまだ対応されてないとは

424:デフォルトの名無しさん
11/02/09 20:10:42
>>421
プロファイラで実行すると逐次実行されるが、プロファイラ上でなければ並列実行される。
ジョブ投入や実行の時間を記録して表示させてみ。

また、同一コンテキストのメモリが二つのデバイスのどちらからでもアクセスできる裏技もあるよ。
最初のアクセスは遅いが、それ以降は早いので、CPU側に読み込んで書き戻すとかしなくてもダミーでメモリをアクセスするジョブを流せばデバイス間のデータ移動ができる。

1年ほど前にデバイス2本同時駆動の実験だけして本チャンの計算プログラムはまだつくってなかったな、そういや。

425:デフォルトの名無しさん
11/03/08 07:32:39.91
昨日1日使ってボトルネックをOpenCLに移植したけど、
余計遅くなったわ。やれやれ

426:デフォルトの名無しさん
11/03/08 08:28:07.93
ボトルネックを移植するんじゃなくてOpenCLに向いている部分を移植しろよ
または並列性を極大化したりif文などの分岐を全部排除するなどアルゴリズム最適化をしてみれば？

427:デフォルトの名無しさん
11/04/07 03:06:36.77
VLIW5のtパイプ埋まらん

428:デフォルトの名無しさん
11/04/13 04:08:44.89
深く考えずに2^26スレッドenqueueしたらひどいことになった。

429:デフォルトの名無しさん
11/04/21 23:37:32.85
なんでこれ有料なんだ？
URLﾘﾝｸ(web.me.com)

430:デフォルトの名無しさん
11/04/22 00:28:47.04
Appleが提供しているツールならまだしも第三者が開発しているツールを無料にしろってのは横暴だろ
シェアウェアや市販ソフトを完全否定なお人ですか？

431:デフォルトの名無しさん
11/04/23 23:18:19.02
AMD APPのOpenCLについてご存じの方がいたら教えて欲しいんですが、
wavefront=64 って事は、例えばwork_group = 128 の場合 work_itemが64ずつ完全に並列実行って認識で合ってるでしょうか？
（wavefront内のやりとりは同期が必要ないかどうかを知りたいです）

432:デフォルトの名無しさん
11/04/24 03:56:08.00
>>431
何の保証もないけど、今のところ大丈夫な気がする。

433:デフォルトの名無しさん
11/04/24 05:50:16.61
最大3クロックのタイミング差があると思うんだけど。

434:デフォルトの名無しさん
11/05/26 04:58:19.55
XOR_INT*4とMULADD*4が同じ時間食うって納得いかん…

435:デフォルトの名無しさん
11/06/14 22:58:32.16
for(d=0;省略){
clSetKernelArg(省略&d);
clEnqueueNDRangekernel(省略);
clEnqueueReadBuffer(省略);
for(省略){読み出したメモリ合算}
}
で1024*dで実行して
読み出して合算して再度実行・・・の形にしてもアドレス違反が起きてしまう・・・
イベントリストもバリア同期も意味なし

GPU実行でアドレス違反は画面だけ真っ黒になってびっくりした
デバックはCPUデバイス使ったほうがいいよ

436:デフォルトの名無しさん
11/06/26 01:59:15.81
最近OpenCLに興味もったんですが皆さん楽しいですか？

437:デフォルトの名無しさん
11/06/26 14:59:58.32
楽しいとか楽しくないとか問題じゃねえよ

438:デフォルトの名無しさん
11/06/26 15:03:37.91
でっかいうんこかどうかだな

439:デフォルトの名無しさん
11/07/04 00:47:28.82
AMD gDEBugger
URLﾘﾝｸ(developer.amd.com)
いろいろ便利かもな

440:デフォルトの名無しさん
11/07/04 00:50:00.35
nsightもOpenCLデバッグ対応してなかったっけ？

441:天使 ◆uL5esZLBSE
11/07/04 06:50:33.14
２０１１年になっても未だにJAVA使い続けてる奴ってさ
仕事で仕方なくならわかるけど

家でもJAVAやってるなら本当にバカだよね。哀れ

ゴミだし

442:デフォルトの名無しさん
11/07/04 07:59:16.86
最近みかける天使うぜー死ねと思っていたが
松本龍の阿呆発言と比べると実害無いだけマシだと思った

443:デフォルトの名無しさん
11/07/05 22:49:02.30
つまんねー書き込みしてないでとっととNG登録しろよ

444:デフォルトの名無しさん
11/07/05 22:51:03.29
このコテハン「天使 ◆uL5esZLBSE」は天才チンパンジー「アイちゃん」が
言語訓練のために使用しているハンドルです。

アイと研究員とのやり取りに利用する書き込みなので、
関係者以外はレスしないで下さい。

　　　　　　　　　　　　　　　　　　京都大学霊長類研究所

445:デフォルトの名無しさん
11/07/06 01:40:07.31
intelのopencl　SDKをlinuxにインスコったけどコンパイルのやり方わからん
gcc使ってどうにかならんの？

446:デフォルトの名無しさん
11/07/06 09:49:42.54
OpenCLってもう１年もバージョン変わって無いけど、開発中止したの？

447:デフォルトの名無しさん
11/07/06 11:06:10.67
バージョンUPしなくていいほど今の版が完成されたすばらしい出来だという事なんだよ

という事にしておきたい

448:デフォルトの名無しさん
11/07/06 11:57:01.57
グラボはどんどん進化してるのに、ライブラリは完成されてるとかねーよ

449:デフォルトの名無しさん
11/07/06 18:08:10.55
進化しても演算部分のコンパイラが底まで進化する必要があるか？

MSのCPUコンパイラさえ基本的には10年以上前のCPUでも動くような最適化レベルで止まっているしな。
GPUとして使うならまだしもGPGPUとして処理するならコンパイラは基本部分だけで、あとはドライバの進化で十分かと

450:デフォルトの名無しさん
11/07/09 07:08:13.67
>>439
それってGPU１枚だけでも使えるの？
requirementsにはハードウェアのことが書いてない

451:1
11/07/26 06:44:48.46
ｽﾚﾘﾝｸ(dataroom板)

452:デフォルトの名無しさん
11/07/27 23:22:22.79
HD4850が最新のドライバではOpenCL動かないし、古いドライバでは動くがゲロ遅
アムドはあかんな

453:デフォルトの名無しさん
11/07/28 01:08:32.77
>>452
4870 + CCC 11.6 で OpenCL 動いてるけど、
もしかして 11.7 では動かなくなるのかな ?

454:デフォルトの名無しさん
11/07/28 14:50:27.81
HD4850, APP 2.4, CCC 11.6で動かず（カーネルコンパイルエラー）。
ググったら4xxxは11.6じゃ動かないから11.5にしろと言うことで11.5にしたら動いた。

455:デフォルトの名無しさん
11/07/28 15:07:33.48
アムドとか言ってるあたりでお察し・・・

456:デフォルトの名無しさん
11/07/28 20:28:57.67
アムドいうただけでレッテル貼りとかどんだけ・・・
ヌビディアはOpenCL対応あかんね
1.0のくせに1.1用の関数を使ってもコンパイル・リンクが通る
でも、clEnqueueWriteBufferRectとか実行したらセグメンテーション違反
なめとるで

457:デフォルトの名無しさん
11/07/29 09:43:45.32
どっちも自社ライブラリ使えってことだよ

458:デフォルトの名無しさん
11/07/29 12:23:00.19
data parallelで簡単な2重forならできるけどそれ使って複雑な計算するのが
できぬ・・・CUDAと違って1024が最大なのがネック

459:452
11/07/30 22:03:20.57
職場のC1060に家パソのHD4850が10倍以上の大差で惨敗してムカついたのでHD6950買ってきた。
2倍以上でHD6950の勝利！
アムド最高やで

460:デフォルトの名無しさん
11/07/30 22:25:54.10
6970や6990じゃなくて6950なのか。てかC1060はもうどうでもよかろう。

461:デフォルトの名無しさん
11/07/30 23:10:14.10
>>460
C1060はどうでもええことないよ。
だって、職場の計算機の貴重な戦力だし。
6950にしたのは家パソ用に高い板を買う気はないから。

462:デフォルトの名無しさん
11/08/01 20:49:14.86
いつの間にか WebCL とか出来てて驚いた。
WebGL は色々使い道あるけど、WebCL は需要が分からん。

463:デフォルトの名無しさん
11/08/01 21:47:49.14
WebGLについてはこちらでお願いします
【O3D】HTML5用 3D API WebGL 【Canvas:3D】
ｽﾚﾘﾝｸ(tech板)

464:デフォルトの名無しさん
11/08/01 22:13:20.26
WebGLの話なんてしてないが

465:デフォルトの名無しさん
11/08/01 23:26:04.83
サイトを開くだけで分散コンピューティングに参加…胸熱。

466:デフォルトの名無しさん
11/08/02 10:29:42.77
URLﾘﾝｸ(www.infoq.com)

これか
確かにブラウザ上で並列処理する必要性がよくわからんな

467:デフォルトの名無しさん
11/08/02 14:03:26.64
頻繁にメインメモリと同期するような計算にはJavaScriptが遅くて使い物にならないだろうし
重い処理を単発でやるだけならサーバーでやればいいだけな気がする
わざわざWebで激しく環境依存するようなことをやる意味が分からん

468:デフォルトの名無しさん
11/08/02 15:29:27.41
技術というのは、早い者勝ちでなぁ
仕様などをはやめに決めておかないと、特許やらパクリと言われたりとかなんやらで面倒な事になってしまうんだ
あと名を残したい人が作ったりするんだ
役に立つとか使えるとか、そんなの関係無いんだ

469:デフォルトの名無しさん
11/08/02 16:18:14.25
それはわかるんだが、特許を取るタイミングとかが難しいよな
取得にも維持費もかかるし、早すぎると普及した一番儲かる時期に特許権が切れて利益にならないとか

まー特許引き延ばしって裏技もあるけど

470:デフォルトの名無しさん
11/08/02 19:41:55.79
まあ、あれや
OpenCL CはJITやから、LL言語からでもグルーライブラリを組めば簡単に使える。
そら、試してみたくもなるわな。
しかし、実際はOpenCL Cを使いこなさなあかんわけで、それほどハードルが低いわけやないと。

んで、環境依存しまくりいうけど、マルチコアプロセッサ用のOpenCLライブラリもIntel, AMDから出てるわけで、もはや大概の環境でOpenCLは使えまっせ。

471:デフォルトの名無しさん
11/08/03 01:09:07.14
ブラウザで超広大なライフゲーム

472:デフォルトの名無しさん
11/08/04 04:52:42.94
APP SDK 2.5 で BFI_INT が使われるようになったけど、
bitselect() 使うとだめで、 (x & 0xf0f0f0f0) | (y & 0x0f0f0f0f) の型だと OK みたい。

473:デフォルトの名無しさん
11/08/04 18:42:12.38
CAL ILコンパイラはもう誰もメンテできないんだろうな。BFI_INT を付け足すのがそんなに苦痛かね?
AMDはLLVMのラデバックエンドに挑戦しているようだけど、果たして新アーキに切り替わる前に
モノにできるんだろうか?

474:デフォルトの名無しさん
11/08/04 23:21:28.44
OpenCLってCellみたいなプロセッサが普及しないと面白くないよね。
GPU型の抽象化だけじゃ。

475:デフォルトの名無しさん
11/08/05 09:45:21.35
そのCellがコケたからなー
発想が速すぎた
今の技術で開発していれば、大人気だったかもしれないのに

476:デフォルトの名無しさん
11/08/06 00:40:12.65
i7であえてOpenCL

477:デフォルトの名無しさん
11/08/06 02:51:44.01
OpenCLのアプリを配布するときってAMDとnVidiaで別に実行ファイル作らなきゃいけないの？

478:デフォルトの名無しさん
11/08/06 03:08:35.23
何でんなこと思った。

479:デフォルトの名無しさん
11/08/06 03:57:16.00
今のところ、OpenCLなアプリケーションを"配布"するための良い方法は無い。(除 MacOS X)

480:デフォルトの名無しさん
11/08/06 07:16:37.83
*.cl カーネルを露出させるのがそんなに恥ずかしいか!

難読化するだけだったら gzip してバイナリに埋め込んどくのが楽かもね。

481:デフォルトの名無しさん
11/08/07 08:06:38.42
nVidiaから最新ドライバでOpenCL1.1対応とかメールきたんだけど、
ドライバとりに行ったらLinux用はまだじゃねーか。
ざけんなー。

482:デフォルトの名無しさん
11/08/07 08:08:49.28
>>480
恥ずかしいというよりノウハウの塊だから出したくない人はいるだろう。

483:デフォルトの名無しさん
11/08/08 05:22:20.10
Windows用OpenCL1.1ドライバを試してみたが、
どうも上手く動かないのでもう一寸待った方が良いと思う

484:デフォルトの名無しさん
11/08/09 01:37:46.04
>>428
門外不出のノウハウ＝世間一般には知られていない。
つまり各分野の研究者すら出し抜く大発見ってことだぞｗ

485:デフォルトの名無しさん
11/08/11 20:59:03.48
>>484
ノウハウが全て開示されているとでも思っているのか？

486:デフォルトの名無しさん
11/08/11 22:05:51.96
世間一般に知られていなければ十分じゃん

487:デフォルトの名無しさん
11/08/12 21:31:49.60
世間一般に知られないようにするためにカーネルを晒したくないわけだろ

488:デフォルトの名無しさん
11/08/14 01:34:57.52
>>473
CAL ILコンパイラ自体はいまだに新命令追加されているよ。
64bitINT除算とかはドキュメント化までされている。
ドキュメントにはなっていないけど、wave_idとかは
Appendix Bにはこっそり追加されて、実際テキストで
1OP命令として書けば使える。

でもBFI_INTは置いてけぼり

489:デフォルトの名無しさん
11/08/14 09:57:57.76
マスクが定数なら、iand,iand,ior で BFI_INT になるとおもうけど、
そうじゃないときになー。

490:デフォルトの名無しさん
11/08/31 17:10:54.28
初心者です。
Cで書かれた演算プログラムを高速化させたいと思っています。
この元のプログラムをホストプログラムとして、OpenCL用に書き換えて、高速化させたい演算部分を引っこ抜いてカーネルプログラムとして書き換えるというやり方でいいのでしょうか？

また、このようなCのプログラムをOpenCL用に書き換える作業を解説しているサイトや書籍はあるのでしょうか？

当方LINUXでのプログラミングをしております。

491:デフォルトの名無しさん
11/08/31 21:06:58.51
並列化はアルゴリズムをかなり選ぶよ。GPGPUなんて尚更。
まず普通にマルチスレッドで並列化してみたら?

492:デフォルトの名無しさん
11/09/15 10:02:24.21
opencl用の自動並列化コンパイラってある？

493:デフォルトの名無しさん
11/09/16 05:07:07.00
>>490
そのやりかたでいいさ。
2重ループを1重ループ2つにわけるとか。
あとはほとんどC言語と同じだから書き換えるところも少ないんじゃないか？

494:デフォルトの名無しさん
11/09/16 18:41:47.81
「Ivy Bridge」プロセッサ、「OpenCL 」をサポート

495:デフォルトの名無しさん
11/09/16 23:43:18.97
OpenCLを使ったおぉっとなるアプリってありますか？

496:デフォルトの名無しさん
11/09/17 08:21:50.52
うわぁってなるあぷりならある

497:デフォルトの名無しさん
11/09/17 08:36:22.90
たとえば？

498:デフォルトの名無しさん
11/09/17 18:08:09.83
まってて、ちょっと調べてくる

499:デフォルトの名無しさん
11/09/18 07:57:32.03
つ「URLﾘﾝｸ(www.geeks3d.com)」

500:デフォルトの名無しさん
11/09/23 23:20:48.33
なんでAMDのOpenCLってこんなにサポートが糞なの？

501:デフォルトの名無しさん
11/09/24 06:50:26.05
OpenCLに関しちゃAMDが一番マシじゃね。

502:デフォルトの名無しさん
11/09/24 15:07:51.08
>>500
ヒトイネ

次ページ