OpenCLプログラミング#1at TECH
OpenCLプログラミング#1 - 暇つぶし2ch760:デフォルトの名無しさん
14/08/30 20:24:50.83 nZ1XDijW.net
よく落ちるな‥

761:デフォルトの名無しさん
14/09/19 08:34:07.91 KzrQAxPc.net
OpenCL 1.2が現在のstableになるのかな?
1.1だとOpenCVは動かないですね

762:デフォルトの名無しさん
14/09/19 23:42:34.05 dfKMMaQo.net
NVIDIAが1.2に対応しないからうちは1.1縛りだな。
OpenCVみたいにCUDAと両方やるならいいんだろうけど。

763:デフォルトの名無しさん
14/10/15 00:45:43.10 bIoSVMWH.net
VBAで使いたいのですが、ラッパーDLL何か
ご存知ないでしょうか?
C#用のは幾つか見つかるのですが…

764:デフォルトの名無しさん
14/10/15 01:04:21.97 bIoSVMWH.net
質問あげ m(_ _)m

765:デフォルトの名無しさん
14/10/15 10:11:05.56 3rwOGNYw.net
>>756
C#でVBAとOpenCLの仲介DLLでも作ればいいんでないの?
Windows知らんけど。

766:デフォルトの名無しさん
14/10/15 10:36:01.03 bIoSVMWH.net
>>758
そうなんですけど、既にあるならそれ使いたいなと。

いま、ClooというC#用のラッパー使ったりソース見てるのですが、
ジェネリクスは使えないからどうするんだ?とか
DLL作ったことないのでチョット途方に暮れてます…
(シンプルなDLL作成サンプルは理解できますが、
openclを全てラップするのは無理…)

767:デフォルトの名無しさん
14/10/15 19:03:22.75 oTkKZ4Eq.net
既にあるもので使い方覚えるより
自分で造った方が早い場合も多い

768:デフォルトの名無しさん
14/10/15 22:49:10.60 y41AVgB1.net
口だけ番長

769:757
14/10/16 00:06:46.03 1e+5gfAa.net
>>760
プラットフォームを返すところから少し作り始めてみましたが、
VBAのcollectionとして値を返すなら、
C#では何なの?ディクショナリ?ってとこで
早速つまづいてしまいました(;_;)

なので、VBAでラッパー作ろうかと迷走中…

770:デフォルトの名無しさん
14/10/16 00:45:29.59 925HRnD9.net
別に何しようと勝手だけど
VBAでOpenCL使う必要性って何?

非同期処理が苦手なVBAは「待ち」が生じるような複雑な計算は向かないし
計算速くするだけならDLLなりに入力投げて結果だけもらえばいいし
Officeとの連携ならVBA使う必要ないし
規定されたソフトウェア以外使用禁止だったらそもそもOpenCL使えそうにないし

771:デフォルトの名無しさん
14/10/16 15:24:45.15 7O3aHiya.net
そもそもVBAに固執してる時点で視野狭窄。

772:757
14/10/16 17:11:21.81 8j84DcHT.net
固執?( ´����×����` ) プッ

773:757
14/10/16 17:12:09.70 8j84DcHT.net
ありゃw

774:デフォルトの名無しさん
14/10/17 13:05:53.28 npcZf8Up.net
あらあら可哀想なひとでしたか。

775:デフォルトの名無しさん
14/10/17 16:09:50.28 aw+RiOqr.net
こんなところにもシナが湧くようになったか

776:デフォルトの名無しさん
14/10/18 01:23:16.18 sx5ESDLm.net
そもそもそんな方法よりこうした方が・・とか
上流にまで遡って正そうとする奴がいるけど
余計なお世話なんじゃない?
VBAでOpenCLを使う方法を聞かれているんだから
答えがあるならそれに出せばいい。
無いならわからないと答えればいい。
見当違いのに話を捻じ曲げて、してやったりと
悦にはいるのか?

777:デフォルトの名無しさん
14/10/18 13:19:15.72 Z3gRebWt.net
余計なお世話だと感じたらスルーすればいいだけ
スルーも出来ないお子ちゃまが馬鹿にされるだけ

778:デフォルトの名無しさん
14/10/18 15:49:20.82 mzkaImX0.net
>>769
あんた公務員やな

779:デフォルトの名無しさん
14/10/18 19:40:45.23 P/Strs7V.net
余計な世話しなきゃいい

780:デフォルトの名無しさん
14/10/19 02:01:55.89 CeuU+CpH.net
まあ、余計なお世話なやつは
わかってない(解決策はわからない)
ってことだから

解決策以外はただの雑談
スルーするかしないかなんて、
どうでもいいこと

781:デフォルトの名無しさん
15/01/12 09:09:09.30 BHqm0X8b.net
OpenCLとCUDAの相互運用について情報を探していたらCUDAカーネルを
OpenCLランタイムから実行できると書いてある記事を見つけたんだが、
本当にそんなんできるんだっけ?
URLリンク(www.4gamer.net)

782:デフォルトの名無しさん
15/02/04 08:37:05.19 PgjHlyod.net
いままでコンスタントに500[ms]程度でkernel処理が終わってたのが、
1分以上kernel処理が終了しない異常が、
処理2回目とあと不定期に発生するようになりました。
処理の内部のループカウントを数えたら正常なときと大差なく、
重い処理をしてはいないようです。やはりハードの不具合でしょうか?

783:デフォルトの名無しさん
15/02/04 11:47:15.88 kErMECZ6.net
windows update

784:デフォルトの名無しさん
15/02/08 04:16:42.58 4RF7kRSx.net
モバイルだと、GPU性能とCPU性能あんま大差ないからな。CPUだと4コアでNEON使えば最大性能で60GFLOPSぐらい?最新のTegraX1とかだと300GFLOPSオーバーするかもしれんが
現行のAdreno330ぐらいだと150GFLOPSくらい?

785:デフォルトの名無しさん
15/02/08 04:19:43.86 4RF7kRSx.net
だからNEONのコードをわざわざ書き直す必要まだないかな?メモリアクセスのほうがボトルネックになってるっぽいのもあるし。まぁ、CPUとGPU実行じゃ消費電力ちがうかもしれんが。

786:デフォルトの名無しさん
15/02/15 00:22:26.32 rqZ8R7KU.net
個人的にはこの言語産廃な気がするけどどうなんだろう
手続きの多さはさすがにちょっと…
CUDA←AMDも似たもの作るorライセンス料払ってでも統一しろ(最良)
C++AMPとOpenACC←そのレベルの抽象言語ぐらい統一しろ(次善)
OpenCL←やめて

787:デフォルトの名無しさん
15/02/15 10:01:14.87 MuMGrz7U.net
OpenCLはハード非依存のGPGPUプラットフォームとして用意され、
その上にライブラリを構築してユーザーはそれを使うのが本来意図してたこと。
残念ながらそういうライブラリがあまり出てきていないのが現実かな。

788:デフォルトの名無しさん
15/02/15 12:56:46.74 TTUR8i8s.net
OpenCLはDSPとかFPGAとかGPU以外もターゲットに入っているから
下手に統合しない方がいいと思う

789:デフォルトの名無しさん
15/02/15 20:42:11.90 aU4fh9i9.net
とか言いながら、触ればわかるが単なるCUDAの焼き直しなんだよな、これ

790:デフォルトの名無しさん
15/02/15 21:52:13.56 DwKzmQqr.net
nvidiaのquadro K620Mか
インテルグラフィックHD5500にしようと思うんだけど
openclとか数値計算の初歩の練習としてはどっちがいいよ

791:デフォルトの名無しさん
15/02/15 22:09:31.75 SQuQNCw8.net
>>783
IntelのOpenCLドライバって糞だって印象しかない。
AMDやNVIDIAで動いてたコードが通らなかったりするし。

792:デフォルトの名無しさん
15/02/15 22:20:29.24 DwKzmQqr.net
>>784
ありがとうございます

793:デフォルトの名無しさん
15/02/15 22:26:41.71 SSlwb3yD.net
実は正しくないコードが他の環境ではたまたま通っていただけ、てのはよくある。
たしかにIntelのコンパイラは厳しいから、普段の開発は他のGPUでやっていても
IntelのKernel Builderでカーネルのチェックしたりするな。

794:デフォルトの名無しさん
15/02/16 00:42:06.13 bUgXoWHZ.net
>>786
コードそのものに問題はなかったよ。
カーネルが複雑になりすぎるとIntelのコンパイラは落ちるから論外。

795:デフォルトの名無しさん
15/02/16 00:55:29.94 0cGz3jVB.net
IntelはGlobalWorkingGroupとLocalWGのサイズがN倍じゃないと動かないんだけどAMDは変な比率でも動く
原因調べるのの時間かかったよ

796:デフォルトの名無しさん
15/02/16 02:05:22.57 bUgXoWHZ.net
>>788
そりゃ動くほうが不思議だw 自分の場合はカーネルを小さくしたら
普通に通ったからそういう問題はなかったはず。

797:デフォルトの名無しさん
15/02/16 07:56:11.60 F7oc1qZ/.net
>>784
同意

798:デフォルトの名無しさん
15/02/16 13:24:15.63 LR9r89r7.net
AMDのコンパイラも最適化オンにしたらコンパイル終わらなかった事あったので、結構怪しい。(2011年ぐらいの話だけど)

799:デフォルトの名無しさん
15/02/16 13:44:20.54 bUgXoWHZ.net
>>791
確かにAMDのコンパイラの最適化は完全に地雷だったw

800:デフォルトの名無しさん
15/02/16 21:40:57.33 HyfDl27x.net
>>783
初心者がこれからOpenCLを始めるのにどの環境を選ぶか、という話なら
NVIDIAは避けるのが無難だな。デバッガやオフラインコンパイラなんかの
ツールが皆無に等しい。
CUDAもやりたいとかいうなら別だが。

801:デフォルトの名無しさん
15/02/16 22:38:07.54 QHeQ+cdL.net
>>793
多くの奴はGPGPUするぞ、じゃメジャーなCUDAで良いやだからな
OpenCL使ってIntel,Nv,AMD(あとFPGAとか?)でちゃんと動くものを作らなければいけないってあんまりないだろからな

802:デフォルトの名無しさん
15/02/17 02:24:50.68 xvdMpEI6.net
OpenCL使ったところで、同じコードでどんなCPU/GPUでも効率よく動くとかレアケースだしなぁ。

803:デフォルトの名無しさん
15/02/17 08:22:15.68 fCIGE3+K.net
最高のパフォーマンスを引き出すチューニングというなら別だが、どれかGPUを想定した
コードならそこそこの速度で動くだろ。たいてい、従来のCPUより速けりゃ十分だろうし。
FPGAだけは別格で、GPUと同じコードじゃぜんぜん速度が出ないだろうが。

804:デフォルトの名無しさん
15/02/18 10:38:35.72 CGhwPhC5.net
SSEレジスタに乗ること期待して書いたchar16とかGPUに食わせたら憤死するで。

805:デフォルトの名無しさん
15/02/18 16:12:46.20 pennC58Z.net
アーキテクチャ毎に最適化しないと、
OpenCLで性能なんか出せないよ。

806:デフォルトの名無しさん
15/02/18 22:51:48.89 Z2YWe05s.net
>>797
ベクタ型は想定するターゲットで効果が見込まれる場合に使うべきで、そういう意味では
どっちかというとチューニングの範疇だろう。
そもそも、インテルのコンパイラならベクタ型使わずに普通に書いてSSE/AVXを
使ってくれるんだが。CL_DEVICE_PREFERRED_VECTOR_WIDTH_CHAR=1だしな。
下手に最適化しようとして却って駄目にしているように思える。

807:デフォルトの名無しさん
15/02/19 01:05:51.96 f67JHinc.net
かたやGPUになるとパイプラインのスカスカ具合見ながら
int2とかint4とか使って依存関係のない演算で埋めていかないとお話にならんしなぁ。

808:デフォルトの名無しさん
15/02/19 02:14:32.89 KUEe9MYM.net
アーキテクチャごとの最適化は、まだコンパイラとかの成長中の部分もあるだろうしなぁ
そのうち改善はしてくれるような気がするけど

809:デフォルトの名無しさん
15/02/19 22:30:01.89 t/UF4QVL.net
そうは言っても今のアーキが向かってる方向ってコンパイラ実装の難易度上がってるから
コンパイラの苦手な部分を補填してやらにゃ速くならないってのは改善される事はないと思う
むしろそこまで賢いコンパイラとか使いたくない

810:デフォルトの名無しさん
15/02/19 23:19:07.50 1LBnym+M.net
技術的側面もあるが
それ以上にIA64がコケたことが
コンパイラを賢くしてプロセッサを脳筋にする道を
決定的に閉ざした
コンパイラの賢さに関して言えば
足並みがそろってない事の方が問題だと思う

811:デフォルトの名無しさん
15/02/26 07:17:19.04 BKvgQceT.net
クロノスってなんかのアニメであったような

812:デフォルトの名無しさん
15/02/26 14:44:53.01 ZlyxtZ3O.net
クロノスはゼウスのお父さん

813:デフォルトの名無しさん
15/02/26 20:31:41.27 yDVFOiWq.net
マッシーンロボッ!
お前には、敵はない!

814:デフォルトの名無しさん
15/03/08 09:21:28.42 rJrv12ko.net
OpenCL2.1は発表されたが相変わらずNVIDIAはやる気なさそうだなぁ、コメントくれないし。
おかげでいまだに開発は1.1ベースだよ。

815:デフォルトの名無しさん
15/04/12 20:37:22.82 4fkLnYAO.net
OpenCLでHEVCをGPUに部分的にデコードさせる実験やってるな
まあ新製品はハードウェアでHEVCに対応してるから不要になっちゃうんだけど

816:デフォルトの名無しさん
15/04/12 20:37:43.88 4fkLnYAO.net
×やってるな
○やってたな去年の夏ごろ

817:デフォルトの名無しさん
15/04/12 21:03:58.32 b726GPIq.net
結局使えるのは、いつくらいになるのか…

818:デフォルトの名無しさん
15/04/25 14:51:39.69 zIE5htjK.net
vexcl使えばopenclもcudaも関係なくGPUが使えるっぽいけど

819:デフォルトの名無しさん
15/04/25 16:55:17.48 DlB5+dQK.net
NVIDIAでやっと1.2が使えるようになったと思ったらバグってんじゃねーか。
本当にやる気無いのな。

820:デフォルトの名無しさん
15/04/26 16:04:03.54 ljYoE8AT.net
そらやる気ないやろ。
cudaなら囲い込みできるのに、
cudaの焼き直しのOpenCLなんて協力するだけ損だし。

821:デフォルトの名無しさん
15/04/27 10:52:17.46 1JZfjbGY.net
URLリンク(pocl.sourceforge.net)

822:デフォルトの名無しさん
15/06/06 14:22:49.99 xHuAhJj5.net
Core i7 3990とGeForce使ってるんだけど、IntelHDが認識されてなくてデバイスマネージャに表示されない
OpenCLの性能評価を試したいんだけど、IntelHDのドライバをインストールすれば認識されますかね?

823:デフォルトの名無しさん
15/06/07 15:10:46.44 OFY6KtcL.net
>>815
モニタはiGPUとゲフォどっちにつないでる?
それと自作PCか?

824:デフォルトの名無しさん
15/06/07 15:14:39.85 OFY6KtcL.net
あ、それとintel Opencl driver インストールうまくできるか試してみて結果おしえて

825:デフォルトの名無しさん
15/06/07 20:39:44.84 NnypvtRT.net
>>816
モニタはGeForceに接続。ドライバインストール試してみる。

826:デフォルトの名無しさん
15/06/08 05:35:15.96 ewd9hwV4.net
Intelのにモニターをつなげないと
いけなかったはず。

827:デフォルトの名無しさん
15/06/08 13:13:32.81 rnRcmo2O.net
i7 3990は検索してもろくにヒットしないけど、Sandy Bridge-Eなら無理なのでは。

828:デフォルトの名無しさん
15/06/09 01:36:37.47 c7FHKlcw.net
そだね、そのくらい確認してるかと思って聞かなかったけど、
iGPUがついてないならそもそも無理だわな。

829:デフォルトの名無しさん
15/06/10 12:18:07.90 VIG2W0Y+.net
うまくいけばCPUの方はOpenCLで動かせるかもしれない
やる意味ないけどね

830:デフォルトの名無しさん
15/06/19 09:06:28.51 giF1KE9b.net
GPUのないノートのCPUでデバックしてから
GPUで実行できるなら俺はうれしい

831:デフォルトの名無しさん
15/06/19 21:38:40.35 s6jV56Gc.net
別途ドライバをインストールしなきゃならんってのが難点なんだよな。
SSE/AVXをお手軽に使えて、コア数に応じてマルチスレッドで実行してくれるから
使いではあると思うんだが。

832:デフォルトの名無しさん
15/06/19 23:20:08.11 KZJPVbVq.net
デバッグなんかよりチューニングが大事だからターゲットハード以外でコーディングしてもなぁ

833:デフォルトの名無しさん
15/06/20 00:21:14.39 46SUOvEb.net
なにがなんでも最高性能出さなきゃならん用途ばかりじゃあるまい。
一般的な並列化のみで大多数のハードでそこそこ速くなりゃ十分、という応用もある。

834:デフォルトの名無しさん
15/06/22 00:09:27.57 e4hiyCLD.net
CLはチューニングなしだとCPUに惨敗もありえるのでな。

835:デフォルトの名無しさん
15/06/22 01:11:03.05 rREKDKy5.net
メモリ転送とenqueueしてからの計算開始に時間かかるのがなぁ

836:デフォルトの名無しさん
15/06/22 07:39:26.22 FYteK6ai.net
CPUに惨敗してた処理がチューニングでどうかなるもんか?
単に並列化できてなかっただけじゃね?

837:デフォルトの名無しさん
15/06/22 21:40:24.04 e4hiyCLD.net
>>829
レジスタ数とか共有メモリサイズとかでブロックサイズだっけnVIDIAでいうところのwarp数とか
調整しないとてんでダメだよ。

838:デフォルトの名無しさん
15/06/22 21:41:31.55 e4hiyCLD.net
>>828
そのコストを払っても高速かどうかは実機でテストするしかないしな。
機種ごとにCLを使うか通常ルーチン使うか選別するくらいしないと効果なし

839:デフォルトの名無しさん
15/06/23 02:38:28.65 22fvktD/.net
チューニングは難しい
何となくやってみたら、処理時間が5倍遅くなったときの衝撃は大きかったな

840:デフォルトの名無しさん
15/06/23 08:25:00.27 drLPVFNo.net
ターゲットのハードに特化したチューニングをしないと使い物にならんようなことを
言っている人がいるが、そんなこといったらユーザー環境を特定せずに広く配布する
アプリなんて作れんな。
うちじゃ一般的なGPU向けチューニングしかしてないが、NV/AMD安いのから高いのまで
テストしてみてローエンドでもCPUの数倍くらいで動くから十分、速く動かしたいなら
高いGPU使え、ってなノリだな。

841:デフォルトの名無しさん
15/06/23 08:50:44.48 LQs/3Np0.net
一番遅いハードに合わせて作っとけば問題ないよ

842:デフォルトの名無しさん
15/06/23 22:58:24.67 VwORpFDM.net
>>833
AMDのHSAのAPUとAMDのOpenCl2のdGPUがHPCを除いたいまのデファクト
それ以外は無視で良い。Nvは一般用でGPGPUやる気ないし
HPC用ならターゲットのハードに特化したチューニングは当然だし

843:デフォルトの名無しさん
15/06/24 01:34:16.84 35TMs94C.net
madとかそういう複合命令(?)を使ってチューニングする程度で抑えたいところ

844:デフォルトの名無しさん
15/08/31 07:10:09.59 kH1QDWTh.net
Vexclの開発が止まってる
誰か引き継ぐ人はいないのか?

845:デフォルトの名無しさん
15/09/02 06:58:53.31 VNDyXTKC.net
早く2.0を使えるようにしてくれ

846:デフォルトの名無しさん
15/09/03 00:02:12.18 iQnjIkb4.net
NVIDIA無視すりゃ幸せになれるぞ

847:デフォルトの名無しさん
15/09/03 01:44:07.69 cb/ef9ik.net
>>839
こんなに対応が遅いと思わなかったんだよ
次からはAMDを信じるよ、あればだけど

848:デフォルトの名無しさん
15/12/19 10:21:19.84 7/8YsZOJ.net
プログラマはMacを使ってるってマジ?
スレリンク(news板)

849:デフォルトの名無しさん
15/12/19 10:23:37.79 qfRCvKdP.net
単なる世間知らずが踊らされてそう言ってるだけ

850:デフォルトの名無しさん
15/12/19 12:49:21.08 BBUxwf4S.net
マルチコピペだぞそれ

851:デフォルトの名無しさん
15/12/19 15:25:38.18 iG82T79N.net
100スレ以上にレスしてNGにならないのは運営が公認してるマルチってことか

852:デフォルトの名無しさん
15/12/19 16:25:03.85 2xl0Mjgh.net
GeForceはOpenCL2.xに対応した?
CUDAに同様の機能が在るから技術的に無理という事はないだろうけど

853:デフォルトの名無しさん
15/12/19 18:13:33.83 LGhGH2LK.net
358でやっと1.2正式サポートしたところ。

854:デフォルトの名無しさん
15/12/19 19:06:17.07 2xl0Mjgh.net
サンクス。IntelですらOpenCL2.0に対応しているのに業界最大手のnVIDIAがやらないのはなぁ
CUDAを使えという事なんだろうけど、それではnVIDIA専用になってしまうからそれは避けたい。
かといってnVIDIAを無視する訳にもいかないというジレンマ
そろそろOpenCL2.xをメインにしていきたいのだが

855:デフォルトの名無しさん
15/12/20 00:20:21.34 ujiFhYYe.net
VGAはいまAMDがすごく伸びてきているんだろ
来年の後半にはVGAの販売数シェアではAMDがNvidiaを上回るんじゃないのか
再来年には一般グラフィックではIntel、AMDが2強ってなるんじゃないか

856:デフォルトの名無しさん
15/12/20 00:47:13.59 14eB8c4R.net
NVIDIAのOpenCL対応はちょうどAppleが採用やめたあたりから停滞したな。
結局のところNVIDIAにとって、そういうOpenCLを望む大口の顧客でもいない限り
OpenCLに力を入れる理由はないんだろうな。

857:デフォルトの名無しさん
15/12/20 01:02:38.32 XNwlDZDb.net
nvidiaはopenAMP+だっけ?あっちに力いれてんじゃないのかね?

858:デフォルトの名無しさん
15/12/20 04:40:12.37 oUoqwn36.net
AMDもCUDAに対応するみたいなニュースをみたけど、どうなったんだろう?
GPGPUの技術も速く落ち着いて欲しい

859:デフォルトの名無しさん
15/12/20 07:41:04.82 MpbNAZoy.net
CUDAが各社GPU共通のならいいけどそうじゃないからなぁ
Intel iGPUでも使えないと困る

860:デフォルトの名無しさん
15/12/20 07:47:22.55 14eB8c4R.net
AMDのあれは、HSAをターゲットにしたHalideやvexclのような並列計算APIで、
それがNVIDIA向けにもコンパイルできるって話だな。既存のCUDAコードからも
コンバートできるというのは目新しいが。

861:デフォルトの名無しさん
16/03/29 10:04:21.74 /c8bAcK4.net
サッカーブッシュ日本代表日程ぷあたん(しゅっちょうまいくろ教育長交代)春文執行40代売上差額シュガーチョコ
URLリンク(www.youtube.com)宇ドナルドアナリストパワーストーンコーチングとしまえん
サッカーブッシュ日本代表日程古本屋よしたけしゅっちょうちょこしゅがー
ディーラー税務署天才開発者死亡詰みヨミドクターマイクロサービ


862:ス不足 サッカーブッシュ日本代表日程ぷあたんシフト光金さかい強制バイト人権侵害問題 春分資源執行ニューヨーク低原価ぼったステーキソルトレイク福岡横浜新橋奴隷課金パチシフト強制バイト問題新潟米センター生残 コスメ24チャリティー隠れ40代生活保護プレイボーイバイトレードいたりあん接待問題 マスコミKARDローンケーオーサービス不足婚活パーティー寄付金執行原発ビジネス FBIチャイニーズタイホテル売上事務所ガチャ決算ガチャキャンペーン(販売報道陣過激派組織向携帯最新情報提供終了 校長発言細心注意ノートン産廃エラー(著作権クレーム中国反応融資高額教育費)(中国捕鯨団体40代社員サッカーコメント 高額入学金ヤフウ新橋大学ヤフウ新橋理事長FX経費 おじや50代資産ガリバズフィード40代エリート



863:デフォルトの名無しさん
16/05/30 13:15:08.40 27ORFIrk.net
CUDA8.0RCでも1.2どまり

864:デフォルトの名無しさん
16/05/31 02:00:22.72 tLbBjsj4.net
CUDAが強すぎて、なかなか広がらないイメージ

865:デフォルトの名無しさん
16/05/31 15:24:04.45 o40hgVi5.net
あまり最適化されてない(できない、ifがそれなりに多い)プログラムをCPUとGPUで動かしてみて、
早い方を採用するには都合がいい。

866:デフォルトの名無しさん
16/08/08 11:44:01.40 OeTPyxgg.net
CUDAは強い強い言われてるけど結局一社独占の技術だから過渡期の産物で終わってメインストリームにはなれんよ
nvidia自体x86やARM関係なくCPUを締め出しにかかって古い仕様を拡張する気がなさそうだし

867:デフォルトの名無しさん
16/08/08 23:41:36.48 FOEjBVJr.net
しかしOpenCLも最近失速気味だしなぁ。規格は2.2まで出てるのにいまだに2.1のまともな実装すら出てないし。
AMDが体力続かなくて手を引いたりしたらOpenVXみたいにフェードアウトするんじゃないか?

868:デフォルトの名無しさん
16/08/13 04:34:37.27 C6tpw


869:DrS.net



870:デフォルトの名無しさん
16/10/29 09:17:30.79 W9gQheBG.net
AppleがGeForce採用すりゃNVIDIAもOpenCLをアップデートすると期待してたが、今回も採用なしか。
それとも逆に、いつまでもOpenCL 2.0対応しないから採用しないのかな。

871:デフォルトの名無しさん
16/10/29 12:19:11.69 YsxFht0u.net
OpenCLはオワコン

872:デフォルトの名無しさん
16/10/29 15:09:52.99 0Cs4HSkt.net
HIPだっけ?
あれでCUDAを汎用的に使えるようになるんじゃないの?

873:デフォルトの名無しさん
16/10/29 18:46:14.19 vjtn6SxB.net
>>862
C/C++使いはOpenCLも使えないと駄目ってなりつつあるんじゃないのか?

874:デフォルトの名無しさん
16/10/30 01:49:24.70 IKgBO44W.net
それはOpenMPでは

875:デフォルトの名無しさん
17/01/08 01:47:50.25 qDa6npPv.net
Vexcl難しい
サンプルコード少なすぎる

876:デフォルトの名無しさん
17/02/12 09:50:54.30 fljd0HzI.net
vexclは挫折してviennacl使ってる
使えるスキルある人ならvexcl良いと思うけど
自分には無理だった

877:デフォルトの名無しさん
17/02/12 14:41:00.16 VBfSC62c.net
boost.computeなら、どうだろうか?

878:デフォルトの名無しさん
17/02/16 11:11:01.71 sX4bqSJb.net
Boost.computeはcudaに対応してない

879:デフォルトの名無しさん
17/02/17 01:28:52.49 LtwBLUnB.net
OpenCLの話題だし、CUDA対応とかより、いかにOpenCLのコードが書きやすいかのほうが大切だと思うんだ

880:デフォルトの名無しさん
17/02/28 20:15:03.56 514SeM49.net
ここ1年くらい停滞気味で話題が少なかったけど、これはめでたい。
NVIDIA 378.66 drivers for Windows offer OpenCL 2.0 evaluation support
URLリンク(www.khronos.org)
一方で、前にいろいろぶち上げたAMDは何してるんだ?Ryzenで忙しいってか?

881:デフォルトの名無しさん
17/03/17 02:02:00.80 YSidBwLT.net
Vexclで行列計算したいけど行列掛け算のexampleしかない
qr分解とかライブラリ使って出来ないの?
Vienaclにはqr分解とか例が沢山あるのに

882:デフォルトの名無しさん
17/03/17 11:56:23.09 ol/nseXL.net
できる

883:デフォルトの名無しさん
17/03/30 08:07:31.22 sSr9ORWQ.net
過疎ってるところ恐縮ですが、質問です。

通常のCプログラムの中で、コプロ的な使い方でOpenCLをインラインアセンブラのように使うような使い方は可能なのでしょうか?
もしくは、その様な使い方を実現する方法はないでしょうか。

884:デフォルトの名無しさん
17/04/04 23:25:23.65 d4Y6801f.net
Openmpでgpuの並列計算も出来るようになってから
Viennaclは更新も止まって、もう実質一年ぐらい更新ない

Openmpがgpu計算の標準になるのかな

885:デフォルトの名無しさん
17/10/25 09:29:08.47 h/b8kKiY.net
開発環境自体もOpenCL 2.0で止まっている感じはするな
鈍足になった感じはする

886:デフォルトの名無しさん
18/04/03 04:40:48.84 mPevnajZ.net
cudaだと毎回計算結果違うとかビットエラーで整数計算も間違うことあるらしい
OpenCLをamdで動かすとどうなの?

887:デフォルトの名無しさん
18/04/03 11:25:01.62 R6gDm2yr.net
えっ

888:デフォルトの名無しさん
18/04/03 23:11:05.85 RICRRaNn.net
マイニング終了でRädeonの中古が格安で大量に売られてるので
何か使えないか
Openclってひょっとして再帰できない?

889:デフォルトの名無しさん
18/04/06 09:28:13.93 Z8wP2fEV.net
>>877
科学計算用のやつだと、ちゃんとエラー補正してくれるよ

890:デフォルトの名無しさん
18/05/18 19:25:23.10 RN2l/52Z.net
再帰できないってことはないだろ。
確認まではしてないけど、小さいの書けばすぐわかるからよろしくです

891:デフォルトの名無しさん
18/05/18 23:22:29.85 z36hYsyi.net
たしか昔はcudaも再帰できなかったと思う
ある時期までの規格なら再帰できないとかもありえる
あるいは製品依存とか?

892:デフォルトの名無しさん
18/05/19 10:52:19.90 iBGlap+k.net
再帰って、例えば階乗(n!)を関数内で1引いて乗算して、また自身を呼び出すみたいなことでしょ?
できないわけないよな……と脳内で思ってます。
色々な階乗をパラでやっても大丈夫だと思うし、一つの階乗をパラでやっても排他きちんとやれば大丈夫だと…
もしかして全く勘違いなこと言ってるのかな…
(最近CL書いてない、というか、並列プログラム自体ネタがなくて書いてないorz)

893:デフォルトの名無しさん
18/05/19 12:28:46.68 BjCA6AhS.net
再帰するにはスタックが必須になるから
そんな暗黙の領域管理をGPUにやらせるのかってことでしょ
再帰がなければ関数ごとに固定領域を決めればいいので楽できる

894:デフォルトの名無しさん
18/05/19 13:45:59.07 iBGlap+k.net
普通に関数呼んでreturnで帰って来るんだから、スタックなんて意識しなくていいんじゃない?
(関数の戻り先は、勝手にスタックに積んでreturnで勝手に取り出してくる)
スタック容量が少ないから別途管理しないといけないってこと?

895:デフォルトの名無しさん
18/05/19 14:22:31.54 7qbCVCh9.net
ふつう、関数はインライン展開される。
再帰だと原則それができない。

896:デフォルトの名無しさん
18/05/19 15:09:02.73 GMayPujS.net
888

897:デフォルトの名無しさん
18/05/19 16:23:46.57 KZiehyBT.net
マイニング負け組はこちらへどうぞ
intel Oprencl2.1が今はお勧め
書籍もいっぱいあるぞ!
構わないからデペロッパーになろう

898:デフォルトの名無しさん
18/05/19 19:18:17.82 fx9VLx2G.net
>>886
マジっすか。勉強になりました。
m(_ _)m

899:
18/05/20 14:06:31.19 JyKbNFIa.net
>>886
Yコンビネータを見よ
インライン展開された、いいかえると無名関数であっても、再帰は可能である

900:デフォルトの名無しさん
18/05/20 14:35:44.13 KmZcyykh.net
的外れすぎるw
Yコンビネータは無名関数で再帰ができるようになる程度の意味しかないだろ。
(末尾呼び出し最適化がない限り)関数呼び出し深さが不定であるのには変わりない。
もちろんOpenCLには末尾呼び出し最適化も第一級オブジェクトとしての関数もないし、
それどころか関数ポインタすらない。

901:デフォルトの名無しさん
18/05/20 16:22:27.06 V9eOsuAz.net
うむ

902:デフォルトの名無しさん
18/05/23 19:10:21.35 Au5e7VGg.net
僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
H1I8V

903:デフォルトの名無しさん
18/05/24 10:34:27.52 cPlRxlDn.net
H1I8V

904:デフォルトの名無しさん
18/07/04 18:21:25.84 bZ79e0V+.net
これ人気らしいぞURLリンク(goo.gl)

905:デフォルトの名無しさん
18/07/04 21:44:26.88 gFgZc5FG.net
QOJ

906:デフォルトの名無しさん
18/07/05 16:14:25.67 AeL6VB/V.net
H1I8V

907:デフォルトの名無しさん
19/06/19 04:56:27.83 tVNS+22r.net
【出資】松本卓朗 人工知能詐欺【注意】
スレリンク(rikei板)

908:デフォルトの名無しさん
19/06/19 08:10:22.42 qaAgAiWI.net
久しぶりに何か書かれたと思ったら orz

909:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch