OpenCLプログラミング#1at TECH
OpenCLプログラミング#1 - 暇つぶし2ch828:デフォルトの名無しさん
15/06/09 01:36:37.47 c7FHKlcw.net
そだね、そのくらい確認してるかと思って聞かなかったけど、
iGPUがついてないならそもそも無理だわな。

829:デフォルトの名無しさん
15/06/10 12:18:07.90 VIG2W0Y+.net
うまくいけばCPUの方はOpenCLで動かせるかもしれない
やる意味ないけどね

830:デフォルトの名無しさん
15/06/19 09:06:28.51 giF1KE9b.net
GPUのないノートのCPUでデバックしてから
GPUで実行できるなら俺はうれしい

831:デフォルトの名無しさん
15/06/19 21:38:40.35 s6jV56Gc.net
別途ドライバをインストールしなきゃならんってのが難点なんだよな。
SSE/AVXをお手軽に使えて、コア数に応じてマルチスレッドで実行してくれるから
使いではあると思うんだが。

832:デフォルトの名無しさん
15/06/19 23:20:08.11 KZJPVbVq.net
デバッグなんかよりチューニングが大事だからターゲットハード以外でコーディングしてもなぁ

833:デフォルトの名無しさん
15/06/20 00:21:14.39 46SUOvEb.net
なにがなんでも最高性能出さなきゃならん用途ばかりじゃあるまい。
一般的な並列化のみで大多数のハードでそこそこ速くなりゃ十分、という応用もある。

834:デフォルトの名無しさん
15/06/22 00:09:27.57 e4hiyCLD.net
CLはチューニングなしだとCPUに惨敗もありえるのでな。

835:デフォルトの名無しさん
15/06/22 01:11:03.05 rREKDKy5.net
メモリ転送とenqueueしてからの計算開始に時間かかるのがなぁ

836:デフォルトの名無しさん
15/06/22 07:39:26.22 FYteK6ai.net
CPUに惨敗してた処理がチューニングでどうかなるもんか?
単に並列化できてなかっただけじゃね?

837:デフォルトの名無しさん
15/06/22 21:40:24.04 e4hiyCLD.net
>>829
レジスタ数とか共有メモリサイズとかでブロックサイズだっけnVIDIAでいうところのwarp数とか
調整しないとてんでダメだよ。

838:デフォルトの名無しさん
15/06/22 21:41:31.55 e4hiyCLD.net
>>828
そのコストを払っても高速かどうかは実機でテストするしかないしな。
機種ごとにCLを使うか通常ルーチン使うか選別するくらいしないと効果なし

839:デフォルトの名無しさん
15/06/23 02:38:28.65 22fvktD/.net
チューニングは難しい
何となくやってみたら、処理時間が5倍遅くなったときの衝撃は大きかったな

840:デフォルトの名無しさん
15/06/23 08:25:00.27 drLPVFNo.net
ターゲットのハードに特化したチューニングをしないと使い物にならんようなことを
言っている人がいるが、そんなこといったらユーザー環境を特定せずに広く配布する
アプリなんて作れんな。
うちじゃ一般的なGPU向けチューニングしかしてないが、NV/AMD安いのから高いのまで
テストしてみてローエンドでもCPUの数倍くらいで動くから十分、速く動かしたいなら
高いGPU使え、ってなノリだな。

841:デフォルトの名無しさん
15/06/23 08:50:44.48 LQs/3Np0.net
一番遅いハードに合わせて作っとけば問題ないよ

842:デフォルトの名無しさん
15/06/23 22:58:24.67 VwORpFDM.net
>>833
AMDのHSAのAPUとAMDのOpenCl2のdGPUがHPCを除いたいまのデファクト
それ以外は無視で良い。Nvは一般用でGPGPUやる気ないし
HPC用ならターゲットのハードに特化したチューニングは当然だし

843:デフォルトの名無しさん
15/06/24 01:34:16.84 35TMs94C.net
madとかそういう複合命令(?)を使ってチューニングする程度で抑えたいところ

844:デフォルトの名無しさん
15/08/31 07:10:09.59 kH1QDWTh.net
Vexclの開発が止まってる
誰か引き継ぐ人はいないのか?

845:デフォルトの名無しさん
15/09/02 06:58:53.31 VNDyXTKC.net
早く2.0を使えるようにしてくれ

846:デフォルトの名無しさん
15/09/03 00:02:12.18 iQnjIkb4.net
NVIDIA無視すりゃ幸せになれるぞ

847:デフォルトの名無しさん
15/09/03 01:44:07.69 cb/ef9ik.net
>>839
こんなに対応が遅いと思わなかったんだよ
次からはAMDを信じるよ、あればだけど

848:デフォルトの名無しさん
15/12/19 10:21:19.84 7/8YsZOJ.net
プログラマはMacを使ってるってマジ?
スレリンク(news板)

849:デフォルトの名無しさん
15/12/19 10:23:37.79 qfRCvKdP.net
単なる世間知らずが踊らされてそう言ってるだけ

850:デフォルトの名無しさん
15/12/19 12:49:21.08 BBUxwf4S.net
マルチコピペだぞそれ

851:デフォルトの名無しさん
15/12/19 15:25:38.18 iG82T79N.net
100スレ以上にレスしてNGにならないのは運営が公認してるマルチってことか

852:デフォルトの名無しさん
15/12/19 16:25:03.85 2xl0Mjgh.net
GeForceはOpenCL2.xに対応した?
CUDAに同様の機能が在るから技術的に無理という事はないだろうけど

853:デフォルトの名無しさん
15/12/19 18:13:33.83 LGhGH2LK.net
358でやっと1.2正式サポートしたところ。

854:デフォルトの名無しさん
15/12/19 19:06:17.07 2xl0Mjgh.net
サンクス。IntelですらOpenCL2.0に対応しているのに業界最大手のnVIDIAがやらないのはなぁ
CUDAを使えという事なんだろうけど、それではnVIDIA専用になってしまうからそれは避けたい。
かといってnVIDIAを無視する訳にもいかないというジレンマ
そろそろOpenCL2.xをメインにしていきたいのだが

855:デフォルトの名無しさん
15/12/20 00:20:21.34 ujiFhYYe.net
VGAはいまAMDがすごく伸びてきているんだろ
来年の後半にはVGAの販売数シェアではAMDがNvidiaを上回るんじゃないのか
再来年には一般グラフィックではIntel、AMDが2強ってなるんじゃないか

856:デフォルトの名無しさん
15/12/20 00:47:13.59 14eB8c4R.net
NVIDIAのOpenCL対応はちょうどAppleが採用やめたあたりから停滞したな。
結局のところNVIDIAにとって、そういうOpenCLを望む大口の顧客でもいない限り
OpenCLに力を入れる理由はないんだろうな。

857:デフォルトの名無しさん
15/12/20 01:02:38.32 XNwlDZDb.net
nvidiaはopenAMP+だっけ?あっちに力いれてんじゃないのかね?

858:デフォルトの名無しさん
15/12/20 04:40:12.37 oUoqwn36.net
AMDもCUDAに対応するみたいなニュースをみたけど、どうなったんだろう?
GPGPUの技術も速く落ち着いて欲しい

859:デフォルトの名無しさん
15/12/20 07:41:04.82 MpbNAZoy.net
CUDAが各社GPU共通のならいいけどそうじゃないからなぁ
Intel iGPUでも使えないと困る

860:デフォルトの名無しさん
15/12/20 07:47:22.55 14eB8c4R.net
AMDのあれは、HSAをターゲットにしたHalideやvexclのような並列計算APIで、
それがNVIDIA向けにもコンパイルできるって話だな。既存のCUDAコードからも
コンバートできるというのは目新しいが。

861:デフォルトの名無しさん
16/03/29 10:04:21.74 /c8bAcK4.net
サッカーブッシュ日本代表日程ぷあたん(しゅっちょうまいくろ教育長交代)春文執行40代売上差額シュガーチョコ
URLリンク(www.youtube.com)宇ドナルドアナリストパワーストーンコーチングとしまえん
サッカーブッシュ日本代表日程古本屋よしたけしゅっちょうちょこしゅがー
ディーラー税務署天才開発者死亡詰みヨミドクターマイクロサービ


862:ス不足 サッカーブッシュ日本代表日程ぷあたんシフト光金さかい強制バイト人権侵害問題 春分資源執行ニューヨーク低原価ぼったステーキソルトレイク福岡横浜新橋奴隷課金パチシフト強制バイト問題新潟米センター生残 コスメ24チャリティー隠れ40代生活保護プレイボーイバイトレードいたりあん接待問題 マスコミKARDローンケーオーサービス不足婚活パーティー寄付金執行原発ビジネス FBIチャイニーズタイホテル売上事務所ガチャ決算ガチャキャンペーン(販売報道陣過激派組織向携帯最新情報提供終了 校長発言細心注意ノートン産廃エラー(著作権クレーム中国反応融資高額教育費)(中国捕鯨団体40代社員サッカーコメント 高額入学金ヤフウ新橋大学ヤフウ新橋理事長FX経費 おじや50代資産ガリバズフィード40代エリート



863:デフォルトの名無しさん
16/05/30 13:15:08.40 27ORFIrk.net
CUDA8.0RCでも1.2どまり

864:デフォルトの名無しさん
16/05/31 02:00:22.72 tLbBjsj4.net
CUDAが強すぎて、なかなか広がらないイメージ

865:デフォルトの名無しさん
16/05/31 15:24:04.45 o40hgVi5.net
あまり最適化されてない(できない、ifがそれなりに多い)プログラムをCPUとGPUで動かしてみて、
早い方を採用するには都合がいい。

866:デフォルトの名無しさん
16/08/08 11:44:01.40 OeTPyxgg.net
CUDAは強い強い言われてるけど結局一社独占の技術だから過渡期の産物で終わってメインストリームにはなれんよ
nvidia自体x86やARM関係なくCPUを締め出しにかかって古い仕様を拡張する気がなさそうだし

867:デフォルトの名無しさん
16/08/08 23:41:36.48 FOEjBVJr.net
しかしOpenCLも最近失速気味だしなぁ。規格は2.2まで出てるのにいまだに2.1のまともな実装すら出てないし。
AMDが体力続かなくて手を引いたりしたらOpenVXみたいにフェードアウトするんじゃないか?

868:デフォルトの名無しさん
16/08/13 04:34:37.27 C6tpw


869:DrS.net



870:デフォルトの名無しさん
16/10/29 09:17:30.79 W9gQheBG.net
AppleがGeForce採用すりゃNVIDIAもOpenCLをアップデートすると期待してたが、今回も採用なしか。
それとも逆に、いつまでもOpenCL 2.0対応しないから採用しないのかな。

871:デフォルトの名無しさん
16/10/29 12:19:11.69 YsxFht0u.net
OpenCLはオワコン

872:デフォルトの名無しさん
16/10/29 15:09:52.99 0Cs4HSkt.net
HIPだっけ?
あれでCUDAを汎用的に使えるようになるんじゃないの?

873:デフォルトの名無しさん
16/10/29 18:46:14.19 vjtn6SxB.net
>>862
C/C++使いはOpenCLも使えないと駄目ってなりつつあるんじゃないのか?

874:デフォルトの名無しさん
16/10/30 01:49:24.70 IKgBO44W.net
それはOpenMPでは

875:デフォルトの名無しさん
17/01/08 01:47:50.25 qDa6npPv.net
Vexcl難しい
サンプルコード少なすぎる

876:デフォルトの名無しさん
17/02/12 09:50:54.30 fljd0HzI.net
vexclは挫折してviennacl使ってる
使えるスキルある人ならvexcl良いと思うけど
自分には無理だった

877:デフォルトの名無しさん
17/02/12 14:41:00.16 VBfSC62c.net
boost.computeなら、どうだろうか?

878:デフォルトの名無しさん
17/02/16 11:11:01.71 sX4bqSJb.net
Boost.computeはcudaに対応してない

879:デフォルトの名無しさん
17/02/17 01:28:52.49 LtwBLUnB.net
OpenCLの話題だし、CUDA対応とかより、いかにOpenCLのコードが書きやすいかのほうが大切だと思うんだ

880:デフォルトの名無しさん
17/02/28 20:15:03.56 514SeM49.net
ここ1年くらい停滞気味で話題が少なかったけど、これはめでたい。
NVIDIA 378.66 drivers for Windows offer OpenCL 2.0 evaluation support
URLリンク(www.khronos.org)
一方で、前にいろいろぶち上げたAMDは何してるんだ?Ryzenで忙しいってか?

881:デフォルトの名無しさん
17/03/17 02:02:00.80 YSidBwLT.net
Vexclで行列計算したいけど行列掛け算のexampleしかない
qr分解とかライブラリ使って出来ないの?
Vienaclにはqr分解とか例が沢山あるのに

882:デフォルトの名無しさん
17/03/17 11:56:23.09 ol/nseXL.net
できる

883:デフォルトの名無しさん
17/03/30 08:07:31.22 sSr9ORWQ.net
過疎ってるところ恐縮ですが、質問です。

通常のCプログラムの中で、コプロ的な使い方でOpenCLをインラインアセンブラのように使うような使い方は可能なのでしょうか?
もしくは、その様な使い方を実現する方法はないでしょうか。

884:デフォルトの名無しさん
17/04/04 23:25:23.65 d4Y6801f.net
Openmpでgpuの並列計算も出来るようになってから
Viennaclは更新も止まって、もう実質一年ぐらい更新ない

Openmpがgpu計算の標準になるのかな

885:デフォルトの名無しさん
17/10/25 09:29:08.47 h/b8kKiY.net
開発環境自体もOpenCL 2.0で止まっている感じはするな
鈍足になった感じはする

886:デフォルトの名無しさん
18/04/03 04:40:48.84 mPevnajZ.net
cudaだと毎回計算結果違うとかビットエラーで整数計算も間違うことあるらしい
OpenCLをamdで動かすとどうなの?

887:デフォルトの名無しさん
18/04/03 11:25:01.62 R6gDm2yr.net
えっ

888:デフォルトの名無しさん
18/04/03 23:11:05.85 RICRRaNn.net
マイニング終了でRädeonの中古が格安で大量に売られてるので
何か使えないか
Openclってひょっとして再帰できない?

889:デフォルトの名無しさん
18/04/06 09:28:13.93 Z8wP2fEV.net
>>877
科学計算用のやつだと、ちゃんとエラー補正してくれるよ

890:デフォルトの名無しさん
18/05/18 19:25:23.10 RN2l/52Z.net
再帰できないってことはないだろ。
確認まではしてないけど、小さいの書けばすぐわかるからよろしくです

891:デフォルトの名無しさん
18/05/18 23:22:29.85 z36hYsyi.net
たしか昔はcudaも再帰できなかったと思う
ある時期までの規格なら再帰できないとかもありえる
あるいは製品依存とか?

892:デフォルトの名無しさん
18/05/19 10:52:19.90 iBGlap+k.net
再帰って、例えば階乗(n!)を関数内で1引いて乗算して、また自身を呼び出すみたいなことでしょ?
できないわけないよな……と脳内で思ってます。
色々な階乗をパラでやっても大丈夫だと思うし、一つの階乗をパラでやっても排他きちんとやれば大丈夫だと…
もしかして全く勘違いなこと言ってるのかな…
(最近CL書いてない、というか、並列プログラム自体ネタがなくて書いてないorz)

893:デフォルトの名無しさん
18/05/19 12:28:46.68 BjCA6AhS.net
再帰するにはスタックが必須になるから
そんな暗黙の領域管理をGPUにやらせるのかってことでしょ
再帰がなければ関数ごとに固定領域を決めればいいので楽できる

894:デフォルトの名無しさん
18/05/19 13:45:59.07 iBGlap+k.net
普通に関数呼んでreturnで帰って来るんだから、スタックなんて意識しなくていいんじゃない?
(関数の戻り先は、勝手にスタックに積んでreturnで勝手に取り出してくる)
スタック容量が少ないから別途管理しないといけないってこと?

895:デフォルトの名無しさん
18/05/19 14:22:31.54 7qbCVCh9.net
ふつう、関数はインライン展開される。
再帰だと原則それができない。

896:デフォルトの名無しさん
18/05/19 15:09:02.73 GMayPujS.net
888

897:デフォルトの名無しさん
18/05/19 16:23:46.57 KZiehyBT.net
マイニング負け組はこちらへどうぞ
intel Oprencl2.1が今はお勧め
書籍もいっぱいあるぞ!
構わないからデペロッパーになろう

898:デフォルトの名無しさん
18/05/19 19:18:17.82 fx9VLx2G.net
>>886
マジっすか。勉強になりました。
m(_ _)m

899:
18/05/20 14:06:31.19 JyKbNFIa.net
>>886
Yコンビネータを見よ
インライン展開された、いいかえると無名関数であっても、再帰は可能である

900:デフォルトの名無しさん
18/05/20 14:35:44.13 KmZcyykh.net
的外れすぎるw
Yコンビネータは無名関数で再帰ができるようになる程度の意味しかないだろ。
(末尾呼び出し最適化がない限り)関数呼び出し深さが不定であるのには変わりない。
もちろんOpenCLには末尾呼び出し最適化も第一級オブジェクトとしての関数もないし、
それどころか関数ポインタすらない。

901:デフォルトの名無しさん
18/05/20 16:22:27.06 V9eOsuAz.net
うむ

902:デフォルトの名無しさん
18/05/23 19:10:21.35 Au5e7VGg.net
僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
H1I8V

903:デフォルトの名無しさん
18/05/24 10:34:27.52 cPlRxlDn.net
H1I8V

904:デフォルトの名無しさん
18/07/04 18:21:25.84 bZ79e0V+.net
これ人気らしいぞURLリンク(goo.gl)

905:デフォルトの名無しさん
18/07/04 21:44:26.88 gFgZc5FG.net
QOJ

906:デフォルトの名無しさん
18/07/05 16:14:25.67 AeL6VB/V.net
H1I8V

907:デフォルトの名無しさん
19/06/19 04:56:27.83 tVNS+22r.net
【出資】松本卓朗 人工知能詐欺【注意】
スレリンク(rikei板)

908:デフォルトの名無しさん
19/06/19 08:10:22.42 qaAgAiWI.net
久しぶりに何か書かれたと思ったら orz

909:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch