【GPGPU】くだすれCUDAスレ part6【NVIDIA】at TECH
【GPGPU】くだすれCUDAスレ part6【NVIDIA】 - 暇つぶし2ch845:デフォルトの名無しさん
14/04/29 21:03:18.01 AVMxK0NV
大して変わってないくせに開発環境変えるなよな

846:デフォルトの名無しさん
14/05/03 04:22:53.23 qVaKcd2l
これまで開発したプログラムをmaxwellアーキテクチャーで動作させるには
5.5までのtoolkitでptxを吐かせるのか、6.0に移行するしかない模様。

847:デフォルトの名無しさん
14/05/04 16:05:09.46 /x2IsFFD
>>846
3月末に、カーネルを15種類連続実行するプログラムを、
CUDA Toolkit 5.5でFermi(CC=2.0/2.1)用コンパイルした物、
Kepler(CC=3.0/3.5)用にコンパイルした物、
CUDA Tooklit 6.0でMaxwell(CC=5.0)用にコンパイルした物の3つで、
GeForce 750 + NSIGHT Visual Studio Editonで「All」でプロファイル採ってみた。
いずれの場合も、ほとんど速度が変わらなかったよ。

だから、無理にMaxwell(CC=5.0)用にする必要は無いかも。

848:デフォルトの名無しさん
14/05/06 20:16:14.86 OXY1qxhv
>>847
これ
URLリンク(docs.nvidia.com)
は釣りってこと? Σ(-д -;)

849:デフォルトの名無しさん
14/05/07 05:55:14.20 OEkku2Ok
>>848
>>846 で合ってると思う。
Gxx→FermiやFermi→Keplerのときも、
新アーキテクチャ非対応な古いToolkitで作ったcubinは使えなかったはず。

850:デフォルトの名無しさん
14/05/10 00:08:49.78 YhiaKf7O
Jetson買った人いる?

851:デフォルトの名無しさん
14/05/10 01:02:28.38 sYRhNUSv
Jetsonってなんだと思ってぐるぐるしたら、NvidiaのRasPiか
RasPiより性能大分良いんだろうが、でも、2万超えは高いな

852:デフォルトの名無しさん
14/05/10 16:02:02.59 p0Sddlo6
自動車用じゃん。スレチだろ

853:デフォルトの名無しさん
14/05/10 20:33:48.55 /nRhPCsz
べつに限定されてはいない

組み込み用といだけ

854:デフォルトの名無しさん
14/05/12 23:57:23.84 LAs79Y1U
この手の奴にBTデフォでついてんのみたことない
今後の組み込みの方向性的に必須なのに

855:デフォルトの名無しさん
14/05/13 00:15:45.25 CSl2SJJR
CUDA Tooklit を6.0にしたらGPU稼働率が下がったんだけど気のせい?

856:デフォルトの名無しさん
14/05/13 00:29:27.71 Iv7eBFJt
>>855
Ver変えたら能率が大きく違ったりするのはよくあることだからなあ……

857:デフォルトの名無しさん
14/05/13 01:44:04.16 CSl2SJJR
CUDA Tooklit を5.0から6.0にしたら
数値計算プログラムの挙動がおかしくなったorz
おんなじような事になった人いますか?

858:デフォルトの名無しさん
14/05/13 04:13:33.08 CSl2SJJR
連投すんません。数値計算上の安定化を入れたら解決しました。
浮動少数演算の癖がこれまでと違うのかも・・・。

859:デフォルトの名無しさん
14/05/13 12:29:21.30 pJVewP3A
安定化って何したんですか?

860:デフォルトの名無しさん
14/05/13 12:54:09.60 X1Xq41se
URLリンク(ja.wikipedia.org)

861:デフォルトの名無しさん
14/05/13 14:08:06.19 CSl2SJJR
>>859
非線形最小二乗法のプログラムで、
一回の反復で更新する解の量を少し減らしたら安定しました。
CPUプログラムよりもGPUプログラムの場合に、
初期値からとんでもなく離れていってしまう場合が多いように感じます。

862:デフォルトの名無しさん
14/05/13 14:15:03.11 CSl2SJJR
>>859
URLリンク(en.wikipedia.org)
4. Expansion
のパラメータγを通常2とするところ、
1.9-2.0の間で初期値に応じて変化させるようにしました。

863:デフォルトの名無しさん
14/05/13 15:22:39.27 pJVewP3A
>>860-862
サンクス
誤差の拡大を抑えるってことなんですね
でもCUDAバージョンの違いで問題が出るってなんだろ?
へんな最適化がされてしまってるのかなあ

864:デフォルトの名無しさん
14/05/13 20:36:41.53 ckwx0yCj
演算の挙動が論理的に変わるような変更ってあったっけ?

865:デフォルトの名無しさん
14/05/17 07:57:45.29 jeRfV2R/
URLリンク(developer.download.nvidia.com)

CUDA 6 Report


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch