【GPGPU】くだすれCUDAスレ【NVIDIA】

【GPGPU】くだすれCUDAスレ【NVIDIA】at TECH

【GPGPU】くだすれCUDAスレ【NVIDIA】 - 暇つぶし2ch754:デフォルトの名無しさん
09/06/24 07:13:15
やっとFortran対応の話出てきたけど、有料なんかね
PGI and NVIDIA Team To Deliver CUDA Fortran Compiler
URLﾘﾝｸ(eu.st.com)

755:デフォルトの名無しさん
09/06/24 07:18:14
ていうかいつのまにかに2.3のベータ出てたのか

756:デフォルトの名無しさん
09/06/26 12:01:06
GTX 285でようやくおれのようなへっぽこでも普通にcpuを凌駕するコードが書けるように
なったようだね。

後は（値段はともかく）消費電力が下がってくれれば、大ブレイクしそう。

757:デフォルトの名無しさん
09/06/27 12:19:52
３００Wなんてクアッドコアマシンを４台くらいクラスタリングしたような消費電力だからな

758:デフォルトの名無しさん
09/07/01 03:13:56
>おれのようなへっぽこでも普通にcpuを凌駕する
だったらCPU要らんがな。
むしろCPU<->GPU間の通信がボトルネックなので、CPU無くして
GPUに直接I/O繋げられるようにしろや！

759:デフォルトの名無しさん
09/07/01 21:14:50
>>758
それなんていうTesla?

760:デフォルトの名無しさん
09/07/01 23:30:38
>>759
それTesｌaでもない。

761:デフォルトの名無しさん
09/07/02 07:45:08
CUDAで乱数を効率的に生成する方法を教えてください

762:デフォルトの名無しさん
09/07/02 09:23:34
>>761
コアごとに違う種から乱数生成すればいいんじゃね？

763:デフォルトの名無しさん
09/07/03 00:25:57
質問なんですが、SDKに付いてたサンプルをmakeしようとしたところ
以下のようなエラーが出てうまくいきません、何か足りないものがあるのでしょうか

/usr/bin/ld: cannot find -lXi
collect2: ld はステータス 1 で終了しました
make[1]: *** [../../bin/linux/release/nbody] エラー 1

OSはfedora10です。色々初心者なのでどうかお願いします。

764:デフォルトの名無しさん
09/07/03 00:52:49
libXiというパッケージをインストールできないかね
俺もfedoraはよく記憶にないんだが

765:デフォルトの名無しさん
09/07/03 07:55:20
>>764
libXiというのがインストールされていないということだったのですか
早速インストールしたいと思います。どうもありがとうございました。

766:デフォルトの名無しさん
09/07/05 04:21:12
teslaとgeforceって何が違うの？

767:デフォルトの名無しさん
09/07/05 05:03:33
OpenGL向けかDirectX向けか

768:デフォルトの名無しさん
09/07/05 10:40:00
>>767
それquadroとgeforceでしょ。

>>766
teslaはhpc専用ボードで、ディスプレイの出力ポートがない。
NVIDIAがボードの製造まで一貫して行ってて、テストもしっかり通している…らしい。
あとメモリが4GB乗ってる。

769:デフォルトの名無しさん
09/07/06 09:01:42
CUDAというよりハードウェアの話なんですが質問させてください

TESLA C1060をMM3500に刺したいんですが、この状態だとBIOSが拝めません
ビープ音「－・・（長短短）」って音がするんでAwardで調べたらビデオアダプタ不良らしい
マザーボードだけを他のに変えたら正しく起動するので、電源やTESLAが悪いわけではなさそうです
TESLAなしのMM3500だけならUbuntuのBoot CDからMemtestが走るとこまで行きました

770:デフォルトの名無しさん
09/07/06 09:34:48
スレ違いどころか板違いだ
判ってるなら該当板いけよ

771:デフォルトの名無しさん
09/07/06 22:26:16
>>769
買ったとこに聞いた方が良いかと...

772:デフォルトの名無しさん
09/07/07 00:46:08
>>772
ありがとう　まずはVIAにメールしてみます

773:NVIDIAの営業の受け売りw
09/07/07 09:05:04
・GeForce
NVIDIAはパーツ選択にはノータッチ。各社さんが勝手に安い部品を積んでいるから動作しなくても当然。
プロならそんなアキバ的発想はやめて、QuadroFXかTeslaを使ってください。
・QuadroFX
NVIDIAの厳しいテスト基準に合格した高品質の出力を保証しているから決して安くありません。
プロにも安心してお使いいただけます。
・Tesla
QuadroFX以上に品質に重点を置いてテストを行なっています。HPCにはこれ以外の選択肢はありえません。

774:デフォルトの名無しさん
09/07/07 09:07:57
>>768
OpenGL向けもDirectX向けもないよ。>773にもある通り、NVIDIAがテストしているかどうかの違い。
なんせ、GeForceの製造販売を行なっているELSAの営業の前で堂々と>773みたいなことを仰ってる。
10倍の価格差も、当然ということなのでしょう。

775:デフォルトの名無しさん
09/07/07 22:07:57
そりゃカノプーが手を引くわけだよな
どうしたってGeForceは価格競争になっちまう

776:デフォルトの名無しさん
09/07/08 00:28:37
不特定多数の客向けのプログラムでGPGPUを使うコードを書くやつはアホウ、ってことだな。

777:デフォルトの名無しさん
09/07/08 06:57:16
全てアホウと決め付けるのはねぇ
　中には超やばいものを開発するかもよ（世界は広い）

特にロシア東欧は要注意！

778:デフォルトの名無しさん
09/07/09 00:40:40
>>777
アホウと言っているのが、nVIDIAの営業ってことだよ。

779:デフォルトの名無しさん
09/07/11 00:02:30
「阿呆」とは言わなかったけれど、「動かなくても当然ですから」くらいのことは言ってたなぁ。

780:デフォルトの名無しさん
09/07/11 00:17:01
今月末に CUDA2.3 が出るとさ。

PGI compiler 9.0 は2週間体験できるから、Fortran で単純な行列積の
コードを書いて試してみたけど、Core2 Quad + GeForce9800GTX で
CUDA 2.0 という古い組み合わせのせいか，
!$acc region の設定の効果が全く現れなかった。

pgf95 -ta=nvidia:cc11 matrix.f
というコマンドでいいと思うんだけど。

781:デフォルトの名無しさん
09/07/11 19:31:18
CUDA用の姫野ベンチをGTX285で実行しようとしたのですけど動きませんでした。
何が原因かわかりません、どなたかわかる方いらっしゃいましたらお願いします。

782:デフォルトの名無しさん
09/07/11 20:08:49
原因はわかりますが、何をお願いされているのかわかりません。

783:デフォルトの名無しさん
09/07/11 21:19:47
その原因について詳しく教えて頂きたいのですが

784:デフォルトの名無しさん
09/07/11 22:37:16
>>783
原因なら簡単ですよ。
あんたが人間じゃなくて人だからです。

785:デフォルトの名無しさん
09/07/11 23:13:59
動くかどうかも保障してないものが普及するとか思ってるのか？

786:デフォルトの名無しさん
09/07/11 23:20:06
>>785
>779のことを言っているのなら、QuadroFXとTeslaがあるから大丈夫だと思っている
頭に蛆が涌いているとしか思えないNVIDIAの営業に言ってあげてください。

無駄だけどw

787:デフォルトの名無しさん
09/07/15 19:53:47
visual profilerについて質問です
プロファイラの項目GPUTimeを見ると全体で3000くらいなのですが、
プログラム中で cutCreateTimer( &timer) を使って計測すると 18ms～60msのバラけた値が出ます
これってどちらが正しい値なのでしょうか？

788:デフォルトの名無しさん
09/07/15 21:31:07
>>781
バイナリのCUDA SDK1.1だからだろ

789:デフォルトの名無しさん
09/07/15 23:02:02
>>787
cutCreateTimer()の実装を見てみた?

790:デフォルトの名無しさん
09/07/20 19:00:37
Fixtarsの資料面白いね、祝日に更新ご苦労さんだわ
この調子で本家資料全部訳してくれないかなｗ
URLﾘﾝｸ(gpu.fixstars.com)

791:デフォルトの名無しさん
09/07/22 08:05:55
2.3来たね、やっと64bit版で32bitコンパイルできるようになった

792:デフォルトの名無しさん
09/07/23 13:44:49
Mac版の2.3.0ドライバーインストールしてみたら、一回目libcuda.dylibだけ入らなかったことに気付かなくて、全然見当違いの所で原因探してて苦労したよ。
一発で入るようにしてください、nVidia様

793:デフォルトの名無しさん
09/07/25 22:10:54
URLﾘﾝｸ(www.nv-info.com)

20年前の高校生は参加しちゃダメかな?

794:デフォルトの名無しさん
09/07/25 22:13:36
Teslaプレゼントしろよ
相変わらず一貫してないな

795:デフォルトの名無しさん
09/07/26 23:27:14
CUDAで動くトリップ検索ツール頂ける方いらっしゃいませんか

796:デフォルトの名無しさん
09/07/27 00:50:11
ﾉｼ

797:デフォルトの名無しさん
09/07/27 03:25:45
【レポート】中高生がCUDAにチャレンジ! NVIDIAがGPUコンピューティングの体験イベント開催 | パソコン | マイコミジャーナル
URLﾘﾝｸ(journal.mycom.co.jp)

798:デフォルトの名無しさん
09/07/27 10:10:10
>>795
あれ？まだ誰も作ってなかったの？

799:デフォルトの名無しさん
09/07/27 10:43:20
あと6年早ければ・・・

800:デフォルトの名無しさん
09/07/27 11:08:28
>>798
らしいです

801:デフォルトの名無しさん
09/07/27 22:53:08
じゃぁ俺が作るか。
まずはCUDA無いバージョンのソースがあるURL教えてｗ

802:デフォルトの名無しさん
09/07/28 00:02:52
まあ、待て屋。

803:デフォルトの名無しさん
09/07/28 00:07:41
>>802
それはラデ用のしかなかったような…

804:デフォルトの名無しさん
09/07/28 00:11:46
CUDA無しを所望のようだからこれで良くね？
CPU用のコードも当然あるよ。

805:デフォルトの名無しさん
09/07/28 00:17:31
>>804
nVIDIAのVGAしか持ってないんだorz

806:デフォルトの名無しさん
09/07/28 00:22:33
>>805は>>795か？
俺は>>801に向けて書いたんだが・・・

807:デフォルトの名無しさん
09/07/28 00:26:42
>>806
あ、はい。
俺は>>805であり、>>795です。

ID出てないと面倒だね

808: ◆hEpdoZ.tHU
09/07/28 06:51:10
>>807
トリップ使ってけれw

809: ◆DokuomoeW.
09/07/28 16:50:48
>>808
おｋ

>>807です

810:,,・´∀｀・,,）っ-○○○
09/07/29 21:19:39
Larrabee向けのソースコードなら多分あるんだがｗｗｗｗｗ

811: ◆DokuomoeW.
09/07/30 12:59:13
まだ手元にある定額給付金で
ラデ買ってくるかな…

それも一つの選択肢

812: ◆DokuomoeW.
09/07/31 21:10:00
かつてTripcode ExplorerのCUDA版があったらしいね
でも、今はもう消えてる…

813:,,・´∀｀・,,）っ-○○○
09/07/31 21:52:43
ギコハハハ

814:デフォルトの名無しさん
09/07/31 22:14:27
>>812
がはは！それはネタだからーw

815: ◆DokuomoeW.
09/07/31 23:11:08
>>814
そうなんだｗｗｗｗｗｗ

816:,,・´∀｀・,,）っ-○○○
09/07/31 23:31:10
ふふふ

817:デフォルトの名無しさん
09/08/01 05:48:13
あらあらふふふ

818:デフォルトの名無しさん
09/08/01 07:37:39
これでいいじゃん
URLﾘﾝｸ(tmkk.hp.infoseek.co.jp)

819:デフォルトの名無しさん
09/08/02 20:49:45
３００Wも消費する物体を数週間動かすとは恐ろしいｗ

820:デフォルトの名無しさん
09/08/03 07:25:23
shared memoryって,CPUで言うL1キャッシュみたいなもん？？

821:デフォルトの名無しさん
09/08/03 08:04:31
>>818
これって使うとどれくらい寿命減るの？
作った人って絶対に高負荷かけて石を壊そうとしてるよね・・・

822:デフォルトの名無しさん
09/08/03 15:36:31
>>821
なにいってるの・・・
まあたしかにファンがクソだと熱で死ぬ可能性はあるが

823:デフォルトの名無しさん
09/08/04 03:54:01
>>820
大分違う。つーか、CPUとは考え方を変えないと使いこなせないよ。

824:デフォルトの名無しさん
09/08/04 10:08:33
>>820
CPUで言うレジストリみたいなもんだ

825: ◆DokuomoeW.
09/08/04 13:52:22
>>818
for Macだ…と

826:,,・´∀｀・,,）っ-○○○
09/08/04 21:07:21
Windows用に直せるだろこんなん。（と言ってやらない）

827:,,・´∀｀・,,）っ-○○○
09/08/04 22:06:06
Vistaだと困ったことに、描画に支障ない程度に負荷調整しないとAeroが死ぬｗｗｗ

828:デフォルトの名無しさん
09/08/08 22:45:00
だれかトリップ生成のアルゴリズム説明して？
趣味でCUDA処理のコード書いてみたいからー

>>818のコード読めって話だけど、ハッシュとか暗号系はアルゴリズム知ってないと、時間かかるんでお願いします。

829:デフォルトの名無しさん
09/08/08 23:22:43
309 名前：◆cZfSunOs.U []： 2009/06/19(金) 11:46:10 ID:MLNb4KfK0 (17)
生キー指定以外の12桁以上「##～」形式も将来の拡張用にしておきましょう．
で，まとめ:

if (length $handle_pass >= 12)
{
my $mark = substr($handle_pass, 0, 1);
if ($mark eq '#' || $mark eq '$')
{
if ($handle_pass =~ m|^#([[:xdigit:]]{16})([./0-9A-Za-z]{0,2})$|)
{
$GB->{TRIPSTRING} = substr(crypt(pack('H*', $1), "$2.."), -10);
}
else
{
# 将来の拡張用
$GB->{TRIPSTRING} = '???';
}
}
else
{
use Digest::SHA1 qw(sha1_base64);
$GB->{TRIPSTRING} = substr(sha1_base64($handle_pass), 0, 12);
$GB->{TRIPSTRING} =~ tr/+/./;
}
}
else
{
# 従来形式
}

830:デフォルトの名無しさん
09/08/08 23:23:28
インデント消えたorz

831:デフォルトの名無しさん
09/08/08 23:25:49
Kernel用のCRYPTを自前実装しないといけないのか・・

832:,,・´∀｀・,,）っ-○○○
09/08/09 00:05:13
C++用のコード晒してみる。これは実際に某ツールで使ってる。

char* trip_sha1(const char* key) {
SHA1Context sha1;
SHA1Reset(&sha1);
SHA1Input(&sha1, reinterpret_cast<const uint8_t*>(key), std::strlen(key));
uint8_t digest[SHA1HashSize];
SHA1Result(&sha1, digest);

static char cryptresult[13]; /* encrypted result */
static const char base64mod[] = /* 0..63 => ascii-64 */
"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789./";
cryptresult[0] = base64mod[digest[0] >> 2];
cryptresult[1] = base64mod[(digest[0] << 4 | digest[1] >> 4) & 0x3F];
cryptresult[2] = base64mod[(digest[1] << 2 | digest[2] >> 6) & 0x3F];
cryptresult[3] = base64mod[digest[2] & 0x3F];
cryptresult[4] = base64mod[digest[3] >> 2];
cryptresult[5] = base64mod[(digest[3] << 4 | digest[4] >> 4) & 0x3F];
cryptresult[6] = base64mod[(digest[4] << 2 | digest[5] >> 6) & 0x3F];
cryptresult[7] = base64mod[digest[5] & 0x3F];
cryptresult[8] = base64mod[digest[6] >> 2];
cryptresult[9] = base64mod[(digest[6] << 4 | digest[7] >> 4) & 0x3F];
cryptresult[10] = base64mod[(digest[7] << 2 | digest[8] >> 6) & 0x3F];
cryptresult[11] = base64mod[digest[8] & 0x3F];
cryptresult[12] = 0;
return cryptresult;
}

833:デフォルトの名無しさん
09/08/09 00:36:34
ｓｈ１のCUDA版くらいありそうだけど

834:828
09/08/09 00:38:07
ご両人、コードさんくす～
実はC住人なんで（汗

蛇足だが関数内のstaticの使い方が気持ち悪いです（笑

さー昔しらべたSHA-1の資料でもひっぱってくるかー

835:,,・´∀｀・,,）っ-○○○
09/08/09 01:53:23
オリジナルのcrypt(3)でもchar配列はstaticでとってるんだよな
たしかにキモイ

std::stringとか使ってみ？
CUDAに移植できへんで？

836:デフォルトの名無しさん
09/08/09 01:56:33
笑えるくらいきれいなワンツーｗ

837:デフォルトの名無しさん
09/08/09 01:57:37
ごば

838:デフォルトの名無しさん
09/08/09 13:04:04
CUDAでrandは使えない？

839:デフォルトの名無しさん
09/08/09 13:11:14
>>838
使えないよ。自分で用意しないと。

840:デフォルトの名無しさん
09/08/09 13:25:21
CUDA上でのSHA1の実装というとこのあたりか？
URLﾘﾝｸ(forums.nvidia.com)

841:デフォルトの名無しさん
09/08/10 22:49:48
r0,g0,b0,r1,g1,b1,r2,....

というようなグローバルメモリにあるchar型の配列に対して、GPU側からuchar4型変数で

{r0,g0,b0,r1} {r1,g1,b1,r2},....

というようにアクセスすることは可能でしょうか？

842:デフォルトの名無しさん
09/08/11 01:04:40
y*4+x

843:841
09/08/11 01:59:08
あーこれじゃ駄目だった
ごめんなさい、忘れてください

844:828 ◆TripEQ.VNLIV
09/08/11 21:13:55
だめだー
SHA1と総当り攻撃じゃ現実的じゃない。。。
4桁適合ならまだ使える感じorz

845:デフォルトの名無しさん
09/08/21 13:47:21
誰かRADEON HD48xx向けのCUDAドライバ開発してないの？

846:デフォルトの名無しさん
09/08/21 14:23:41
>>845
どちらかというと
AMD Accelerated Video Transcoding（AVT）

では？

847:デフォルトの名無しさん
09/08/21 16:05:07
いや、CUDA互換機能つけて
CUDA対応ソフトを使えるようにならんかなーと。

848:デフォルトの名無しさん
09/08/21 17:49:44
>>847
OpenCLじゃだめですか？

849:デフォルトの名無しさん
09/08/21 17:50:52
ラッパー作ってくれるならいいけど・・・
既存のソフトでCUDAにしか対応してないやつとか
CUDA以外の開発環境が整わなさすぎて、見切り発車でCUDA使いたいなとか
あるんで。

850:デフォルトの名無しさん
09/08/21 18:44:14
CUDAってOpenCL取り込んでたような……気のせい？

851:,,・´∀｀・,,）っ-○○○
09/08/21 20:13:56
CUDAは環境。

OpenCLは言語・フレームワークで、CUDA向けのプログラムを記述出来る物のひとつ。
従来の「CUDA言語」は "C for CUDA" という扱いになった。

852:デフォルトの名無しさん
09/08/21 20:36:51
x64でCUDAをしようと思ったんだけど，vitual studioでプロジェクトが作れない．
CUDA_VS_Wizard_W64.2.0を入れて，
CUDA64WinAppはテンプレートとして表示されるようになったが，
選択してもうまく生成されない．
CUDAWinApp(32bit)の方はうまく生成される．

64bitで開発してる方や，
症状の原因がわかりそうな方，ご教授願う．

853:デフォルトの名無しさん
09/08/21 21:00:40
おっと，自己解決．
スレ汚しスマソ．

854:デフォルトの名無しさん
09/08/21 23:07:09
>>853
いや、教えてよ（笑）

855:デフォルトの名無しさん
09/08/23 20:28:04
共有メモリのBank Conflictがいまいちわからないのですが、
同じ配列のアドレス(添え字)に複数のスレッドが同時にアクセスしなければいよいのでしょうか？

856:デフォルトの名無しさん
09/08/26 07:21:12
最近のマザボってPCIEx16が普通に2,3個あるよな
ところで違う世代のGeForce9800、GTX280とかを積んだ場合
CUDAはどちらのGPUも使ってくれるの？

857:デフォルトの名無しさん
09/08/26 09:24:02
>>856
CUDAはGPUチップを一つだけしか使えない。
どれを使うかは、cudaSetDevice()で指定しないといけない。
サンプルの、MultiGPUを参照のこと。

858:デフォルトの名無しさん
09/08/26 18:32:52
ということは，
最近のグラボ一枚にGPUが2つ積んであるヤツでも，
GPUを指定してやらないといけないのか．

859:デフォルトの名無しさん
09/08/26 18:39:49
そそ、しかも1スレッド1GPUに拘束される。

860:デフォルトの名無しさん
09/08/26 19:17:17
>>858
未確認だけど、SLIの場合はドライバで1つのGPUに見せかけるらしい。
2チップを積んでいるカードは内部でSLI接続されているらしいし、
1デバイスの場合と同じでもいいかもしれない。

861:デフォルトの名無しさん
09/08/26 23:51:13
SLIとCUDAは同時使用できないとかじゃないのか？

862:デフォルトの名無しさん
09/08/27 00:10:58
URLﾘﾝｸ(forum.nvidia.co.jp)
* SLIグループ内の各GPUは個別に列挙されるようになったため、
計算アプリケーションはSLIがグラフィックス向けに有効になっている
場合でも、マルチGPUの性能を活用することができます。

と、リリースノートにはあるね

863:デフォルトの名無しさん
09/08/27 00:25:41
>>862
2.3からはSLIの場合でもCUDAからは個別に見えるように変更なのか。

SLIでゲームの中でPhysXとかCUDAを使う場合とかは特定のチップに負荷が集中して
そのせいで利用効率が落ちたりしないのかな？

864:デフォルトの名無しさん
09/08/27 01:23:53
プログラマが生理整頓するか，
CUDAさんよろしくお願いしますするか，どっちがいいかってことか．
でも，一度の演算に対して，1コアにスレッドが重複しない限りは，
無駄に複数のGPUに処理を分配する必要性はないよな．
演算の命令ごとにGPUを切り替えるなら，効果はありか．
SLIの場合って，GPUのRAMは共有されるのか？

>>859
GPUはGPU内の大量のコアがそれぞれ1スレッドずつ受け取る仕組みじゃないのか？
1スレッド1GPUって並列演算ってレベルじゃねーぞ．

865:デフォルトの名無しさん
09/08/27 03:53:53
>>864
「スレッドを受け取る」っていう意味がわからんのだが。
CPUの１スレッドがGPU１個使って、そのGPUが複数スレッドを実行する。

866:デフォルトの名無しさん
09/08/27 04:59:54
>>865
CPUのスレッドなのね．
スレッドのことをGPUのハードウェアスレッドかと勘違いしてた･･･orz

867:デフォルトの名無しさん
09/09/01 18:44:53
CUDAがでてきた2005年当時は、シングルコアの限界も見えてきて、それなら

有り余るグラフィックボードの性能を、3Ｄレンダリングや、フォトショップフィルタなど、ゲーム以外にも有効活用と歌ってたけど

あれよあれよという間に、インテルCPUがマルチコア化してきて、そっちの方が上記の用途に、大きな効果があり、メインになってきて、

結局グラフィックボードは、結局またGPUはゲーム以外に用なしになったなｗ

868:デフォルトの名無しさん
09/09/01 19:21:06
U-BASICってバージョンアップしないの？

869:デフォルトの名無しさん
09/09/01 19:38:01
>>867
コンシューマーはそうかもしれんけど、エンタープライズはまた少し違うんじゃない？じゃなきゃNVIDIAもTESLAなんて作らんよ。

870:デフォルトの名無しさん
09/09/01 20:10:53
ああシールの貼り替えで10倍の金を取るために始めたアレか

871:デフォルトの名無しさん
09/09/01 23:00:56
>>870
本気でそう思ってるなら偏狭すぎる。少しは頭使えよ

872:デフォルトの名無しさん
09/09/02 00:04:27
>>869
むしろ、nVIDIAはTESLA以外作りようが無かったんでしょ。
だってCPU作れないんだもん。

873:デフォルトの名無しさん
09/09/02 02:29:04
NVIDIA は、2009年8月17日、業界標準の線形代数ライブラリ、LAPACK を、超並列処理の NVIDIA CUDA 対応 GPU に最適化した実装「CULA」のベータ版が EM Photonics 社からリリースされたと発表した。
LAPACK ルーチンは何百万人もの開発者が活用し、数値物理学、構造力学、電子設計オートメーションなどさまざまな問題の解決に役立てられている。
CULA により、ワークステーションやデータセンターで使われている NVIDIA Tesla GPU の力を活用し、クアッドコア CPU 1個の場合でパフォーマンスを最大10倍に引き上げることが可能になるとされる。
EM Photonics には、CULA Basic、CULA Premium、CULA Commercial からなる CULA tools という製品ファミリがある。CULA ライブラリとは、LAPACK ルーチンの実装の1つで、GPU の能力を活用して高速に処理が行えるようにしたもの。
LAPACK というのは線形代数でよく使われる関数の集合体で、科学分野や工学分野で活用されている。科学分野や工学分野の問題は線形モデルで近似できることが多いため、線形代数ルーチンで解が得られる。
CULA は、NVIDIA GPU が持つ超並列 CUDA アーキテクチャを活用し、LAPACK ルーチンの多くを高速で処理できる。

874:デフォルトの名無しさん
09/09/02 08:05:49
>>872
それ以外作りようがなかったからって…事前事業でやってるんじゃないんだぞ？「しょうがなくTESLA作る」とかありえないんだよ。純粋に、戦略的なマーケティングの結果だろ。

875:デフォルトの名無しさん
09/09/02 08:10:12
>>874
× 事前
◯ 慈善

876:デフォルトの名無しさん
09/09/02 09:31:55
戦略的なマーケティングの結果、マザボは作れてもCPUは作れないNVIDIAは仕方なしに、
TESLAをでっち上げたわけですね、判ります。

877:デフォルトの名無しさん
09/09/02 12:41:59
CPUは作れないってどういう意味で言ってるんだろ
x86互換プロセッサなんて作れるところはいくらでもある
ただライセンスの問題なダケ
あとはマーケットな

878:デフォルトの名無しさん
09/09/02 12:46:20
x86互換プロセッサぐらいなら大学の授業でFPGAに実装したことあるぞ

879:デフォルトの名無しさん
09/09/02 12:51:56
互換なんてダレでも作れるべ
性能はムリだが

880:デフォルトの名無しさん
09/09/02 12:58:32
DXCSがくるからCUDAはもういらないかもー

881:デフォルトの名無しさん
09/09/02 12:59:56
作るだけならVIAにだってできる

882:デフォルトの名無しさん
09/09/02 13:07:09
↑↑お前出来ないだろｗ

883:408
09/09/02 14:49:32
NVIDIAってCUDA捨てたん？
ここ1年ぐらい見る限りすげーやる気なさそうなんだけど。

884:デフォルトの名無しさん
09/09/02 15:18:52
捨ててないけどやることないだけだろ

885:デフォルトの名無しさん
09/09/02 17:51:42
今はOptiXに期待

886:デフォルトの名無しさん
09/09/02 18:43:14
URLﾘﾝｸ(news.developer.nvidia.com)

おまいら，
9月30日以降に期待ですよ．

887:デフォルトの名無しさん
09/09/02 21:10:27
CUDAで最適化したいプログラムに条件分岐満載で
実際の演算部分がほとんどなくてDate並列化できそうもないときって
あきらめるしかないのかな･･･。

888:,,・´∀｀・,,）っ-○○○
09/09/02 22:49:22
URLﾘﾝｸ(www.atmarkit.co.jp)

Fixstarsのエンジニアからの有り難い言葉

889:デフォルトの名無しさん
09/09/02 23:43:18
条件分岐でシーケンスを発生させる事そのものが目的でなけりゃ、
何か手はあるんでないの？
何しようとしてるか知らんけど、今使ってるアルゴリズムに以外に
GPU向きの手がないか調べてみたらいいんでない？

890:デフォルトの名無しさん
09/09/03 15:42:37
やっぱりx86コアが100個も200個もあるほうがいいんじゃね？

891:デフォルトの名無しさん
09/09/03 17:29:08
>>889
なるほど
もっとソースを読んで見るよ。

あとCUDAについてのオススメの文献あるかな？

892:デフォルトの名無しさん
09/09/03 21:47:44
>>891
GPU Gems3。訳本はアホみたいに高いが、英語でよければネットで公開されてる。途中までだけど。

893:デフォルトの名無しさん
09/09/03 21:52:19
>>890
そりゃそうかもしれんが、コスト見合わんだろ。

894:,,・´∀｀・,,）っ-○○○
09/09/03 22:31:48
x86のほうが性能マシな演算用途こそ、GPUが何百台あってもコスト的に見合わないんじゃないかと

895:デフォルトの名無しさん
09/09/03 22:43:05
>>892
thx
でかい書店いって立ち読みして検討するかな。

>>894
そうとも限らない。
32bit単精度浮動小数点を扱えるプロセッサが数百個あるわけで、
プログラムの仕方によっては高速化する。
まあ向き不向きがあるのは事実だし、どっちが良いとは決め付けられない。

896:,,・´∀｀・,,）っ-○○○
09/09/03 22:47:43
向き不向きでいえばGPUに向いてない（というか使うことすらできない）演算の方が圧倒的に多い。

897:デフォルトの名無しさん
09/09/04 01:37:54
円周率の計算とかに使えればいいじゃん。

898:,,・´∀｀・,,）っ-○○○
09/09/04 02:08:24
なにそれ誰が得するの？

899:デフォルトの名無しさん
09/09/04 02:10:35
円周率を100万桁まで暗記してる人が、あれ？次なんだったっけって言って調べられる

900:デフォルトの名無しさん
09/09/04 05:48:21
GPUが今後発展するなら、GPUに向いたアルゴリズムが開発されてくるでしょう。
でも、普通のCPUが高速化してくるので、結局特定の分野しか使えないのかもね。まさにハードウェアアクセラレータ。

901:デフォルトの名無しさん
09/09/04 16:30:49
全く依存性がなく並列に計算できるものに向いてるんだっけ？
あんまり計算用途には向いてない気もするんだけど。

902:デフォルトの名無しさん
09/09/04 17:05:27
実際高速化されてるものもあるんだし、得している奴はいるだろ

903:デフォルトの名無しさん
09/09/04 17:31:22
粒子法では，GPUかなり美味しいです＾＾

904:デフォルトの名無しさん
09/09/04 17:34:46
画像や文字のパターンマッチングにもそれなりに使えるよ。

905: ◆TripEQ.VNLIV
09/09/04 21:24:41
実は一般ユーザーが恩恵を受ける事はほとんどない事実。。。

906:デフォルトの名無しさん
09/09/04 22:19:54
ATI臭くなってきたぞ，このスレ

907:デフォルトの名無しさん
09/09/05 01:41:57
ATIのGPUでCUDAが使えるならともかく使えないのに、
なぜかCUDAスレでATIの話題がされる不思議。

908:デフォルトの名無しさん
09/09/05 04:37:45
ATOM３３０搭載PCでCUDAなグラボを付けたら幸せになりますか？

909:デフォルトの名無しさん
09/09/05 05:32:50
>>908
気持ち次第です。

910:デフォルトの名無しさん
09/09/05 07:55:02
NVIDIAへの財務次第です

911:408
09/09/05 09:50:44
あきらかに落ち目でしょNVIDIA