12/05/10 01:35:01.75
日本のメモリの会社が潰れたのはかなり痛いな・・・
702:デフォルトの名無しさん
12/05/10 15:36:00.11
ptxコード読まなきゃいけなくなったんだけど、typeの.predって何なのかいまいちわかってない
703:デフォルトの名無しさん
12/05/10 16:46:59.88
述部(predicate)だね。
ptxの場合は単に、比較などの結果を保持するだけのような希ガス。
で、そのレジスタの結果に依存してインストラクションの実行する、と。
例えば、
--
setp.gt.s32 %p1, %r5, %r7;
@%p1 bra $Lt_0_12802;
--
なら r5 > r7のときに分岐するし、
--
setp.lt.s32 %p2, %r9, %r11;
@%p2 sub.s32 %r14, %r11, %r14;
--
なら r9 < r11のときに引き算を行なう。
704:デフォルトの名無しさん
12/05/10 21:33:54.24
分岐マスクのためのレジスタは何本あるんだろ
それとも汎用レジスタと共用なのか
705:702
12/05/11 16:21:50.31
>>703
thx
そういう意味だったのか……
CUDAはC言語の延長だから大丈夫とか考えた三月の俺を叩きのめしたい
PTXコードの読み方って英語のやつしかないよねたぶん
706:デフォルトの名無しさん
12/05/11 17:11:50.74
>>705
私が書いたメモならあるよw
>>704
実験コードで見たところ、汎用レジスタと述語レジスタの合計で制限されてたかと。
述語レジスタだけでどこまで増やせるかは実験してない。
707:702
12/05/11 17:26:43.70
>>706
恵んでください。
割と切実に。卒業したいので。
708:デフォルトの名無しさん
12/05/11 18:02:12.84
ISA的にはwarpあたり7本か6本じゃね。
3bitのどれかが常にalways扱いだったような。
709:デフォルトの名無しさん
12/05/14 15:19:34.27
初心者質問です。
お願いします。
cufftってcuda3.2でも使えるのでしょうか?
cufftdestroyが未解決の外部シンボルだと言われてしまうのですが?
ただ単に、リンクできてないだけなのでしょうか?
710:デフォルトの名無しさん
12/05/14 18:14:14.93
>>709
使えたと思うよ。
つーか、cufftdestroy()が未解決って、あんたの間違いだろ。
711:デフォルトの名無しさん
12/05/15 14:03:46.41
>>710
返信ありがとうございます
他の関数はコンパイルが通る(通っているように見えるだけ?)のに
cufftdestroy()
cufftExecZ2Z()
cufftPlan1d()
だけが未解決となっているのですが、
この関数だけ、他のライブラリが必要だなんてことがあるのでしょうか?
712:デフォルトの名無しさん
12/05/15 15:52:04.02
destroyはDestroy。
z2zは未実装。
Plan1dはしらね。
警告レベル引き上げれば?
713:デフォルトの名無しさん
12/05/17 11:36:49.94
cufft.hはインクルードしているのかな?
714:デフォルトの名無しさん
12/05/17 13:08:31.44
■後藤弘茂のWeekly海外ニュース■
NVIDIAが世界最多トランジスタ数のチップ「GK110」を公開
URLリンク(pc.watch.impress.co.jp)
715:デフォルトの名無しさん
12/05/17 15:21:47.32
警告レベルって、デフォルトは最大なんですよね?
Destroyに関しては、タイプミスです。
z2zは未実装っていうのが、よくわからないんですけど。。。。
716:デフォルトの名無しさん
12/05/17 17:10:10.69
GPGPU上でソケット通信とかって出来るかな
717:デフォルトの名無しさん
12/05/17 17:20:54.19
GPGPUの仮想マシン同士のn対n通信をシミュレートとかそういうのをイメージした
718:デフォルトの名無しさん
12/05/17 18:16:22.69
>>715
未実装: 実装されていないこと。
cufftのライブラリの中にz2zの関数そのものが存在していないのよ。
で、あんたがどんな環境で開発しているか判らんのに警告レベルがどうなっているかなんか判るかい。
そんなことは自分で調べなさいよ。
>>716
cuda5でLAN接続されているGPU同士で連携させる機能がつくらしいよ。
719:デフォルトの名無しさん
12/05/17 21:52:07.76
多次元配列を扱えないのは何でなんだろう.
ブロックとスレッドインデックスで一次元化するの面倒なんだけど.
720:デフォルトの名無しさん
12/05/17 23:46:21.89
ピンメモリを確保すると、スワップによる退避を防げるのは分かったのですが、
実際はスワップ以外にも、メモリフラグメンテーション解消のためのコンパクションでも
メモリアドレスの変化って起こり得ますよね?
それもないようにするのがピンメモリですよね?
721:デフォルトの名無しさん
12/05/18 01:25:35.91
>>719
別に扱えなくはないぞ。普通にdata[blockIdx.x][thiredIdx.x]ってできると思う。
スレッド数を定数にしなくちゃならなくなるから却って煩わしいと思うけど。
つーか、面倒ったってオフセット計算する関数を作るだけじゃん。