【GPGPU】くだすれCUDAスレ part7【NVIDIA】

【GPGPU】くだすれCUDAスレ part7【NVIDIA】at TECH

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 - 暇つぶし2ch660:デフォルトの名無しさん
16/02/21 12:58:04.21 YDVcjdw/.net
>>644
てめえはすぐに論破されると単発で煽りやがる
こういう奴だからこそこっちは不必要にNGだけでなく相手をしないといけないんだよ馬鹿野郎！
コテならコテだけで通せ！糞団子！
それから、NVがこれからGPGPUを捨てる根拠となるソースだ
実際にここで科学技術演算をされてらっしゃる皆さんもご覧になった方がいい↓
URLﾘﾝｸ(camera-pc.com)
結局これもCS機をAMDが独占したためなんだよな

661:,,・´∀｀・,,）っ-○○○
16/02/21 13:15:26.28 gnD1Eicx.net
ばか？

662:,,・´∀｀・,,）っ-○○○
16/02/21 13:28:33.48 gnD1Eicx.net
科学技術計算でAMDのGPUが上げた実績なんてないし
NVIDIAがHPCを重視する姿勢にも変わりはない
そもそもMaxwell世代に大型のスパコン案件が無かったから倍精度特化版を作ってないだけで

663:,,・´∀｀・,,）っ-○○○
16/02/21 14:11:49.09 gnD1Eicx.net
ちなみにその個人ブログの主は科学技術計算に対してあまりに無知でお話にならない
ただカタログスペックのFLOPS数値を上げてヨシとするものではないのだわ
大規模システムはノード間のデータ転送帯域がものすごい重要で
NVLinkもその一環
AMDはカタログスペックありきで中身が無いし
実際2017～18年の米国大型スパコン案件を何一つとして獲得できてない

664:デフォルトの名無しさん
16/02/21 14:17:28.22 YDVcjdw/.net
URLﾘﾝｸ(ascii.jp)
＞Keplerの世代では倍精度浮動小数点のサポートの有無がこれにあたったが、
＞Pascalはこの点ではMaxwellを継承しており、
＞倍精度浮動小数点の性能は非常に低いと思われるので、ここでの差別化は難しい。
Pascalはここのスレ住人にとっては大変残念な事になるだろうな
その理由は先述したとおり、AMD準拠のDirectX12が策定された事でゲーム用GPUでNVは必死になって
電力効率の優位で喰らいつこうとしているためで描画特化でDX12世代に必須になるGPGPUを弱体化させた
トレードオフがある
倍精度とNVの関係は残念ながら離婚前の別居状態のようなさめた状態

665:,,・´∀｀・,,）っ-○○○
16/02/21 14:23:54.76 gnD1Eicx.net
相変わらず知恵おくれだねえ
その記事を読んでもPascalの倍精度特化版が存在しないということは読み取れないがね
大型案件がつけばMaxwellの倍精度特化版も出す用意はあったくらいだし
少なくともPascalには客がついている

666:,,・´∀｀・,,）っ-○○○
16/02/21 14:35:55.03 gnD1Eicx.net
倍精度の性能はスパコンでは今後も重要だけど
足回りの性能に見合わないほどのカタログスペックが必要かと問われれば
「必要ない」のが現実なわけで。
足回りの強化もなしにただ倍精度ユニットだけ並べておけばFLOPS数が稼げる
LINPACKベンチの実用性に疑問符が付くご時世ですからね
URLﾘﾝｸ(news.mynavi.jp)

667:,,・´∀｀・,,）っ-○○○
16/02/21 14:50:22.3

668:5 ID:gnD1Eicx.net

669:デフォルトの名無しさん
16/02/21 15:18:31.73 igZD1LUA.net
病気の人は倍精度特化のcpu使うって宣言してんだから
関係のないcudaスレにあらしにくんなよ

670:,,・´∀｀・,,）っ-○○○
16/02/21 15:30:43.09 gnD1Eicx.net
Polarisは結局スパコンのデザインウィンを未だ1件たりとも取れてないんだよな
全てが無駄だったね

671:デフォルトの名無しさん
16/02/21 15:31:01.75 VEySITtF.net
野球ファンがどっちの贔屓チームの方が凄いか喧嘩してるようなアホらしさｗ

672:,,・´∀｀・,,）っ-○○○
16/02/21 15:40:19.39 gnD1Eicx.net
たとえるなら阪神ファンがオフシーズンに東京ドームに居座って六甲颪を大合唱するレベルの
あつかましさ

673:デフォルトの名無しさん
16/02/21 15:59:16.02 ksxAl9BA.net
>>646
勝手にくそ団子と同一視するな。
不愉快だ。

674:デフォルトの名無しさん
16/02/21 19:49:31.23 YDVcjdw/.net
>>658
お前も糞の自覚はあるんだな、糞団子

675:,,・´∀｀・,,）っ-○○○
16/02/21 20:00:48.09 gnD1Eicx.net
うんこくってる時にカレーの話はやめてください

676:デフォルトの名無しさん
16/02/21 20:37:09.44 zsQMik7a.net
小学生かよ…

677:デフォルトの名無しさん
16/02/21 21:06:17.70 igZD1LUA.net
米国のエクサスケールではcuda使わないんだけどね

678:デフォルトの名無しさん
16/02/21 22:12:15.14 gJEqj33V.net
URLﾘﾝｸ(www.livevolume.com)
このソフト動かしたいんだけど、nvidiaのカードが必要なんですか？
すいません、プログラムのプの字も知らない初心者です
pentium N3700でGPUがintel graphicなんですけど
やっぱりこの環境で動かすことはできないのでしょうか…
現状では「GLSL compile error」と出て描画ができません
もしスレ違いな質問だったら本当にごめんなさい

679:デフォルトの名無しさん
16/02/21 23:09:10.02 Qg7TSliE.net
>>663
Minimum system requirementsにNvidiaとあるし、
そして、実際に動かないとなるとnvidiaつけるしかないだろ

680:,,・´∀｀・,,）っ-○○○
16/02/22 02:03:02.55 XUbrDPNF.net
果たしてそのマシンにGPUなんてつけられるだろうか？
ノートならG-Tuneあたりのゲーミングノート買うのが一番手ごろじゃなかろうか
（メーカー製ノートでもGeForce搭載機はあんまり見かけない）

681:,,・´∀｀・,,）っ-○○○
16/02/23 17:44:18.03 U0HFk1NZ.net
スパコン案件の有無が倍精度版の有無を決めるというのは間違いないようで
NVIDIA Pascal based GP100 GPU to boast of 12TFLOPS SP & 4 TFLOPS DP performance
URLﾘﾝｸ(vr-zone.com)
とりあえずTesla購入予定の方は何も心配いらないということです
悔しがるのはTeslaが買えない貧乏研究者とAMD厨だけでいいですよ

682:デフォルトの名無しさん
16/02/23 18:53:40.49 NTXFP2zz.net
研究者しか倍精度を使わないと思ってるところが団子クオリティー

683:,,・´∀｀・,,）っ-○○○
16/02/23 19:57:44.93 U0HFk1NZ.net
↑ね、　この負け犬クオリティ

684:,,・´∀｀・,,）っ-○○○
16/02/23 19:59:57.59 U0HFk1NZ.net
GeForceは個人用のGPUであって倍精度で科学技術演算のためのものじゃないんですよ
倍精度の性能に正規の�

685:ﾎ価を払おうとしない悪質ユーザーの梯子を外されたからって何が問題なんですかねえ

686:,,・´∀｀・,,）っ-○○○
16/02/23 20:14:34.27 U0HFk1NZ.net
倍精度ユニットの実装コストはロハではないので
メインで使う単精度の演算性能向上や電力効率の改善に振ったほうが
大多数のユーザーのためなんですよ
実質TeslaをGeForceの価格で売れと言ってるような倍精度乞食の言葉に
耳を傾ける必要はないのﾃﾞｽ

687:デフォルトの名無しさん
16/02/23 21:11:07.44 NTXFP2zz.net
単精度布教はいいからCUDAについて書けよ

688:デフォルトの名無しさん
16/02/23 22:13:43.75 /ZAu7LIh.net
NGにしてるから何かいてあるか知らないけど、どうせ相手にする価値がないことは>>671
から読み取れるｗ
このスレは研究者もヲチしてるだろうから言っておくけど、もうNVは倍精度は捨てるね
Felmi時代とは大違い
DirectX12（ウィンドウズ10）になるとAMDだけがローレベルAPIの恩恵に与れることを知ってるから、
Maxwell世代で素早くGPGPU切りの変わり身を演じた
今後は半精度と単精度の混合GPUばかりでCUDAはどんどん腐ってくるｗ

689:デフォルトの名無しさん
16/02/23 22:47:19.86 oMRN0TkA.net
恥ずかしいやつだなこいつ

690:デフォルトの名無しさん
16/02/23 23:01:37.48 /ZAu7LIh.net
>>673
てめえをNGにして非難合戦のスレ汚しをしたくないのにノコノコ単発で出てくるな！
糞団子！

691:デフォルトの名無しさん
16/02/23 23:20:55.12 zq7ECeNv.net
>>672
なんかAMDが勝ち組でNVが負け組の様に書いてあるけど、実際は真逆だよ
AMDはゲーム機でなんとか持ちこたえてる状況で、NVはDL特需で歴史的な好況
GPGPUはCUDAがデファクトになりつつあるからAMDはほぼ詰んでる
まぁ、先の事は判らないけどね。

692:デフォルトの名無しさん
16/02/23 23:23:55.28 oMRN0TkA.net
>>674
お前みたいな負け犬ｱﾑ厨が自作PC板から出てこなきゃ平和なんだけど

693:デフォルトの名無しさん
16/02/24 12:20:01.56 Ad4bERAY.net
>>675 >>675
まだ単発自演で俺をやり込めようってか？糞団子！
NVはもはや半精度でしか生き残りが出来ないんだよ！
このスレは倍精度の行方が一番大事なんだからてめえがいることが一番スレを汚すんだ馬鹿野郎！

694:デフォルトの名無しさん
16/02/24 12:31:29.64 dk01eTkb.net
倍精度の行方なら団子がソース付きで書いたけどね
結局NVIDIAがHPCから撤退なんてのは出鱈目な言いがかりと

695:デフォルトの名無しさん
16/02/24 12:47:40.23 dk01eTkb.net
ほれ
NVIDIA Pascal based GP100 GPU to boast of 12TFLOPS SP & 4 TFLOPS DP performance
URLﾘﾝｸ(vr-zone.com)
そらあんだけのシェアとエンプラ向けの大躍進あればコンシューマ向けとHPC向けで
それぞれに合わせた演算ユニット構成のカスタマイズ費用くらい捻出できるだろう
そしてここはAMDについて語るスレでもNVIDIAをネガキャンするスレでもない
誰が場所をわきまえていないのか自覚したら？

696:デフォルトの名無しさん
16/02/24 12:47:59.45 jB1Q2gHg.net
>>677
おいおい糞団子と一緒にするなよ
ここはCUDAスレだぞ
倍精度の行方とかどうでもよろしい
お前自分が糞団子レベルになってる事に気付けよ

697:デフォルトの名無しさん
16/02/24 12:58:31.02 jXa1RnbL.net
浮動小数点数の精度なんて
コード組む側からすればどれも一緒だよ
倍精度だと収束するが
単精度だと発散するとか
それ単にコードの質が悪いだけだしね
何がそんなに気になるのかわからん

698:デフォルトの名無しさん
16/02/24 13:10:46.14 kxdU4ZHF.net
>>681
えっ？？？

699:デフォルトの名無しさん
16/02/24 13:17:56.21 dk01eTkb.net
FireProがHPC向けでまったといっていいほど使われないのは
分岐粒度が荒過ぎて実効でスペックの半分も出ないとか
特定用途向けの商用ライブラリが用意されてないのか
それ以前の問題としてランタイムが頻繁にクラッシュするとか
結局のところトー�

700:^ルの問題なんだよね単精度特化の一般のGPUで多倍精度使う場合は遅い倍精度を使うより単精度DFTのほうがはるかに速い

701:デフォルトの名無しさん
16/02/24 14:12:53.97 s8sb75Sy.net
中小企業や個人開発のプログラムにもCUDA開発の無償支援してくれる
そういう実績があるからCUDAが鉄板になってるわけで
そういうことをやったためしもなければ大赤字でやれる予算も割けないAMDに
期待できることは何一つとしてない、これが現実
うちの商品はほぼ整数しか使わないだから倍精度実数が速いかどうかなんて
微塵も関係ない

702:デフォルトの名無しさん
16/02/24 14:34:29.38 Ad4bERAY.net
糞団子はコテ使ってると相手してくれないから寂しくて単発コテはずし作戦に出たのか？
NVはどう考えても半精度中心のグラフィックス/深層学習中心に経営資源をシフトしてるんだがｗ

URLﾘﾝｸ(ascii.jp)
＞Pascalはこの点ではMaxwellを継承しており、倍精度浮動小数点の性能は非常に低いと思われるので
＞Pascalはこの点ではMaxwellを継承しており、倍精度浮動小数点の性能は非常に低いと思われるので
↑
大事な事だから二度言うぞ
＞つまりPK100は半精度浮動小数点をサポートするが、PK104はこれをサポートしない(あるいは回路を持たない)可能性がある。
↑
プロセスルール次第だが半精度に重心を置いていることは明白だな

703:デフォルトの名無しさん
16/02/24 14:41:47.70 Ad4bERAY.net
half2floatをPascalでは強化していくから、結局AMD対NVの戦いは「half2float」の描画特化対
「Async」の戦いになっていくんだろうね

704:デフォルトの名無しさん
16/02/24 14:51:49.40 NAMaIKUn.net
今後この馬鹿に一切かまうな
かまうから喜んで荒らし続ける

705:デフォルトの名無しさん
16/02/24 15:33:36.04 jXa1RnbL.net
どっかのニュースのコピペばかりで
うんざりするよ
自分の引き出しは空だと言っているようなものだ

706:デフォルトの名無しさん
16/02/24 17:46:05.30 l0DrHc2T.net
>>686
AMDなんか興味ない
お前は糞団子と同レベルの荒らしだ
失せろ

707:デフォルトの名無しさん
16/02/24 17:50:58.28 jXa1RnbL.net
一般利用でCUDAが何に使えるのか
ネタ出せよ
ゲームで使えんの？

708:デフォルトの名無しさん
16/02/24 17:55:56.67 Ad4bERAY.net
>>689
お前はAMDに一番興味あるだろうが糞団子！
お前が去ればこのスレは一気にクリーンになるんだよボケ
お前が一番危機感抱いてるのは倍精度をなくす方向のNVに対して非難が集中する事だけだ
だからこそお前が一番イラネーんだよ屑

709:デフォルトの名無しさん
16/02/24 18:44:53.08 l0DrHc2T.net
>>691
お前病院行けよw

710:デフォルトの名無しさん
16/02/24 18:55:34.70 Ad4bERAY.net
>>692
糞団子よヒヨッたなｗ

711:デフォルトの名無しさん
16/02/24 21:04:29.34 Nmttufaz.net
>>693
お前はいったい何と戦ってるんだ？
日和ったの意味も違うしな
ここのみんなはAMDにもNVにも思い入れはないから
迷惑だから糞団子と一緒に消えてくれ

712:デフォルトの名無しさん
16/02/24 22:15:50.14 teBWCRhn.net
団子よりヤバイ真性のキチガイが団子以外も団子に見えているらしい。

713:デフォルトの名無しさん
16/02/24 22:27:56.59 zahm20jW.net
団子消えろ

714:デフォルトの名無しさん
16/02/24 22:37:00.33 l5BeTFuC.net
>>695
ほんと真性基地だよな。日中でも必死カキコっていうのもな
この人、プログラムに関する話がでないことからして、プログラムやったことないんだろうな

715:デフォルトの名無しさん
16/02/24 22:56:49.71 teBWCRhn.net
>>683
分岐粒度が荒すぎってCPUとの比較なら未だしも、NVIDIAとの比較だったら普通そんなに差は出ないぞ。
差が出るのは64のうち前半もしくは後半の32がほぼ埋まっているのに、反対の32が完全に空みたいな状況が頻発する場合だけ。
まあCUDAからのベタ移植ならあり得ないこともないのだろうが。

716:デフォルトの名無しさん
16/02/25 08:17:21.70 qdgy2oNb.net
プログラムの話しようぜ
そうすれば団子その他プログラム書けない人が消えるだろうから

717:デフォルトの名無しさん
16/02/25 08:22:03.55 qdgy2oNb.net
>>698
まあそうだな
今のnVidia32、AMD64の設定は回路効率と性能効率を考えて美味しいところなんだろうか？
ただの惰性？

718:デフォルトの名無しさん
16/02/25 08:23:54.24 YDhqTq2/.net
将来的に4にするっていこうだが
実行レベルでは
warpは32のままだろうけど

719:デフォルトの名無しさん
16/02/25 13:05:41.93 FCdE8jm8.net
>>692-695 >>697
糞団子は黙ってろ！
文句があるならコテ付けろやコラ！
テメエが鬱陶しいんじゃ、ボケ！
>>698
それも糞団子の自演だよ
NVIDIAの優位性は3dfxを買収した事で得られたソフトノウハウだな
自作板でもそうだけど、よくよく考えるとおかしな文面でごまかすのが団子
たいてい論破されるとどうでもいい専門用語を並べてイカスミ作戦に出る

720:デフォルトの名無しさん
16/02/25 14:04:40.68 Sn2492Ux.net
>>702
まずお前がコテつけてくれ

721:デフォルトの名無しさん
16/02/25 14:47:28.30 Ey2CZbRS.net
不用意に3dfxとか使うと歳がばれるぞ

722:デフォルトの名無しさん
16/02/25 17:48:12.65 8lu6Pire.net
>>702
あの程度の文面を理解できないほど技術に疎いのだな。
そもそも団子認定連呼廚のスタンスがよくわからん。

723:デフォルトの名無しさん
16/02/25 18:22:40.32 Ey2CZbRS.net
好きなんだろ
恋だよ恋

724:デフォルトの名無しさん
16/02/25 19:23:25.50 JdxelD2D.net
糞団子もイカスミも同レベル

725:デフォルトの名無しさん
16/02/25 19:39:25.49 tc7lGvfi.net
団子が消えれば平和になる

726:デフォルトの名無しさん
16/02/25 19:52:29.05 JdxelD2D.net
団子既に消えてるじゃん？
イカスミが煽るから戻って来るんだよ

727:デフォルトの名無しさん
16/02/25 20:58:58.26 qdgy2oNb.net
誰だよイカスミって

728:デフォルトの名無しさん
16/02/25 23:01:45.88 OUVaT1r5.net
nvidia ってC++AMPって力いれてるの？
CUDAが主力なのはわかるんだが。
OpenMPのようにC++AMPがいいところまでいってからtoolkitにマージするつもりなのか
それともC++AMPが自然消滅するのを待っているのかわからん。

729:デフォルトの名無しさん
16/02/25 23:56:26.32 y8R9vLq2.net
>>710
>>702=イカスミ

730:,,・´∀｀・,,）っ-○○○
16/02/25 23:58:06.25 VFYZCeUD.net
C++ AMPは事実上終了したよ
MSはいまNVIDIA ThrustをベースにしたParrarel STLに注力中

731:,,・´∀｀・,,）っ-○○○
16/02/26 00:00:42.44 au4AtN7W.net
Pallarel STLね

732:デフォルトの名無しさん
16/02/26 00:04:42.12 sfGjrhZB.net
>>705
NVはC++AMPとか言うより倍精度をボリュームゾーンから外しにかかってるな
Pascalには全く期待できんよ
IBMの場合は大口契約だから安く調達するだろうけど、それだけ
いずれGPGPU用（テスラ）は値段を上げざるを得ないだろうなあ

733:デフォルトの名無しさん
16/02/26 00:18:06.49 XrDeqd+8.net
それなら死んでないでしょう。
スラストがCUDA用のライブラリと同様に
C++AMPで使うためのものだろうから。

734:,,・´∀｀・,,）っ-○○○
16/02/26 00:46:50.10 au4AtN7W.net
Pallarel STLのバックエンドはC++AMPに限らずOpenACCやOpenMP(4.0), TBBでもいい
NVIDIAが推してるのはOpenACC, IntelはOpenMP

735:デフォルトの名無しさん
16/02/26 00:49:09.70 jDU7chRF.net
>>704
俺3dfxを知らないからググッタよ。イカスミ、かなりの歳なひとなんだな
C++AMPを使っている奴どれぐらいいるんだ？

736:デフォルトの名無しさん
16/02/26 01:09:31.01 puLBdTvq.net
>>714
ミス指摘してさらにひどくミスすんなって

737:,,・´∀｀・,,）っ-○○○
16/02/26 01:13:08.03 au4AtN7W.net
parallelサーセンｗｗｗｗｗ

738:デフォルトの名無しさん
16/02/26 01:36:18.43 1N9hBdg9.net
>>715
最初の頃のテスラは円高もあり、20万位だったが、いまじゃ80万くらいになってもうた。まあA30とかは120万くらいしたんだけど。

739:デフォルトの名無しさん
16/02/26 01:38:37.56 XrDeqd+8.net
>>717
そうだOpenACCだ。勘違いしてたよ。
C++AMPではなかった。
MSだけだとC++AMPはきびしいだろうね。
まだOpenACCのほうがめはあると思う

740:デフォルトの名無しさん
16/02/26 01:42:47.55 XrDeqd+8.net
>>721
その頃とくらべると開発環境がかくだんに良くなってる。
HWのコストだけでなく、そういうの含んでの価格だろうね。

741:デフォルトの名無しさん
16/02/26 03:40:06.50 VdCPJ0Vc.net
>>702
後半はまったくその通りだな団子
どこかで調べた用語を使うが、意味を良く分からずに使うからおかしな日本語になる

742:デフォルトの名無しさん
16/02/26 05:22:49.16 YzxqLjh+.net
nvはpgi買収してopenaccのコンパイラも力入れてるよ
doeのエクサスケールで使うのもcudaじゃなくてopenaccだし

743:デフォルトの名無しさん
16/02/26 05:38:13.56 mUz9Cfpw.net
「,,・´∀｀・,,）っ-○○○」って鳥屋氏でしょ。
悪いけどここに同じレベルの人はいないんじゃない。

744:デフォルトの名無しさん
16/02/26 07:10:07.81 VdCPJ0Vc.net
何のレベル？

745:デフォルトの名無しさん
16/02/26 08:03:13.43 lqbLzerX.net
イカスミが同レベル
どっちも要らない

746:デフォルトの名無しさん
16/02/26 08:04:45.81 VdCPJ0Vc.net
鳥屋氏ってだ～れ？

747:デフォルトの名無しさん
16/02/26 11:35:24.33 J+QrFB1k.net
NVの工作員
GPGPUはVLIW時代のATIGPUを持ち出してネガキャン

748:デフォルトの名無しさん
16/02/27 13:53:00.79 VbYYT6/A.net
鳥屋でググるとこれが出てきた
ｽﾚﾘﾝｸ(software板)

749:,,・´∀｀・,,）っ-○○○
16/02/27 19:58:40.83 WSIY1iVq.net
俺がいてもいなくてもCUDAプログラミングの話ができない無能集団のスレ

750:デフォルトの名無しさん
16/02/27 20:22:31.94 VXpwyn8O.net
囲碁ソフトにディープラーニングが使われ始めてるんだが、
ＣＵＤＡ対応ソフトもそろそろ来るかもしれん。
一般人にも身近な技術になるかもね。

751:,,・´∀｀・,,）っ-○○○
16/02/27 20:27:20.16 WSIY1iVq.net
そのうち教えられたことだけしかコーディングできないクソPGもAIにとって代わられるんだろうな

752:デフォルトの名無しさん
16/02/27 22:07:54.84 unQVppL1.net
なるほど糞団子が嫌われるわけだ

753:デフォルトの名無しさん
16/02/27 22:34:12.86 VbYYT6/A.net
鳥屋ってただのサンデープログラマーだからな
知ったか決めてりゃ嫌われる

754:デフォルトの名無しさん
16/02/27 23:58:13.35 Fq+Tn6zB.net
>>736
鳥屋氏の書いたコード見たことないでしょｗ
申し訳ないけど、ここにいる人たちとは次元が違うよ。
頭が良すぎて理解されないタイプ。

755:デフォルトの名無しさん
16/02/28 00:21:01.28 4gv2LXai.net
>>731
,,・´∀｀・,,）っ-○◎●
と持っている団子が違うが同じ人なのか？　

756:,,・´∀｀・,,）っ-○○○
16/02/28 00:32:14.81 5Pz55yFT.net
君はその名前欄に●入れてそのまま表示されるか試したことがあるかい？

757:,,・´∀｀・,,）っ-○◎○
16/02/28 00:34:20.80 lm9zk8qN.net
テスト

758:デフォルトの名無しさん
16/02/28 00:34:46.41 lm9zk8qN.net
むう、表示されんのう

759:デフォルトの名無しさん
16/02/28 00:53:04.73 4gv2LXai.net
別人なのか？
,,・´∀｀・,,）っ-○◎●
が持っているのは焼き鳥
で
,,・´∀｀・,,）っ-○○○
が持っているのは団子
ということか

760:デフォルトの名無しさん
16/02/28 00:58:05.10 9kjNwUs3.net
鳥屋氏が両方つかってるの見たことあるから本人なんじゃない?

761:デフォルトの名無しさん
16/02/28 01:03:49.87 4gv2LXai.net
なら、次は,,・´∀｀・,,）っ-○◎● で書き込んでくれるな

762:デフォルトの名無しさん
16/02/28 01:06:06.88 9kjNwUs3.net
っていうか●が名前欄に使えなくなった経緯も知らないんじゃ、鳥屋氏のことを知らなくても無理は無いね。

763:デフォルトの名無しさん
16/02/28 01:17:52.65 4gv2LXai.net
>>745
俺もだが団子と言っている奴は鳥屋時代のこと知らないだろ
>>737の言うような奴ならすごいCUDAコード披露して欲しいが
でも、雑談に必死なコテの荒らしって感じだからな。
とりあえず、鳥屋時代のコードどっかにないのか?　見てみたい気がする

764:デフォルトの名無しさん
16/02/28 01:18:45.52 TGNAvpkz.net
糞団子がどんなコード書く

765:か知らんけど、弾道計算の件でシドロモドロになった事実は消えんぞ所詮その程度の知的レベル

766:デフォルトの名無しさん
16/02/28 01:43:25.37 9IJglbed.net
>>725
速度自体は生でcudaやったほうが速いらしいから
これは開発効率を優先してPGIなのかね？
あるいは現時点ではいまいちでも今後の成長を鑑みてとかさ
さすがにdod,doeでも世代ごとのコード書き換えは負担なんだろうか

767:デフォルトの名無しさん
16/02/28 01:50:50.47 9IJglbed.net
キャッシュの増量やシャッフルIA、HyperQ,DP等を全部こみこみで考えると
１コアあたりの実効性能（flaot）はfermi, keplar, maxwellと上がってると考えていいのかね？
flops/core/clockではなくてflops/coreという意味で、かつ理論値での比較ではなくていかに実測値がでるかという意味で。

768:,,・´∀｀・,,）っ-○○○
16/02/28 02:02:26.76 5Pz55yFT.net
俺は中村氏じゃねーから

769:,,・´∀｀・,,）っ-○○○
16/02/28 02:05:54.35 5Pz55yFT.net
2009年当時なら団子はやっぱり団子だったぜ？
URLﾘﾝｸ(www.openwall.com)

当時書いてたのも別に変態的でもない普通のCコードですけどね
URLﾘﾝｸ(download.openwall.net)

770:デフォルトの名無しさん
16/02/28 03:07:32.07 9kjNwUs3.net
>>750
あれ、中村氏もそのAAつかってなかったっけ?
とにかく鳥屋氏(=中村氏)はプログラミングの技術も問題に対するアプローチの仕方も異次元の存在だったな。

771:デフォルトの名無しさん
16/02/28 09:32:39.66 kqHim0z9.net
やっぱり団子って複数人いるよね？
すごく詳しい話をするとおもったら、なんか急に低レベルだったり、
てにをはが変わったりする。

772:デフォルトの名無しさん
16/02/28 09:40:16.99 uncqUlBQ.net
たまに二人の団子が会話することもあるぞ

773:,,・´∀｀・,,）っ-○○○
16/02/28 11:21:05.00 5Pz55yFT.net
> あれ、中村氏もそのAAつかってなかったっけ?
なにそれ見たことない

774:デフォルトの名無しさん
16/02/28 11:43:53.32 F3rkrfCl.net
結局鳥屋が馬鹿団子の振りしてるだけかもだが、詐欺の天才は結局馬鹿より有害
NVのやる事は何でもマンセーではスレ汚しとしか言いようがない
CS機をAMDが独占したからNVは倍精度に手を出せなくなった、と言うといつも発狂
これでは冷静な議論が出来ない

775:デフォルトの名無しさん
16/02/28 11:46:36.13 1t5d585j.net
おまえはcuda関係ないんだからくるなよ
かまってちゃん

776:,,・´∀｀・,,）っ-○○○
16/02/28 11:51:31.77 5Pz55yFT.net
そっち界隈しばらくチェックしてなかったけど海外のﾊｶｰ面白いことやってるね。
ちょうどCUDAに特化した話題だ。
MaxwellのLOP3.LUT命令を使ったビット演算の高速化テクニックについて興味ある人は
一度この講演ビデオ観ておくといいと思う。
URLﾘﾝｸ(www.irongeek.com)
実際問題AVX-512のvpternlogもLOP3.LUTと引数互換なんだわ
ぶっちゃけソース置換するだけで移植可能

777:デフォルトの名無しさん
16/02/28 12:03:43.36 F3rkrfCl.net
>>757
鳥屋＝糞団子！テメエこそCUDAの何が分かるんだボケ！

778:デフォルトの名無しさん
16/02/28 12:06:45.18 1t5d585j.net
ハイハイお薬の時間でちゅよ

779:デフォルトの名無しさん
16/02/28 12:18:13.04 F3rkrfCl.net
単発のお時間がきまちゅたね～
鳥屋＝糞団子が自作板からこっちのスレの巡回時間が来たみたいｗ
本当に鳥屋が使える天才なら２ちゃん談義なんかしねえな
１０�

780:N前ならゲーム業界か、少し前なら京に関わるか或いはアメリカでイラン向けバックドアを仕掛けるお仕事か… どっちにしろヒマを持て余すようではお里は知れてる

781:デフォルトの名無しさん
16/02/28 12:24:17.80 1t5d585j.net
ハイハイお部屋に戻りましょうねぇ

782:,,・´∀｀・,,）っ-○○○
16/02/28 12:37:00.70 5Pz55yFT.net
URLﾘﾝｸ(community.amd.com)
AMDのGPUにはLOP3.LUT相当の命令がないことにユーザーからも不満が噴出しているようです

783:デフォルトの名無しさん
16/02/28 12:44:20.68 F3rkrfCl.net
単発でも見事につられまちゅね～wwwww
団子＝鳥屋ちゃんピンチでちゅね～wwwwww

784:デフォルトの名無しさん
16/02/28 12:51:25.16 1t5d585j.net
ハイハイご飯時間ですよおじぃちゃん

785:デフォルトの名無しさん
16/02/29 16:54:00.73 XMRi5hV6.net
なんだかすごく質問しにくい流れなんですがいいですか？
バイトニックソートのプログラムを作ってみまして、
要素数512を境にGPUの方が速くなったのは良かったんですが、
要素数8192くらいからGPUの時間増加の傾きがCPUより悪化してしまって、
1048576ともなるとほとんど大差ないくらいになってしまいました。
これが普通なのか、おかしいのか、
おかしいなら原因として何がありそうか教えてほしいです。
一応可能なところはshared memory使ってますが、要素数256以降は
比較の組がとびとびになるはずなのでglobal memoryを直接読んでます。
以下、ソートを10000回繰り返した際の1回あたりの所要時間です。
要素数 CPU[s] GPU[s] CPU/GPU
2 0.00000 0.00004 0.004
4 0.00000 0.00005 0.008
8 0.00000 0.00005 0.011
16 0.00000 0.00006 0.020
32 0.00000 0.00007 0.036
64 0.00001 0.00008 0.099
128 0.00002 0.00009 0.229
256 0.00005 0.00010 0.522
512 0.00013 0.00013 1.027
1024 0.00031 0.00016 1.909
2048 0.00076 0.00025 2.975
4096 0.00179 0.00036 4.919
8192 0.00423 0.00068 6.248
16384 0.00933 0.00202 4.627
32768 0.02142 0.00637 3.363
65536 0.04903 0.01776 2.761
131072 0.10829 0.05003 2.165
262144 0.24928 0.13078 1.906
524288 0.54765 0.32437 1.688
1048576 1.22586 0.77101 1.590

786:デフォルトの名無しさん
16/02/29 17:56:37.64 +ARXUC0S.net
鳥屋、答えてやれよ

787:,,・´∀｀・,,）っ-○○○
16/02/29 23:54:40.69 72g2TQWh.net
>>767
バードショップ氏と話しがしたいなら @chapuni に凸ってきたら？

788:,,・´∀｀・,,）っ-○○○
16/03/01 00:01:36.14 9XwMWslZ.net
バイトニックソートはキャッシュメモリで収まる範囲内の小さなデータ集合に対して有効
サイズが大きくなるとGPUのローカルメモリから外れて大幅にパフォーマンスが落ちる
CPUのほうが低レイテンシ・大容量のキャッシュ積んでる分だけ有利になるわけだ
CPUのキャッシュに収まらない量になれば再びGPUのほうが上回るはずだ
まあそのレベルに達する段階でO(n log n)のソートの検討の余地があるが

789:デフォルトの名無しさん
16/03/01 00:02:13.26 epSXE3Ge.net
>>766
Nvidiaならおかしいことはよくある。気にするな
GPGPUでおかしいことをさけたいなら倍精度の自慢のAMDを使う

790:デフォルトの名無しさん
16/03/01 00:33:31.30 k65RqU8V.net
質問者がシェアードメモリって言ってるのにキャッシュとかいい加減なこと言ってる
シェアードメモリに言及しないなんてあり得ない
そもそもCUDA使ったことないんだろうな
やっぱ糞団子は低レベルだな

791:,,・´∀｀・,,）っ-○○○
16/03/01 00:41:11.27 9XwMWslZ.net
いったい何年前の話をしてるんだ
Fermiから階層型キャッシュ導入してるが
URLﾘﾝｸ(www.gdep.jp)

792:,,・´∀｀・,,）っ-○○○
16/03/01 00:46:09.76 9XwMWslZ.net
GPUについてはどっちにも解せる「ローカルメモリ」と言い換えてる
ちゃんと読めない子は呼吸を止めて1秒あなた新鮮だけど煮魚

793:デフォルトの名無しさん
16/03/01 12:21:21.56 /z3eDKB8.net
>>771
結局団子を買いかぶってた奴は団子自身だろwwwwwwwwww
糞っぷりを言い触らされたくないﾁﾝｹなプライドが虚勢を張りたくなる理由なんだろう

794:デフォルトの名無しさん
16/03/01 12:24:00.41 CYOvNsDD.net
ケンタッキーフライドチキンがどうしたって

795:,,・´∀｀・,,）っ-○○○
16/03/01 12:31:48.31 iam2QPf0.net
GMにマッピングされたメモリは一定の局所性があればキャッシュにマッピングされる
常識が通じないバカが勝手に自爆してるな

796:754
16/03/01 15:10:24.97 oQoWs5hY.net
>>769
キャッシュメモリ……
すいません、当方キャッシュについては不勉強でして、よくわかってません。
多分L1とかL2とか書いてあるやつだと思うのですが、手元の参考書が古い(6年前)もので……。
DeviceQueryだとL2 Cache Size: 524288 bytes って出るのでこれでしょうか。
Total amount of shared memory per block: 49152 bytes とか
Total number of registers available per block: 65536 とかもあります。
英語版Wikiの平均計算時間O(log(n)^2)parallel timeもよくわかってなかったりします。
log(n^2)なのか(log n)^2なのかよくわからんとです。
>>770
倍精度だと性能がうんたらとややこしかったので、単精度整数のソートなんです。
正確には同サイズの単精度整数配列2つを作り、
片方を基準にソートして、もう片方を一緒に並び替えてます。
構造体にしてもいいんですが、一緒に並び替えたほうだけが後々必要なデータでして。
最終的にはソートした結果を使って色々処理するためのプログラムなんですが、
現状だとこのソートで全体の8割くらい時間食っちゃってるんですよね。
ソートしなかったらもっと遅い(というかO(n^2)になる)ので無意味ってわけでもないんですが。

忘れてましたがGeForce GTX 760を使ってます。
以前機会があったので、別のGPU(GTX570だった気がする)でほぼ同じ計算させてみたこともあるんですが、
そっちだともっとマシでした。CPUより確実に速い、と胸を張って言えるくらい。
スペックの違いを加味しても、うちのGPUだけ下手したらCPUより遅いってのも変だなあ、と。

797:デフォルトの名無しさん
16/03/01 15:16:26.28 oDNKlTv2.net
たぶんfermi世代とkepler世代でのL1Dの扱われ方の違いとか？

URLﾘﾝｸ(news.mynavi.jp)

798:デフォルトの名無しさん
16/03/01 20:11:04.94 /z3eDKB8.net
要約すると団子の答えは答えになってない

799:754
16/03/01 21:01:21.25 oQoWs5hY.net
>>778
参照先読みました。キャッシュの話だったので自信はありませんが、
Fermi(GX570)世代のキャッシュは容量超えると(多分)通信の速いL1D等に退避されてたけど、
Kepler(GTX760)世代だと通信の遅いglobalに退避されるようになった、ってことですか？
さすがにアーキテクチャの仕様だと自分のスキルじゃ対応できません……。
>>779
答えになってないというか、私の知らない範囲の回答だったんでよくわからなかった感じです。
言ってることは766さんの参照先と多分同じなんだと思います。自信はありませんけど。
で、みなさん改善する方法はないでしょうか……。
大

800:規模計算にウンタラ使うとカンタラがヤバいから避ける、みたいなことありませんか？オプションにホニャララって追加すれば設定が変わる、とか(実はオプションもよくわかってない)。大規模の時、キャッシュ代わりにあえてsharedを定義しても意味ないのかな…普通はないよな…

801:デフォルトの名無しさん
16/03/01 22:50:15.99 1eMSB1ZO.net
また団子が知ったかぶりをかましたのか！（呆れ）

802:,,・´∀｀・,,）っ-○○○
16/03/01 22:57:33.44 xcdR7XnG.net
そもそもキャッシュはシェアードメモリの退避先ではなくグローバルメモリの一部の読み書きを高速化するためのもの
シェアードメモリに収まらないデータのソートで遅くなる問題なのでシェアードメモリは全く関係ない

アホが自爆すんなよ

803:,,・´∀｀・,,）っ-○○○
16/03/01 23:00:19.76 xcdR7XnG.net
データ全体がキャッシュに収まらない場合はキャッシュローカリティを意識した演算順序の最適化をする
これはCPUでもGPUでも理屈は変わらない

804:,,・´∀｀・,,）っ-○○○
16/03/02 00:01:12.12 Lh/popYV.net
自分の答えを示さず謂れのないイチャモン付けに必死になる奴ほど
スレにとって邪魔な存在はないね

805:デフォルトの名無しさん
16/03/02 01:05:18.36 WNl5zi/w.net
団子はレスをまとめることを覚えて

806:754
16/03/02 01:23:35.90 n1GLxV/f.net
>>782-783
キャッシュローカリティって何さ…となったので、Google先生に勧められた
wikiの『参照の局所性』を読んで、ちょっとわかった気がします。
自分が作ったバイトニックソートは大規模データの場合、
各threadがほとんど毎回前回と異なる&近傍でもないメモリ参照することになるので
時間的にも空間的にも最適化ができてないみたいです。
ない知恵絞ってif文減らして実質1つにした結果がこれだよ！
あ、いや、thread単位はそうでも、warpとかblock単位で見れば近傍データなのか…？これはバンクの話か…？
実装のややこしさを飲み込めばシェアソートの方が参照の局所性は大きくしやすいのかな…？

まだよくわかってないことが1つありまして、
プログラム上では何万何十万の計算を並列に扱ったとしても、
物理的にはハード側の制限があるわけじゃないですか。
GTX760ならCUDAコア1152基なわけで、一万を並列化しても
実際には同時じゃなくて9回くらいに分けて順に処理する、みたいな。
となると、その9回で各CUDAコアは別のメモリを参照するわけなんですが、
この時前回のキャッシュって残るんでしょうか？　残らない…ですよね？
それともカーネルとしての処理が終わるまでは残るんでしょうか？
はたまたプログラムが終わるまでは念のため残しておく、とか？
キャッシュの利用自体が悪いんじゃなくて、
キャッシュにも収まらないデータ量がよくないってのはわかってるんですが、
なんかこのあたりの理解がまだ曖昧なんです。

807:754
16/03/02 01:46:45.38 n1GLxV/f.net
だらだら長文書いたわりに今自分の気になることからは逆に離れた気がする。
手っ取り早く要約すると、CPU↔メモリ(キャッシュ)の速度は
CUDAコア↔各種メモリの速度のどの当たりに相当するのか、でしょうか？
GPU内ならレジスタ＞shared(キャッシュ)＞globalの順で速いとかは聞きますけど、
もう一歩踏み込んで『この不等号の列に割り込ませるなら』CPUの速度はこのあたり、という指標が見つからないんですよね。
もちろん機種によって千差万別だとは思いますが、
傾向としてはこのくらいかなあ、みたいな話でもいいので教えていただけたら幸いです。
あ、もちろん>>786の質問も答えていただけると助かります。
キャッシュがよくわかってないのも確かなので。

808:,,・´∀｀・,,）っ-○○○
16/03/02 01:48:15.90 Lh/popYV.net
後続の処理が走ってもデータが保持されるかどうか？
これについては実装依存としかいいようがない
なにせGPUはCPUと比べてもキャッシュの容量は小さいので
いつまでも今処理してないデータを保持し続ける理由も乏しい。

処理順序の並べ替えが可能なら、データアクセスの局所性に合わせて並べ替えることをお勧めする。

809:デフォルトの名無しさん
16/03/02 15:13:17.26 XnY+JUNw.net
この会話を分かりやすく噛み砕くとこういう感じか

754
GPUの並列化の最適化を教えてください

団子
シェアードメモリーガー

754
あの…ですからデータの並列化を…

団子
データアクセスの局所性ガー

754
・・・・（その並び替えが分からないんだけどなー）・・・・まあいいです

810:デフォルトの名無しさん
16/03/02 16:29:21.57 epqhA4MI.net
おきゅんぱしー

811:754
16/03/02 17:56:48.93 n1GLxV/f.net
あっ

812:デフォルトの名無しさん
16/03/02 18:46:16.76 nVGVVFPp.net
>>787
うーん、速さといってもデータ転送なのかレイテンシなのかで答えようが無いね。
レイテンシに関してはコアに近いところだとCPUの方がクロックが高いから圧倒的にCPUだね。

813:デフォルトの名無しさん
16/03/02 19:06:15.16 2uJZVygs.net
>>773
いやいや、CUDAユーザーならローカルメモリなんて言い方はしない
そもそもローカルではないし
SRAMはキャッシュとシェアードだけ
ボロ出しまくり糞団子

814:デフォルトの名無しさん
16/03/02 20:08:27.14 n1GLxV/f.net
>>788
なるほど。基本的に残ってないと考えた方がよさそうですね。
バイトニックソートは綺麗に並列化できちゃうので、並び替えは無理っぽいです。
>>790
Occupancy確認しました。ビンゴでした。4%とかなにそれクソ使えてない。
というか、よくよく確認したらsharedもまだまだ余裕があったので、
要素数256でsharedの利用を切り替えていたのを2048まで拡張しました。
8192越えたあたりで悪化し始める、という性質こそ変わりませんでしたが
sharedの恩恵を受けられる範囲が増えたおかげか悪化しつつも
約100万要素でもCPUより7倍強速くすることができました。これでOccupancyは50%。
100%にするにはsharedのサイズの設定を変えなきゃならないけどやり方わかんない…。
しかし、こんなアホみたいな理由で遅くなっていたなんて。
みなさまにはご迷惑おかけしました……。
>>792
やっぱりCPUですか。GPUの性能をフルに発揮させるには
それなりに大きい規模を並列化して誤魔化さないといけないわけですね。

815:754
16/03/02 20:12:34.57 n1GLxV/f.net
名前入れ忘れたりsage忘れたりしてますが>>794は754です。
IDで察してくださいすみません。

816:デフォルトの名無しさん
16/03/02 20:36:32.21 XnY+JUNw.net
迷アドヴァイスを見るに見兼ねたスレ住民のおかげで助かりましたとさめでたしめでたし

817:デフォルトの名無しさん
16/03/02 21:24:19.27 ewxUegIs.net
>>794
シェアードをローカルとか言う奴の事は聞かないように
GPUはシェアードメモリを使ってなんぼだから

818:デフォルトの名無しさん
16/03/02 21:47:03.61 mhOGU3Or.net
っていうかgpgpuでソートが
そもそも間違ってるよなあ

819:,,・´∀｀・,,）っ-○○○
16/03/02 23:53:33.06 Vx/0gvlz.net
てかFermi以降のSMはキャッシュを構成するSRAMの一部を
GMとは独立した空間のスクラッチパッドメモリとして割り当ててるだけなんだけどね
SMXが実質的なコアとみなすならシェアードメモリって別にシェアードでもなんでもないぞ

820:デフォルトの名無しさん
16/03/03 00:02:42.09 L7+NtMAj.net
ますます支離滅裂だな
シェアードメモリがシェアードじゃないとかCUDAの概念を全否定する発言じゃねぇか
つまりお前はCUDAの事なんか全く判ってない
ここはCUDAのスレだぞ
そろそろ出て行けや糞団子

821:,,・´∀｀・,,）っ-○○○
16/03/03 00:24:01

822:.33 ID:HcahvuJO.net

823:デフォルトの名無しさん
16/03/03 00:48:19.47 OHZiW0+6.net
確かにCUDAというかNVIDIAの定義しているシェアードメモリは一般的なシェアードメモリとは違うね。どちらかというとローカルメモリといった方が正しいかもしれん。

824:,,・´∀｀・,,）っ-○○○
16/03/03 01:01:39.27 HcahvuJO.net
同じコアだからこそメモリを介さずレジスタ上でシフト・シャッフルができる（Kepler以降）

CUDAのSIMTとは単純に32要素1024ビットのSIMDを32スレッドと読み替えてるだけ
この点はG8x世代から変わらないね

825:デフォルトの名無しさん
16/03/03 01:48:33.97 TCZfqrpq.net
自演会話すれば糞団子が味噌団子に変化するじゃないぞ？団子さんよお

826:,,・´∀｀・,,）っ-○○○
16/03/03 07:58:21.23 HcahvuJO.net
自演認定しても頭がよくなりませんよ、他所者君
CUDAをちゃんと勉強してる人にはみんな知ってる事実だ

827:デフォルトの名無しさん
16/03/03 08:43:19.76 dzwxxNC2.net
また夜中の自演が始まったか
バレてないと思うところが糞団子だね
何度も言うがここはCUDAのスレ
僕の考えたシェアードメモリ論ならチラシの裏に書いとけ

828:デフォルトの名無しさん
16/03/03 09:02:21.96 HqLf1iVZ.net
CUDAでいうシェアードメモリはCPUでいう一次キャッシュだし、CELLで言うところのLSだから、SMメモリとかコアメモリとかにしておけばよかったのにね。
CUDAの黎明期はGPUをスパコンって呼ぶ戦略があったから、1スレッドを一コアに見立て、共有メモリだと言っていたのかもしれないね。

829:デフォルトの名無しさん
16/03/03 09:17:45.89 dzwxxNC2.net
>>807
それを言うならオンチップメモリ
少なくともソフトレイヤーではキャッシュとシェアードは別物
そもそもMaxwellではデータバスも異なる
んでここはCUDAのスレだ
スペオタと糞団子は去れ

>>804
cudaDeviceSetCacheConfigは試してみたのかな？

830:デフォルトの名無しさん
16/03/03 12:05:39.08 DYrHTZ2H.net
>>804
俺に聞かれてもなｗ
Occupancy確認してからスムースになってきたみたいだし、使わなくても順調ならそれでいいという
考えもある

831:,,・´∀｀・,,）っ-○○○
16/03/03 12:34:58.87 Z97pa2Hq.net
ソフトレベルって言ってもなぁ
.cuやPTXのレベルならそうだろうがcubinレベルでみて言ってるんじゃないんだろ？

実際Sharedなんて言ってもSMX（実質上のコア）の中でしか参照できないんじゃ名前に偽りありとしか
SPMDをオレオレ用語で置き換えた概念で説明すればSharedなんだろうが物理的にはCellのSPUのLSと同じトポロジにすぎん

832:デフォルトの名無しさん
16/03/03 14:52:54.35 Qh2UpiXS.net
逆に複数のsmx間で共有されてたら
くそ遅いだろう
ローカルだから他のsmx気にしなくていいわけで

833:デフォルトの名無しさん
16/03/03 14:54:11.01 DdRI0anx.net
>>810
相変わらず頓珍漢なこと言ってるな
お前がどう思うかは全く興味がないから
ここはCUDAスレだ
CUDA使った事ない糞団子は去れ

834:754
16/03/03 14:57:08.65 FhaRPDaV.net
>>808
CUDA_Occupancy_Calculator.xlsで確認してたんですが、
CC3.0だと48kb/16kbと16kb/48kbの他に32kb/32kbがあるっぽくて、
32kbなら100%になる、みたいな謎結果が出てたんです。
で、うちの古い参考書にはその設定のやり方が載ってなかったんです。
だけどそのあと.xlsファイルを開き直したらなぜが100%になってました。
なんでやねん。

835:,,・´∀｀・,,）っ-○○○
16/03/03 15:08:31.08 IfmnFgwQ

836:.net

837:デフォルトの名無しさん
16/03/03 17:12:24.19 fEIbv9/m.net
また低脳の団子が自演かよ!?
いい加減にして欲しい
コイツがいるとスレが腐るんだけど（怒）

838:デフォルトの名無しさん
16/03/03 19:52:45.84 dqlRC1xd.net
>>814
初代から使ってそのレベルならお前には向いてないからもう諦めろ
結局質問者には何ひとつ有益な情報を与えられない低レベル糞団子

839:デフォルトの名無しさん
16/03/03 20:01:58.72 TCZfqrpq.net
>>813 （>>766）
ああいう大人（団子）みたいになったらだめですよ（笑い

840:デフォルトの名無しさん
16/03/03 20:19:52.39 4mtdR8td.net
団子ちゃんは詳しいと思う。

841:デフォルトの名無しさん
16/03/03 20:29:28.69 n6tvCzB6.net
文句言うだけの奴より団子のほうがこのスレの役に立っている。

842:デフォルトの名無しさん
16/03/03 21:01:42.18 KusOhd2G.net
　　　　　　　　　　　　　　　【親米涙目】　★　　　ロシアがアメリカを一発ＫＯ　　　★　【反中逃亡】

　　宇宙人側からの申し入れは、とにかく核の利用と戦争をやめなさい、もう一つは宇宙人の存在を公表しなさい。
　つけ足したのが、６０年の猶予を与えましよう、２０１４年には発表しなければならなかったんですね、宇宙人の存在を。
　　　　　ロシアという大国の首相がね、あれは冗談だよでは済まないですね、しかも２回も言ってるんだからね。
　　　　　　　　　　　　　　　　　　　　　URLﾘﾝｸ(www.youtube.com)

　　　　　　　　　　　【親米屈辱】　★　　　宇宙人いない派のおバカさん残念ｗｗｗ　　　★　【反中赤面】

　　　　　　NASAは、UFOに対して長年取ってきた態度のために、無用な組織とされることを恐れています。
　　　　　　　　　　　　　　　　　マイトレーヤが公に現れるにつれて、UFOが姿を表すでしょう。
世界平和の脅威は、イスラエル、イラン、アメリカです。イスラエルの役割は跪いて、パレスチナに許しを請うことです。
　　　　　　　　　　　　　　　　アメリカによる他国の虐待に反対の声を上げなければなりません。
　　　　彼らは今世紀（21世紀）をこの帝国が出来上がるアメリカの世紀と呼ぶ。しかし、そうはならないだろう。
　　彼らが世界中に‘民主的’制度を確立したいという衝動をコントロールするのは、マイトレーヤの任務である。
Q 経済崩壊が2015年から、テレパシー世界演説が2017年の初めなら、2016年に大戦でしょうか。A 大戦は起こりません。

　　　【親米命乞い】　★　　　マイトレーヤのテレパシーによる世界演説は英国ＢＢＣが放送　　　★　【反中土下座】
　　　　　　　　　　　　　　　　　　　　　URLﾘﾝｸ(www.youtube.com)

　　　　　　　　　　　　　　　　マイトレーヤが世界に向かって話をする準備は良好に進行している。
　　25分か35分くらいかもしれませんが、歴史上で初めて、世界的規模のテレパシーによる接触が起こるのです。
　　テレビ中継はこの出来事のために存在するのであり、この時、初めてご自身の本当の身分を明らかにされます。

843:デフォルトの名無しさん
16/03/03 21:02:13.41 L7+NtMAj.net
はい、単発来ましたw

糞団子のどこが有益なんだ？
シェアードメモリの

844:割り当て変更にも答えられずに、ローカルメモリとか嘘の情報垂れ流してる奴だぞ？まともなCUDAユーザーならローカルメモリとシェアードメモリが別物なんて事は常識以前の問題だ糞団子の自論なんか誰も聞きたくない嫌われ者の糞団子は去れ！

845:,,・´∀｀・,,）っ-○○○
16/03/03 22:03:27.41 vD1NzbLA.net
他人のレスで我が物顔してるだけじゃん
無益な厨房だな

846:,,・´∀｀・,,）っ-○○○
16/03/03 22:12:39.51 vD1NzbLA.net
つーか自称シェアードメモリが実質的なLocalStorageでしかないことは知っておかないとハマる事例もあるんだけどね
SIMTはAVXユニットを8コア、Xeon Phiの1コアを16コアって読み替えるトンデモ抽象化

847:デフォルトの名無しさん
16/03/03 22:33:11.46 a8cmYHdA.net
自演するな！糞団子

848:,,・´∀｀・,,）っ-○○○
16/03/03 22:34:50.71 vD1NzbLA.net
別に何も間違ったことは書いてないんだが理解できないバカがいる

849:デフォルトの名無しさん
16/03/03 22:51:35.86 L7+NtMAj.net
シェアードメモリをローカルメモリとか言う嘘を垂れ流してる事はスルーなんだな
簡単な初期化関数すらアドバイス出来ない低レベル糞団子

ちなみにシェアードメモリは自称でもなんでもなく公式な名称だ
気に入らないなら自分で会社起こして俺の考えた最強のGPUでも作ればいいさ
まぁ、お前のレベルじゃディスクリートすら無理な事は明らかだがな
早く去れよ糞団子

850:デフォルトの名無しさん
16/03/03 22:52:03.02 tH72Ij/h.net
さっき、Anacondaの最新バージョンである2.5.0(64-bit　python3.5.1)を入れたの
だけど、それにコマンドプロンプトがデフォルトで入っていないので、pip installが
出来なくて困っています。ipythonやインタラクティヴシェルは入っています。

前のAnacondaのバージョン(python2.7で使っている)であれば、ipythonや
対話シェルからq()やquit()で、普通に、コマンドプロンプトに戻れて、そこから
pip installなどが出来たのになぜなのでしょうか。

普段使っているコマンドプロンプトはpython2.7用になっているので、そこから
python3.5.1用のpip installも出来ません。コマンドプロンプトをpythonのヴァージョン
ごとに切り替えることができるのかもしれないけど、その方法も分かりません。

どなたか、知っている人がいたら教えて下さい。
よろしくお願いします。m(__)m

851:デフォルトの名無しさん
16/03/03 23:25:12.80 L7+NtMAj.net
>>827
恐ろしくスレ違いなんだけど
python2系と3系を共存させるならパスを適切に設定しないとダメだよ
詳しくはググってくれ

取り敢えずコマンドプロンプトでpyって打ってからpipしてみたら？

852:デフォルトの名無しさん
16/03/03 23:27:56.45 Qh2UpiXS.net
>>821
どう違うの？

853:デフォルトの名無しさん
16/03/03 23:45:09.31 L7+NtMAj.net
>>829
なぜググらない？
URLﾘﾝｸ(www.gdep.jp)

854:デフォルトの名無しさん
16/03/04 00:05:36.72 oWoP2ITQ.net
ha?

855:デフォルトの名無しさん
16/03/04 00:13:03.67 HJiU7/Cc.net
>>828
パスは、最新のAnacondaをインストールする時に、パスを自動設定するなら
チェックを入れよという欄があって、チェックを入れてインストールを終了
すると、新しい環境設定が入っています。

念のためシステムで環境設定でパスをチェックしたけど、Anaconda3で、
新しいのが入っている。Anacondaは、3ヴァージョン使っている
のだけど、新しくなるほど使いにくくなっている感じですね。

q()でコマンドプロンプトに戻れると>>827で書いたのは、間違えだった。
それは、R言語のやり方だった。

856:デフォルトの名無しさん
16/03/04 00:16:41.20 oWoP2ITQ.net
nv用語だとローカルにないものが
ローカルメモリなんだなこりゃややこしい

857:デフォルトの名無しさん
16/03/04 00:25:56.51 HJiU7/Cc.net
今更の問題だけど、pythonはやはり、2系と3系の互換・移植性が
悪いのが問題かな。今日買った、

基礎 Python (IMPRESS KISO SERIES) 単行本（ソフトカバー） – 2016/3/4

大津真 (著)

URLﾘﾝｸ(www.amazon.co.jp)

が、3系で、ちょっと変わった雰囲気のコードの使い方があったので、面白いの
だけど、2系と併用だと>>827みたいになって、pip　installも出来ないし、
ipythonでしか、3系が使えないのが困りもの。2系で使える3系のものも
あるけれど…。

2系を全部消せば3系を使えるのは分かっているのだけど、2系の方が
出来ることがまだまだ多い感じがするからね。まだ2系が多数派でしょ。

あ、仮想環境ヴァージョンを切り替えてやればいいのかな。

858:デフォルトの名無しさん
16/03/04 00:38:24.47 HJiU7/Cc.net
あ、pythonのクダスレだと、勘違いしてました。
失礼いたしました。

859:デフォルトの名無しさん
16/03/04 00:40:30.37 UJ4KYtRn.net
>>833
何を今更
だからこそ嘘を垂れ流す糞団子はここから去れよ

860:,,・´∀｀・,,）っ-○○○
16/03/04 01:07:12.95 qzn/KKB0.net
ウソ扱いしてるお前が自覚のないウソつきなんだけど

861:,,・´∀｀・,,）っ-○○○
16/03/04 01:15:03.88 qzn/KKB0.net
>>833
もっとも、スピルされたレジスタのデータが真っ先に格納されるのはGDDR*ではなく
キャッシュだけどな
なぜならキャッシュはDRAMの読み書きを高速化するためにあるから

862:デフォルトの名無しさん
16/03/04 02:24:38.67 pNMSyXd+.net
自覚のない荒らし
それが団子の糞風味クオリティ

863:デフォルトの名無しさん
16/03/04 07:49:00.48 o39fhgVG.net
>>837
何が嘘なのか具体的に示せよ
俺は具体的に示したろ
糞団子は去れ

864:デフォルトの名無しさん
16/03/04 07:50:34.02 o39fhgVG.net
>>838
＞なぜならキャッシュはDRAMの読み書きを高速化するためにあるから
そんなパソコン教室の初日に教わる様な内容を語るスレじゃねぇよ
糞団子は去れ！

865:デフォルトの名無しさん
16/03/04 08:15:25.08 uG62vIs+.net
匿名で俺って言い張られてもｗ

866:デフォルトの名無しさん
16/03/04 09:40:06.12 sQ9JXJsj.net
>>842
流れが読めないなら黙ってればいいのに

867:デフォルトの名無しさん
16/03/04 09:48:28.02 /J2AWB0A.net
Talk me.

868:デフォルトの名無しさん
16/03/04 10:12:42.01 uG62vIs+.net
オレオレ、俺だよ俺
俺だよ

かまってよ

ってかｗ

869:デフォルトの名無しさん
16/03/04 11:01:16.11 z53XqiUN.net
お前つまんねぇよ

870:デフォルトの名無しさん
16/03/04 11:46:47.03 pNMSyXd+.net
団子ちゃん悔しいだろホントはおともだちをつくってワイワイ話したいんだろ？
じゃあ自作板帰ろうな

871:デフォルトの名無しさん
16/03/04 12:02:03.20 uG62vIs+.net
オレオレ主張したいんならコテハンつけろよ

872:デフォルトの名無しさん
16/03/04 15:46:55.78 XhYLrWiK.net
俺だよ

873:デフォルトの名無しさん
16/03/04 19:33:33.59 o39fhgVG.net
答えに窮すると何故か匿名になる
安定の自演糞団子

874:デフォルトの名無しさん
16/03/04 19:39:28.79 dJLsGuAT.net
自分がやってるからって
他人もそうだと思うなよ
病気の人

875:デフォルトの名無しさん
16/03/04 21:27:27.28 nvZ+jZcm.net
まだやってんのかよっw。
シェアードメモリはローカルメモリだよwww。

876:,,・´∀｀・,,）っ-○○○
16/03/04 21:40:33.21 qzn/KKB0.net
方言のない一般名称でいうと「スクラッチパッドメモリ」か

877:デフォルトの名無しさん
16/03/04 21:49:33.06 pNMSyXd+.net
ぼろ出してもコテでい続けるのは正直苦痛だろ？

な、団子

878:デフォルトの名無しさん
16/03/04 22:01:24.79 WoARA1cN.net
>>852
>>830

879:,,・´∀｀・,,）っ-○○○
16/03/04 23:13:53.73 qzn/KKB0.net
名無しばっかりだと不安で団子認定に必死な病気の癖に

880:デフォルトの名無しさん
16/03/05 04:38:45.77 GYxVvQjW.net
いい加減通常時に戻ってください
正直どっちもどっちなんだよね
どっちも邪魔

881:デフォルトの名無しさん
16/03/05 07:19:08.49 dgmAi0Ww.net
マジで糞団子は去ってくれ
嫌われてるの自覚しろ

882:デフォルトの名無しさん
16/03/05 07:44:33.94 I9HpfPeT.net
コテの人はいい加減ブログでもなんでも始めたらいいよ
荒らし行為だよ

コテ煽る人もやめてよ

883:デフォルトの名無しさん
16/03/05 09:30:50.56 pYtkFW+i.net
団子さん
お願いです。
あなたが来てからこのスレは機能しなくなりました。
ここは数少ないCUDAの情報交換の場です。
もう、ここに来ないで下さい。

884:デフォルトの名無しさん
16/03/05 09:48:51.08 7wCpFrY5.net
実際の荒しは倍精度、精神病の人ですけどね

885:デフォルトの名無しさん
16/03/05 10:46:20.52 we9m+Baq.net
こいつ一人が団子団子連呼してて
すげー気持ちわりーよ

886:デフォルトの名無しさん
16/03/05 10:51:01.60 7wCpFrY5.net
好きなんだろ
付き合っちゃいなよ

887:デフォルトの名無しさん
16/03/05 11:18:09.46 nqZZ4Fac.net
最近は傷心の団子をおもちゃにするうんこごっこが流行ってるのか？

888:デフォルトの名無しさん
16/03/05 11:20:03.53 7wCpFrY5.net
いいえ
精神病の人をどうバカにするかが流行ってます

889:デフォルトの名無しさん
16/03/05 14:14:59.66 oAjMaO0h.net
つーかまともな話しようとすると団子認定されるのは書き込む気を無くさせるためなのだろうか。
技術的な話をすると内容がどうでも団子にされるから、そういう話が理解できないのと、ある意味団子崇拝が酷いのだろうな。

890:デフォルトの名無しさん
16/03/05 15:25:30.62 PxQJKL1y.net
>>861
団子はある程度(正しいかは別にして)技術的話が出来るけど、
その人はAMDは倍精度がすごいよ、GPGPUの勝者はAMDで決まり！と
I　love 団子だけだからな。

891:デフォルトの名無しさん
16/03/05 16:26:59.56 nqZZ4Fac.net
あんまり団子をおもちゃにするなって
ウンコの匂いが充満するじゃないかｗ

892:デフォルトの名無しさん
16/03/05 16:43:06.41 hF4tqJh9.net
こんにちは。

CUDA では、__device__ 修飾された関数は、GPU内部から呼び出せますが、
再帰コールが出来ないのはなぜですか？

以下はできますよね？

__device__ int aaa(int x) {
　return x * 2;
}

__device__ int bbb(int y) {
　return aaa(y) + 3;
}

では、以下は駄目ですか？
__device__ int kaijou(int y) {
　if ( y == 1 ) {
　　return y;
　}
　else {
　　return y * kaijou(y-1);
　}
}

893:デフォルトの名無しさん
16/03/05 17:05:18.01 nqZZ4Fac.net
団子は答えなくて結構

894:デフォルトの名無しさん
16/03/05 17:17:05.46 oAjMaO0h.net
ハード的に絶対できないと言うことも無いのだろうが、スタックどれだけ使うか計算できないってのが大きいんじゃね。

895:デフォルトの名無しさん
16/03/05 19:01:23.69 wCUhFShW.net
最適化の邪魔になるから最初から再帰はやめてねーんってことかな。

896:デフォルトの名無しさん
16/03/05 20:36:21.36 pXJbdtfw.net
>>870
おまえが正解答えてやれば
あれずに済むだろ

897:,,・´∀｀・,,）っ-○○○
16/03/05 21:10:49.87 18qofrJ5.net
>>873
俺ならその無駄レス書いてる暇で書けるぞ>>870は無能だから理解できないだけで

>>871
CUDAの自称コアが要素毎プレディケートつきのSIMDユニットを
マルチコアって言い張ってるだけから本物の独立したコアでないから
で終わりなんだけどね。
命令ポインタは「自称コア」ごとに独立してないんだ

「分岐」も本物の分岐ではなく、if-else節を全部一列のコードに展開してプレディケート
しているだけ。プレディケートビットの全要素が0あるいは1になって初めて関数を
飛び越えることができる。

SIMDの要素（自称）ごとに命令ポインタと関数コールスタックを管理できて別々の
命令ステートを独立して持てるならそれは既にSIMDじゃない

898:,,・´∀｀・,,）っ-○○○
16/03/05 21:25:15.51 18qofrJ5.net
ベクトルを隠蔽しない、1ワープを1つのスレッドとして処理できるプログラミングモデルが
提供されるなら再帰は理屈上可能
それはCPUのSIMDの在り方と同じってことだけど

899:デフォルトの名無しさん
16/03/05 21:53:08.36 LlD1+gMh.net
独立したコア�

900:ﾆいう前提だから、コア毎のレジスタで表現できる範囲の処理しか出来ないって事だと思ってたけど違うのか。

901:デフォルトの名無しさん
16/03/05 22:00:09.02 oAjMaO0h.net
基本はSIMDプロセッサでの本当の分岐だよ。
簡単な処理ならpredicate実行で済ますけどこれはモダンなプロセッサではSIMT、SIMD、に限らず一般的な手法

状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていくから、どこかのdivergent pathで無限ループになるとwarp内の別threadには何時までたっても制御が帰ってこないけどね。

902:,,・´∀｀・,,）っ-○○○
16/03/05 22:00:10.11 18qofrJ5.net
再帰だけならCell SPUすら出来てるからね
命令ポインタの制約のある偽りのコアであること以上の理由はないでしょう

末尾再帰をループに展開するオプションすら用意してないのは処理系の実装の手抜きだろうと思うけど

903:デフォルトの名無しさん
16/03/05 22:04:28.99 0d+Ags99.net
可能な限り手を抜くのがハードにとってのＧＰＧＰＵという物かも

904:,,・´∀｀・,,）っ-○○○
16/03/05 22:12:52.44 18qofrJ5.net
実害は具体的にはバックトラッキング型の探索アルゴリズムが使えない
（実装方法に制限がある）とかかな

905:デフォルトの名無しさん
16/03/05 22:24:17.32 oAjMaO0h.net
cudaは性能出すために最適化しだすと、結局SIMD構造を意識して記述することになる。
で結局、SIMTでプログラミングするメリットを感じなくなる。

scatter,gatherも便利なのだけど、それしかないから、性能出すためにアラインメント気にしながら連続アドレスにアクセスするように記述していると、普通のSIMDのようにアドレス１つ計算すればすむのに無駄だなぁと。

で、複数のアドレスを受け取ったハードウェアが同じキャッシュラインに乗っていることを検出してメモリアクセス回数を最小化するとか、バカじゃねと。

まあGCNはそこら辺の無駄に対応していて美しいのだが、いかんせんソフトやサポート体制がクソ過ぎて。

906:デフォルトの名無しさん
16/03/05 23:05:45.56 wCUhFShW.net
>>877
>状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていく
横からですが参考になります。
再帰がまずいっていうより結果として条件分岐をたくさん通るのがまずいって感じですかね。

907:デフォルトの名無しさん
16/03/06 08:40:29.75 e28R5O2W.net
最近は、5,000円くらいの低価格GPUでも、Keplerコアを使っていて、
Fermiコアの上位互換だから、再帰コールも出来るのですか？

でも、関数のローカル変数は、C/C++と全く同じで、スレッド独立だが、
関数引数だけは、スレッド共通だと聞きましたが、これだと再帰コール
できなさそうですが。

908:デフォルトの名無しさん
16/03/06 11:18:07.40 5MH1CF8G.net
あーあまた糞団子が答えちゃった
このスレの事情を知らん奴が見ると余計に迷うぞ

909:,,・´∀｀・,,）っ-○○○
16/03/06 11:35:37.89 ejwavTIm.net
答えられないクズは存在する価値ないでしょ
とっとと失せろよゴミ

910:,,・´∀｀・,,）っ-○○○
16/03/06 11:48:38.53 ejwavTIm.net
つーか俺も含めてまだ正解出してないんだけどな

んで正解はこれ、Kepler以降なら再帰に【一応は】対応
URLﾘﾝｸ(developer.download.nvidia.com)

誰かツッコミ入れると思ったけど期待外れだったなあ
まあ、俺の説明も何も間違ってないのだけど
(>>874も「出来ない」という説明をしてるのではなく制約を説明しているだけ）

911:デフォルトの名無しさん
16/03/06 13:04:30.88 ZW4nksfm.net
確かにこの団子は鳥屋氏じゃないな。
鳥屋氏はこういう物言いはしない。

912:,,・´∀｀・,,）っ-○○○
16/03/06 13:12:58

913:.97 ID:ejwavTIm.net

914:,,・´∀｀・,,）っ-○○○
16/03/06 13:18:27.49 ejwavTIm.net
ドァンゴが、１３：１８くらいを、お伝えします

915:,,・´∀｀・,,）っ-○○○
16/03/06 13:20:55.68 ejwavTIm.net
ちゃぷにさんはだんごやさんを嫌ってるはずなので彼がその顔文字を使う理由はないんだよ
自分でNGキーワードに入れてる宣言してたし

916:,,・´∀｀・,,）っ-○○○
16/03/06 13:22:13.40 ejwavTIm.net
更に言うと彼は精神が壊れて自作PC板で機械翻訳コピペを貼るだけの人に成り下がってしまった

917:デフォルトの名無しさん
16/03/06 13:49:39.00 5MH1CF8G.net
団子＝鳥屋でも別にいいじゃねーか
糞撒き散らすだけならどっちもNGだ

918:,,・´∀｀・,,）っ-○○○
16/03/06 13:52:02.23 ejwavTIm.net
中村ちゃぷに君と一緒にしないでくれる？

919:デフォルトの名無しさん
16/03/06 14:37:46.02 ZW4nksfm.net
>>891
鳥屋氏に何かあったの? そっちが気になる。

920:,,・´∀｀・,,）っ-○○○
16/03/06 14:39:09.93 ejwavTIm.net
>>894
だから本人に直接聞いて来いよTwitterアカウントあるだろ

921:デフォルトの名無しさん
16/03/06 14:42:36.51 ZW4nksfm.net
別に本人と直接連絡とれるけどなんか聞きにくいじゃん。
おしえてよ。

922:,,・´∀｀・,,）っ-○○○
16/03/06 14:43:25.75 ejwavTIm.net
俺なら聞けるのか？ｗ
デタラメ言っちゃうけど？

923:デフォルトの名無しさん
16/03/06 14:47:00.65 ZW4nksfm.net
本人に根掘り葉掘り聞くよりいいよ。

924:,,・´∀｀・,,）っ-○○○
16/03/06 14:48:10.37 ejwavTIm.net
ちなみに彼は10年以上前から初心者の質問板で「メンヘル屋」と呼ばれてたぞ

925:デフォルトの名無しさん
16/03/06 23:01:58.93 YHBwXFpN.net
日曜日の真昼間に2ch張り付きかよ
さすが糞団子だな

926:デフォルトの名無しさん
16/03/07 07:46:57.77 7lblB3Ic.net
平日の日中ならいいのかｗ

927:デフォルトの名無しさん
16/03/07 12:32:22.52 +p3ICmyk.net
頼むからNGの外に出てくるな>>901＝糞団子

928:デフォルトの名無しさん
16/03/07 17:04:45.58 GuUCesj8.net
マジで氏ねよ！ここ糞団子！！
お前のせいでスレがめちゃくちゃ！

929:デフォルトの名無しさん
16/03/07 19:13:33.67 IaXW9rhX.net
>>901
なんでそう思ったの？

930:デフォルトの名無しさん
16/03/07 21:28:52.80 Xyilrqi/.net
病気の人が召還してる

931:デフォルトの名無しさん
16/03/08 00:17:54.26 zUXR2K3c.net
糞団子は>>900が効いてる様だなw

932:,,・´∀｀・,,）っ-○○○
16/03/08 01:03:04.66 4ClxYf7a.net
普通ジャン

933:デフォルトの名無しさん
16/03/08 06:06:38.08 sCq0/cKi.net
家でpcにかじり付いてる人なんだろ
病気の人は

934:デフォルトの名無しさん
16/03/08 07:07:19.82 zUXR2K3c.net
日曜日に一日中2chが普通なんだ
さすが糞団子

935:デフォルトの名無しさん
16/03/08 22:50:34.72 f+sFTvrc.net
2chやっているおっさんなら起きてから寝るまで2chが普通だろ
いまはスマホで仕事サボって2chしているおっさんが多いからな

936:デフォルトの名無しさん
16/03/08 22:59:24.25 8p7AV+as.net
>>910
今やちょっとゆる会社だと、トイレが満室になって10分待ちだからな。

937:デフォルトの名無しさん
16/03/08 23:40:27.24 SNBHGm11.net
そんなにトイレが好きならドアを接着剤で止めてやろうかと思った

938:デフォルトの名無しさん
16/03/09 00:03:43.04 QI7bsFp8.net
平日仕事サボって2chなら、まぁわからなくも無い
理解できないのは日曜日の朝から晩まで2ch張り付きの糞団子

939:,,・´∀｀・,,）っ-○○○
16/03/09 00:29:18.66 EC2EcKU9.net
スマホゲーの体力ゲージ消化してるだけじゃね？
2chなんてとっくにブーム終わってるだろ

940:デフォルトの名無しさん
16/03/09 12:01:37.54 Bn2mru1A.net
>>913
話し相手が欲しいんだよ
スレをウンコ臭くしておいて

941:デフォルトの名無しさん
16/03/09 17:46:55.52 +SKBM1r7.net
へえ、お前、寂しがり屋なんだな

942:デフォルトの名無しさん
16/03/09 19:21:18.15 QI7bsFp8.net
糞団子が急に大人しくなって笑える
かなり効いた様だなw

943:デフォルトの名無しさん
16/03/09 19:28:24.12 n0++16X2.net
かまってちゃん
乙

944:デフォルトの名無しさん
16/03/09 21:45:15.09 Bn2mru1A.net
コテ団子をNGにして華麗にスルーしないとね
名無しで煽る時は怒るんじゃなくてファブリーズでも置いておきましょう

945:デフォルトの名無しさん
16/03/09 22:07:10.45 F7KphU9Z.net
そんなにかまってほしいのか

946:デフォルトの名無しさん
16/03/09 22:13:39.55 QI7bsFp8.net
それはお前だろ
さっきからチョロチョロウザい

947:デフォルトの名無しさん
16/03/09 22:45:09.81 F7KphU9Z.net
おまえがそれを言うのか

948:デフォルトの名無しさん
16/03/10 00:12:27.45 lJwnXkdm.net
なんだ
やっぱり、かまってちゃんか？

949:デフォルトの名無しさん
16/03/10 05:26:45.85 ElNFIbXj.net
っ鏡

950:デフォルトの名無しさん
16/03/10 20:04:24.43 lJwnXkdm.net
いや、朝の5時から鏡出されても…

951:デフォルトの名無しさん
16/03/10 22:07:55.24 Kwch6Nj+.net
ここはプ板のかまってちゃんが集うところです
Nvidiaユーザーってへんなやつ多いよね。どう？

952:,,・´∀｀・,,）っ-○○○
16/03/10 23:24:17.96 36+0Q/RN.net
ミラーマン！
植草教授！

953:デフォルトの名無しさん
16/03/11 00:12:19.52 0VtVfbcA.net
はい
かまってちゃんの変な奴来ました

954:デフォルトの名無しさん
16/03/12 13:14:03.96 7MrNfl0C.net
誰も居ない？

955:デフォルトの名無しさん
16/03/14 00:27:24.09 tMjTpPPM.net
糞団子が荒らして過疎ったな
ホントろくでもねぇ奴だったな

956:デフォルトの名無しさん
16/03/15 19:07:06.06 NepgFCLn.net
では素人が質問してもいいですか
オプションのCUDA RuntimeをStatic CUDA runtime library (-cudart static)にしているのにもかかわらずcudart32_75.dllが生成されるんですけど不要ですよね？
消しても動くのでいらなさそうではあるんですけど一応残してます

957:デフォルトの名無しさん
16/04/06 05:42:39.04 b0ehB924.net
URLﾘﾝｸ(devblogs.nvidia.com)
URLﾘﾝｸ(devblogs.nvidia.com)

958:デフォルトの名無しさん
16/04/06 19:11:29.54 7FwwXsE8U
NVIDIA DGX-1がダサいだー

959:デフォルトの名無しさん
16/04/08 23:49:33.98 Oe8UeTI2.net
>>874
この辺りからの流れはとても勉強になる

960:デフォルトの名無しさん
16/04/13 00:20:39.50 vTxSOF48.net
>>930
CUDAを使ったことがない連中がたくさん来場してたからな
CUDAは映像･画像処理の一般プログラムではなく専門性が非常に高い分野(機械学習や車の自動運転とか)で使うって感じに
なってきたからな。

961:,,・´∀｀・,,）っ-○○○
16/04/13 00:37:51.36 uE1XEE4+.net
レジスタファイルがダイ全体で14Mもあるとかホント化け物ですね
アクセスレイテンシはでかそう

962:デフォルトの名無しさん
16/04/13 18:30:01.95 P1TlabSM.net
言っているそばからw

963:デフォルトの名無しさん
16/04/18 20:53:52.86 npM92plo.net
以前エクサスケールへむけての改良点てやってたけど
warpサイズが4になったりレジスタファイルの階層化とか
やってるのかな

964:デフォルトの名無しさん
16/04/29 07:41:21.25 H9O34uIX.net
>>935
機械学習はマルチGPU

965:デフォルトの名無しさん
16/04/29 19:49:33.11 F6Ql+W8p.net
Pascalは忘れられてるけど、倍精度も強化されてるんだよね
単精度を徹底的に削った思い切った方針には目を見張った

966:,,・´∀｀・,,）っ-○○○
16/04/29 21:17:01.56 RuK53SvA.net
大型スパコン案件に特化して設計したものをGPUに流用してるだけで
それが全部だと言い張られても困りますが

967:デフォルトの名無しさん
16/04/29 22:49:34.54 wZxrhoKH.net
なんでおまえが困るんだよw

968:デフォルトの名無しさん
16/04/30 00:41:27.46 oV2mml7H.net
ＧＰＧＰＵは深層学習のブレークで

969:今後一気に需要が高まる？

970:デフォルトの名無しさん
16/04/30 11:52:36.46 xhIIf3AZ.net
高まるだろうね
倍精度と半精度がちょうどいい具合

そうやってGPGPU市場を頑張ってもらって12.1の妨害行為は止めて欲しいわ

971:デフォルトの名無しさん
16/04/30 22:20:59.01 4IpkHcLg.net
その需要の大半はnVIDIAが発表したEyerissみたいな専用チップに喰われるのでは

972:,,・´∀｀・,,）っ-○○○
16/04/30 22:33:42.88 wNNJHcCv.net
あれはCNNに特化したものでGPUほどのプログラマビリティはない
ディープラーニングって一言で言っても1個のASICで賄えるほど狭い分野じゃない

973:デフォルトの名無しさん
16/04/30 22:45:19.47 tL+Fobdg.net
CNNに特化て具体的には行列演算てこと？

974:,,・´∀｀・,,）っ-○○○
16/04/30 23:20:42.71 wNNJHcCv.net
疎行列に特化したマトリクス演算回路とそれなりの帯域のリングバスネットワークが主な構成要素
って覚えておけば大体間違いない
実はGPUの特性と正反対（GPUは密行列なら得意）

975:デフォルトの名無しさん
16/04/30 23:25:48.76 WnEgJTfp.net
fermi世代ってdouble⇒floatで倍速なはずだよね？
ちっとも速くならないんだが。

976:デフォルトの名無しさん
16/05/01 05:03:39.83 IAB0IXGv.net
大分前だけど構造体でデータを渡すとdouble扱いになったことはある
原因は不明

977:デフォルトの名無しさん
16/05/01 10:04:45.15 c2Ftkl1w.net
>>950
thx。

調べてみた感じだと、倍精度が無いカードで暗黙のdouble→floatキャストがあったり、
floatへの数値代入で接尾語Fを付けないとdoubleにキャストされたりもあるっぽいね。

fermiでarch=compute_20,sm_20指定してるから基本的には宣言通りだと思ったのだが、実際どうなってるのか・・。
全部floatに置き換えてもわずかしかスピードアップしないのは、バイトコピー分が浮いてるだけな気がする。

978:デフォルトの名無しさん
16/05/01 10:24:43.67 tKi6j9CT.net
匿名通信（Tor、i2p等）ができるファイル共有ソフトBitComet（ビットコメット）みたいな、
BitTorrentがオープンソースで開発されています

言語は何でも大丈夫だそうなので、P2P書きたい！って人居ませんか？

Covenantの作者（Lyrise）がそういう人と話したいそうなので、よろしければツイートお願いします
URLﾘﾝｸ(twitter.com)

ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーｗ

The Covenant Project
概要

Covenantは、純粋P2Pのファイル共有ソフトです

目的

インターネットにおける権力による抑圧を排除することが最終的な目標です。そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します

特徴

Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)

接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
ｈ

979:デフォルトの名無しさん
16/05/01 11:36:33.54 4G1NPxxh.net
eyerissは大量のデーターが複数のフィルター処理されるのに向いてる

980:デフォルトの名無しさん
16/05/09 19:46:40.50 ZKk/r1uF.net
質問があります
環境はwindows 10 | arch linux, cuda 7.5, gcc | visual c++ 2013です

#include <stdio.h>

__global__ void a(char *A){
}

int main(){
a<<1, 1>>(); // (1)
}

(1)で「expression must have integral or enum type」とエラーが出て困っているのですが
ホストコンパイラを呼び出す際に何か間違えているのでしょうか

コンパイルに使用したコマンドは
windows
　nvcc -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\bin" -c -DWIN32 -D_CONSOLE -D_MBCS -Xcompiler /EHsc,/W3,/nologo,/Wp64,/O2,/Zi,/MT test.cu
linux
　（失念したが大体同じ）
です

981:デフォルトの名無しさん
16/05/09 23:47:16.41 +C4ZnXlR.net
>>954
≪≫のところじゃない？
二重カッコじゃなくて、三重カッコにすべきかな

二重カッコだと別の演算子になって、意味が変わってくる

982:デフォルトの名無しさん
16/05/09 23:54:10.06 ZKk/r1uF.net
ああ、3重括弧でしたか
間抜けなミスで騒いでしまって申し訳ないです
ありがとうございます

983:デフォルトの名無しさん
16/05/20 21:20:51.03 OCEBmLiZ.net
グーグルがTensolFlow用のTPUとかいうの作ってたらしいがどうなの？

984:sage
16/05/23 17:33:55.45 w8cwn6FF.net
CUDA fortranで一つの配列に対して2GB以上のメモリを
アロケートすることが出来ず、
PGIのサイト見たら「2GBの壁」とかって説明されているのですが、
これってどうにか克服出来ないですかね？

985:デフォルトの名無しさん
16/05/23 18:16:51.67 rInNNyjw.net
>>958
何gbくらい必要なの？

986:デフォルトの名無しさん
16/05/23 18:47:01.54 hrdyo10f.net
>>958
fortranなんか使っているからだよ。

987:デフォルトの名無しさん
16/05/23 19:56:12.00 Y87SDCLt.net
３２ビットの壁ってこと？

988:デフォルトの名無しさん
16/05/23 22:17:34.30 COcpIksW.net
CU_LIMIT_MALLOC_HEAP_SIZE か cudaLimitMallocHeapSize を拡げりゃいいんじゃないかな。

989:デフォルトの名無しさん
16/05/24 12:32:54.07 eVw6ZtsBc
>>959
6GB位ですかね

990:デフォルトの名無しさん
16/06/01 19:25:08.39 XXwwXNx4.net
URLﾘﾝｸ(developer.nvidia.com)
>Supported on Windows, Linux and MacOS systems with Pascal, Kepler, Maxwell, Tegra K1 or Tegra X1 GPUs.
のTegra K1の文字を見て、サポート復活を喜んでいたのですが、
Tegra K1は32bitでして、
必要なCUDA7.5は64bit必須
もしかして、cuDNNとCUDAは無関係で独立して使えたりしますか？

991:デフォルトの名無しさん
16/06/03 02:14:25.16 qw00fiPh.net
CUDA APIで１番始めに呼んだAPIは時間がかかるとのことですが、
時間計測に影響が出ないように事前にどんな関数を呼んでますか？
慣習だったり、よく使われる関数があれば教えてください。

992:デフォルトの名無しさん
16/06/04 23:09:31.90 EzTgQ+dX.net
工学じゃなくて物理系でもcuda覚える価値ってある？

993:デフォルトの名無しさん
16/06/04 23:54:08.10 64JgiXiE.net
安く実験したいなら
N体や粒子法なんかは普通のCPUじゃたいしたことはできない

994:デフォルトの名無しさん
16/06/05 01:52:52.19 2/2r2xD9.net
むしろ、科学計算したい人のための技術だと思う

995:デフォルトの名無しさん
16/06/12 02:11:09.53 F98p4y3q.net
他人にも聞こえんの？

996:デフォルトの名無しさん
16/06/12 12:50:48.33 4gtPrZLr.net
この部分がエラー吐くんだが
cuda7.5

struct cuComplex {
float r;
float i;
cuComplex( float a, float b ) : r(a), i(b) {}
__device__ float magnitude2( void ) {
return r * r + i * i;
}
__device__ cuComplex operator*(const cuComplex& a) {
return cuComplex(r*a.r - i*a.i, i*a.r + r*a.i);
}
__device__ cuComplex operator+(const cuComplex& a) {
return cuComplex(r+a.r, i+a.i);
}
};

997:デフォルトの名無しさん
16/06/12 13:24:56.47 MCoM6cvm.net
CUDA by EXAMPLEのサンプル？
<cuComplex.h>の定義とぶつかってるんじゃね？

998:デフォルトの名無しさん
16/06/12 13:39:51.78 4gtPrZLr.net
>>971
そうそう
エラーはこんな感じ

Documents/Visual Studio 2013/Projects/template/cuda_by_example/chapter04/julia_gpu.cu(43): error
: calling a __host__ function("cu_Complex::cu_Complex") from a __device__ function("julia") is not allowed

999:デフォルトの名無しさん
16/06/12 13:50:41.56 MCoM6cvm.net
試してないけど、コンストラクタに__device__付けてないのが悪いと言っているような。

1000:デフォルトの名無しさん
16/06/12 14:09:28.62 4gtPrZLr.net
>>973
ありがとうございます
解決しました

1001:デフォルトの名無しさん
16/06/15 14:42:46.55 d2Xou3GL.net
【GPGPU】くだすれCUDAスレ part8【NVIDIA】
ｽﾚﾘﾝｸ(tech板)

1002:デフォルトの名無しさん
16/06/15 14:44:14.63 d2Xou3GL.net
誤爆

【GPGPU】くだすれCUDAスレ part8【NVIDIA】
ｽﾚﾘﾝｸ(tech板)

1003:デフォルトの名無しさん
16/06/16 14:11:42.71 hLUHI1zp.net
615 ：名前は開発中のものです。：02/06/10 21:48 ID:???
>将来的にはスカートの頂点を触ってヒラヒラさせたりしたいので、どうせシステムメモリーに
ボーンでやる気なのか？つらそー。

616 ：◆CKmHzWpc：02/06/11 03:48 ID:zXaLQtp.
みなさんありがとうございます
１．モデルを分割するのが嫌→頂点シェーダ－を使うorシステムメモリに置いてソフトでやる
２．モデルを分割してもいい→ハードのジオメトリブレンドを使ってやる・・
というのが考えられる・・・んですよね
色々組み合わせを試して、高速なのを選びたいと思います

>>627
これは、スカートの頂点をCPUで直接操作しようと思っています
ボーンでやらずに、簡単なクロスシュミレーションのような事を目指しています
どうせモデルの一部をシステムメモリに置くなら、もう全部システムメモリにし
てもいいか、と思ったのです

1004:デフォルトの名無しさん
16/07/08 23:35:06.27 6MyfUlG7/
>>958
CUDAじゃなくてFortranでの問題かもしれんね
mcmodelオプションかなあ
しかし1変数に6GBとかちょっと信じがたい

1005:デフォルトの名無しさん
16/07/20 14:03:52.95 S0wpPWZM.net
tess

1006:デフォルトの名無しさん
16/09/02 13:17:38.94 W3BuWeJb.net
erlangならね

1007:デフォルトの名無しさん
16/09/06 19:38:14.96 MfZbc6Jb.net
まだ埋まってなかった

1008:デフォルトの名無しさん
16/10/03 10:11:13.82 1bWakqV9.net
pascal titan xでcudaを動かしている人に質問�

1009:ﾅすが高負荷時にクロックダウンは起きませんか

1010:デフォルトの名無しさん
17/02/11 05:41:42.45 GCRxMqXs.net
埋め

1011:デフォルトの名無しさん
17/03/01 20:35:36.75 G4g91z/5.net
は最多か

1012:デフォルトの名無しさん
17/03/03 13:35:21.41 nBceVUOh.net
サクラ

1013:デフォルトの名無しさん
17/03/03 14:59:54.92 GURukhR9.net
浜田

1014:デフォルトの名無しさん
17/03/06 16:46:29.52 7tw9lmnR.net
かいな

1015:デフォルトの名無しさん
17/05/07 11:40:19.10 ehHyxLGM.net
a.exe: a.cu
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe

ウインドーズでメイクファイルで上みたいにやってクダーCコンパイラーでコンパイルしたんですけど
コマンドラインにちゃんと
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe
と表示されたあと
wd
4819
c1xx: fatal error C1083: ソースファイルを開けません。'略':No such file or directory
a.cu
c1xx: fatal error C1083: ソースファイルを開けません。'4819':No such file or directory
と出ます。たぶん"に囲まれた中の/がメタ文字じゃないのになぜか消されているとおもうんですけど
なぜエラーになるのか教えてください。
/を//あるいは-に置き換えたらちゃんとコンパイルできました
よろしくお願いします。
" /wd 4819"と"と/の間にスペースを入れても出来ました。

1016:デフォルトの名無しさん
17/05/07 11:42:54.14 ehHyxLGM.net
＞＞９７３
は新スレに移行しました

1017:デフォルトの名無しさん
17/10/21 21:44:51.57 ch8ppFz8.net
975

1018:デフォルトの名無しさん
17/10/21 21:45:16.89 ch8ppFz8.net
976

1019:デフォルトの名無しさん
17/10/21 21:45:35.47 ch8ppFz8.net
977

1020:デフォルトの名無しさん
17/10/21 21:46:09.62 ch8ppFz8.net
978

1021:デフォルトの名無しさん
17/10/21 21:46:43.41 ch8ppFz8.net
979

1022:デフォルトの名無しさん
17/10/21 21:47:04.64 ch8ppFz8.net
980

1023:デフォルトの名無しさん
17/10/21 21:47:23.30 ch8ppFz8.net
981

1024:デフォルトの名無しさん
17/10/21 21:47:46.15 ch8ppFz8.net
982

1025:デフォルトの名無しさん
17/10/21 21:48:12.14 ch8ppFz8.net
983

1026:デフォルトの名無しさん
17/10/21 21:48:31.31 ch8ppFz8.net
984

1027:デフォルトの名無しさん
17/10/21 21:48:48.87 ch8ppFz8.net
985

1028:デフォルトの名無しさん
17/10/21 21:49:04.73 ch8ppFz8.net
986

1029:デフォルトの名無しさん
17/10/21 21:49:28.95 ch8ppFz8.net
987

1030:デフォルトの名無しさん
17/10/21 21:49:46.87 ch8ppFz8.net
988

1031:デフォルトの名無しさん
17/10/21 21:50:13.50 ch8ppFz8.net
989

1032:デフォルトの名無しさん
17/10/21 21:51:07.97 ch8ppFz8.net
990

1033:デフォルトの名無しさん
17/10/21 21:51:27.98 ch8ppFz8.net
991

1034:デフォルトの名無しさん
17/10/21 21:51:48.54 ch8ppFz8.net
992

1035:デフォルトの名無しさん
17/10/21 21:52:08.22 ch8ppFz8.net
993

1036:デフォルトの名無しさん
17/10/21 21:52:26.37 ch8ppFz8.net
994

1037:デフォルトの名無しさん
17/10/21 21:52:42.66 ch8ppFz8.net
995

1038:デフォルトの名無しさん
17/10/21 21:53:11.93 ch8ppFz8.net
996

1039:デフォルトの名無しさん
17/10/21 21:53:27.63 ch8ppFz8.net
997

1040:デフォルトの名無しさん
17/10/21 21:53:44.96 ch8ppFz8.net
998

1041:デフォルトの名無しさん
17/10/21 21:54:02.51 ch8ppFz8.net
999

1042:デフォルトの名無しさん
17/10/21 21:54:28.40 ch8ppFz8.net
1000

1043:1001
Over 1000 Thread.net
このスレッドは１０００を超えました。
新しいスレッドを立ててください。
life time: 1065日 22時間 39分 42秒

1044:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています