【GPGPU】くだすれCUDAスレ part7【NVIDIA】

【GPGPU】くだすれCUDAスレ part7【NVIDIA】at TECH

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 - 暇つぶし2ch353:,,・´∀｀・,,）っ-○○○
16/02/03 22:25:59.26 gpz71jEo.net
TeslaでもXeon Phiでもなく一般ピープル向けGPUに倍精度性能が必要だって言ってるのは
ろくに科研費申請が通らない貧乏研究室くらいでしょ

354:デフォルトの名無しさん
16/02/04 13:10:48.29 lq8BoEbf.net
>>344
お前が使い方を知らないだけ

355:デフォルトの名無しさん
16/02/04 13:11:30.26 lq8BoEbf.net
>>344
お前は半精度だけで十分

356:デフォルトの名無しさん
16/02/04 18:29:53.21 TT5D/Cpx.net
Maxwellは擬似的な倍精度も出来ないんだよ
それくらいしっておこうな

357:デフォルトの名無しさん
16/02/04 20:00:25.29 o+ucOEnp.net
単精度と比べると凄い遅いだけで
倍精度演算自体はハードで実装している。
物凄い遅いといっても1/32で1/16のradeon furyと比べると半分だから大差ないと言えば無い。

358:デフォルトの名無しさん
16/02/04 20:13:21.23 d8M6zG1u.net
Maxwellは倍精度の演算器が排除されただけで疑似倍精度は実装されている
そもそもソフトレベルでも実装できることだし

359:デフォルトの名無しさん
16/02/04 20:15:36.92 TT5D/Cpx.net
FURYはMaxwellを参考にしてるからな
HBMの容量の少なさが祟って何じゃこりゃ状態だったけど、Polarisは一層Maxwell類似のワッパ路線がとられる
これでNVはもう倍精度を完全に捨てにかかる

360:,,・´∀｀・,,）っ-○○○
16/02/04 23:21:52.01 zdF89aL0.net
いや実際半精度が4倍速いほうが使いどころあると思うよ
ゲームで倍精度なんて使わないじゃん

361:デフォルトの名無しさん
16/02/04 23:28:29.99 3r7tJtQx.net
深層学習がはやったらＧＰＧＰＵももっと市民権を得るかな？

362:デフォルトの名無しさん
16/02/05 00:42:53.10 TcXSJNY1.net
半精度を4倍速くしたら半精度専用になるな
そんなもの売れないぞ

363:デフォルトの名無しさん
16/02/05 01:21:13.26 p946S2WD

364:.net

365:デフォルトの名無しさん
16/02/05 04:09:45.89 iPwofUfz.net
倍精度を高速化したらどれだけ売り上げが見込めるのかをnvに分かるように説明したら。
>>353
頂点シェーダは単精度が必要でも、実行時間のかなりがフラグメントシェーダなんだから、別に半精度専用になって売れないとはならないだろう。

住みわけがある訳だろ。で、倍精度頑張ったのは期待の売り上げが出なかったわけだろ多分。
願望を語るスレであるより、アリモノでなんとかするスレであった方が建設的だと思うがね。

366:デフォルトの名無しさん
16/02/05 07:52:28.94 X6eE9Wue.net
すまんがゲーマーは帰ってくれないか？

367:デフォルトの名無しさん
16/02/05 08:26:49.67 23YXKvG1.net
なぜ団子がここにいる？
まあ、CUDAもかなり広く使われてくるようになったから、
数値演算の枠組みだけじゃなくなってきているのはわかるが。

368:デフォルトの名無しさん
16/02/05 08:45:35.15 bTIbnCX4.net
いやこのひとはかなり初期からCUDAつかってるの
それこそnvにgeforceくれてやるからCUDA使ってちょって
誘われるような時代から

369:デフォルトの名無しさん
16/02/05 08:50:46.42 KXdvQQGq.net
1スレ目に三色団子おるな

370:デフォルトの名無しさん
16/02/05 12:16:48.26 bTIbnCX4.net
URLﾘﾝｸ(techon.nikkeibp.co.jp)
CNN専用チップ、NVIDIAなどがGPUの改良で開発
URLﾘﾝｸ(techon.nikkeibp.co.jp)
Eyerissは、グラフィックス処理プロセッサー（GPU）と同様、SIMD（single instruction multiple data）などから成る
プロセッサー・エレメント（PE）を多数集積したICである。
ただし、GPUとはデータの移動を最小限に抑えた設計にした点が異なる。
具体的には、EyerissはSRAMから成るオンチップメモリー108Kバイトを備えており、
CNNの各層の演算結果をオンチップメモリーにバッファリングさせることで、
チップ外の主記憶に書き戻す頻度を大きく減らした。
また、PEに入力するデータ列に共通部分がある場合は、その共通部分を保持して差分だけを入力する。
さらに、複数のPEに同じデータを入力する場合は、各PEにそれぞれ送るのではなく、
途中まで1つのデータとして送り、そこからPEの個数分データをコピーして入力する。いわゆるマルチキャストである。
これらによって、データ処理時のデータの移動を最小限に抑え、消費電力を大幅に低減した。
加えて、データを主記憶に書き戻す時は圧縮し、読み出す時に伸長する。
CNNの畳み込み演算後のデータはフィルターを通すことで圧縮しやすい形になっていて、メモリー帯域の節約効果が高いという。
　作製したEyerissの動作をNVIDIA社のGPU「TK1」と比較すると、
EyerissはデータのスループットこそTK1の約1/2だったが、消費電力はTK1の最小約1/37と大幅に低い。
主記憶に出し入れしたデータの帯域も、TK1の1120Mバイト/秒に対し、Eyerissは127Mバイト/秒だったとする。

371:デフォルトの名無しさん
16/02/05 12:55:11.71 p946S2WD.net
>>358
だからお前はインテルスレに帰れっつってんだろ団子！

372:デフォルトの名無しさん
16/02/05 13:02:33.01 bTIbnCX4.net
また病気か

373:デフォルトの名無しさん
16/02/05 13:44:39.13 p946S2WD.net
>>362
倍精度イラネ、ここは管スレだぞ！と言ってたのはお前だったのか、団子！

374:デフォルトの名無しさん

375:sage
団子ってなに？

376:デフォルトの名無しさん
16/02/05 14:36:57.91 3a93fntK.net
どうもこのスレには
CUDAをマシに使っている奴は
いないようにみえるな
ひたすらベンチマークしかやってない感じね

377:デフォルトの名無しさん
16/02/05 16:33:49.39 3vmCyKKd.net
倍精度よりコンテキスト処理の自由化をだな
Oculasからも苦言言われてるのに

378:デフォルトの名無しさん
16/02/05 16:34:59.76 3vmCyKKd.net
バックグラウンド処理が作りにくいからこそ、Asyncやプログラマブルコンテキストは次のGPUでは絶対に搭載してほしい

379:デフォルトの名無しさん
16/02/05 16:48:34.33 bTIbnCX4.net
ほとんど関係ない
URLﾘﾝｸ(www.tomshardware.com)

380:デフォルトの名無しさん
16/02/05 23:50:50.50 TcXSJNY1.net
はやく4倍精度のせろ！

381:デフォルトの名無しさん
16/02/06 12:36:05.76 pRi/vsC+.net
それをPEZYに言ってくれ

382:デフォルトの名無しさん
16/02/06 18:18:06.14 xHoLN9eE.net
お前その会社好きだな
一般向けに売ってもいないのに

383:デフォルトの名無しさん
16/02/06 20:15:07.20 pRi/vsC+.net
PEZY以外に応じてくれないぞ

384:デフォルトの名無しさん
16/02/06 20:47:57.74 xHoLN9eE.net
それでそこの製品は使ってるのか？

385:デフォルトの名無しさん
16/02/08 05:05:55.45 z0FWqNRt.net
いい加減にないものねだりはやめろ。

386:,,・´∀｀・,,）っ-○○○
16/02/08 22:05:16.73 ZbGdhM32.net
「Teslaを一桁安値で買わせろ」みたいなのは論外だろ
ゲーマーと倍精度が欲しい人は市場が全くかみ合わない
そんなのもう結論出てるだろ

387:,,・´∀｀・,,）っ-○○○
16/02/08 22:24:56.08 lyi6FC/t.net
もともとTeslaとQuadro/GeForceはECCの有無で差別化してたが
世界最大級のGPGPUスパコンがNonECCで使ってるので
全く差別化になってない
だから倍精度演算器を物理的に廃することでの差別化を行った
それだけ。
Tesla買えばいいだけだろ？
どうせ予算通らないから買えないだけだろ
ろくな論文も出せない底辺大学の研究室あたりがいいご身分だな

388:デフォルトの名無しさん
16/02/09 00:34:13.76 LI1PJjMq.net
>世界最大級のGPGPUスパコンがNonECCで使ってる
これについて詳しく。

389:デフォルトの名無しさん
16/02/09 13:10:44.06 i8FfOnoz.net
>>376
あなたはどこの大学ですか？

390:デフォルトの名無しさん
16/02/09 14:10:52.05 rPxo0Z4x.net
最初は影でこそこそディープディープ言ってて倍精度いらない、管スレでゲームコンソールを巡る政治的な思惑が
NVの倍精度切りに繋がった事実もスレチガイだ馬鹿野郎！って煽ってたのにな
流れが悪くなったのでコテの正体を出したんだろう
多分Async煽りも正体はこいつだ
ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに
本当に陰険だね、団子は

391:デフォルトの名無しさん
16/02/09 17:12:26.87 CgzlKX4i.net
そこそこの分解能ならTeslaやTitanで十分だろ

392:デフォルトの名無しさん
16/02/09 17:14:02.43 uHp67F+7.net
べつにphiでも使えばいいだけだが
teslaとphiの混合機も普通にあるし
とりあえずamdという選択肢は皆無

393:デフォルトの名無しさん
16/02/09 17:32:39.26 i8FfOnoz.net
登場かな

394:デフォルトの名無しさん
16/02/09 18:40:55.41 OHQNRB+7.net
nvは高校生や高専向けのセミナーもやってるし
ことしのgtcもセッション数は500超える
やってきたことの重みが違いすぎる

395:デフォルトの名無しさん
16/02/09 19:05:34.27 Z0SOCsIU.net
でも他GPUでは使えないんでしょ？ってのが重すぎる
GPGPUはnvidiaの私物ではない

396:デフォルトの名無しさん
16/02/09 19:07:27.62 dBPqK+gq.net
まともな研究機関ならTeslaは学割使えるんだが…
GeForceで倍精度が必要な理由なんてほんと世間知らずの戯言だな

397:デフォルトの名無しさん
16/02/09 19:15:52.47 CgzlKX4i.net
>>384
黎明期はデファクトスタンダードの取り合いだから当然の流れ

398:デフォルトの名無しさん
16/02/09 19:20:58.08 OHQNRB+7.net
>>384
よそが勝手に投げ出しただけじゃん

399:デフォルトの名無しさん
16/02/09 19:27:05.49 C4h+tGmi.net
>>384
言ってることが頓珍漢過ぎる
嫌ならopenCL使えばいいじゃん？

400:デフォルトの名無しさん
16/02/09 19:32:42.77 OHQNRB+7.net
dlといえばmitとnvが共同開発したeyerissはflotじゃなくfixedだったな
データ移動を極力控えた構造でcnnの場合データの再利用性が高いので
peからpeへの受け渡しが有効なのだとか
それでもエネルギーコストは
aluからレジスタファイルへの場合を１とすると
peへは3
内部のバッファーへは10
外部dramへは500のエネルギーコストがかかるんだそうな

401:デフォルトの名無しさん
16/02/09 20:43:41.18 YFSBhYG5.net
>ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに
言うことがバカすぎて吹いた
まともな法人はこのスレに社運なんてかけませんから
Tesla相当の性能をGeForceにも実装しろという
悪質クレーマーを客だと思わない権利は
NVIDIAにもあるだろjk

402:デフォルトの名無しさん
16/02/09 21:14:42.66 q4H41fNH.net
米エネルギー省の評価ソフトがほとんど単精度で
倍精度使うのがlinpackしかいという

403:デフォルトの名無しさん
16/02/09 21:20:54.23 IR1D3KHq.net
単精度じゃ足りないけど倍精度なら十分って領域は実は少ない。
単精度用演算器に少量の精度を追加して倍精度を1/4の速度でやるのが一番利に叶っている。
まあこれすら普及帯ではけちられて1/16になるのが倍精度の立ち位置
倍精度用の演算器積むくらいだったら単精度の演算器で可能なbit数で複数組み合わせると簡単に多倍長精度演算を実現できるような命令を用意してくれた方がよっぽどありがたい。

404:デフォルトの名無しさん
16/02/09 21:34:25.12 DH+vdKhf.net
>ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに
糞ワロタwww
このスレすごいんだな

405:,,・´∀｀・,,）っ-○○○
16/02/09 21:47:11.85 SI3uOwiZ.net
どっかのバKaveriは512SPで倍精度50GFLOPS未満
CPU1コアより遅いんだが

406:デフォルトの名無しさん
16/02/09 22:14:14.05 5ErhaZ8p.net
今日は団子がいっぱいいるなあ

407:デフォルトの名無しさん
16/02/10 00:25:10.96 u83LBvNZ.net
倍精度が高ければ許される
倍精度が低ければ、メモリが多くてもメモリ幅が多くても消費電力が低くても許されない

408:デフォルトの名無しさん
16/02/10 00:37:19.11 ZwcaN/9X.net
団子分身の術か
もうここもワッチョイの時期かね？

409:デフォルトの名無しさん
16/02/10 00:56:31.15 pL5WuRkY.net
だから団子ってなんだよ？

410:デフォルトの名無しさん
16/02/10 01:41:12.63 JsTfqJoq.net
団子は団子。

411:デフォルトの名無しさん
16/02/10 02:29:40.13 FSPq21yA.net
amd信者っていう精神病患ってるよな

412:,,・´∀｀・,,）っ-○○○
16/02/10 08:25:30.16 gHO8h5ZQ.net
倍精度ハードフル実装マンセー
↓
トランジスタが増える
↓
ウエハ1枚あたりのチップ採れる数が減る（&歩止まり率も減る）
↓
製造コスト上がる
↓
(,,・´∀｀・,,)

413:デフォルトの名無しさん
16/02/10 08:35:12.26 IPR+3W8l.net
倍精度の話しないと死んじゃう人は点呼取ってくれる？
「倍精度でCUDA」スレと、「実在のGPUでCUDA」スレに分けた方がいいよね、多分。

414:デフォルトの名無しさん
16/02/10 08:39:26.22 5rSlusQ0.net
バカはhello worldから始めなさい

415:,,・´∀｀・,,）っ-○○○
16/02/10 08:48:59.74 gHO8h5ZQ.net
件の赤い会社が帳簿の赤も解消しないのは、市場価格に対して製造原価が高すぎるからだよ
会社を潰れかけの状態にしてまで実装コストの高い倍精度ハードを実装するのは模範的な企業とは思えんがねえ
QuadroとTeslaのブランドが分かれてないようなもんだ

416:デフォルトの名無しさん
16/02/10 08:57:23.58 5rSlusQ0.net
まぁDLのおかげでteslaでも倍精度無しのものもあるけどね
ただ今後、DLはEyerissの方向で行きそうなんで
完全にDLは別ラインの製品でいくのか
GPU自体がEyerissの発展形になるか
GPUのデータ移動減らすとかレジスタファイルの階層化って研究はしてるようだけど

417:デフォルトの名無しさん
16/02/10 12:31:36.49 zvpoME6O.net
何とか倍精度不要論に持っていこうと必死な団子でした

418:,,・´∀｀・,,）っ-○○○
16/02/10 12:36:21.64 qcpMLBSZ.net
アホがいるね
特定のアプリケーションに特化して結果的に倍精度性能落とした製品は、その目的の用途から外れなきゃ何の問題もねーじゃん
ディープラーニングにもゲームにも倍精度の性能は必要ないから
倍精度が必要な用途にはK80やその後継あるいはPhiを買えばいい
科学技術演算用に設計されてないGPUに倍精度が必要だとかいうのはただのデムパ

419:デフォルトの名無しさん
16/02/10 13:03:35.72 VS1+7AWR.net
>>402
団子だけ隔離出来れば良い

420:,,・´∀｀・,,）っ-○○○
16/02/10 23:12:49.82 7x9wHVqL.net
>>405
Teslaの単精度特化版は1スロット版のK8ならそうだけどK10なら発表は2012年で
ディープラーニング言い出す前の話
ダイ本体はGTX600番台そのものだからそれ専用に設計されてるわけではないしね

EyerissがよくわらんのだけどROPやテクスチャユニットも削ってるわけ？

421:デフォルトの名無しさん
16/02/10 23:48:08.15 pL5WuRkY.net
ここだけの話
K10はシェールガス探査特化モデルだよ

422:,,・´∀｀・,,）っ-○○○
16/02/10 23:52:02.41 7x9wHVqL.net
倍精度推しの池沼君がどんな世の中の役に立つソフト作ってて
LINPACKベンチ以外なんの実務に役立ってるのかは興味あるね

423:デフォルトの名無しさん
16/02/11 03:51:57.10 Q8jkKaXt.net
eyerissはgpuじゃなくdl専用

424:デフォルトの名無しさん
16/02/11 09:23:41.72 pqlF/R5A.net
団子は倍精度に親でも殺されたか？

425:デフォルトの名無しさん
16/02/11 09:24:20.60 pqlF/R5A.net
豚に真珠
団子に倍精度

426:,,・´∀｀・,,）っ-○○○
16/02/11 09:27:55.02 qHP8+I1C.net
>>411に答えてね

427:,,・´∀｀・,,）っ-○○○
16/02/11 09:37:09.50 qHP8+I1C.net
俺は必要だっていう人の言い分は理解してるし
それに合わせたチップを選べばいいと思うのだけどね
倍精度ハードウェアがTeslaはともかく一般消費者向けのGeForceに
載らないといけない理由はない
一般消費者が倍精度のスループットを見てGPUを選ぶトレンドを作りたいなら
まずてめえが倍精度載せる価値のあるソフト作って示せばいい

428:デフォルトの名無しさん
16/02/11 13:14:12.26 Dgt4YBtM.net
科学技術演算に倍精度は必要不可欠
はい論破完了
簡単だったね

429:デフォルトの名無しさん
16/02/11 13:23:19.60 U2ZcAFvs.net
へー
それって
一般消費者向けの
GeForceに？

430:,,・´∀｀・,,）っ-○○○
16/02/11 13:27:04.20 yn/CS7EG.net
一般消費者が科学技術計算する必要あることがまったく示せていない

431:デフォルトの名無しさん
16/02/11 13:28:21.16 pqlF/R5A.net
豚に真珠
団子に倍精度

432:デフォルトの名無しさん
16/02/11 13:35:33.57 U2ZcAFvs.net
あたまわるそう

433:デフォルトの名無しさん
16/02/11 13:37:15.86 Dgt4YBtM.net
ここは何スレだったっけ？
単発団子よ

434:デフォルトの名無しさん
16/02/11 13:39:04.93 U2ZcAFvs.net
また病気か？

435:,,・´∀｀・,,）っ-○○○
16/02/11 13:42:27.10 yn/CS7EG.net
TSMCのウェハ価格体系的に用途別に倍精度が削れる用途向けには削ったほうが
コストダウンになるからそうするでしょうよ
Maxwell世代のTeslaがないのは大型スパコン案件もないからっての大きいと思う

436:,,・´∀｀・,,）っ-○○○
16/02/11 13:45:25.92 yn/CS7EG.net
>>422
お前理解してないから出てけよ

437:デフォルトの名無しさん
16/02/11 13:47:41.45 U2ZcAFvs.net
Tesla M40「・・・」
Teala M4 「・・・」

438:,,・´∀｀・,,）っ-○○○
16/02/11 13:56:21.86 yn/CS7EG.net
すまん、倍精度版ね

439:デフォルトの名無しさん
16/02/11 15:18:50.25 FNR4nKd2.net
今年の流行語大賞は売精奴

440:デフォルトの名無しさん
16/02/11 17:25:56.22 R5nKPKgb.net
普通に考えて一般向けGPUに倍精度はいらないよな
32bitと16bit浮動小数点しか使わねーよ
それでも贅沢なぐらい

441:デフォルトの名無しさん
16/02/11 18:10:05.08 0bpwaMQp.net
ほんとそれ
一般向けとしてはオーバースペックなくらい

442:デフォルトの名無しさん
16/02/11 18:51:28.54 pqlF/R5A.net
団子がいっぱい

443:デフォルトの名無しさん
16/02/11 20:13:55.90 Dgt4YBtM.net
駄目だ、団子の性でここも腐ってきた

444:,,・´∀｀・,,）っ-○○○
16/02/11 21:01:08.64 yn/CS7EG.net
だからお前の発言のどこが論破なんだよ
論理破綻の略か？

445:デフォルトの名無しさん
16/02/12 02:22:44.00 m8Kq2x0U.net
シールズ脳

446:デフォルトの名無しさん
16/02/12 13:14:15.71 10CGBYPs.net
ここがCUDAスレだと何度言えば分かるんだ！団子
科学技術演算も出来ないGPUじゃ話にならんわ

447:デフォルトの名無しさん
16/02/12 17:49:19.72 igghQz0I.net
まあ、倍精度じゃないと、イタレーティブソルバーは収束しないわな。4倍精度ぐらいあれは、CG法で反復回数が極端に減るかもね。

448:デフォルトの名無しさん
16/02/12 20:54:47.44 okDGKGY+.net
売性奴

449:デフォルトの名無しさん
16/02/12 21:37:49.48 ws+NUeAo.net
風俗業みたいな書き方だな

450:デフォルトの名無しさん
16/02/12 22:41:27.77 10CGBYPs.net
今日の重力波観測にしたってあれは、理論屋が出したシミュレーションに従ってそれと同じデータを観測したわけだろ
そういうのが単精度/半精度で出せるわけねーだろ

451:デフォルトの名無しさん
16/02/12 22:42:28.23 okDGKGY+.net
じゃあ倍精度使ってんの？

452:デフォルトの名無しさん
16/02/12 22:42:32.12 7+E8+eHE.net
100倍精度くらいいるな

453:デフォルトの名無しさん
16/02/12 22:43:21.37 7+E8+eHE.net
倍精度なんて普通に使う
水や空気のように

454:デフォルトの名無しさん
16/02/13 00:10:37.29 KZpZDJLQ.net
ただし、グラフィックスには要らない

455:デフォルトの名無しさん
16/02/13 00:16:44.75 X+VeUhDc.net
①No double precision, no life.
②Double precision make me happy.

456:デフォルトの名無しさん
16/02/13 00:47:18.16 vQuqpgIG.net
ここではMaxwellやPascalはおよびじゃない

457:デフォルトの名無しさん
16/02/13 00:48:53.57 dx+PFg0T.net
CUDAをなんのために使うかだよなあ。
グラフィックスだけならOPENGLだけでええんのとちゃうか？

458:デフォルトの名無しさん
16/02/13 00:54:32.58 LMFsV4x8.net
>>439
だったら何
そんなのはGPUであつかう問題じゃないから

459:デフォルトの名無しさん
16/02/13 01:59:47.65 KZpZDJLQ.net
GPUはグラフィックスを扱うのが本分なので
一般向けGPUは倍精度無しでも文句は言えない

460:デフォルトの名無しさん
16/02/13 05:22:35.21 zAv3sSPP.net
BSD!　BSD!　BSD!

461:デフォルトの名無しさん
16/02/13 11:28:45.10 EDACvSC3.net
>>448
お前の文句なんかどうでもいい
GPGPUってのはこういうことのために使うんだぜ！？団子
-----------------------------------------------------------------------
645 : 名無しのひみつ＠転載は禁止2016/02/12(金) 22:56:12.20 ID:oUDSwd87
>>626
別に2ちゃんだから適当に幾らでも変なことでも聞いていいんじゃね？
人間の頭で考えないと絶対にダメな部分が最も大きい
相対論も標準理論も量子力学も計算機だけでは絶対無理
計算機が答を出すというより、計算機は望遠鏡とか温度計のような「測定器の一種」という感覚が近いと思う
GPGPUは使いまくってるはずだけど、半ば問題に特化して設計するスパコンもあり
スパコンに関してはそれ自体がすごいというより、スパコン目当てに優秀な人が集まる効果のほうが大事という気がする、2020年のオリンピックみたいにスパコンという祭りに人が集まるから、良い方にも悪い方にも転ぶだろう
646 : 名無しのひみつ＠転載は禁止2016/02/12(金) 22:57:56.72 ID:eXgf7vm3

462:デフォルトの名無しさん
16/02/13 12:08:27.34 c+BFT1nX.net
いろいろ探して結局コピペ

463:デフォルトの名無しさん
16/02/13 13:38:06.14 LMFsV4x8.net
結局何が言いたいの？
理想のものが欲しければ自分が計算機設計の専門家になればいいじゃん
手遅れかもしれないけど

464:,,・´∀｀・,,）っ-○○○
16/02/13 14:55:58.29 dwcfM3wy.net
自然言語処理や画像認識、いま産学連携で資金集まってるのはこういう分野
データサイエンス分野は文系の学者さんも研究に参画してるし応用範囲広いんだよね
何の金にもならない倍精度行列積で1位じゃないとダメなんですか？とかホントどうでもいい話

465:,,・´∀｀・,,）っ-○○○
16/02/13 15:03:24.00 dwcfM3wy.net
スパコンに倍精度演算性能が必要なのは誰も否定してないじゃん
個人のゲームやお絵かき用のパソコンにそれが必要かという話であって。
コピペで代弁してもらったつもりになってるのかもしれないけど
実質的に何の主張にもなってないわけよ

466:デフォルトの名無しさん
16/02/13 17:16:53.26 EDACvSC3.net
>>454
＞個人のゲームやお絵かき用のパソコンにそれが必要かという話であって。
ホントここが何スレか分かってない池沼
Async煽りをしてた団子が攻守入れ替わるとこれだからな

467:デフォルトの名無しさん
16/02/13 17:49:57.42 pMfjul4g.net
GPUとGPGPUの区別もつかないのか？

468:,,・´∀｀・,,）っ-○○○
16/02/13 18:00:36.66 dwcfM3wy.net
> Async煽りをしてた団子が攻守入れ替わるとこれだからな
それこそお前の妄想じゃん
RadeonのGPGPUプログラミングの話をしたいなら超過疎のHSAスレへ

469:,,・´∀｀・,,）っ-○○○
16/02/13 18:03:11.84 dwcfM3wy.net
> GPGPUは使いまくってるはずだけど、半ば問題に特化して設計するスパコンもあり
って引用しつつ、倍精度性能が不要な用途に特化する意義は認めないんだね

470:,,・´∀｀・,,）っ-○○○
16/02/13 18:11:06.88 dwcfM3wy.net
ついでに攻められてるのがどっちなのかすら理解してない

471:デフォルトの名無しさん
16/02/13 18:14:06.59 vpwmEJlM.net
団子消えろ邪魔

472:デフォルトの名無しさん
16/02/13 18:17:25.51 vpwmEJlM.net
GPの意味わかるか？

473:,,・´∀｀・,,）っ-○○○
16/02/13 18:25:02.18 dwcfM3wy.net
>>439の言ってるLIGOのリサーチに協力したのはうんこFireProではなくXeon Phiなんだよね
URLﾘﾝｸ(www.hpcwire.com)
重力演算は1格子点あたり小数点以下3桁程度の精度があれば十分といわれる分野
Stampedeに載ってるKNCは除算ユニットは遅く逆数・逆数平方根命令の
有効桁は14ビットだ。
まあこんだけあればニュートン法すら要らないわけよ。
倍精度で分解能を上げて遅い倍精度に単精度（実効精度14ビット）で格子点を
大量に捌くほうがより正しいシミュレーションができる。
ニュートン法不要ってのはﾆﾀﾄﾞﾘ=ｻﾝの受け売りだが

474:,,・´∀｀・,,）っ-○○○
16/02/13 18:42:17.05 dwcfM3wy.net
14ビットは間違い。SkylakeXeonで使えるAVX-512Fのほうだね。
KNCのrcp23ps/rsqrt23psのスループットは23ビット。
つまり単精度の除算は乗算1回との合計2ステップで割り切りなしの十分な精度が得られる

475:デフォルトの名無しさん
16/02/13 18:45:56.87 vpwmEJlM.net
スレ違い

476:,,・´∀｀・,,）っ-○○○
16/02/13 18:48:25.54 dwcfM3wy.net
倍精度必要論が否定されるから都合が悪いだけだろう？
重力演算のために長崎大がGeForce買いあさって作った激安スパコンだって
単精度特化仕様だったよ？
これもﾆﾀﾄﾞﾘ=ｻﾝが協力している。古事記にも書いてある。

477:,,・´∀｀・,,）っ-○○○
16/02/13 19:06:49.99 dwcfM3wy.net
ゴードンベル賞で2度の受賞を経験したﾆﾀﾄﾞﾘ=ｻﾝをして
天文学分野のシミュレーションは半精度程度の分解能があれば十分だって言ってるんだよ

478:デフォルトの名無しさん
16/02/13 19:49:28.20 LMFsV4x8.net
でもGRAPEは6倍精度実装してるじゃん
天文学と一纏めにしてるけど連星とかブラックホールが近接するような場合は高い精度が要求されるよね
逆に宇宙の大規模構造とかだと桁増やすより分解能上げた方が精度上がるのかもしれないけど

479:,,・´∀｀・,,）っ-○○○
16/02/13 19:57:12.93 dwcfM3wy.net
否定しない。
いずれにしてもどれも個人のパソコンに必要な要件ではない。
個人のパソコンのパーツを組み合わせて大規模演算ができるのはコストメリット的に重要だけど
個人のパソコンに倍精度が必要な理由の説明としては本末転倒です

480:デフォルトの名無しさん
16/02/13 21:14:52.93 EE+8Wdg+.net
結局自分じゃ使えもしないのに
倍精度倍精度連呼してるのが滑稽だってこった

481:デフォルトの名無しさん
16/02/14 00:27:03.46 cgGYXXdh.net
スレタイも読めないアホ

482:,,・´∀｀・,,）っ-○○○
16/02/14 00:51:54.56 QIqkGWdy.net
スレタイに即した話題振ってくれよ

483:デフォルトの名無しさん
16/02/14 00:57:10.67 cgGYXXdh.net
お前が消えたらな

484:,,・´∀｀・,,）っ-○○○
16/02/14 00:57:39.60 QIqkGWdy.net
お前が行くべきスレ（HSAスレ）に行けば平和になるよ

485:デフォルトの名無しさん
16/02/14 01:39:56.33 lXFnYTTq.net
AMDな人が来てCUDAの話無・CUDA使っていない奴の雑談スレになったな
AMDのGPGPUスレ過疎すぎでこっちにきたんだろうが

486:,,・´∀｀・,,）っ-○○○
16/02/14 02:02:42.36 vcWFNaoW.net
そもそも初代CUDAの時期に倍精度なんてサポートされてなかったし
メインストリームのGeForceが倍精度強かった時代なんて一度もないのに
いつから馬鹿の一つ覚えの倍精度連呼が始まったやら

487:デフォルトの名無しさん
16/02/14 07:18:27.73 feLPD2f/.net
豚に真珠
団子に倍精度

488:,,・´∀｀・,,）っ-○○○
16/02/14 09:14:03.10 vcWFNaoW.net
>>476の名前は団子っていうそうです

489:デフォルトの名無しさん
16/02/14 09:20:16.22 SumOf5e2.net
団子がいっぱい

490:デフォルトの名無しさん
16/02/14 15:01:21.31 LdUYpatK.net
そもそもCUDAは科学技術演算を必要とする人のスレなのにな
いつの間にか糞団子はゲームに必要かどうかに論点をすり替え

491:,,・´∀｀・,,）っ-○○○
16/02/14 16:23:41.37 vcWFNaoW.net
> そもそもCUDAは科学技術演算を必要とする人のスレなのにな
意味が分からない

492:,,・´∀｀・,,）っ-○○○
16/02/14 16:26:10.17 vcWFNaoW.net
CUDAでハローワールドも書けないレベルのnoobが気取ってみても
頭の悪さは隠せないよ

493:デフォルトの名無しさん
16/02/14 16:42:03.99 k6vnuBvm.net
cudaで今nvidia的にイチオシの用途がdlで、half性能が効いてくるという奴じゃないの？

494:デフォルトの名無しさん
16/02/14 16:58:17.35 MYivShEO.net
と言うよりGPGPU自体がDLバブルに乗っかってるからな
ボリュームゾーンに合わせた製品仕様になるのは当然の流れ

495:,,・´∀｀・,,）っ-○○○
16/02/14 17:32:35.33 vcWFNaoW.net
ﾊﾞｲｾｲﾄﾞﾏﾝｾｰ「俺がボリュームゾーンだ！俺のためのGPUを作れ！」

496:,,・´∀｀・,,）っ-○○○
16/02/14 17:54:26.87 vcWFNaoW.net
DOE案件みたいな大口需要があるときだけ倍精度特化版作って
それ以外は民間需要重視でいくってのは間違いじゃないと思うよ
次のDOE案件はVoltaだ
逆に言うとそれまでは倍精度特化版は出ないということだな

497:デフォルトの名無しさん
16/02/14 20:43:02.26 feLPD2f/.net
団子うざい

498:デフォルトの名無しさん
16/02/14 20:43:29.15 feLPD2f/.net
スレちがい
きえろ

499:,,・´∀｀・,,）っ-○○○
16/02/14 20:45:40.73 vcWFNaoW.net
認めろよ負け犬
お前らの需要は民間需要とみなされてないんだよ

500:,,・´∀｀・,,）っ-○○○
16/02/14 21:07:00.02 vcWFNaoW.net
残念だけどGeForceに倍精度が必要な理由を説くには
ゲームなどの目的で使って一般ユーザーが必要であることは絶対必要な条件だ
まさかそんな単純な理屈もわからないのか？
だからお前は俺ごときに言い負かされてるんだよ

501:デフォルトの名無しさん
16/02/14 21:17:16.56 3MzGEHLi.net
でもdoeの評価アプリはほとんどが単精度なのだ

502:デフォルトの名無しさん
16/02/14 21:20:27.80 q4Y9hkYF.net
やっぱり次のスパコンはGPU入れてくるのかな。
CPUだけで今の１００倍は難しいよね？

503:,,・´∀｀・,,）っ-○○○
16/02/14 21:20:35.19 vcWFNaoW.net
Top500ランキングに使うLINPACKベンチは倍精度だからそれのためだけに必要なんだよ
ちなみにHPCGだと倍精度ユニットいくらあってももてあそぶから倍精度厨には逆風だね

504:デフォルトの名無しさん
16/02/14 21:29:25.60 q4Y9hkYF.net
maxwellが発売されて２年たつが、pascalはいつごろ発売になるのだろうか。

505:デフォルトの名無しさん
16/02/14 21:30:32.20 feLPD2f/.net
豚に真珠
団子に倍精度

506:デフォルトの名無しさん
16/02/14 21:34:09.88 3MzGEHLi.net
pascalは今年
voltaは来年
pascalは大きな変更になり
voltaは小改良

507:デフォルトの名無しさん
16/02/14 21:39:33.62 LdUYpatK.net
倍精度の必要性すら認めない奴がどうしてこのスレにいる？

508:デフォルトの名無しさん
16/02/14 21:46

509::01.01 ID:3MzGEHLi.net

510:,,・´∀｀・,,）っ-○○○
16/02/14 21:47:24.48 vcWFNaoW.net
そんな人は一人もいませんよ？
消費者向けGPUに倍精度が必要みたいなアホなこと言う負け犬君を馬鹿にしてるだけですよ

511:デフォルトの名無しさん
16/02/14 21:47:51.57 VLtYVTYt.net
Geforceで科学技術計算なんてことあるの？
2秒間の壁や1週間も１００％負荷で連続使用したら過熱して壊れそう。

512:デフォルトの名無しさん
16/02/14 21:51:42.44 k6vnuBvm.net
必要性もなにも倍精度演算自体は可能だろ。積和で単精度の1/32くらいの速度だけど。
それで不満な人間がCUDAにこだわる意味がわからん。
そもそもCUDA対応ハードで倍精度強かったのってfermiとkeplerの時期だけで、しかもコンシューマ向けで開放されたのもその極一部じゃない。

513:デフォルトの名無しさん
16/02/14 21:52:57.52 3MzGEHLi.net
それはfuryでもおなじだけどな

514:,,・´∀｀・,,）っ-○○○
16/02/14 21:53:10.10 vcWFNaoW.net
倍精度が必要な人は必要らしくマイノリティ税を払って4桁ドルのTeslaを使えばよろしい

515:,,・´∀｀・,,）っ-○○○
16/02/14 22:08:24.09 vcWFNaoW.net
防衛上の理由として
北朝鮮や中共がGeForceを買いあさって弾道計算に使われたら困るから
消費者向けGPUは倍精度を削るのは当然でしょう

516:デフォルトの名無しさん
16/02/14 22:18:41.75 k6vnuBvm.net
倍精度演算を単精度の1/4より速く実行するのは基本的に無駄なはずなんだよね。
keplerは別回路で使わなければ完全に無駄だったし、fermiの1/2にもからくりがあって、整数演算器の方に少し回路を付け足せば単精度性能を倍にできるのを抑えた感じ。
納入先との契約で倍精度性能は単精度の1/2にすることみたいな縛りでもあったのかね。
1/4にしないでもっとけちれば次は1/16になるのが自然
なのにmaxwellは1/32

517:デフォルトの名無しさん
16/02/14 22:57:17.12 MYivShEO.net
>>503
＞防衛上の理由として
＞
＞北朝鮮や中共がGeForceを買いあさって弾道計算に使われたら困るから
＞消費者向けGPUは倍精度を削るのは当然でしょう
中共とかなに時代錯誤なこと言ってんだよ
Nvidiaはファブレスで製造はTSMCだぞ
そもそも弾道計算にGPU要らんし

518:,,・´∀｀・,,）っ-○○○
16/02/14 23:02:24.40 vcWFNaoW.net
今存在している政権を時代錯誤と言ってみたり台湾と中国の区別がつかなかったり
いろいろ論外すぎる

519:デフォルトの名無しさん
16/02/14 23:28:08.25 MYivShEO.net
>>506
いやいや、中共が買い漁るとか言ってるのが時代錯誤なんだよ
ココム時代かよ
スパコンの現状見て今更「弾道計算に使われたら困るからGPUから倍精度削りました」とか寝言としてもありえ無いぞ

520:デフォルトの名無しさん
16/02/14 23:32:03.43 MYivShEO.net
>>506
あ、そうそう
TSMCに限らず台湾メーカーは当然中国工場持ってるからな
中台の政治はアレだが経済はズブズブなんだよ

521:,,・´∀｀・,,）っ-○○○
16/02/14 23:34:42.85 vcWFNaoW.net
その寝言で米国政府が天河1号Aおよび2号のパーツ供給打ち切る命令を下してりゃ世話無いわ

522:デフォルトの名無しさん
16/02/15 00:10:01.72 tk+f5azn.net
つーか今さらだよなぁ。
既に世界一のスパコン輸出した後で規制するとか、アメリカはアホなのか。

523:デフォルトの名無しさん
16/02/15 00:38:07.27 vFZf1/EN.net
>>509
お前それ反論になって無いぞ
もしかしてGeForceに倍精度のせないのはマジで米政府が関与してるとか思ってるわけ？
お前正気か？
もう少しまともな奴だと思ってたが買い被り過ぎだったようだな

524:デフォルトの名無しさん
16/02/15 01:27:27.22 WsLHcQ2

525:x.net

526:デフォルトの名無しさん
16/02/15 06:50:35.29 iMQPxQqI.net
2018年にかけて米国でknlとpascal,voltaでスパコンが更新されていくからな
天河はもう過去のものになる
日本はもう一番目指してないし

527:デフォルトの名無しさん
16/02/15 12:37:26.72 WsLHcQ2x.net
計算機なんて数増やせば良いだけだから単体性能よりコスパで1位を目指すべきだと思うんだが

528:デフォルトの名無しさん
16/02/15 13:15:29.44 GXDoYvGw.net
そんなん日本じゃ無理じゃん

529:デフォルトの名無しさん
16/02/15 18:36:52.42 jliXXPJr.net
>>514
なんもわかってないな
ノード数の2乗に比例してインターコネクトは複雑になる
なんのために大きなスパコンが必要だと思う？
莫大なメモリ空間がないとできないことがあるからだ

530:,,・´∀｀・,,）っ-○○○
16/02/15 19:35:35.81 ZpISfAaX.net
>>513
そーは言ってもあの国はコンシューマ向けGPUかき集めてでもスパコン作るから
現に初代天河1号でそれやったし
中国のPCゲーム市場は拡大しててGPUメーカーにとってもおいしい市場だ
軍事転用の懸念から輸出規制かけられたらNVIDIAだって大損なわけよ
だから最初から倍精度ハードは載せない
その理屈は最低限理解してほしいのだけど・・・

531:デフォルトの名無しさん
16/02/15 20:03:17.93 dHmco+xc.net
そもそも倍精度はいらないって持論言ってなかった？
それなら軍事用途でも倍精度なしでいいってことだよね？
そうすると、中国はいくらでもGeForceを軍事転用して作れるんじゃない？
倍精度載せないのが軍事転用を防ぐためってのは無理がないか？

532:,,・´∀｀・,,）っ-○○○
16/02/15 20:06:18.36 ZpISfAaX.net
もちろんそれが一番の理由だなんて言う理由はない
どうせ倍精度なんて使えてもそれこそ豚に真珠を与えるがごとき日曜プログラマの道楽のために
NVIDIAは会社を傾ける気はないのは確かだろう

533:デフォルトの名無しさん
16/02/15 20:37:26.50 dHmco+xc.net
ハイエンド以外はそうでしょうね。
でもハイエンドはTeslaとマスクを別にするほどメリットはないでしょう。
だからTeslaに搭載されている以上、ハイエンドにもつくだろうね。
ドライバや回路切断で無効化措置がとられるかもしれないけど。

534:デフォルトの名無しさん
16/02/15 20:41:01.96 dHmco+xc.net
GeForceに倍精度を載せないのはビジネス面からの理由で、
Teslaに倍精度が必要かどうかとはまた違う議論だよね
それからKeplar世代Teslaも最初1/12くらいだったのが1/3にまで上げられたのは
必要な人がいたからじゃないのかな。
４倍精度以上のライブラリがあることからも精度が必要な人はいると思うよ。
単品の精度はfloatでいいけど、累積誤差のせいで途中段階ではより高精度が必要という局面は多いんじゃないだろうか。
倍精度完全ゼロにしたらTeslaはこけると思う。

535:デフォルトの名無しさん
16/02/15 21:09:32.48 3Z78wnsj.net
Nvidiaが倍精度どころか単精度ですら要らないんじゃね？路線になった理由は明快
（AMDの）MantleがDirectX12とVulkanの取り込まれたから
ゲーム機は完全にAMD一色になったから、もはやゲームはAMD中心に動いている
全てのAAAゲームはCS機のローレベルAPIで組まれ、その成果をPCに持っていく形が定着した
従ってPCゲームは今までのように互換性や異種GPU間の翻訳を行うのをやめた
DirectX12はそこの所が根本的に違う
しかし団子はそこの理解がないから最初っから倍精度不要論をぶっていればまだかわいげがあったが、
ゲームに倍精度は不要だ！と言い出したのは、Pascalの仕様が明らかになってからｗ
それまでの団子は、NVはPascalに倍精度路線を復活させる！（�

536:Lリッの一点張りだった

537:,,・´∀｀・,,）っ-○○○
16/02/15 21:12:20.04 ZpISfAaX.net
> GeForceに倍精度を載せないのはビジネス面からの理由で、
> Teslaに倍精度が必要かどうかとはまた違う議論だよね
それは誰も否定してる人はいない
> それからKeplar世代Teslaも最初1/12くらいだったのが1/3にまで上げられたのは
> 必要な人がいたからじゃないのかな。
大型スパコン案件があったから。
Maxwell世代にはなくて、民間需要を探したら結局単精度しか需要が無かった

538:デフォルトの名無しさん
16/02/15 21:22:31.09 jCwjLRdK.net
団子>弾道計算には倍精度が必要！（キリッ
↑
マジでアホ

539:,,・´∀｀・,,）っ-○○○
16/02/15 21:23:17.67 ZpISfAaX.net
必要だけど？

540:,,・´∀｀・,,）っ-○○○
16/02/15 21:24:28.08 ZpISfAaX.net
惑星探査機なんか発射時刻1秒のずれすら許されないレベル

541:デフォルトの名無しさん
16/02/15 21:33:03.42 PRVxDG3b.net
弾道計算といったら大砲の弾やせいぜい弾道ミサイルといったイメージ
人工衛星は軌道計算というのが一般的だろう

542:デフォルトの名無しさん
16/02/15 21:34:44.35 WsLHcQ2x.net
GPUはいらないけどな

543:デフォルトの名無しさん
16/02/15 21:39:07.56 iMQPxQqI.net
で
このhello worldも書けない倍精度バカは何が言いたいんだ

544:,,・´∀｀・,,）っ-○○○
16/02/15 21:45:08.13 ZpISfAaX.net
スパコンは数増やせばいいとか言っちゃうレベルの超絶バカには理解できんだろう

545:,,・´∀｀・,,）っ-○○○
16/02/15 21:50:22.85 ZpISfAaX.net
呼ばれてもいないAMDファンボーイが勝手にわめいてるだけでしょ
Async Shader（笑）なんてスパコンでは全く需要がないんですよ。
繰り返すけど、需要がないんですよ。
何千並列のGPUが動く環境ではそもそも同じGPUで複数スレッドを
動かす必要性そのものが疑問だし本当に別々のスレッドを多並列で動かしたい用途には
60コア240スレッドのXeon Phi向けの問題だったりする。帯短襷長。

546:デフォルトの名無しさん
16/02/15 21:54:15.47 dHmco+xc.net
>>523
＞大型スパコン案件があったから。
Titanとかだよね。ということはやっぱりむこうの研究者もより精度がほしいってことなんだな。

＞Maxwell世代にはなくて、民間需要を探したら結局単精度しか需要が無かった
そもそも民間にGPGPUの需要があるのかも疑問だな。
大学以外でほとんど導入してる事例を見聞きしたことがない。
F1や飛行機の気流計算とかには大規模サーバに積んでシミュレーションしたりしてるのかな？
あとは建築における風の影響とかさ。
普通は世代ごとにプログラミングとテストし直す手間考えるとCPU増設するよって考えに至りそう。

547:デフォルトの名無しさん
16/02/15 22:24:29.68 iMQPxQqI.net
>>522
pascalの仕様がいつ明らかになったんだ？

548:デフォルトの名無しさん
16/02/15 22:34:24.26 jCwjLRdK.net
>>526
＞惑星探査機なんか発射時刻1秒のずれすら許されないレベル
その昔3ビットコンピュータの時代に米国は有人月探査をやってるんだが？
中共は弾道計算()にスパコンが必要なんだw

549:,,・´∀｀・,,）っ-○○○
16/02/15 22:38:59.79 ZpISfAaX.net
月がいつ惑星になったんだ
的が大きすぎてスイングバイのタイミング計算も必要ないぞ

550:デフォルトの名無しさん
16/02/15 22:44:09.45 iMQPxQqI.net
月には本当に行ったのかね
よく帰ってこれたな
てかランディングよくできたな
よく月から離れられたな

551:デフォルトの名無しさん
16/02/15 22:48:44.77 iMQPxQqI.net
核開発はおいそれと実験できないので
シミュレーション主体だろうけど

552:デフォルトの名無しさん
16/02/15 23:23:28.51 jCwjLRdK.net
>>535
弾道計算がいつの間にか惑星探査に成るよりマシ
スウィングバイの計算ですらスパコンいらないのに弾道計算にスパコンが必要な根拠を早く示せよw

553:デフォルトの名無しさん
16/02/15 23:27:02.18 iMQPxQqI.net
それは使用者がどの程度の精度を求めるかってだけじゃね
キロか
メートルか
センチか
ミリか
マイクロか
ナノか

554:デフォルトの名無しさん
16/02/15 23:33:23.73 iMQPxQqI.net
ipadのdawソフトだって64bit floatで合成できるし
サンプリンレートだって96khzがつかえる
で、聞いて違いがわかるのかって話だわ
さすがに32khz（昔のrolandのdtm音源とかね)と44.1khzはわかるけど

555:,,・´∀｀・,,）っ-○○○
16/02/15 23:42:05.72 ZpISfAaX.net
倍精度くんはDLで使われてる半精度の用途すら理解できてないと思うよ

556:デフォルトの名無しさん
16/02/15 23:54:48.03 6lA61DJG.net
科学技術計算で半精度が使えるのなんて、DLぐらいじゃねーの？
線形方程式を扱う問題は倍精度がないと使いもんになんないよ。
単精度で行けるのは、流体解析とかかな。

557:デフォルトの名無しさん
16/02/15 23:58:33.47 iMQPxQqI.net
必要な部分だけ倍精度で
後は単精度って言う混合精度が普通ですけどね

558:デフォルトの名無しさん
16/02/16 00:11:11.75 Rkm/CQ33.net
>>541
いいからお前は中共がスパコンで弾道計算()する根拠を示せよw
出来ないなら去れ

559:,,・´∀｀・,,）っ-○○○
16/02/16 00:16:10.17 hr2Cmr1D.net
そこいちいち突っ込むなよ
↓この池沼レスに突っ込んだやつ何人いるよ
427 ：デフォルトの名無しさん [↓] ：2016/02/12(金) 22:41:27.77 ID:10CGBYPs (2/2)
今日の重力波観測にしたってあれは、理論屋が出したシミュレーションに従ってそれと同じデータを観測したわけだろ
そういうのが単精度/半精度で出せるわけねーだろ

560:デフォルトの名無しさん
16/02/16 01:05:12.74 zrbNTBh/.net
くだらないすれになってきたな。
CUDAだけに。

561:デフォルトの名無しさん
16/02/16 01:07:09.51 uizCIs9N.net
惑星探査機の打ち上げ時に1秒のズレが許されないのは、もし1秒のズレが
起こるとロケット側の打ち上げシーケンスはリアルタイムに変更出来ない以上、
生じたズレを探査機側でカバーする必要があり燃料を大量に消費するから
ロケット発射時の1秒分に相当するズレが軌道計算時の演算精度によって
生じると示されない限りは今回の話の流れで例として出す意味は無い

562:デフォルトの名無しさん
16/02/16 01:22:51.47 Rkm/CQ33.net
>>545
話を逸らすな糞団子
GPUに倍精度が載らない理由としてお前が妄想で持ち上げた米政府陰謀論はどう始末すんだよ
いつの間にか惑星探査の話に誤魔化そうとしてドツボに嵌ってるし
どうやらお前には虚言癖があるようだな
それ精神疾患の初期症状だぞ

563:デフォルトの名無しさん
16/02/16 05:14:07.98 JyLDDdd2.net
こいついいかげんあたまわりーな
geforceにいらねぇってだけで
どこでgpuにいらねぇってかいてんだ
トットトキエロ無関係なamd信者

564:デフォルトの名無しさん
16/02/16 08:27:02.86 TSHTNtoJ.net
491 名前:,,・´∀｀・,,）っ-○○○ [sage] :2016/02/14(日) 22:08:24.09 ID:vcWFNaoW
防衛上の理由として
北朝鮮や中共がGeForceを買いあさって弾道計算に使われたら困るから
消費者向けGPUは倍精度を削るのは当然でしょう

565:デフォルトの名無しさん
16/02/16 08:39:42.99 O+KKJC7C.net
missile guidance
コピペしてあげる
URLﾘﾝｸ(www.rugged.com)
URLﾘﾝｸ(www.nrl.navy.mil)

Accelerating Binary Genetic Algorithm Driven Missile Design Optimization
Routine with a CUDA Coded Six Degrees-Of-Freedom Simulator
URLﾘﾝｸ(etd.auburn.edu)

566:デフォルトの名無しさん
16/02/16 08:44:44.70 5qdf7tTQ.net
あたまわりーなっていう書き込みがあたまわるそうw

567:デフォルトの名無しさん
16/02/16 12:24:44.18 r3FuaOqG.net
>>549
てめえのケツは文体から丸見えなんだよ、糞団子！

568:デフォルトの名無しさん
16/02/16 13:13:36.31 Rkm/CQ33.net
>>551
どこに弾道計算()って書いてあるんだ？
今更必死になって資料探してるのが笑える
糞団子www

569:デフォルトの名無しさん
16/02/16 17:01:16.79 O+KKJC7C.net
missile guidanceって書いてんですけど
本当にアホなんだ

570:デフォルトの名無しさん
16/02/16 19:19:35.76 Rkm/CQ33.net
>>555
ミサイル誘導と弾道計算()をゴッチャにして無いか？

571:デフォルトの名無しさん
16/02/16 19:31:16.10 ehtVDEti.net
お前らってCUDAスレでミサイルの話したいの？
うざいよ

572:デフォルトの名無しさん
16/02/16 19:32:32.16 Got2320i.net
団子が消えれば平和になる

573:デフォルトの名無しさん
16/02/16 19:37:49.67 vQzfh9to.net
そもそも米国初のスパコンは300flopsで
弾道計算目的で作られたわけですけどね

574:デフォルトの名無しさん
16/02/16 19:46:46.20 Got2320i.net
団子うざい

575:デフォルトの名無しさん
16/02/16 19:52:40.02 JyLDDdd2.net
倍精度バカが消えればいいだけ

576:デフォルトの名無しさん
16/02/16 19:52:56.44 Rkm/CQ33.net
>>559
だからなに？
300flopsでいいならatomでも使えば？
弾道ミサイルと誘導ミサイルの区別もつかない知障が恥の上塗りしてどうする

577:デフォルトの名無しさん
16/02/16 19:53:37.32 JyLDDdd2.net
相変わらず
病気ですかｗ

578:デフォルトの名無しさん
16/02/16 19:55:56.44 Rkm/CQ33.net
>>563
なんだよネタ切れか糞団子
早く弾道計算()の根拠を示せよwww

579:,,・´∀｀・,,）っ-○○○
16/02/16 21:31:21.33 n4dpDB+H.net
ID:Rkm/CQ33
ひまだねこいつ
Teslaなんて買えるご身分じゃないことはわかったよ

580:デフォルトの名無しさん
16/02/16 21:46:16.04 JyLDDdd2.net
c++ampの死亡がよほど悔しかったと見える

581:デフォルトの名無しさん
16/02/16 21:52:57.09 Rkm/CQ33.net
>>565
お前さぁ何で個人ユース前提で話進めてんの？貧乏F蘭学生か？
悪いけどプライベートでゴリゴリコード書かんから家ではオンボードチップのみだよ
んなこといいから早く弾道計算()のソース探して来いや

582:,,・´∀｀・,,）っ-○○○
16/02/16 21:54:13.47 n4dpDB+H.net
AMDの株価がまたダダ下がりしてるよ
年内に潰れるんじゃないの？（煽

583:デフォルトの名無しさん
16/02/16 22:55:41.72 Rkm/CQ33.net
>>568
お前、俺がAMD信者だと思いたいわけ？
残念だが単なるツールに思い入れは無い
そもそもプライベートではインテルHDだしな
ぶっちゃけ、AMDでもNVでも倍精度でも単精度でもどうでもよろしい
糞団子がおかしな事言ってるから突っ込んでるんだよ
さぁ話を逸らさず、早く弾道計算のソース探して来いやwww

584:デフォルトの名無しさん
16/02/16 22:59:58.46 r3FuaOqG.net
結局Asyncとか煽ってたのは団子だよ
そして株価ガーとまたぞろ論破された悔しさから関係ないバカッターぶり

585:デフォルトの名無しさん
16/02/16 23:03:30.71 JyLDDdd2.net
おまえだろｗ

586:デフォルトの名無しさん
16/02/16 23:04:56.35 r3FuaOqG.net
糞団子は及びじゃねーんだよ
倍精度が嫌なら自作板帰れや

587:,,・´∀｀・,,）っ-○○○
16/02/16 23:19:32.08 n4dpDB+H.net
Async（笑）はお呼びじゃねーから

588:,,・´∀｀・,,）っ-○○○
16/02/16 23:22:10.95 n4dpDB+H.net
倍精度CUDAでAMDの倒産時期のシミュレーションをしようず

589:デフォルトの名無しさん
16/02/16 23:55:31.06 TSHTNtoJ.net
この糞団子って奴はNV信者なのか？
かなりキショいな

590:デフォルトの名無しさん
16/02/16 23:58:08.83 Rkm/CQ33.net
>>574
お前、先にやる事あんだろ
早く弾道計算()のソース探して来いや
糞団子

591:デフォルトの名無しさん
16/02/17 03:31:12.34 0fWAF1mS.net
amd信者はスレのレベルを下げるの上手だよな
どこでも

592:デフォルトの名無しさん
16/02/17 07:30:57.92 rf0k3qKD.net
団子うざい消えろ

593:デフォルトの名無しさん
16/02/17 07:57:37.34 VmCK2l0E.net
お前何なの？
団子団子団子って
この固ハン好きなの？

594:デフォルトの名無しさん
16/02/17 09:30:58.37 rYEbraru.net
団子を知らんなんてもぐりだな。

595:デフォルトの名無しさん
16/02/17 12:25:17.76 OFL0xTOo.net

sssp://o.8ch.net/7vw7.png

596:,,・´∀｀・,,）っ-○○○
16/02/17 21:53:22.36 vQUlaZXp.net
だんごさんはアイドルだからな

597:デフォルトの名無しさん
16/02/17 22:38:37.14 ftw2nvyT.net
お、おう

598:デフォルトの名無しさん
16/02/18 00:59:56.44 yA7sr9oe.net
507 ：,,・´∀｀・,,）っ-○○○：2016/02/15(月) 20:06:18.36 ID:ZpISfAaX
もちろんそれが一番の理由だなんて言う理由はない
どうせ倍精度なんて使えてもそれこそ豚に真珠を与えるがごとき日曜プログラマの道楽のために
NVIDIAは会社を傾ける気はないのは確かだろう

団子いいこと言うな、その通りだよ
お前ごときが倍精度の存在意義なんかわかりゃしないんだから
そのままここから消えろ

599:デフォルトの名無しさん
16/02/18 01:34:33.83 BdjwVjbv.net
人間の脳細胞も半精度

600:デフォルトの名無しさん
16/02/18 15:31:31.41 k3R63z0a.net
アンチの方が邪魔で迷惑というのは、嫌儲や嫌韓と変わらんな。

601:デフォルトの名無しさん
16/02/18 20:51:58.59 8FWPXGjX.net
>>586
団子ははっきり言ってやらんと分からんアスペだから

602:デフォルトの名無しさん
16/02/18 22:55:07.89 yHWNW4Hi.net
確実に言えることは
こいつはCUDAより団子のほうが
興味があるようだってこと
CUDAスレなのにな
迷惑だから他でやって欲しい

603:デフォルトの名無しさん
16/02/18 23:48:14.62 dPaFikXI.net
>>588
お前が一番しつこいよ
消えろ

604:デフォルトの名無しさん
16/02/19 12:26:53.00 3s8ITFfM.net
団子はインテルNVマンセー馬鹿に過ぎない
Fermiの時代は倍精度の必要性を謳ってたのまた団子
現在倍精度不要論をぶってるのはこいつが工作員である証拠
くだスレにはまったく不要

605:デフォルトの名無しさん
16/02/19 18:46:26.08 ktnruegg.net
>>587
団子はいくら言っても分からないようだから、そろそろ諦めてくれないか。
邪魔だし迷惑。
団子だけならNGできるんで、団子たたきはやめて、キッチリ完全スルーしてくれ。

606:デフォルトの名無しさん
16/02/19 19:43:08.21 3s8ITFfM.net
>>591
＞、団子たたきはやめて、キッチリ完全スルーしてくれ。
NGだけなら簡単だが、こいつは倍精度を否定してるんだよ
そして名無しで煽ってるから問題だろうが

607:デフォルトの名無しさん
16/02/20 01:44:55.38 C1beyHUM.net
病人乙

608:,,・´∀｀・,,）っ-○○○
16/02/20 02:13:53.70 yfJQw59R.net
俺がこのスレで名無しになったことなんて1度たりともない

609:,,・´∀｀・,,）っ-○○○
16/02/20 02:18:16.51 yfJQw59R.net
一般消費者向けのGPUで倍精度の性能は必要ないとしか言ってないんだけどな俺は
なぜなら、一般消費者の用途で倍精度の性能が必要でないからだ
トートロジーを並べてるだけだけどこれは普遍の真理。

倍精度特化のTeslaが使いたい人は使えばいい
だからこそなおさらGeForceが倍精度に特化しなければいけない理由はない
いつ倍精度そのものを否定したんだ？

610:,,・´∀｀・,,）っ-○○○
16/02/20 02:22:37.26 yfJQw59R.net
ドァンゴが、午前２：２２くらいをお知らせします

611:デフォルトの名無しさん
16/02/20 06:16:50.67 2KEvBzOT.net
Teslaがいつ倍精度に特化したって？

612:デフォルトの名無しさん
16/02/20 08:36:03.80 deWWtRHc.net
>>595
はいはい
一般消費者向けのGPUから倍精度が削除されたのは米政府の陰謀なんだろw
お薬増やしおきますね～

613:デフォルトの名無しさん
16/02/20 08:42:57.95 wJmoGGP6.net
お前のGPGPUプロジェクトが
どのように許容誤差見積を出して
倍精度を必要とそっちを語った方が
反論になるだろう
出せ

614:,,・´∀｀・,,）っ-○○○
16/02/20 09:07:06.30 mQDXSMnA.net
>>597
Teslaにも倍精度に特化してないモデルもある
倍精度が強いのはあくまで「スパコン用のTesla」だ
それの流用版のGeForceやQuadroも副次的に倍精度が強かったこともあったが
GeForceに倍精度の需要があったからではない
GeForceで倍精度が速くないと困るとか言ってる手合いはろくに研究予算もつかない
ゴミ研究者かなんかだと思ってるが
（そんなものに拘ってるからろくな論文が書けないんだろ）

615:デフォルトの名無しさん
16/02/20 09:53:53.93 gxBCXYT2.net
>>600
＞GeForceで倍精度が速くないと困るとか言ってる手合いはろくに研究予算もつかない
＞ゴミ研究者かなんかだと思ってるが
おいおい、GeForceは一般消費者向けが前提じゃなかったのか？
糞団子は論点ズレまくりでまともに議論が噛み合ってない

616:,,・´∀｀・,,）っ-○○○
16/02/20 10:17:55.46 mQDXSMnA.net
だから学校から支給される予算じゃTeslaが買えないからGeForce使うしかないんでしょ

617:,,・´∀｀・,,）っ-○○○
16/02/20 10:18:51.16 mQDXSMnA.net
あるいは赤ポスにつけなかったおちこぼれか
いずれにしても「一般」消費者でありはしない

618:,,・´∀｀・,,）っ-○○○
16/02/20 11:09:20.85 mQDXSMnA.net
所詮は自分が欲しいかどうかだけが基準点でもっと大きな市場のニーズを
理解できないｱﾌｫでしょう
大学院重点化の弊害ですね
就活失敗したようなレベルのゴミを研究室に引きこもらせたら
ますます世間知らずをこじらせるのも道理

619:,,・´∀｀・,,）っ-○○○
16/02/20 11:18:36.93 mQDXSMnA.net
論文博士という日本独自の制度もたいがいだがな
3年間も通って単位取得だけしかできず学校を放逐されたゴミにも
なまじ希望を与えるからタチが悪いというか

620:デフォルトの名無しさん
16/02/20 12:50:45.19 kmGvjPZb.net
,,・´∀｀・,,）っ-○○○NGですっきり

621:デフォルトの名無しさん
16/02/20 13:08:52.37 kmGvjPZb.net
>>601
糞団子は論点をずらすと言うより、負け犬になるといつも違う話をする＆名無しでスレ汚しだから
NGだけでは駄目なんだよ
本当はDX12でNVがハブられた事実を認めたくないために架空のでっち上げ話をしてる
その証拠にMaxwell世代以前のNVはﾆﾀﾄﾞﾘｻﾝ（笑い）の話をだして市販のNVGPUが大学研究機関
に納入された事を自慢してたからな
こいつは単なるアンチAMDのステマ部隊
454 ：,,・´∀｀・,,）っ-○○○：2016/02/13(土) 19:06:49.99 ID:dwcfM3wy
ゴードンベル賞で2度の受賞を経験したﾆﾀﾄﾞﾘ=ｻﾝをして
天文学分野のシミュレーションは半精度程度の分解能があれば十分だって言ってるんだよ
453 ：,,・´∀｀・,,）っ-○○○：2016/02/13(土) 18:48:25.54 ID:dwcfM3wy
倍精度必要論が否定されるから都合が悪いだけだろう？
重力演算のために長崎大がGeForce買いあさって作った激安スパコンだって
単精度特化仕様だったよ？
これもﾆﾀﾄﾞﾘ=ｻﾝが協力している。古事記にも書いてある。

622:デフォルトの名無しさん
16/02/20 13:46:11.25 AOSmisIg.net
>>600
特化の意味わかる？
単精度の1/3の速度じゃ特化じゃないから

623:デフォルトの名無しさん
16/02/20 13:53:58.49 T6EctyCF.net
特化じゃね。
1/4がイーブン

624:デフォルトの名無しさん
16/02/20 15:21:16.14 XuC13l9f.net
団子さんにコンプレックス持ってる病人がいるなｗ

625:,,・´∀｀・,,）っ-○○○
16/02/20 15:32:40.26 mQDXSMnA.net
ただのAMDファンボーイだから
そもそもAMDはCUDAが使えないしCPUもAVXが半速のゴミしか出せないので
科学技術方面では全く役に立ちませんよ

626:,,・´∀｀・,,）っ-○○○
16/02/20 15:35:44.85 mQDXSMnA.net
価格の安いコモディティ製品本来の用途外に流用するのがGPGPUの始まり
用途外を前提に設計しろなんてのは片腹痛い話ですよ

627:,,・´∀｀・,,）っ-○○○
16/02/20 15:50:28.63 mQDXSMnA.net
ちなみに仮数の単精度は24ビット、倍精度は53ビット
積和ユニットのの複雑度は仮数のビット数の二乗にほぼ比例するので
実際には倍精度積和ユニットの実装コストは単精度の5倍よりも多い

628:デフォルトの名無しさん
16/02/20 15:52:58.65 AOSmisIg.net
>>609
倍精度特化じゃないCPUが1/2
イメージ的にはこれで普通
特化って言ったら単精度演算器を持たない、昔ながらのスーパーコンピューターみたいなやつ

629:,,・´∀｀・,,）っ-○○○
16/02/20 16:03:04.79 mQDXSMnA.net
先に否定してるのにアホか

630:デフォルトの名無しさん
16/02/20 16:14:51.99 T6EctyCF.net
>>614
要は技術を知らないバカが無謀な要求をしていると自白しているわけだな。
そもそもCPUは倍精度特化で、単精度は搭載している回路の半分だけ利用しておまけでつけているくらいの勢い。
正確には倍精度以上から降りてきたという方が正しいような気もするが。

631:デフォルトの名無しさん
16/02/20 16:19:59.15 XuC13l9f.net
うん、じゃCPU使ってなよ病気の人
CUDA関係ないからもう来ないでね

632:,,・´∀｀・,,）っ-○○○
16/02/20 16:47:44.25 mQDXSMnA.net
逆に言うと倍精度をサポートしなければ同じトランジスタの実装コストで
5倍以上の単精度ユニットを実装できるということ
それがCPUとは別方向で進化してきたGPUの速さの根源
それを否定するのはGPUを否定するようなもの

633:デフォルトの名無しさん
16/02/20 16:51:35.52 T6EctyCF.net
>>618
んな事はねぇよ。
回路を流用すれば1/4や1/16での
倍精度演算は殆ど追加コスト無く出来る。それを削ったからといって増やせる単精度性能は20%も無い。
まあ、これが大きいから1/4でなく1/16を選択するのが通常なのだけど。

634:デフォルトの名無しさん
16/02/20 16:53:25.90 XuC13l9f.net
もうくんなつったろ
病人

635:,,・´∀｀・,,）っ-○○○
16/02/20 16:59:15.42 mQDXSMnA.net
>>619
>>618のいうサポートっていうのはフルスピードの倍精度っていう意味
もちろん単精度を複数回（or複数ユニット）回して倍精度を実現してもいいが
それが現状のMaxwellなどの在り様なわけで

636:デフォルトの名無しさん
16/02/20 17:45:22.65 deWWtRHc.net
うわさではsmxに1個だけdpがあるとかないとか

637:,,・´∀｀・,,）っ-○○○
16/02/20 17:59:22.63 mQDXSMnA.net
あったとしてもどういう役回りかわからんでしょ
ぶっちゃけると単精度で分割処理するとはいっても実際には
倍精度フォーマットをデノーマライズして複数の単精度データに変換するハードウェアと
演算結果を組み立てて倍精度フォーマットに書き戻すハードウェアも必要だからね
そのビットフィールドの変換をソフトで処理したら1/16すら出ない

638:デフォルトの名無しさん
16/02/20 18:20:08.42 T6EctyCF.net
本来遅いハードでもdpどころか64bit整数の乗算も1/9で済むはずなのにそこはサボって24bit乗算器を16bitとしてしか利用していないんだよな。

639:デフォルトの名無しさん
16/02/20 19:23:23.87 C1beyHUM.net
挙動の違いがあるとまずいから
同じユニット使ってるとか言う

640:デフォルトの名無しさん
16/02/20 20:26:03.16 kmGvjPZb.net
>>619
AMDのGCNアーキテクチャーのGPUは複数のコアを使うと倍精度の演算が出来るように設計してある
それがPS4/XBOに搭載されたものだから、ゲームは非常にGPGPUに強いんだよな
DX12とVulkanはGCNで最大性能を発揮できるように設計されたローレベルAPI
これが怖いからMaxwellは半精度FP16GPUになった
描画に特化してGPGPUが弱い

641:,,・´∀｀・,,）っ-○○○
16/02/20 20:39:18.95 mQDXSMnA.net
誰も使わないゴミの話に興味ないよ

642:デフォルトの名無しさん
16/02/21 00:09:39.56 Qg7TSliE.net
>>626
ここはCUDA(言語)スレでGPGPUスレではない
AMDのGCNの宣伝したいなら、いまAMDはCUDAもある程度サポートしているらしいから、
AMDでCUDAしたときのベンチぐらい載せて宣伝してくれないか？
GPGPUのすばらしいぞ宣伝ならここでなくGPGPUスレでやれ

643:,,・´∀｀・,,）っ-○○○
16/02/21 00:46:36.86 qKVvfwew.net
HSA総合スレを盛り上げてやれよ
プログラムのプの字も書けないゴミには無理か？

644:デフォルトの名無しさん
16/02/21 01:26:54.56 fTBqyn4A.net
>>629
ここはディープラーニングスレじゃねーぞ糞団子

645:デフォルトの名無しさん
16/02/21 01:51:21.48 uPvCsAh0.net
AMDは早くCUDAに対応しろ。

646:デフォルトの名無しさん
16/02/21 02:47:38.75 0MRjXIaU.net
>>613
乗算の回路規模なんてぜんぜん大したこと無いって言ってなかった？

647:,,・´∀｀・,,）っ-○○○
16/02/21 02:54:22.04 gnD1Eicx.net
>>632
俺は言った覚えはないがな

648:,,・´∀｀・,,）っ-○○○
16/02/21 02:55:38.55 gnD1Eicx.net
>>630
プログラム書けないクソボケが居座る板でもないぞ
DQNのAMDファンボーイは自作PC板で妄想垂れ流してろクソボケ

649:,,・´∀｀・,,）っ-○○○
16/02/21 02:57:56.81 gnD1Eicx.net
そもそもAMDのあれはCUDAを実行できるという理解は正しくない
CUDAのCソースをOpenCLに変換するトランスレータを作りましたという話で
PTXを実行できる環境を作るという話ではない

650:デフォルトの名無しさん
16/02/21 11:51:35.77 YDVcjdw/.net
>>634
＞プログラム書けないクソボケが居座る板でもないぞ
ここお笑いですか？糞団子

651:,,・´∀｀・,,）っ-○○○
16/02/21 11:57:22.58 gnD1Eicx.net
倍精度連呼君は倍精度を使って何をやるのかすら提示してないよね

652:,,・´∀｀・,,）っ-○○○
16/02/21 11:58:40.76 gnD1Eicx.net
>>636
AMDファンボーイはプログラムを書いたこともないから
AMDの開発環境の圧倒的なひどさを知らんのですよ
知識さえあればNVIDIA一択になる理由がわかる

653:デフォルトの名無しさん
16/02/21 12:15:14.37 MzI2quQP.net
>>633
おまえの偽物か？
態度はおまえそのものだったけど

654:デフォルトの名無しさん
16/02/21 12:19:33.63 MzI2quQP.net
>>637
いろいろと書かれてるのに、すべてお前が一般人は使わないと決めつけてスルーしてるだけ
プログラム板のCUDAスレッドなんだから一般人とは母集団が違うのは当たり前なんだが
お前が不要で、一般人の9割が不要でもこのスレ的には関係ない

655:デフォルトの名無しさん
16/02/21 12:21:46.08 hql2OPnW.net
>>637
レイトレなんかどうだい？

656:,,・´∀｀・,,）っ-○○○
16/02/21 12:33:02.90 gnD1Eicx.net
AMDのGPUは母集団そのものに入ってない
その点は理解してくれ

657:,,・´∀｀・,,）っ-○○○
16/02/21 12:37:43.18 gnD1Eicx.net
AMD語りはこっちへ
HSA総合スレ【part 3】
ｽﾚﾘﾝｸ(tech板)

658:デフォルトの名無しさん
16/02/21 12:47:19.67 bDXYj0yt.net
だれも倍精度不要なんて書いてないのにな。
倍精度特化がコンシューマ向けには必要無いと言うだけで。

659:,,・´∀｀・,,）っ-○○○
16/02/21 12:56:20.84 gnD1Eicx.net
倍精度は必要な人は必要だけどAMDがこのスレに不要

660:デフォルトの名無しさん
16/02/21 12:58:04.21 YDVcjdw/.net
>>644
てめえはすぐに論破されると単発で煽りやがる
こういう奴だからこそこっちは不必要にNGだけでなく相手をしないといけないんだよ馬鹿野郎！
コテならコテだけで通せ！糞団子！
それから、NVがこれからGPGPUを捨てる根拠となるソースだ
実際にここで科学技術演算をされてらっしゃる皆さんもご覧になった方がいい↓
URLﾘﾝｸ(camera-pc.com)
結局これもCS機をAMDが独占したためなんだよな

661:,,・´∀｀・,,）っ-○○○
16/02/21 13:15:26.28 gnD1Eicx.net
ばか？

662:,,・´∀｀・,,）っ-○○○
16/02/21 13:28:33.48 gnD1Eicx.net
科学技術計算でAMDのGPUが上げた実績なんてないし
NVIDIAがHPCを重視する姿勢にも変わりはない
そもそもMaxwell世代に大型のスパコン案件が無かったから倍精度特化版を作ってないだけで

663:,,・´∀｀・,,）っ-○○○
16/02/21 14:11:49.09 gnD1Eicx.net
ちなみにその個人ブログの主は科学技術計算に対してあまりに無知でお話にならない
ただカタログスペックのFLOPS数値を上げてヨシとするものではないのだわ
大規模システムはノード間のデータ転送帯域がものすごい重要で
NVLinkもその一環
AMDはカタログスペックありきで中身が無いし
実際2017～18年の米国大型スパコン案件を何一つとして獲得できてない

664:デフォルトの名無しさん
16/02/21 14:17:28.22 YDVcjdw/.net
URLﾘﾝｸ(ascii.jp)
＞Keplerの世代では倍精度浮動小数点のサポートの有無がこれにあたったが、
＞Pascalはこの点ではMaxwellを継承しており、
＞倍精度浮動小数点の性能は非常に低いと思われるので、ここでの差別化は難しい。
Pascalはここのスレ住人にとっては大変残念な事になるだろうな
その理由は先述したとおり、AMD準拠のDirectX12が策定された事でゲーム用GPUでNVは必死になって
電力効率の優位で喰らいつこうとしているためで描画特化でDX12世代に必須になるGPGPUを弱体化させた
トレードオフがある
倍精度とNVの関係は残念ながら離婚前の別居状態のようなさめた状態

665:,,・´∀｀・,,）っ-○○○
16/02/21 14:23:54.76 gnD1Eicx.net
相変わらず知恵おくれだねえ
その記事を読んでもPascalの倍精度特化版が存在しないということは読み取れないがね
大型案件がつけばMaxwellの倍精度特化版も出す用意はあったくらいだし
少なくともPascalには客がついている

666:,,・´∀｀・,,）っ-○○○
16/02/21 14:35:55.03 gnD1Eicx.net
倍精度の性能はスパコンでは今後も重要だけど
足回りの性能に見合わないほどのカタログスペックが必要かと問われれば
「必要ない」のが現実なわけで。
足回りの強化もなしにただ倍精度ユニットだけ並べておけばFLOPS数が稼げる
LINPACKベンチの実用性に疑問符が付くご時世ですからね
URLﾘﾝｸ(news.mynavi.jp)

667:,,・´∀｀・,,）っ-○○○
16/02/21 14:50:22.3

668:5 ID:gnD1Eicx.net

669:デフォルトの名無しさん
16/02/21 15:18:31.73 igZD1LUA.net
病気の人は倍精度特化のcpu使うって宣言してんだから
関係のないcudaスレにあらしにくんなよ

670:,,・´∀｀・,,）っ-○○○
16/02/21 15:30:43.09 gnD1Eicx.net
Polarisは結局スパコンのデザインウィンを未だ1件たりとも取れてないんだよな
全てが無駄だったね

671:デフォルトの名無しさん
16/02/21 15:31:01.75 VEySITtF.net
野球ファンがどっちの贔屓チームの方が凄いか喧嘩してるようなアホらしさｗ

672:,,・´∀｀・,,）っ-○○○
16/02/21 15:40:19.39 gnD1Eicx.net
たとえるなら阪神ファンがオフシーズンに東京ドームに居座って六甲颪を大合唱するレベルの
あつかましさ

673:デフォルトの名無しさん
16/02/21 15:59:16.02 ksxAl9BA.net
>>646
勝手にくそ団子と同一視するな。
不愉快だ。

674:デフォルトの名無しさん
16/02/21 19:49:31.23 YDVcjdw/.net
>>658
お前も糞の自覚はあるんだな、糞団子

675:,,・´∀｀・,,）っ-○○○
16/02/21 20:00:48.09 gnD1Eicx.net
うんこくってる時にカレーの話はやめてください

676:デフォルトの名無しさん
16/02/21 20:37:09.44 zsQMik7a.net
小学生かよ…

677:デフォルトの名無しさん
16/02/21 21:06:17.70 igZD1LUA.net
米国のエクサスケールではcuda使わないんだけどね

678:デフォルトの名無しさん
16/02/21 22:12:15.14 gJEqj33V.net
URLﾘﾝｸ(www.livevolume.com)
このソフト動かしたいんだけど、nvidiaのカードが必要なんですか？
すいません、プログラムのプの字も知らない初心者です
pentium N3700でGPUがintel graphicなんですけど
やっぱりこの環境で動かすことはできないのでしょうか…
現状では「GLSL compile error」と出て描画ができません
もしスレ違いな質問だったら本当にごめんなさい

679:デフォルトの名無しさん
16/02/21 23:09:10.02 Qg7TSliE.net
>>663
Minimum system requirementsにNvidiaとあるし、
そして、実際に動かないとなるとnvidiaつけるしかないだろ

680:,,・´∀｀・,,）っ-○○○
16/02/22 02:03:02.55 XUbrDPNF.net
果たしてそのマシンにGPUなんてつけられるだろうか？
ノートならG-Tuneあたりのゲーミングノート買うのが一番手ごろじゃなかろうか
（メーカー製ノートでもGeForce搭載機はあんまり見かけない）

681:,,・´∀｀・,,）っ-○○○
16/02/23 17:44:18.03 U0HFk1NZ.net
スパコン案件の有無が倍精度版の有無を決めるというのは間違いないようで
NVIDIA Pascal based GP100 GPU to boast of 12TFLOPS SP & 4 TFLOPS DP performance
URLﾘﾝｸ(vr-zone.com)
とりあえずTesla購入予定の方は何も心配いらないということです
悔しがるのはTeslaが買えない貧乏研究者とAMD厨だけでいいですよ

682:デフォルトの名無しさん
16/02/23 18:53:40.49 NTXFP2zz.net
研究者しか倍精度を使わないと思ってるところが団子クオリティー

683:,,・´∀｀・,,）っ-○○○
16/02/23 19:57:44.93 U0HFk1NZ.net
↑ね、　この負け犬クオリティ

684:,,・´∀｀・,,）っ-○○○
16/02/23 19:59:57.59 U0HFk1NZ.net
GeForceは個人用のGPUであって倍精度で科学技術演算のためのものじゃないんですよ
倍精度の性能に正規の�

685:ﾎ価を払おうとしない悪質ユーザーの梯子を外されたからって何が問題なんですかねえ

686:,,・´∀｀・,,）っ-○○○
16/02/23 20:14:34.27 U0HFk1NZ.net
倍精度ユニットの実装コストはロハではないので
メインで使う単精度の演算性能向上や電力効率の改善に振ったほうが
大多数のユーザーのためなんですよ
実質TeslaをGeForceの価格で売れと言ってるような倍精度乞食の言葉に
耳を傾ける必要はないのﾃﾞｽ

687:デフォルトの名無しさん
16/02/23 21:11:07.44 NTXFP2zz.net
単精度布教はいいからCUDAについて書けよ

688:デフォルトの名無しさん
16/02/23 22:13:43.75 /ZAu7LIh.net
NGにしてるから何かいてあるか知らないけど、どうせ相手にする価値がないことは>>671
から読み取れるｗ
このスレは研究者もヲチしてるだろうから言っておくけど、もうNVは倍精度は捨てるね
Felmi時代とは大違い
DirectX12（ウィンドウズ10）になるとAMDだけがローレベルAPIの恩恵に与れることを知ってるから、
Maxwell世代で素早くGPGPU切りの変わり身を演じた
今後は半精度と単精度の混合GPUばかりでCUDAはどんどん腐ってくるｗ

689:デフォルトの名無しさん
16/02/23 22:47:19.86 oMRN0TkA.net
恥ずかしいやつだなこいつ

690:デフォルトの名無しさん
16/02/23 23:01:37.48 /ZAu7LIh.net
>>673
てめえをNGにして非難合戦のスレ汚しをしたくないのにノコノコ単発で出てくるな！
糞団子！

691:デフォルトの名無しさん
16/02/23 23:20:55.12 zq7ECeNv.net
>>672
なんかAMDが勝ち組でNVが負け組の様に書いてあるけど、実際は真逆だよ
AMDはゲーム機でなんとか持ちこたえてる状況で、NVはDL特需で歴史的な好況
GPGPUはCUDAがデファクトになりつつあるからAMDはほぼ詰んでる
まぁ、先の事は判らないけどね。

692:デフォルトの名無しさん
16/02/23 23:23:55.28 oMRN0TkA.net
>>674
お前みたいな負け犬ｱﾑ厨が自作PC板から出てこなきゃ平和なんだけど

693:デフォルトの名無しさん
16/02/24 12:20:01.56 Ad4bERAY.net
>>675 >>675
まだ単発自演で俺をやり込めようってか？糞団子！
NVはもはや半精度でしか生き残りが出来ないんだよ！
このスレは倍精度の行方が一番大事なんだからてめえがいることが一番スレを汚すんだ馬鹿野郎！

694:デフォルトの名無しさん
16/02/24 12:31:29.64 dk01eTkb.net
倍精度の行方なら団子がソース付きで書いたけどね
結局NVIDIAがHPCから撤退なんてのは出鱈目な言いがかりと

695:デフォルトの名無しさん
16/02/24 12:47:40.23 dk01eTkb.net
ほれ
NVIDIA Pascal based GP100 GPU to boast of 12TFLOPS SP & 4 TFLOPS DP performance
URLﾘﾝｸ(vr-zone.com)
そらあんだけのシェアとエンプラ向けの大躍進あればコンシューマ向けとHPC向けで
それぞれに合わせた演算ユニット構成のカスタマイズ費用くらい捻出できるだろう
そしてここはAMDについて語るスレでもNVIDIAをネガキャンするスレでもない
誰が場所をわきまえていないのか自覚したら？

696:デフォルトの名無しさん
16/02/24 12:47:59.45 jB1Q2gHg.net
>>677
おいおい糞団子と一緒にするなよ
ここはCUDAスレだぞ
倍精度の行方とかどうでもよろしい
お前自分が糞団子レベルになってる事に気付けよ

697:デフォルトの名無しさん
16/02/24 12:58:31.02 jXa1RnbL.net
浮動小数点数の精度なんて
コード組む側からすればどれも一緒だよ
倍精度だと収束するが
単精度だと発散するとか
それ単にコードの質が悪いだけだしね
何がそんなに気になるのかわからん

698:デフォルトの名無しさん
16/02/24 13:10:46.14 kxdU4ZHF.net
>>681
えっ？？？

699:デフォルトの名無しさん
16/02/24 13:17:56.21 dk01eTkb.net
FireProがHPC向けでまったといっていいほど使われないのは
分岐粒度が荒過ぎて実効でスペックの半分も出ないとか
特定用途向けの商用ライブラリが用意されてないのか
それ以前の問題としてランタイムが頻繁にクラッシュするとか
結局のところトー�

700:^ルの問題なんだよね単精度特化の一般のGPUで多倍精度使う場合は遅い倍精度を使うより単精度DFTのほうがはるかに速い

701:デフォルトの名無しさん
16/02/24 14:12:53.97 s8sb75Sy.net
中小企業や個人開発のプログラムにもCUDA開発の無償支援してくれる
そういう実績があるからCUDAが鉄板になってるわけで
そういうことをやったためしもなければ大赤字でやれる予算も割けないAMDに
期待できることは何一つとしてない、これが現実
うちの商品はほぼ整数しか使わないだから倍精度実数が速いかどうかなんて
微塵も関係ない

702:デフォルトの名無しさん
16/02/24 14:34:29.38 Ad4bERAY.net
糞団子はコテ使ってると相手してくれないから寂しくて単発コテはずし作戦に出たのか？
NVはどう考えても半精度中心のグラフィックス/深層学習中心に経営資源をシフトしてるんだがｗ

URLﾘﾝｸ(ascii.jp)
＞Pascalはこの点ではMaxwellを継承しており、倍精度浮動小数点の性能は非常に低いと思われるので
＞Pascalはこの点ではMaxwellを継承しており、倍精度浮動小数点の性能は非常に低いと思われるので
↑
大事な事だから二度言うぞ
＞つまりPK100は半精度浮動小数点をサポートするが、PK104はこれをサポートしない(あるいは回路を持たない)可能性がある。
↑
プロセスルール次第だが半精度に重心を置いていることは明白だな

703:デフォルトの名無しさん
16/02/24 14:41:47.70 Ad4bERAY.net
half2floatをPascalでは強化していくから、結局AMD対NVの戦いは「half2float」の描画特化対
「Async」の戦いになっていくんだろうね

704:デフォルトの名無しさん
16/02/24 14:51:49.40 NAMaIKUn.net
今後この馬鹿に一切かまうな
かまうから喜んで荒らし続ける

705:デフォルトの名無しさん
16/02/24 15:33:36.04 jXa1RnbL.net
どっかのニュースのコピペばかりで
うんざりするよ
自分の引き出しは空だと言っているようなものだ

706:デフォルトの名無しさん
16/02/24 17:46:05.30 l0DrHc2T.net
>>686
AMDなんか興味ない
お前は糞団子と同レベルの荒らしだ
失せろ

707:デフォルトの名無しさん
16/02/24 17:50:58.28 jXa1RnbL.net
一般利用でCUDAが何に使えるのか
ネタ出せよ
ゲームで使えんの？

708:デフォルトの名無しさん
16/02/24 17:55:56.67 Ad4bERAY.net
>>689
お前はAMDに一番興味あるだろうが糞団子！
お前が去ればこのスレは一気にクリーンになるんだよボケ
お前が一番危機感抱いてるのは倍精度をなくす方向のNVに対して非難が集中する事だけだ
だからこそお前が一番イラネーんだよ屑

709:デフォルトの名無しさん
16/02/24 18:44:53.08 l0DrHc2T.net
>>691
お前病院行けよw

710:デフォルトの名無しさん
16/02/24 18:55:34.70 Ad4bERAY.net
>>692
糞団子よヒヨッたなｗ

711:デフォルトの名無しさん
16/02/24 21:04:29.34 Nmttufaz.net
>>693
お前はいったい何と戦ってるんだ？
日和ったの意味も違うしな
ここのみんなはAMDにもNVにも思い入れはないから
迷惑だから糞団子と一緒に消えてくれ

712:デフォルトの名無しさん
16/02/24 22:15:50.14 teBWCRhn.net
団子よりヤバイ真性のキチガイが団子以外も団子に見えているらしい。

713:デフォルトの名無しさん
16/02/24 22:27:56.59 zahm20jW.net
団子消えろ

714:デフォルトの名無しさん
16/02/24 22:37:00.33 l5BeTFuC.net
>>695
ほんと真性基地だよな。日中でも必死カキコっていうのもな
この人、プログラムに関する話がでないことからして、プログラムやったことないんだろうな

715:デフォルトの名無しさん
16/02/24 22:56:49.71 teBWCRhn.net
>>683
分岐粒度が荒すぎってCPUとの比較なら未だしも、NVIDIAとの比較だったら普通そんなに差は出ないぞ。
差が出るのは64のうち前半もしくは後半の32がほぼ埋まっているのに、反対の32が完全に空みたいな状況が頻発する場合だけ。
まあCUDAからのベタ移植ならあり得ないこともないのだろうが。

716:デフォルトの名無しさん
16/02/25 08:17:21.70 qdgy2oNb.net
プログラムの話しようぜ
そうすれば団子その他プログラム書けない人が消えるだろうから

717:デフォルトの名無しさん
16/02/25 08:22:03.55 qdgy2oNb.net
>>698
まあそうだな
今のnVidia32、AMD64の設定は回路効率と性能効率を考えて美味しいところなんだろうか？
ただの惰性？

718:デフォルトの名無しさん
16/02/25 08:23:54.24 YDhqTq2/.net
将来的に4にするっていこうだが
実行レベルでは
warpは32のままだろうけど

719:デフォルトの名無しさん
16/02/25 13:05:41.93 FCdE8jm8.net
>>692-695 >>697
糞団子は黙ってろ！
文句があるならコテ付けろやコラ！
テメエが鬱陶しいんじゃ、ボケ！
>>698
それも糞団子の自演だよ
NVIDIAの優位性は3dfxを買収した事で得られたソフトノウハウだな
自作板でもそうだけど、よくよく考えるとおかしな文面でごまかすのが団子
たいてい論破されるとどうでもいい専門用語を並べてイカスミ作戦に出る

720:デフォルトの名無しさん
16/02/25 14:04:40.68 Sn2492Ux.net
>>702
まずお前がコテつけてくれ

721:デフォルトの名無しさん
16/02/25 14:47:28.30 Ey2CZbRS.net
不用意に3dfxとか使うと歳がばれるぞ

722:デフォルトの名無しさん
16/02/25 17:48:12.65 8lu6Pire.net
>>702
あの程度の文面を理解できないほど技術に疎いのだな。
そもそも団子認定連呼廚のスタンスがよくわからん。

723:デフォルトの名無しさん
16/02/25 18:22:40.32 Ey2CZbRS.net
好きなんだろ
恋だよ恋

724:デフォルトの名無しさん
16/02/25 19:23:25.50 JdxelD2D.net
糞団子もイカスミも同レベル

725:デフォルトの名無しさん
16/02/25 19:39:25.49 tc7lGvfi.net
団子が消えれば平和になる

726:デフォルトの名無しさん
16/02/25 19:52:29.05 JdxelD2D.net
団子既に消えてるじゃん？
イカスミが煽るから戻って来るんだよ

727:デフォルトの名無しさん
16/02/25 20:58:58.26 qdgy2oNb.net
誰だよイカスミって

728:デフォルトの名無しさん
16/02/25 23:01:45.88 OUVaT1r5.net
nvidia ってC++AMPって力いれてるの？
CUDAが主力なのはわかるんだが。
OpenMPのようにC++AMPがいいところまでいってからtoolkitにマージするつもりなのか
それともC++AMPが自然消滅するのを待っているのかわからん。

729:デフォルトの名無しさん
16/02/25 23:56:26.32 y8R9vLq2.net
>>710
>>702=イカスミ

730:,,・´∀｀・,,）っ-○○○
16/02/25 23:58:06.25 VFYZCeUD.net
C++ AMPは事実上終了したよ
MSはいまNVIDIA ThrustをベースにしたParrarel STLに注力中

731:,,・´∀｀・,,）っ-○○○
16/02/26 00:00:42.44 au4AtN7W.net
Pallarel STLね

732:デフォルトの名無しさん
16/02/26 00:04:42.12 sfGjrhZB.net
>>705
NVはC++AMPとか言うより倍精度をボリュームゾーンから外しにかかってるな
Pascalには全く期待できんよ
IBMの場合は大口契約だから安く調達するだろうけど、それだけ
いずれGPGPU用（テスラ）は値段を上げざるを得ないだろうなあ

733:デフォルトの名無しさん
16/02/26 00:18:06.49 XrDeqd+8.net
それなら死んでないでしょう。
スラストがCUDA用のライブラリと同様に
C++AMPで使うためのものだろうから。

734:,,・´∀｀・,,）っ-○○○
16/02/26 00:46:50.10 au4AtN7W.net
Pallarel STLのバックエンドはC++AMPに限らずOpenACCやOpenMP(4.0), TBBでもいい
NVIDIAが推してるのはOpenACC, IntelはOpenMP

735:デフォルトの名無しさん
16/02/26 00:49:09.70 jDU7chRF.net
>>704
俺3dfxを知らないからググッタよ。イカスミ、かなりの歳なひとなんだな
C++AMPを使っている奴どれぐらいいるんだ？

736:デフォルトの名無しさん
16/02/26 01:09:31.01 puLBdTvq.net
>>714
ミス指摘してさらにひどくミスすんなって

737:,,・´∀｀・,,）っ-○○○
16/02/26 01:13:08.03 au4AtN7W.net
parallelサーセンｗｗｗｗｗ

738:デフォルトの名無しさん
16/02/26 01:36:18.43 1N9hBdg9.net
>>715
最初の頃のテスラは円高もあり、20万位だったが、いまじゃ80万くらいになってもうた。まあA30とかは120万くらいしたんだけど。

739:デフォルトの名無しさん
16/02/26 01:38:37.56 XrDeqd+8.net
>>717
そうだOpenACCだ。勘違いしてたよ。
C++AMPではなかった。
MSだけだとC++AMPはきびしいだろうね。
まだOpenACCのほうがめはあると思う

740:デフォルトの名無しさん
16/02/26 01:42:47.55 XrDeqd+8.net
>>721
その頃とくらべると開発環境がかくだんに良くなってる。
HWのコストだけでなく、そういうの含んでの価格だろうね。

741:デフォルトの名無しさん
16/02/26 03:40:06.50 VdCPJ0Vc.net
>>702
後半はまったくその通りだな団子
どこかで調べた用語を使うが、意味を良く分からずに使うからおかしな日本語になる

742:デフォルトの名無しさん
16/02/26 05:22:49.16 YzxqLjh+.net
nvはpgi買収してopenaccのコンパイラも力入れてるよ
doeのエクサスケールで使うのもcudaじゃなくてopenaccだし

743:デフォルトの名無しさん
16/02/26 05:38:13.56 mUz9Cfpw.net
「,,・´∀｀・,,）っ-○○○」って鳥屋氏でしょ。
悪いけどここに同じレベルの人はいないんじゃない。

744:デフォルトの名無しさん
16/02/26 07:10:07.81 VdCPJ0Vc.net
何のレベル？

745:デフォルトの名無しさん
16/02/26 08:03:13.43 lqbLzerX.net
イカスミが同レベル
どっちも要らない

746:デフォルトの名無しさん
16/02/26 08:04:45.81 VdCPJ0Vc.net
鳥屋氏ってだ～れ？

747:デフォルトの名無しさん
16/02/26 11:35:24.33 J+QrFB1k.net
NVの工作員
GPGPUはVLIW時代のATIGPUを持ち出してネガキャン

748:デフォルトの名無しさん
16/02/27 13:53:00.79 VbYYT6/A.net
鳥屋でググるとこれが出てきた
ｽﾚﾘﾝｸ(software板)

749:,,・´∀｀・,,）っ-○○○
16/02/27 19:58:40.83 WSIY1iVq.net
俺がいてもいなくてもCUDAプログラミングの話ができない無能集団のスレ

750:デフォルトの名無しさん
16/02/27 20:22:31.94 VXpwyn8O.net
囲碁ソフトにディープラーニングが使われ始めてるんだが、
ＣＵＤＡ対応ソフトもそろそろ来るかもしれん。
一般人にも身近な技術になるかもね。

751:,,・´∀｀・,,）っ-○○○
16/02/27 20:27:20.16 WSIY1iVq.net
そのうち教えられたことだけしかコーディングできないクソPGもAIにとって代わられるんだろうな

752:デフォルトの名無しさん
16/02/27 22:07:54.84 unQVppL1.net
なるほど糞団子が嫌われるわけだ

753:デフォルトの名無しさん
16/02/27 22:34:12.86 VbYYT6/A.net
鳥屋ってただのサンデープログラマーだからな
知ったか決めてりゃ嫌われる

754:デフォルトの名無しさん
16/02/27 23:58:13.35 Fq+Tn6zB.net
>>736
鳥屋氏の書いたコード見たことないでしょｗ
申し訳ないけど、ここにいる人たちとは次元が違うよ。
頭が良すぎて理解されないタイプ。

755:デフォルトの名無しさん
16/02/28 00:21:01.28 4gv2LXai.net
>>731
,,・´∀｀・,,）っ-○◎●
と持っている団子が違うが同じ人なのか？　

756:,,・´∀｀・,,）っ-○○○
16/02/28 00:32:14.81 5Pz55yFT.net
君はその名前欄に●入れてそのまま表示されるか試したことがあるかい？

757:,,・´∀｀・,,）っ-○◎○
16/02/28 00:34:20.80 lm9zk8qN.net
テスト

758:デフォルトの名無しさん
16/02/28 00:34:46.41 lm9zk8qN.net
むう、表示されんのう

759:デフォルトの名無しさん
16/02/28 00:53:04.73 4gv2LXai.net
別人なのか？
,,・´∀｀・,,）っ-○◎●
が持っているのは焼き鳥
で
,,・´∀｀・,,）っ-○○○
が持っているのは団子
ということか

760:デフォルトの名無しさん
16/02/28 00:58:05.10 9kjNwUs3.net
鳥屋氏が両方つかってるの見たことあるから本人なんじゃない?

761:デフォルトの名無しさん
16/02/28 01:03:49.87 4gv2LXai.net
なら、次は,,・´∀｀・,,）っ-○◎● で書き込んでくれるな

762:デフォルトの名無しさん
16/02/28 01:06:06.88 9kjNwUs3.net
っていうか●が名前欄に使えなくなった経緯も知らないんじゃ、鳥屋氏のことを知らなくても無理は無いね。

763:デフォルトの名無しさん
16/02/28 01:17:52.65 4gv2LXai.net
>>745
俺もだが団子と言っている奴は鳥屋時代のこと知らないだろ
>>737の言うような奴ならすごいCUDAコード披露して欲しいが
でも、雑談に必死なコテの荒らしって感じだからな。
とりあえず、鳥屋時代のコードどっかにないのか?　見てみたい気がする

764:デフォルトの名無しさん
16/02/28 01:18:45.52 TGNAvpkz.net
糞団子がどんなコード書く

765:か知らんけど、弾道計算の件でシドロモドロになった事実は消えんぞ所詮その程度の知的レベル

766:デフォルトの名無しさん
16/02/28 01:43:25.37 9IJglbed.net
>>725
速度自体は生でcudaやったほうが速いらしいから
これは開発効率を優先してPGIなのかね？
あるいは現時点ではいまいちでも今後の成長を鑑みてとかさ
さすがにdod,doeでも世代ごとのコード書き換えは負担なんだろうか

767:デフォルトの名無しさん
16/02/28 01:50:50.47 9IJglbed.net
キャッシュの増量やシャッフルIA、HyperQ,DP等を全部こみこみで考えると
１コアあたりの実効性能（flaot）はfermi, keplar, maxwellと上がってると考えていいのかね？
flops/core/clockではなくてflops/coreという意味で、かつ理論値での比較ではなくていかに実測値がでるかという意味で。

768:,,・´∀｀・,,）っ-○○○
16/02/28 02:02:26.76 5Pz55yFT.net
俺は中村氏じゃねーから

769:,,・´∀｀・,,）っ-○○○
16/02/28 02:05:54.35 5Pz55yFT.net
2009年当時なら団子はやっぱり団子だったぜ？
URLﾘﾝｸ(www.openwall.com)

当時書いてたのも別に変態的でもない普通のCコードですけどね
URLﾘﾝｸ(download.openwall.net)

770:デフォルトの名無しさん
16/02/28 03:07:32.07 9kjNwUs3.net
>>750
あれ、中村氏もそのAAつかってなかったっけ?
とにかく鳥屋氏(=中村氏)はプログラミングの技術も問題に対するアプローチの仕方も異次元の存在だったな。

771:デフォルトの名無しさん
16/02/28 09:32:39.66 kqHim0z9.net
やっぱり団子って複数人いるよね？
すごく詳しい話をするとおもったら、なんか急に低レベルだったり、
てにをはが変わったりする。

772:デフォルトの名無しさん
16/02/28 09:40:16.99 uncqUlBQ.net
たまに二人の団子が会話することもあるぞ

773:,,・´∀｀・,,）っ-○○○
16/02/28 11:21:05.00 5Pz55yFT.net
> あれ、中村氏もそのAAつかってなかったっけ?
なにそれ見たことない

774:デフォルトの名無しさん
16/02/28 11:43:53.32 F3rkrfCl.net
結局鳥屋が馬鹿団子の振りしてるだけかもだが、詐欺の天才は結局馬鹿より有害
NVのやる事は何でもマンセーではスレ汚しとしか言いようがない
CS機をAMDが独占したからNVは倍精度に手を出せなくなった、と言うといつも発狂
これでは冷静な議論が出来ない

775:デフォルトの名無しさん
16/02/28 11:46:36.13 1t5d585j.net
おまえはcuda関係ないんだからくるなよ
かまってちゃん

776:,,・´∀｀・,,）っ-○○○
16/02/28 11:51:31.77 5Pz55yFT.net
そっち界隈しばらくチェックしてなかったけど海外のﾊｶｰ面白いことやってるね。
ちょうどCUDAに特化した話題だ。
MaxwellのLOP3.LUT命令を使ったビット演算の高速化テクニックについて興味ある人は
一度この講演ビデオ観ておくといいと思う。
URLﾘﾝｸ(www.irongeek.com)
実際問題AVX-512のvpternlogもLOP3.LUTと引数互換なんだわ
ぶっちゃけソース置換するだけで移植可能

777:デフォルトの名無しさん
16/02/28 12:03:43.36 F3rkrfCl.net
>>757
鳥屋＝糞団子！テメエこそCUDAの何が分かるんだボケ！

778:デフォルトの名無しさん
16/02/28 12:06:45.18 1t5d585j.net
ハイハイお薬の時間でちゅよ

779:デフォルトの名無しさん
16/02/28 12:18:13.04 F3rkrfCl.net
単発のお時間がきまちゅたね～
鳥屋＝糞団子が自作板からこっちのスレの巡回時間が来たみたいｗ
本当に鳥屋が使える天才なら２ちゃん談義なんかしねえな
１０�

780:N前ならゲーム業界か、少し前なら京に関わるか或いはアメリカでイラン向けバックドアを仕掛けるお仕事か… どっちにしろヒマを持て余すようではお里は知れてる

781:デフォルトの名無しさん
16/02/28 12:24:17.80 1t5d585j.net
ハイハイお部屋に戻りましょうねぇ

782:,,・´∀｀・,,）っ-○○○
16/02/28 12:37:00.70 5Pz55yFT.net
URLﾘﾝｸ(community.amd.com)
AMDのGPUにはLOP3.LUT相当の命令がないことにユーザーからも不満が噴出しているようです

783:デフォルトの名無しさん
16/02/28 12:44:20.68 F3rkrfCl.net
単発でも見事につられまちゅね～wwwww
団子＝鳥屋ちゃんピンチでちゅね～wwwwww

784:デフォルトの名無しさん
16/02/28 12:51:25.16 1t5d585j.net
ハイハイご飯時間ですよおじぃちゃん

785:デフォルトの名無しさん
16/02/29 16:54:00.73 XMRi5hV6.net
なんだかすごく質問しにくい流れなんですがいいですか？
バイトニックソートのプログラムを作ってみまして、
要素数512を境にGPUの方が速くなったのは良かったんですが、
要素数8192くらいからGPUの時間増加の傾きがCPUより悪化してしまって、
1048576ともなるとほとんど大差ないくらいになってしまいました。
これが普通なのか、おかしいのか、
おかしいなら原因として何がありそうか教えてほしいです。
一応可能なところはshared memory使ってますが、要素数256以降は
比較の組がとびとびになるはずなのでglobal memoryを直接読んでます。
以下、ソートを10000回繰り返した際の1回あたりの所要時間です。
要素数 CPU[s] GPU[s] CPU/GPU
2 0.00000 0.00004 0.004
4 0.00000 0.00005 0.008
8 0.00000 0.00005 0.011
16 0.00000 0.00006 0.020
32 0.00000 0.00007 0.036
64 0.00001 0.00008 0.099
128 0.00002 0.00009 0.229
256 0.00005 0.00010 0.522
512 0.00013 0.00013 1.027
1024 0.00031 0.00016 1.909
2048 0.00076 0.00025 2.975
4096 0.00179 0.00036 4.919
8192 0.00423 0.00068 6.248
16384 0.00933 0.00202 4.627
32768 0.02142 0.00637 3.363
65536 0.04903 0.01776 2.761
131072 0.10829 0.05003 2.165
262144 0.24928 0.13078 1.906
524288 0.54765 0.32437 1.688
1048576 1.22586 0.77101 1.590

786:デフォルトの名無しさん
16/02/29 17:56:37.64 +ARXUC0S.net
鳥屋、答えてやれよ

787:,,・´∀｀・,,）っ-○○○
16/02/29 23:54:40.69 72g2TQWh.net
>>767
バードショップ氏と話しがしたいなら @chapuni に凸ってきたら？

788:,,・´∀｀・,,）っ-○○○
16/03/01 00:01:36.14 9XwMWslZ.net
バイトニックソートはキャッシュメモリで収まる範囲内の小さなデータ集合に対して有効
サイズが大きくなるとGPUのローカルメモリから外れて大幅にパフォーマンスが落ちる
CPUのほうが低レイテンシ・大容量のキャッシュ積んでる分だけ有利になるわけだ
CPUのキャッシュに収まらない量になれば再びGPUのほうが上回るはずだ
まあそのレベルに達する段階でO(n log n)のソートの検討の余地があるが

789:デフォルトの名無しさん
16/03/01 00:02:13.26 epSXE3Ge.net
>>766
Nvidiaならおかしいことはよくある。気にするな
GPGPUでおかしいことをさけたいなら倍精度の自慢のAMDを使う

790:デフォルトの名無しさん
16/03/01 00:33:31.30 k65RqU8V.net
質問者がシェアードメモリって言ってるのにキャッシュとかいい加減なこと言ってる
シェアードメモリに言及しないなんてあり得ない
そもそもCUDA使ったことないんだろうな
やっぱ糞団子は低レベルだな

791:,,・´∀｀・,,）っ-○○○
16/03/01 00:41:11.27 9XwMWslZ.net
いったい何年前の話をしてるんだ
Fermiから階層型キャッシュ導入してるが
URLﾘﾝｸ(www.gdep.jp)

792:,,・´∀｀・,,）っ-○○○
16/03/01 00:46:09.76 9XwMWslZ.net
GPUについてはどっちにも解せる「ローカルメモリ」と言い換えてる
ちゃんと読めない子は呼吸を止めて1秒あなた新鮮だけど煮魚

793:デフォルトの名無しさん
16/03/01 12:21:21.56 /z3eDKB8.net
>>771
結局団子を買いかぶってた奴は団子自身だろwwwwwwwwww
糞っぷりを言い触らされたくないﾁﾝｹなプライドが虚勢を張りたくなる理由なんだろう

794:デフォルトの名無しさん
16/03/01 12:24:00.41 CYOvNsDD.net
ケンタッキーフライドチキンがどうしたって

795:,,・´∀｀・,,）っ-○○○
16/03/01 12:31:48.31 iam2QPf0.net
GMにマッピングされたメモリは一定の局所性があればキャッシュにマッピングされる
常識が通じないバカが勝手に自爆してるな

796:754
16/03/01 15:10:24.97 oQoWs5hY.net
>>769
キャッシュメモリ……
すいません、当方キャッシュについては不勉強でして、よくわかってません。
多分L1とかL2とか書いてあるやつだと思うのですが、手元の参考書が古い(6年前)もので……。
DeviceQueryだとL2 Cache Size: 524288 bytes って出るのでこれでしょうか。
Total amount of shared memory per block: 49152 bytes とか
Total number of registers available per block: 65536 とかもあります。
英語版Wikiの平均計算時間O(log(n)^2)parallel timeもよくわかってなかったりします。
log(n^2)なのか(log n)^2なのかよくわからんとです。
>>770
倍精度だと性能がうんたらとややこしかったので、単精度整数のソートなんです。
正確には同サイズの単精度整数配列2つを作り、
片方を基準にソートして、もう片方を一緒に並び替えてます。
構造体にしてもいいんですが、一緒に並び替えたほうだけが後々必要なデータでして。
最終的にはソートした結果を使って色々処理するためのプログラムなんですが、
現状だとこのソートで全体の8割くらい時間食っちゃってるんですよね。
ソートしなかったらもっと遅い(というかO(n^2)になる)ので無意味ってわけでもないんですが。

忘れてましたがGeForce GTX 760を使ってます。
以前機会があったので、別のGPU(GTX570だった気がする)でほぼ同じ計算させてみたこともあるんですが、
そっちだともっとマシでした。CPUより確実に速い、と胸を張って言えるくらい。
スペックの違いを加味しても、うちのGPUだけ下手したらCPUより遅いってのも変だなあ、と。

797:デフォルトの名無しさん
16/03/01 15:16:26.28 oDNKlTv2.net
たぶんfermi世代とkepler世代でのL1Dの扱われ方の違いとか？

URLﾘﾝｸ(news.mynavi.jp)

798:デフォルトの名無しさん
16/03/01 20:11:04.94 /z3eDKB8.net
要約すると団子の答えは答えになってない

799:754
16/03/01 21:01:21.25 oQoWs5hY.net
>>778
参照先読みました。キャッシュの話だったので自信はありませんが、
Fermi(GX570)世代のキャッシュは容量超えると(多分)通信の速いL1D等に退避されてたけど、
Kepler(GTX760)世代だと通信の遅いglobalに退避されるようになった、ってことですか？
さすがにアーキテクチャの仕様だと自分のスキルじゃ対応できません……。
>>779
答えになってないというか、私の知らない範囲の回答だったんでよくわからなかった感じです。
言ってることは766さんの参照先と多分同じなんだと思います。自信はありませんけど。
で、みなさん改善する方法はないでしょうか……。
大

800:規模計算にウンタラ使うとカンタラがヤバいから避ける、みたいなことありませんか？オプションにホニャララって追加すれば設定が変わる、とか(実はオプションもよくわかってない)。大規模の時、キャッシュ代わりにあえてsharedを定義しても意味ないのかな…普通はないよな…

801:デフォルトの名無しさん
16/03/01 22:50:15.99 1eMSB1ZO.net
また団子が知ったかぶりをかましたのか！（呆れ）

802:,,・´∀｀・,,）っ-○○○
16/03/01 22:57:33.44 xcdR7XnG.net
そもそもキャッシュはシェアードメモリの退避先ではなくグローバルメモリの一部の読み書きを高速化するためのもの
シェアードメモリに収まらないデータのソートで遅くなる問題なのでシェアードメモリは全く関係ない

アホが自爆すんなよ

803:,,・´∀｀・,,）っ-○○○
16/03/01 23:00:19.76 xcdR7XnG.net
データ全体がキャッシュに収まらない場合はキャッシュローカリティを意識した演算順序の最適化をする
これはCPUでもGPUでも理屈は変わらない

804:,,・´∀｀・,,）っ-○○○
16/03/02 00:01:12.12 Lh/popYV.net
自分の答えを示さず謂れのないイチャモン付けに必死になる奴ほど
スレにとって邪魔な存在はないね

805:デフォルトの名無しさん
16/03/02 01:05:18.36 WNl5zi/w.net
団子はレスをまとめることを覚えて

806:754
16/03/02 01:23:35.90 n1GLxV/f.net
>>782-783
キャッシュローカリティって何さ…となったので、Google先生に勧められた
wikiの『参照の局所性』を読んで、ちょっとわかった気がします。
自分が作ったバイトニックソートは大規模データの場合、
各threadがほとんど毎回前回と異なる&近傍でもないメモリ参照することになるので
時間的にも空間的にも最適化ができてないみたいです。
ない知恵絞ってif文減らして実質1つにした結果がこれだよ！
あ、いや、thread単位はそうでも、warpとかblock単位で見れば近傍データなのか…？これはバンクの話か…？
実装のややこしさを飲み込めばシェアソートの方が参照の局所性は大きくしやすいのかな…？

まだよくわかってないことが1つありまして、
プログラム上では何万何十万の計算を並列に扱ったとしても、
物理的にはハード側の制限があるわけじゃないですか。
GTX760ならCUDAコア1152基なわけで、一万を並列化しても
実際には同時じゃなくて9回くらいに分けて順に処理する、みたいな。
となると、その9回で各CUDAコアは別のメモリを参照するわけなんですが、
この時前回のキャッシュって残るんでしょうか？　残らない…ですよね？
それともカーネルとしての処理が終わるまでは残るんでしょうか？
はたまたプログラムが終わるまでは念のため残しておく、とか？
キャッシュの利用自体が悪いんじゃなくて、
キャッシュにも収まらないデータ量がよくないってのはわかってるんですが、
なんかこのあたりの理解がまだ曖昧なんです。

次ページ