【GPGPU】くだすれCUDAスレ part7【NVIDIA】

【GPGPU】くだすれCUDAスレ part7【NVIDIA】at TECH

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 - 暇つぶし2ch200:183
15/09/08 02:08:23.68 V+WRCKAL.net
少し分かったことがありました
グローバルで
const int i = 1;
const double d = 1;
と定義すると
__device__内でiは使えてdは使えませんでした
error: identifier "d" is undefined in device code
とエラーが出てしまいます
どうしてdouble型だとエラーになるのでしょうか？

201:デフォルトの名無しさん
15/09/11 23:39:48.38 myHMFCwl.net
floatやlongは？

202:デフォルトの名無しさん
15/09/14 22:17:35.79 2IqUP8/H.net
floatはダメでlong intはOK
だめならだめで引数とすれば良いんですけどね
整数だけというのはcudaの仕様ですかね？

203:デフォルトの名無しさん
15/09/15 09:01:24.15 10B5WSYL.net
なんでだろうな。全く調べていないので100％想像だけど、
GPU上にstatic変数が確保されているとは思えないから、
（無いとは言い切れないが）
コンパイル時に定数展開しているんだろうな。
C++の言語仕様としてconst intは定数展開していいし、
（厳密な言い方だと間違いかもしれん）
クラスのstaticメンバにしても宣言のみで定義が不要ってのがあるから、
それに則った処理なんじゃなかろうか。

204:デフォルトの名無しさん
15/09/15 14:26:04.38 8ArN6+Sd.net
Visual Studioでエラーでた
似たような状況の人いたら教えてほしいです
環境
CPU core i5 4570
GPU GTX 980
Visual Studio 2010 Ultimate
CUDA v7.0
NSIGHT v5.0
使用言語はC
エラーが起こる状況↓
__device__ function1(){
int array1[ 1000 ];
function2( array1 );
}
__device__ function2( int *array1 ){
int array2[ 1000 ];
for( int k = 0 ; k < 1000 ; k++ ){
array1[ k ] = rand(); // rand()は何らかの乱数を返す関数
array2[ k ] = rand();
}
}
function1を呼び出したとき，時折だがarray1の値がarray2の値と同じになってしまう
エラーが起きた状況で以下のことは確認済み
・array1,2ともにグローバルメモリに確保されている
・array1とarray2のポインタは異なっている
・rand()が異なる値を返している
また，array2の宣言をfunction1で行い，function2にarray2のポインタを返すことで回避ができる

205:デフォルトの名無しさん
15/09/15 14:29:46.25 JgRUCOJR.net
全然知らんけど、スタックオーバーフローじゃね？
static int array2[1000];にすれば解決

206:GPU太郎
15/09/16 01:21:13.95 6Rc88cmlK
>>179
＞Nvはゲームにゲーム用VGAには倍精度演算イラネから省くって流れだか

結局その理由は、PS4/XBoxONEにGCN世代GPUを獲られたからだ
つまり言葉は悪いが「ゲーム機は（DX12世代を見据えた）実験台」
とAMDは割り切っていた

そのためにGPGPU市場を見据えた大胆な実験を特にPS4で実行している
PCもその流れを受けて、これから海外パブリッシャーがどんどん超大作をそちらに合わせて出していく

これからは、AMDのFirePROにシフトするべき

207:デフォルトの名無しさん
15/09/17 00:01:30.77 6wQsOGVx.net
>>193
device修飾してないだけとか馬鹿なおちはないよな？

208:デフォルトの名無しさん
15/09/27 11:58:09.30 X6SDQWu/.net
VS2013　cuda7.0で
intelisenseがcudaの関数やthreadIdxなんかに赤線つけるんだけど
intelisenseを無効化させる方法ではなく、対応させられない？

209:デフォルトの名無しさん
15/09/29 16:27:34.89 ++1fLQj6.net
CUDAって余計な決まり事が多くてGLSLよりわかりにくくなってると思うんだけど

210:デフォルトの名無しさん
15/09/30 06:44:35.73 OmftLuOo.net
>>201
#include<device_launch_parameters.h>
で消えない？

211:デフォルトの名無しさん
15/10/01 00:53:18.68 44xt2+tf.net
cuda_header.hに以下をまとめて、これを.cuでインクルードしてるんだけど、インテリセンスがエラーとして表示したままなんだ。
また従来のcutil系の代わりのhelper関数のヘッダが開けないともなぜか出る。（プロジェクトの追加のインクルードDirには指定してあるんだが・・）
でもコンパイルはされるんだよ・・・。インテリセンスのキャッシュクリアしようと考えたんだが２０１３のメニューにはないみたいだし・・。
#include <cuda.h>
#include <cuda_runtime.h>
#include <device_launch_parameters.h>
#include <device_functions.h>
#include <math_constants.h>
#include <helper_cuda.h>
#include <helper_math.h>

212:デフォルトの名無しさん
15/11/11 20:12:32.44 1VxiIponn
超初歩的な質問ですがよろしければお願いします
環境 windows7 64bit Visual Studio 2013 community CUDA7.5
CUDAインストール時にはVS2013をインストール済みと判定するものの
コマンドプロンプトからnvccでサンプルを実行させると
nvcc fatal　 : nvcc cannot find a supported version of microsoft visual studio
とエラーが発生します
パスなどの設定の問題なのでしょうか？

213:デフォルトの名無しさん
15/11/11 20:55:36.03 FAkUvGGr.net
超初歩的な質問ですがよろしければお願いします
環境 windows7 64bit Visual Studio 2013 community CUDA7.5
CUDAインストール時にはVS2013をインストール済みと判定するものの
コマンドプロンプトからnvccでサンプルを実行させると
nvcc fatal : nvcc cannot find a supported version of microsoft visual studio
とエラーが発生します
パスなどの設定の問題なのでしょうか？

214:デフォルトの名無しさん
15/11/11 22:32:08.88 kzShUi9X.net
コマンドプロンプトからcl.exe叩くのと同じだろう。
VSの開発者コマンドプロンプトからやってみれば？

215:デフォルトの名無しさん
15/11/12 06:18:25.24 oFlt1n6m.net
Communityでもいけるんだ？
少し前に断念してProにした記憶がある

216:デフォルトの名無しさん
15/11/16 00:30:41.16 wFEoXPFZ.net
質問です
OpenGLとCUDAを使って流体のシミュレーションをしようと考えています
OpenGLの描画とCUDAの計算を別スレッドで行ってCUDAの計算の完了を待たずに描画をしようとするとプログラムが落ちてしまいます
そもそもこういう使い方は間違いですか？
GPUを二つ使わないと不可能なのでしょうか？

217:デフォルトの名無しさん
15/11/16 04:31:20.12 yRzaBdvH.net
CUDAを待たずにどういったデータで描画してるの？

218:デフォルトの名無しさん
15/11/16 11:12:07.65 wFEoXPFZ.net
正確には
　　　　　　CUDAで計算
　　　　　　　　　　↓
計算用と描画用として二つのデータをメモリにコピー
　　　　　↓　　　　　　　　↓
グラフィック描画　　CUDAで計算　　←ここを並列化したい
　　　　　　　　　　　　　　　↓
計算用と描画用として二つのデータをメモリにコピー
　　　　　↓　　　　　　　　↓
グラフィック描画　　CUDAで計算
　　　　　　　　　　　　　　　↓
といった処理の流れです
描画と計算の処理の合計が少しでも速くなれば最終的には速くなる見込みなんですが、描画とCUDAは同時にはできないのでしょうか？

219:デフォルトの名無しさん
15/11/16 13:12:47.35 tPyDrti9.net
>>209
そういうのは環境、sdk、cc、計算モード、HWによっても違うと思うんだけど。
大前提として計算してる最中でも、描画分のリソースは残してるのかね？

220:デフォルトの名無しさん
15/11/16 18:15:47.96 wFEoXPFZ.net
すいません何故か解決しました
OpenGLによる描画をサブスレッドにしていたところメインスレッドにしたら問題なく実行できるようになりました

221:デフォルトの名無しさん
15/11/19 10:22:54.59 78JlLUmP.net
AMD、GPGPUの向けの取り組み「ボルツマンイニシアチブ」を発表。CUDAとの互換性も提供 | スラド
URLﾘﾝｸ(srad.jp)

222:デフォルトの名無しさん
15/11/19 18:31:49.90 xKyOvSDo.net
>>214
いまや一般向けプログラムですらGPUを使うことが普通になったから、
これがC++コンパイラーのデファクトになるだろうな。
DX12,VulkanでGPUするならAMDって流れにまってしまったからな

223:デフォルトの名無しさん
15/11/19 20:24:21.71 FjjW9TL1.net
え？
GPGPUの世界は圧倒的にNVIDIAなんだけど？

224:デフォルトの名無しさん
15/11/19 20:26:18.29 Zq45eYUV.net
PC用GPUでもAMDはシェア2割切ってるでしょ

225:デフォルトの名無しさん
15/11/19 21:33:26.48 ngiRjlY7.net
産業向けのガチのやつならNvidiaでくだ
カジュアルな一般向けならIntelをOpenCLでってとこかな

226:デフォルトの名無しさん
15/11/19 22:05:05.00 btQoS/xZ.net
開発の手間で言えばCUDAが一番楽。NV限定にできるなら趣味でやるにしてもそれが一番手軽。
OpenCLならせめてAMD。IntelはOpenCLの経験を積んだ苦労と向け。

227:デフォルトの名無しさん
15/11/19 22:09:50.57 ngiRjlY7.net
個人向けやオフィスPCでグラボ別にあるのって少数だから仕方ない。
数を優先するならむしろNvidia切ってIntelのみ対応という手もありうる。

228:デフォルトの名無しさん
15/11/19 22:10:45.45 ngiRjlY7.net
慣れてるし開発ツール揃ってるからNが一番楽なんだけど。

229:デフォルトの名無しさん
15/11/19 22:48:28.04 btQoS/xZ.net
HD GraphicsでOpenCLやってもCPUと大して性能変わらんぞ？
それに、オンボードグラフィックスのPC自体は多いだろうが、OpenCL1.0しか動かんとか
そもそもOpenCLが使えないのも少なくない。間口でいうならSSEでもやるほうがまし。
そうでなければAMDでOpenCL開発してNVとIntelで動作確認ってところだな。

230:デフォルトの名無しさん
15/11/19 23:05:53.48 ngiRjlY7.net
>>222
CPUの代わりというよりは少しでも計算パワーがほしい場合もあってさ。
GPU使ってる間CPU使えるなら２倍になるじゃん？
あるいはBGでうごかしてフロントでは通常のアプリ使えるじゃない？
絶対的なパワーというよりはそういう所に使いでを見出してる。
確かにOpenCLはHWアーキ変更激しいし世代でがらりと変えてくるからやりにくそうなんだけど。

231:デフォルトの名無しさん
15/11/19 23:06:47.02 ngiRjlY7.net
間違い。OpenCLではなくてIntelのGPUね

232:デフォルトの名無しさん
15/11/19 23:36:03.63 u4ZVkU4H.net
AMD関連使って良かったと思った印象が一度も無いから使いたくねえな

233:デフォルトの名無しさん
15/11/19 23:54:31.95 btQoS/xZ.net
>>223
つまり、少しでもパフォーマンスは欲しいけどdGPUほどの性能は必要なくて、
数を優先するけどオンボードグラフィックスでOpenCLが動く環境に限定していいと。
最初の「カジュアル」からは想像つかないピンポイントな要件だなｗ

234:デフォルトの名無しさん
15/11/20 00:37:51.03 XYOZ5eLO.net
カジュアルGPGPUなら内蔵GPUでOpenCL2確定
一方、外GPUを使う高性能GPGPUものは昔はNvidiaが圧倒していたけど、いまはAMDが圧倒しているんだろ？

235:デフォルトの名無しさん
15/11/20 00:49:06.07 H4wqwi3u.net
>>226
そうなのかなあ？自分の文章の書き方が良くないのかもしれないが
ほとんどは内蔵GPUしか期待できないから、
その範囲で少しでも計算パワー稼ごうと思ったらそれしかないように思うのだけど
dGPUほどの性能はいらないわけじゃなくて、ほとんど期待できないからしかたなくという感じ。

236:デフォルトの名無しさん
15/11/20 01:19:10.06 mr/p17yR.net
組み込みは知らないけど汎用PCでAMDが圧倒した話なんて聞いたことない

237:デフォルトの名無しさん
15/11/20 05:55:05.61 M/+Jbdu5.net
bitcoin マイニングでは AMD 一択だったようだが

238:デフォルトの名無しさん
15/11/20 07:13:28.40 08M9JH

239:WM.net

240:デフォルトの名無しさん
15/11/20 07:48:52.29 kIzUFPbb.net
bitcoinは専用ASICが開発されてとっくにそっちが主流になりました
GPGPUでやったところで、最早電気代のもとを取ることすらできない
GPGPUが最適といわれるのはASIC以前にFPGA化して売り出すほどの人気もない
マイナー暗号通貨くらいでそんなニーズが世界的な需要をけん引することなんて
ありうるわけがないのだ（需要が少ないからこそGPGPUでやってるわけだし）

241:デフォルトの名無しさん
15/11/20 07:54:46.98 h5Le2W6O.net
>>228
一般に配布するアプリでなるべく多くの環境で動かしたいというならOpenCLで、
内蔵GPUしかない人は動けば御の字、もっと速く動かしたければちゃんとしたGPU
買ってね、でいいと思うが。
社内ツールとかで外付けがほとんど期待できないのなら、たいして速くならない
割りに動かないリスクばかり大きいんで素直にCPUのがマシ。

242:デフォルトの名無しさん
15/11/20 08:15:06.13 lXZVvFkG.net
GPUばりばり使ってますってアピールしているプログラムで、avxもsseも使えないようなプログラミングしている例も多いからなぁ。

243:デフォルトの名無しさん
15/11/20 08:21:26.00 kIzUFPbb.net
内蔵GPUはどのみちメインメモリの帯域で頭打ちになるのでたいていの問題では
AVX使ったほうが速いんだよね
どっかのA社のはCPUコア側のメモリ帯域にリミッタがかかってて内蔵GPU側も使わないと
フルに帯域を使えないうえCPU側のAVX性能が残念だから
そもそもそれ専用にプログラム書くほどの市場がない
CUDAは一握りでもちゃんと労力に見合った金を払ってくれる法人ユーザーが一定数いるから
ビジネスとして成立するんだよ。その点法人皆無で貧乏人しかいないA社ユーザーじゃ無理

244:デフォルトの名無しさん
15/11/20 11:47:48.38 mr/p17yR.net
ビットコインマイニングとか普通じゃない使い方で普及してるかどうかはどうでもよくないか

245:デフォルトの名無しさん
15/11/27 23:57:44.09 tzomtYgx.net
内臓GPUにこだわるのはそもそもGPUに興味もない人が増えていて
そんな人までプログラム、GPGPUに参加したり利用する可能性が高いからなんだよな
GPU自体ニッチ向けの商売になりつつあるし

246:デフォルトの名無しさん
15/11/28 00:01:22.67 KoXr/JyJ.net
>>211
DX12でGeForce全般がAsync、非同期処理が苦手といった話があったけどそれとは関係ないよね？
自己解決ってことはやっぱ非同期で処理してたのが原因かもしれないけど
（サブで描画するのは普通にお行儀が悪いけど）

247:デフォルトの名無しさん
15/11/28 00:33:01.21 CG0HQ1xP.net
単にOpenGLの使い方の問題だろ。context作ったスレッドと別のスレッドからアクセスしようとした。

248:デフォルトの名無しさん
15/11/29 06:40:00.31 Ciaig/FJ.net
Win7PCに搭載されたQuadro4000とVC2012のC++AMPでfloatの計算をさせると「グラフィックスが応答しないのでリセットしました」とかメッセージをだしてプログラムが異常終了してしまう。
計算量はCPUを使った場合に８スレッド＋AVX2で30分くらい。一枚のグラボで画面表示とGPGPU計算の両立は無理？ CUDAを使えば可能なのだろうか？

249:デフォルトの名無しさん
15/11/29 06:56:59.57 PzHZjgEI.net
少し前のレス見てごらん

250:デフォルトの名無しさん
15/11/29 19:54:46.97 jxlspYCF.net
>>240
GPGPUではよくあること
そんなことがよくあるから一般PCでGPGPUが激活用されない
一般PCではGPGPUよりOSによる画面表示の方が大事だから、画面表示を激妨げるのものは殺す
GPGPUを必死したいならGPGPU用VGAと画面表示用VGAを搭載する
画面表示を激妨害しないようなゆとりGPGPUプログラムにする

251:デフォルトの名無しさん
15/11/29 22:14:39.86 Ciaig/FJ.net
＞＞２３１
レスありがとう。
やっぱ、無理なんだ。
動くのは、サンプルだけか。

252:デフォルトの名無しさん
15/11/29 22:41:35.63 eJ1soHzz.net
GPGPU始めたときに最初に引っかかるところだな。
これの一番下。
URLﾘﾝｸ(msdn.microsoft.com)

253:デフォルトの名無しさん
15/11/29 23:16:26.96 vsLNXKl8.net
QuadroってTCCモードにできなかったっけか？

254:デフォルトの名無しさん
15/12/02 07:09:10.66 REHK1l6p.net
Quadro自体結構前の世代のグラボじゃないっけ・・・

255:デフォルトの名無しさん
15/12/09 05:38:34.32 0m997ITy.net
２秒たったらハードウエア割り込みをかけて一瞬だけ画面表示させて、TDRが問題にならないように制御できないのかな？

256:デフォルトの名無しさん
15/12/09 16:39:41.14 OazooE89.net
あんたエンジニアに向いてないなw

257:デフォルトの名無しさん
15/12/09 19:33:54.62 wnEGaksG.net
いや、むしろ向いてるかも
デスマーチを突破するにはそれぐらいのやっつけ仕事が出来なきゃねw

258:デフォルトの名無しさん
15/12/10 02:04:50.93 0cE1JGhL.net
勢いでwindows10にしてからcudaが一切認識しなくなった・・・
version7.5、ドライバ最新版入れてGPU-ZでCUDAにチェック入っているのに初期化で失敗する。
付随してwaifu2x-caffeとかも動かなくなってるしもしかしてまだwin10には対応してなかったのか。

259:デフォルトの名無しさん
15/12/10 02:30:34.40 DGBX2/sF.net
>>250
URLﾘﾝｸ(docs.nvidia.com)
によるとサポートしてそうだけど

260:デフォルトの名無しさん
15/12/10 22:46:54.47 0cE1JGhL.net
>>251
だよね・・・
最新ドライバや少し古いバージョンを入れてみるとGPU-Zでチェックに入ってるんだが
cudaを使うソフトがことごとく検出できませんでしたと出てサンプルプロジェクトも強制終了する。
NVEncのためにCUDAが使えなくなったとかいう記事見たけど、まさかこれが理由ってわけではないよね

261:デフォルトの名無しさん
15/12/10 23:22:08.77 9vd2ccw+.net
>>252
win10のvs2013で7.5問題なく使えてる。ついてくるサンプル、ビルド・実行ともに。

262:デフォルトの名無しさん
15/12/10 23:59:35.52 Qmth+aWu.net
今のNvidiaはAMDに比べてかなり安定度低いからな

263:デフォルトの名無しさん
15/12/11 02:14:41.31 f48gwmmB.net
>>252
GPU-ZでCUDAが見えるのにアプリケーションが動かないってのはRuntime DLLが
見つからないんじゃないのか？
どっちにしても、CUDAのどの関数を呼んだときに落ちるのか、あるいはそもそも
最初から起動できないのか、どこで落ちているかくらい調べることはできるだろ。

264:デフォルトの名無しさん
15/12/26 22:42:40.07 Xbomr4ek.net
>>249
そんな態度でいるからデスマーチに陥るんじゃ？
いざとなった時の処世術は身につけておかなければいけないとは思うけど

265:デフォルトの名無しさん
16/01/10 19:11:06.55 EetmQxdp.net
おかげさまでCUDAでchainer使えるようになりました。
爆速で進捗状況見てるだけで嬉しいです。
本当にありがとうございました。

266:デフォルトの名無しさん
16/01/13 07:52:00.07 6qdfgrgw.net
使えなかった理由は何だったのかと

267:デフォルトの名無しさん
16/01/17 02:52:40.35 u0dhvow6W
教えていただきたいことがあります。
ubuntu14で、chainer1.5.1のmnistをGPUで計算できるか試行錯誤中です。
python train_mnist.py --gpu 0 #エラー　
sudo python train_mnist.py --gpu 0 #エラー
python train_mnist.py --gpu 0 #うまく動いた
と、sudoをつけて外しただけで、うまく動いた理由を知りたいのです。自分の操作が正しいのか間違ってるのかよくわからなくなってきました…
ログのリンクも添付しています。2つは同じファイルです(dotupはアップローダーの都合上zip圧縮しています)

事前の処理として、vgaのドライバ、cudaとcudnnを入れてパスを通しています。
またchainerのmnistも、cpuの処理ならエラーは出ずに動いていました。

操作は
python train_mnist.pyを実行してcrl+cで止めた。
python train_mnist.py --gpu 0を実行してエラーになった（30-38行目と同じエラー）。
その後、再起動
1行目：VGAの番号を取得した（GTX750tiのIDが0）
28行目：enter押しただけ
29行目：python train_mnist.py --gpu 1　なんとなくid1で動かしてみた。エラー
39行目：id2で動かしてみた。内蔵gpuを使うかも？と思ったがエラー
49行目：id0で試すもエラー
59行目：sudoつけてみてエラー。パスを引き継いでないからnvccがない（=CUDAが見つからない）、cudnnが無いというエラーが出ているのだと思います。
91行目：sudo外したら普通に動いた

URLﾘﾝｸ(www.dotup.org)
URLﾘﾝｸ(www1.axfc.net)

268:デフォルトの名無しさん
16/01/17 03:23:46.57 lMNqpq/q.net
教えていただきたいことがあります。
ubuntu14で、chainer1.5.1のmnistをGPUで計算できるか試行錯誤中です。
python train_mnist.py --gpu 0 #エラー　
sudo python train_mnist.py --gpu 0 #エラー
python train_mnist.py --gpu 0 #うまく動いた
と、sudoをつけて外しただけで、うまく動いた理由を知りたいのです。自分の操作が正しいのか間違ってるのかよくわからなくなってきました…
ログのリンクも添付しています。2つは同じファイルです(dotupはアップローダーの都合上zip圧縮しています)
事前の処理として、vgaのドライバ、cudaとcudnnを入れてパスを通しています。
またchainerのmnistも、cpuの処理ならエラーは出ずに動いていました。
操作は
python train_mnist.pyを実行してcrl+cで止めた。
python train_mnist.py --gpu 0を実行してエラーになった（30-38行目と同じエラー）。
その後、再起動
1行目：VGAの番号を取得した（GTX750tiのIDが0）
28行目：enter押しただけ
29行目：python train_mnist.py --gpu 1　なんとなくid1で動かしてみた。エラー
39行目：id2で動かしてみた。内蔵gpuを使うかも？と思ったがエラー
49行目：id0で試すもエラー
59行目：sudoつけてみてエラー。パスを引き継いでないからnvccがない（=CUDAが見つからない）、cudnnが無いというエラーが出ているのだと思います。
91行目：sudo外したら普通に動いた
URLﾘﾝｸ(www.dotup.org)
URLﾘﾝｸ(www1.axfc.net)

269:デフォルトの名無しさん
16/01/17 04:58:38.94 rTwmHzKS.net
普通にsudoユーザー環境でcudaにパスが通ってないだけ
パスの通し方がわからなかったらこのスレじゃなくてLinuxの初心者スレで

270:デフォルトの名無しさん
16/01/17 14:25:56.74 lMNqpq/q.net
>>261
ありがとうございました。

271:デフォルトの名無しさん
16/01/21 02:42:05.52 ZU2ddnih.net
素人な質問なんですがコア数×10スレッド立てたときとコア数と同じスレッド数で10ループした場合とでは前者の方が1.5倍くらい早かったんですけど何故でしょうか
物理的に真に並列で動作するのはコア数と同じスレッド数ではないのですか
最適なスレッド数が分からなくて困ってます

272:,,・´∀｀・,,）っ-○○○
16/01/21 03:02:10.96 tV143knu.net
Core数ではなくWarp数に合わせるべし
Maxwellの場合はコア数とWarp数は一致してるけどね
コア数の倍以上のスレッド数を立ち上げるメリットは、ロード・ストアを含む命令間の
レイテンシが隠蔽されるのでパイプラインの充填率が上げやすくなる。
半面、1スレッドあたりで使えるレジスタ本数が少なくなるので
ロード・ストアを頻発するほどのレジスタ不足になるのは本末転倒なので
並列化は程々に。
これに特に明確な基準はない。最適なスレッド数はトライ＆エラーで決める。
慣れてくるとPTXとかCUBINを逆アセンブルして決める場合もある
（昔、理研で重力を自在に操る高貴なる男性研究者がメールで教えてくれた方法）

273:デフォルトの名無しさん
16/01/21 03:04:52.51 l5HMGS+b.net
>>263
仮想コア等の技術などで、本来あるコア数以上の並列処理をするのが最新のcpuやGPU、そしてライブラリ
そのへんはあまり考えずにリファレンス通りに投げてしまう方がいいと思う。
ライブラリによっても日々変わるので、最適なスレッド数というのはわからない

274:デフォルトの名無しさん
16/01/21 03:07:26.03 UGOk39Ww.net
並列化のアレコレの時に気をつけるのは基本的にはオーバーヘッドやで
スレッド増やしたことで減るオーバーヘッドを考えてみなされ

275:デフォルトの名無しさん
16/01/21 03:12:33.48 RQbtFNgK.net
そんなもん処理にもよるわ
メモリアクセスがネックになることが多いから
物理的に真に並列で動作するなんてことの方がまれ

276:デフォルトの名無しさん
16/01/21 03:52:40.75 ZU2ddnih.net
>>264
時間のかかる処理を行っている間に別のワープへ命令を発行しているということなんですかね

277:デフォルトの名無しさん
16/01/22 08:29:36.48 3nKRZUCp.net
ECCにはこだわっても
マザーの品質にこだわらないならいいのではｗ

278:デフォルトの名無しさん
16/01/22 17:13:45.63 xiqoLqZ5.net
正直本格的な並列処理は非同期処理対応したGPUを待った方がよさそうなんだけどな

279:デフォルトの名無しさん
16/01/22 18:34:49.79 EJ7vldBc.net
別に待つ必要なくね？
乗り換えれば済むし

280:デフォルトの名無しさん
16/01/22 19:37:25.23 xiqoLqZ5.net
RadeonはCUDA対応してないじゃん
nvidia製の非同期処理に対応したCPUは実質的にはまだ出てない

281:デフォルトの名無しさん
16/01/22 22:55:19.34 XypiUmy6.net
>>272
＞RadeonはCUDA対応してないじゃん
当たり前じゃんw
＞nvidia製の非同期処理に対応したCPUは実質的にはまだ出てない
だからなに？
それまで待ってるの？
意味がわからない

282:デフォルトの名無しさん
16/01/22 23:25:50.64 t81Zesj8.net
落ち着けよ

283:デフォルトの名無しさん
16/01/22 23:38:58.19 /Be9v1kC.net
1.メモリ読みにいく
2.大きな遅延が発生するからレジスタ待避
3.別なスレッド立ち上げる
を繰り返し
レジスタがどんどん減っていく

284:デフォルトの名無しさん
16/01/22 23:48:18.02 xiqoLqZ5.net
>>275
これがあるから並列処理に制限がかかって
非同期処理はnvidiaがNG出す状況になってるんだろうなと思う

285:デフォルトの名無しさん
16/01/23 00:13:36.37 TXnGkntP.net
いや非同期かんけぇねぇし

286:デフォルトの名無しさん
16/01/23 00:24:57.37 NV47HivO.net
>>276
お前さっきからなに訳のわからない事言ってんだよ

287:デフォルトの名無しさん
16/01/23 02:41:31.78 qmdjqcBj.net
今あるもの使うしかないのに何が言いたいのかわからんぞ

288:デフォルトの名無しさん
16/01/28 12:46:52.07 6a4EL6WE.net
非同期処理はゲームで使うもの
GPGPUには関係ないよ

289:デフォルトの名無しさん
16/01/28 12:56:49.21 6a4EL6WE.net
むしろNVにとっての痛手は倍精度のGPUを作っちゃうと「ゲーム用」が完全にAMD天下になっちゃう事
その最大の理由が、SCEに吹っかけすぎて、NV切りを起こされた事
GCN世代GPUがゲーム機を総獲りし、ローレベルAPIで組まれるAAAタイトルが全てGCNに最適化
これを奇貨としたAMDがDirectX12を提唱→DirectX史上初めての互換切り→AMDデファクトスタンダードの流れ
そのために科学技術演算と言う市場を捨てないといけなくなった
VulkanもDX12に倣って完全にAMDに合わせてるからな
だからディープディープ連呼するんだよ
半精度でディープが出来るからな

290:デフォルトの名無しさん
16/01/28 15:37:41.52 GWvEyNte.net
カメラと連携してリアルタイムで判断をこなしながらってのは非同期処理無しでも大丈夫なのか？

291:デフォルトの名無しさん
16/01/28 17:48:40.92 nzOvC+QF.net
ばかがいる

292:デフォルトの名無しさん
16/01/28 20:21:46.33 EEHWgu+r.net
ああ、いつもの非同期君だよ
ほっとけ

293:デフォルトの名無しさん
16/01/29 01:29:29.84 q0fsZtFa.net
非同期はゲーム用って何度言えば

294:デフォルトの名無しさん
16/01/29 02:29:28.87 QU8XaCF4.net
非同期って何だよ

295:デフォルトの名無しさん
16/01/29 07:41:28.07 HGJh8rQ+.net
hyper-q

296:デフォルトの名無しさん
16/01/29 12:43:58.50 q0fsZtFa.net
多分非同期君はNV信者だと思う
そうでなければこんなところのこんなスレで五月蝿く連呼するか？
問題はなぜそうするのか、だ
俺なりに出した答えは、Pascal開発が暗礁に乗り上げてる所為だと思う
未だにモックしか出してないからな、Pascal

297:デフォルトの名無しさん
16/01/29 15:12:50.38 HGJh8rQ+.net
ばかがいる

298:デフォルトの名無しさん
16/01/29 17:56:14.69 q0fsZtFa.net
hyper-阿q　HG

299:デフォルトの名無しさん
16/01/30 11:53:30.18 8faHSQBO.net
VulkanとDirectX12は殆どAMDのためにあるようなものだからな
ゲーム機を支配したAMDはローレベルAPIを支配し、ゲームコードは全てAMD基準になった
これはNVにとっては痛恨
倍精度GPUなんか出す余裕はないだろう

300:デフォルトの名無しさん
16/01/30 12:24:57.23 o5vi6iJ9.net
GPUのグローバルメモリのバンド幅計算で質問があります。
バンド幅(GB/s) = メモリのデータレート(MHz) * bit幅(bits) / 8(byte) / 1000
メモリのデータレート　GDDR5の場合　clock * 4
　　　　　　　　　　　DDR3の場合　clock * 2
上記のようになると思うのですが、
DDR3は立ち上がり立ち下がりで情報を伝達するのでクロックの2倍になるのはわかったのですが
GDDR5がDDR3に比べなぜ2倍になるのでしょうか？

301:デフォルトの名無しさん
16/01/30 14:18:14.00 PJcKfdaW.net
クロック信号1周期に4回データ転送してるから4倍

302:デフォルトの名無しさん
16/01/30 16:35:02.53 o5vi6iJ9.net
>>293
回答ありがとうございます。
NVIDIAのスペックを見ていたのですが仕様値と計算があわず、わからなくなってしまいました。
URLﾘﾝｸ(www.nvidia.co.jp)
これによると、C2050は384bit, 1500MHz, で144GB/sとあるのですが、計算してみると
　384 * 1500 * 4 / 8 / 1000 = 288GB/s
になってしまうのです。仮に1500MHzがデータレートと仮定すると
　384 * 1500 / 8 / 1000 = 72GB/s
どちらも仕様値と違ってしまいます。もしかしてバンド幅はメモリのリードとライト
合わせての値なのでしょうか？

303:デフォルトの名無しさん
16/01/30 16:36:27.36 o5vi6iJ9.net
つまり上り72GB/s、下り72GB/sの合わせて144GB/sなのでしょうか？

304:デフォルトの名無しさん
16/01/30 16:59:32.46 8faHSQBO.net
NVはもう倍精度のGPUは造らないよ
ローレベルAPIをAMDに奪われた現在、半精度GPUで描画特化をせざるを得ない

305:デフォルトの名無しさん
16/01/30 18:25:46.28 ypcCS+Q8.net
CUDAスレで何言ってるんだかこのアホは

306:デフォルトの名無しさん
16/01/31 00:13:30.67 v07wXVxF.net
描画とかもうどうでも良い
時代はGPGPU

307:デフォルトの名無しさん
16/01/31 00:57:29.07 cNgLqKMa.net
GPGPUでは倍精度がものを言うが、NVはもう倍精度に手を出せないということ

308:デフォルトの名無しさん
16/01/31 01:06:55.62 V+Yf7lZI.net
単精度でも十分みたいな話じゃなかったの？
それでディープ・ラーニングを推し進めていると思ったんだけど

309:デフォルトの名無しさん
16/01/31 01:23:20.65 cNgLqKMa.net
深層学習とビッグデータは半精度（でも可）
しかしこのスレの関心はあくまでも倍精度、出来るならば倍々精度だろ？
しかしこの倍精度は、CS機の競争環境でオマケがつくか削られるか都合で決まる
そう言うわけでVoltaはアメリカ政府との契約違反に問われないように出荷するだろうけど、
これはカスタム
AMDにCS機が獲られた現在、NVのGPUは描画/ワットパフォーマンス特化路線に軸足を置いた
DirectX11まではハイレベルAPIだったから倍精度GPUを出す余地があり、同時に科学技術演算市場を狙う二兎を追う路線を
追求できた
しかしDirectX12は完全にAMDのGCN世代GPUのハード直叩き規格だから普通に戦ったらfps/解像度共に負けてしまう
だからこそ半精度に活路を求めている

310:デフォルトの名無しさん
16/01/31 01:27:41.36 v07wXVxF.net
DirectX12とかどうでもよろしい
ここはCUDAのスレ
AMDな方はOpenCL()のスレにお帰り下さい

311:デフォルトの名無しさん
16/01/31 02:27:05.81 tWmMlKqo.net
GeforceはいいからTeslaがんばれ

312:デフォルトの名無しさん
16/01/31 08:33:54.41 v07wXVxF.net
TeslaよりTitanの方が良いよ

313:デフォルトの名無しさん
16/01/31 11:45:10.40 k6wK0w/E.net
ばかが常駐するようになったな

314:デフォルトの名無しさん
16/02/01 01:21:54.44 27TlSaYk.net
倍精度倍精度って、使い道も無いくせに
滑稽だな
戦闘力みたいなイメージか

315:デフォルトの名無しさん
16/02/01 02:50:26.19 9fNLotPU.net
科学計算でも計算量が多くてそこまで精度が必要なものってどれだけあるんだ

316:デフォルトの名無しさん
16/02/01 07:15:29.10 BOcjqYcH.net
科学技術計算では単精度や半精度で行う方がよっぽど珍しいと思うが

317:デフォルトの名無しさん
16/02/01 09:11:27.82 fnCrDph6.net
物理系じゃ大きい数+極小の数なんて普通にあるからな
倍精度でも足りなくて四倍精度必要になったりすることもざら

318:デフォルトの名無しさん
16/02/01 09:26:01.45 2VMpgIMC.net
Kerasってdeep learningフレームワークはbackend.pyてファイルを追加するだけでopenclでも動くようになってるよ。誰かbackendを書かないか？

319:デフォルトの名無しさん
16/02/01 12:33:46.47 Ucvj9UOE.net
こうなったらこのスレの住人が声を上げて、PEZYに倍々精度のMPUを造ってもらおうよ
もうNVは金輪際倍精度に手を出さないよ

320:デフォルトの名無しさん
16/02/01 14:17:42.51 fSUYSvsK.net
倍精度が必要な要件って
例えば何があるんだ？
2.0e+38を超えるスケールで
2.0e-38以下の誤差を必要とするプロジェクト？
そんなのあんの？
そりゃー誤差が小さくなれば
破綻する可能性は減るけどさ
おたくらが求めてるのってそれだけじゃねえの？

321:デフォルトの名無しさん
16/02/01 14:48:07.70 iOXOBOCM.net
いらん
DNNではな

322:デフォルトの名無しさん
16/02/01 14:59:29.79 9fNLotPU.net
>>308
でもシミュレーションにGPGPU使ってる人いるだろ
たいして速度でないのに倍精度でやってんのか
xeon phi使った方が良さそう

323:デフォルトの名無しさん
16/02/01 15:05:12.00 CUSF99yG.net
>>312
指数分の大きさではなくて仮数部の大きさ(幅)だよね。
仮数部の幅分大きさの違う数値を加減算すると0を加減算したのと同じになると思うけど。

324:デフォルトの名無しさん
16/02/01 15:07:09.85 CUSF99yG.net
増分解法では致命的になる場合あり。

325:デフォルトの名無しさん
16/02/01 15:07:56.23 SiSRa9Ib.net
装置もんで数万枚/日のリアルタイム画像処理に使ってるけど、普通にdoubleが使えると楽なんだけどな。
速度も考慮すると大きい数と小さい数の計算前、画像処理の前後でdouble、float変換してるからCPU圧迫してくる。
でも、シンプルで意図した通りに動くからCUDAは組みやすい。
んー、この辺がジレンマだな。

326:デフォルトの名無しさん
16/02/01 15:44:31.42 fSUYSvsK.net
それは倍精度が必要な理由になってないような
やっぱ盲信が多そうだな

327:デフォルトの名無しさん
16/02/01 16:07:14.05 oiE/5K5n.net
>>311
そこの製品一般人で買えるルートあんのかよ

328:デフォルトの名無しさん
16/02/01 18:24:22.88 BOcjqYcH.net
大きな行列の計算、FFT、急峻なカーブの音声フィルター、レイトレーシング、物理シミュレーション、空間認識、...
倍精度以上の精度が必要な用途はいろいろとある
単精度のハードで倍精度相当の演算をすると、十数倍の時間がかかる
倍精度のハードで4倍精度相当の演算も同様に十数倍
多倍長演算も倍精度や4倍精度ハードがあれば、単精度よりもずっと速く計算が可能

329:デフォルトの名無しさん
16/02/01 18:32:19.85 BOcjqYcH.net
簡単な画像フィルターや音声フィルターなら単精度でいいし、ディープラーニングなら半精度でも良かったりする
半精度～4倍精度までのハードがあるのが一番なんだけど
倍精度演算ハードがあれば単精度も同じ速度で計算が可能だが、単精度のハードで倍精度相当の演算をするには十数倍の時間がかかる
ゲーム用途など、単精度を使うことがはっきりしてる時じゃなければ倍精度を積んでおくのが無難
4倍精度はさすがにGPUに積むのは規模が大きくなりすぎるが、CPUには積んで欲しい
半精度は、単精度との変換だけでとりあえずは良い

330:デフォルトの名無しさん
16/02/01 20:19:15.33 Ucvj9UOE.net
URLﾘﾝｸ(www.4gamer.net)
URLﾘﾝｸ(www.4gamer.net)
＞また，Huang氏が示したスライドで，第2世代Maxwellアーキテクチャベースの「GeForce GTX TITAN X」とDrive PX 2を比較すると，
＞単精度浮動小数点演算性能は前者が7TFLOPSなのに対して後者は8TFLOPSと，
＞劇的には高速化していない点も気になった。
↓その一方で…
＞ちなみにHuang氏は，Drive PX 2の性能指標として，ディープラーニング処理の演算性能を示す
＞「DL TOPS」を示しているが，これだとデュアルPascalはGeForce GTX TITAN Xの3倍以上というスコアになっている。
これ、完全にゲーム特化とビッグデータ特化GPUじゃん、Pascalwwwwww
俺の言ったとおりもう科学技術GPGPUはオワコンなんだよ
完全に半精度依存、完全にワットパフォーマンス/描画特化GPU路線だはwwwwww 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)

331:デフォルトの名無しさん
16/02/01 21:46:57.46 vs1yi7F6.net
>>321
倍精度乗算器の回路コストは単精度の約4倍

332:デフォルトの名無しさん
16/02/01 22:30:54.71 MibI1Q78.net
バカが住み着いてる

333:デフォルトの名無しさん
16/02/01 22:58:36.28 9fNLotPU.net
実際に業務で使ってる人は倍精度で運用してるのか？

334:デフォルトの名無しさん
16/02/01 23:10:33.37 BOcjqYcH.net
>>323
まあ純粋に乗算器だけでいえばそうだけど...
>>322
半精度はさすがにゲームでも足りない
半精度専用GPUなんて出ない
少なくともPC用には

335:デフォルトの名無しさん
16/02/01 23:17:23.47 BOcjqYcH.net
>>325
業務っていろいろあるが
おれの範疇は単精度、倍精度、疑似4倍精度、多倍長といろいろ
多倍長も、筆算レベルからカラツバ、DFTレベルとさまざま
もちろん普通のレジスタサイズの整数演算も
特殊なジャンルであることは否定しない

336:デフォルトの名無しさん
16/02/01 23:19:49.62 BOcjqYcH.net
半精度もIEEE754じゃない独自フォーマットなら使った事はあるが、使った事があるって程度

337:デフォルトの名無しさん
16/02/01 23:27:26.75 dRJvSEmL.net
>>326
>半精度はさすがにゲームでも足りない
そんなこと分かるかよ
HDRで16bit浮動小数点フォーマットとか普通に使うだろ
メモリ帯域が半分で済むんだぞ
ゲームなんか正確さより速さ優先だから、色を表現するのに16bitで十分な場合がほとんどだろ

338:デフォルトの名無しさん
16/02/02 01:51:42.07 LP8V/wwM.net
だから違うよ
使ったことがあるかじゃねーよ
何でその精度が必要なのかってところよ
4倍精度とか軽々しく言うが
このスケールが本当にわかってるのか
疑わしいぜ

339:デフォルトの名無しさん
16/02/02 03:08:21.02 xiUt8T5M.net
4倍精度とか専用ハード作れとしか言いようがない
汎用品に求めるものじゃない

340:デフォルトの名無しさん
16/02/02 12:53:46.97 ULLNmZyK.net
>>326
よく嫁
Pascalは基本混合精度
PK104は単精度と半精度の混合
PK100は倍精度の混合らしいが、多分これはテスラ新シリーズとして販売だと思う
もうグラボ価格の倍精度CUDA組はむりぽ
>>331
もうPEZYにお願いするしかないよ、倍々精度
これはマジでそう思ってる
逆を言えば理研＝PEZYの特殊HPCはそこしか生き残りが出来ないのではないか
どうしてもというならARMカスタムとか
倍精度はNVはもうだめぽだから、AMDに期待するしかない

341:デフォルトの名無しさん
16/02/02 13:17:56.85 sWHooGm6.net
混合精度って単精度と半精度が両方載ってるって事だ�

342:謔ﾈ仮に1個の演算器の回路規模が1:3として、演算器の回路比率を1:1にし、単精度は半精度の演算も出来るとすると、すべて単精度にした場合に比べて演算器の数は単精度が半分で単精度が2倍か単精度2倍のインパクトよりも単精度半分のインパクトの方が大きい気がする

343:デフォルトの名無しさん
16/02/02 14:24:13.48 ULLNmZyK.net
完全にグラフィックス描画効率/深層学習向けの構成だね
データ地獄になるから広帯域メモリも必要になるがHBM規格はAMDが握っているために、（HBM2の）開発が遅れた
GDDR5＋を急遽導入する事になったのはそのため
このスレだとDX12とかVulkanとか一言口にするだけで「スレチガイだ馬鹿！」と怒鳴る奴がいるが、
これは全てが絡み合っている
DX12とVulkanという二つのローレベルAPIがAMD中心による策定である以上、これらのローレベルAPIへの依存を避ける
ワットパフォーマンスGPUに経営路線の舵を切るの必然

344:デフォルトの名無しさん
16/02/02 15:52:24.40 MS6gBcZU.net
>>334
スレチガイだ馬鹿！

345:デフォルトの名無しさん
16/02/02 20:33:43.42 ubpTh4Nt.net
>>334
そのすごいAMDでお前はどんなGPGPUソフト/プログラム作っていいるんだ？

346:デフォルトの名無しさん
16/02/02 21:22:14.45 xseyqTiA.net
cudaだっつうに
hsaスレでやってろ
馬鹿

347:デフォルトの名無しさん
16/02/02 22:08:37.37 +ZIKPYce.net
雑談は楽しいけど、ここCUDAスレやで
amdの話をするなってことじゃなく、スレチ話をいつまですんねんってこと

348:デフォルトの名無しさん
16/02/02 22:41:10.14 NB4DG1EG.net
Visual Studio 2015対応になるのはいつですかねぇ

349:デフォルトの名無しさん
16/02/03 12:08:39.46 15l+1fC7.net
>>336　>>337
自演乙
わざわざ自作板から出張ご苦労様

350:デフォルトの名無しさん
16/02/03 12:56:39.94 d3Nc4Jqw.net
バカな上の病気なんだな

351:デフォルトの名無しさん
16/02/03 14:19:34.04 15l+1fC7.net
Pasacalこけそうで危機感いっぱいだは

352:デフォルトの名無しさん
16/02/03 22:25:31.36 hEPpn7Fg.net
だはｗ

353:,,・´∀｀・,,）っ-○○○
16/02/03 22:25:59.26 gpz71jEo.net
TeslaでもXeon Phiでもなく一般ピープル向けGPUに倍精度性能が必要だって言ってるのは
ろくに科研費申請が通らない貧乏研究室くらいでしょ

354:デフォルトの名無しさん
16/02/04 13:10:48.29 lq8BoEbf.net
>>344
お前が使い方を知らないだけ

355:デフォルトの名無しさん
16/02/04 13:11:30.26 lq8BoEbf.net
>>344
お前は半精度だけで十分

356:デフォルトの名無しさん
16/02/04 18:29:53.21 TT5D/Cpx.net
Maxwellは擬似的な倍精度も出来ないんだよ
それくらいしっておこうな

357:デフォルトの名無しさん
16/02/04 20:00:25.29 o+ucOEnp.net
単精度と比べると凄い遅いだけで
倍精度演算自体はハードで実装している。
物凄い遅いといっても1/32で1/16のradeon furyと比べると半分だから大差ないと言えば無い。

358:デフォルトの名無しさん
16/02/04 20:13:21.23 d8M6zG1u.net
Maxwellは倍精度の演算器が排除されただけで疑似倍精度は実装されている
そもそもソフトレベルでも実装できることだし

359:デフォルトの名無しさん
16/02/04 20:15:36.92 TT5D/Cpx.net
FURYはMaxwellを参考にしてるからな
HBMの容量の少なさが祟って何じゃこりゃ状態だったけど、Polarisは一層Maxwell類似のワッパ路線がとられる
これでNVはもう倍精度を完全に捨てにかかる

360:,,・´∀｀・,,）っ-○○○
16/02/04 23:21:52.01 zdF89aL0.net
いや実際半精度が4倍速いほうが使いどころあると思うよ
ゲームで倍精度なんて使わないじゃん

361:デフォルトの名無しさん
16/02/04 23:28:29.99 3r7tJtQx.net
深層学習がはやったらＧＰＧＰＵももっと市民権を得るかな？

362:デフォルトの名無しさん
16/02/05 00:42:53.10 TcXSJNY1.net
半精度を4倍速くしたら半精度専用になるな
そんなもの売れないぞ

363:デフォルトの名無しさん
16/02/05 01:21:13.26 p946S2WD

364:.net

365:デフォルトの名無しさん
16/02/05 04:09:45.89 iPwofUfz.net
倍精度を高速化したらどれだけ売り上げが見込めるのかをnvに分かるように説明したら。
>>353
頂点シェーダは単精度が必要でも、実行時間のかなりがフラグメントシェーダなんだから、別に半精度専用になって売れないとはならないだろう。

住みわけがある訳だろ。で、倍精度頑張ったのは期待の売り上げが出なかったわけだろ多分。
願望を語るスレであるより、アリモノでなんとかするスレであった方が建設的だと思うがね。

366:デフォルトの名無しさん
16/02/05 07:52:28.94 X6eE9Wue.net
すまんがゲーマーは帰ってくれないか？

367:デフォルトの名無しさん
16/02/05 08:26:49.67 23YXKvG1.net
なぜ団子がここにいる？
まあ、CUDAもかなり広く使われてくるようになったから、
数値演算の枠組みだけじゃなくなってきているのはわかるが。

368:デフォルトの名無しさん
16/02/05 08:45:35.15 bTIbnCX4.net
いやこのひとはかなり初期からCUDAつかってるの
それこそnvにgeforceくれてやるからCUDA使ってちょって
誘われるような時代から

369:デフォルトの名無しさん
16/02/05 08:50:46.42 KXdvQQGq.net
1スレ目に三色団子おるな

370:デフォルトの名無しさん
16/02/05 12:16:48.26 bTIbnCX4.net
URLﾘﾝｸ(techon.nikkeibp.co.jp)
CNN専用チップ、NVIDIAなどがGPUの改良で開発
URLﾘﾝｸ(techon.nikkeibp.co.jp)
Eyerissは、グラフィックス処理プロセッサー（GPU）と同様、SIMD（single instruction multiple data）などから成る
プロセッサー・エレメント（PE）を多数集積したICである。
ただし、GPUとはデータの移動を最小限に抑えた設計にした点が異なる。
具体的には、EyerissはSRAMから成るオンチップメモリー108Kバイトを備えており、
CNNの各層の演算結果をオンチップメモリーにバッファリングさせることで、
チップ外の主記憶に書き戻す頻度を大きく減らした。
また、PEに入力するデータ列に共通部分がある場合は、その共通部分を保持して差分だけを入力する。
さらに、複数のPEに同じデータを入力する場合は、各PEにそれぞれ送るのではなく、
途中まで1つのデータとして送り、そこからPEの個数分データをコピーして入力する。いわゆるマルチキャストである。
これらによって、データ処理時のデータの移動を最小限に抑え、消費電力を大幅に低減した。
加えて、データを主記憶に書き戻す時は圧縮し、読み出す時に伸長する。
CNNの畳み込み演算後のデータはフィルターを通すことで圧縮しやすい形になっていて、メモリー帯域の節約効果が高いという。
　作製したEyerissの動作をNVIDIA社のGPU「TK1」と比較すると、
EyerissはデータのスループットこそTK1の約1/2だったが、消費電力はTK1の最小約1/37と大幅に低い。
主記憶に出し入れしたデータの帯域も、TK1の1120Mバイト/秒に対し、Eyerissは127Mバイト/秒だったとする。

371:デフォルトの名無しさん
16/02/05 12:55:11.71 p946S2WD.net
>>358
だからお前はインテルスレに帰れっつってんだろ団子！

372:デフォルトの名無しさん
16/02/05 13:02:33.01 bTIbnCX4.net
また病気か

373:デフォルトの名無しさん
16/02/05 13:44:39.13 p946S2WD.net
>>362
倍精度イラネ、ここは管スレだぞ！と言ってたのはお前だったのか、団子！

374:デフォルトの名無しさん

375:sage
団子ってなに？

376:デフォルトの名無しさん
16/02/05 14:36:57.91 3a93fntK.net
どうもこのスレには
CUDAをマシに使っている奴は
いないようにみえるな
ひたすらベンチマークしかやってない感じね

377:デフォルトの名無しさん
16/02/05 16:33:49.39 3vmCyKKd.net
倍精度よりコンテキスト処理の自由化をだな
Oculasからも苦言言われてるのに

378:デフォルトの名無しさん
16/02/05 16:34:59.76 3vmCyKKd.net
バックグラウンド処理が作りにくいからこそ、Asyncやプログラマブルコンテキストは次のGPUでは絶対に搭載してほしい

379:デフォルトの名無しさん
16/02/05 16:48:34.33 bTIbnCX4.net
ほとんど関係ない
URLﾘﾝｸ(www.tomshardware.com)

380:デフォルトの名無しさん
16/02/05 23:50:50.50 TcXSJNY1.net
はやく4倍精度のせろ！

381:デフォルトの名無しさん
16/02/06 12:36:05.76 pRi/vsC+.net
それをPEZYに言ってくれ

382:デフォルトの名無しさん
16/02/06 18:18:06.14 xHoLN9eE.net
お前その会社好きだな
一般向けに売ってもいないのに

383:デフォルトの名無しさん
16/02/06 20:15:07.20 pRi/vsC+.net
PEZY以外に応じてくれないぞ

384:デフォルトの名無しさん
16/02/06 20:47:57.74 xHoLN9eE.net
それでそこの製品は使ってるのか？

385:デフォルトの名無しさん
16/02/08 05:05:55.45 z0FWqNRt.net
いい加減にないものねだりはやめろ。

386:,,・´∀｀・,,）っ-○○○
16/02/08 22:05:16.73 ZbGdhM32.net
「Teslaを一桁安値で買わせろ」みたいなのは論外だろ
ゲーマーと倍精度が欲しい人は市場が全くかみ合わない
そんなのもう結論出てるだろ

387:,,・´∀｀・,,）っ-○○○
16/02/08 22:24:56.08 lyi6FC/t.net
もともとTeslaとQuadro/GeForceはECCの有無で差別化してたが
世界最大級のGPGPUスパコンがNonECCで使ってるので
全く差別化になってない
だから倍精度演算器を物理的に廃することでの差別化を行った
それだけ。
Tesla買えばいいだけだろ？
どうせ予算通らないから買えないだけだろ
ろくな論文も出せない底辺大学の研究室あたりがいいご身分だな

388:デフォルトの名無しさん
16/02/09 00:34:13.76 LI1PJjMq.net
>世界最大級のGPGPUスパコンがNonECCで使ってる
これについて詳しく。

389:デフォルトの名無しさん
16/02/09 13:10:44.06 i8FfOnoz.net
>>376
あなたはどこの大学ですか？

390:デフォルトの名無しさん
16/02/09 14:10:52.05 rPxo0Z4x.net
最初は影でこそこそディープディープ言ってて倍精度いらない、管スレでゲームコンソールを巡る政治的な思惑が
NVの倍精度切りに繋がった事実もスレチガイだ馬鹿野郎！って煽ってたのにな
流れが悪くなったのでコテの正体を出したんだろう
多分Async煽りも正体はこいつだ
ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに
本当に陰険だね、団子は

391:デフォルトの名無しさん
16/02/09 17:12:26.87 CgzlKX4i.net
そこそこの分解能ならTeslaやTitanで十分だろ

392:デフォルトの名無しさん
16/02/09 17:14:02.43 uHp67F+7.net
べつにphiでも使えばいいだけだが
teslaとphiの混合機も普通にあるし
とりあえずamdという選択肢は皆無

393:デフォルトの名無しさん
16/02/09 17:32:39.26 i8FfOnoz.net
登場かな

394:デフォルトの名無しさん
16/02/09 18:40:55.41 OHQNRB+7.net
nvは高校生や高専向けのセミナーもやってるし
ことしのgtcもセッション数は500超える
やってきたことの重みが違いすぎる

395:デフォルトの名無しさん
16/02/09 19:05:34.27 Z0SOCsIU.net
でも他GPUでは使えないんでしょ？ってのが重すぎる
GPGPUはnvidiaの私物ではない

396:デフォルトの名無しさん
16/02/09 19:07:27.62 dBPqK+gq.net
まともな研究機関ならTeslaは学割使えるんだが…
GeForceで倍精度が必要な理由なんてほんと世間知らずの戯言だな

397:デフォルトの名無しさん
16/02/09 19:15:52.47 CgzlKX4i.net
>>384
黎明期はデファクトスタンダードの取り合いだから当然の流れ

398:デフォルトの名無しさん
16/02/09 19:20:58.08 OHQNRB+7.net
>>384
よそが勝手に投げ出しただけじゃん

399:デフォルトの名無しさん
16/02/09 19:27:05.49 C4h+tGmi.net
>>384
言ってることが頓珍漢過ぎる
嫌ならopenCL使えばいいじゃん？

400:デフォルトの名無しさん
16/02/09 19:32:42.77 OHQNRB+7.net
dlといえばmitとnvが共同開発したeyerissはflotじゃなくfixedだったな
データ移動を極力控えた構造でcnnの場合データの再利用性が高いので
peからpeへの受け渡しが有効なのだとか
それでもエネルギーコストは
aluからレジスタファイルへの場合を１とすると
peへは3
内部のバッファーへは10
外部dramへは500のエネルギーコストがかかるんだそうな

401:デフォルトの名無しさん
16/02/09 20:43:41.18 YFSBhYG5.net
>ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに
言うことがバカすぎて吹いた
まともな法人はこのスレに社運なんてかけませんから
Tesla相当の性能をGeForceにも実装しろという
悪質クレーマーを客だと思わない権利は
NVIDIAにもあるだろjk

402:デフォルトの名無しさん
16/02/09 21:14:42.66 q4H41fNH.net
米エネルギー省の評価ソフトがほとんど単精度で
倍精度使うのがlinpackしかいという

403:デフォルトの名無しさん
16/02/09 21:20:54.23 IR1D3KHq.net
単精度じゃ足りないけど倍精度なら十分って領域は実は少ない。
単精度用演算器に少量の精度を追加して倍精度を1/4の速度でやるのが一番利に叶っている。
まあこれすら普及帯ではけちられて1/16になるのが倍精度の立ち位置
倍精度用の演算器積むくらいだったら単精度の演算器で可能なbit数で複数組み合わせると簡単に多倍長精度演算を実現できるような命令を用意してくれた方がよっぽどありがたい。

404:デフォルトの名無しさん
16/02/09 21:34:25.12 DH+vdKhf.net
>ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに
糞ワロタwww
このスレすごいんだな

405:,,・´∀｀・,,）っ-○○○
16/02/09 21:47:11.85 SI3uOwiZ.net
どっかのバKaveriは512SPで倍精度50GFLOPS未満
CPU1コアより遅いんだが

406:デフォルトの名無しさん
16/02/09 22:14:14.05 5ErhaZ8p.net
今日は団子がいっぱいいるなあ

407:デフォルトの名無しさん
16/02/10 00:25:10.96 u83LBvNZ.net
倍精度が高ければ許される
倍精度が低ければ、メモリが多くてもメモリ幅が多くても消費電力が低くても許されない

408:デフォルトの名無しさん
16/02/10 00:37:19.11 ZwcaN/9X.net
団子分身の術か
もうここもワッチョイの時期かね？

409:デフォルトの名無しさん
16/02/10 00:56:31.15 pL5WuRkY.net
だから団子ってなんだよ？

410:デフォルトの名無しさん
16/02/10 01:41:12.63 JsTfqJoq.net
団子は団子。

411:デフォルトの名無しさん
16/02/10 02:29:40.13 FSPq21yA.net
amd信者っていう精神病患ってるよな

412:,,・´∀｀・,,）っ-○○○
16/02/10 08:25:30.16 gHO8h5ZQ.net
倍精度ハードフル実装マンセー
↓
トランジスタが増える
↓
ウエハ1枚あたりのチップ採れる数が減る（&歩止まり率も減る）
↓
製造コスト上がる
↓
(,,・´∀｀・,,)

413:デフォルトの名無しさん
16/02/10 08:35:12.26 IPR+3W8l.net
倍精度の話しないと死んじゃう人は点呼取ってくれる？
「倍精度でCUDA」スレと、「実在のGPUでCUDA」スレに分けた方がいいよね、多分。

414:デフォルトの名無しさん
16/02/10 08:39:26.22 5rSlusQ0.net
バカはhello worldから始めなさい

415:,,・´∀｀・,,）っ-○○○
16/02/10 08:48:59.74 gHO8h5ZQ.net
件の赤い会社が帳簿の赤も解消しないのは、市場価格に対して製造原価が高すぎるからだよ
会社を潰れかけの状態にしてまで実装コストの高い倍精度ハードを実装するのは模範的な企業とは思えんがねえ
QuadroとTeslaのブランドが分かれてないようなもんだ

416:デフォルトの名無しさん
16/02/10 08:57:23.58 5rSlusQ0.net
まぁDLのおかげでteslaでも倍精度無しのものもあるけどね
ただ今後、DLはEyerissの方向で行きそうなんで
完全にDLは別ラインの製品でいくのか
GPU自体がEyerissの発展形になるか
GPUのデータ移動減らすとかレジスタファイルの階層化って研究はしてるようだけど

417:デフォルトの名無しさん
16/02/10 12:31:36.49 zvpoME6O.net
何とか倍精度不要論に持っていこうと必死な団子でした

418:,,・´∀｀・,,）っ-○○○
16/02/10 12:36:21.64 qcpMLBSZ.net
アホがいるね
特定のアプリケーションに特化して結果的に倍精度性能落とした製品は、その目的の用途から外れなきゃ何の問題もねーじゃん
ディープラーニングにもゲームにも倍精度の性能は必要ないから
倍精度が必要な用途にはK80やその後継あるいはPhiを買えばいい
科学技術演算用に設計されてないGPUに倍精度が必要だとかいうのはただのデムパ

419:デフォルトの名無しさん
16/02/10 13:03:35.72 VS1+7AWR.net
>>402
団子だけ隔離出来れば良い

420:,,・´∀｀・,,）っ-○○○
16/02/10 23:12:49.82 7x9wHVqL.net
>>405
Teslaの単精度特化版は1スロット版のK8ならそうだけどK10なら発表は2012年で
ディープラーニング言い出す前の話
ダイ本体はGTX600番台そのものだからそれ専用に設計されてるわけではないしね

EyerissがよくわらんのだけどROPやテクスチャユニットも削ってるわけ？

421:デフォルトの名無しさん
16/02/10 23:48:08.15 pL5WuRkY.net
ここだけの話
K10はシェールガス探査特化モデルだよ

422:,,・´∀｀・,,）っ-○○○
16/02/10 23:52:02.41 7x9wHVqL.net
倍精度推しの池沼君がどんな世の中の役に立つソフト作ってて
LINPACKベンチ以外なんの実務に役立ってるのかは興味あるね

423:デフォルトの名無しさん
16/02/11 03:51:57.10 Q8jkKaXt.net
eyerissはgpuじゃなくdl専用

424:デフォルトの名無しさん
16/02/11 09:23:41.72 pqlF/R5A.net
団子は倍精度に親でも殺されたか？

425:デフォルトの名無しさん
16/02/11 09:24:20.60 pqlF/R5A.net
豚に真珠
団子に倍精度

426:,,・´∀｀・,,）っ-○○○
16/02/11 09:27:55.02 qHP8+I1C.net
>>411に答えてね

427:,,・´∀｀・,,）っ-○○○
16/02/11 09:37:09.50 qHP8+I1C.net
俺は必要だっていう人の言い分は理解してるし
それに合わせたチップを選べばいいと思うのだけどね
倍精度ハードウェアがTeslaはともかく一般消費者向けのGeForceに
載らないといけない理由はない
一般消費者が倍精度のスループットを見てGPUを選ぶトレンドを作りたいなら
まずてめえが倍精度載せる価値のあるソフト作って示せばいい

428:デフォルトの名無しさん
16/02/11 13:14:12.26 Dgt4YBtM.net
科学技術演算に倍精度は必要不可欠
はい論破完了
簡単だったね

429:デフォルトの名無しさん
16/02/11 13:23:19.60 U2ZcAFvs.net
へー
それって
一般消費者向けの
GeForceに？

430:,,・´∀｀・,,）っ-○○○
16/02/11 13:27:04.20 yn/CS7EG.net
一般消費者が科学技術計算する必要あることがまったく示せていない

431:デフォルトの名無しさん
16/02/11 13:28:21.16 pqlF/R5A.net
豚に真珠
団子に倍精度

432:デフォルトの名無しさん
16/02/11 13:35:33.57 U2ZcAFvs.net
あたまわるそう

433:デフォルトの名無しさん
16/02/11 13:37:15.86 Dgt4YBtM.net
ここは何スレだったっけ？
単発団子よ

434:デフォルトの名無しさん
16/02/11 13:39:04.93 U2ZcAFvs.net
また病気か？

435:,,・´∀｀・,,）っ-○○○
16/02/11 13:42:27.10 yn/CS7EG.net
TSMCのウェハ価格体系的に用途別に倍精度が削れる用途向けには削ったほうが
コストダウンになるからそうするでしょうよ
Maxwell世代のTeslaがないのは大型スパコン案件もないからっての大きいと思う

436:,,・´∀｀・,,）っ-○○○
16/02/11 13:45:25.92 yn/CS7EG.net
>>422
お前理解してないから出てけよ

437:デフォルトの名無しさん
16/02/11 13:47:41.45 U2ZcAFvs.net
Tesla M40「・・・」
Teala M4 「・・・」

438:,,・´∀｀・,,）っ-○○○
16/02/11 13:56:21.86 yn/CS7EG.net
すまん、倍精度版ね

439:デフォルトの名無しさん
16/02/11 15:18:50.25 FNR4nKd2.net
今年の流行語大賞は売精奴

440:デフォルトの名無しさん
16/02/11 17:25:56.22 R5nKPKgb.net
普通に考えて一般向けGPUに倍精度はいらないよな
32bitと16bit浮動小数点しか使わねーよ
それでも贅沢なぐらい

441:デフォルトの名無しさん
16/02/11 18:10:05.08 0bpwaMQp.net
ほんとそれ
一般向けとしてはオーバースペックなくらい

442:デフォルトの名無しさん
16/02/11 18:51:28.54 pqlF/R5A.net
団子がいっぱい

443:デフォルトの名無しさん
16/02/11 20:13:55.90 Dgt4YBtM.net
駄目だ、団子の性でここも腐ってきた

444:,,・´∀｀・,,）っ-○○○
16/02/11 21:01:08.64 yn/CS7EG.net
だからお前の発言のどこが論破なんだよ
論理破綻の略か？

445:デフォルトの名無しさん
16/02/12 02:22:44.00 m8Kq2x0U.net
シールズ脳

446:デフォルトの名無しさん
16/02/12 13:14:15.71 10CGBYPs.net
ここがCUDAスレだと何度言えば分かるんだ！団子
科学技術演算も出来ないGPUじゃ話にならんわ

447:デフォルトの名無しさん
16/02/12 17:49:19.72 igghQz0I.net
まあ、倍精度じゃないと、イタレーティブソルバーは収束しないわな。4倍精度ぐらいあれは、CG法で反復回数が極端に減るかもね。

448:デフォルトの名無しさん
16/02/12 20:54:47.44 okDGKGY+.net
売性奴

449:デフォルトの名無しさん
16/02/12 21:37:49.48 ws+NUeAo.net
風俗業みたいな書き方だな

450:デフォルトの名無しさん
16/02/12 22:41:27.77 10CGBYPs.net
今日の重力波観測にしたってあれは、理論屋が出したシミュレーションに従ってそれと同じデータを観測したわけだろ
そういうのが単精度/半精度で出せるわけねーだろ

451:デフォルトの名無しさん
16/02/12 22:42:28.23 okDGKGY+.net
じゃあ倍精度使ってんの？

452:デフォルトの名無しさん
16/02/12 22:42:32.12 7+E8+eHE.net
100倍精度くらいいるな

453:デフォルトの名無しさん
16/02/12 22:43:21.37 7+E8+eHE.net
倍精度なんて普通に使う
水や空気のように

454:デフォルトの名無しさん
16/02/13 00:10:37.29 KZpZDJLQ.net
ただし、グラフィックスには要らない

455:デフォルトの名無しさん
16/02/13 00:16:44.75 X+VeUhDc.net
①No double precision, no life.
②Double precision make me happy.

456:デフォルトの名無しさん
16/02/13 00:47:18.16 vQuqpgIG.net
ここではMaxwellやPascalはおよびじゃない

457:デフォルトの名無しさん
16/02/13 00:48:53.57 dx+PFg0T.net
CUDAをなんのために使うかだよなあ。
グラフィックスだけならOPENGLだけでええんのとちゃうか？

458:デフォルトの名無しさん
16/02/13 00:54:32.58 LMFsV4x8.net
>>439
だったら何
そんなのはGPUであつかう問題じゃないから

459:デフォルトの名無しさん
16/02/13 01:59:47.65 KZpZDJLQ.net
GPUはグラフィックスを扱うのが本分なので
一般向けGPUは倍精度無しでも文句は言えない

460:デフォルトの名無しさん
16/02/13 05:22:35.21 zAv3sSPP.net
BSD!　BSD!　BSD!

461:デフォルトの名無しさん
16/02/13 11:28:45.10 EDACvSC3.net
>>448
お前の文句なんかどうでもいい
GPGPUってのはこういうことのために使うんだぜ！？団子
-----------------------------------------------------------------------
645 : 名無しのひみつ＠転載は禁止2016/02/12(金) 22:56:12.20 ID:oUDSwd87
>>626
別に2ちゃんだから適当に幾らでも変なことでも聞いていいんじゃね？
人間の頭で考えないと絶対にダメな部分が最も大きい
相対論も標準理論も量子力学も計算機だけでは絶対無理
計算機が答を出すというより、計算機は望遠鏡とか温度計のような「測定器の一種」という感覚が近いと思う
GPGPUは使いまくってるはずだけど、半ば問題に特化して設計するスパコンもあり
スパコンに関してはそれ自体がすごいというより、スパコン目当てに優秀な人が集まる効果のほうが大事という気がする、2020年のオリンピックみたいにスパコンという祭りに人が集まるから、良い方にも悪い方にも転ぶだろう
646 : 名無しのひみつ＠転載は禁止2016/02/12(金) 22:57:56.72 ID:eXgf7vm3

462:デフォルトの名無しさん
16/02/13 12:08:27.34 c+BFT1nX.net
いろいろ探して結局コピペ

463:デフォルトの名無しさん
16/02/13 13:38:06.14 LMFsV4x8.net
結局何が言いたいの？
理想のものが欲しければ自分が計算機設計の専門家になればいいじゃん
手遅れかもしれないけど

464:,,・´∀｀・,,）っ-○○○
16/02/13 14:55:58.29 dwcfM3wy.net
自然言語処理や画像認識、いま産学連携で資金集まってるのはこういう分野
データサイエンス分野は文系の学者さんも研究に参画してるし応用範囲広いんだよね
何の金にもならない倍精度行列積で1位じゃないとダメなんですか？とかホントどうでもいい話

465:,,・´∀｀・,,）っ-○○○
16/02/13 15:03:24.00 dwcfM3wy.net
スパコンに倍精度演算性能が必要なのは誰も否定してないじゃん
個人のゲームやお絵かき用のパソコンにそれが必要かという話であって。
コピペで代弁してもらったつもりになってるのかもしれないけど
実質的に何の主張にもなってないわけよ

466:デフォルトの名無しさん
16/02/13 17:16:53.26 EDACvSC3.net
>>454
＞個人のゲームやお絵かき用のパソコンにそれが必要かという話であって。
ホントここが何スレか分かってない池沼
Async煽りをしてた団子が攻守入れ替わるとこれだからな

467:デフォルトの名無しさん
16/02/13 17:49:57.42 pMfjul4g.net
GPUとGPGPUの区別もつかないのか？

468:,,・´∀｀・,,）っ-○○○
16/02/13 18:00:36.66 dwcfM3wy.net
> Async煽りをしてた団子が攻守入れ替わるとこれだからな
それこそお前の妄想じゃん
RadeonのGPGPUプログラミングの話をしたいなら超過疎のHSAスレへ

469:,,・´∀｀・,,）っ-○○○
16/02/13 18:03:11.84 dwcfM3wy.net
> GPGPUは使いまくってるはずだけど、半ば問題に特化して設計するスパコンもあり
って引用しつつ、倍精度性能が不要な用途に特化する意義は認めないんだね

470:,,・´∀｀・,,）っ-○○○
16/02/13 18:11:06.88 dwcfM3wy.net
ついでに攻められてるのがどっちなのかすら理解してない

471:デフォルトの名無しさん
16/02/13 18:14:06.59 vpwmEJlM.net
団子消えろ邪魔

472:デフォルトの名無しさん
16/02/13 18:17:25.51 vpwmEJlM.net
GPの意味わかるか？

473:,,・´∀｀・,,）っ-○○○
16/02/13 18:25:02.18 dwcfM3wy.net
>>439の言ってるLIGOのリサーチに協力したのはうんこFireProではなくXeon Phiなんだよね
URLﾘﾝｸ(www.hpcwire.com)
重力演算は1格子点あたり小数点以下3桁程度の精度があれば十分といわれる分野
Stampedeに載ってるKNCは除算ユニットは遅く逆数・逆数平方根命令の
有効桁は14ビットだ。
まあこんだけあればニュートン法すら要らないわけよ。
倍精度で分解能を上げて遅い倍精度に単精度（実効精度14ビット）で格子点を
大量に捌くほうがより正しいシミュレーションができる。
ニュートン法不要ってのはﾆﾀﾄﾞﾘ=ｻﾝの受け売りだが

474:,,・´∀｀・,,）っ-○○○
16/02/13 18:42:17.05 dwcfM3wy.net
14ビットは間違い。SkylakeXeonで使えるAVX-512Fのほうだね。
KNCのrcp23ps/rsqrt23psのスループットは23ビット。
つまり単精度の除算は乗算1回との合計2ステップで割り切りなしの十分な精度が得られる

475:デフォルトの名無しさん
16/02/13 18:45:56.87 vpwmEJlM.net
スレ違い

476:,,・´∀｀・,,）っ-○○○
16/02/13 18:48:25.54 dwcfM3wy.net
倍精度必要論が否定されるから都合が悪いだけだろう？
重力演算のために長崎大がGeForce買いあさって作った激安スパコンだって
単精度特化仕様だったよ？
これもﾆﾀﾄﾞﾘ=ｻﾝが協力している。古事記にも書いてある。

477:,,・´∀｀・,,）っ-○○○
16/02/13 19:06:49.99 dwcfM3wy.net
ゴードンベル賞で2度の受賞を経験したﾆﾀﾄﾞﾘ=ｻﾝをして
天文学分野のシミュレーションは半精度程度の分解能があれば十分だって言ってるんだよ

478:デフォルトの名無しさん
16/02/13 19:49:28.20 LMFsV4x8.net
でもGRAPEは6倍精度実装してるじゃん
天文学と一纏めにしてるけど連星とかブラックホールが近接するような場合は高い精度が要求されるよね
逆に宇宙の大規模構造とかだと桁増やすより分解能上げた方が精度上がるのかもしれないけど

479:,,・´∀｀・,,）っ-○○○
16/02/13 19:57:12.93 dwcfM3wy.net
否定しない。
いずれにしてもどれも個人のパソコンに必要な要件ではない。
個人のパソコンのパーツを組み合わせて大規模演算ができるのはコストメリット的に重要だけど
個人のパソコンに倍精度が必要な理由の説明としては本末転倒です

480:デフォルトの名無しさん
16/02/13 21:14:52.93 EE+8Wdg+.net
結局自分じゃ使えもしないのに
倍精度倍精度連呼してるのが滑稽だってこった

481:デフォルトの名無しさん
16/02/14 00:27:03.46 cgGYXXdh.net
スレタイも読めないアホ

482:,,・´∀｀・,,）っ-○○○
16/02/14 00:51:54.56 QIqkGWdy.net
スレタイに即した話題振ってくれよ

483:デフォルトの名無しさん
16/02/14 00:57:10.67 cgGYXXdh.net
お前が消えたらな

484:,,・´∀｀・,,）っ-○○○
16/02/14 00:57:39.60 QIqkGWdy.net
お前が行くべきスレ（HSAスレ）に行けば平和になるよ

485:デフォルトの名無しさん
16/02/14 01:39:56.33 lXFnYTTq.net
AMDな人が来てCUDAの話無・CUDA使っていない奴の雑談スレになったな
AMDのGPGPUスレ過疎すぎでこっちにきたんだろうが

486:,,・´∀｀・,,）っ-○○○
16/02/14 02:02:42.36 vcWFNaoW.net
そもそも初代CUDAの時期に倍精度なんてサポートされてなかったし
メインストリームのGeForceが倍精度強かった時代なんて一度もないのに
いつから馬鹿の一つ覚えの倍精度連呼が始まったやら

487:デフォルトの名無しさん
16/02/14 07:18:27.73 feLPD2f/.net
豚に真珠
団子に倍精度

488:,,・´∀｀・,,）っ-○○○
16/02/14 09:14:03.10 vcWFNaoW.net
>>476の名前は団子っていうそうです

489:デフォルトの名無しさん
16/02/14 09:20:16.22 SumOf5e2.net
団子がいっぱい

490:デフォルトの名無しさん
16/02/14 15:01:21.31 LdUYpatK.net
そもそもCUDAは科学技術演算を必要とする人のスレなのにな
いつの間にか糞団子はゲームに必要かどうかに論点をすり替え

491:,,・´∀｀・,,）っ-○○○
16/02/14 16:23:41.37 vcWFNaoW.net
> そもそもCUDAは科学技術演算を必要とする人のスレなのにな
意味が分からない

492:,,・´∀｀・,,）っ-○○○
16/02/14 16:26:10.17 vcWFNaoW.net
CUDAでハローワールドも書けないレベルのnoobが気取ってみても
頭の悪さは隠せないよ

493:デフォルトの名無しさん
16/02/14 16:42:03.99 k6vnuBvm.net
cudaで今nvidia的にイチオシの用途がdlで、half性能が効いてくるという奴じゃないの？

494:デフォルトの名無しさん
16/02/14 16:58:17.35 MYivShEO.net
と言うよりGPGPU自体がDLバブルに乗っかってるからな
ボリュームゾーンに合わせた製品仕様になるのは当然の流れ

495:,,・´∀｀・,,）っ-○○○
16/02/14 17:32:35.33 vcWFNaoW.net
ﾊﾞｲｾｲﾄﾞﾏﾝｾｰ「俺がボリュームゾーンだ！俺のためのGPUを作れ！」

496:,,・´∀｀・,,）っ-○○○
16/02/14 17:54:26.87 vcWFNaoW.net
DOE案件みたいな大口需要があるときだけ倍精度特化版作って
それ以外は民間需要重視でいくってのは間違いじゃないと思うよ
次のDOE案件はVoltaだ
逆に言うとそれまでは倍精度特化版は出ないということだな

497:デフォルトの名無しさん
16/02/14 20:43:02.26 feLPD2f/.net
団子うざい

498:デフォルトの名無しさん
16/02/14 20:43:29.15 feLPD2f/.net
スレちがい
きえろ

499:,,・´∀｀・,,）っ-○○○
16/02/14 20:45:40.73 vcWFNaoW.net
認めろよ負け犬
お前らの需要は民間需要とみなされてないんだよ

500:,,・´∀｀・,,）っ-○○○
16/02/14 21:07:00.02 vcWFNaoW.net
残念だけどGeForceに倍精度が必要な理由を説くには
ゲームなどの目的で使って一般ユーザーが必要であることは絶対必要な条件だ
まさかそんな単純な理屈もわからないのか？
だからお前は俺ごときに言い負かされてるんだよ

501:デフォルトの名無しさん
16/02/14 21:17:16.56 3MzGEHLi.net
でもdoeの評価アプリはほとんどが単精度なのだ

502:デフォルトの名無しさん
16/02/14 21:20:27.80 q4Y9hkYF.net
やっぱり次のスパコンはGPU入れてくるのかな。
CPUだけで今の１００倍は難しいよね？

503:,,・´∀｀・,,）っ-○○○
16/02/14 21:20:35.19 vcWFNaoW.net
Top500ランキングに使うLINPACKベンチは倍精度だからそれのためだけに必要なんだよ
ちなみにHPCGだと倍精度ユニットいくらあってももてあそぶから倍精度厨には逆風だね

504:デフォルトの名無しさん
16/02/14 21:29:25.60 q4Y9hkYF.net
maxwellが発売されて２年たつが、pascalはいつごろ発売になるのだろうか。

505:デフォルトの名無しさん
16/02/14 21:30:32.20 feLPD2f/.net
豚に真珠
団子に倍精度

506:デフォルトの名無しさん
16/02/14 21:34:09.88 3MzGEHLi.net
pascalは今年
voltaは来年
pascalは大きな変更になり
voltaは小改良

507:デフォルトの名無しさん
16/02/14 21:39:33.62 LdUYpatK.net
倍精度の必要性すら認めない奴がどうしてこのスレにいる？

508:デフォルトの名無しさん
16/02/14 21:46

509::01.01 ID:3MzGEHLi.net

510:,,・´∀｀・,,）っ-○○○
16/02/14 21:47:24.48 vcWFNaoW.net
そんな人は一人もいませんよ？
消費者向けGPUに倍精度が必要みたいなアホなこと言う負け犬君を馬鹿にしてるだけですよ

511:デフォルトの名無しさん
16/02/14 21:47:51.57 VLtYVTYt.net
Geforceで科学技術計算なんてことあるの？
2秒間の壁や1週間も１００％負荷で連続使用したら過熱して壊れそう。

512:デフォルトの名無しさん
16/02/14 21:51:42.44 k6vnuBvm.net
必要性もなにも倍精度演算自体は可能だろ。積和で単精度の1/32くらいの速度だけど。
それで不満な人間がCUDAにこだわる意味がわからん。
そもそもCUDA対応ハードで倍精度強かったのってfermiとkeplerの時期だけで、しかもコンシューマ向けで開放されたのもその極一部じゃない。

513:デフォルトの名無しさん
16/02/14 21:52:57.52 3MzGEHLi.net
それはfuryでもおなじだけどな

514:,,・´∀｀・,,）っ-○○○
16/02/14 21:53:10.10 vcWFNaoW.net
倍精度が必要な人は必要らしくマイノリティ税を払って4桁ドルのTeslaを使えばよろしい

515:,,・´∀｀・,,）っ-○○○
16/02/14 22:08:24.09 vcWFNaoW.net
防衛上の理由として
北朝鮮や中共がGeForceを買いあさって弾道計算に使われたら困るから
消費者向けGPUは倍精度を削るのは当然でしょう

516:デフォルトの名無しさん
16/02/14 22:18:41.75 k6vnuBvm.net
倍精度演算を単精度の1/4より速く実行するのは基本的に無駄なはずなんだよね。
keplerは別回路で使わなければ完全に無駄だったし、fermiの1/2にもからくりがあって、整数演算器の方に少し回路を付け足せば単精度性能を倍にできるのを抑えた感じ。
納入先との契約で倍精度性能は単精度の1/2にすることみたいな縛りでもあったのかね。
1/4にしないでもっとけちれば次は1/16になるのが自然
なのにmaxwellは1/32

517:デフォルトの名無しさん
16/02/14 22:57:17.12 MYivShEO.net
>>503
＞防衛上の理由として
＞
＞北朝鮮や中共がGeForceを買いあさって弾道計算に使われたら困るから
＞消費者向けGPUは倍精度を削るのは当然でしょう
中共とかなに時代錯誤なこと言ってんだよ
Nvidiaはファブレスで製造はTSMCだぞ
そもそも弾道計算にGPU要らんし

518:,,・´∀｀・,,）っ-○○○
16/02/14 23:02:24.40 vcWFNaoW.net
今存在している政権を時代錯誤と言ってみたり台湾と中国の区別がつかなかったり
いろいろ論外すぎる

519:デフォルトの名無しさん
16/02/14 23:28:08.25 MYivShEO.net
>>506
いやいや、中共が買い漁るとか言ってるのが時代錯誤なんだよ
ココム時代かよ
スパコンの現状見て今更「弾道計算に使われたら困るからGPUから倍精度削りました」とか寝言としてもありえ無いぞ

520:デフォルトの名無しさん
16/02/14 23:32:03.43 MYivShEO.net
>>506
あ、そうそう
TSMCに限らず台湾メーカーは当然中国工場持ってるからな
中台の政治はアレだが経済はズブズブなんだよ

521:,,・´∀｀・,,）っ-○○○
16/02/14 23:34:42.85 vcWFNaoW.net
その寝言で米国政府が天河1号Aおよび2号のパーツ供給打ち切る命令を下してりゃ世話無いわ

522:デフォルトの名無しさん
16/02/15 00:10:01.72 tk+f5azn.net
つーか今さらだよなぁ。
既に世界一のスパコン輸出した後で規制するとか、アメリカはアホなのか。

523:デフォルトの名無しさん
16/02/15 00:38:07.27 vFZf1/EN.net
>>509
お前それ反論になって無いぞ
もしかしてGeForceに倍精度のせないのはマジで米政府が関与してるとか思ってるわけ？
お前正気か？
もう少しまともな奴だと思ってたが買い被り過ぎだったようだな

524:デフォルトの名無しさん
16/02/15 01:27:27.22 WsLHcQ2

525:x.net

526:デフォルトの名無しさん
16/02/15 06:50:35.29 iMQPxQqI.net
2018年にかけて米国でknlとpascal,voltaでスパコンが更新されていくからな
天河はもう過去のものになる
日本はもう一番目指してないし

527:デフォルトの名無しさん
16/02/15 12:37:26.72 WsLHcQ2x.net
計算機なんて数増やせば良いだけだから単体性能よりコスパで1位を目指すべきだと思うんだが

528:デフォルトの名無しさん
16/02/15 13:15:29.44 GXDoYvGw.net
そんなん日本じゃ無理じゃん

529:デフォルトの名無しさん
16/02/15 18:36:52.42 jliXXPJr.net
>>514
なんもわかってないな
ノード数の2乗に比例してインターコネクトは複雑になる
なんのために大きなスパコンが必要だと思う？
莫大なメモリ空間がないとできないことがあるからだ

530:,,・´∀｀・,,）っ-○○○
16/02/15 19:35:35.81 ZpISfAaX.net
>>513
そーは言ってもあの国はコンシューマ向けGPUかき集めてでもスパコン作るから
現に初代天河1号でそれやったし
中国のPCゲーム市場は拡大しててGPUメーカーにとってもおいしい市場だ
軍事転用の懸念から輸出規制かけられたらNVIDIAだって大損なわけよ
だから最初から倍精度ハードは載せない
その理屈は最低限理解してほしいのだけど・・・

531:デフォルトの名無しさん
16/02/15 20:03:17.93 dHmco+xc.net
そもそも倍精度はいらないって持論言ってなかった？
それなら軍事用途でも倍精度なしでいいってことだよね？
そうすると、中国はいくらでもGeForceを軍事転用して作れるんじゃない？
倍精度載せないのが軍事転用を防ぐためってのは無理がないか？

532:,,・´∀｀・,,）っ-○○○
16/02/15 20:06:18.36 ZpISfAaX.net
もちろんそれが一番の理由だなんて言う理由はない
どうせ倍精度なんて使えてもそれこそ豚に真珠を与えるがごとき日曜プログラマの道楽のために
NVIDIAは会社を傾ける気はないのは確かだろう

533:デフォルトの名無しさん
16/02/15 20:37:26.50 dHmco+xc.net
ハイエンド以外はそうでしょうね。
でもハイエンドはTeslaとマスクを別にするほどメリットはないでしょう。
だからTeslaに搭載されている以上、ハイエンドにもつくだろうね。
ドライバや回路切断で無効化措置がとられるかもしれないけど。

534:デフォルトの名無しさん
16/02/15 20:41:01.96 dHmco+xc.net
GeForceに倍精度を載せないのはビジネス面からの理由で、
Teslaに倍精度が必要かどうかとはまた違う議論だよね
それからKeplar世代Teslaも最初1/12くらいだったのが1/3にまで上げられたのは
必要な人がいたからじゃないのかな。
４倍精度以上のライブラリがあることからも精度が必要な人はいると思うよ。
単品の精度はfloatでいいけど、累積誤差のせいで途中段階ではより高精度が必要という局面は多いんじゃないだろうか。
倍精度完全ゼロにしたらTeslaはこけると思う。

535:デフォルトの名無しさん
16/02/15 21:09:32.48 3Z78wnsj.net
Nvidiaが倍精度どころか単精度ですら要らないんじゃね？路線になった理由は明快
（AMDの）MantleがDirectX12とVulkanの取り込まれたから
ゲーム機は完全にAMD一色になったから、もはやゲームはAMD中心に動いている
全てのAAAゲームはCS機のローレベルAPIで組まれ、その成果をPCに持っていく形が定着した
従ってPCゲームは今までのように互換性や異種GPU間の翻訳を行うのをやめた
DirectX12はそこの所が根本的に違う
しかし団子はそこの理解がないから最初っから倍精度不要論をぶっていればまだかわいげがあったが、
ゲームに倍精度は不要だ！と言い出したのは、Pascalの仕様が明らかになってからｗ
それまでの団子は、NVはPascalに倍精度路線を復活させる！（�

536:Lリッの一点張りだった

537:,,・´∀｀・,,）っ-○○○
16/02/15 21:12:20.04 ZpISfAaX.net
> GeForceに倍精度を載せないのはビジネス面からの理由で、
> Teslaに倍精度が必要かどうかとはまた違う議論だよね
それは誰も否定してる人はいない
> それからKeplar世代Teslaも最初1/12くらいだったのが1/3にまで上げられたのは
> 必要な人がいたからじゃないのかな。
大型スパコン案件があったから。
Maxwell世代にはなくて、民間需要を探したら結局単精度しか需要が無かった

538:デフォルトの名無しさん
16/02/15 21:22:31.09 jCwjLRdK.net
団子>弾道計算には倍精度が必要！（キリッ
↑
マジでアホ

539:,,・´∀｀・,,）っ-○○○
16/02/15 21:23:17.67 ZpISfAaX.net
必要だけど？

540:,,・´∀｀・,,）っ-○○○
16/02/15 21:24:28.08 ZpISfAaX.net
惑星探査機なんか発射時刻1秒のずれすら許されないレベル

541:デフォルトの名無しさん
16/02/15 21:33:03.42 PRVxDG3b.net
弾道計算といったら大砲の弾やせいぜい弾道ミサイルといったイメージ
人工衛星は軌道計算というのが一般的だろう

542:デフォルトの名無しさん
16/02/15 21:34:44.35 WsLHcQ2x.net
GPUはいらないけどな

543:デフォルトの名無しさん
16/02/15 21:39:07.56 iMQPxQqI.net
で
このhello worldも書けない倍精度バカは何が言いたいんだ

544:,,・´∀｀・,,）っ-○○○
16/02/15 21:45:08.13 ZpISfAaX.net
スパコンは数増やせばいいとか言っちゃうレベルの超絶バカには理解できんだろう

545:,,・´∀｀・,,）っ-○○○
16/02/15 21:50:22.85 ZpISfAaX.net
呼ばれてもいないAMDファンボーイが勝手にわめいてるだけでしょ
Async Shader（笑）なんてスパコンでは全く需要がないんですよ。
繰り返すけど、需要がないんですよ。
何千並列のGPUが動く環境ではそもそも同じGPUで複数スレッドを
動かす必要性そのものが疑問だし本当に別々のスレッドを多並列で動かしたい用途には
60コア240スレッドのXeon Phi向けの問題だったりする。帯短襷長。

546:デフォルトの名無しさん
16/02/15 21:54:15.47 dHmco+xc.net
>>523
＞大型スパコン案件があったから。
Titanとかだよね。ということはやっぱりむこうの研究者もより精度がほしいってことなんだな。

＞Maxwell世代にはなくて、民間需要を探したら結局単精度しか需要が無かった
そもそも民間にGPGPUの需要があるのかも疑問だな。
大学以外でほとんど導入してる事例を見聞きしたことがない。
F1や飛行機の気流計算とかには大規模サーバに積んでシミュレーションしたりしてるのかな？
あとは建築における風の影響とかさ。
普通は世代ごとにプログラミングとテストし直す手間考えるとCPU増設するよって考えに至りそう。

547:デフォルトの名無しさん
16/02/15 22:24:29.68 iMQPxQqI.net
>>522
pascalの仕様がいつ明らかになったんだ？

548:デフォルトの名無しさん
16/02/15 22:34:24.26 jCwjLRdK.net
>>526
＞惑星探査機なんか発射時刻1秒のずれすら許されないレベル
その昔3ビットコンピュータの時代に米国は有人月探査をやってるんだが？
中共は弾道計算()にスパコンが必要なんだw

549:,,・´∀｀・,,）っ-○○○
16/02/15 22:38:59.79 ZpISfAaX.net
月がいつ惑星になったんだ
的が大きすぎてスイングバイのタイミング計算も必要ないぞ

550:デフォルトの名無しさん
16/02/15 22:44:09.45 iMQPxQqI.net
月には本当に行ったのかね
よく帰ってこれたな
てかランディングよくできたな
よく月から離れられたな

551:デフォルトの名無しさん
16/02/15 22:48:44.77 iMQPxQqI.net
核開発はおいそれと実験できないので
シミュレーション主体だろうけど

552:デフォルトの名無しさん
16/02/15 23:23:28.51 jCwjLRdK.net
>>535
弾道計算がいつの間にか惑星探査に成るよりマシ
スウィングバイの計算ですらスパコンいらないのに弾道計算にスパコンが必要な根拠を早く示せよw

553:デフォルトの名無しさん
16/02/15 23:27:02.18 iMQPxQqI.net
それは使用者がどの程度の精度を求めるかってだけじゃね
キロか
メートルか
センチか
ミリか
マイクロか
ナノか

554:デフォルトの名無しさん
16/02/15 23:33:23.73 iMQPxQqI.net
ipadのdawソフトだって64bit floatで合成できるし
サンプリンレートだって96khzがつかえる
で、聞いて違いがわかるのかって話だわ
さすがに32khz（昔のrolandのdtm音源とかね)と44.1khzはわかるけど

555:,,・´∀｀・,,）っ-○○○
16/02/15 23:42:05.72 ZpISfAaX.net
倍精度くんはDLで使われてる半精度の用途すら理解できてないと思うよ

556:デフォルトの名無しさん
16/02/15 23:54:48.03 6lA61DJG.net
科学技術計算で半精度が使えるのなんて、DLぐらいじゃねーの？
線形方程式を扱う問題は倍精度がないと使いもんになんないよ。
単精度で行けるのは、流体解析とかかな。

557:デフォルトの名無しさん
16/02/15 23:58:33.47 iMQPxQqI.net
必要な部分だけ倍精度で
後は単精度って言う混合精度が普通ですけどね

558:デフォルトの名無しさん
16/02/16 00:11:11.75 Rkm/CQ33.net
>>541
いいからお前は中共がスパコンで弾道計算()する根拠を示せよw
出来ないなら去れ

559:,,・´∀｀・,,）っ-○○○
16/02/16 00:16:10.17 hr2Cmr1D.net
そこいちいち突っ込むなよ
↓この池沼レスに突っ込んだやつ何人いるよ
427 ：デフォルトの名無しさん [↓] ：2016/02/12(金) 22:41:27.77 ID:10CGBYPs (2/2)
今日の重力波観測にしたってあれは、理論屋が出したシミュレーションに従ってそれと同じデータを観測したわけだろ
そういうのが単精度/半精度で出せるわけねーだろ

560:デフォルトの名無しさん
16/02/16 01:05:12.74 zrbNTBh/.net
くだらないすれになってきたな。
CUDAだけに。

561:デフォルトの名無しさん
16/02/16 01:07:09.51 uizCIs9N.net
惑星探査機の打ち上げ時に1秒のズレが許されないのは、もし1秒のズレが
起こるとロケット側の打ち上げシーケンスはリアルタイムに変更出来ない以上、
生じたズレを探査機側でカバーする必要があり燃料を大量に消費するから
ロケット発射時の1秒分に相当するズレが軌道計算時の演算精度によって
生じると示されない限りは今回の話の流れで例として出す意味は無い

562:デフォルトの名無しさん
16/02/16 01:22:51.47 Rkm/CQ33.net
>>545
話を逸らすな糞団子
GPUに倍精度が載らない理由としてお前が妄想で持ち上げた米政府陰謀論はどう始末すんだよ
いつの間にか惑星探査の話に誤魔化そうとしてドツボに嵌ってるし
どうやらお前には虚言癖があるようだな
それ精神疾患の初期症状だぞ

563:デフォルトの名無しさん
16/02/16 05:14:07.98 JyLDDdd2.net
こいついいかげんあたまわりーな
geforceにいらねぇってだけで
どこでgpuにいらねぇってかいてんだ
トットトキエロ無関係なamd信者

564:デフォルトの名無しさん
16/02/16 08:27:02.86 TSHTNtoJ.net
491 名前:,,・´∀｀・,,）っ-○○○ [sage] :2016/02/14(日) 22:08:24.09 ID:vcWFNaoW
防衛上の理由として
北朝鮮や中共がGeForceを買いあさって弾道計算に使われたら困るから
消費者向けGPUは倍精度を削るのは当然でしょう

565:デフォルトの名無しさん
16/02/16 08:39:42.99 O+KKJC7C.net
missile guidance
コピペしてあげる
URLﾘﾝｸ(www.rugged.com)
URLﾘﾝｸ(www.nrl.navy.mil)

Accelerating Binary Genetic Algorithm Driven Missile Design Optimization
Routine with a CUDA Coded Six Degrees-Of-Freedom Simulator
URLﾘﾝｸ(etd.auburn.edu)

566:デフォルトの名無しさん
16/02/16 08:44:44.70 5qdf7tTQ.net
あたまわりーなっていう書き込みがあたまわるそうw

567:デフォルトの名無しさん
16/02/16 12:24:44.18 r3FuaOqG.net
>>549
てめえのケツは文体から丸見えなんだよ、糞団子！

568:デフォルトの名無しさん
16/02/16 13:13:36.31 Rkm/CQ33.net
>>551
どこに弾道計算()って書いてあるんだ？
今更必死になって資料探してるのが笑える
糞団子www

569:デフォルトの名無しさん
16/02/16 17:01:16.79 O+KKJC7C.net
missile guidanceって書いてんですけど
本当にアホなんだ

570:デフォルトの名無しさん
16/02/16 19:19:35.76 Rkm/CQ33.net
>>555
ミサイル誘導と弾道計算()をゴッチャにして無いか？

571:デフォルトの名無しさん
16/02/16 19:31:16.10 ehtVDEti.net
お前らってCUDAスレでミサイルの話したいの？
うざいよ

572:デフォルトの名無しさん
16/02/16 19:32:32.16 Got2320i.net
団子が消えれば平和になる

573:デフォルトの名無しさん
16/02/16 19:37:49.67 vQzfh9to.net
そもそも米国初のスパコンは300flopsで
弾道計算目的で作られたわけですけどね

574:デフォルトの名無しさん
16/02/16 19:46:46.20 Got2320i.net
団子うざい

575:デフォルトの名無しさん
16/02/16 19:52:40.02 JyLDDdd2.net
倍精度バカが消えればいいだけ

576:デフォルトの名無しさん
16/02/16 19:52:56.44 Rkm/CQ33.net
>>559
だからなに？
300flopsでいいならatomでも使えば？
弾道ミサイルと誘導ミサイルの区別もつかない知障が恥の上塗りしてどうする

577:デフォルトの名無しさん
16/02/16 19:53:37.32 JyLDDdd2.net
相変わらず
病気ですかｗ

578:デフォルトの名無しさん
16/02/16 19:55:56.44 Rkm/CQ33.net
>>563
なんだよネタ切れか糞団子
早く弾道計算()の根拠を示せよwww

579:,,・´∀｀・,,）っ-○○○
16/02/16 21:31:21.33 n4dpDB+H.net
ID:Rkm/CQ33
ひまだねこいつ
Teslaなんて買えるご身分じゃないことはわかったよ

580:デフォルトの名無しさん
16/02/16 21:46:16.04 JyLDDdd2.net
c++ampの死亡がよほど悔しかったと見える

581:デフォルトの名無しさん
16/02/16 21:52:57.09 Rkm/CQ33.net
>>565
お前さぁ何で個人ユース前提で話進めてんの？貧乏F蘭学生か？
悪いけどプライベートでゴリゴリコード書かんから家ではオンボードチップのみだよ
んなこといいから早く弾道計算()のソース探して来いや

582:,,・´∀｀・,,）っ-○○○
16/02/16 21:54:13.47 n4dpDB+H.net
AMDの株価がまたダダ下がりしてるよ
年内に潰れるんじゃないの？（煽

583:デフォルトの名無しさん
16/02/16 22:55:41.72 Rkm/CQ33.net
>>568
お前、俺がAMD信者だと思いたいわけ？
残念だが単なるツールに思い入れは無い
そもそもプライベートではインテルHDだしな
ぶっちゃけ、AMDでもNVでも倍精度でも単精度でもどうでもよろしい
糞団子がおかしな事言ってるから突っ込んでるんだよ
さぁ話を逸らさず、早く弾道計算のソース探して来いやwww

584:デフォルトの名無しさん
16/02/16 22:59:58.46 r3FuaOqG.net
結局Asyncとか煽ってたのは団子だよ
そして株価ガーとまたぞろ論破された悔しさから関係ないバカッターぶり

585:デフォルトの名無しさん
16/02/16 23:03:30.71 JyLDDdd2.net
おまえだろｗ

586:デフォルトの名無しさん
16/02/16 23:04:56.35 r3FuaOqG.net
糞団子は及びじゃねーんだよ
倍精度が嫌なら自作板帰れや

587:,,・´∀｀・,,）っ-○○○
16/02/16 23:19:32.08 n4dpDB+H.net
Async（笑）はお呼びじゃねーから

588:,,・´∀｀・,,）っ-○○○
16/02/16 23:22:10.95 n4dpDB+H.net
倍精度CUDAでAMDの倒産時期のシミュレーションをしようず

589:デフォルトの名無しさん
16/02/16 23:55:31.06 TSHTNtoJ.net
この糞団子って奴はNV信者なのか？
かなりキショいな

590:デフォルトの名無しさん
16/02/16 23:58:08.83 Rkm/CQ33.net
>>574
お前、先にやる事あんだろ
早く弾道計算()のソース探して来いや
糞団子

591:デフォルトの名無しさん
16/02/17 03:31:12.34 0fWAF1mS.net
amd信者はスレのレベルを下げるの上手だよな
どこでも

592:デフォルトの名無しさん
16/02/17 07:30:57.92 rf0k3qKD.net
団子うざい消えろ

593:デフォルトの名無しさん
16/02/17 07:57:37.34 VmCK2l0E.net
お前何なの？
団子団子団子って
この固ハン好きなの？

594:デフォルトの名無しさん
16/02/17 09:30:58.37 rYEbraru.net
団子を知らんなんてもぐりだな。

595:デフォルトの名無しさん
16/02/17 12:25:17.76 OFL0xTOo.net

sssp://o.8ch.net/7vw7.png

596:,,・´∀｀・,,）っ-○○○
16/02/17 21:53:22.36 vQUlaZXp.net
だんごさんはアイドルだからな

597:デフォルトの名無しさん
16/02/17 22:38:37.14 ftw2nvyT.net
お、おう

598:デフォルトの名無しさん
16/02/18 00:59:56.44 yA7sr9oe.net
507 ：,,・´∀｀・,,）っ-○○○：2016/02/15(月) 20:06:18.36 ID:ZpISfAaX
もちろんそれが一番の理由だなんて言う理由はない
どうせ倍精度なんて使えてもそれこそ豚に真珠を与えるがごとき日曜プログラマの道楽のために
NVIDIAは会社を傾ける気はないのは確かだろう

団子いいこと言うな、その通りだよ
お前ごときが倍精度の存在意義なんかわかりゃしないんだから
そのままここから消えろ

599:デフォルトの名無しさん
16/02/18 01:34:33.83 BdjwVjbv.net
人間の脳細胞も半精度

600:デフォルトの名無しさん
16/02/18 15:31:31.41 k3R63z0a.net
アンチの方が邪魔で迷惑というのは、嫌儲や嫌韓と変わらんな。

601:デフォルトの名無しさん
16/02/18 20:51:58.59 8FWPXGjX.net
>>586
団子ははっきり言ってやらんと分からんアスペだから

602:デフォルトの名無しさん
16/02/18 22:55:07.89 yHWNW4Hi.net
確実に言えることは
こいつはCUDAより団子のほうが
興味があるようだってこと
CUDAスレなのにな
迷惑だから他でやって欲しい

603:デフォルトの名無しさん
16/02/18 23:48:14.62 dPaFikXI.net
>>588
お前が一番しつこいよ
消えろ

604:デフォルトの名無しさん
16/02/19 12:26:53.00 3s8ITFfM.net
団子はインテルNVマンセー馬鹿に過ぎない
Fermiの時代は倍精度の必要性を謳ってたのまた団子
現在倍精度不要論をぶってるのはこいつが工作員である証拠
くだスレにはまったく不要

605:デフォルトの名無しさん
16/02/19 18:46:26.08 ktnruegg.net
>>587
団子はいくら言っても分からないようだから、そろそろ諦めてくれないか。
邪魔だし迷惑。
団子だけならNGできるんで、団子たたきはやめて、キッチリ完全スルーしてくれ。

606:デフォルトの名無しさん
16/02/19 19:43:08.21 3s8ITFfM.net
>>591
＞、団子たたきはやめて、キッチリ完全スルーしてくれ。
NGだけなら簡単だが、こいつは倍精度を否定してるんだよ
そして名無しで煽ってるから問題だろうが

607:デフォルトの名無しさん
16/02/20 01:44:55.38 C1beyHUM.net
病人乙

608:,,・´∀｀・,,）っ-○○○
16/02/20 02:13:53.70 yfJQw59R.net
俺がこのスレで名無しになったことなんて1度たりともない

609:,,・´∀｀・,,）っ-○○○
16/02/20 02:18:16.51 yfJQw59R.net
一般消費者向けのGPUで倍精度の性能は必要ないとしか言ってないんだけどな俺は
なぜなら、一般消費者の用途で倍精度の性能が必要でないからだ
トートロジーを並べてるだけだけどこれは普遍の真理。

倍精度特化のTeslaが使いたい人は使えばいい
だからこそなおさらGeForceが倍精度に特化しなければいけない理由はない
いつ倍精度そのものを否定したんだ？

610:,,・´∀｀・,,）っ-○○○
16/02/20 02:22:37.26 yfJQw59R.net
ドァンゴが、午前２：２２くらいをお知らせします

611:デフォルトの名無しさん
16/02/20 06:16:50.67 2KEvBzOT.net
Teslaがいつ倍精度に特化したって？

612:デフォルトの名無しさん
16/02/20 08:36:03.80 deWWtRHc.net
>>595
はいはい
一般消費者向けのGPUから倍精度が削除されたのは米政府の陰謀なんだろw
お薬増やしおきますね～

613:デフォルトの名無しさん
16/02/20 08:42:57.95 wJmoGGP6.net
お前のGPGPUプロジェクトが
どのように許容誤差見積を出して
倍精度を必要とそっちを語った方が
反論になるだろう
出せ

614:,,・´∀｀・,,）っ-○○○
16/02/20 09:07:06.30 mQDXSMnA.net
>>597
Teslaにも倍精度に特化してないモデルもある
倍精度が強いのはあくまで「スパコン用のTesla」だ
それの流用版のGeForceやQuadroも副次的に倍精度が強かったこともあったが
GeForceに倍精度の需要があったからではない
GeForceで倍精度が速くないと困るとか言ってる手合いはろくに研究予算もつかない
ゴミ研究者かなんかだと思ってるが
（そんなものに拘ってるからろくな論文が書けないんだろ）

615:デフォルトの名無しさん
16/02/20 09:53:53.93 gxBCXYT2.net
>>600
＞GeForceで倍精度が速くないと困るとか言ってる手合いはろくに研究予算もつかない
＞ゴミ研究者かなんかだと思ってるが
おいおい、GeForceは一般消費者向けが前提じゃなかったのか？
糞団子は論点ズレまくりでまともに議論が噛み合ってない

616:,,・´∀｀・,,）っ-○○○
16/02/20 10:17:55.46 mQDXSMnA.net
だから学校から支給される予算じゃTeslaが買えないからGeForce使うしかないんでしょ

617:,,・´∀｀・,,）っ-○○○
16/02/20 10:18:51.16 mQDXSMnA.net
あるいは赤ポスにつけなかったおちこぼれか
いずれにしても「一般」消費者でありはしない

618:,,・´∀｀・,,）っ-○○○
16/02/20 11:09:20.85 mQDXSMnA.net
所詮は自分が欲しいかどうかだけが基準点でもっと大きな市場のニーズを
理解できないｱﾌｫでしょう
大学院重点化の弊害ですね
就活失敗したようなレベルのゴミを研究室に引きこもらせたら
ますます世間知らずをこじらせるのも道理

619:,,・´∀｀・,,）っ-○○○
16/02/20 11:18:36.93 mQDXSMnA.net
論文博士という日本独自の制度もたいがいだがな
3年間も通って単位取得だけしかできず学校を放逐されたゴミにも
なまじ希望を与えるからタチが悪いというか

620:デフォルトの名無しさん
16/02/20 12:50:45.19 kmGvjPZb.net
,,・´∀｀・,,）っ-○○○NGですっきり

621:デフォルトの名無しさん
16/02/20 13:08:52.37 kmGvjPZb.net
>>601
糞団子は論点をずらすと言うより、負け犬になるといつも違う話をする＆名無しでスレ汚しだから
NGだけでは駄目なんだよ
本当はDX12でNVがハブられた事実を認めたくないために架空のでっち上げ話をしてる
その証拠にMaxwell世代以前のNVはﾆﾀﾄﾞﾘｻﾝ（笑い）の話をだして市販のNVGPUが大学研究機関
に納入された事を自慢してたからな
こいつは単なるアンチAMDのステマ部隊
454 ：,,・´∀｀・,,）っ-○○○：2016/02/13(土) 19:06:49.99 ID:dwcfM3wy
ゴードンベル賞で2度の受賞を経験したﾆﾀﾄﾞﾘ=ｻﾝをして
天文学分野のシミュレーションは半精度程度の分解能があれば十分だって言ってるんだよ
453 ：,,・´∀｀・,,）っ-○○○：2016/02/13(土) 18:48:25.54 ID:dwcfM3wy
倍精度必要論が否定されるから都合が悪いだけだろう？
重力演算のために長崎大がGeForce買いあさって作った激安スパコンだって
単精度特化仕様だったよ？
これもﾆﾀﾄﾞﾘ=ｻﾝが協力している。古事記にも書いてある。

622:デフォルトの名無しさん
16/02/20 13:46:11.25 AOSmisIg.net
>>600
特化の意味わかる？
単精度の1/3の速度じゃ特化じゃないから

623:デフォルトの名無しさん
16/02/20 13:53:58.49 T6EctyCF.net
特化じゃね。
1/4がイーブン

624:デフォルトの名無しさん
16/02/20 15:21:16.14 XuC13l9f.net
団子さんにコンプレックス持ってる病人がいるなｗ

625:,,・´∀｀・,,）っ-○○○
16/02/20 15:32:40.26 mQDXSMnA.net
ただのAMDファンボーイだから
そもそもAMDはCUDAが使えないしCPUもAVXが半速のゴミしか出せないので
科学技術方面では全く役に立ちませんよ

626:,,・´∀｀・,,）っ-○○○
16/02/20 15:35:44.85 mQDXSMnA.net
価格の安いコモディティ製品本来の用途外に流用するのがGPGPUの始まり
用途外を前提に設計しろなんてのは片腹痛い話ですよ

627:,,・´∀｀・,,）っ-○○○
16/02/20 15:50:28.63 mQDXSMnA.net
ちなみに仮数の単精度は24ビット、倍精度は53ビット
積和ユニットのの複雑度は仮数のビット数の二乗にほぼ比例するので
実際には倍精度積和ユニットの実装コストは単精度の5倍よりも多い

628:デフォルトの名無しさん
16/02/20 15:52:58.65 AOSmisIg.net
>>609
倍精度特化じゃないCPUが1/2
イメージ的にはこれで普通
特化って言ったら単精度演算器を持たない、昔ながらのスーパーコンピューターみたいなやつ

629:,,・´∀｀・,,）っ-○○○
16/02/20 16:03:04.79 mQDXSMnA.net
先に否定してるのにアホか

630:デフォルトの名無しさん
16/02/20 16:14:51.99 T6EctyCF.net
>>614
要は技術を知らないバカが無謀な要求をしていると自白しているわけだな。
そもそもCPUは倍精度特化で、単精度は搭載している回路の半分だけ利用しておまけでつけているくらいの勢い。
正確には倍精度以上から降りてきたという方が正しいような気もするが。

631:デフォルトの名無しさん
16/02/20 16:19:59.15 XuC13l9f.net
うん、じゃCPU使ってなよ病気の人
CUDA関係ないからもう来ないでね

632:,,・´∀｀・,,）っ-○○○
16/02/20 16:47:44.25 mQDXSMnA.net
逆に言うと倍精度をサポートしなければ同じトランジスタの実装コストで
5倍以上の単精度ユニットを実装できるということ
それがCPUとは別方向で進化してきたGPUの速さの根源
それを否定するのはGPUを否定するようなもの

633:デフォルトの名無しさん
16/02/20 16:51:35.52 T6EctyCF.net
>>618
んな事はねぇよ。
回路を流用すれば1/4や1/16での
倍精度演算は殆ど追加コスト無く出来る。それを削ったからといって増やせる単精度性能は20%も無い。
まあ、これが大きいから1/4でなく1/16を選択するのが通常なのだけど。

634:デフォルトの名無しさん
16/02/20 16:53:25.90 XuC13l9f.net
もうくんなつったろ
病人

635:,,・´∀｀・,,）っ-○○○
16/02/20 16:59:15.42 mQDXSMnA.net
>>619
>>618のいうサポートっていうのはフルスピードの倍精度っていう意味
もちろん単精度を複数回（or複数ユニット）回して倍精度を実現してもいいが
それが現状のMaxwellなどの在り様なわけで

636:デフォルトの名無しさん
16/02/20 17:45:22.65 deWWtRHc.net
うわさではsmxに1個だけdpがあるとかないとか

637:,,・´∀｀・,,）っ-○○○
16/02/20 17:59:22.63 mQDXSMnA.net
あったとしてもどういう役回りかわからんでしょ
ぶっちゃけると単精度で分割処理するとはいっても実際には
倍精度フォーマットをデノーマライズして複数の単精度データに変換するハードウェアと
演算結果を組み立てて倍精度フォーマットに書き戻すハードウェアも必要だからね
そのビットフィールドの変換をソフトで処理したら1/16すら出ない

次ページ