【Maxwell2】GeForce合同葬儀場⑯⑩【DX12非対応】

【Maxwell2】GeForce合同葬儀場⑯⑩【DX12非対応】at JISAKU

【Maxwell2】GeForce合同葬儀場⑯⑩【DX12非対応】 - 暇つぶし2ch1018:Socket774
16/01/12 19:45:49.71 8CaA9+4A.net
>>984
半精度君がmaxwellは半精度積んでると言い張ってるんだよ
いっくら説明してもわかってくれない池沼なのよ

1019:Socket774
16/01/12 19:53:38.51 7jYIdjnj.net
ピーク性能を比べると？

1020:Socket774
16/01/12 19:55:28.33 7jYIdjnj.net
いいや、自分で調べる

1021:Socket774
16/01/12 20:23:18.20 7jYIdjnj.net
半精度<=>単精度の変換はどれもできる

Titan X と Tegra X は半精度演算器をもっている
32bitレジスタに16bitを2個パックして演算可能
Tegraは半精度演算器のピーク性能は単精度演算器の倍になる
それ以外のモデルは不明

ざっと調べた感じ

1022:Socket774
16/01/12 20:37:56.93 8CaA9+4A.net
>>986
＞Titan X と Tegra X は半精度演算器をもっている

これはどこに載ってた？

Tegra X1が半精度が1TFLOPS、単精度が500GFLOPS
半精度を単精度ユニットで倍処理してるから>>946の記事通りだね

1023:Socket774
16/01/12 20:49:04.71 7jYIdjnj.net
URLﾘﾝｸ(gunosy.com)

半精度浮動小数点演算をサポートしている
1個の単精度レジスタに2個の半精度をパックして保持する
ということで
半精度演算器を持っている
半精度と単精度の

1024:変換を単にサポートしてるということのではないと解釈した記事の表現が多少あいまいなのと、記事が正しいかどうか不明、ピーク性能が未記載であるのでもしかしたら嘘かも逆に半精度を搭載してないという記事はあるの？

1025:Socket774
16/01/12 20:50:45.60 8CaA9+4A.net
>>990
まず>>956

1026:Socket774
16/01/12 20:51:14.04 7jYIdjnj.net
URLﾘﾝｸ(ascii.jp)

ここにも
「Maxwellコアの場合、SIMD演算のように単精度演算ユニットで2つの半精度演算を同時に行なえる。この場合の演算性能はさらに倍増することになる。」
とある

1027:Socket774
16/01/12 20:53:46.88 7jYIdjnj.net
両方の記事があるなら、
nVidia公式の発表か実際にピーク性能を測ったもの
だけがソースの価値があるってことになる

1028:Socket774
16/01/12 20:56:22.47 7jYIdjnj.net
記者はよく理解してない人もいるから、
「半精度と単精度の変換をサポートしてる」ってのを
半精度サポート ===> 半精度演算可能
って書いちゃう人もいるかもしれないし、
ある時期や製品から状況が変わったかもしれない

いずれにしろ、単に罵倒しあうだけじゃ本当のところはわからない

1029:Socket774
16/01/12 20:59:06.08 8CaA9+4A.net
URLﾘﾝｸ(www.4gamer.net)

＞ちなみに，CUDA世代以降のNVIDIA製GPUにおけるCUDA Coreは，
＞1クロックあたり最大2つの単精度浮動小数点演算を実行することができるが，
＞半精度浮動小数点数用の特別な演算器は持っていないので，
＞単精度浮動小数点演算と半精度浮動小数点演算の性能は変わらない。
＞KeplerアーキテクチャのGPUを統合したTegra K1もそうだ。
＞それに対し，Tegra X1では単精度浮動小数点演算性能値が半精度浮動小数点演算性能値のちょうど半分となった。
＞この事実から，Tegra X1のCUDA Coreでは，半精度浮動小数点演算のために演算器が変更されたのだと分かる。

＞ホワイトペーパーの9ページには，Tegra X1のGPUでは積和演算器がFP16をサポート
＞することが説明されている。おそらくTegra X1では，CUDA CoreにあるFP32の積和演算器で
＞FP16×2個の演算を行えるよう，手が入ったのではなかろうか

1030:Socket774
16/01/12 21:03:20.43 8CaA9+4A.net
>>994
半精度演算ができるから半精度演算器を載せていると勘違いしてるのでは？
>>912から何故TitanXやTegraX1に半精度演算器がのっていることになるのかわからないよ

1031:Socket774
16/01/12 21:08:32.62 7jYIdjnj.net
>>995 より >>990 の引用の方が新しいからね

>>990 が正しいかどうかは知らないけど、
少なくとも >>995 は時期的に >>990 の否定にはなっていないのでは？

1032:Socket774
16/01/12 21:09:51.51 7jYIdjnj.net
TitanXの半精度のピーク性能がわかれば解決するのだが
あいにくTitanXを持っていない

1033:Socket774
16/01/12 21:13:39.97 8CaA9+4A.net
>>990のどこにも半精度演算器の話は載ってないし、君の単なる推測だよね
ならより新しい情報の>>956が正しいのでは

1034:Socket774
16/01/12 21:21:29.47 7jYIdjnj.net
> このため、Titan Xでは16ビットのFP16という半精度浮動小数点演算をサポートしている。
> GPUの32ビットのレジスタに2つのFP16の数値を詰め込んでいるので、
> FP16の数値はx86のSIMDのように連続したアドレスである必要があるが、
> うまく使えば、同じデータ量で2倍の演算ができることになり、性能を向上させられる。

1035:Socket774
16/01/12 21:23:38.48 7jYIdjnj.net
> しかし、現在のKeplerやMaxwell GPUは半精度浮動小数点の演算器を持っていないので、
> メモリから読んだFP16の数値はhalf2floatで32bitに変換して演算を行い、
> 演算結果はfloat2halfで16bitのFP16に戻してメモリに格納することになる。

これを見るとたしかに積んでなさそう
これだけでこれが正しいとも言えないけど

1036:１００１
Over 1000 Thread.net
1台のマシンが組み上がりました。。。
新しい筐体を用意してくださいです。。。。

　　　　　　　　　自作PC板＠2ch URLﾘﾝｸ(anago.2ch.net)

1037:１００２
Over 1000 Thread.net
２ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。

──────────
《プレミアム会員の主な特典》
★ ２ちゃんねる専用ブラウザからの広告除去
★ ２ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
──────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
URLﾘﾝｸ(premium.2ch.net)
URLﾘﾝｸ(pink-chan-store.myshopify.com)

1038:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています