16/01/08 16:40:28.22 7EUn+QZG.net
これが半精度君の発言な
改めて貼っておくわ
565 名前:Socket774[] 投稿日:2015/10/15(木) 01:41:28.91 ID:K16GSLSF
>>546
>おおまかにCPUで例えると、ゲフォはシングルスレッドが超早いシングルCPU
もっと分りやすく例えると、8ビットCPUを使ったPCエンジンがMaxwellなw
16ビットCPU(68000)を使ったメガドライブがGCN、みたいな
実際Maxwellは半精度GPUだしな
電力効率は無茶苦茶いいけど、GPGPUが弱い
966:Socket774
16/01/08 21:34:57.68 lUxDOAqr.net
電力効率な…
Polarisは4月か5月らしい
URLリンク(www.4gamer.net)
この消費電力の低さだとデモで使ってるミドルかそれ以下の製品にもHBM2使ってくるかもな
967:Socket774
16/01/09 00:14:10.89 wTrLRPlf.net
ただのGDDR5だろうな
ご祝儀でも2万円以下で、ターゲットとしてはGTX750とかの1万5千円程度の値段になりそうなこいつにそんなコストを掛けるとは思えん
968:Socket774
16/01/09 00:31:07.63 lrrgjRuE.net
書いてないからCPUがどんなもんかわからんけどざっくり1/3くらいにはなってるから
GPUが超すごいかHBM2使ってるかどっちかだろ
969:Socket774
16/01/09 00:47:30.77 xpuuK2Qj.net
一方がデュアルとはいえ250Wだからな
インパクトはでかい
970:Socket774
16/01/09 03:21:29.41 ngW7IFaB.net
>>936
Polaris側ビッグダイで超ゆるゆる回している可能性…ないかw
971:Socket774
16/01/09 06:07:45.32 4z8CQlMR.net
>>938
動画の方に構成のってたぞ
URLリンク(i.imgur.com)
CPUはi7-4790K
972:Socket774
16/01/09 06:32:42.16 4z8CQlMR.net
Furyの時はHBMメモリモジュールの他に4社ほど協力が必要だったからコスト高になったが
GFはIBMのTSV装置を譲り受けてるからそこのコストをだいぶ省略できるんだよ
GLOBALFOUNDRIES Webinar: Advanced 2.5D and 3D Packaging
URLリンク(www.youtube.com)
あとな、GFの14nm LPPはリーク電流が28nmと比較して1/10しかない
GLOBALFOUNDRIES Webinar: Challenges and Solutions for 14nm Digital Design Reference Flows
URLリンク(www.youtube.com)
28 HPP
Test conditions is 0.85V in a -40 to 125°C range.
Max frequency is measured at 0.85V x 0.9 = 0.765V wich is a 10% voltage margin.
Power is measured at 10% excess voltage, that is at 0.985V.
Fmax 1.17 GHz
Dynamic power 210mW
Leakage 119mW
14nm LPP LVT
Test conditions is 0.8V in a -40 to 125°C range.
Max frequency is measured at 0.8V x 0.9 = 0.72V wich is a 10% voltage margin.
Power is measured at 10% excess voltage, that is at 0.88V.
Fmax 2.41 GHz
Dynamic power 310mW
Leakage 18.6mW
973:Socket774
16/01/09 08:52:50.18 mtEpkcPc.net
YouTube、近いうちにHDR動画に対応
URLリンク(getnews.jp)
974:Socket774
16/01/09 11:26:42.54 wTrLRPlf.net
>>942
> GFはIBMのTSV装置を譲り受けてるからそこのコストをだいぶ省略できるんだよ
それはGPUやAPUのHBM2の搭載にかなりコストダウン出来そうだな
IntelやNvidiaに対してかなりのアドバンテージになるね
975:Socket774
16/01/09 11:42:15.79 s7vCsu0s.net
>>934
FP16=M糞WELLという既出の情報を見てみぬ振りをするのはなぜだ?
大体GPUコアは単精度だけだったとしても複数コアを使って倍精度をやるときもあるし
976:Socket774
16/01/09 13:13:19.53 gDOukMtT.net
>>945
だからソースはどこにあんだよ
これ↓はお前が記事内容を極解してるだけでFP16=maxwellなんて内容じゃねーぞ
URLリンク(pc.watch.impress.co.jp)
つーかこの件についてnVidiaのネガティブな話ならなんでも喜ぶ
ファンボーイが一切触れようとしない時点で察しろよアホ
977:Socket774
16/01/09 13:19:37.13 gDOukMtT.net
>>945
ああ、もうレス返してくんなよめんどくせーから
お仲間のファンボーイにすら半精度君と言われたときにお前のポジションは決まったから
978:Socket774
16/01/09 13:23:05.74 uOZRGU3D.net
>>945
半精度君は未だにMaxwellにはFP16演算器が載ってると思ってんのな。
その記事の中に載ってないて書いてあるのに。
ガチで日本語読めないようだ。
サスガ鼻輪をつけたVUTA
979:Socket774
16/01/09 13:29:44.27 +3mgtnV9.net
半島人半精度君、略して半々
980:Socket774
16/01/09 13:30:48.99 gDOukMtT.net
>>948
そういや半精度君はチョンの可能性が高いんだったな
それなら日本語が理解できないのも納得だわ
981:Socket774
16/01/09 19:28:19.95 s7vCsu0s.net
Pascalは倍精度!(キリッ
の落とし前はどうつけるんだろうな工作員はw
FP16なんか載ってない!なんて言い張るくせにな
982:Socket774
16/01/09 19:30:21.74 oZjWa/y+.net
NVの歴史も今年が最後だな
983:Socket774
16/01/09 19:44:18.54 gIwwV/7i.net
>>951
も少し日本語勉強してから出直すよろし
984:Socket774
16/01/09 21:08:22.73 hhEwTZl8.net
倒産も時間の問題だな
985:Socket774
16/01/09 21:31:30.95 jIPa6vPm.net
SWBFのDX12対応で大勝利だな
986:Socket774
16/01/09 23:46:24.13 +abl5zqm.net
URLリンク(news.mynavi.jp)
>しかし、現在のKeplerやMaxwell GPUは半精度浮動小数点の演算器を持っていないので、メモリから読んだFP16の数値はhalf2floatで32bitに変換して演算を行い、演算結果はfloat2halfで16bitのFP16に戻してメモリに格納することになる。
のってないで
987:Socket774
16/01/10 00:28:29.26 BpKKHie+.net
あいかわらずのマッチポンプ臭
AMDとAMDファンを叩ければなんでもありなんだろう
988:Socket774
16/01/11 11:49:09.13 uBGyAs69.net
>>946
このソースを見るとどこがどう見てもFP16を重ねて単精度演算をしてると断定してるんだがな↓
>16-bit浮動小数点データを2個パック化して演算
>Maxwell GPUコアの最大のハイライトは、「パックドFP16(16-bit浮動小数点演算)」のサポートだ。
989:Socket774
16/01/11 11:58:09.08 iAZD4F7Z.net
>>919
Nv採用じゃ、実用化、普及したころには、別の新製品を高く買え!って買い替え、再開発の頻度が高くなりすぎるわな。
組み込み向けの製品なんだか、ただの汎用PCなんだか、Nvの市場戦略は訳が分からん。
990:Socket774
16/01/11 12:43:44.83 0vzm5U2U.net
>>958
>具体的には、Tegra X1 Maxwellでは、CUDAコアの32-bitレジスタを2つに分割、
>アッパーハーフ(上位)16-bitとローワーハーフ(下位)16-bitに、それぞれ16-bitの
>FP16データを格納できるようにした。CUDAコアは32-bitレジスタから2つの
>FP16ソースオペランドを読み出し、2つの同じFP16オペレーションを平行して実�
991:sする。 >そして、演算結果を再びパック化して32-bitレジスタに格納する。 FP32をFP16二つに分割して処理してるって書いてあるだろ
992:Socket774
16/01/11 12:44:35.07 0vzm5U2U.net
>例えば、FMA(積和算)なら、3つの32-bitレジスタをソースオペランドとして読み出し、
>3つの16-bitソースを2セットを取り出して同じ積和演算命令を両方に対して実行、
>結果を1つの32-bitデスティネーションレジスタに書き込む。1個のFP32 CUDAコアが、2個のFP16オペレーションを並列実行できるため、Tegra X1のFP16のスループットは、FP32の2倍となる。
993:Socket774
16/01/11 12:51:01.27 0vzm5U2U.net
>>958
>1個のFP32 CUDAコアが、2個のFP16オペレーションを並列実行できるため、Tegra X1のFP16のスループットは、FP32の2倍となる。
さすがにこれでわかっただろ・・・
994:Socket774
16/01/11 13:01:17.16 0vzm5U2U.net
つーか記事を全文ちゃんと読めばわかることがなんでわからないんですかねえ
maxwellは半精度という歪んだ思い込みをしたまま記事をナナメ読みすると
自分にとって都合の悪い部分は読み飛ばしてしまうんですかね
995:Socket774
16/01/11 13:16:38.39 lvgrP1Uf.net
自分が日本語読み書き不自由なの自覚できてない奴の相手してやる必要ないダロ
996:Socket774
16/01/11 14:32:13.78 0vzm5U2U.net
>>958
上の説明じゃ分かりにくいかもしれんから言っとくと
その記事にはFP32演算器でFP16二つを倍処理するという話が載ってて
FP16演算器なんて出てこないしFP32演算はFP32演算器でおこなっている
という図が載ってるだけ
これ以上の分かりやすい説明は無理w
997:Socket774
16/01/11 14:34:12.84 qTsIrxGO.net
CUDAなんぞ使ったらあとでぼったくりされるのが目に見えてる
調達先の選択肢は可能な限りオープンにしておいた方が
コスト面でも安定供給の点でも吉、と普通は考える
998:Socket774
16/01/12 07:27:58.69 7EsqGcQV.net
URLリンク(wccftech.com)
いかんでしょ
999:Socket774
16/01/12 13:38:51.01 VR3pqEQf.net
URLリンク(m.mydrivers.com)
Nご飯は申しわけなく思います:16nmパスカルは難産になりました……
今年、グラフィックカードの2強はすべて正式に1Xnm時代に入るでしょう、見るのを考えてみて、ファンたちなどの今回の技術の革新は長期に4年続きます。
とお相手をするのはのに従ってすべて構築がかえるのが新しくてで、A方はPolaris(北極星)を使用し始めて、NカードはPascal(パスカル)、物理学者と星座、誰更に夢まぼろしですか?
実は以前のが暴露するによって、NVが先にAMDが商品を出す、後者が年に決める中で(もっとも速い3月の小さいコア)、であるべきでしかし現在の情勢から、はNカードがいくつか問題に遭遇したようなことを見に来ます。
先週、NVIDIAはDrive PX を宣言しました2は自動的にプラットフォームを運転して、これは緑営(軍隊)が自分の図形を利用して実力の掘り出したのを計算して新しく金点を掘るので、当然で、科学技術の含有量ももとても高いです。
これは“自動車が超えて計算する”の端末だと誉められて2粒の全く新しいTegraプロセッサーを使って、一粒ごとに12核設計(8核A57+4核のデンバー)、同時にまた(まだ)2粒のPascalグラフィックカードを添えて
でもとても速くて、CEO黄色の仁の手柄の展示するPCB版はただGTX980Mを使うだけですので事実は蹴られて破裂して、どうしても人を失望させます。
現在最もは
1000:っきりしている1枚、Drive PX 2は板の背中GPU図をデモして、パスカルの原型と大変な違いがあります その時筆者のが解読したのは秘密のために考慮するので、しかし今いくつか外国のメディアは指摘して、NVIDIAのPascalはいくつか問題に出会ったのであるようで、境遇は難産になります。 この兆しは最初AMD RTG大会の時にに表れて、初めてパスカルを伝えて2017年までようやく発売することができます。 今黄(さん)はマクスウェルの“成り済ます”を使って、いくつかアナリストに運び出して2009年のフェルミの構築類比を行いを始めさせて、当時のこの40nm革命的性質の製品転覆性をかなり備えるのため2度の延期、 言い方があるのは良率で、“陰謀が議論する”もあって推測するのはHD5000が先に振る舞いを出してNVを超えて論断を予想するのです。 ,,, ( ゚д゚)つ┃ゲフォ厨房完全にオワタ
1001:Socket774
16/01/12 13:50:13.31 HcaGDA+Z.net
Nvidia’s Pascal Is MIA, Could Be In Trouble Reports Allege – Drive PX2 Demoed With GTX 980M Instead Of Pascal
パスカルは不明?
タイトルからわからねえ、誰か訳してくれ
1002:Socket774
16/01/12 14:02:21.08 FxB3dWJs.net
>>963
maxwellは単精度を二つ使って倍精度が出来ないところを見ると、最初っからFP16前提だろ
卵とニワトリの話をしてもしょうがない
1003:Socket774
16/01/12 14:06:47.61 FxB3dWJs.net
NVにとってまた嫌なニュースがキタ
PCで割れがし辛いプロテクション技術をソニーが開発
URLリンク(kotaku.com)
URLリンク(torrentfreak.com)
URLリンク(yurukuyaru.com)
世界でも最も悪名の高い掲示板として知られる3DMで、
ある声明が発表され話題になっています。
なんと「まもなくPCゲームの解析が不可能になる」というもの。
背景には近年急速な進歩を遂げたプロテクション技術の存在があるといいます。
この一年間、いくつかの大作ゲームに導入されたコピー対策技術がクラッキング集団の頭を抱えさせています。
ソニーが開発した「Denuvo」という改ざん防止技術です。
最初にこれが採用された『ドラゴンエイジ:インクイジション』は割られてしまったのですが、解析までに要した期間は一ヶ月。
この業界では”前代未聞レベルの”長い格闘があったようです。
その後「Denuvo」はさらに進化を遂げ、いまだ『ジャストコーズ3』
『FIFA16』といった大型タイトルの海賊版が出回る気配はありません。
3DMフォーラムの設立者・Phoenix氏は、以下のコメントを残しています。
「近ごろ『ジャストコーズ3』の割れについて多く質問を受けるのでお答えします。
最終段階(の解析)はあまりにも難しく、我々のクラッカーはほぼ諦めています。本作は割れるでしょう。
しかし昨今の暗号化技術の�
1004:J発動向をみると、あと2年で世界から (海賊版の)無料ゲームはなくなる。そのように私は恐れています」 なお最近のゲームでは『メタルギアソリッド5』『バットマン アーカムナイト』 『マッドマックス』『ライズオブトゥームレイダー』などが このプロテクション技術を採用しています。
1005:Socket774
16/01/12 14:15:53.09 IWf8Wskb.net
>>969
AMDの次世代APU/CPU/SoCについて語ろう 236世代©2ch.net
808-809レス目に機械翻訳の載せてあんじゃん
1006:Socket774
16/01/12 16:14:29.46 8CaA9+4A.net
>>970
>maxwellは単精度を二つ使って倍精度が出来ないところを見ると、最初っからFP16前提だろ
もう言ってることが無茶苦茶だなw
単精度を二つ使って倍精度が出来ないからmaxwellは半精度ってどういう脳の
構造をしてたらそういう結論に達するんだ?
>>965を見てもまだ理解できてないみたいだな
幼稚園児に数学を教えてるような気分だわw
1007:Socket774
16/01/12 16:24:11.39 8CaA9+4A.net
>>970
そもそもTegra X1だけの機能なのをmaxwell全てがそうであるかのように
語ってる時点で頭おかしいんだけどな
1008:Socket774
16/01/12 16:39:26.03 8CaA9+4A.net
それにしても半精度君とか業者君とか機械翻訳君とかグロ貼り君とか殺害予告君とか
ファンボーイには頭のアレな奴が多いなw
1009:Socket774
16/01/12 17:18:30.28 R9YAjnOJ.net
>>970
倍精度がFP64
単精度がFP32
半精度がFP16
1010:Socket774
16/01/12 17:30:37.53 kIJG35fN.net
割れにくくなるのはPC向けタイトルを出すモチベーションアップに繋がるので、PCゲーム市場にとってポジティブ。
と普通考えるところを>>971みたいな事書いちゃうのは、なんというかサスガ未だにOSレス完成PCが売れまくるお国の方だなて感じ。
1011:Socket774
16/01/12 17:41:30.82 8CaA9+4A.net
割れなくなるとNVが嫌がるとか意味不明だよな
NVはソフトメーカー囲ってるんだから割れに反対の立場だろうに
1012:Socket774
16/01/12 17:47:58.72 BuYYT0dJ.net
>>973
半精度君は池沼だから
どれほど丁寧に説明しても理解できないから
真面目に対応するだけ無駄だよ。
1013:Socket774
16/01/12 18:02:11.85 8CaA9+4A.net
>>979
わかった、さすがにもうスルーするわ
疲れるだけだしな
1014:Socket774
16/01/12 18:58:39.11 7jYIdjnj.net
半精度も単精度もどっちも積んでんだろ
で一部を共通化してると
どっちにより力を入れてるかはピーク性能を比べれば分かる
1015:Socket774
16/01/12 18:59:10.83 7jYIdjnj.net
これ以上くだらん言い争いは止め
1016:Socket774
16/01/12 19:02:10.16 6ErM7VKn.net
>>981
半精度は載ってません。
最近のゲフォにもラデにも。
1017:Socket774
16/01/12 19:07:39.64 7jYIdjnj.net
じゃあ何を言い争ってるの?
1018:Socket774
16/01/12 19:45:49.71 8CaA9+4A.net
>>984
半精度君がmaxwellは半精度積んでると言い張ってるんだよ
いっくら説明してもわかってくれない池沼なのよ
1019:Socket774
16/01/12 19:53:38.51 7jYIdjnj.net
ピーク性能を比べると?
1020:Socket774
16/01/12 19:55:28.33 7jYIdjnj.net
いいや、自分で調べる
1021:Socket774
16/01/12 20:23:18.20 7jYIdjnj.net
半精度<=>単精度 の変換はどれもできる
Titan X と Tegra X は半精度演算器をもっている
32bitレジスタに16bitを2個パックして演算可能
Tegraは半精度演算器のピーク性能は単精度演算器の倍になる
それ以外のモデルは不明
ざっと調べた感じ
1022:Socket774
16/01/12 20:37:56.93 8CaA9+4A.net
>>986
>Titan X と Tegra X は半精度演算器をもっている
これはどこに載ってた?
Tegra X1が半精度が1TFLOPS、単精度が500GFLOPS
半精度を単精度ユニットで倍処理してるから>>946の記事通りだね
1023:Socket774
16/01/12 20:49:04.71 7jYIdjnj.net
URLリンク(gunosy.com)
半精度浮動小数点演算をサポートしている
1個の単精度レジスタに2個の半精度をパックして保持する
ということで
半精度演算器を持っている
半精度と単精度の
1024:変換を単にサポートしてるということのではない と解釈した 記事の表現が多少あいまいなのと、記事が正しいかどうか不明、ピーク性能が未記載 であるのでもしかしたら嘘かも 逆に半精度を搭載してないという記事はあるの?
1025:Socket774
16/01/12 20:50:45.60 8CaA9+4A.net
>>990
まず>>956
1026:Socket774
16/01/12 20:51:14.04 7jYIdjnj.net
URLリンク(ascii.jp)
ここにも
「Maxwellコアの場合、SIMD演算のように単精度演算ユニットで2つの半精度演算を同時に行なえる。この場合の演算性能はさらに倍増することになる。」
とある
1027:Socket774
16/01/12 20:53:46.88 7jYIdjnj.net
両方の記事があるなら、
nVidia公式の発表か実際にピーク性能を測ったもの
だけがソースの価値があるってことになる
1028:Socket774
16/01/12 20:56:22.47 7jYIdjnj.net
記者はよく理解してない人もいるから、
「半精度と単精度の変換をサポートしてる」ってのを
半精度サポート ===> 半精度演算可能
って書いちゃう人もいるかもしれないし、
ある時期や製品から状況が変わったかもしれない
いずれにしろ、単に罵倒しあうだけじゃ本当のところはわからない
1029:Socket774
16/01/12 20:59:06.08 8CaA9+4A.net
URLリンク(www.4gamer.net)
>ちなみに,CUDA世代以降のNVIDIA製GPUにおけるCUDA Coreは,
>1クロックあたり最大2つの単精度浮動小数点演算を実行することができるが,
>半精度浮動小数点数用の特別な演算器は持っていないので,
>単精度浮動小数点演算と半精度浮動小数点演算の性能は変わらない。
>KeplerアーキテクチャのGPUを統合したTegra K1もそうだ。
>それに対し,Tegra X1では単精度浮動小数点演算性能値が半精度浮動小数点演算性能値のちょうど半分となった。
>この事実から,Tegra X1のCUDA Coreでは,半精度浮動小数点演算のために演算器が変更されたのだと分かる。
>ホワイトペーパーの9ページには,Tegra X1のGPUでは積和演算器がFP16をサポート
>することが説明されている。おそらくTegra X1では,CUDA CoreにあるFP32の積和演算器で
>FP16×2個の演算を行えるよう,手が入ったのではなかろうか
1030:Socket774
16/01/12 21:03:20.43 8CaA9+4A.net
>>994
半精度演算ができるから半精度演算器を載せていると勘違いしてるのでは?
>>912から何故TitanXやTegraX1に半精度演算器がのっていることになるのかわからないよ
1031:Socket774
16/01/12 21:08:32.62 7jYIdjnj.net
>>995 より >>990 の引用の方が新しいからね
>>990 が正しいかどうかは知らないけど、
少なくとも >>995 は時期的に >>990 の否定にはなっていないのでは?
1032:Socket774
16/01/12 21:09:51.51 7jYIdjnj.net
TitanXの半精度のピーク性能がわかれば解決するのだが
あいにくTitanXを持っていない
1033:Socket774
16/01/12 21:13:39.97 8CaA9+4A.net
>>990のどこにも半精度演算器の話は載ってないし、君の単なる推測だよね
ならより新しい情報の>>956が正しいのでは
1034:Socket774
16/01/12 21:21:29.47 7jYIdjnj.net
> このため、Titan Xでは16ビットのFP16という半精度浮動小数点演算をサポートしている。
> GPUの32ビットのレジスタに2つのFP16の数値を詰め込んでいるので、
> FP16の数値はx86のSIMDのように連続したアドレスである必要があるが、
> うまく使えば、同じデータ量で2倍の演算ができることになり、性能を向上させられる。
1035:Socket774
16/01/12 21:23:38.48 7jYIdjnj.net
> しかし、現在のKeplerやMaxwell GPUは半精度浮動小数点の演算器を持っていないので、
> メモリから読んだFP16の数値はhalf2floatで32bitに変換して演算を行い、
> 演算結果はfloat2halfで16bitのFP16に戻してメモリに格納することになる。
これを見るとたしかに積んでなさそう
これだけでこれが正しいとも言えないけど
1036:1001
Over 1000 Thread.net
1台のマシンが組み上がりました。。。
新しい筐体を用意してくださいです。。。。
自作PC板@2ch URLリンク(anago.2ch.net)
1037:1002
Over 1000 Thread.net
2ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
──────────
《プレミアム会員の主な特典》
★ 2ちゃんねる専用ブラウザからの広告除去
★ 2ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
──────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
URLリンク(premium.2ch.net)
URLリンク(pink-chan-store.myshopify.com)
1038:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています