AMDの次世代CPUについて語ろう第32世代

AMDの次世代CPUについて語ろう第32世代at JISAKU

AMDの次世代CPUについて語ろう第32世代 - 暇つぶし2ch91:Socket774
10/01/15 04:05:07 uv9NOF5c
2コア2スレは確定してるでしょ…

関係無いけどTSMC 40nmの歩留まりの話
URLﾘﾝｸ(megalodon.jp)
(DigiTimesは時間がたつと見られなくなるので魚拓)

ここでふと写真を見ると中のダイに見覚えが……

URLﾘﾝｸ(www.amd.com)
どう見てもShanghaiです本当にありがとうございました

で、40nm(TSMC?)でShanghai作ってんの？
とか思ったけどどう考えても間違いか手抜きだよな…
どっから写真持ってきたのかなあ

92:Socket774
10/01/15 07:22:15 lOh/Tbj1
NVは1ベクタをいくつものスレッドに分解する手法を取っていて
ベクタじゃない並列は↑よりもっと難しいだろうけどこれもスレッドを分けることは可能と考えられる

しかしデータ並列＝タスク並列ならそれ以前の問題だから
2コア2スレが確定してしまうわけか

93:Socket774
10/01/15 18:21:46 8SH9sWdn
>>54
3.5 基本的には下がるが大した事はなく、シュリンクで高クロック化する事で
　　取り戻す。

94:MACオタ
10/01/15 20:28:40 B+xNc+Fe
特に新味のある話題ではありませんが、GFとCharteredの合併完了とのこと。
URLﾘﾝｸ(www.globalfoundries.com)
　　---------------
　　GLOBALFOUNDRIES today announced it has officially integrated operations
　　with Chartered Semiconductor Manufacturing started functioning as one company
　　under the GLOBALFOUNDRIES brand.
　　---------------
IBMは研究費をボッタクれる相手が一社減って大損…と(笑)

95:Socket774
10/01/15 23:56:07 yT8gAEc6
私は3.8 でもALUの倍速駆動だけは絶対に無いと思うな
Bulldozerは高効率を目指してるんだしCPU 3.5GHzで7GHz駆動とか
方向性が違い過ぎる気がする

発想は凄くいいらしいんだけどねぇ・・・

96:Socket774
10/01/16 00:16:26 YKyOfxPp
IBMは儲かってるから影響少ないかなー

97:Socket774
10/01/16 00:23:57 Pu0TSKFJ
今度はIBMは搾取する側から搾取される側になるのか…

98:Socket774
10/01/16 00:24:06 G/niqYLW
ネトバですが呼んだ？

99:Socket774
10/01/16 00:25:11 YKyOfxPp
安らかにお眠りください

100:Socket774
10/01/16 01:44:15 6SrrWyTn
IBMに払うライセンス料は事業規模に応じて決めてて、
合併したからって半分になったりはしないんじゃないのかねえ。

101:Socket774
10/01/16 02:18:32 juBdPJPA
>>95
ALUが片肺飛行の時は、デコーダーはALUの半速でいけたりしない？

それなら、片肺飛行時に例えばALUを150％にクロックアップした場合は、
デコーダーはその逆で150/2＝75％までクロックダウンしていい
電気を食うのはデコーダらしいし、電力的にはこれで相殺じゃないかな

102:Socket774
10/01/16 10:38:40 5PACIhPQ
Llanoって480SPだけど、
今の5600シリーズ(400sp)より性能高いのかな？

103:Socket774
10/01/16 11:35:30 Svsrdt4E
Llanoが出る頃にはHD6000シリーズが出る頃だし、
HD5600より高い可能性はありそう。

104:Socket774
10/01/16 11:52:40 cftyhswV
>>369
羽生のこれまでやってきたとんでもないところからの逆転劇を何度も見てきてれば
これぐらいの形勢で断言できる奴はいないと思うんだが

105:Socket774
10/01/16 11:53:30 cftyhswV
すまん誤爆した

106:Socket774
10/01/16 14:57:37 Fchfo1vp
>>101
かも知れないけど、そういう複雑な仕組みより
CPU全体で少しでも速く動くようにする気がする。
それにそういう時は1スレッド/2コア実行！って思ったから3.8

107:Socket774
10/01/16 18:15:43 EhwHL2XJ
記事も何度読んでも良く分かんないんだよな
シングルスレッドはCPUを切り替えながら4命令／サイクルで動きつづけるの？

108:Socket774
10/01/16 18:53:21 VR+qCz7q
>>103
GPUのメモリ周りに細工が施されてなければ5600に負ける

109:Socket774
10/01/16 20:02:03 EBixQCkF
CPU⇔GPU間の帯域が劇的に改善され
るだろうし、演算性能自体も20~40%増し
くらいになりそうだから、4670には勝てるん
じゃね。

メモリ帯域が倍近く違うGT240のGDDR5/GD
DR3モデルの性能差も、せいぜい10~25%ってと
こで、劇的な違いが無いし。

URLﾘﾝｸ(www.anandtech.com)

ちなみにノートだと、GDDR3のMobility Radeon
HD5830がGDDR5を使うMobility Radeon
HD4770/4750より上位モデル扱い

110:Socket774
10/01/16 21:47:24 CiMcyFqC
4コア＋4670超えって事は、TDP125Wで投入してくるのかな？

111:Socket774
10/01/16 21:54:23 unsLTrtf
>>110
65Wとか45W枠とか。それ以下だろ。
ノートも視野に入れているだろうし。
ノート用は25W枠以下でもでるんじゃね？

112:Socket774
10/01/16 23:00:44 FyAxupyb
>>110
ノート向けだから最大45Wだろう。

もしかしたらSFF PC向けに65Wモデルが有るかもしれんけど。
45nm SOI → 32nm SOI H/MGでかなり消費電力が改善されるから、下手すりゃ今の半分位になる。

65Wモデル：CPU/3GHz、GPU/700MHz
45Wモデル：CPU/2.5～2.8GHz、GPU/500MHz
25Wモデル：CPU/2GHz、GPU/300～500MHz
みたいになるんじゃないかな

113:Socket774
10/01/16 23:15:43 /+eYtIAa
ただ、"32nmプロセス"では3GHz以上で動作し、
消費電力は2.5～25Wとかいう話もあるしどーなるのか。

114:Socket774
10/01/16 23:52:01 FyAxupyb
あんまり期待しすぎても外れたときにガッカリするから、
控えめに予想しといた方が精神衛生にはいい。

115:Socket774
10/01/17 00:01:47 6SrrWyTn
Radeon要らないならSandyBridgeでいいし、
Radeon好きならSandyBridge+Mobility Radeonを選ぶと思うんだが。

116:Socket774
10/01/17 00:12:41 0crV6qpH
Llano+外部GPUにしたときCrossFire的なことは可能？

117:Socket774
10/01/17 00:49:33 fBzjmNnq
レイテンシ長そうだから出来てもそんなに高速化しなさそう。
デュアルCPUなら出来るかもしれない。

118:Socket774
10/01/17 02:56:56 3bP/7nDC
>>116
Llanoはノート用だから外部GPUとの組み合わせはありえない。

119:Socket774
10/01/17 03:23:44 3bP/7nDC
Sandyは2コア版でも150mm2位あるから今のi5と同程度の値段で安くはないだろう。
AthlonIIX2/4+785Gが後2年は恐らくコストパフォーマンス最強。

よく考えたら、Bulldozer8コアとLlano4コアだけじゃ隙間だらけというか、ラインナップが揃わないな。
来年は現在のコアのシュリンクもあると想定して予想してみる

ハイエンド：
Bulldozer 8コア/6コア(2コア殺し)
250mm2位

ミドル：
32nm Propus 6か8コア
150～200mm2

エントリー：
32nm Propus
(多分LlanoからGPUを引いたコア)
100mm2位

ローエンド
45nm Regor 続行

ノート：
Llano 4コア (160mm2位)
と2コア(多分別設計で100mm2位)

ネットブック(pineよりも少し上)：
Ontario (1コア+80SP位のGPUで50m2以下)

120:Socket774
10/01/17 03:40:03 uxAvc4Kl
Llanoはデスクトップにも投入されますん
公式ロードマップ見れ

121:Socket774
10/01/17 03:44:47 3bP/7nDC
個人予想だが、ハイエンドのBulldozer以外はL3積まないだろう。
L3なくても競争で大丈夫なのはPropus vs Clarkで実証できたし、
無理に積むくらいならコアを多く積んだ方がよほど高性能だろう。

PC向けは32nm版Propus 4コアと8コアのダイを作って、
GPUは785G/890Gと、多分45nm か 40nmで作られる　DX11 対応のチップセット内蔵GPUで、
2011年を過ごす。(多分 Cedarコアそのものか派生コア)

図式としては
RagerやPropus +785G vs Clark i3 or PenG
32nm Propus4コア + 890G vs Sandy 2コア
32nm Propus8コア + 890GorDX11コア vs Sandy4コア

Bulldozer 8コアと Propus 8コアどっちが大きいんだろう？
実はL3含めても多少小さい位で、もしかしたら12コアを300mm2位で出してくるかも。
何せ同じコア数でBulldozerの方が大きかったら意味ないからな。

ということで、実はBulldozer 12コア vs Sandy 8コアが両者300mm2位でハイエンド対決っぽい気がする。

122:Socket774
10/01/17 03:58:52 3bP/7nDC
>>120
投入されてもソケット互換がないから新ソケット登場になるはず。
デスクトップと言っても恐らくメーカーの省スペース向け用で、
マザー直付けとか統合GPUも考慮したAM4とかだろう。

仮にGPU殺してAM3に挿せるようにしても、コスト効率が悪すぎて意味がない。
性能自体はPropusと同程度だろうしね。(シュリンクした分高クロック動作出来るかな)
それなら、100mm2位の32nm Propusを作った方がよほど効率がいい。

統合GPUも考慮したソケットが恐らく2011年後半か2012年頃に出るとおもう。
仮にAM4として、32nm版のCPUコアをピン数だけ変えて対応させたり、LlanoのAM4対応版も登場。

そして恐らくBulldozer + HD6xxxのFusion第二弾もこのソケットに対応すると思う。
まあ、32nmじゃサイズや開発期間的に無理そうだから、22nmで2012/13年頃に出る気がする。

123:Socket774
10/01/17 04:52:39 0vXBaHP/
さすがにお花畑と言わざるを得ない。

Analyst Dayでのロードマップ上にはサーバー・デスクトップ・ノートあわせても
Zambezi（Bulldozer 8/6/4コア）
Llano（K10 4コア+APU）
Ontarino（Bobcat 2コア+APU）
しかない。

ラインナップ的に追加されるとしてもLlano 2コア程度だろう。

124:Socket774
10/01/17 05:03:22 i9WKK8fm
つうかintelよりコア多く積んでようやく同等とか
そんなのベンチ以外の一般用途じゃ負け決定じゃないか・・

125:Socket774
10/01/17 05:05:47 zjKTZGim
8と12ぐらいの話ならそれほどでもないかなー

126:Socket774
10/01/17 08:57:02 rTNp65S5
コア当たりのオーバークロック耐性如何では
TurboBoost的状況が面白くなりそうではないか

127:Socket774
10/01/17 09:06:06 EDx24zQj
TurboBoostをAMDが実装するとしても、Bulldozerって2コア単位にならない？
整数演算部分が2つあるけど、他は共有なんだし。

128:Socket774
10/01/17 09:58:33 PzcePZzL
>>121-122
書き込みに既出情報を無視したたくさんの「僕が考えたCPU妄想」が詰まっていて楽しいな…。
"Propus"の8コアとか。"Bulldozer"の12コアとかｗ
しかしAMDには"Propus"の8コアなんて計画にないし、"Bulldozer"の12コアも無いｗ

まず"Bulldozer"の最初に投入される"Zambezi"は既に8コアってわかっているんだが？
たぶんこれは現行の"Opteron"などの鯖用をリプリースするためのCPUだろうけど、
それ以上のコアはいまと同じで、MCMされ16コア・12コアとなるだろうね。
"Zambezi"以上のコアは出るかもしれないけど、それはその次のプロセスだろ。
そして一般PC向けには、すでに"Bulldozer"で4コア以上という計画がちゃんと出されている。
そもそも今更"Propus"というか"K10コア"を"Llano"以外に開発しているとか。
AMDの開発能力の過大評価もねーだろｗ

ただLlanoが専用ソケットになるのは同意だな。正確には変えた方がいいと思う。
Core i3/i5は一応VGA出力未対応のLGA1156に挿せるんだっけ？
それをしてもいいのだろうけど、そんなのは大した利点ではないし、させなくしていいだろうし。

まぁ。確かに次世代CPUを考えるスレだから、その妄想は楽しかったけど、
既出の情報からずれた妄想はいらないよ。

>>124
>intelよりコア多く積んでようやく同等

この意味がわからん。"SandyBridge"も最大8コアだが…。
しかも8/6コアはどうせOpteron用だろ。
一般向けに出るとしたら6/4だろ。
そしてベンチにだけ強いのはIntel CPUの専売特許…。

129:Socket774
10/01/17 10:16:34 uUv2wP7g
4/8のZambeziはデスクトップ向けでPhenomIIの後継、Opteron系とは別。
Opteron系は12/16のInterlagosとか6/8のValencia。
Analyst Dayの発表から変わってるのなら既出情報とやらを教えてくれ。

130:Socket774
10/01/17 10:35:30 PzcePZzL
あ。そうか。Opteron系は"Valencia"があるんだっけ…。
って事は一般向けにも8コア投入か。
"Sandy Bridge"とは物理コア二倍で論理が同数の戦いか。

131:Socket774
10/01/17 10:37:12 dAXJMgHm
>>129
Zambezi/ValenciaってDeneb/Shanghaiの関係と同じじゃないの？
12・16コアは6・8コアのMCMだし

132:Socket774
10/01/17 10:43:11 EDx24zQj
SandyBridgeもLGA1366後継は8コア、6コアなので
上位は物理コア同じで論理コア倍の関係になる。

133:Socket774
10/01/17 11:37:44 4ow9cjx+
Interlagos「Opteron6xxx」：12～16コア（６ﾓｼﾞｭｰﾙ～8ﾓｼﾞｭｰﾙ）
Valencia「Opteron4xxx」：4～8コア（2ﾓｼﾞｭｰﾙ～4ﾓｼﾞｭｰﾙ）
Zambezi「CS用CPU」：4～8コア（2ﾓｼﾞｭｰﾙ～4ﾓｼﾞｭｰﾙ）

SandyBridge　　Interlagos
物理：8コア　　　物理：16コア
論理：16コア　　　論理：8コア（8ﾓｼﾞｭｰﾙ？）
＋
GPUコア内包

134:Socket774
10/01/17 11:42:12 EDx24zQj
>>133
SandyBridgeのLGA1366後継はGPUないらしいよ。
それにInterlagosと同格はXeonMPだから、SandyBridge世代のXeonMPは2011年中には出てこないだろう。
2011年はWestmere世代MPの物理12コア論理24コアまでしかないはず。

135:Socket774
10/01/17 11:45:57 KovAHKTa
こんな所ではないかな？と妄想してみる。

バリュー１～２：Sandy Bridge　H2　2C 2T　VS　Llano　2C
バリュー２～３：Sandy Bridge　H2　2C 4T VS　Llano　4C
エッセンシャル：Sandy Bridge　H2　4C 4T VS Bulldozer　4C 2モジュール
メインストリーム１～３：Sandy Bridge　H2　4C 8T VS　Bulldozer　6C 3モジュール
パフォーマンス：Sandy Bridge　H2　6C 12T VS　Bulldozer　8C 4モジュール
パフォーマンス：Sandy Bridge　B2　6C 12T VS　Bulldozer　8C 4モジュール
エクストリーム：Sandy Bridge　B2　8C 16T VS　Bulldozer　12C 3モジュールMCM

136:Socket774
10/01/17 12:18:38 SsrQfBI/
LlanoはCongo Platformと同じで、隙間狙いなんじゃね。
正面から挑んでも勝機は無いから、強力なGPU+4コア
を格安で提供みたいな。

現状だと、各メーカーの採用状況は、HP,DELLともに廉
価モデルのみだから、強力なGPUをプラスすることで、上
位モデルへの採用を狙えるかもしれないし。

137:Socket774
10/01/17 12:30:24 4ow9cjx+
Interlagos「Opteron6xxx」：12～16コア（６ﾓｼﾞｭｰﾙ～8ﾓｼﾞｭｰﾙ）
Valencia「Opteron4xxx」：4～8コア（2ﾓｼﾞｭｰﾙ～4ﾓｼﾞｭｰﾙ）
Zambezi「CS用CPU」：4～8コア（2ﾓｼﾞｭｰﾙ～4ﾓｼﾞｭｰﾙ）

--------------------------------------------------------------------------------------------
SandyBridge（LGA1155）　　SandyBridge（LGA1366）　　　　Zambezi
物理：4コア　　　　　　　　　物理：8コア　　　　　　　　　　　物理：8コア
論理：8コア　　　　　　　　　論理：16コア　　　　　　　　　　論理：4コア（4ﾓｼﾞｭｰﾙ？）
　＋
GPU内包
---------------------------------------------------------------------------------------------
Westmere-EX　　　　　　　SandyBridge-EX（LGA????）　　　Interlagos
物理：12コア　　　　　　　　物理：----　　　　　　　　　　　　物理：16コア
論理：24コア　　　　　　　　論理：----　　　　　　　　　　　　論理：8コア（8ﾓｼﾞｭｰﾙ？）
---------------------------------------------------------------------------------------------

コア数はいいとして、スレッド数的にAMD厳しくないか
SandyBridge自体Nehalemから大きく変わらないらしいので、何処までBulldozerアーキでアドバンテージを築けるかが勝負か

138:Socket774
10/01/17 12:46:41 FOvX/UZo
シングル遅いなら要らんな

139:Socket774
10/01/17 12:50:05 rTNp65S5
スレッド数はある程度あれば問題無さそう
やはり電力効率に尽きる
これが不味いとTDPの関係上コア数もクロックも上げられない
intelより高くても良いならメインストリームでは何とかなるだろうけど
ハイエンドで絶望的な状況になってしまう

140:Socket774
10/01/17 12:53:17 4ow9cjx+
>>138
URLﾘﾝｸ(blogs.amd.com)
US20090172359

141:Socket774
10/01/17 12:54:23 EZrSsgWw
dualでいいからIPCとクロック上げてくれよ

142:Socket774
10/01/17 13:12:22 uxAvc4Kl
何で論理コア減らしてんのよ
1モジュールで2スレッド処理出来ることは確定してるのに

143:Socket774
10/01/17 13:14:52 tSVI+tCD
clarkdaleがあれほどのせいのうになったから
Lianoの性能がどれほどか楽しみだな。

144:Socket774
10/01/17 13:20:15 HXnmGK1H
>>142
Interlagos「Opteron6xxx」：12～16コア（６ﾓｼﾞｭｰﾙ～8ﾓｼﾞｭｰﾙ）
Valencia「Opteron4xxx」：4～8コア（2ﾓｼﾞｭｰﾙ～4ﾓｼﾞｭｰﾙ）
Zambezi「CS用CPU」：4～8コア（2ﾓｼﾞｭｰﾙ～4ﾓｼﾞｭｰﾙ）

--------------------------------------------------------------------------------------------
SandyBridge（LGA1155）　　SandyBridge（LGA1366）　　　　Zambezi
物理：4コア　　　　　　　　　物理：8コア　　　　　　　　　　　物理：8コア
論理：8コア　　　　　　　　　論理：16コア　　　　　　　　　　論理：8コア（4ﾓｼﾞｭｰﾙ）
　＋
GPU内包
---------------------------------------------------------------------------------------------
Westmere-EX　　　　　　　SandyBridge-EX（LGA????）　　　Interlagos
物理：12コア　　　　　　　　物理：----　　　　　　　　　　　　物理：16コア
論理：24コア　　　　　　　　論理：----　　　　　　　　　　　　論理：16コア（8ﾓｼﾞｭｰﾙ）
---------------------------------------------------------------------------------------------

こうか

145:Socket774
10/01/17 13:27:16 3PP6Uy61
>>142
何スレッドでも処理出来ますが

146:Socket774
10/01/17 13:58:35 3bP/7nDC
>>128
いや、俺もZambeziが8コアなのは知っている
ただ、propus8コアよりでかいと意味がないなーと思ったんだよ
シングルスレッド性能は下がるか同じくらいらしいからね
そしたら、小さいコアになる必要があるし、その場合もしかしたら12コアくらい頑張れば積めるのかなと思ったんだよ。

ちなみに全くの新コアで新プロセスになるだろうBulldozarは、遅れたり最悪失敗する可能性が有るから、
次善策として、穴埋めできる既存コアのシュリンクを密かに用意してるんじゃないかとも思うんだが。
その場合、Llanoコアから見て4コアで100mm2位にできそうなPropusコアはシュリンクの価値があると思う。
そうすると8コアでも200mm2になり、Sandybridge相手でも十分戦えそうなほど強力に見える。

妄想といえば妄想だけど、Propusの4コアと8コアのシュリンクが有れば、Bulldozerが遅れても問題ない気がする。

147:Socket774
10/01/17 14:09:17 HXnmGK1H
>>146
＞シングルスレッド性能は下がるか同じくらい
URLﾘﾝｸ(blogs.amd.com)
特許US20090172359

この情報からは下がらないんじゃないかな

148:Socket774
10/01/17 14:12:18 MQ/0M0zK
クライアント用だからL3削ってもいいのであって、鯖用に大容量L3なしは厳しいだろう。
マルチプロセッサ時の性能ダウンを緩和するProbFilterも使えなくなる。
8コアとなるとクロスバー部分がIstanbulのときより肥大化するし。

149:Socket774
10/01/17 14:47:29 KovAHKTa
よく考えたらコスト的にありえん部分があったので妄想訂正。

バリュー２　　　　：Sandy Bridge　H2　2C 2T　VS　Llano　2C
バリュー３：Sandy Bridge　H2　2C 4T VS　Llano　4C
エッセンシャル：Sandy Bridge　H2　4C 4T VS Bulldozer　4C 2モジュール
メインストリーム１～３：Sandy Bridge　H2　4C 8T VS　Bulldozer　6C 3モジュール
メインストリーム３、パフォーマンス：Sandy Bridge　H2？6C 12T VS　Bulldozer　8C 4モジュール
メインストリーム３、パフォーマンス：Sandy Bridge　B2　6C 12T VS　Bulldozer　8C 4モジュール　
エクストリーム：Sandy Bridge　B2　8C 16T VS　Bulldozer　12C 3モジュールMCM？
　

150:Socket774
10/01/17 14:50:11 uUv2wP7g
今から一年後に今さら手垢のついたK10系コア×8のCPUはいらんだろ
そんなのに回すリソースがあるぐらいなら今後のことを考えてBulldozerに注力すべきところ
GPUとセットで廉価・ノート向けにLlanoを準備しているのは正しい

151:Socket774
10/01/17 16:11:17 Xq1W71YJ
ノートなら手垢のついたK10でいい……というのも間違ってるような。
最初のプラン通り、GPU統合もBulldozerベースで行くべきところではないかと。

まあそうできない事情があるのはわかるんだけど、
K10コアで誰が買うの? という。

152:Socket774
10/01/17 16:30:12 MhWLbZJt
>>149
>Bulldozer　12C 3モジュールMCM？
ハイエンドだけ別のソケットってのは考えにくくない？

>>151
Agena→Deneb/Propus→Thuban→Llanoってアーキテクチャ的に3回もマイナーチェンジしてるし、
ローエンド向け（兼バックアッププラン？）では悪くないと思う
それよりむしろLlanoが2010年中でSandy Bridgeより先に出せればなあ・・・と思う

153:Socket774
10/01/17 16:48:55 QiQBQSqj
>>151
マーケティング次第だと思います

154:Socket774
10/01/17 16:52:43 iYfugQbc
Bulldozer 4Cでいいから2010に出してくれ。

155:Socket774
10/01/17 16:56:26 RX6BiXzv
結局、仮想OSを沢山動かすサーバーに最適化しやがったのか
企業のデスクトップはみんなローエンド路線だし、まあ正しいのかね。

156:Socket774
10/01/17 16:59:53 zjKTZGim
今の売れ筋はその辺と

157:Socket774
10/01/17 17:03:37 iYfugQbc
日本はセレロン王国ですから。

158:Socket774
10/01/17 17:04:23 EKDxcaLk
というか鯖路線で勝てないと
結局のところ10年前のどうしようもない状況に戻るしかない
まあBulldozerでほんとに勝てるかどうかも微妙だけどな

159:Socket774
10/01/17 17:12:42 QiQBQSqj
RADEONのようにロー～ミドルを制すればいい

160:Socket774
10/01/17 17:23:21 Xq1W71YJ
>>153
AMDの世界ではマーケティング=ダンピングなのだが……

161:MACオタ
10/01/17 17:35:19 RiQ1mYyb
あまりの能天気っぷりに、このカキコミ準備し始めたんですけど妥当な結論に
議論が落ち着きつつありますね。
これ、現状での istanbul と nehalem のシングルソケットモデルでの SPEC2006
での比較ですが、1.5倍のコア数ですら性能で追いつくこともおぼつかない始末。
コアのリソースをケチった bulldozer で sandy bridge の比較も想像がつきそうな
モノはあります。

　(base/peak)　　　　　　　int　　　　　　　fp　　　　　　　int-rate　　　　fp-rate
Opteron 2435/2.6GHz　　18.0 / 21.1　　22.0 / 23.9　　82.0 / 104　　65.1 / 72.0
Xeon E5540/2.53GHz　　26.5 / 29.4　　31.8 / 33.8　　104 / 111　　84.8 / 87.6

[参考]
■ Opteron 2435/2.6GHz (HP ProLiant DL165 G6)
URLﾘﾝｸ(www.spec.org)
URLﾘﾝｸ(www.spec.org)
URLﾘﾝｸ(www.spec.org)
URLﾘﾝｸ(www.spec.org)

■ Xeon E5540/2.53GHz (Bull R440 E2)
URLﾘﾝｸ(www.spec.org)
URLﾘﾝｸ(www.spec.org)
(上記のCINT2006, CFP2006はデュアルソケットモデルの結果だが、両ベンチは
シングルプロセスのベンチマークである。)
URLﾘﾝｸ(www.spec.org)
URLﾘﾝｸ(www.spec.org)

162:Socket774
10/01/17 17:39:01 QiQBQSqj
Llanoはノート向けでCongoやTigrisクラスを置き換えるんじゃないかと妄想
そうすると6～10万くらいで提供されるから性能に対して不当に安いかもしれないですね

163:Socket774
10/01/17 17:41:34 n4xRcLBz
>>109
GPU/CPU間の帯域って性能にそんなに影響するかなあ？

勿論既存のチプセト内蔵GPUの時よりはマシになるだろうけど、今の大抵の780以降の
チプセトだとLFB搭載が普通だから、それがメインメモリになるデメリットで相殺され
そうな悪寒が。

>>122
GPU統合CPUのソケットからのVideo出力って、やっぱAMD独自になるのかね？

何か標準的な出力インターフェースが有れば良いのに、とオモタ。

164:Socket774
10/01/17 17:42:49 zjKTZGim
性能に対して不当に安いぐらいでいい

165:Socket774
10/01/17 17:43:30 Xq1W71YJ
>>161
Nehalemはベンチ番長でうんたらかんたら
Bulldozerは1スレッドを2コアでうんたらかんたら

166:Socket774
10/01/17 17:45:59 3PP6Uy61
雑音は知能の改善の兆しが見られずうんたらかんたら

167:Socket774
10/01/17 17:47:15 SL1w6Pza
むしろ伝統レベルの知能維持

168:Socket774
10/01/17 17:56:26 0crV6qpH
ライトバックキャッシュについて語り合わないか？

169:Socket774
10/01/17 18:03:48 SFIOhFBJ
21GB/sの帯域でどうしろっての・・

170:MACオタ＞168 さん
10/01/17 18:06:16 RiQ1mYyb
>>168
地味に思えるかもしれませんが、分岐予測について語り合ったほうが良いかと思いますよ。
URLﾘﾝｸ(www.realworldtech.com)
ちょうど安藤氏の最近の講座も、その方面の話を書いてますし。
URLﾘﾝｸ(journal.mycom.co.jp)

171:Socket774
10/01/17 18:07:06 iYfugQbc
APUはノートとかローコストデスクトップ用だわな。
メモリ性能が落ちるのがわかりきっててパフォーマンス
なんか出せるわけがない。

172:Socket774
10/01/17 18:09:46 hQhNowFK
WriteCoalescingCache
TransientTransactionCache

173:Socket774
10/01/17 18:13:52 QiQBQSqj
やっぱりマイコミはまだHD5670のレビューないなー

174:Socket774
10/01/17 18:19:30 EZrSsgWw
都合の悪いものはベンチ番長ｗ

175:Socket774
10/01/17 18:31:20 Xq1W71YJ
誰か>>161のシステム価格の違いを突っ込んでくれないかな。

自分はAMD信者じゃないからやらん。

176:Socket774
10/01/17 18:33:18 RX6BiXzv
実行ユニットをたくさん並べても、依存関係のせいで有効活用できてない
今でも無駄だらけなんで、インテルはHT導入して有効活用を図ったけど、
5％の回路追加で30％ぐらいしか性能上がらない。

それだったら細い実行ユニット二つ並べた方がマシと言ってるわけね。
12%の回路追加で80％上がりますよってか。

確かに仮想OS使うなら、HTよりこっちのがいいかもな。
ジサカー的には、マルチコア対応ソフトがどのくらい速くなるかだな。

177:Socket774
10/01/17 18:50:04 BnlhWNS8
コア数増やしていっても一般用途との乖離が進むだけ

178:Socket774
10/01/17 18:59:15 uUv2wP7g
4コア8スレッドなIntelの方が先逝っちゃってるけどね

179:Socket774
10/01/17 19:02:24 iYfugQbc
HyperThreadingはタイミング系アプリで不具合起こすことが
あるから俺は否定的。

180:Socket774
10/01/17 19:02:54 MQ/0M0zK
前は50%のリソース増で80%のスループットアップだったのが、
12%増で80%ってかなり数字が変わっているね。
リソース増加の計算の仕方変えたのだろうか。

181:Socket774
10/01/17 19:03:36 dbjrQn0t
整数ユニットの数とかどうでもいいから
ロード・ストアの性能上げて欲しい

x86 Memory disambiguition test
URLﾘﾝｸ(www.realworldtech.com)

Phenom
ｽﾚﾘﾝｸ(tech板:551番)
> Test 1 -- Loading before unknown load address:
> Loading before unknown load address:　10 cycles
> Loading before known load address:　　 10 cycles
> Loading before unknown load address:　Yes!

> Test 2 -- Loading before unknown store address:
> Loading before unknown store address:　20 cycles
> Loading before known store address:　　10 cycles
> Loading before unknown store address:　No!

> Test 3 -- Storeing before unknown load address:
> Storeing before unknown load address:　25 cycles
> Storeing before known load address:　　12 cycles
> Storeing before unknown load address:　No!

> Test 4 -- Storeing before unknown store address:
> Storeing before unknown store address:　25 cycles
> Storeing before known store address:　　 10 cycles
> Storeing before unknown store address:　No!

182:Socket774
10/01/17 19:09:29 BnlhWNS8
core i5 6xxシリーズは地に足の着いた良品

183:Socket774
10/01/17 19:10:06 3PP6Uy61
依存関係のこと考えると「2コアで1スレ」もおまけ程度のもので
シングルスレッドではやはりクロック上げるのが一番なんだよな

184:Socket774
10/01/17 19:14:02 iYfugQbc
i5 6xxにするぐらいなら750のほうが幸せ。
ビデオカードは独立で搭載するもんだ。

185:Socket774
10/01/17 19:22:04 SL1w6Pza
スレチ

186:Socket774
10/01/17 19:25:23 BnlhWNS8
そうかい？
高々2.66GHzの4coreより3.47GHzの2coreの方がベンチ以外じゃ快適だと思うが？

187:Socket774
10/01/17 19:28:20 3bP/7nDC
Bulldozerは新コア新プロセスでリスクでかいだろ？
次善策で既存コアのシュリンク版は必要。
事情やリソースは関係ない、企業として当然の戦略

Llanoは15万円以上の高性能ノート向け
5万～10万のレンジはAthlonII+785Gとかの在庫処分だろう
5万以下のネットブッククラスはシングルコアのOntario
Llanoを10万以下はあり得ないな、あっても99800とかだろう。
(選別落ちの2コア版とかで)

188:Socket774
10/01/17 19:35:33 uUv2wP7g
Llanoが現在メインのシュリンクコア版だしちっさくなって余裕のできた分をGPUに回してるだけ
下のラインはCPUコア×2のOntarioがあるだろ

189:Socket774
10/01/17 19:40:23 3bP/7nDC
ClarkdaleのCPUが84mm2でメモコンとか加えたら100mm2位だろう。
LlanoからGPU削ったら、100mm2位になる。

つまり、32nmプロセスはK10.5 4コアとNehalem 2コア4スレッドが同じサイズになる。
性能差はあまり出ないのはAthlonII vs i3/i5の色んなベンチが証明している。

しかもllanoはターボブーストっぽい機能も備えると聞く
最早AMDとIntelの差はCPUには存在せず、内蔵GPUの差になるんじゃないかな。

190:Socket774
10/01/17 19:42:58 5EJJcVZp
Llanoはたぶんノート全般だと思うよ。
まず採用されることが前提だから、
価格は安めに設定されてくるはず。
あとは消費電力が改善されていれば…の話だが。

191:MACオタ＞175 さん
10/01/17 19:44:43 RiQ1mYyb
>>175
　　----------------------
　　誰か>>161のシステム価格の違いを突っ込んでくれないかな。
　　----------------------
プロセッサ価格なら簡単に調べられますよ。
Opteron 2435: 112,590 円 URLﾘﾝｸ(www.1-s.jp)
Xeon E5540: 82,620 円 URLﾘﾝｸ(www.1-s.jp) E5540

192:Socket774
10/01/17 19:51:18 BnlhWNS8
2 coreと4 coreでベンチの差がないってのは
4 coreにとって悲しいことだね

193:Socket774
10/01/17 20:59:01 SFIOhFBJ
考えてみるとturbo boostってnanoの逆オーバークロックと同じなんだな
TukwilaのPLL二つ搭載もC7と同じ

centaurってすごい

194:Socket774
10/01/17 21:19:24 BnlhWNS8
Adaptive PowerSaverの自動オーバークロックって行か

Yet another feature provides automatic overclocking if the die
temperature is low. Another feature allows the processor to automatically maintain the die
temperature at a user-specified temperature.

195:Socket774
10/01/17 21:56:24 Xq1W71YJ
>>191
パーツ屋でOpteron/Xeon買う人はいないから、実勢は反映されてないんじゃないかなあ。

HP ProLiant DL165 G6
AMD Opteron 2435 2.6GHz*2 8GB RAM で434,700円
URLﾘﾝｸ(h10010.www1.hp.com)

同じくHP ProLiant DL160 G6
Intel Xeon X5550 2.66GHz*2 8GB RAM で510,300円

システム価格で見れば、性能差に見合った価格差はありそうよ? (まあ当然だけど)

196:Socket774
10/01/17 22:05:43 Xq1W71YJ
でまあ、昔なら「Opteronの方がamd64バイナリで有利」とかあって、
価格以外にもAMDを選ぶ理由があったんだけど、今は特にないんだよね。

せめてAESアクセラレーションぐらい先取りすればいいと思うんだがね。
VIAが既にやっていることだし。

197:Socket774
10/01/17 22:36:59 QiQBQSqj
15万以上ってもはやゲーミングモデルじゃん
それか情弱向けにオプションつけまくったモデルか

AIONなどのメジャーなMMOとかが中設定以下で快適に動けばいいので10万前後がやっぱ妥当かな

198:Socket774
10/01/17 22:45:20 3bP/7nDC
>>192
> 2 coreと4 coreでベンチの差がないってのは
> 4 coreにとって悲しいことだね
2コアと4コアにサイズの差があまりないから気にすることもなさそうだ。
小さいコア(K10)4個 ≒ 大きなコア(Corei)2個

199:MACオタ
10/01/17 23:34:47 RiQ1mYyb
トランジスタ数とダイサイズに関して言えばこうなっている訳ですが…
URLﾘﾝｸ(techreport.com)
　- Istanbul: 904 million transistors, and its six-core die is 346 mm2
　- Nehalem: 751 million transistors in a 263 mm2 die

そして性能差は>>161、価格差は>>191にある通り。

200:Socket774
10/01/18 00:28:45 WZlY2HdQ
トランジスタ数がShanghaiと同じだと考えると、Nehalemのトランジスタ対性能比は
すごいですな。

201:Socket774
10/01/18 00:29:43 1veusQsY
>>182
ジサッカーから見放されてるけどなｗ

202:Socket774
10/01/18 01:07:13 WZlY2HdQ
しかしMACオタも、Bulldozerのひみつについては
まだ何もそれっぽいネタを掴んでないのかね。

Rock同様、発売延期(→中止のコンボ)でも驚かないが。
CMTではちょっとしか売れないだろう。
CMTでないというには、まだパズルのピースが欠けている。

203:Socket774
10/01/18 01:44:47 OdlMhC+p
SPECみたいな提灯でしか性能語れないのか

204:Socket774
10/01/18 02:12:29 9SWwf0Nr
はぁ？

205:Socket774
10/01/18 06:27:25 ZNqPRg1o
あいかわらずアム厨はアホですな～

206:Socket774
10/01/18 07:15:31 UHOs0uZE
> 2 coreと4 coreでベンチの差がないってのは
> 4 coreにとって悲しいことだね

シングルで圧倒的に劣るってｗ

シングルの遅い4coreはベンチでしか使えない

でもクライアントでatom 100コアとかあったら
買いそうだよな、ここの連中

207:Socket774
10/01/18 08:32:30 8y915HXX
最高な提灯記事が読めるようになればそれで良いです

208:Socket774
10/01/18 10:16:03 4QVWtV+N
既知の何百何千という高速化技術の中から、ワットパフォーマンスの良いものを拾い出し悪い物は削って
徹底的にブラッシュアップしたのがCore2とその子孫
また、ワットパフォーマンス≒トランジスタ効率だからそちらも優秀

Bulldozerもアーキテクチャの節目なんだからその辺りの事は当然やってくるだろ

209:Socket774
10/01/18 10:27:13 GQmX2tgC
OpスレよりXEON E5540とOPTERON 2435比較
ｽﾚﾘﾝｸ(jisaku板:515-番)

210:Socket774
10/01/18 10:28:41 fZVom6Vp
Intel最適化をまだ語ってる奴が居るとは

211:Socket774
10/01/18 11:32:07 WZlY2HdQ
>>209
XeonのファイルI/Oの数字がおかしいね。
何かバックグラウンドで動いてるんじゃない?

212:Socket774
10/01/18 13:23:49 9GveaEit
>>206
おいおい…頭の中は大丈夫か？

213:Socket774
10/01/18 15:26:49 1veusQsY
528 名前：Socket774[sage] 投稿日：2010/01/01(金) 12:22:44 ID:lEhCwdPM
TOP500だとNehalem-EPとBarcelonaでコア辺りのクロック性能同じ位だね。
参考になるのかどうか判らないが。

でも実質Intel専用ベンチのSandraで差が付かないってのは凄いな。

214:Socket774
10/01/18 17:04:37 jBGA7LYI
>>211
ファイルIOに限らずメモリなんかも不可解に遅い

215:Socket774
10/01/18 18:20:14 ktrV4NKu
そんなことよりBobcatの話しようぜ！
今分かってるのは「カスタム回路を使わない」「高度な分岐予測・投機実行は備えない」
からパイプライン浅めで、比較的低周波数なことくらい？

シングルスレッドの整数演算性能を捨ててないシンプルコアって、多分なかっただろうから期待

216:Socket774
10/01/18 20:09:49 8U9tjYSr
Bobcatってスマートでかっこいいよね
そこら辺の飼い慣らされた家猫とはひと味違うぜ

217:Socket774
10/01/18 20:18:01 LThODl5q
俺はロングかセミロングが好きかな

218:Socket774
10/01/18 20:23:42 ZwKmOpS3
オセロットの可愛さはガチ

219:Socket774
10/01/18 20:28:10 6KyefAMi
>>218
俺のリロードはレボリューションだぁ！！！！！！

220:Socket774
10/01/18 20:42:35 fZVom6Vp
>>216
味っていうか属っていうか

221:Socket774
10/01/18 22:27:39 eVh9mt7u
>>215
ファイル鯖にはうってつけのCPUで正直欲しいんだが、
自作で手に入るのかね

222:Socket774
10/01/18 22:57:56 E1LMjgwA
ファイル鯖くらいならCore2の低クロック品とかで十分なんじゃね

223:Socket774
10/01/18 23:55:41 OdlMhC+p
ソフトウェアRAID6のランダムライトで1GB/s出る位に早くならないもんかね。

224:Socket774
10/01/19 01:30:20 S5KVCh0t
SASを16台くらい並べてみたらどうだろう

225:Socket774
10/01/19 10:00:02 CuG681Er
それだけのアレイを接続できるんならやってみろって感じだな

226:Socket774
10/01/19 10:05:55 IkeUqbQI
都市名のコードネームは止め？

227:Socket774
10/01/19 12:15:20 9BeRtdL9
>>222
ファイル鯖ならATOMでいいだろ…。

>>226
まだ続いているでしょ？

228:Socket774
10/01/19 13:07:31 H1+3K/RE
2010年CES　3D映像は、「情報を消費する人」を動かすか
URLﾘﾝｸ(cybergarden.cocolog-nifty.com)

CESから2010年代前半を展望する～情報を消費するカタチを変える
URLﾘﾝｸ(cybergarden.cocolog-nifty.com)

229:Socket774
10/01/19 14:22:18 jf7EPGQ2
ここ一瞬で萌えレイアウト止めたよなｗ

230:Socket774
10/01/19 19:40:10 W0UrEsTT
>>7
いちばん使い回しがきいたのはSuper 7。
Pentium 75MHzからK-6II+550MHzまで、最低から最高までの周波数の幅がもっとも広く、
インテルからAMD、サイリックスからライズまで、もっとも多社のCPUが載った。

231:Socket774
10/01/19 20:30:14 SJ8uADyt
原作知らんけどクドかわいいね
金銭的に買えなかった俺にローアングルな悩殺写真を・・・

232:Socket774
10/01/19 20:32:19 SJ8uADyt
これは酷い誤爆

233:Socket774
10/01/19 20:49:30 8WpZK6HL
>>231
激しく同意

234:Socket774
10/01/19 20:56:14 e9bu8ORi
>>227
あのmini-ITXのマザボじゃどうにもならんのだよ。
BOBCATも組み込みしかないだろうけどな。

235:Socket774
10/01/19 23:00:03 uvDhVx1H
URLﾘﾝｸ(www.sc.isc.tohoku.ac.jp)

東北大の学生さんの卒論なんだけど、これがBULLDOZERの元ネタだなきっとｗ

整数演算３　ロードストア２のCPUシミュレーターで、実効IPCは1.5にも届かないのか。
売ってるCPUはもっと工夫が凝らされてるんだろうけど、
IPC=3以上を目指して頑張るのは無理があるのかもしれないな。

後は回るかどうかだなあ

236:Socket774
10/01/19 23:29:27 7ffNIays
>>230
だがちょっと待って欲しい
クロックの幅が一番大きいのはLGA775(1.6GHz-3.8GHz）ではないか？

237:Socket774
10/01/20 00:04:10 HlC9iNf4
>>230
その程度の論文？と呼べるかどうか判らない代物が元ネタだったらもっと
CPUの会社沢山出来てるわ。内容的に大原の記事の方がまだましだわ。

238:Socket774
10/01/20 00:04:54 HlC9iNf4
あーアンカー間違えた235宛てね・・

239:Socket774
10/01/20 00:36:08 r3FXAeQB
>>238
そんなマジレスしなくても

240:Socket774
10/01/20 00:58:55 6UORIW68
>>237-238
ネタにマジレス格好悪いレベルだぜｗ

241:Socket774
10/01/20 01:23:40 HlC9iNf4
>>239-240
すまんな。
>整数演算３　ロードストア２のCPUシミュレーターで、実効IPCは1.5にも届かないのか。
とか言ってるからマジで頭がアレな奴かと思っちゃった。

242:,,・´∀｀・,,）っ-○○○
10/01/20 02:08:04 3l1MxLJm
実効値なんてそんなもんだ。

243:Socket774
10/01/20 02:14:08 r3FXAeQB
>>241
なんで？
常にIPC3で計算できると思ってるの？

244:,,・´∀｀・,,）っ-○○○
10/01/20 07:03:25 3l1MxLJm
実効IPC=3なんて命令・データとも完全にL1キャッシュにヒットしてなおかつ
オペレーションに依存関係が無い場合に初めてできるもんだ。

245:Socket774
10/01/20 07:44:37 pz9xcW/d
IPC=9のCPUがでるまで寝るわ

246:Socket774
10/01/20 13:10:31 P6CXp1Ua
>>245
冷凍睡眠お勧め。

247:Socket774
10/01/20 14:31:42 21fuO/ef
その大原がAMDは平均IPC3だと匂わせるような記事書いてフルボッコだったような

248:Socket774
10/01/20 16:12:39 pnsh+ZBn
書いてねーし

249:Socket774
10/01/20 17:20:01 P6CXp1Ua
>>247
古いな…確かK10がまだK8Lと呼ばれていた時代だっけ？

250:Socket774
10/01/20 19:11:31 vEs0l7rq
Itaniumが事実上死んで、ILPに特化したプロセッサなくなっちゃったね
電力効率悪かろうとも、シングルスレッド性能のみを追求する分野ってないのかね

251:Socket774
10/01/20 20:55:03 v2BmrT8w
久し振りに2ちゃん見たけど、AMDってまだあったのか

252:MACオタ
10/01/20 20:59:44 sipYmIQS
GFの親会社でアブダビのATICが韓国の半導体業界と手を組むとのこと。
URLﾘﾝｸ(www.eetimes.com)
　　--------------------
　　The agreement is broad-ranging covering development collaboration, commercial,
　　public-private and educational cooperation. The possibility of ATIC investing in
　　Hynix, a memory chip vendor from which a number of banks are seeking to
　　disengage, was not discussed in a statement issued by ATIC, but nor was it excluded.
　　--------------------
まあ、この程度でアム虫さんの信仰心は揺らがないのでしょうが、一方で Intel が日本への
投資を強化するなんてニュースも…
URLﾘﾝｸ(www.eetimes.com)
　　====================
　　The story quotes Akimichi Degawa, a Tokyo-based strategic investment manager
　　at Intel Capital saying the firm plans to invest "aggressively" in Japan and is
　　looking at opportunities in both publicly traded companies and private firms.
　　====================

253:Socket774
10/01/20 20:59:48 TZcObhIA
890FX+Thubanﾏﾀﾞｰ

254:Socket774
10/01/20 21:09:59 3OseHzk9
>>252
マジで…かの国にだけは触れちゃダメー…。

>>253
そろそろ。Q1末期だっけ？

255:Socket774
10/01/20 21:15:29 ZlA3B/iG
>>252
韓国は今や世界のエレクトロニクス工場になっているのは
周知の事実だと思うんだが、何かまずいことでもあるのか？

どこがどこと組もうがどうでもいい話だろう。

256:Socket774
10/01/20 21:18:12 HlC9iNf4
そんな話はしょっちゅう出てるが一度もそうなった事はない。
これからもそうならないだろう。

257:Socket774
10/01/20 21:19:55 p2mXKIKF
韓国パーツどっさりPCモドキ使ってるマカが韓国を否定しちゃいかんだろｗ

258:Socket774
10/01/20 21:25:42 3RWg4yKL
というか、PC系って基本中台韓が多いよね

259:Socket774
10/01/20 21:43:55 pz9xcW/d
半導体ランキングにはいってる日本企業は東芝だけだっけ？

260:Socket774
10/01/20 21:51:45 OT5c7vMb
>>252
そんなこと言ってたら電子機器などさわれんわ　馬鹿ｗ

261:Socket774
10/01/20 22:08:09 HlC9iNf4
>>259
ルネサスは？

262:Socket774
10/01/20 23:14:34 u3jMY2t/
ATICがかの国に手を出したんだろ？
かの国の法則に従って資金売りが悪化し、
GFにまで影響が出ないか心配だ。

263:Socket774
10/01/20 23:20:50 i1o63ilr
そんなことよりライトバックキャッシュについて語ろうぜ
GPUも絡めてな

264:,,・´∀｀・,,）っ-○○○
10/01/21 00:42:27 bARPtRXi
いまどきのCPUでライトバックじゃないキャッシュってどんだけあるの？

NetburstのL1→L2はライトスルーだったが

265:Socket774
10/01/21 00:53:17 o7OvW/F2
GT300のキャッシュはライトバックキャッシュじゃなくて
ライタブル（ライトスルー）キャッシュじゃないの？

266:Socket774
10/01/21 02:20:16 hFBj4Su0
>>228
３D映像なんてweb2.0と一緒で、儲けネタが欲しい業界が無理に騒いでるだけだわな。

267:Socket774
10/01/21 02:29:43 GsWx9FvL
3Dはコケる気がする
｢日本人は新しいものに否定的だから～｣とかじゃなくて普通に世界規模でコケそう

268:Socket774
10/01/21 02:31:02 ZIOUcXl2
映画は広がってるし
今回失敗してまた5,6年後に再燃するかもしれんな

269:Socket774
10/01/21 02:39:14 GsWx9FvL
うむ…

270:Socket774
10/01/21 03:03:19 bN7Prhn6
眼鏡のいらない3Dが必要
映画館で2時間程度なら非日常の経験として抵抗はないが
家の中でTVを見るのにわざわざ眼鏡は無いわ
需要があっても本気でホームシアター組んでる人くらいでしょ

271:Socket774
10/01/21 03:17:04 zVfwXlXl
自宅で3Dで初音ミクがみられるならわざわざ眼鏡かけちゃいますよ?

272:MACオタ
10/01/21 08:36:12 of8CGWIO
RealWorldTech掲示板の投稿で発見しましたが、OPEN64のリポジトリに
bulldozerのキャッシュ構成と思しき情報が…
RWT掲示板
URLﾘﾝｸ(www.realworldtech.com)
問題のソース
URLﾘﾝｸ(svn.open64.net)
■ L1
case TARGET_orochi:
L[0] = MHD_LEVEL(MHD_TYPE_CACHE, // Type
16*1024, // Size
64, // Line Size
18, // Clean Miss Penalty
18, // Dirty Miss Penalty
4, // Associativity
32, // TLB Entries
4*1024, // Page Size
50, // TLB Clean Miss Penalty ?
50, // TLB Dirty Miss Penalty ?
6.0, // Typical Outstanding Loads ?
0.8, // Load_OP_Overlap_1 ?
0.4, // Load_OP_Overlap_2 ?
50); // Pct_Excess_Writes_Nonhidable ?
break;

273:MACオタ＠続き
10/01/21 08:40:12 of8CGWIO
■ L2
　case TARGET_barcelona:
　　　　// TODO: this might be too generous: in multiple processor situations,
　　　　// there is a cost to loading the shared bus/memory.
　　　　L[1] = MHD_LEVEL(MHD_TYPE_CACHE,
　　　　　　　　1*512*1024,
　　　　　　　　64,
　　　　　　　　150,
　　　　　　　　200, // ?
　　　　　　　　16,
　　　　　　　　512,
　　　　　　　　4*1024,
　　　　　　　　50, // ?
　　　　　　　　50, // ?
　　　　　　　　LNO_Run_Prefetch ? 1.8: 1.0, // ?
　　　　　　　　LNO_Run_Prefetch ? 0.7 : 0.1, // ?
　　　　　　　　LNO_Run_Prefetch ? 0.3 : 0.05, // ?
　　　　　　　　LNO_Run_Prefetch ? 25 : 50); // ?
　break;

274:Socket774
10/01/21 08:40:59 h6O0rEFb
やっぱスカラーしょぼそうだな

275:MACオタ＠訂正
10/01/21 08:42:46 of8CGWIO
>>273 は見ての通り Barcelona の記述でした。こちらが bulldozer

　case TARGET_orochi:
　　　　// TODO: this might be too generous: in multiple processor situations,
　　　　// there is a cost to loading the shared bus/memory.
　　　　L[1] = MHD_LEVEL(MHD_TYPE_CACHE,
　　　　　　　　2*1024*1024,
　　　　　　　　64,
　　　　　　　　150,
　　　　　　　　200, // ?
　　　　　　　　16,
　　　　　　　　512,
　　　　　　　　4*1024,
　　　　　　　　50, // ?
　　　　　　　　50, // ?
　　　　　　　　LNO_Run_Prefetch ? 1.8: 1.0, // ?
　　　　　　　　LNO_Run_Prefetch ? 0.7 : 0.1, // ?
　　　　　　　　LNO_Run_Prefetch ? 0.3 : 0.05, // ?
　　　　　　　　LNO_Run_Prefetch ? 25 : 50); // ?
　break;

276:Socket774
10/01/21 10:10:07 6rHZVXtL
L1D: 16KB
共有L2: 2MB

この容量差だとInclusiveか?

277:Socket774
10/01/21 10:29:10 VnnADWU2
トレースキャッシュ説もある

278:Socket774
10/01/21 10:54:44 AEWheypA
ふーん。このキャッシュ量が本当だとすると、
本当に新アーキティクチャなんだなぁ…。

279:Socket774
10/01/21 11:37:00 Y4KeIyu+
またL2少ないのか

280:Socket774
10/01/21 11:51:23 36ug54NB
1モジュールあたりのL2が2MBなんじゃないの？
モジュール間で共有するL3もあるし。

281:Socket774
10/01/21 12:05:41 AEWheypA
>>279
L2は大きいだろ。

282:Socket774
10/01/21 13:44:06 bN7Prhn6
L2がこれだけあるとL3は容量差的にVictimか
それともT-RAM採用で大容量化してInclusiveか

283:Socket774
10/01/21 13:47:32 AYWZXSqR
そもそもL3あるのか疑問

284:Socket774
10/01/21 13:50:40 AEWheypA
>>283
いや…その発言は流石に…。

285:Socket774
10/01/21 13:59:50 AYWZXSqR
描いてあったんだな
見落としてた
URLﾘﾝｸ(journal.mycom.co.jp)

286:Socket774
10/01/21 14:10:56 bN7Prhn6
L2のLatency大きくね？

287:Socket774
10/01/21 14:18:20 lRH2p+r+
L1は半減してway数が倍か

288:Socket774
10/01/21 16:43:15 AEWheypA
まぁ。実際には全く別CPUの物だったりしてｗ

289:Socket774
10/01/21 23:26:08 Sw9mRP75
>>288
かもね。でも、Bulldozerは2コアで同じL2キャッシュを
共有するんだから、非排他型で小容量L1と大容量L2というのも
理にはかなってるんじゃない？

しっかし、どこぞのCPUみたいな構成だなｗ

290:Socket774
10/01/22 06:49:25 se7VxPdl
まるでPen4を低消費電力志向の効率重視に
生まれ変わらせたみたいだな

291:Socket774
10/01/22 07:09:45 vv38dy3z
Pen4みたいなCPUにするとは地獄一直線じゃまいか
それにIntelのように提灯記事書かせられないし

292:Socket774
10/01/22 07:23:00 K06V7UEH
アム厨ざまあｗ

293:Socket774
10/01/22 08:33:55 wkPpJWIv
(Pentium4 - 1コア2スッドレ) + 2コア1スッドレ + HKMG + 32nm + AMD版TB　 = Bulldozer

294:Socket774
10/01/22 08:35:23 wkPpJWIv
そぉい！　を忘れてた

295:Socket774
10/01/22 09:34:39 afQeCPeg
Some instruction latency numbers of Bulldozer?
URLﾘﾝｸ(citavia.blog.de)

命令レイテンシも出てるみたいだ

296:Socket774
10/01/22 10:16:42 4TT5t9OB
URLﾘﾝｸ(svn.open64.net)
Any_Result_Available_Time()がレイテンシ

fp-load 2 -> 5
fadd/fmul 4 -> 6
fmadd 6
fdiv32 18 -> 27
fdiv64 20 -> 30

297:Socket774
10/01/22 12:57:14 3wlIUqpb
>>295-296
これは今の時期に一応動くサンプルが出回っているってことか？
ちょっとwktkだな。

298:Socket774
10/01/22 13:03:53 J2L2y9ii
ふう馬鹿乙

299:Socket774
10/01/22 14:30:57 Uk3NQC1H
各構成が変わり過ぎてて旧世代との比較で性能が予測できないな

300:,,・´∀｀・,,）っ-○○○
10/01/22 18:21:52 F0MHD1R9
実にピーキーな設計だ。

301:Socket774
10/01/22 18:53:16 GIRP/464
>>300
ピキピキッと来る奴だ

302:Socket774
10/01/22 19:31:46 wziKbBXq
嫌な予感がしてきた
ワクワクする

303:Socket774
10/01/22 20:19:31 cbqjUVp0
ピーキー過ぎてお前にゃ無理だよ

304:Socket774
10/01/22 20:28:58 xvmz2ouS BE:468305524-PLT(19240)
乗れるさ

305:Socket774
10/01/22 20:31:40 cbqjUVp0
ハッハッ、欲しけりゃな、お前もデカイのぶんどりな！

306:Socket774
10/01/22 20:46:45 Vf6MgUru
そうかぁ。節電設定でも、周波数を3.8GHzより下げちゃいけないんだな。

307:Socket774
10/01/22 22:13:26 /gxtwgUX
>>300
解説頼む

308:Socket774
10/01/23 00:09:54 xxGAzTki
11000MHzまできっちり回せ。

309:Socket774
10/01/23 01:36:50 qgng7PD2
２モジュール４コアの高クロック品が狙い目なのかな？
Pentium4はIPCが1ぐらいだったらしいけど、
IPC2あれば高クロックに振った方が速かったりしてな。
スケジューラ回路のリストラで電力下がるとして
4GHz台120Wなら・・・

310:Socket774
10/01/23 01:47:48 oDPcINH1
まず何よりも消費電力と熱を考慮し
ピークよりもアベレージ重視設計で
使うトランジスタを節約し
あとはクロックで稼ぐ・・・のかな

長年の懸案事項だったL1/L2に
ようやく手が入ったなら朗報か

311:Socket774
10/01/23 08:04:50 8xf6EvDV
>>307
>290-293でいつものように意味不明に騒いでるからその線だろ

312:Socket774
10/01/23 08:16:44 Cp2S/TpC
通常営業だな

313:Socket774
10/01/23 08:18:40 Efpfc30w
おそい！やすい！
ですね

314:Socket774
10/01/23 08:29:11 5Moz3plC
シングルスレッド速いとか妄想してた馬鹿がいたなあｗ
スループット重視の鯖石だと普通に考えればわかるよね

315:Socket774
10/01/23 08:31:40 Efpfc30w
いや、まだだ
6GHzでまわせば、あるいは・・

316:Socket774
10/01/23 09:01:57 vU3Fl957
Intelとの差はキャッシュ性能に殆ど依存しているからな、ここをどこまで改善しているかによるだろう。

317:Socket774
10/01/23 09:20:19 UFezY+DZ
お前にゃﾋﾟｰｷｰ過ぎて無理だぜ

318:Socket774
10/01/23 11:31:35 lJnqlLLO
ALU倍速駆動にしろ

319:Socket774
10/01/23 12:10:37 /bdibb4d
もっとポジティブに行こうや・・・

1つのデコーダーで、1サイクルごとにデコードするスレッドを
切り替えて実行するんだから、遅くなるのは仕方ないでないの。
やっぱ考え方としては、デュアルコアで4スレッドを実行するのと
ほぼ同等の性能をシングルコア(50%のリソース増)で実現できました。と
考えれば(トータルでは)そう悲観するほどの物でもない

320:Socket774
10/01/23 12:27:08 8xf6EvDV
誰か悲観してんの？

321:Socket774
10/01/23 12:33:02 dk0vk5nJ
整数演算のピーク値が欲しい俺が悲観してる。
FPUはスループット重視でいいけど、
ALUは低レイテンシ重視にしようや…

322:Socket774
10/01/23 12:47:20 bwXY1ERG
>>315
クロック上げれば帳尻は合うわな　
上げる事が出来ればな

323:Socket774
10/01/23 12:49:13 8xf6EvDV
ピークパワーだけ欲しくて総合スループットは低くていいなんてPen4かよ

324:Socket774
10/01/23 13:02:58 QcVFNMzm
実際のクロック次第だけど現段階だとターゲットをwebサーバに絞ってるのかなと思う。

325:Socket774
10/01/23 13:03:39 QcVFNMzm
webというか金融とかも含んだflopsがあまり関係ないサーバ。

326:Socket774
10/01/23 13:06:13 7hAU7jGj
どんなCPUになるのか想像つかん

327:Socket774
10/01/23 13:12:32 dk0vk5nJ
うむ。発想は分かりはするんだよな。
ピークを犠牲にしてスループット高めるのはwebサーバには向いてる。
でも、ピークを高めずにスループット重視してるばかりだと、
近い将来ARM系Micro Sliceサーバと衝突すんのよね…多分。
そして、x86だとこのコンセプトではほぼ確実にARMに勝てない。
64bit(アドレスは48bitだけど)の恩恵があるうちは有利に事を運べるだろうけどね。

328:Socket774
10/01/23 13:36:18 ogLZ5Sul
URLﾘﾝｸ(perspectives.mvdirona.com)

っSPARC T2

329:Socket774
10/01/23 13:37:08 Cp2S/TpC
そのARMが台頭してくるのは近い将来って何年後？

330:Socket774
10/01/23 13:39:35 8xf6EvDV
>>295の命令レイテンシでは
小数点はボロボロだけど
それ以外のは
packed insert
dynamic tls call
load8_16/32/64が下がったくらいで他は現状維持してる
（sqrt～は平方根のことなら小数点関係だし）
AMDはCPU内のFPUは捨てたがってるからこの辺は予定通り
んでFPUやL1Dのレイテンシなどが悪化した代わりがどこに出るか
その辺も楽しみだ（多分クロックだろうけど）

331:Socket774
10/01/23 13:45:28 uIBmASUi
URLﾘﾝｸ(www.ne.jp)
もし仮に無限に実行ユニットがあったと仮定した場合ですら、
依存関係により並列性は1.7程度にしかならない事が研究により分かっている。

という事らしいけど、どうですかね。
高IPC路線はK9で挫折したんじゃないのかな。
元々並列度の高いプログラムだったら、マルチスレッドにした方が速いんだろ。
逐次計算みたいなのはシングルでやるしかないけど、IPCは上がらないと。

332:Socket774
10/01/23 14:00:45 rCmfSd+3
最終的にGPUを統合するのであろうから、
FLOPSを低くしてくるのはAMD的に理にかなっているが、
これが本当ならばなんか引っかかるCPU構造だな。

今更クロック重視するとは思えないし、
何かしらの隠し球がまだあるのか？
あるいはまったく別のCPUってオチか？

333:えるえる
10/01/23 14:02:56 jW/y4Jct
スループット重視ってだけ。

334:えるえる
10/01/23 14:04:35 jW/y4Jct
BarcelonaとBulldozerを比較するのは、
US-IVとUS-T1を比較するようなものだ。
両者は目指しているものが異なる。
別に驚くような事実もないし、悩むことはない。

335:えるえる
10/01/23 14:11:28 jW/y4Jct
PCユーザ的には、Barcelonaが今後どう拡張されていかを中心にフォローしていくべきなんじゃね?
BulldozerはこんなAMD製品もある的なサブストーリーだ。

IntelはCore 2系をベースに少しずつ拡張していってうまくいってるだろ。
AMDはそれがK10系だってだけだ。

336:Socket774
10/01/23 14:12:12 8xf6EvDV
スループット＝処理能力　重視なのは当たり前だろう
IntelはPen4とかピーキー（全部がトレースキャッシュに載って分岐も無ければ！潜在能力は凄いんだ！とか）なのを平気で作ったりするが

337:Socket774
10/01/23 14:15:22 Efpfc30w
シングルが遅いんじゃ意味が無いんだよ
一般クライアントは

338:Socket774
10/01/23 14:22:22 ogLZ5Sul
>>332
GPU統合してからFPUを捨てるのが筋。
どうせソフトウェア側の対応はハードが現われてから10年かかる。

統合の目処すら立ってないという段階で統合前提にFLOPS捨てるバカはいない。

339:えるえる
10/01/23 14:22:58 jW/y4Jct
つ Liano
つか、Lianoがそういう方面はバックアップしているからな。
むしろLianoがあるということで、今後はK10系も拡張するプランもあるんだろと期待させられるわけで。
Bulldozerはジャンルが違うのではっきりいって注目株ではない。
アーキテクチャが新しいというだけで期待する時代はおわた。

340:えるえる
10/01/23 14:27:55 jW/y4Jct
LianoはAVXが間に合ってなさそうなのがIntelへの対抗馬としては痛いな。
Lianoの後継がどうなるかが今一番の注目どころです。
Bulldozerの方がこのスレのネタ的には盛り上がるんだろうけど、
Lianoも忘れないでね。

341:Socket774
10/01/23 14:30:53 rCmfSd+3
>>338
統合の目処…FUSION開発自体は"Llano"でようやく製品化だが、
開発自体は昔からやっているし、ノウハウは蓄積されているだろ。

でもFPUを減らすのは確かに「時期尚早」な感じはぬぐいきれないよね。

342:Socket774
10/01/23 14:34:11 VNfNmd+H
Llano後継はbulldozer+RV9xxなんじゃないの？

343:えるえる
10/01/23 14:38:48 jW/y4Jct
多分、Lianoの後継がBulldozerだと考えている人がBulldozerに注目していて、
Lianoの後継がK10系ベースだと考えている人がBulldozerに懐疑的なんだろうな。
今の時代、新しいアーキテクチャがでたからといって、全てを置き換えるかはわからんわけで、
ローエンドはローエンドでBobcatがカバー。AMD的には最初から分担路線が頭にはいってるのかもよ。

344:Socket774
10/01/23 14:42:28 Efpfc30w
LlanoのGPUはR800世代で演算に期待できるような代物じゃない

345:Socket774
10/01/23 14:45:46 VNfNmd+H
>>343
それだと開発リソースの少ないAMDは不利じゃね？>Bulldozer,Hound+,bobcat並列
「CPUパワーなんてもう十分だからHound+のクロックアップだけで十分。
クライアント向けはGPU強化に注力する」なんていうのもありかもしれないけど。

346:えるえる
10/01/23 14:47:53 jW/y4Jct
Llanoは色々あって遅れたFusion処女作でとりいえずの間に合わせ。
故にLlanoの後継が注目なんだ。AMDも上層部がよほど初期構想の頃ならいざ知らず、
PC市場でBulldozerでIntelと本気で闘い続けられるとは思ってないはずだ。
むしろその回答としてあとから用意されたのがLlanoなんじゃないかと。

347:Socket774
10/01/23 14:48:46 ogLZ5Sul
製品以前に、統合アーキティクチャ自体をAMDは未だ開発できていない。
妄想にトチ狂って大枚はたいてATi買っちゃった手前、ずっと統合するする言ってるだけで、
GPU統合でFPUの代替など夢のまた夢。

348:Socket774
10/01/23 14:51:22 KwK37v9/
>>343
さすがに後継は"Bulldozer"だと思っているだろ。
実際に"Bulldozer"のロードマップにもAPUって書いてあるし。

だけど>>344氏が言うとおりにR800世代なのが微妙。
"Llano"は今年出るべき商品だったんだよ。
そして統合するならば一新されるというR900世代だったんだよ。

349:えるえる
10/01/23 14:51:49 jW/y4Jct
まあ>>346は妄想としても、
Bulldozerが本気で普及することと考えても、ハイエンドPCから
徐々にローエンドへ拡大することになるから、その戦況でLlano系で闘うか、
Bulldozerを本気で後継にするのか判断することになると思うね。
今のロードマップはメインストリーム以下のマーケットにBulldozerはないから、
いきなりBulldozerに置き換えされることは少なくともないし、
出足見てからキャンセル出来ると思う。

350:えるえる
10/01/23 14:56:44 jW/y4Jct
>>348
サーバでの後継はBulldozerでいいんじゃないか?
だからBulldozerはK10の後継といっても嘘じゃないな。
APUはAMDの開発力に疑問はあるが、サーバ向けの拡張かもしれない。

351:Socket774
10/01/23 15:00:32 KwK37v9/
>>346
"Llano"はもともと「統合は限定的」ってなっているから、
去年消えた"Swift"改良版なのは確かだろうな。

>>350
>APUはAMDの開発力に疑問はあるが、サーバ向けの拡張かもしれない。

…えー。APUに否定的だと"Llano"自体も全否定にな（ｒｙ

352:MACオタ
10/01/23 15:02:20 F/R2HRG8
私は今回のOpen64の資料を見て、AMDはシングルスレッド性能向上策として
非常に高い動作クロックを実現すると見ますよ。
通常演算パイプラインにおいて、相当に高い動作クロックでもALUは一段の
パイプラインで済見ます。(以下はPOWER6の例)
URLﾘﾝｸ(pc.watch.impress.co.jp)
しかしその前段はパイプラインを深くする必要が出てきます。

Netburst に代表される高クロック路線は消費電力と発熱の壁に阻まれて退陣
する羽目になりましたが、現代では
　・動作中にダイナミックに動作周波数と電源電圧を制御する (DVFS)
　・必要な場合は定格以上の動作クロックで動作する
という手法で復活しつつあります。

ましてモジュール間で命令制御を共有するbulldozerの場合、シングルスレッドで
熱くなったら片側を休ませて隣のモジュールをアクティブにする『モジュール・
ホッピング』を考えているのかもしれません。
もちろん Intel が以前から語っている "core hopping" からアイデアを拝借して
いる訳ですが…
URLﾘﾝｸ(www.computerworld.jp)
　　-----------------
　　そのほか、過剰に発熱したコアの稼働を停止し、別のコアへシームレスに
　　動作を継続させるコア間でのホッピング機能や、メモリ・バスの高速化を
　　実現するチップの積層技術なども、Borkar氏によって紹介された。
　　-----------------

353:えるえる
10/01/23 15:03:33 jW/y4Jct
APUの意味わかってるのか?
アプリケーション特化アクセラレータを統合するんであって、
GPUとはかぎらんのだよ。サーバ向けなら最近のトレンドにのって
暗号化処理とか、HPC向けのアクセラレータかもしらん。
AMDの開発力に疑問はあるが、PC向けのLlanoと同じとは限らないと言うことだ。

354:えるえる
10/01/23 15:10:49 jW/y4Jct
FPUとキャッシュのレイテンシ値だけで
高クロックになるという単純なドレスデン予想は外れるであろう。

355:Socket774
10/01/23 15:12:10 tukdrqeT
>>352
POWER7で高クロック化諦めてまたIPC側に振ってきたがな

356:Socket774
10/01/23 15:22:17 Efpfc30w
APUって誰が使うの

357:MACオタ
10/01/23 15:23:43 F/R2HRG8
さてAMDの4Q, 2009の決算報告がらみで経営状態にかかわるニュースが出回っています。
特に新しくもないですが、書き留めておきます。
まず2009年通期の業績
URLﾘﾝｸ(phx.corporate-ir.net)
　- CPU部門: 売上 $4,131M ($4,559M @2008), 利益 $127M ( -$461M @2008)
　- GPU部門: 売上 $1.206M ($1,165M @2008), 利益 $50M ( $12M @2008)
ということで、やっとCPUの赤字販売状態から脱しました。
Intelから分捕った$1,242Mが無ければ実質赤字だったとは言え、研究開発 ($1,721M)等、
もう少しリストラすればなんとか生き残れそうです。

一方で、ATIC は完全に AMD からファブを買い取るというニュースも流れています。
URLﾘﾝｸ(www.eweek.com)
　　--------------------
　　Advanced Technology Investment Co. reportedly is looking to take full control
　　of Globalfoundries, the processor manufacturing venture created in 2009 with
　　chip maker Advanced Micro Devices.
　　--------------------
VIAの様に生き残るということになるのでしょうか？

358:Socket774
10/01/23 15:27:31 3G3DSWg6
にしても、とりあえずソフトウエア側で、アクセラレーションのAPI規格策定(DirectXや、OpenGLのような)をやって、
ハードが無くても、低速でも最低限動くようなソフトウェアレイヤーを作ってから
ハードウェアのアクセラレーターを付加していけばいいのにな。

そうじゃなきゃプログラマの大半つかわねぇって。いまだにMMXだって使わないソフトがやまほどある。
いちいちその機能が存在してるかどうかをチェックして、存在してるときと、ないときの両方の処理を書かないといけないからな。

またこれで、インテル・AMDがそれぞれバラバラなアクセラレータをCPUに統合して、
普及＆デファクトスタンダードが決まるまで、「CPUには乗ってるのに殆ど使われない」無駄な時代が、
ズーーーーっと続くわけでさぁ・・・

359:MACオタ＞355 さん
10/01/23 15:27:59 F/R2HRG8
>>355
POWER7にも Power Gating とターボモードは採用されているってご存知ですが？
URLﾘﾝｸ(www.power.org)
(p.10)
　　-----------------
　　・ -50% to +10% frequency slew independent per core
　　-----------------

360:Socket774
10/01/23 15:32:30 Efpfc30w
OCのオート化はNanoから、PLL2つ載せはC7から

361:Socket774
10/01/23 15:37:07 kFpghOm2
>>355
4GHzでブン回したら十分だろ。

つか去年
将来的にシュリンクした更なる高クロック版出せると言ってたじゃん。
（Blue Watersの性能更新用）

362:MACオタ＞360 さん
10/01/23 15:45:24 ebeYPP2S
>>360
　　--------------
　　PLL2つ載せはC7から
　　--------------
大昔にPowerPC G3に実装されていた技術かと。
URLﾘﾝｸ(spg.ict.ac.cn)
C7は2005年でしたっけ？
URLﾘﾝｸ(ascii.jp)

363:Socket774
10/01/23 15:45:28 7hAU7jGj
Bulldozerはリソース節約方向なのでリーク電流的には有利
だけど高クロックで回すならVthの小さいトランジスタを使うからその有利分も吹き飛んでお釣りが来る気が

364:Socket774
10/01/23 16:15:41 vU3Fl957
APU=ヘテロプロセッサ=CPU+GPGPU+α(色んなアクセラレータ)
APUの第一弾=Llano=K10+RV830?
第2段=Bulldozer+RV9xx
Bulldozerは整数演算の並列処理に特化したプロセッサー

この辺までは確定した路線だろう

それとBulldozerの設計思想や構造から、
シングルスレッド性能は控えめ、
FPU/SSE/AVXは対応しているだけのおまけ程度にしか考えられてないと思う。
特にAVXはベンチマークで勝つ気が全くない手抜き構成といえる。

RADEONの将来像というか目標はFPUの代替だろう。
そのためにどんな改良やアーキテクチャ変更があるのかは不明だが、
CPUみたいなL1/L2搭載、MIMD化あたりが妥当なところかな。

2011年のラインアップから考えて、AMDの中では、
CPUチームは整数演算特化のメニーコア開発　(Bulldozer系などの最新CPUコア)
GPUチームは最新DXへの最適化とスループット重視のGPGPUコア開発　(RADEONの最新GPUコア)
APUチームは前世代のCPU+GPGPUの統合コア開発　(LlanoなどのFusionコア)
APUをベースにした小型化によるモバイルコア開発 (BobcatやOntario)
に大別されて開発が進んでいるんじゃないかな。

365:Socket774
10/01/23 16:19:19 Efpfc30w
＞＞362
お、さんきゅう

366:Socket774
10/01/23 16:23:10 Efpfc30w
＞RADEONの将来像というか目標はFPUの代替だろう。

だから、どうやって使うんですか

367:Socket774
10/01/23 16:26:03 UsD5n5Cg
ゲーマーや一般はラデ
業務用はゲフォ

ラデがGPGPUに力入れてくれたら最高なんだがな

368:Socket774
10/01/23 16:51:03 3JiyCJfU
GPGPUに力を入れないようになったからRV7x0以降の人気なんでしょ

95%以上のユーザが使わないようなところに
ダイサイズと消費電力を大量につぎ込む必要はない

っていうか、GPGPUに力を入れた結果がR600時代の不人気だったわけだし

369:Socket774
10/01/23 17:00:35 MkvXrIgt
HD6xxxはどうするんだろ
R600の復活か？

370:Socket774
10/01/23 17:09:45 ogLZ5Sul
>>357
> 研究開発 ($1,721M)等、もう少しリストラすればなんとか生き残れそうです。
そこ削っちゃらめぇ

> 一方で、ATIC は完全に AMD からファブを買い取るというニュースも流れています。
製造をGFに縛られなくなるAMDに一方的に有利な話のような。
おかしいぞ?

371:Socket774
10/01/23 17:10:07 8xf6EvDV
PCIえ取り付け型のﾗﾃﾞの構成は描画特化からは変えんだろ
GPGP用と平行するリソースも無いならともかく

372:Socket774
10/01/23 17:23:54 VNfNmd+H
>>371
GPUとしての効率性を犠牲にしない範囲で、徐々に
改良を加えていくっていうのがAMDの方針じゃないの

373:Socket774
10/01/23 17:28:43 KwK37v9/
>>364
>特にAVXはベンチマークで勝つ気が全くない手抜き構成といえる。

手抜きというか。ほぼ設計完了していたであろう"Bulldozer"を
AVX採用のために一年延期して強引に搭載したわけだし、
手抜きというか。一年で頑張ったってほめてやれｗ

374:Socket774
10/01/23 17:30:24 WgnQ907e
>>370
ATICがGFを完全に買い取るのではないかという話はIntelとの和解直後にも出ていた。
GFに縛られなくなると言っても他にどこがAMDのCPUを作れるんだ、という感じではあるが。
どっちにせよ次からAMDの決算発表にはGFの分は含まれなくなるので普通に黒字化する可能性は高い。

375:Socket774
10/01/23 17:31:56 Efpfc30w
AVXで現実路線に変更
GPUでCPUのFPの肩代りなんてお花畑は取りやめ
GPUはただのGPU

376:Socket774
10/01/23 17:34:42 MkvXrIgt
>>375
夢の無いこと言うなよ
いつかはできるかもしれないだろ！

377:Socket774
10/01/23 17:38:48 8xf6EvDV
>>372
単純でスパンの短いGPUで
わざわざゆっくり改良する必要は無い

現在ﾗﾃﾞはVLIWでベクタに限らない超並列プロセッサになっているが
GPGPとして汎用性を持たせようとしてNVのようにするとダイ効率が凄く悪化する
これはNVの技術が悪いのではなく
CPUを持たないNVが1つのアーキでGPGPも描画も両方こなそうとした方針のせい

378:Socket774
10/01/23 17:52:37 Efpfc30w
AMD以外はVLIWじゃ無いけどね
IntelのGMA含めて

379:Socket774
10/01/23 18:05:33 MkvXrIgt
NVIDIAはなぁ、GPGPUに特化、ゲームに特化で二種類作れば良かったんじゃないかと思うんよ

380:Socket774
10/01/23 18:14:46 UUwRetTy
>>379
ｔｅｇｒａに賭けたんだろ

しょうがあんめえ

381:Socket774
10/01/23 18:38:55 8EVEFFZA
ゲーム特化でVLIWが有利って言うなら
GPGPUなんて関係のないIntelやS3がなぜVLIWじゃないのか不思議

382:Socket774
10/01/23 18:41:19 ogLZ5Sul
計算特化のチップはGPUのほかにもDSPなどいろいろあるが、
汎用品(CPU)に比べてボリュームが出ないので、製造プロセスや規模で不利を負う。
GPU需要のボリュームに相乗りするのは非常に重要で、GPGPUの強みの本質と言って良い。

383:Socket774
10/01/23 18:44:59 UsD5n5Cg
NVIDIAは法人特化
ATIはコンシューマ特化

でもAMDは元々法人鯖がメイン顧客だったからアレだな…

どちらにしろNVIDIAは
GPGPU促進させてCGプロダクションにGPU売り込むしかないだろ
大量に導入すると思うぜ

384:Socket774
10/01/23 18:54:33 8xf6EvDV
わけのわからんのが出てきたから言っとくが
別に俺も「VLIW方式は素晴らしい」とか言ってるわけじゃない
今のﾗﾃﾞは並列化のためのスケジューリングを自前でなくCPUに任せているため
その分スペースが省けサイズ面の効率が良い
しかしCPUはそんなことのために設計されたわけじゃないので
CPUにとっても全体で見ても効率は悪い
しかしGPUにとっては効率が良い
大事なことなので２回言いました

でもどうでもいいけどMIMDのIntelIGPでそんなことしたら馬鹿丸出しじゃないか？

385:Socket774
10/01/23 18:56:32 uTurV4UX
だとするとQuadroの品揃えがイマイチ
Fireもだけど

386:Socket774
10/01/23 18:57:19 BXRXj6ZG
　米AMDは1月21日、2009年第4四半期の業績が黒字転換したと発表した。13四半期ぶりの黒字となる。

　同四半期の売上高は16億4600万ドルと、前年同期から42％増加した。純利益は11億7800万ドル（1株当たり1.52ドル）。
前年同期は14億3600万ドルの赤字だった。主にIntelから受け取った独禁法訴訟の和解金12億5000万ドルが業績に
貢献したとしている。

　2009年通期では、売上高は54億300万ドルで、前年の58億800万ドルから減少した。利益面は改善しており、前年は
31億2900万ドルの赤字だったのに対し、3億400万ドルの純利益を計上している。

　2010年第1四半期の売上高は、季節的要因により、前四半期よりも減少する見通しだとしている。

URLﾘﾝｸ(www.itmedia.co.jp)

CPUの性能で負けてるからシェアとれないだけなのにﾀｶﾘするっておかしくないか？
さっさとi7以上の性能の物を出せばいいだろ

387:Socket774
10/01/23 18:57:28 uTurV4UX
誤爆しました('A`)

388:Socket774
10/01/23 19:08:25 8EVEFFZA
GPUにとって効率がいいのなら何でAMDだけがVLIWなの？

389:Socket774
10/01/23 19:29:37 8xf6EvDV
>>388
読解力と検索力を少しくらいは身に付けてもいいと思うんだが・・・
とりあえずこれだけ貼っとく
URLﾘﾝｸ(pc.watch.impress.co.jp)

390:Socket774
10/01/23 19:32:50 8EVEFFZA
だからなんで他社はvliwじゃないんだよ

391:Socket774
10/01/23 19:33:41 Efpfc30w
低効率だから

392:Socket774
10/01/23 19:42:32 MkvXrIgt
理由はわからんが実際ゲームでダイ面積あたりや消費電力あたりの性能の効率は良いと思うよ

393:Socket774
10/01/23 19:46:38 8xf6EvDV
NVの方式（命令を全てバラバラにする）と
AMD（ATi）の方式（命令を強引に一塊にする）が両立出来るとしたら
おそらくそれは「データ並列＝タスク並列」な串使いの世界の出来事じゃ

394:Socket774
10/01/23 19:50:30 UUwRetTy
>>386
ｉｎｔｅｌの代理店の工作員乙

日本におけるｉｎｔｅｌの代理店っていうとあそことあそこだなｗ

395:Socket774
10/01/23 19:54:35 8EVEFFZA
nvの場合、命令を全てバラバラになんてしてないんだが

それとvliwもよくて3/5程度の効率

396:Socket774
10/01/23 20:16:44 OtLuAMMy
3/5のソースは？

397:Socket774
10/01/23 20:20:48 8EVEFFZA
扱う頂点やらpixelの殆どが3要素だから
2次元に落とし込まれたらもっと下がるけど

398:Socket774
10/01/23 20:29:58 kDiCVdhG
>>375
やめてないよ。AVX + SSE5呼ばれていた物の双方を実装だから。
将来的にはその方向性に行くだろうね。

399:Socket774
10/01/23 20:33:02 OtLuAMMy
妄想なら妄想だって言ってくれればいいのに
URLﾘﾝｸ(www.cgo.org)

Bioshock: 2290 ps 4.222533
Call of Juarez: 594 ps 3.922494
Crysis: 284 ps 3.800968
LostPlanet: 83 ps 3.383631

ピーク性能比で80%前後、極端に低いロスプラでも68%の実効性能

400:Socket774
10/01/23 20:40:07 aRT81zWc
>>379
ビデオカードを汎用演算「にも」転用出来るのが売りなのに
特化した専用チップにしたらGPGPUの主旨から外れるだろうが

401:Socket774
10/01/23 20:45:18 8xf6EvDV
>>400
汎用＆特化（矛盾）なんだから
その辺は言葉のアヤだろ

402:Socket774
10/01/23 21:05:19 xIhN/ISY
やっぱVLIWは最高ヤネ

403:MACオタ＞402 さん
10/01/23 21:13:43 Mz/BEPLA
>>402
それを言うなら、もっとIntelも褒めなきゃ(笑)
Elbrus から Transmeta に至るまで、VLIW の主要特許は Intel の元に
集まっていますよ。
それにつけても Tukwila は…
2008年の Hot Chips のプレゼンは、今読むと涙無しにはいられません。
URLﾘﾝｸ(www.hotchips.org)

404:Socket774
10/01/23 21:35:29 Pr7wZsRj
Itanium見てるとアーキテクチャなんか小さな問題で結局は種銭次第なんだとわかる

405:Socket774
10/01/23 21:38:46 Cp2S/TpC
種銭じゃなくてゲイツソフトにシカトされたからだろ

406:Socket774
10/01/23 21:51:53 UFezY+DZ
それでも多少売れる方面がなかったわけでもないし
予定通りだせてればねえ

407:Socket774
10/01/23 21:55:19 GVKfM7u3
570mm^2てさ

すごく……大きいです………

408:Socket774
10/01/23 21:59:48 UFezY+DZ
24mm * 24mm　ぐらいか
すごいね

409:Socket774
10/01/23 22:01:36 Pr7wZsRj
何しろIntelにやる気があったのはMontecitoキャンセルしてChivanoでリネーム詐欺するまで
要するにMadison出した2003年が最後
今年でItanium詐欺も7年目でハードウェア板からすらスレが消えた

410:Socket774
10/01/23 22:15:52 CVKLqKhx
x86以外はマイケルソフトに取って価値が無い
x86-64の時も基本インストラクション共通にさせたし、違いがあるのは
FPUのごく一部のみ

他の高速CPUはLinuxかメーカ製のUnixぐらいしか使われない

411:Socket774
10/01/23 22:21:33 8xf6EvDV
マイケルソフトってｗ
ソフトの性能がムーンウォークでもすんのかｗ

412:Socket774
10/01/23 23:03:26 xxGAzTki
APUはローコストPC向けのSoCでしょ。i3とかi5と同じ路線だよ。

413:Socket774
10/01/24 03:32:30 TS6SjhjY
今はそう見えるかも知れんが将来はそうではないのです

414:Socket774
10/01/24 04:23:58 q+1dJYCR
将来というか、過去にはローコスト向けでないこともあった。

URLﾘﾝｸ(www.amd.com)
> AMD plans to create a new class of x86 processor that integrates the
> central processing unit (CPU) and graphics processing unit (GPU) at
> the silicon level with a broad set of design initiatives collectively
> codenamed “Fusion.”

> Fusion processors are expected in late 2008/early 2009, and the
> company expects to use them within all of the company’s priority
> computing categories, including laptops, desktops, workstations
> and servers

415:Socket774
10/01/24 06:20:38 t377Rn3L
統合するなら800SP 1.2TflopsのGPUより
32SP 35.2gflopsのGPUの方がつかいでがありそうだ

Radeon HD4870 VS Chrome540GTX Shader performance
URLﾘﾝｸ(www.youtube.com)

416:Socket774
10/01/24 08:08:55 DnyHurpG
Chromeでゲームはできないよ

417:Socket774
10/01/24 09:13:24 MXMnx2SZ
そりゃ、省電力で細いバスでも落ち込まない方がいいでしょ

418:Socket774
10/01/24 10:13:43 cDRBFVMW
>>414
昔も今も変わっていないだろ。ローコスト版が先行しただけで。

419:Socket774
10/01/25 07:23:23 Xlar/xuY
今のｘ86CPUっぽくなってきたNVのGPUに
GPUの手法（複数スレッドでレイテンシ隠蔽）を取り入れたかもしれないBull
何だか混沌としてきました

420:Socket774
10/01/25 12:50:48 E8tFlFaS
BulldozerはSMTという話もでてきてないと思うが、なにでレイテンシ隠蔽するつもり?

421:Socket774
10/01/25 13:11:43 Xlar/xuY
「HTでメモリレイテンシ隠蔽」なんてのは1コアで複数スレッドを担当しなきゃならなかった頃の話で
今の「多コアあるけど1スレッド性能はどうなん？」には無関係
URLﾘﾝｸ(pc.watch.impress.co.jp)

GPUとスレッドの関係はよくは知らないけど
並列ばかりの処理ということでガンガンにスレッドを分けて実行しているという
URLﾘﾝｸ(pc.watch.impress.co.jp)
Bullも1スレッドをさらに分ける逆HTを付けるのかも知れないということ
ただし整数の並列度を考えると大して効果無いだろうけどね・・・

422:Socket774
10/01/25 13:37:34 /cbtGFs2
GPUは元々スレッドが多数あるからってだけで、CPUとは状況が違う。
逆HTって特許見ても、条件分岐命令のときに2ユニット使える例を載せてるだけで、
しかも1スレッド2スレッドに分解するという話じゃないし。

423:Socket774
10/01/25 14:18:52 XxdXHRhO
>>421
？
投機実行は「多コア有るけど1スレッド性能はどうなん？」に関係あるだろう。ていうかモロにそれじゃね。

複数のコアがあっても、どうしても多スレッドに分散処理できないシングルスレッド処理では
他のコアのパワーを使っての高速化ができないのが現時点のCPU。

しかし投機実行は、ある一スレッドが実行中の処理が読むであろうメモリを
他のスレッドに読ませて先にキャッシュさせてしまうことでメモリレイテンシを隠蔽する技術。
原理的にはHyper-Threading限定のテクじゃないから、普通のマルチコアでも使える。

ただ原理上、メモリ帯域を非常に浪費するので、インテルもRDRAM発展型の高速メモリが
実用化する「なら」やるつもりだった技術であって、それがポシャッタ現在ではもう
無かったことになってるけどな。

424:Socket774
10/01/25 14:48:26 Xlar/xuY
>>423
＞今の「多コアあるけど1スレッド性能はどうなん？」には無関係
はHTについての話

425:Socket774
10/01/25 17:06:21 XxdXHRhO
>>424
話をループさせんなよ。
そのHyper-Threadingでメモリレイテンシの隠蔽って言うのが、
投機実行なんだってば。

別にHyper-Threading限定の技術でもないので、
「1コアで複数スレッドを担当しなきゃならなかった頃」 "だけ"の技術と
いうわけでもない、とゆうてるだけ。

その気になりゃBulldozerにだって有効だが
上で述べたようにメモリ帯域の話が絡んでくるので
現在のメモリ状況では可能性が小さいとうだけだ。

426:Socket774
10/01/25 17:32:10 kt559r2q
色々こんがらがってる

427:Socket774
10/01/25 17:41:49 Xlar/xuY
HT+投機もまだのはずなのに
HTにすでに投機実行の機能が組み込まれてることになっているという・・・

428:Socket774
10/01/25 18:07:58 Xlar/xuY
あ、逆かな？
>423,425の書き方だと
「投機実行の技術・機能の中にHTが含まれる」のほうか

429:Socket774
10/01/25 18:10:37 IjMENfe7
ちょっとブルドーザーで整地したほうがいいな

430:Socket774
10/01/25 18:12:24 kt559r2q
整地をEXEcuteしたらRockが頭を出してきた

431:Socket774
10/01/25 20:52:56 XxdXHRhO
>>427
いやいやいや、そんなことひとかけらも言ってまへんがな。

「投機実行はHT限定の技術じゃない」、って何度も書いてるだろ？俺。
つまり「HTとは関係なく使える技術」だって言うことだよな、普通に読んだら。

でも、君の「Hyper-Threadingのなかに投機実行」だとか、
「投機実行の中にHT」　だと、まるっきり正反対の意味だよな？
HTからとにかく離れろ。

あ、あと>>420とは別人だぞ、俺。そいつが言いたかったこととは繋がってないぞ
簡単なツッコミいれただけなんだがな。

432:Socket774
10/01/25 21:21:13 Xlar/xuY
「HTとは関係なく使える技術」だが
＞Hyper-Threadingでメモリレイテンシの隠蔽って言うのが、
＞投機実行

普通に読むともうわけわかりません

どうせ現実世界のことじゃないからどうでもいいけど

433:Socket774
10/01/25 21:22:41 kt559r2q
GPU的なマルチスレッディングによるレイテンシ隠蔽と
Speculative Multithreadingによるレイテンシ隠蔽を混同してるのでは

前者はデータのロード中に他のスレッド実行しときましょうって技術
実行されてるスレッドからすればレイテンシは隠蔽されていると言える
が、ユーザーから見れば1スレッドあたりの処理時間は短くなってない

後者は投機スレッドを走らせてメインスレッドが必要とするデータを
予め揃えておこうという技術
うまく填れば1スレッドあたりの処理時間は短くなる

今のHyper-threadingの効果は前者のみ
URLﾘﾝｸ(www.watch.impress.co.jp)

434:Socket774
10/01/25 22:19:39 XxdXHRhO
>>432
うーむ・・普通に読んでいて投機実行が解ってるなら、むしろ、わからない方が意味不明なんだが。
そんなややっこしい事言ってるかなぁ？意思の疎通ってむずかしいぜ。
そっちが何がわからないのかわからない。俺もどうでもいいんだがw

もしかして、「現在の」HTに限定して考えてるのか。HTでも投機実行が可能なのは知ってるだろ？（今のHT、じゃないぞ）

原理的にはHTでないマルチコアでも投機実行の効果は得られるって「だけ」の話。「これだけ」の話。HTは除外しろ。

>>433
そう、そういうこと。後者の話。前者は、投機実行と関係なくマルチスレッドなら得られる効用だが。

435:Socket774
10/01/25 22:29:49 Xlar/xuY
「HTはシングルスレッド性能に無関係。特に多コアな今では」に
「関係あるだろ投機実行なんだから」と噛み付いて
その後グチャグチャなID:XxdXHRhOの主張を誰かまとめてくれないか

436:Socket774
10/01/25 22:38:01 XxdXHRhO
簡単なツッコミなのにぐちゃぐちゃどんどん勝手に脱線してるのお前だろーが！w

わからないと言うから、何が解らないんだ?と聞いたら、また斜め上行くレスが返ってくるし。。
外野の433が簡単に理解してるのに。

いくらなんでもID:Xlar/xuYちょっと頭悪すぎる。

437:Socket774
10/01/25 22:49:07 RcYSifM8
多分、ID:Xlar/xuYは物理的にマルチコアになっているから、
並列化の程度が低いアプリが多数な現状では、
今実装されているHTTでのメモリレイテンシの隠蔽の効果は小さいよねって言ってるだけなのでは？
で、多分>>421で後藤記事のURL貼って言いたかったのは、
「Hyper-Threadingでメモリレイテンシを隠蔽」の項目だけなんじゃないの？

それが、その下に投機マルチスレッディングについての解説もあったから、
ID:XxdXHRhOが勘違いして投機実行に話こじらせたんじゃないの？

438:Socket774
10/01/25 23:03:51 Xlar/xuY
>>437
ていうか>424でちゃんと言ってるしねえ・・・
>421でも投機の文字は出さずHTと書いてるし間違えようがないような

「出したソースに蛇足があった」とかそんな単純な原因ではないかと

439:Socket774
10/01/25 23:24:45 XxdXHRhO
ていうか、お互いどうでもいいことなんだから、もういいんじゃね。。
キレて頭悪いとか言ったのは済まなかったが。

440:Socket774
10/01/26 00:59:05 KJhBQd0R
SMTの目的はメモリレイテンシの隠蔽と偉い人が公言してるから
>「HTでメモリレイテンシ隠蔽」なんてのは1コアで複数スレッドを担当しなきゃならなかった頃の話
とか言うのがそもそも脳内
アーキテクトだったら謝るよｗ

441:Socket774
10/01/26 01:28:23 zefH5VMs
Xlar/xuYもXxdXHRhOも間違った思い込みで書いてるから
議論の見当ハズレっぷりが凄まじいな。

こういうキチガイ展開が見られるのがAMDスレの醍醐味。

442:Socket774
10/01/26 01:55:16 lx9jgWOa
で、馬鹿な私に教えてください。
Bulldozerってやつは相当スゴイんですか？
今のPhenomとかの3倍とか速くなったりするんですか？

443:Socket774
10/01/26 02:23:44 zefH5VMs
今公開されている情報ではまだ何もわからない。
シングルスレッド処理が速くなる要素はほとんどない(明らかにされていない)。
コア数が増えて、マルチスレッドアプリケーションは速くなるかもしれない。

444:Socket774
10/01/26 02:35:50 FJ6eTqx4
メモリレイテンシの隠蔽は単なるマルチスレッドのことで
HTに限った話ではない。
HTが目指したところは1コアのリソースで2コアに見せる
ことで少ない投資で多くのメリットを見込んだことと、実行
中のCPUリソースの空きを減らして実行効率を高めること。
リアルデュアルコア比で1.2～1.5倍の性能しかでなかった
から、デュアルコアが一般化して消えたと思ったら復活。

445:Socket774
10/01/26 06:03:38 43Eg5jmS
>>441

そうそう。
ID:zefH5VMのような、根拠なく自分だけは正しいと思い込んでる
自尊心が肥大したバカが多いのが特徴。

マクオタとか雑音とかもそうだなw

446:Socket774
10/01/26 07:31:02 lAz+XAnz
こうして自作板ではゲハ厨が無益な争いを続けていた

447:Socket774
10/01/26 07:45:43 FUSFZyCf
　　　　　　　　　　　 .　-―-　.　　　　　　やったッ！！　さすが>>440！
　　　　　　　　　／　　　　　　ヽ
　　　　　　　　　　//　　　　　　　　 ',　　　　　　偉い人の公言を
　　　　　　　　 | { ＿＿＿＿＿　|　　　　　　　　一言しか覚えられないッ！
　　　　　　 (⌒ヽ7´　　　　　　　｀`ヒﾆ¨ヽ
　　　　　　　ヽ､..二二二二二二二. -r‐''′　　　　　そこにシビれる！
　　　　　　　　/´ 〉'"＞､､,,.ィ二¨'　{.　ヽ　　　＿　＿　　　　　　あこがれるｩ！
　　　　　　　 `r､|　ﾞ._(9,)Ｙ´_(9_l′ )　（　 , -'′　｀¨¨´￣｀ヽ、
　　　　　　　　 {（,|　`'''７､,. ､ ⌒　　|/ﾆＹ　{　　　　　　　　＼
　　　　　　　ヾ|　　　^'^ ′-､　,ﾉr')リ　 ,ゝ､ｰ｀―-'- ∠,_　ﾉ
　　　　　　　　　 | 　｢匸匸匚|　'"|ィ'（　（,ﾉ,r'ﾞへ.￣￣,二ﾆ､ﾞ}了
　　　　, ヘｰ‐- ､ l 　｜ /＾''⌒|　　| |　,ゝ )､,>（_9,`!i!}i!ｨ_9,）　|人
　 -‐ノ .ヘー‐-ｨヽ　!‐}_＿,..ﾉ　｜| /-‐ヽ| 　 -イ,__,.>‐　　ﾊ　}
　''"/／ヽｰ､　ﾉヽ∧　`ｰ一'´　／　|′　丿!　　, -===- ､　　}くｰ- ..._
　 /／＾＼　ヾ-､ :| ﾊ　￣　／　ﾉ　|.　　{ {ﾊ. 　Ｖ'二'二ソ　ﾉ| |　　　｀ヽ
,ノ　ヽ,_　ヽノヽ_)ﾉ:l　'ｰｰ＜.　　/ 　|.　　ヽヽヽ._ ｀二¨´　／ノﾉ
/　　 <＾_,.ｲ `r‐'ﾞ :::ヽ　＼　｀丶､　|、　　＼＼'ｰ--‐''"／／
＼＿＿_,／|　 !　　::::::l、　　＼　　＼| ＼　　　＼ヽ　　/ ノ

448:Socket774
10/01/26 10:58:01 lGDJaw7L
>>444
メモリレイテンシの隠蔽については、out-of-orderの実装で
既に実用化されている。
out-of-order機構を見直すと、HT実装のコストがそれほど高くないので
擬似Dual-CPUとしてＨＴを実装した。
ただ、ＨＴ実装の擬似Dual-CPUは本当のDual-CPUに性能が及ばなく、
シングルスレッド性能にも悪影響が及ぶことが分かり…

なんてことだと思う。

＊HTで実装した擬似Dual-CPUは、本当のDual-CPUよりも数十%性能が落ちることもある

449:Socket774
10/01/26 10:58:23 7OfkrXnA
投機実行って、条件分岐などがある時に、結果がどっちに行くかわからないけど
パイプラインを遊ばせておくのはもったいないので確率の高い方の分岐をとりあえずパイプラインに流すことなのだが・・・
なぜマルチスレッドのキャッシュ読み込みとかの話になってんだ？

450:Socket774
10/01/26 11:02:39 lGDJaw7L
>>449
そっちの方は聞いたことが無いけど、実用化されているの？
条件分岐でなくて、演算とメモリ処理の演算過程の依存関係について
レジスタを多めにした上でパラに実行って事だと思ったが

451:Socket774
10/01/26 11:06:29 Mg+G8SkH
PentiunProのウリは分岐予測と投機実行ですが、なにか？

452:Socket774
10/01/26 11:54:56 wp/u0OoH
>実用化されているの？
とっくの昔に

453:Socket774
10/01/26 11:58:34 UPZa8hNx
投機的マルチスレッディングはまだどこも実装していないよ。
分岐予測の投機実行とは別物だし。

454:Socket774
10/01/26 12:06:37 lGDJaw7L
一部読み間違えしてたので修正

分岐予測：実装済み
投機的マルチスレッディング（分岐の双方に対し実行内容をパイプに入れる）
　　　　　　：実装実績なし
投機的実行：　分岐予測で取り出した命令の流れに対し、先行実行できる箇所を抽出して
　　　　　　　　　パラに処理する（データロードも含む）

というのが私の知識内容。
間違いがあるかもしれないが。

455:Socket774
10/01/26 12:32:19 UPZa8hNx
>>454
投機的マルチスレッディングでシングルスレッドのメモリレイテンシの隠蔽というのは、
URLﾘﾝｸ(pc.watch.impress.co.jp)
で解説されている、ヘルパースレッドで値予測して、メインスレッドにデータロード待ちさせないって話。

456:Socket774
10/01/26 12:54:01 lGDJaw7L
>>455
性能が向上するのは簡単に予測が尽くし、記事も知っている。
ただ、まだ実装されてなかったと思うんだよね。
＊メモリレイテンシというよりは、やり直しサイクルを短く出来るってことと思う

実装されれば、大々的に広告する気がするし。
＊　COREについては…マイクロフュージョンの効果が高い気がする。
　まだ、実装はされてない…と思う

457:Socket774
10/01/26 12:59:10 UPZa8hNx
>>455
だから、投機的マルチスレッディングは実装されてないよ。
上で投機実行がどうの言い出した人間は現在実装されていない技術の話をしてるんだし。

458:Socket774
10/01/26 13:00:49 UPZa8hNx
アンカー間違えた。>>455じゃなくて、>>456。

459:Socket774
10/01/26 13:01:56 FUSFZyCf
分岐のためではなくメモリアクセスのための先読みだろ

460:Socket774
10/01/26 13:03:28 qOQK+pME
テープアウトまでした Rock が事実上失敗しているからねぇ。

461:Socket774
10/01/26 14:06:16 Q7c9DJpa
投機実行君はさんざん他人を罵倒していたのだから、
投機実行という言葉を間違って使っていましたと謝罪するのが先じゃないかな。

462:Socket774
10/01/26 15:25:36 nyFU8phE
データの先読みに効果がある技術
　プリフェッチ
　Out-of-Order
　Memory Disambiguation(Out-of-Order Load) - 投機的
　Speculative Multithreading - 投機的

463:Socket774
10/01/26 18:18:07 43Eg5jmS
謝罪なんて自分から要求するものじゃないんだよ。事故とか犯罪で相手が一方的に加害者ならともかく。

464:Socket774
10/01/26 18:28:55 FUSFZyCf
まあまあ
ここはひとつ俺に免じて
「投機実行＝Hyper-Threadingでメモリレイテンシの隠蔽」
を認めてやってくれようじゃないか

465:Socket774
10/01/26 18:47:28 43Eg5jmS
ざっと見た感じ、まともな事言ってそうなのはID:lGDJaw7Lくらいだな。
あとはやたら、周りを分かってない奴呼ばわりしてる、分かってない奴ばっかだ。

ｵﾚﾓﾅー

466:Socket774
10/01/26 19:25:30 6HcjqORx
スレッドっていうのがどうもね。
OSレベルの話になっちゃうし。
補助スレッドを同じコアで同時に動くようにスケジューリングするようOSに改修が必要なんだろ。
プリフェッチ命令を適宜挟んでメモリコントローラが裏でキャッシュにため込むのとどれだけ効率に差が出るか。
補助スレッドを生成するコストとプリフェッチ命令を発行するコストを比較すると圧倒的にプリフェッチ命令の方がいいわな。

467:Socket774
10/01/26 19:35:14 6HcjqORx
>>454
投機実行の意味が間違い。
それじゃ単なるout of order実行だろ。
正しい分岐じゃない可能性もあるけど実行させてしまうのが「投機」実行。

468:Socket774
10/01/26 19:52:23 43Eg5jmS
概念的に似てる物が多いよな。あとプリフェッチとかもどう違うのか解説ｷﾎﾞﾝ。
ほんと複雑な処理してるわCPU。

469:Socket774
10/01/26 20:01:38 lGDJaw7L
微妙な違いを区別して細分化しているだけだろ。
分岐命令の先のデータロードも含めて実行している（本当に必要か分からない）ってのが
投機的実行。
そもそも、投機的実行自身、分岐予測ある無しに関わらず、分岐命令の先について
一旦パイプラインに突っ込んでおくことだと思うんだよね。
（分岐予測：静的だろうが、動的だろうが：が外れればパイプラインに入れた中身を廃棄）

out-of-orderは分岐命令を含まない所なんかで、データの順序依存性を見て先に処理できる所は
処理してしまう方式。

複合ケースになるとめんどいなあ。　色々、細分化して名前付けてるかもしれないけど

470:Socket774
10/01/26 20:02:21 XrWKhmAz
BulldozerはPower6とNiagaraを足して二で割った感じか

471:Socket774
10/01/26 20:11:58 OErgc3fr
>>469
実行可能なところをピックアップして、と言う言葉から根本的に投機実行の意味を理解していないと判断した。

次ページ