CPUアーキテクチャについて語れ 20

CPUアーキテクチャについて語れ 20at JISAKU

CPUアーキテクチャについて語れ 20 - 暇つぶし2ch102:Socket774
11/11/05 16:56:21.98 hN4Jy1Vp
インテルが1万人レイオフを行ったときは
Core2で挽回し始めていて、その裏でNehalemアーキ開発も進んでいた

今のAMDは……

103:Socket774
11/11/05 17:17:33.74 gqLPNyoW
空っぽだな

104:Socket774
11/11/05 19:41:18.38 xAARp2gD
10%って何人なんだろうね

105:Socket774
11/11/05 20:35:14.97 Wjwrq41X
10年度の時点で16000人か。ということは1600人。
何か撤退する分野があってそこを切るのか？

106:Socket774
11/11/05 20:42:56.94 xAARp2gD
centaurが16社できるぞ

107:Socket774
11/11/05 21:21:53.72 3hTz23j3
AMDの製品ラインの中で、現在から将来に渡ってダメなのは
どうみてもBulldozerなんだが、
ここ手放すと終焉が見える。

108:Socket774
11/11/05 22:07:51.09 TcWmJEa8
>>102
Intelのリストラが話として出てきたのは2004年じゃないか？ちょっと記憶が怪しいが。C2Dの前なのは確か。
ただしエンジニア(R&D)は減らさず逆に増強されたはず。
あの頃はOpteronにやられてたから価格競争に耐えられるような組織作りを迫られてたんだよな。
リストラの実施とPentiumDの価格改定が重なった2006年の第2四半期は大きく業績を落とした。
ただリーマンショックの時には既に組織改革が粗方終わってたので上手く乗り切れたね。

109:Socket774
11/11/05 23:15:05.74 O0U6bSI1
URLﾘﾝｸ(www.computerworld.jp)

110:Socket774
11/11/06 00:06:26.80 Nt3idcCl
ごめん、2004年は大嘘。
Intelが2006年の第1四半期に前年同期比で4割ほど減益だったのが始まりっぽい。
URLﾘﾝｸ(www.intel.co.jp)

決算の発表から一週間後に投資家へリストラによる経営体質の改善を約束。
URLﾘﾝｸ(news.cnet.com)
>The comprehensive project, which will look at ways to cut costs per unit and improve employee productivity, will take place over the next 90 days, he said.
(略)
>In an effort to overcome its loss of market share amid a slower-growing overall market, Intel plans to launch its largest product refresh in years.
>
>"New products based on the Core microarchitecture for power and performance will be launched this summer and refresh the Intel product line in all segments," Otellini said.
>
>Three new chips, one for each of the Core market segments, will be part of the rollout: Woodcrest for servers in June, Conroe for desktops in July, and Merom for notebooks in August.

文脈的にはCMAを採用した製品を6～8月に前倒しで投入するというのもリストラクチャリングの一環。

6月にはMarvellへXScaleを売却。
URLﾘﾝｸ(news.cnet.com)

2006年第2四半期の、前四半期より更に低調な決算を発表した翌日(7/20)には役員人事。
URLﾘﾝｸ(pc.watch.impress.co.jp)

111:Socket774
11/11/06 00:49:17.48 UAQkgGYY
世の中には最高益出したと同時に開発者を大量リストラしたスクエニって企業もあるのよ。

112:Socket774
11/11/06 01:09:50.77 CcEL+lwI
あそこは開発を自社で抱えたくないんでしょ

113:Socket774
11/11/06 01:24:19.83 H60KplLz
結局どこに事業ドメインをおくかでしょ。

AMDは半導体を外に出しちゃったしATIも一定の成果あげちゃったし
営業にいたってはIntelのパワーゲームに勝てるわけないし

理論設計だけでやってけるか謎だけど、Intel一社になったらx86はマイナー転落だろうな。

114:Socket774
11/11/06 01:32:51.18 ecJIB34Q
スクエニは確かクビ切ったのと同時に新入社員も大量に入れてるな
社長がイエスマン欲しいのか、若手7割にしたら問題解決とか言ってたし

AMDは厳しそうだな・・・ATI買収しといて良かったね
ってくらいか
単体ならまず死んでる

115:Socket774
11/11/06 01:39:55.74 gZZxRbNS
>>114
スクエニは組織を新しくしたいのか。
毛色の違う会社になるのかも。

116:Socket774
11/11/06 03:25:15.07 In7LY003
コンピュータの高性能化が終わったら科学技術の進歩はどうなるんだ？

117:Socket774
11/11/06 05:15:28.01 7JHbn030
AMDが終わっても、アーキテクチャ間の競争は終わらない。

118:Socket774
11/11/06 10:20:21.92 UeaW747B
AMDの存在はコンピュータの歴史全体から見ると
あってもなくてもたいしてかわらん程度の影響度でしかない。
ARMの方がはるかにでかいよね。

119:Socket774
11/11/06 10:46:42.31 uUPBubTs
>>118
結局はx86互換メーカーの1つでしかないから、AMD
ところで、未だに？オクでSUNのSparc機が出たりしてるが、買った人いる？
俺は、Blade150買ったけど、、たいして役にたってない。

120:Socket774
11/11/06 10:53:48.88 uUPBubTs
SpecCPU2000辺りだとUltaraSparc3の1.2GhzがPen4-2Ghzぐらいの性能だけど
実際のアプリでの性能差だとどうなんだろ？

121:Socket774
11/11/06 11:01:11.44 H60KplLz
コンピュータの歴史全体という視点からなら、AMDがないとIntelは成り立たなかった。

Intelは単なる半導体メモリの製造技術しかなく、一方AMDはCPU周辺回路設計技術があり、
AMDからの技術供与でIntelCPUが成り立った。　ともにフェアチャイルドからの独立組みな。

122:Socket774
11/11/06 11:14:18.53 uUPBubTs
SUNのSparcが登場したころは、x86は行き詰まり死滅するはずだったが、、
現に、性能では386/486より上で俺は「いつかはSUNやHPのUNIX機を買うぞ」
と思い、十数年、、いざ買ってみると「なんだ、この程度か。」と拍子抜け。
何か普通のPCとは違う世界を味わえるかと思ったが的ハズレだった。

123:Socket774
11/11/06 11:49:04.48 gZZxRbNS
うお、フェアチャイルドがもとだったのか！？
これは目から鱗。

124:Socket774
11/11/06 12:22:51.16 jXisSrix
486/Pentium時代は、IntelはRISC勢にぼろ負けしてた
ただしその後、Intelはチップ内部にRISC的な設計思想をかなり取り入れ、
従来のCISCの命令セットの互換を保ったままCPU内部をRISCとCISCのいいとこどりみたいなのに進化させて、
RISCの利点がなくなったけどな

125:Socket774
11/11/06 12:38:25.88 TNhtuW9t
>122
90年代ならAlphaあたりはx86と格の違いを見せ付けてたんだけどな

日本語で一番詳しいのはando さんのところか。他のサイトはもっと頑張らないと
　AMCCのARMv8プロセサX-Gene
　Calxedaのサーバ用4コアARM Cortex-A9チップ
　URLﾘﾝｸ(www.geocities.jp)

どちらもモバイルとはインターフェイスのリッチさが違うしECC使えたりで
なんちゃってサバ仕様ではなく本気だなって印象

126:Socket774
11/11/06 12:42:14.89 gZZxRbNS
Andoさんは別格。

127:Socket774
11/11/06 13:03:49.84 NSXl9wKe
andoさんは確か富士通のSPARCアーキテクトで、仕事やめてからも、
大学で非常勤かなんかで講師やってるんじゃなかったっけ？

128:Socket774
11/11/06 13:23:17.37 gZZxRbNS
SPARCに絡んでたのは聞いてたが、アーキテクトだったのか。
すげぇｗ

129:Socket774
11/11/06 16:17:20.23 UeaW747B
>>121
なんでこういうデタラメを平気で書く人がAMD周辺からはあとを絶たないんだろうか。
Intelは自社のメモリを拡販するためにプロセッサを作ったのが事の始まり。
AMDはプロセッサは後発参入なんだが。

130:Socket774
11/11/06 16:21:57.35 JxM2qe8P
intelのセカンドソ－スでは

131:Socket774
11/11/06 17:05:41.70 u/JJbn9o
>>125
一つ上の記事が気になった。MIPS系だろうか。

132:Socket774
11/11/06 17:42:20.30 L8kSdmbW
>>129
だよな。AMDはx86の生産委託を受けたって企業ってイメージしか無いわ。

133:Socket774
11/11/06 17:47:12.12 gZZxRbNS
元DECのエンジニアが多いんだったっけ？

134:Socket774
11/11/06 17:58:04.43 u/JJbn9o
>>133
とりあえず今話題にしているAMDプロセッサの黎明期って意味では
DECのエンジニアは関係ない。AM2900の顧客がDECだったとかは関係あるかもしれないが。

135:Socket774
11/11/06 17:59:46.43 gZZxRbNS
ダーク・メイヤーが元DECだったのが印象深くてね。
黎明期はまだDEC色はなかったんだね。

136:Socket774
11/11/06 18:02:07.67 H60KplLz
>>129
なんでこういう無知を平気書く人がIntel周辺からは後を絶たないんだろうか。
「プロセッサ」「CPU」ってぇのを半導体で集積回路を起こした「マイクロプロセッサ」だけしか知らないからだろうなｗ

Intelがプロセッサを作ったのは日本のビジコン社から電卓用チップの製造委託を受けたのが事の始まり。
結局Intelだけでは設計できず、ビジコンから嶋さんが設計に入ってようやく完成したのがi4004。
電卓用ではなく汎用にしたらいいんじゃね？的な発想はIntel側から出たが、結局理論設計やったのは嶋さん。

i4004で味をしめたIntelはその後i8008開発したけど失敗、さらにi8080開発しようとしてテンでだめだったから
結局嶋さんをヘッドハントしてようやく完成にこぎつけた。

そもそもIntelが世界で始めて開発したのは「マイクロ」コンピュータであって、おもちゃに毛が生えたものでしかない。
当時は汎用機のCPUが中心で、コアメモリや磁気メモリ中心だったところに半導体メモリに目をつけたのがIntel。
一方のAMDは汎用機のCPUの周辺回路をマイクロチップ化することで事業をスタートした。

AMDは周辺回路のほかに不揮発性メモリの技術もあって、Intelはこれらの技術もライセンス供与を受けている。

137:Socket774
11/11/06 18:05:14.84 gZZxRbNS
>>136
日本人すげーｗ

138:Socket774
11/11/06 18:12:26.70 gZZxRbNS
嶋正利
URLﾘﾝｸ(ja.wikipedia.org)

こんなすごい人がいたなんて知らなかった！
CPUなんてものは最初から欧米の人間が設計の中心だと思ってた。

＞嶋は「欧米の人たちと比べても、自分が劣るなどと決して思ったことはありません。
＞機会さえあれば日本人も創造的開発はできます」[7]と述べている。

勇気付けられるね。

139:Socket774
11/11/06 18:16:40.94 7JHbn030
×日本人がすごい
○嶋さんがすごい

あと池田敏雄とか
エンジニアリングに国境はない

140:Socket774
11/11/06 18:38:05.20 H60KplLz
いやいやいや、日本人も結構スゴイんですよ？

半導体も真空管もリレーも使わずにフェライトコアだけで論理回路を構成するパラメトロンとか日本人の発明ですぜ。
パラメトロン計算機とか上野の博物館で隅に追いやられて忘れ去られてるけど…。

141:Socket774
11/11/06 18:54:34.80 UeaW747B
>>136
このスレならそれくらい常識。
ネットで検索して多少はまともなレスができたようだが、
Intel的にはビジコンの件もDRAMを売りたいからむしろマイクロプロセッサがメモリの周辺ICの感覚だったのよ。
で、AMDがなければIntelがなかったという論拠はなんなんだろうか?
セカンドソースって米国と日本のメーカーを含めて何社もあった中のAMDは一つにしかすぎんのだが。

142:Socket774
11/11/06 18:58:30.49 UeaW747B
ちなみにIntelの創業者のノイスは世界初の集積回路の発明者で、
マイクロプロセッサ、SRAM、DRAMの発明はTIと並んでIntelが最初。
4004は嶋さん自身も言っているとおり、メインフレームのアーキテクチャの影響は受けてない。

143:Socket774
11/11/06 19:34:50.14 UUUJ6fve
>>139
俺が最初に嶋正利について知ったとき感じたのはこの人のすごさよりも
日本企業のビジネス感覚、人材活用ののしょぼさ、間抜けっぷりへの失望だった。

144:Socket774
11/11/06 21:59:51.68 H60KplLz
>>141
> Intel的にはビジコンの件もDRAMを売りたい
i4002はDRAMではない。嘘の上塗り恥ずかしいよ。

145:Socket774
11/11/06 22:01:03.61 H60KplLz
>>142
で、どこのだれがi4004がメインフレームのアーキテクチャだなどと主張を？

146:Socket774
11/11/06 22:03:08.08 xLjXsWBB
>>144
横から失礼
それはおまえの認識不足か読み違ってるだけ

147:Socket774
11/11/06 22:04:07.66 c5UKFg5N
AMDの設立って1969年でセカンドソースはじめたのってi8088の1979年くらいからだろ
製品がでる10年も前からセカンドソースの一つってどんだけオーパーツ？

148:えるえる
11/11/06 22:21:19.61 UeaW747B
4002
The RAM chip stored four 80-b numbers and additionally the chip had an output port.
The use of three-transistor dynamic memory cells made the RAM chip feasible.

three-transistor dynamic memory cells
誰とはいわないけど。嘘の上塗りってほんとに恥ずかしいですね。わらい。

149:Socket774
11/11/06 22:24:24.08 H60KplLz
>>147
セカンドソースはi8085からなのと、i8080のデッドコピーをAMDも作っているから、
その意味ではAMDは1975年くらいから互換プロセッサメーカだった。
ただその当時からAMDはオリジナルCPUだしてるけどね。

で。
i8080はおろかi8085にいたるまでIntelはDRAMコントローラを出すことができなかったし、
i8085に至ってはメモリを接続するのにアドレスとバスを分離するのに自社外のバスコントローラを必要とした。
半導体メモリの拡販のためのプロセッサ開発なんていうのは相当苦しい後付の理由だね。
事実だとしても、Intelは自力じゃ自社のマイクロプロセッサに自社のメモリをつけることができないという
間抜けっぷりをさらしたことになる。

AMD（というかその他の半導体メーカ）はマイクロプロセッサ開発においてはIntelに水を開けられていたのは事実。
嶋さんがZilogに移ってZ80出したおかげでひっくり返されて、IBMが8088/80286採用するまで沈んでたけど。

AMDはバスコントローラやFPU、時代が下ってからは不揮発性メモリなどの技術を押さえ、
この部分でIntelに対しライセンス供与を行っている。

150:Socket774
11/11/06 22:25:23.29 H60KplLz
>>148
あら失礼。

151:えるえる
11/11/06 22:26:11.87 UeaW747B
4004はテッドホフ=アーキ担当、嶋=実装担当
みたいなイメージなのかな。

もともとコンピュータ史に興味があれば、
IBM > CRAY, Intel, DEC, UNIVAC > Sun, Motorola > AMD
としか思わないはずなので、
ネット見ながら応戦しているのがばればれである。

152:Socket774
11/11/06 22:28:43.25 UnBk6tkg
つうか70年代当時に販売担当上級副社長だったエド・ゲルバッハが「我々は
マイクロプロセッサをメモリ製品の拡販の手段と考えていた」と語っているんで、
そこら辺は常識の範囲だろ。

153:えるえる
11/11/06 22:29:48.49 UeaW747B
>>149
そんなに堅く考える必要性ないだろ。
今みたいにIntelに自社の支配力がない時代には、他社と補完路線で商売やってたってだけのような。
セカンドソースは自社で製品安定供給できる製造体制ととのえば、利益ないからやめたくなるんじゃないの?

154:Socket774
11/11/06 22:29:52.81 H60KplLz
>>151
> 4004はテッドホフ=アーキ担当、嶋=実装担当
それはさすがに嶋さん怒るな。

> ネット見ながら応戦しているのがばればれである。
というレッテル貼りしたいのがミエミエなわけだけが、
コンセプトメーカしか並べられず半導体メーカを出せていないあたりでニワカってレッテル貼りかえせばいいのかな ;-)

155:Socket774
11/11/06 22:34:29.76 H60KplLz
>>153
実際その状況になったのは i80286が安定してからだよね。

Intelはセカンドソーサを何度かつぶしにかかってるけど、AMDはそのたびにしぶとく生き残ってる。
背景の一つにクロスライセンスがあるわけだけど、前に更新したのが2001年だからそろそろ切れるのかもね。

156:Socket774
11/11/07 00:47:53.34 598dwazn
携帯電話が地球シミュレータと同等の演算能力を持つというのか｡
ARM恐るべし

157:Socket774
11/11/07 04:17:23.77 L773e4Yw
Core 2 Duo はキビキビしすぎて少しでもプログラムが
遅れてタイミングがズレるとにエラーになる事が多い。
WMPみたいに、しぶといプログラムはエラーにならず、
開始するのに時間がかかる。P4の、もっさりの方が快適
なんだが、熱に弱いのがネック。

158:Socket774
11/11/07 04:58:20.16 +h1mwsvo
えるえるって前にトンデモ理論振りかざして
ボコボコにされてたやつじゃねえか・・・

159:Socket774
11/11/07 07:59:19.61 4hSB2nzz
まあ言ってることは間違ってはいない

160:Socket774
11/11/07 09:29:25.35 tIhiyhKc
>>153
×Intelに自社の支配力がない時代
○Intelに自社の開発力がない時代
そう言えばMotoは自社で6800の周辺チップ一通り揃えてたけど
性能や価格面ではダメダメだったのを思い出した

161:Socket774
11/11/07 11:15:11.29 vqJLMGpp
リファレンスを提示するとかが主で、性能や価格を頑張らない
ものってのが昔はあった気がする。
どこもかしこも世知辛い今はもうなさそうだが。
モトローラが該当するかどうかは知らない

162:Socket774
11/11/07 16:14:07.75 uNNC+L/4
富士通、最大23.2PFLOPSを実現するスパコンを発売～京で用いた技術をさらに発展
URLﾘﾝｸ(pc.watch.impress.co.jp)

40nmで16コアで1.848GHzで110W

163:Socket774
11/11/07 17:41:17.11 vqJLMGpp
IXfx のダイサイズはかなり大きい

IIIVfx 45nm 8Core 513mm2
URLﾘﾝｸ(journal.mycom.co.jp)

IXfx 40nm 16Core
URLﾘﾝｸ(pc.watch.impress.co.jp)

164:Socket774
11/11/07 18:00:54.19 mETZ5tg9
消費電力倍かよ。
フル構成時のシステム消費電力凄い
事になりそうだな。

165:Socket774
11/11/07 18:11:35.63 vqJLMGpp
同じ1PFLOPSのシステム同士で比べたら
VIIIfxからIXfxでノード数が半分近くに減るから
インターコネクトチップやらなんやらの分だけ電力は減るだろう

IXfxのダイサイズがかなり恐ろしいことになってそうなのが気になる。
Tukwila も超えて最大級なんじゃないのかな

POEWR7 567mm2
POWER6 341mm2
SPARC64 VIIIfx 513mm2
SPARC64 VII 445mm2
Tukwila 699mm2
Montecito 596mm2
Westmere-EX 513mm2
Nehalem-EX 684mm2
Magny-Cours 346mm2x2 MCM
GTX580 520mm2
Radeon HD6970 389mm2

166:Socket774
11/11/07 18:49:14.06 mHeWIMwy
コピペ情報

SPARC64 IXfx
TMSC 40nm
ダイサイズ 21.9 mm × 22.1 mm
トランジスタ数約 18 億 7000 万個

SPARC64 VIIIfx
富士通45nm
ダイサイズ 22.7 mm × 22.6 mm
トランジスタ数約 7 億 6000 万個

167:Socket774
11/11/07 19:10:05.65 bCCRVu4f
富士通先端プロセスェ……

168:Socket774
11/11/07 19:45:33.28 gMmqsDRj
>>154
フェデリコ・ファジンを忘れてもらっては困るでござるよ。彼も嶋さんとザイログ行っちゃったけどね。
ピーナッツでIBMが出した2ndソース要求が元々だけど、MILスペックを取ってたのはAMDだけだったからアタマ一つ飛び抜けてた。

169:Socket774
11/11/07 21:26:10.62 fmSbxnKO
ここで IBM fab club について一言↓

170:Socket774
11/11/07 23:12:17.05 UlJ7ISjD
>>158
そんなことあったか?

171:Socket774
11/11/07 23:32:04.50 mHeWIMwy
妄想垂れ流してた漢字コテハンのやつが使ってた
もう一つの名前がえるえるだとおもってたけど違うのか

172:Socket774
11/11/07 23:35:44.59 UlJ7ISjD
このあたりかな。1年前の。結構いまみると他のレスよりまともだと思うが。
URLﾘﾝｸ(www.varusu.com)

173:Socket774
11/11/08 00:03:29.63 whGG3rJt
日本発のCPUアーキテクチャを開発してほしい。
ARMに対抗するようなヤツ。

174:Socket774
11/11/08 00:05:11.31 NQmcsU5G
あるだろw SHとか。

175:Socket774
11/11/08 00:54:43.81 siJmdRDd
M2090(GF110) 40nm 520mm 177GB/s 6GB TDP225W
　LINPACK 346? GFLOPS/理論値 665GFLOPS = 0.52?
SPARC64 IXfx 40nm 484mm 85GB/s 64GB 110W
　LINPACK 220? GFLOPS/理論値 236.5GFLOPS = 0.93?

GPUもTufuみたいなインターコネクトでつなげば実効効率あがるのかな。
しかしそうするとコスト差が小さくなるはず

176:Socket774
11/11/08 00:56:14.51 +6Q8QlOQ
震災でルネサスから出荷とまって自動車産業に大打撃与えたのってSHだっけ？

177:Socket774
11/11/08 02:25:10.88 xQnlrl77
>>164
ワットパフォーマンスは上がるだろ
だから実質的に消費電力が減る

178:Socket774
11/11/08 02:38:01.96 4J5KFli2
TSMCのプロセスでも1.8GHzぐらいなら出せるんだ

179:Socket774
11/11/08 03:14:21.38 4AFzjJ75
>>178
TSMCと富士通でどっちがクロック出しやすいかはしらないが、
TSMCは40nmで倍のコア数（トランジスタは2倍弱？）の模様。

180:179
11/11/08 03:15:38.40 4AFzjJ75
上の方に書いてあったか。二倍強だ。
28nm移行も、みたいに書いてあったけど28nmはみんなが
TSMCに委託するからバックオーダー抱えまくりじゃん。

181:Socket774
11/11/08 06:26:18.59 JWtVALlg
SPARC64はハイエンド側に追いやられてどんづまりだと思っていたが、
まさかHPCで生きのこるとは。

182:Socket774
11/11/08 06:37:19.82 siJmdRDd
IXfx は特化CPU、T4も特化CPU、もし両方生き残れれば
汎用ではないことが生き残りの理由ってことになるのかな

183:Socket774
11/11/08 07:14:54.67 JWtVALlg
メインストリームから外れた以上、ニッチに特化するのは必要条件、
って当たり前すぎて面白くないけど。
全ては(チップアーキテクチャの優劣とは無関係に)強力なユーザーを捕まえられるかどうか、
そのユーザーが生き残れるかどうか、にかかっていると思う。AlphaはDECとともに倒れた。
RISCのもう一つの雄、ハイエンドには行けなかったMIPSはどうなるかな。

184:Socket774
11/11/08 09:46:57.26 MhLpVB9N
Bladeワークステｰションを買って、Solaris使えばスパコン気分が味わえるはず。

185:Socket774
11/11/08 10:13:35.78 JWtVALlg
豆腐もつけないと……

186:Socket774
11/11/08 12:57:09.18 MhLpVB9N
>>181
元からハイエンド向けに作られたのがSparc64じゃないの？
端から、PCや携帯なんて考慮してない。

187:Socket774
11/11/08 13:16:02.11 cCvfqTaO
そういやItaniumってまだ息してたっけ？

188:Socket774
11/11/08 13:22:39.10 rD8+vPdx
来年、32nmのが出るので、まだ息はしている。
hpが採用している限り、やめられないだけな気もするけど。

189:Socket774
11/11/08 14:24:09.71 DRZy98ol
>>183
中国のスマートフォンやHPCはMIPSベースだべ

190:Socket774
11/11/08 15:21:10.07 czzaVWbf
MACオタが消えると本当に誰も口上に載せないな＞POWER

191:Socket774
11/11/08 16:09:58.18 065VaUjw
URLﾘﾝｸ(news.mynavi.jp)

なお、同社ではGPUコンピューティングやIntelのMICアーキ
テクチャなどについても、

「IntelのKnightシリーズは8SIMD、GPGPUは16SIMDだと思っており、
単に演算器を増やすほうがコアを増やすよりも確かに増やす
トランジスタ数の問題では楽になる。
しかし、もう1つの問題として、超並列演算を低消費電力で
実現するためにはインタコネクトをCPUに内蔵する必要がある。
我々はTofuで、その第一歩を築けた。
我々のほか、こうしたアプローチが現在出来ているのは
IBMがBlue Geneで実現しているだけであることを考えれば、
我々が一番Exaスケールの実現に近いと思っている」

と、2018-2020年ころが目標とされているExaスケールを20MW
程度で実現するのに、最も近いのは富士通であることを強調した。

192:Socket774
11/11/08 16:47:48.56 ByYh8jJ6
富士通研、CPUの廃熱を用いた冷却用冷水製造技術を開発
URLﾘﾝｸ(news.mynavi.jp)

富士通ノリノリですね

193:Socket774
11/11/08 17:49:53.61 08YawsXY
理研の建物が既にそうなんじゃないのかという気がする（プレスリリース日がFXと同じだし）んだけど、実際はどうなんだろう。

194:Socket774
11/11/08 19:14:09.33 whGG3rJt
富士通すげぇな。

195:Socket774
11/11/08 20:08:38.70 9JctjHde
富士通はいいから早くJapanistの製品版と64bitドライバをリリースしろ

196:Socket774
11/11/08 23:26:19.31 czzaVWbf
関係ないけど，大学時代富士通のスパコンでOAKが使えたのには笑った｡

197:Socket774
11/11/09 00:05:01.16 7cxnclMt
本当に全く関係ないな。

198:Socket774
11/11/09 01:02:11.88 gwae3QrI
>>178
SPARC T4 は 3GHz だよ

199:Socket774
11/11/09 10:13:37.93 kkv8OM+F
シンプル・低クロック・ローパワー・メニーコアだったNiagaraが
どんどん普通のパフォーマンスコアに近づいていく一方で
またARMで同じ歴史をもう一回繰り返そうとしている件

200:Socket774
11/11/09 13:38:46.51 S7d2/MTH
つまりARMがハイパフォーマンス指向で行き詰まった後RXマイコンの時代が来るというわけだな。

201:Socket774
11/11/09 14:00:38.48 kkv8OM+F
RXのARMに対する優位性がよくわからない。
ルネサスの全面サポートがあるからマイコンにはいいんだろうけど、
それはD/Aコンバータ買ったらおまけで付いてきたコアがたまたまRXだった、みたいな話で、
別におまけはARMでも構わないだろう、と。

202:Socket774
11/11/09 15:38:17.66 kVU5uXh9
Niagaraの失敗を見てもAMDは何も学ばなかったようだな。

203:Socket774
11/11/09 18:49:14.26 Vban78Wt
>>196
大型コンピューター用のOAKはJEFっていうんだぜ。

204:Socket774
11/11/10 09:43:36.82 GMIxkngh
Niagaraは失敗じゃないyo!

205:Socket774
11/11/10 18:44:32.62 Kfh1/tzs
URLﾘﾝｸ(livedoor.blogimg.jp)

206:Socket774
11/11/10 21:28:10.30 vtMmLWuT
糞なコアをたくさん積んでも糞は糞でしかない。

207:Socket774
11/11/10 22:30:50.00 SUJUpFk+
>>205
流石のビッグブルー。

208:,,・´∀｀・,,）っ-○○○
11/11/11 01:51:27.39 lEV7BMte
>>201
ARMはでかすぎるだろｗｗｗ
携帯電話にPentium 4を載せようって言ってるようなもの。

RXはM16Cの系譜で十分な実績がある。ボタン電池で動くような機器にも使われてるぜ。
とはいっても三菱を中心とした国内家電メーカーのガラパゴスプラットフォームが主戦場なんだけどね。

209:Socket774
11/11/11 11:00:05.55 y5bnUGEx
ARMv8でレジスタ倍増して、コンディションビットが削られて、
なんか普通のRISCになってきた件
実はMIPSで良くね?

210:,,・´∀｀・,,）っ-○○○
11/11/11 21:03:47.91 lEV7BMte
MIPSってARMが台頭してから斜陽って印象あるけどいまだに時価総額ではIntelの倍もあるんだよな。

211:Socket774
11/11/11 21:39:52.54 BQdc+Z2g
んな馬鹿な

212:,,・´∀｀・,,）っ-○○○
11/11/11 22:02:16.40 lEV7BMte
URLﾘﾝｸ(finance.yahoo.com)
Market Cap: 273.30M

URLﾘﾝｸ(finance.yahoo.com)
Market Cap: 122.51B

MとB読み間違えてた

213:Socket774
11/11/11 22:07:37.99 ZsiHYzJb
だんごも人間だなｗ

214:Socket774
11/11/11 22:11:38.97 UARXw3tP
えっ

215:Socket774
11/11/11 23:11:31.66 /rubVh8/
lol

216:Socket774
11/11/11 23:38:51.01 sbpA7QMM
URLﾘﾝｸ(news.mynavi.jp)
> オペコードは32bitで、レジスタ指定ビットは5bitとなる。命令によってはこれに32bitまたは64bitのオペランドが続く。
32/64/96bit可変長? 相変わらずRISCらしくない。Thumb-2もそうだけど。

217:Socket774
11/11/11 23:52:37.78 FN/1HnC6
>>75の資料にはそんなこは書かれていない
ライターの勘違いだろ

218:,,・´∀｀・,,）っ-○○○
11/11/11 23:54:36.10 lEV7BMte
x86フォーマットの利点を部分的に取り入れた形だね。
従来のARMのようなリテラルプールからのロードはコストが大きい。
命令フェッチと同時に即値が得られるメリットは大きい。

219:,,・´∀｀・,,）っ-○○○
11/11/11 23:55:17.93 lEV7BMte
>>217
まあ単なるリテラルプールかもしれないね

220:Socket774
11/11/12 00:07:47.27 IvUr1heL
A64はThumbなしでx86のオブジェクトコードサイズに対抗出来るのか?

221:Socket774
11/11/12 00:44:55.20 yYVXMI0w
レジスタフィールドに各5bit使っちゃうとさすがに16bit化はできなそうだよな

222:Socket774
11/11/12 01:06:38.48 8gOK4EVR
ThumbもコンディションビットもARMの差別化要因だったのに、
それを捨てての32レジスタ化はやや疑問

223:,,・´∀｀・,,）っ-○○○
11/11/12 01:29:11.61 rlP+RKEI
汎用レジスタは31本じゃね？
32本目はゼロレジスタなのか、あるいは特別な意味（たとえば11111＝即値参照）を持つのか
どっちやろね？

224:Socket774
11/11/12 02:19:52.00 U45BaRXO
ゼロレジスタはあるようだが32本目として実装されてるのかは分からんな。

225:Socket774
11/11/12 02:54:07.90 yYVXMI0w
知らなかったがNECのV800シリーズはリテラルがあるときだけ32bitで通常命令は16bitだったのな
URLﾘﾝｸ(www.cqpub.co.jp)

226:Socket774
11/11/12 11:24:50.41 IvUr1heL
31か32かは問題ではない

227:,,・´∀｀・,,）っ-○○○
11/11/12 11:53:51.03 rlP+RKEI
問題あるよ。11111Bがレジスタではない別のオペランドを表現できる可能性があるからね。

228:Socket774
11/11/12 12:03:31.81 8gOK4EVR
いやそれもちょっとは問題だけど、レジスタ指定が4bitか5bitかに比べれば些細な問題だろう

229:,,・´∀｀・,,）っ-○○○
11/11/12 12:10:35.57 0Rl4D2Is
Knights*のSIMDは5ビットになるけどね

230:Socket774
11/11/12 17:29:41.07 tY9Kax8N
IEE７５４形式の単精度型で表現できる数の最大の正の数
正規化された数で最小の正の数、最小の正の数がわかりません
おしえてくださいｍｍ

231:Socket774
11/11/12 17:56:13.02 BqqThEFE
逆にベクトル演算は32本じゃ足りないのでは?

232:,,・´∀｀・,,）っ-○○○
11/11/12 18:28:59.08 9Qg5HDCp
16x16単精度の行列積でギリギリ足りる程度。

233:Socket774
11/11/12 22:17:49.39 8gOK4EVR
512bit*32本ってSPEの128bit*128本と同じサイズなのか。

234:,,・´∀｀・,,）っ-○○○
11/11/12 22:26:53.12 9Qg5HDCp
更に4つのスレッドごとにあるから4倍だね。
SIMDレジスタだけで1コアあたり8KB。
冷静に考えると凄い量だよな。

235:Socket774
11/11/12 23:06:16.05 8gOK4EVR
多い分だけL1キャッシュ並のレイテンシなんじゃないの?

236:Socket774
11/11/13 00:03:21.42 jL9bcfGb
IPFは未だにL1$のレーテンシが1だが

237:Socket774
11/11/13 00:13:00.04 014AhMR2
クロックいくつの話だろう

238:,,・´∀｀・,,）っ-○○○
11/11/13 01:16:19.61 T27q85rv
>>235
L1キャッシュのアクセスはタグ引きがあるから番号と物理位置がすぐに求まるレジスタファイルには勝てない。
レジスタリネーミングとかやりだすとまた話は別だけどね。

239:,,・´∀｀・,,）っ-○○○
11/11/13 01:22:12.27 T27q85rv
GPUでは数十KBあるけどやはりレイテンシは大きいらしいね。
使いやすくするために次世代Teslaではレジスタファイルの階層化やるって話だから
キャッシュとあんまり変わらなくなるかも。

240:Socket774
11/11/13 01:36:08.54 AFjtl6VE
Knights Cornerを安価にばらまいてくれたら
いろいろやってみる機会ができて面白いだろうになあ
一般向けでバーゲン価格はありえないかもしれないけど

241:Socket774
11/11/13 02:00:17.52 Utilcmxj
>>239
＞GPUでは数十KBあるけどやはりレイテンシは大きいらしいね。
シェアードメモリのことかな？
やっぱいくつかで共有するとアービトレーションでレイテンシかかるのかな。

242:,,・´∀｀・,,）っ-○○○
11/11/13 02:31:37.97 T27q85rv
いや、レジスタファイルそのものがでかい。
単精度×32768本って何バイト？

243:Socket774
11/11/13 03:13:38.55 Utilcmxj
えっ、レジスタなのにレイテンシ大きいの？
最悪じゃん。

244:Socket774
11/11/13 03:44:13.48 DOg34JEF
それを隠蔽するのがGPUの真骨頂だからなぁ　＞レイテンシを最適化するCPUとスループットを最適化するGPU

数百クロックのメモリレイテンシを隠蔽するために長大なパイプラインと膨大なレジスタが必要になるわけで。
そして膨大なレジスタの搭載でレイテンシが長くてもパイプラインである程度は隠蔽できるしね。
フルHDなら常に200万スレッドが並走しているからレイテンシよりも容量を取ってもおかしくない。

245:Socket774
11/11/13 07:11:40.39 LN6eg/Tp
GPUは、レジスタへのアクセス（とシェアードメモリ）はレイテンシがマルチスレッドで完全に隠蔽できて、実質1クロック

246:Socket774
11/11/13 22:38:45.60 lCs86oaR
>>244
200万スレッドw
1pixel1スレッドw
どんだけ無駄な設計だよw

247:,,・´∀｀・,,）っ-○○○
11/11/13 22:42:46.62 T27q85rv
512SPで8192スレッドくらいだったような。

248:Socket774
11/11/13 22:44:39.56 y3Ce4y6z
>>246
シェーダープログラム書いてみ？　１ピクセル１スレッドだから。

249:,,・´∀｀・,,）っ-○○○
11/11/13 22:48:12.02 T27q85rv
同時処理するわけじゃないからね。

250:Socket774
11/11/13 22:48:32.89 014AhMR2
物事は様々な抽象レベルで考えるんだ

251:Socket774
11/11/13 23:12:55.54 lCs86oaR
>>248
GPUってデバッガで実行過程をトレースすることもできないのに
シェーダのソースコードだけから物理的な動作を推測するのは無理があるわw

252:Socket774
11/11/13 23:45:12.33 LN6eg/Tp
Parallel Nsight使え

253:Socket774
11/11/13 23:52:49.81 Utilcmxj
なるほど。
GPUはレイテンシをうまく隠蔽してるんだね。

254:Socket774
11/11/14 00:26:23.84 ak2saiFA
CPU　ヨボヨボで1つのことしかこなせない老人
GPU　いろんな人から多くの仕事を任せられる若者

って感じか

255:Socket774
11/11/14 00:33:54.70 FGGcGxSM
CPU　少数だけど頭が柔らかい人
GPU　いっぱいいるけど頭が硬い人

こんな感じだろ

256:Socket774
11/11/14 00:36:44.30 Bvkz2l47
CPU … 数個の複雑な仕事をこなせる職人
GPU … 数千単位の単純な仕事をこなす工場

ってカンジだと。
生産性では大量生産な工場に敵わないが、
オーダーメイドでいろいろな仕事を熟せるCPUさん。

257:Socket774
11/11/14 00:40:02.34 +CNvzy9s
CPUは老練な感じがするね。

258:,,・´∀｀・,,）っ-○○○
11/11/14 00:57:34.26 JD7xK2Zg
何か指示をしたら全員同じ動きをする人々

259:Socket774
11/11/14 01:03:05.37 +CNvzy9s
日本人みたいだな。

260:Socket774
11/11/14 02:38:22.79 /X0n8WLm
>>238
タグ引きはL1では並列に行うからレイテンシは増やさないよ
レジスタファイルはポート数大きいしレイテンシで特に有利ということはない

レジスタの見かけのレイテンシが小さく見えるのは
実行ユニット間でのフォワーディングがあるからだよ

>>239
NVIDIAがレジスタキャッシュを導入するのは消費電力を減らすのが主な目的らしい
CPUもレジスタキャッシュを持ったものはあるけど
これはポート数を増やすのがしんどいから見かけのポート数を増やすのが目的

AMDのVLIWはフォワーディングでレジスタのレイテンシを隠蔽している

>>248
GPUで言うところのスレッドは複数スレッドでPCを共有しているから
CPUのスレッドとは数え方が違う
言うまでもないかもしれないが

261:Socket774
11/11/14 16:38:51.48 cQRpyNQk
D.E Shaw研究所はAntonと呼ぶ分子動力学(Molecular Dynamics:MD)計算専用のスパコンを開発し、その最初のシステムでのシミュレーション結果を発表した。

タンパク質のフォールディングではミリ秒程度のシミュレーションを
行わないとどのように折りたたまれて行くかが分からないのであるが、
汎用スパコンでのシミュレーションでは1日掛かって100ns程度に
相当するシミュレーションしか出来ず、msのシミュレーションには
何万日も掛かってしまうので、実用的ではない。
これを専用アーキテクチャで100倍程度加速すれば、実行可能な範囲に
入るというのがAnton開発の狙いである。

D.E.Shaw氏が創立したD.E.Shaw & Coは運用資産2.5兆円の
世界最大規模のヘッジファンドであるが、現在は、Shaw氏は
ヘッジファンドの日常のマネジメントには携わらず、
D.E.Shaw Researchのチーフサイエンティストとして、
MDのアルゴリズムやAntonシステムの開発を行っているという。
そして、同研究所の運用費用はShaw氏のポケットマネーで賄われていると
言われている。

このAntonの512ノードシステムの最初の2台が完成し、それを用いて、
2万3,558原子のDHFR(5DFR)では10.4μs/day、11万6,650原子の
T7Lig(1AOI)では3.06μs/dayの性能を達成した。
URLﾘﾝｸ(news.mynavi.jp)

262:,,・´∀｀・,,）っ-○○○
11/11/14 17:38:53.58 JD7xK2Zg
>>260
論理レジスタと物理レジスタのマッピングが一致してる場合においてはレジスタ番号から
レジスタファイル上の位置の算出は低コストでできるでしょ。

キャッシュはヒットを確認してからはじめて転送できるので、確実にデータの存在が保証される
レジスタと同等のレイテンシってことはないはず（あくまで同等の容量と仮定した場合の話）

263:Socket774
11/11/14 23:41:47.15 MWtnjh65
バフェット氏のバークシャー、ＩＢＭ株を107億ドルで購入－ＣＮＢＣ
URLﾘﾝｸ(www.bloomberg.co.jp)

264:Socket774
11/11/15 01:13:02.64 RPSb6iGS
>>262
レジスタファイルはアドレッシングは簡単でもポート数が多いのでレイテンシが大きくなるという話だよ

265:,,・´∀｀・,,）っ-○○○
11/11/15 01:22:09.78 Cr2GvgSQ
それはL1のRead/Writeポート数を増やしても同じことだ

266:Socket774
11/11/15 01:28:39.77 P4uo+OFN
まぁ、DRAMのレイテンシに比べたらかわいいもんだ。

267:Socket774
11/11/15 08:40:11.45 alKNyBpn
日本の家電メーカーはこぞってARMに向かっているのだね。

東芝「レグザ」，パナソニック「ビエラ」など，最新テレビの映像エンジンを支えるARMのCPUコア
URLﾘﾝｸ(www.4gamer.net)

268:Socket774
11/11/15 08:54:47.31 CtWv9QlY
>>265
L1はせいぜい2ポートとかだけど
レジスタファイルはSNBのPRFなら多分7ポートとかそれくらい

そもそもレジスタファイルのレイテンシはほとんどの場合隠蔽される

269:Socket774
11/11/15 09:00:12.30 alKNyBpn
ついでに、ARM Technical Symposia 2011 Japanの他の記事
URLﾘﾝｸ(www.4gamer.net)
URLﾘﾝｸ(www.4gamer.net)
URLﾘﾝｸ(www.4gamer.net)

270:Socket774
11/11/15 23:19:14.66 dOqUwe6R
このｽﾚはKnights Cornerの話が
あまり出てきてなさそうだね

将来、京を負かすかもしれないぞ?

271:Socket774
11/11/15 23:33:03.32 M+XUj+BO
じゃあ、お前がネタ振りすればいいだろ
最近なんかトピックあったっけ？

272:Socket774
11/11/16 01:40:17.71 dgvdiitO
こないだIntelが複数のペタ級スパコンに採用されたよ！！って発表して以来特になんもない

273:,,・´∀｀・,,）っ-○○○
11/11/16 03:04:06.02 iPcYYMFW
機密保持契約破ってまで話したがるベンダーもユーザーもいないでしょ。

274:Socket774
11/11/16 03:16:41.93 VoaI1vrk
米国国策事業に組み込まれたからどうでもええわ

275:,,・´∀｀・,,）っ-○○○
11/11/16 03:25:02.22 iPcYYMFW
東大の次期スパコン、中国の大手IT企業浪潮と提携とか、おまいらがスルーしてただけで、
今年の7月以降大きな話題だらけだったしな。
あとは次のIDFあたりを待つくらいか。

276:Socket774
11/11/16 03:27:33.27 qvMADfQv
個人向けに売ってくれることを祈るだけｗ

277:Socket774
11/11/16 03:39:29.08 tLFbwzqP
>「Intel Federalは世界最高のスパコンを作り上げることを目的として
>米国政府と協力して立ち上げた」と米国政府との緊密性をアピール

278:Socket774
11/11/16 04:32:36.71 7nRxkD9l
大学研究機関が主要顧客なんだし
Knightsはもっと情報出してもいいとおもうんだけどな

279:Socket774
11/11/16 04:53:51.39 dgvdiitO
こないだCERNが出した発表でも使ったのKnightsFerryだったしパートナーのとこにもまだCornerは届いてないとか？

280:,,・´∀｀・,,）っ-○○○
11/11/16 07:27:06.84 iPcYYMFW
現状、Larrabee 1の倍精度強化版である以上の何かだとは思ってないんだけどな。

281:Socket774
11/11/16 07:50:46.96 a0ElPuLG
【スパコン世界一「京」の全貌】
「世界最速」を実現したアーキテクチャ
URLﾘﾝｸ(itpro.nikkeibp.co.jp)
新機能満載のCPUとTofuインターコネクト
URLﾘﾝｸ(itpro.nikkeibp.co.jp)
プログラム実行とMPI通信を高速化
URLﾘﾝｸ(itpro.nikkeibp.co.jp)

282:Socket774
11/11/16 08:15:48.84 ztjVMwFg
東大の次期スパコンってこれじゃないの？

東京大学情報基盤センター、スパコンシステム刷新--PRIMEHPC FX10を4800ノード
URLﾘﾝｸ(japan.zdnet.com)

283:Socket774
11/11/16 08:44:02.75 CXSQmpeK
>>279
Cornerは22nmノードだから、今作ってるところ

のはず

284:Socket774
11/11/16 20:06:40.30 /RfE+OZP
64bit後発組は、先発組にくらべてデコーダ負荷が軽くなる命令セット採用しやすくなるから有利じゃね？
先発組は、互換性維持したまま性能揚げないといけないので、デコーダがどんどん複雑になるが、
後発組はデコーダがシンプルになる命令セットにできるからな

285:,,・´∀｀・,,）っ-○○○
11/11/16 20:52:47.09 iPcYYMFW
PRIMERGY RX300のほうならいけるかなと思ったけどはPCIeボード刺さりそうに無いな。
RICCの入れ替えには使えそう。

286:Socket774
11/11/16 21:31:50.36 /QFnuRJw
MICが東大のスパコンで使われるって何処情報なん？
研究開発には使用してるみたいだけど

287:,,・´∀｀・,,）っ-○○○
11/11/16 21:56:55.99 iPcYYMFW
研究開発だけして使わない手は無いでしょ
まあ、東大のアカポス受け入れ先の国研あたりならいくらでも入る余地はあると思ってるが。

Opteronはなくなったとは思ったがVenusは意外だった。

288:Socket774
11/11/16 22:02:14.06 lo5v5tzi
KnightsCorner来たよ
URLﾘﾝｸ(www.xbitlabs.com)

289:Socket774
11/11/16 22:06:05.26 /QFnuRJw
何だルーマーでもなく妄想を吹聴してただけか

290:,,・´∀｀・,,）っ-○○○
11/11/16 22:10:26.67 iPcYYMFW
倍精度で1Tなら単精度だと2Tは出るのか。

291:Socket774
11/11/16 22:10:46.59 hj3oZ/F8
>>288
> Interestingly, but the KNC accelerator is not just a PCI Express accelerator like its predecessor,
> the Knights Ferry compute accelerator for software developers,
> but looks like CPU that plugs into a socket or a special adapter.
何気にすごい事書いてあるんだけど

292:Socket774
11/11/16 22:11:24.24 hj3oZ/F8
QPI版ktkrってこと？

293:,,・´∀｀・,,）っ-○○○
11/11/16 22:25:51.15 iPcYYMFW
京は早くも国会版事業仕分けで予算削減対象に祭り上げられてるがMICの影響もあるんだろうな。
日本主導の技術ってなんでこうもガラパゴス化するんだろうな。

WiMAX2がdocomoのLTE帯域増加より先行するとか。

294:,,・´∀｀・,,）っ-○○○
11/11/16 22:36:45.46 iPcYYMFW
あれ？ひょっとしてWestmere-EXと同じLGA1567か？
URLﾘﾝｸ(img.club.pchome.net)

295:Socket774
11/11/16 23:14:17.10 02wRMdCb
Itaniumとか見てると、システムベンダもIntelの非主流チップの舟には乗りにくいんじゃないか

296:Socket774
11/11/16 23:20:46.78 PRQQPRpb
URLﾘﾝｸ(www.xbitlabs.com)
これじゃメモリ帯域足りなすぎで実効性能出ないっしょ

297:,,・´∀｀・,,）っ-○○○
11/11/16 23:34:40.11 iPcYYMFW
DRAM混載前提だな

298:Socket774
11/11/16 23:35:23.14 tw/xpRHh
Intelは、新アーキテクチャで技術的に優れてるけれど互換性が無い新CPUを作るも商業的に成功せず、
自社の互換性があるCPUが商業的に成功してきた

IA64でも、過去のインテルのCPUの法則とおなじようになった

いまや、PA-RISCの後継機として、HP-UX専用CPU化してるな

299:Socket774
11/11/16 23:42:06.64 t32s0ZdB
メニーコアにソフトウェアの対応は追いつくのかな?
多少ワットパフォーマンスが落ちる程度なら、従来通りのリッチコアの方が
ソフトウェアは数段書きやすいような。

300:Socket774
11/11/16 23:47:17.16 EkOolI4e
Itaniumって技術的に優れてるの?
最初から全然ダメにしか見えなかったが。

301:Socket774
11/11/16 23:59:29.81 6Og8WK5r
TSVか

302:301
11/11/17 00:00:31.91 6Og8WK5r
>297 宛な

303:Socket774
11/11/17 00:04:54.79 na+c1KzK
まあ来る来る言ってなかなか来ない技術の一つですがね……

URLﾘﾝｸ(202.218.219.41)
> 450mmウエハー、EUV、TSV、半導体製造の最新技術は実用化のめども立たず

304:Socket774
11/11/17 00:22:26.40 umKNouZr
短波長のEUVへ移行せずに16nmを製造するって？　マジか
おじさんは頭が古いからびっくりだ

305:Socket774
11/11/17 00:27:27.73 umKNouZr
URLﾘﾝｸ(news.mynavi.jp)
Wide IO Mobile RAMは約1200の端子だからTSV

これはTSVの実用化には該当しないの？

306:Socket774
11/11/17 00:40:05.50 na+c1KzK
サンプル出荷は出来た。予定通り2012年中に量産も開始できるかもしれない。
しかし離陸できるかどうかは、なんともわからんのですよ。

URLﾘﾝｸ(pc.watch.impress.co.jp)
> TSVの量産準備ができているかどうかについては、JEDEC内部でも見解がわかれている。
> 今回のカンファレンスでBill Gervas氏はTSVは少なくとも2016年まではスピードイー
> ルドの面から準備が整わないと発言。それに対して、メモリの部会を束ねるDesi Rhoden
> (デジー・ローデン)氏(Chairman, JEDEC JC-42: Solid State Memories)が、「JEDECの
> 見解は、TSVは現在すでに準備ができているというものだ」と反駁する一幕があった。

307:Socket774
11/11/17 00:42:20.21 Kbxcu78w
メモリ側の方という意味では該当しますよ。ただこれはあくまで容量・速度を稼ぐためのメモリ内部のTSVであって、この後ロジックと接続するという工程があり、
そこに関してはまだこれから開発するという段階です。メモリ内部のTSVの応用ではサーバー向け大容量モジュール(32～64GB)が開発され既にサンプル出荷されています。
兎にも角にも問題はロジックとメモリとの積層で、ここでは後工程メーカー（パッケージング、ダイ加工・接続など）、半導体ファブなどとの連携が必要ですし、
デバグ・テストも相当な苦労が要ります。それと当然ですが加工自体が相当な歩留まりを落とす要因でありますから、メリットがそれを上回るかできる限り不良品を出さないかの
努力がまだ追いついていませんでしょうね。下手に加工失敗すればウェハでは良品でも不良品になっちゃいますから。

308:Socket774
11/11/17 00:48:48.85 mNtps0XJ
マジでDRAM混載しないかな。
セットでイイじゃん、もう。
レイテンシ劇減りでみんなハッピー。

309:Socket774
11/11/17 00:54:05.50 Kbxcu78w
熱（はあと）
積層接続間の経年劣化も結構気になるところではあります。

310:Socket774
11/11/17 00:57:13.27 mNtps0XJ
フォン・ノイマンが現代を生きていたら、プロセッサの性能は違っていただろうか･･･

311:Socket774
11/11/17 05:48:36.96 gmf+EPHn
熱問題が出るような用途は
積層でなくてシリコンインターポーザ使うんでないの？

312:Socket774
11/11/17 10:58:40.25 2dHuUS9E
TSVじゃないけどTSVと同じように使える積層チップはすでにソニーが実用化して使用してるな
原理上２層までしか無理で３層以上には使えないけどMCLってやつ

313:Socket774
11/11/17 14:46:24.90 umKNouZr
2004年にはこんなこと言ってたのにな

>米Intel社は2009年の32nm世代半導体製造技術量産に向けて，波長が
>13.4nmの光源を使うEUV(extreme ultraviolet：極紫外線)リソグラフィ技術を
>研究してきたが，それが実用化に向けた開発段階になったことを明らかにした。
URLﾘﾝｸ(techon.nikkeibp.co.jp)

314:Socket774
11/11/17 15:02:52.92 VVYxBFrh
EUVは光源出力が量産レベルには足りない
数年前はEUVマスクの欠陥を検査する方法が無いとかいう笑えない話もあったが解決したのかな

315:Socket774
11/11/17 19:50:39.26 CIVizuwi
KLAが開発したじゃなかったっけ？
後はレジストと一番最大な問題光源だな。

未だに平均30Wで15WPHとか話しにならん

316:Socket774
11/11/17 22:33:32.53 y57/jaoC
印刷以外の方法でトランジスタ形成できないものか。

317:Socket774
11/11/17 23:17:51.97 U99XJNWw
電子ビーム直描

318:Socket774
11/11/17 23:20:04.21 mNtps0XJ
ちょｗ量産でｗｗｗ

319:Socket774
11/11/18 00:40:22.80 XqnW1ixr
印刷以外の方法で　同じくらい安く　トランジスタ形成

320:Socket774
11/11/19 10:45:29.51 xIm2Liy1
タンパク質の勝手に整列する性質を利用して云々というのを
いつぞや新聞か何かで見たような。

321:Socket774
11/11/19 13:01:28.68 PjvX6VpV
DNAコンピュータの原理を改良して配線づくりか。新しいな。

322:Socket774
11/11/19 13:21:17.33 ZQ7Ge7PR
新聞でたまに◯◯技術を開発みたいなのがでるが、
ああいったのの９割以上は実用化せずにお蔵入りだからな

323:Socket774
11/11/20 09:37:33.71 UCJ0QIk0
価格を下げたり利益を出したりするのはもっと難しい
レアメタルみたいに痛い目を見ないとｗ

324:Socket774
11/11/21 23:40:51.51 wUvFXnJ5
URLﾘﾝｸ(cybergarden.cocolog-nifty.com)

AMDの32nmは歩留まりで苦戦しているが、Intelよりトランジスタが小さい。なんで20億トランジスタが300平方mmなんだ?
GLOBALFOUNDERIESは凄いことをしている。最高だぜ!

325:Socket774
11/11/21 23:46:43.31 zfmv3eWw
>>324
The Interlagos chip has a total of 2.4 billion transitions, which means the Valencia chip has 1.2 billion.
URLﾘﾝｸ(www.theregister.co.uk)

実は12億トランジスタでした
最初20億とでたのは間違い

326:Socket774
11/11/22 00:38:01.26 GCEFOAA9
モジュールx4とL3だけで12億超えそうだけどな

327:Socket774
11/11/22 00:57:42.87 XVOOGEAh
間違いというかてきとーに見積もっただけですかね。にしてもかなりスカスカな感じです。まあダイ写真見ても明らかですけど。
ノースブリッジは既存のK10からかなり流用したというらしいので、そこら辺のレイアウトが甘いんでしょうかね。
といっても1Module+L2で213MいくのでL3とあわせるとどう考えても足りんような気がします。

一応GPUにトランジスタを使えばかなりの密度には詰め込めるようなので、GFの32nmSOIは性能より密度重視なのでしょう。
（Llano 4Coreは1450Mに対して228mm^2で1mm^2あたり6.36M、Bulldozerを2Bとしたときの1mm^2あたりの密度はほぼ同じ6.35M）

328:,,・´∀｀・,,）っ-○○○
11/11/22 01:07:33.62 reyen26Y
どっちでもいいじゃん。
トランジスタの量は結果を得るためのコストであって、消費者が求める結果（性能）そのものではない。
本当に20億も使ってこんな程度のものしか作れないならx86から逃げてもまともなもの作れないぜ。

329:,,・´∀｀・,,）っ-○○○
11/11/22 01:10:33.41 reyen26Y
>>327
低クロック動作だと密度あげられるからね。
CPUでもL3キャッシュのクロックをコアより落とし密度をあげて容量増やすのは常套手段だし
（キャッシュの場合クロックだけじゃなくて平均アクセス頻度も少ないけど）

330:,,・´∀｀・,,）っ-○○○
11/11/22 22:13:22.64 reyen26Y
俺のスレストぶりは半端ない

331:Socket774
11/11/22 22:14:38.05 o4wpKpTF
おまえってセコンドガレッジやってるほう？
たまには更新しろよ

332:,,・´∀｀・,,）っ-○○○
11/11/22 22:28:26.84 reyen26Y
レンタル料3年分纏め払いしてそれ以降払ってない。
故に今月いっぱいで閉鎖。

333:Socket774
11/11/23 02:02:38.97 ZSEGTZX/
だんごさん、AVXやってる？
あれ速い？
SSE2系の延長で考えていい？

334:Socket774
11/11/23 12:42:11.78 vYM1HkSG
なぜここで
ム板の汗スレじゃいかんのか

335:Socket774
11/11/23 14:24:38.07 sEh8QXTP
インデックス修飾はどのような目的で作られたアドレッシングモードなのか
教えてください

336:Socket774
11/11/23 17:28:42.10 Q+Hu7iID
x = ar[3];

337:Socket774
11/11/26 10:07:02.49 RNSKGm+6
ソフトウェアトランザクショナルメモリのハードウェア支援は
Rockと共に消失?

338:Socket774
11/11/26 11:14:55.81 E514+JLY
64バイトのキャッシュラインを単位に、複数のラインを同時に書き換え監視したり
atomicに更新できたりすると、夢がひろがりんぐ。

339:Socket774
11/11/26 13:19:37.46 Tml2pRZY
>>337
BG/Qで復活

340:Socket774
11/11/26 13:25:17.55 E514+JLY
URLﾘﾝｸ(news.mynavi.jp)
これだ! 素晴らしい。

341:Socket774
11/11/26 17:16:29.03 s4W95dtS
tbbのcache_aligned_allocatorとatomic使えばよくね？

342:Socket774
11/11/26 17:39:32.64 gxKc78+W
>>341
TBBのatomicってよく知らないけどただのクリティカルセクションじゃないの？
だとすると複数のクリティカルセクションを合成したときにデッドロックが発生する可能性がある
STMはそれをプログラマが特に考慮する必要がない

ただ、純粋にソフトウェアで実装するとマジで重いので
バリアとかをハードウェアで実装して高速化する

343:Socket774
11/11/26 17:41:32.96 gxKc78+W
変な書き方をしてしまった
クリティカルセクション -> ロックを使ったクリティカルセクション

344:Socket774
11/11/26 19:25:30.11 E514+JLY
ロックを使った排他制御は、メニーコアにスケールさせたときに性能劣化が激しいのも問題。
クアッドコアで1コアが共有資源をロックして、他3コアを待たせるのは許容範囲でも、
メニーコアで他の15コアとか63コアとかを待たせると、結果として待ちだらけになってしまうからね。

345:Socket774
11/11/26 19:45:43.93 JqHPUTc4
ロックとかスヌープとかないようにできないんかな。
コア増えるほど頭打ちになってくじゃん。

346:Socket774
11/11/26 20:03:55.74 E514+JLY
BG/Qのmulti-versioned cacheは他アーキテクチャに広まればかなり有望かと。

347:Socket774
11/11/26 20:09:44.85 izktWWga
Itaniumにも似たような機能なかったっけ

348:Socket774
11/11/26 20:17:57.37 E514+JLY
無いと思う。
> BG/Qが実用化されると、トランザクションメモリのハードウェアサポートを
> 持つ初めてのプロセサとなる。
と本文にもある。

349:Socket774
11/11/26 21:16:39.80 s4W95dtS
>>344-345
parallel_reduceを使えばロックは結構な割合で削減できるしパフォーマンスもコア数に比例して上がる事が多い

350:Socket774
11/11/26 21:25:49.48 E514+JLY
>>349
ここでやりたいのは並列処理じゃなくて、
たとえば一つの連結リスト(同等の機能を提供する構造であれば何でもいいが)という共有資源に対して
どう効率よく並行アクセスを許すか、という話なのだ。

351:Socket774
11/11/27 03:06:32.10 g/uiiUxD
>>344
待たなかったら正常動作しないんだからしょうがない
４個と１６個じゃプログラム設計から変えないとならんがメモリは一本だからヤル気出ねぇ

352:Socket774
11/11/27 04:40:03.01 S3cb5ypX
よく最適化された同期ルーチンは
ほぼmfenceのコスト
つまりロード・ストアキューのフラッシュのコスト
なんでSTMだろうがロックだろうがあんまりかわらん

まぁOpenMPですら多くの場合ろくに最適化されてない
最適化されたロックは自作するほかないという現状は問題ではあるが

353:Socket774
11/11/27 06:25:35.19 X4h1uf+C
この場合に着目している排他制御のコストは
ロック方式の場合、実際にロックが衝突してスピンで待たされる事象かと。
STMというロックのない同期(代わりにリトライはあるが)をいかに低コストで実装するかを考えたときに
IBMの回答がマルチバージョン化L2キャッシュによるハードウェア支援。
RockはL1だけだったので一歩踏み込んでいる。

しかし、トランザクション中、プロセスコンテキストスイッチとかL2をフラッシュするような事象に
対応できるのだろうか……?
ひょっとしてHPC限定なのだろうか。

354:Socket774
11/11/27 07:22:01.68 6jXdGQU6
結局、マルチバージョンとか楽観的並行制御とか
トランザクション処理で研究されてきた手法になるのか……？

355:Socket774
11/11/27 11:01:23.94 l+fyjYfS
マルチスレッドや同期の説明が詳しいアーキテクチャの本ってないの?

356:Socket774
11/11/27 14:03:05.27 8LUvJufy
これかな
URLﾘﾝｸ(www.amazon.co.jp)

357:Socket774
11/11/27 18:41:19.85 S3cb5ypX
STMでもコア間通信をメモリシステムを介しておこなう以上
衝突がなくてもメモリオーダリングを保証する必要がある
現代のx86CPUではここにコストがかかってしまう

358:Socket774
11/11/27 19:26:52.36 +BBan95l
>>357
x86を駆逐すると言われているARMだと低コストなの？

359:Socket774
11/11/27 20:05:56.75 QOcm5FUv
>>355
まずはTanenbaum先生から学ぶのを強くおすすめしておく。
URLﾘﾝｸ(www.amazon.co.jp)
> モダンオペレーティングシステム原書第2版 [単行本]

360:Socket774
11/11/27 20:06:05.30 bo6+qjty
>>358
誰がそんな寝言を?

361:355
11/11/27 23:14:49.27 l+fyjYfS
>>356, >>359
thx。今度買って読んでみるなり。最近めっきりソフト事情わからんので。

362:Socket774
11/11/28 00:49:48.08 nZys/Ktu
>>360
そういえばAMDスレの気違いが言ってたな。

363:Socket774
11/11/28 00:51:26.04 OvAxwLmt
スーパーファミコンについて質問だけど、
スーパーファミコンのCPUは16bitで、
メモリ容量は64KBまでしか扱えないはずだけど、
メインRAMだけで128KBも搭載しているのはどうして？

364:Socket774
11/11/28 00:55:52.14 cYUakT45
セグメント方式を採用してるのかな？

365:Socket774
11/11/28 01:00:00.72 G530zl56
>>363
SFC/SNESのCPUは65816互換の16bitチップで24bit(16MB)のメモリ空間を持つ。
命令カウンタやアドレスレジスタは16bit長なんでバンクアクセスだけど。

366:Socket774
11/11/28 01:00:01.50 nZys/Ktu
>>363
URLﾘﾝｸ(ja.wikipedia.org)(%e3%82%b3%e3%83%b3%e3%83%94%e3%83%a5%e3%83%bc%e3%82%bf)
アドレスは24bit。

367:Socket774
11/11/28 01:22:03.41 OvAxwLmt
なるほど。
残りの8Mbitはどうやってメモリ空間を確保しているんですか？

でもCPUが16bitだから、一度に扱えるプログラムの最大量は64KBが限度ですか？

368:Socket774
11/11/28 01:28:21.03 PWNpyKXW
君のパソコンにも付いているx86の元祖16bit CPUのi8086だって16bit CPUで1MBも扱えたよ。

369:Socket774
11/11/28 01:32:42.11 G530zl56
>>367
基本は16bitアドレス＋8bitのバンクレジスタ値＝24bitアドレスだが、24bitダイレクトアドレスを
扱う命令も持ってる

URLﾘﾝｸ(hp.vector.co.jp)

370:Socket774
11/11/28 01:37:38.49 OvAxwLmt
つまり、16MBのメモリ空間を256個に分割し、
16bitCPUから64KBのメモリ256個にアクセスできるように見せているんですか？

371:Socket774
11/11/28 07:23:57.83 4zQT3kTK
>>357
え？
キャッシュ経由、あるいは内部バス経由で届かなかったっけ？

372:Socket774
11/11/28 12:50:08.20 j/RjBP71
>>371
チップ内バス経由でもコストがかかるということ
大体だけどロードストア片方なら50cycle両方なら100cycleくらいかかる

373:Socket774
11/11/28 19:27:51.22 4zQT3kTK
>>372
把握

しかしFXのインターコアレイテンシでかいな・・・
昨日Sandraで計ったが棒グラフが飛び出してやがる

374:Socket774
11/11/28 19:29:37.91 cYUakT45
いつもメモリアクセスが足を引っ張る。

375:Socket774
11/11/28 21:38:22.70 OvAxwLmt
ここにはSFCのCPUは64KB×256バンクと書いてある

URLﾘﾝｸ(www.d-colors.net)

376:Socket774
11/11/29 10:32:45.64 ESmoCS4I
65816は24ビットアドレッシングに対応してるんだよね?
64180みたいに、64KB空間内に別のアドレス領域を呼び出す形じゃないと
バンク「切り替え」とは呼びづらい印象

377:Socket774
11/11/29 18:45:38.37 V664wuwR
65816は一部のアドレッシングモードで24ビットリニアアドレスに対応している
>>369のリンク先が正確

かなり嫌なCPUだった

378:Socket774
11/11/29 18:59:50.87 BsFBzaDa
マルチコアから高性能コアで進化を目指すインテルのCPU
URLﾘﾝｸ(plusd.itmedia.co.jp)

379:Socket774
11/11/29 19:03:54.17 V664wuwR
でもないな
スタック相対アドレッシングが二つ抜けている

380:Socket774
11/11/29 19:13:37.34 s/l3GAGD
>>378
うん
やっぱこの企業アホだわ・・・

381:Socket774
11/11/29 19:25:33.48 V664wuwR
と、中卒ひきこもりが申しております

382:Socket774
11/11/29 19:35:17.22 BsFBzaDa
ID:s/l3GAGD

Socket AM3/AM3+マザー総合 Part4
596 ：Socket774[sage]：2011/11/29(火) 01:18:48.37 ID:s/l3GAGD
>>595
オンボならソレくらい大目に見てやれよ・・・
価格から言えばC/P最強なだけある

それでもBulldozerを買った漏れは豪傑
588 ：Socket774[sage]：2011/11/29(火) 01:21:01.38 ID:s/l3GAGD
>>586
俺貴族か
なら貴族らしく憐れな民をAMDへと導いていかねばならぬな

【AM3+】AMD FX総合 2台目【Bulldozer】
481 ：Socket774[sage]：2011/11/29(火) 11:23:00.18 ID:s/l3GAGD
k15statはよ

【AM3+】AMD FX総合 2台目【Bulldozer】
489 ：Socket774[sage]：2011/11/29(火) 17:46:39.65 ID:s/l3GAGD
>>486
実際はCPUとかの場合色々と要素があるから単純にはいかないけど
まぁ大まかにはそうだね

それでもBulldozerを買った漏れは豪傑
603 ：Socket774[sage]：2011/11/29(火) 19:06:50.68 ID:s/l3GAGD
>>601
同感

マジな話、自身で使ってみるまでわかんねぇ

383:Socket774
11/11/29 21:57:03.94 M4jKqbzM
CPUは1Gヘルツぐらいにクロック周波数を抑え、
コアを16コアぐらいにした方がいいんじゃないの？

384:Socket774
11/11/29 21:58:08.94 q0VU5NZY
つ「シングルスレッド性能」

385:Socket774
11/11/29 22:09:19.79 P5LxLEmN
処理にはほぼ必ず並列化できない部分があり、アムダールの法則により、
シングルスレッド性能は依然として重要。
メニーコアCPUの代表・SPARC T1は1.4GHzの低クロックコアで始まったが、
最新のT4では3.0GHzの「普通の」コアになっている。

386:Socket774
11/11/29 22:11:13.10 lRNv0DQ2
EPIC+OoOEでも1GHzじゃC2Dに負けるな

387:Socket774
11/11/29 22:30:11.28 M4jKqbzM
>>384-385
だよね。
OSやソフトが必ずしもマルチコアに対応しているとは限らないから。

388:Socket774
11/11/29 23:14:17.83 rW23Gh8f
PGの立場からすると性能を上げるためのマルチスレッドって難しいし面倒なんだよね
排他処理だとか同期だとか何だとか
GPGPUが何だとか騒がれててもなかなか一般用途に降りてこないのはそのせい

GPGPUを本気で普及させたいなら、勝手に並列化してくれるコンパイラが必須だと思うわ
何も考えなくても勝手にMMXやSSE使ってくれるIntelコンパイラみたいにさ

389:Socket774
11/11/29 23:24:05.91 AXPxuOSq
ICCはそんなに賢くないよ。使ったことあるの？
SIMD化できるのは単純なループ位
まともにSIMDを活用するにはintrinsicsを使わざるを得ないのが現状

GPUを使った自動アクセラレーションとか実用には程遠い
OpenMP程度のセマンティクスすらGPUコードの自動生成とかできない
そもそもGPUでまともな性能を出すためにはアルゴリズムから調整しなおす必要がある
GPUにポートしたのにCPUよりワットパフォーマンスが悪化するなんてことは簡単に起きる

どうせ人力が必要ならせめて書きやすくしたいよねってことでC++AMPとかが提案されている

390:Socket774
11/11/29 23:41:46.71 s/l3GAGD
>>381
残念ながら高卒だ
まぁアホなのは自他ともに認める

391:Socket774
11/11/30 00:37:54.44 U/q7yGsd
先日のIDFでIntelはCilk Plusをアピールしてたな
Xeon用のコードを書いておけばMICへの対応はリコンパイルだけで良いと

392:Socket774
11/11/30 00:39:55.06 5tFd22DD
>>390
正直でいいなｗ
まあ統計では高卒以下って決して少数派じゃないんだけどね。

393:Socket774
11/11/30 01:13:54.75 Dw2YNB+j
>>378
Intelすげぇな･･･
わくわくしてきたぞ。

394:Socket774
11/11/30 02:14:33.62 sDhY0nUo
スマートフォンや組み込み向けでGPUを積極的に利用する動きが盛んだから
そこから逆輸入される展開もありじゃね

395:Socket774
11/11/30 17:48:59.46 LwEgcoZn
ゲームにしか使われてないじゃん

396:Socket774
11/11/30 20:15:28.61 j5ymgfwb
米クレイ、京大からスパコン受注　富士通「京」に競り勝つ
スーパーコンピューター専業の米クレイ（ワシントン州）が、京都大学の次期スパコンを受注した。
学術情報メディアセンターに納入、2012年５月に稼働させる。旧帝大７校が海外製スパコンを主要機種として採用するのは初めて。
京大は1969年以来、富士通の牙城だった。受注額は外部記憶装置などを含め40億円未満。クレイは今回の受注を機に、国立大学や公共研究機関への販売を強化する。

397:Socket774
11/11/30 20:25:41.66 aBgYbdRO
>>388
ソフト屋さんでもマルチスレッドってそんなに難しいの?
俺はBASICやC、Javaの基礎しか知らないタコなんだけど。

マシンを会社組織になぞらえて、この処理は山田さん（山田スレッド）、この処理は鈴木さん（鈴木スレッド）
忙しいときにはみんなで手分けする、呼び出し（メッセージ）をやり取りして。
単純だけど大量の処理は下請けの爺費有(GPU)さんに外注する。

そんな素人の考えじゃだめなのかな

398:Socket774
11/11/30 20:56:23.47 5mvHBE8Z
>>397
山田さんの仕事の結果次第で鈴木さんの仕事が変わるような処理が多い

399:Socket774
11/11/30 21:27:41.42 sDhY0nUo
>>395
んなこたぁない
普通の操作の画面遷移にGPU支援使うのはもう当たり前になって来てる
GPGPUもどんどん使っちゃおうぜって流れも

400:Socket774
11/11/30 21:31:29.94 BSOM0wor
>>397
「アムダールの法則」
www.ne.jp/asahi/comp/tarusan/AMDAHAL.jpg

401:Socket774
11/11/30 21:41:50.37 BSOM0wor
間違えて画像だけのそれも不完全URL張ってしまった…

古いがわかりやすいブログ記事
URLﾘﾝｸ(www.ne.jp)
同トランジスタ数でコア数を変えた場合の性能グラフ
URLﾘﾝｸ(www.ne.jp)
HTやBulldozerのような手法が有効な理由のグラフ
URLﾘﾝｸ(www.ne.jp)

402:397
11/11/30 22:02:46.68 aBgYbdRO
進捗報告会議・対応再検討スレッドも必要になるのか
動的にコードを書き換えて再コンパイル・リンクみたいで訳わからなくなるわ

403:Socket774
11/11/30 22:07:08.66 +rXwWkIl
>>396
クレイってことは、これOpteronなのか？

404:Socket774
11/11/30 22:09:59.15 2uIjQAjY
>>397
> 忙しいときにはみんなで手分けする、呼び出し（メッセージ）をやり取りして。
手分けする処理を予め決めておかないといけない
呼び出しあってﾃﾞｯﾄﾞﾛｯｸが発生するとｱｳﾄ

とはいえ、ﾏに任される現状のままではﾏﾙﾁｽﾚｯﾄﾞ化は進まないね。
ｺﾝﾊﾟｲﾗやﾊｰﾄﾞの支援も欲しい。
依存関係がなくて空きコアがあれば、自動でｽﾚｯﾄﾞを分ける、
くらいのｺﾝﾊﾟｲﾗとﾊｰﾄﾞは作れるはず。

405:Socket774
11/11/30 22:14:42.80 6LhwoOoq
仮想化サーバのように、無関係な処理を持ってこない限り、
依存関係がない、ということは無い。

406:,,・´∀｀・,,）っ-○○○
11/11/30 22:29:33.52 BLsBPrps
>>403
Xeonもあるからなぁ。
Magny-Coursからのアップグレードならともかく、Opteronを今選ぶ意味ってあんま無い気がするんだが。

407:Socket774
11/11/30 22:30:14.73 oo875wwP
>>404
C言語の仕様で依存関係の有無を判定するのは無理だろ
ポインタで指された先の領域がどこかでオーバーラップしてるかもしれないんよ

408:Socket774
11/11/30 22:32:01.92 oo875wwP
>>406
XE6らしいよ
URLﾘﾝｸ(dreammakerk.blog92.fc2.com)

409:Socket774
11/11/30 22:56:30.75 QJ/zeYrz
2位じゃダメですね、入札も

410:Socket774
11/11/30 23:15:21.40 jT2q8XBk
>>397
マルチスレッド自体は別に難しくないぞ
山田さんが営業して、鈴木さんが電話番して、佐藤さんが会計処理するみたいな感じなら

難しいのは3人で分担して会計処理をして早く仕事を終わらせろって言われた場合
分担をきちんと決めておかないと作業が重複して無駄になるし、
二人以上同時に同じ書類を見られないから、誰かが使ってたら使い終わるまで待たなきゃいけなかったり
Aを処理するためにはBとCの情報が必要で、Bを処理するためにはDを…なんて場合もあるし

そういった諸々を勘案してプログラムを作るのが面倒くさくて難しいってお話

411:Socket774
11/12/01 15:14:20.44 Do65qa+4
64kBの頃にはメモリーを確保するのに少しの量、少しの期間の占有も
無駄は省かなければ、みたいな感じがあったが、
今、メモリーを少し余分な期間や分量を確保してもあまり気にしていない
プログラマは多いだろう。保守性の高さとか、メモリー最適化よりも
優先したいことことがいくつか考えられる。

今はせいぜい1ソケット20スレッドくらいだから、どのスレッドも常に
フル稼働するのがハードを生かすよいソース、と考えている。
もしも使えるスレッド数が数桁ほど増えたら、立ち上げたスレッドに
暇そうにしてる時間があってもあまり気にしなくなるかもしれない

412:Socket774
11/12/01 15:36:56.78 wde0wUa6
リッチコアはコスト高いが、
メニーコアのインターコネクトはもっとコスト高い。

413:Socket774
11/12/01 15:37:35.92 Do65qa+4
>>403
12年のはOpteronだな。予定通りに14年に追加があるならそっちは
インターコネクトがPCI-EのCascade だから、その時点で性能のいい方になるだろう

414:Socket774
11/12/03 02:14:38.21 0PWAawPk
ﾌﾞﾙの評価が、意外と悪くない
URLﾘﾝｸ(news.mynavi.jp)
大原評

・サーバ用のCPUとして使う限りはSandyに匹敵する性能
・これをデスクトップPC向けに流用したことが論外、暴挙。
みたいな感想が書かれている。
デスクトップPC用のCPUとして使う限り、PhenomIIと比べても少し劣る性能しか出ない。とね。

415:Socket774
11/12/03 02:35:04.73 go6ULmKY
大原自身は最初のころより随分発言が変わってるけどなｗ

URLﾘﾝｸ(ascii.jp)

＞独立した3つのALU命令と3つのLoad命令であれば、実質1.5サイクルで処理できることになる。
つまり、単純に「IPCが減った」と言い切れない構成に変わったわけだ。
Load命令＋ALU命令であっても、実質的なスループットはむしろK10よりも向上する可能性が高い。

それが

＞本来ならIPCが3→2に下がっているのだから、これを補うためには動作周波数を50%引き上げる必要がある。

416:Socket774
11/12/03 03:14:49.56 OjyaBmr3
庇おうとして庇いきれなかった
最低限現行アーキテクチャと同等の性能はあるだろうという低めの予想をも下回った

417:Socket774
11/12/03 03:16:16.80 dcYG1PdD
1年くらい前はAMD自身がK10→BullはIPCも向上するって言ってたから

418:Socket774
11/12/03 04:07:35.11 cj9P9sX8
実行ユニットが減ったから2命令でぴったり張り付いてるグラフはある意味笑えた

419:Socket774
11/12/03 06:50:25.61 2a8NDgog
相変わらず長い

420:Socket774
11/12/03 13:36:44.51 qVme7aJ5
噂: 3GHzCPU、768MBRAM…国内開発者がWii Uの具体的なスペックをリーク
URLﾘﾝｸ(gs.inside-games.jp)

421:Socket774
11/12/03 14:17:45.46 Jvwn3hJZ
G3系と970系で若干違うとはいえ
Broadwayの拡張がXenon風PowerPCのクアッドというのはわかりやすいが、
DRAM内蔵等で差異化できないと
本当にXbox360を遅れて出しただけになってしまうな。

422:Socket774
11/12/03 14:23:15.09 2a8NDgog
PCの派生品で作るようになってからまるで面白くなくなったなゲームコンソールも
OSも順調に重くなってるようだし

423:Socket774
11/12/03 16:59:42.34 MGMqsxof
2Gbitチップを3枚か4枚重ねたら768MBか1GBだし
噂が本当ならダイスタックなんだろうな。
でも45nmなら熱が多いし、スタックはDRAMだけでCPUとはMCMかも

424:Socket774
11/12/03 17:51:34.52 OjyaBmr3
そういえば、Broadway製造元のこんな話を読んだばかりだった。

URLﾘﾝｸ(www.geocities.jp)
>　2011年12月1日にIBMとMicronは，IBMがMicronのHybrid Memory Cubeを製造すると
> 発表しました。製造プロセスは32nmのHigh-K Metal gateで，IBMのEast Fishkill
> 工場で製造されます。

任天堂は必ず変なメモリを積んでくるが、まさかなあ……

425:Socket774
11/12/03 18:24:39.35 cj9P9sX8
いままで1T-RAMとかeDARMとか実績たっぷりすぎるし容量より速度取るとか2012年に出すにはメモリ少なくねとかほんとにやりそうで怖い

426:Socket774
11/12/03 20:36:14.85 VsY2lY6Z
チョニーと任天堂は変なメモリを積む上に容量を少なくするから、
PCでのゲーム製作技術が応用できないし、
少ないメモリ容量をやりくりする事に終始するので最悪。

PCで主流となっている汎用メモリをたくさん積むのが一番良いのに何故それをやらないのか？

427:Socket774
11/12/03 20:43:42.76 XhgvODwK
容量より帯域

428:Socket774
11/12/03 20:47:44.78 0PWAawPk
>>426
たぶん、PCとは比較にならんほどにコスト削減圧力が強いからだろう。

と思うのだが、PS3とかの値段を考えれば、もうちょっとメモリ増やせって思うのが普通だよな。
出現当初はともかく、今もこの値段っていったい... とついつい考えてしまうレベル。

PC用メモリが今のように格安で売られる時期には特に強く思う。

429:Socket774
11/12/03 20:56:39.56 1Vwxncur
発売時期も勘定にいれなよ

430:Socket774
11/12/03 21:07:44.51 78eB8o52
ヘテロジニアスだとか新CPUをギリギリまでコストかけて頑張っても
そのしわ寄せコストの折り合いでメモリサイズまでギリギリじゃ
開発者にいったい何をやらせたいのか
片手落ちもいいところ

431:Socket774
11/12/03 21:40:23.95 MGMqsxof
やっぱ帯域のために容量は絞り込んでると思うな

PCでメインメモリが遅いのに見栄えのいいゲームができるのはGPU-VRAM帯域が
広いからと、CPUが多くのキャッシュを積んでメインメモリの遅さを
隠蔽しているから。キャッシュのふんだんなCPUはダイが大きくなって
高くつくし、VRAM専用帯域を設けるハードもチップ数が増えて高くつく。
PS3を企画した頃のようなコストのかけ方は今は難しいだろう

432:Socket774
11/12/03 22:05:01.06 pHu+kt/h
変なメモリを使うのはDDR3とかだと帯域稼ぐのにビット幅を増やさないといけないからだよ
ビット幅を増やすとボードのコストにそのまま跳ね返るから

コンシューマゲーム機は長い期間で大量の部品を調達するから
変な部品を使う方がまだコスト削減できる

433:Socket774
11/12/03 22:15:45.52 LgGuUF7E
PS3や箱は良い線いってたと思うけどな
まだPS2時のHL2みたいなソフトがPCで出てきてないし
新ハードは何処も厳しそう
頓挫した物理演算チップとか変化球で載せてこないか期待してるけど
それなら部品数削ってGPUに金かけた方がよさそうだし

>>432
初期の箱のGDDR3配線はぐちゃぐちゃだったな
PS3のGDDR3はGPU上に載せてたけど、メモリクロック下げたんだっけ

434:Socket774
11/12/03 22:18:49.02 K/AEA7Z2
ゲハは無知なんだから黙ってろ

435:Socket774
11/12/03 23:10:16.28 EXilt/Jd
ゲハすぎるわ

436:Socket774
11/12/04 00:39:59.81 QVduBP7n
そもそもPCじゃないんだからメモリ容量そんなにいらない。

437:Socket774
11/12/04 00:48:37.27 oCAY8S/P
>>436
少ないだろバカ

特にPS2とPS3は酷すぎる

438:Socket774
11/12/04 00:55:39.34 JJWNyvSc
RING基板は1GBらしいから少ないけど全然ダメという少なさじゃない。
とはいえ、アップグレードせずに数年使い回すのだから1GB越えるくらいじゃないと。

439:Socket774
11/12/04 01:40:45.81 qd4UWlbn
PSPも初期設計どおりeDRAM 8MBのみだったらいまごろ楽しかっただろうな

PC-FXにはメインメモリの増設スロットがあったなそういえば

440:,,・´∀｀・,,）っ-○○○
11/12/04 11:55:28.57 i89MGNmc
>>417
IPCが向上するなんて言ってないぞ。シングルスレッド性能が向上するとは言ってたが。
（もちろん「XOPやFMA4などの新命令を使わずにできる」なんてことは言ってない）

441:Socket774
11/12/04 12:23:56.34 Rre4N0Rl
コンソールはハード決め打ちなこともあって
メモリが足りないのは工夫すればなんとかなるんだけど
帯域とかレイテンシはわりと工夫の余地がなく、致命的に表現を制約するんですよ。
5年同じハードを使い回す≒工夫に費やす時間の猶予はある、という観点で
容量よりも性能が優先されがちです。

442:Socket774
11/12/04 13:20:44.26 wx/hqeKO
K10をFMA4やXOP、C6ステートに対応させりゃ良かったんじゃねというのは禁句なんでしょうか（´･ω･｀）

443:Socket774
11/12/04 14:00:59.47 QMlML57q
>>442
TimnaのためにP6の要素を分解して再構成したチップをつくり、
さらにBaniasへと進化させたイスラエルチームのような別チームをAMDが持つ余裕があれば、
並行してそういうのを作ることもできたんじゃないの？

444:Socket774
11/12/04 14:30:59.65 Qtx7SijC
鯖用とPC用に異なるアーキテクチャのCPUを並行開発できないAMDの弱点が、
Athlon64では逆に有効手になってたけど、
今回のﾌﾞﾙでは順当にデメリットが大噴出した。

ということだよね?

445:,,・´∀｀・,,）っ-○○○
11/12/04 14:56:28.12 i89MGNmc
>>442
Llanoが未だにSSSE3すら対応してない（Core 2登場から5年も経ってるにもかかわらず）。
あのデコーダ改良できる人いないんじゃないの？

446:Socket774
11/12/04 15:39:32.86 ekxDfIq4
作った本人以外でも改良できるような骨太の開発体制の構築って難しいよな
中小企業はどこも苦労していると思う

447:Socket774
11/12/04 17:03:24.04 u38wn0LR
COBOLが思い浮かんだ俺。

448:Socket774
11/12/04 18:38:29.17 YSZkohac
>>440
IPCが上がると言ってるぞ
URLﾘﾝｸ(www.xtremesystems.org)

449:Socket774
11/12/04 18:43:42.34 ekxDfIq4
モジュールあたりのIPCだったんだよ！！！１！

450:Socket774
11/12/04 18:50:38.73 3uqlOV77
な、なんだｔｔ(ry

451:Socket774
11/12/04 19:43:44.26 wx/hqeKO
>>446
ファブレスになった以上最早R&D部隊の確立無くしてAMDの存続は成しえないから頑張ってほしいなぁ

まぁあの取締役会だからこれからもお馬鹿な決定をいっぱい寄越してくれそうだけどさ・・・

452:Socket774
11/12/05 20:40:01.96 w2YwVfa9
>>441
でもPS3でXDRAMを採用した事は評価できない。
当時からDDR3SDRAMは存在していたし、
今でもDDR3SDRAMが現役。

453:Socket774
11/12/05 21:05:19.37 ZQ/O2CSZ
>>452
当時のDDR3じゃPS3のXDR RAMの帯域出せないだろ

454:Socket774
11/12/05 21:07:11.74 iGMiZNca
黄石。

455:Socket774
11/12/05 21:21:04.85 w2YwVfa9
>>453
メモリは帯域よりも量が重要だよ。
PS3はメモリの量の少なさが足枷となり、
ライバルのXBOX360やPCゲームに勝てないし、
少ないメモリをやりくりする為にソフト開発費が高騰している。

456:Socket774
11/12/05 22:37:26.00 pEGnq++x
1チップの帯域とシステムの帯域。ゲーム機はコストがタイトで
チップ数を減らしたいから、同じ容量、同じシステム帯域でもチップ数が
少なくなる速いインターフェイスを選ぶ。

457:Socket774
11/12/05 22:48:08.31 5plYKqOo
バカが沸いてるな

458:Socket774
11/12/05 22:52:28.70 CgxaGLhl
少なくとも、456の言うような考え方でハードを作ってる会社があるのは事実だと思うんだ。
その方向性が妥当かどうかとは別問題として。

その奇抜な発想が突き抜けていたのがPS2のローカルメモリのビット幅の広さ。

結局、後継ハードで互換性を確保できなくなった原因でもあるんだろ?
それに、時間が経つと製造コストが下がる、はずがなぜか下がらなくて赤字を出しやすかったり。

459:Socket774
11/12/05 23:13:08.93 si5ddA9c
PCを超えるゲーム機は出ないってことになる
ま、アーケードで唯一がんばてるtypeXがPCだしな

460:Socket774
11/12/05 23:47:25.77 K5X7vRTH
戦いは数だよ

461:Socket774
11/12/05 23:57:03.75 iGMiZNca
PCは金かけただけ良いグラフィックスで楽しめるのがイイなぁ。
この拡張性は魅力だよ。
選択肢は多いに越したことない。

462:Socket774
11/12/06 00:11:38.96 vpYBVsuC
登場時点でハイエンドPCより描画性能が高いというのはPS2が最後だったからね

PS3/XBox360以降のコンシューマゲーム機のアドバンテージは
１）同一性能であれば低コストであることと
２）PCでは最低限遊べる環境を低めに設定する必要があるがその必要がないこと

今後数年でIntel内蔵GPUが十分な性能を持つようになれば
ゲームを遊べるレベルのＰＣが普及することになるので
これらのアドバンテージは消失する

となるとあとはさらに高性能に逃げるか特殊なUIで差別化するしかない
でもMSはKinectをPCに開放してるしあまりゲーム機本体に囲い込む気はなさそう

463:Socket774
11/12/06 00:16:44.27 ZOtQUQa5
３）電源とゲームメディアを入れるだけでゲームが出来る

これ、大きいぞ。子供でもお年寄りでも簡単にできるからな。

464:Socket774
11/12/06 00:22:12.88 V03LSFq0
しょぼい考察聞かされる身にもなれよ
2＋1個しか挙げられないってどんだけ低能だよw
ゲハはおとなしくロムってろ

465:Socket774
11/12/06 00:34:31.53 eRNtx7t8
取り敢えずPCあればゲーム機イラネ

466:Socket774
11/12/06 00:42:14.71 ICZgaaMK
>>465
ゲーム機用のソフトの大半がPCでもプレイ可能な状況じゃなけりゃ
そもそも二択が成立しないんだが

467:Socket774
11/12/06 00:43:54.96 ooBSftg1
そうなった今ゲーム業界側はどういうハードを構想するべきなのかね。
PCのGPUが高速化しちゃった今ゲーム向きに差別化できるCPU・GPUは何か。

まあやりようがないってのが答のような気もする。

468:Socket774
11/12/06 00:44:07.33 nkntBAEY
>>462
VRAM4MBのゴミのどこがハイエンドなんだよｗ
一年以上前に発売されたドリームキャスト以下のメモリ容量。

>>463
＞３）電源とゲームメディアを入れるだけでゲームが出来る

PS3と箱○のソフトは、電源とゲームメディアを入れるだけでは遊べないから糞
家庭用ゲーム機のアドバンテージを自ら放棄している

469:Socket774
11/12/06 02:00:00.06 +sMuGSqC
まあ、GSはシェーダ以前の古典的なハードで
フィルレート=帯域命の設計だからな

470:Socket774
11/12/06 05:39:52.78 HMCNVH6p
DirectX7の世代の範囲で、
速度を優先して機能を削減したような構造だよね。

テクスチャを張ると速度半減ってのも大きな制限の一つだけど、
VRAM容量が小さすぎるからテクスチャを利用すること自体が困難だから、
速度半減という弱点は実質的にはあまり関係ないか。

カタログスペック通りの高性能を発揮させるためにはすさまじく労力が必要な厳しい構造だったんだよな?

471:Socket774
11/12/06 08:27:01.95 qsGC0f82
>>462
そもそも性能の要らない2DゲームみたいなものだってPCでやる人は少ないわけで
コスト云々以前に市場がない気が…
ハイエンドなんて志向する客はさらにほんの一部なんだから、高い金出してグラボ買ってね！で棲み分け出来てると思う

472:Socket774
11/12/06 20:27:53.02 nkntBAEY
PS2の糞仕様の所為で、どれだけ多くの日本のソフトハウスが潰れ、
どれだけ多くの日本のソフトハウスが開発能力や競争力を失ったか知れない。

473:Socket774
11/12/06 20:29:47.18 nkntBAEY
>>471
廃スペックゲーム機が生き残る道は、
アーケード筐体と同じアーキテクチャを採用し、
業務用のソフトがそのまま家庭用でも動くみたいにしないと厳しいね。

でも、今だともうネオジオみたいなやり方は利益を出せないだろうな。

474:Socket774
11/12/06 20:39:15.12 OAsF2Vhf
いつからここはPS2を叩くスレになったんだ

475:Socket774
11/12/06 23:02:34.54 JfSoh2Tt
>>473
アーケードってx86のCPUかつNvやAtiのGPUなどPCのシステムそのものか、それに近い仕様で動いてるやつ多いみたいだぞ。
しかもハイスペックでも何でもない感じで

OSもWindows系を使ってたり

476:Socket774
11/12/06 23:19:18.85 3QucKl2k
アーケードは全部Winだよ
コスと考えたらあたりまえだけど

477:Socket774
11/12/06 23:27:50.39 CrERfVp2
eX-BOARDはC7とCN700（UniChrome）

478:Socket774
11/12/07 01:33:59.16 o3fwvsWW
久夛良木健氏が語る、PlayStation 3とCellの正体
URLﾘﾝｸ(pc.watch.impress.co.jp)

＞[久夛良木氏] 　次は面白い。(PS3は)ただ垂直(ネットワークしない状態)で見て、
＞単なるゲーム機だと思ってやってもすごいと思う。

＞だから、(ソフトウェア開発が)ナイトメアにならないようにしないと……。

ナイトメアになっちゃったね。

479:Socket774
11/12/07 13:48:40.43 pqQ/Om99
今のアーケードマシンって随分化石染みたスペックの物使ってるんだな｡
ハイエンドでも。まあ組込み系だから当然だけど｡

480:Socket774
11/12/07 19:04:32.16 9pABluLs
アーケードは一台あたりにかけられるお金が違うし、逆に台数は出ないから
ハイスペックな汎用PCそのもの方がいいに決まってるだろ。

481:,,・´∀｀・,,）っ-○○○
11/12/07 21:47:20.51 xKk7Jj7U
PCとは違って連続稼動が求められるから多少はPCよりは周回遅れの「枯れた」パーツ使うことになるね。

といっても組み込み向けとして売られてるCPU・チップセットって現状、型落ち品を
高く売りつけるための手段になっている気はする。
（最新プロセスのCPUは連続稼動に耐えられるほど安定してないなんて言っちゃったら
Xeonは誰も買いません）

482:Socket774
11/12/07 22:10:00.73 Mefp1xgV
組み込みマザーボードメーカが
ASUSみたいなメーカみたいに
神速で作れないだけだろうと思う

483:Socket774
11/12/07 22:47:20.51 V9HR29/A
劣悪環境前提ってのも考慮に入れてな

484:Socket774
11/12/07 23:24:51.32 cbOImle5
PCゲーや家庭用ゲームがこれ程発達した現代では、
既にアーケードゲームの存在意義は無くなったと言っても過言じゃない。

485:Socket774
11/12/07 23:41:54.62 tic2SsQx
大型筐体ゲームを家に置きたいとは思わんがな。

486:Socket774
11/12/07 23:42:57.40 cbOImle5
しかも一台で自動車が買える程の値段がする
問題はアーケード筐体の方で、家庭用ゲーム機である程度代替できてしまう

487:Socket774
11/12/07 23:58:26.43 JeHEETRm
>>483
そこだよな、なるたけ消耗系部品点数を削りつつ必要なレベルを維持できないといけない
その上原価も安く・・・となると最新は・・・

488:Socket774
11/12/07 23:58:33.28 qU5C+c1o
かなり以前からゲーセンの主役はプライズやメダルや体感筐体機で
ビデオ表示性能を誇示する時代じゃなくなってるし。

489:Socket774
11/12/08 00:16:27.21 pgKkSncP
あとは特殊な機材が必要なヤツとか。
三国志大戦とかWCCFとかガンダムカードビルダーのようなカードゲームや
戦場の絆みたいな体感ゲームとか。

見れば見るほど特殊なCPUやらアーキテクチャーは必要ないな。

490:Socket774
11/12/08 00:20:39.82 Z5x4kOaj
Teslaとか載せて家庭用PCとは一線を画するハイエンドスペックを実現して、
それで高いインカムが確実に望めるならそうするだろうけど、
あんまり期待できないよね……
客にアピールするのは、幸か不幸かそこじゃない。

491:Socket774
11/12/08 01:00:46.86 2klS0qwD
京を繋いでゲームを作ったら良いんじゃね？

492:,,・´∀｀・,,）っ-○○○
11/12/08 03:51:49.02 s0p69/Mg
15年位前にゲーム雑誌で読んだけど北米じゃ一番近いゲーセンまで10kmなんてことも珍しくないそうな
（人口密度の高い日本ですらかなり潰れてるし今はもっと酷いんじゃないのか？）

巨大冷蔵庫に食料大量に詰め込むのと同じ感覚でゲームに金かけるのがゲーム大国アメリカ

もっとも、その消費志向も変わりつつあるけどね。
丁度日本のコンビニみたいな品揃えの小型店舗が増えてるらしい。

493:Socket774
11/12/08 08:17:36.36 fiRGPmzm
へぇ～、たしかにアメリカでゲーセンってイメージないなぁ。

494:Socket774
11/12/08 08:33:16.10 Z5x4kOaj
映画のTRON見てよ

495:Socket774
11/12/08 09:17:13.35 x69JnpA9
>>485
格闘ゲーやシューティングゲーで使われるような筐体なら重さ100Kg(家庭用400L冷蔵庫と
同じぐらいの重量)だから、工夫すれば家に置けないこともない
(ただし幅が70cmはあるから、分解しないとだめだな)http://
>>492
海外でゲーセンあると、ストリートギャングや麻薬売人の類がたむろして
治安的にもよくないからゲーセンがあまりないと聞いたが？

後、今はx86CPUでコプロのx87など使わなく、FPU性能もSpecCPUベンチを
見る限りじゃ他アーキと遜色ないのに、「x86=FPU遅い」の扱いをされてるのは
何故？

496:Socket774
11/12/08 09:24:02.09 Z5x4kOaj
レジスタ8-16本しかないからじゃない?

497:Socket774
11/12/08 11:52:33.51 ot2kYU6c
>>495
固定観念て奴ぢゃね？

498:Socket774
11/12/08 12:55:55.72 npraXjtK
日頃の行いだよ
必要な命令を載せるよりクロック上げる方を優先すんな

499:Socket774
11/12/08 13:24:07.50 PZTbgDbu
浮動小数点演算が主用途と割り切って128bit×128本とか載せてるやつに比べれば
そりゃ遅いよね。しかし汎用CPUである限りはレジスタをむやみに増やすわけにもいかず。

500:Socket774
11/12/08 14:16:16.65 x69JnpA9
>>496
Pen4以降は物理「レジスタ増えてる
>>498
x86はCISCだから命令の数は多い
>>499
おそらくCELLのことを言ってるのかな？
しかし、CELLのSPE1つの浮動少数性能はいくつかのサイトを見ると実効で
23Gflopsでこの数値はCore2 1コア分のFPU実効値22Gflopsとあまり変わらない

そうか、CPU関連のサイト製作者は何気にアンチx86RISCマンセーみたいな人が
多いから、叩きたいだけのかも。

501:Socket774
11/12/08 17:09:11.57 VIBtiN/+
なに勝手に結論出してるの、ダイサイズ考えろよ

>>499の考えで問題ないだろ

502:Socket774
11/12/08 17:45:45.30 zjTFlDhH
DreamcastのSH4のSIMD
PS2のVU
PS3のCell
とゲーム機向けのCPUは当時としてはFPUにリソースを割いたものが多かったからな

503:Socket774
11/12/08 18:37:59.65 pgKkSncP
いっそ中国の新型CPUを使ったゲーム機とかでたら面白そうだが。
GPUどうすりゃいいのかわからんけど。

504:,,・´∀｀・,,）っ-○○○
11/12/08 21:30:00.19 I95SPawS
>>499
別に遅かないよ。
i7-2600あたりでDGEMM 100GFLOPS出せるし実効性能はかなり高い。
SIMDの物理レジスタは百数十本とかあって、リネーミングして並列動作させてるから
FPの稼働率を高められる。
むしろ論理レジスタが少ない方が動的スケジューリングしやすいんじゃなかったかな。
（いまやC++ネイティブと遜色ないパフォーマンスを得たJavaVMなんか1レジスタのスタックマシンだし）
安藤さんとかは故意にこのあたりをミスリードしていると思う。

505:Socket774
11/12/09 00:22:11.85 h+0V9M4A
>>504
団子のそのレスも故意にいろいろミスリードしてません?

506:Socket774
11/12/09 00:26:06.36 2o4dp7+U
>>503
爆発するから気を付けないといけないな

507:Socket774
11/12/09 01:04:24.56 d+Ytikgd
>>506
そっちでも面白いけど、ゲーム機になってない主要RISCってAlphaとSPARCだろう。
SPARC独自実装してる富士通かAlphaパクった中国に新ゲーム機を期待したい。

508:,,・´∀｀・,,）っ-○○○
11/12/09 01:07:59.26 HaOcUE8E
>>505
レジスタリネームを備えたアウトオブオーダ実行型のアーキテクチャだと
論理レジスタ本数の多い少ないはそれほど性能に影響しないね。

インオーダのAtomとかなら確かにレジスタ16本じゃ性能出すの辛いって思うけど。
でもそれこそどうにでもなるんじゃね？
巨大論理レジスタを表現するためのオペランドフィールドを増やすとか可変長のx86のほうが柔軟に出来ると思うけど

SPARCのISAは1オペランドあたり5ビットしか指定フィールドがないからさ、
京に採用されたHPC-ACEでは、前置命令に拡張フィールドの3ビット（×3フィールド×2命令分）を
収めることで、強引に256本のレジスタを表現してるわけで。

そういう手を使うならx86でも（プリフィックス新設すれば）可能だと思うんだよね。
実際MICはSIMDの論理レジスタを32本に増やしてるし。

509:Socket774
11/12/09 01:10:06.79 vkP4u9nJ
HPCで使われてgreen500で京より上にも入っているXeonは2GHz台、
デスクトップのパフォーマンスクラスは3GHｚ台、
他のプロセッサよりも電力的に有利な製造プロセスにも関わらず
デスクトップ並みのシングルスレッド性能の高い版では
greenで上位に入れないのがx86の限界

510:,,・´∀｀・,,）っ-○○○
11/12/09 01:17:13.26 HaOcUE8E
詭弁だな。
それを言うなら京のVenusも2GHzでインオーダ実行だからデスクトップPCの
シングルスレッド性能には程遠い。

x86なみにシングルスレッド性能の高いCPUを例示してみてよ。

511:Socket774
11/12/09 01:17:41.70 SlhJ+Auu
fmaddが無いだけ

512:Socket774
11/12/09 01:27:03.40 FbvidVGx
>>509
POWER6さんの悪口はそこまでだ

513:,,・´∀｀・,,）っ-○○○
11/12/09 01:28:02.96 HaOcUE8E
BlueWatersって事実上x86（MIC）に負けたんだよな

514:Socket774
11/12/09 01:50:44.94 vkP4u9nJ
>>512
でもPOWER7 は自身の最高クロックのままgreenで100以内に
いくつもランクインしていて、ある意味男らしい

515:,,・´∀｀・,,）っ-○○○
11/12/09 01:52:24.43 HaOcUE8E
SPECpower_ssjのほうには登録しないのがIBMクオリティ

516:Socket774
11/12/09 01:53:57.04 U2+rp+qb
,,・´∀｀・,,）っ-○○○ )´Д`；) Oh...

517:Socket774
11/12/09 03:04:51.91 I/NYD7pb
ワットパフォーマンス重視が頭打ちになったらどうするんだろうね…
現在のスパコン並のマシンがコモディティ化するだけかい?

518:Socket774
11/12/09 03:08:55.81 lvgCYANa
シュリンクや回路の最適化など製造面での進歩がメーカーを問わず全ファブまで行き渡ったら、最も効率的なアーキテクチャ以外の演算装置は淘汰されるだろうか？

519:Socket774
11/12/09 03:46:39.98 d/CXajCs
>シュリンクや回路の最適化など製造面での進歩がメーカーを問わず全ファブまで行き渡ったら
その前に非シリコン半導体が出てくるんじゃね
量子コンピュータはどうなんだろうな……

520:Socket774
11/12/09 04:01:21.34 3Q4MIBDJ
>>514
IBM「電力効率が悪いからPOWER7はPOWER6よりクロック下げます」
という経緯も知らないニワカは黙ってろ

521:Socket774
11/12/09 06:56:24.69 Na8JAD0m
>>510
え？普通にアウトオブオーダ実行だろ？

522:,,・´∀｀・,,）っ-○○○
11/12/09 07:33:15.87 HaOcUE8E
ああ、レジスタリネームが無いだけでOoOE自体はあるのね

523:,,・´∀｀・,,）っ-○○○
11/12/09 07:35:04.89 HaOcUE8E
いや、例のプレフィックス命令の作用考えれば広義の「リネーム」はあるか

524:Socket774
11/12/09 09:16:20.21 vkP4u9nJ
1995年　SPARC64（無印）　out of order
1995年　PentiumPro　out of order

525:Socket774
11/12/09 13:26:37.13 zgcIhzKZ
普通に論理/物理レジスタ 32/64、OoO、SMTだ

526:Socket774
11/12/09 15:33:41.83 h+0V9M4A
>>508
ARMさんもA64で増やしたし
論理レジスタは32本がミニマムじゃないかな?

527:Socket774
11/12/09 17:36:47.33 n+x5si1T
>>505
シッタカの団子にそんな芸当はできないよ

528:Socket774
11/12/10 00:58:37.09 liiZowda
論理レジスタが少ないとレジスタの使いまわしや早いフェッチの機会が少なくなるため、
物理レジスタがいくらあっても性能向上の余地は限られる。

整数演算ではあまり差はつかないが、きっちりスケジューリングされた浮動小数点演算では差が大きい。

529:Socket774
11/12/10 00:59:35.96 liiZowda
団子の書き込みの半分くらいはデタラメだと思えばいいね。

530:Socket774
11/12/10 01:18:22.16 +2qEBKmT
「団子氏」って「団子虫」に似てるね
「団子厨」って団子虫からきたのか？

団子虫
団子無視

531:Socket774
11/12/10 01:43:26.00 metW1VQM
物理レジスタが多ければ大丈夫っていうのは
あくまで論理レジスタだけでspllingなしでプログラムが組める場合だよね

あとRSのエントリ数はCore2で32・SandyBridgeでも54で
これはレイテンシの大きいFPU命令やＬ２アクセスを隠蔽するには不十分
まだまだソフトウェアレベルのスケジューリングの比重は大きい

532: 忍法帖【Lv=40,xxxPT】
11/12/10 02:23:29.00 C8DWaXpD
Haswellでもその辺の拡張は行ってくるだろうね
Core2→Nehalem→Sandyと各世代ごとで必ず強化されてる部分だしな

次ページ