CPUアーキテクチャについて語れ 20

CPUアーキテクチャについて語れ 20at JISAKU

CPUアーキテクチャについて語れ 20 - 暇つぶし2ch2:Socket774
11/10/09 08:34:43.13 pd6B4c1l
>>1のつ

パッケージはDIPで頼むわ
1000ピン超のDual inline packageは今にも動き出しそうでかっこいいぞ

3:Socket774
11/10/09 11:20:27.88 RmdgPw4r
>>1乙。

ヘテロジニアスマルチコアマンセー。

4:竹島は日本領土
11/10/09 17:31:28.47 ZNb+V1Ri
Qualcomm's New Snapdragon S4: MSM8960 & Krait Architecture Explored
URLﾘﾝｸ(www.anandtech.com)

5:Socket774
11/10/12 23:21:04.12 KaJQiQDm
492: Socket774 [sage] 2011/10/12(水) 15:24:37.43 ID:rgns2cVw (8)
国内レビュー

AMD FXシリーズ最上位「FX-8150」ベンチマーク
URLﾘﾝｸ(pc.watch.impress.co.jp)
遂に姿を現した8コアCPU「AMD FX」はCPUの覇権を握れるか？
URLﾘﾝｸ(ascii.jp)
Bulldozerは気難しい─AMDの新CPUアーキテクチャ“Zambezi”を試す
URLﾘﾝｸ(plusd.itmedia.co.jp)
「FX-8150」レビュー（前編）。ついに発進するBulldozer世代のCPU「Zambezi」はゲーマーの福音となるか
URLﾘﾝｸ(www.4gamer.net)
Bulldozer世代の8コアCPU「AMD FX」"Zambezi"徹底攻略 - 性能ベンチマーク編
URLﾘﾝｸ(journal.mycom.co.jp)

6:,,・´∀｀・,,）っ-○○○
11/10/14 01:06:02.24 yly8pXmE
デニス・リッチー死去・・・

7:Socket774
11/10/15 00:37:55.49 +GoXuSGa
この記事を読んでて今更気付いたんだけどBulldozerのトランジスタ数が20億っておかしくない？

URLﾘﾝｸ(www.xbitlabs.com)
>AMD publicly said that each Bulldozer dual-core CPU module with 2MB unified L2 cache contains 213 million transistors and is 30.9mm2 large.
(中略)
>As a result, all four CPU modules with L2 cache within Zambezi/Orochi processor consist of 852 million of transistors and take 123.6mm2 of die space.
>Assuming that 8MB of L3 cache (6 bits per cell) consist of 405 million of transistors,
> it leaves around whopping 800 million of transistors to various input/output interfaces, dual-channel DDR3 memory controller as well as various logic and routing inside the chip.

Tukwilaの総トランジスタ数が約20億なんだけど、そのうちの大部分に当たる14.2億は24MBのL3キャッシュに費やされてるんだよね。
一般にアンコアと呼ばれる部分(12ポートのクロスバ、2MBのディレクトリキャッシュ、QPIとFBDのI/Fとコントローラー)のトランジスタ数はわずか1.95億しかない。
粗っぽく仕様を比較するとこんな感じで、明らかにTukwilaのアンコアはBulldozerよりリッチなのでBulldozerがTukwilaの4倍以上もここにトランジスタを費やしてるとは思えないんだが。
Bulldozer … 4M, On-Chip-Memory 16MB(L3$ 8MB), HT 4ch, DDR3 2ch
Tukwila … 4C, On-Chip-Memory 30MB(L3$ 24MB) QPI full*4 + half*2, FBD 4ch,, Directory Cache 1MB*2

8:Socket774
11/10/15 01:16:53.86 +GoXuSGa
あ、ごめん。記事をちゃんと読まずに脊髄反射で書きこみした。xbitもBulldozerの20億は多すぎるって言ってるのね。(そこから設計に不備がある可能性を指摘。)

9:Socket774
11/10/15 03:56:38.28 NhgPmXsG
なんか面白い話が出てきたな
URLﾘﾝｸ(northwood.blog60.fc2.com)
Bulldozerが遅いのは手作業をやめて自動設計ツールに頼ったのが原因らしい

10:Socket774
11/10/15 04:47:59.92 +GoXuSGa
xbitの作文をスルーして読んだらアンコアが悪いとか、どうもそういう単純な話じゃなさそうだな。
AMDが本格的にファブレス企業へなってしまったような印象を受けた。
URLﾘﾝｸ(www.insideris.com)
Bulldzerは紙(企画書？)の上では素晴らしいチップだった。俺はBulldozerの物理設計が始まる前～物理設計中の時期にAMDで働いてたんだ。
俺に言えるのはBulldozerはそれ自体の魅力も薄ければIntelに対する競争力も無いってこと。
(何故なら俺はAMDの設計手法が全く駄目だと確信しているから。)
俺がAMDで働いてた頃、Bulldozerに何が起きたかは語りたくもないんだが…

何が起きたかって言うと、経営陣はクロスエンジニアリングを決定したんだ。
これは手作業でのCPUの設計を止めてSoCの設計手法へ移行しろってことだった。
この結果、パフォーマンスやダイサイズや効率性について色々諦めなきゃならなかった。　(DECのところ省略)
今までIntelとAMDは少なくともクリティカルな部分については常に手作業で設計してきた。
だがそれは俺の退社前には変わっちまった。AMDは論理合成、フロアプラン、配線等の自動化ツールに頼り始めてたんだ。
俺はAMDを辞める前の数年間は設計フローの部署に居た。
そこでツールベンダの要望に応えて自動化ツールを使った加算器や乗算器などの試験的なデザインをしたよ。
ツールのパフォーマンスを引き出すために色々な手を講じたけど、毎度ツールから産まれる機能ブロックは、
手作業で設計したものと比べて2割大きくて2割遅い上にエレクトロマイグレーション等の問題を抱えた代物だった。

これが今のAMDの設計手法さ。さぞかし立派な物が出来るに違いないね。

11:Socket774
11/10/15 05:39:33.95 0EucyfqB
CPUアーキテクチャについて語れ 16
ｽﾚﾘﾝｸ(jisaku板)

587 名前：MACオタ[sage] 投稿日：2010/02/14(日) 03:24:04 ID:Wj71GeXX [1/17]
(略)
- The only bad thing is that some guys I know at AMD say that Bulldozer is
　not really all that great a product, but is shipping just because AMD
　needs a model refresh. "Sometimes you just gotta ship what you got."
　でもなぁ… AMDのツレが言うにはAMDは製品サイクルに切迫して製品化
　してくるらしいんだよな。「何でもいいから今出来てるのを出さなきゃいけない
　時もあるんだよ」って。

ここら辺のことって自動配線の話だったのかな

12:Socket774
11/10/15 05:58:36.78 whlisdOx
まあベンチ結果があれだし
製造技術で差をつけられてるのに設計まで放棄したら
馬鹿でも結果が分かる
とはいえGPU統合まで考えるとまだまだAMDは捨てたもんじゃないが

13:Socket774
11/10/15 06:36:54.16 ulnDUdfZ
ほうほう、なかなか興味深い
設計で手抜きとは…こっから手作業で取り戻せるのかね

14:Socket774
11/10/15 08:16:29.60 HTRKNxsH
意図的に手を抜いたならまだいい。
クリティカルな部分すら自動化ツールに頼らなければならない状況になってなければいいが。

15:Socket774
11/10/15 10:41:48.53 +GoXuSGa
Hot Chips 22 - AMDの小型、低電力CPUコア「Bobcat」
URLﾘﾝｸ(journal.mycom.co.jp)
>Bobcatの設計ターゲットの第一は電力、チップ面積が小さいこと、2番目が高い性能であるが、その次にカスタム設計のメモリなどの種類数を少なくして、
>プロセサコアの大部分を論理合成で作れるようにすること、そしてプロセスが変わっても容易に移行できることが挙げられている。
>
>Bobcatコアを使用する最初の製品である「Ontario」はTSMCの40nmプロセスを使うと見られているが、関係の深いGLOBALFOUNDRIESのプロセスへの移行も視野に入っていると思われる。

そしてAMDがBulldozerの後継コア(Piledriver)をTSMCでも生産するという噂が…
URLﾘﾝｸ(www.techpowerup.com)

16:Socket774
11/10/15 12:07:30.21 sWyGoRQ1
K10あたりからあのクラスのCPUは本格的にAMDの開発リソースでは手に余るようになってきてるんだろうな

やっぱりK10のデコーダとかロードストアとかキャッシュ周りを順当に改良していった方が
良かった気がするんだがそれじゃ駄目なんかね？

K10ってノースブリッジのクロック上げるだけで性能豹変するらしいし
まだいけそうな気がするんだけどなぁ

17:Socket774
11/10/15 12:10:10.02 gWGsaGjK
xbit記事の手作業or自動設計という対立軸はどうなんだ？
ふつー自動設計ツール＆人力カスタムで造り上げていくもんだろ。

長年のノウハウがあるTSMCと比べてGFから提供される
各種デザインキットがショボかった可能性はありそうだが・・・。

18:Socket774
11/10/15 13:20:09.87 72p6jp6o
>>17
失敗したのを確認してから出てくるような自称5年前までの元社員の投稿に
どれほど意味があるのかは、まあ読み手次第だが。

19:Socket774
11/10/15 13:33:28.28 +GoXuSGa
>>17
この人がAMDに勤めていたと思われる時期はまだFabが売却されてGFになってないのでGFのデザインキットは無関係。
ツールを購入してテストしていたというくだりからするとAMDは社内製ツールをある程度諦めたっぽい。

>>18
記事になったのは2日前だけど投稿自体は1年以上前のものだった。
URLﾘﾝｸ(forums.macrumors.com)
Bobcatも同様な設計をされていることは知らなかったみたいだね。

20:,,・´∀｀・,,）っ-○○○
11/10/16 04:27:05.81 arCmCIWG
ふつうは守秘義務で退職後5年間は口外してはいけないことになっている

21:Socket774
11/10/16 04:27:51.80 lKlxp30A
URLﾘﾝｸ(www.theinquirer.net)
このままのやり方では2018年に8nmまで行ってもエクサスケールのスパコンは出来ませんよ

URLﾘﾝｸ(www.theregister.co.uk)
ハイパフォーマンス向けCPUの上にDRAMを積層させるとCPUの熱でDRAMはまともに動きませんよ
(つまりDRAMは別に積層させ、それとCPUを繋ぐHMCのようなものが必要ですよってこと？)

22:,,・´∀｀・,,）っ-○○○
11/10/16 04:44:59.99 arCmCIWG
> Bobcatも同様な設計をされていることは知らなかったみたいだね。
Atomより小さいのに性能がいいとかいいたいんだろうけど
CPUコア自体はAtomのほうが遙かに電力効率はいいんだぜ

N/Dシリーズが残念なのはチップセットがAtomに最適化されていないから。

23:Socket774
11/10/16 05:24:40.78 1J/5fE5h
>>21
後藤さんはIntelはDRAMの上にCPUを載せる方向を考えているって書いてたよ

24:Socket774
11/10/16 09:20:07.18 duuL/4ob
追加
AMDのデザイナーであるJerry Moenchが2004年のVLSIで「リソースの少ないAMDは自動化ツールに頼る必要があるのでK8とK9の配線層数は非常に多くなる。」という発言をしていたらしい。
URLﾘﾝｸ(arstechnica.com)

>>22
AMDのトレンドがそうなりつつあったのかなと思っただけでそれ以外の意図はない。

25:Socket774
11/10/16 10:01:55.99 lKlxp30A
Bulldozerは11層
Bobcatは10層
>>24の話は今回の件に関しては関係無くね
昔からIntelの方が配線層は1,2層少なかったからそのことだと思うけど

26:Socket774
11/10/16 10:07:58.41 duuL/4ob
そして昔からIntelのキャッシュは速かった。

27:Socket774
11/10/16 12:16:55.20 XTNiHNmW
えっ？ｗ

28:Socket774
11/10/16 15:33:29.54 NjkXCo1L
同じ自動化でもBobcatの方は目に見えるようなアンコアの無駄がないから
AMDから引き継いだGFの設計ツールの方がTSMCのより劣っているじゃないのか？

29:Socket774
11/10/16 19:58:55.07 inoe90w3
ボブはデュアルだから4M8Cのブルと比べてもな

アイドル見る限りGFの32nmは優秀っぽいからそこだけ救いかね
まぁ歩留まりはいつものAMDみたいだが

30:Socket774
11/10/16 20:59:20.13 NjkXCo1L
K8のデュアルの頃から同じアンコアの無駄あるから

31:Socket774
11/10/16 21:24:59.36 fCUXbMeg
>>23
後藤さんのIDFレポートで、CPUの上に載せる構想はフェイクだったと言ってる。

URLﾘﾝｸ(pc.watch.impress.co.jp)
----
Intelは、これまでDRAMスタックの上にCPUを載せた構想図を示してきたが、それはフェイクで、
実際にはキューブメモリの共同開発を進めていたことがIDFで明らかになった。

32:Socket774
11/10/17 01:28:09.67 tXXGEmNb
つーことは>>21の方針ということだね。

33:Socket774
11/10/17 12:45:22.65 Qb1Z2fwV
>>31
スカイネット…

34:Socket774
11/10/17 23:33:58.98 oiNLt3WA
>>31
インテルが忍者プログラマなどと言うかww
URLﾘﾝｸ(pc.watch.impress.co.jp)

35:Socket774
11/10/17 23:43:42.05 tXXGEmNb
>>34
これ、何度見ても吹くｗ

36:Socket774
11/10/21 10:54:18.31 swxSwYAF
マイクロソフト、次世代機「Xbox Next」を2013年ホリデーシーズンに投入か
URLﾘﾝｸ(www.inside-games.jp)

ソニー、プレイステーション4向けのプロジェクトを複数の内部スタジオで開始か
URLﾘﾝｸ(www.inside-games.jp)

37:Socket774
11/10/22 08:30:40.15 WXy0l5/4
当然研究開発はするでしょう。PS3は10年もたせると言っていたから、
新箱が2013年末ローンチなら、PS4は1年後の2014年末ローンチでその位だが…

The Cell processor 2 is in development, and go for PlayStation 4
URLﾘﾝｸ(translate.google.es)

38:Socket774
11/10/22 09:49:55.09 khfWeJNr
Cell 2　そんなものが存在するのだろうか・・・

39:Socket774
11/10/22 11:24:37.20 taA5UawY
まあSPEを乗せないと話にならん

40:Socket774
11/10/22 12:39:23.57 tJPrvzew
PS4はPS2の機能を最実装して欲しいよ。

41:Socket774
11/10/22 13:51:29.05 U8K0kVfc
エミュでいいと思うが、任天堂が特許とってたな…。

42:Socket774
11/10/22 14:33:32.67 ENHfY00V
2014年までひっぱるならSPEもソフトエミュでの再現が視野に入ってくるのでは？

43:Socket774
11/10/22 14:55:02.22 MAhgU7wM
ゲハが来ると如実にレベルが下がるな

44:Socket774
11/10/22 14:58:26.58 gkhHBwkF
CellはGPUと違って好きに叩かせてるらしいから
互換を優先するなら載せてくるだろうけど
PS3のように敢えて載せず、PS2を16000円で売るような事もやるだろう
まあ投資額としてはPS4にも載せるつもりだったと思うけど

45:Socket774
11/10/22 16:24:00.70 1URor+rl
今頃何言ってるんだっていわれそうだが、時分割で高速に切り替えて
実効的に回路規模数倍相当になるFPGAを売ってるベンチャーがあるんだな

URLﾘﾝｸ(www.kumikomi.net)
URLﾘﾝｸ(eetimes.jp)

46:Socket774
11/10/22 18:31:44.02 vFNOAi9C
すげーな、これ。

47:Socket774
11/10/27 13:14:14.67 EqjWh8zl
ARM+SPEでPS3のゲームを動かすときだけARMでPPEをエミュでもすりゃいいんじゃないかと
暴論

48:Socket774
11/10/27 18:39:29.88 +a53G7Tz
手堅い
いまどき新PPEを作ったりSPEを他コアでエミュるよりは

49:Socket774
11/10/27 19:17:38.67 d4vvlLlg
どこが手堅いんだかさっぱりわからん
WiiUや次期XboxもPowerだしSPEつけるならPS3との互換性捨ててARMにする意味が全く無い

50:Socket774
11/10/27 21:05:14.90 +a53G7Tz
WiiUは45nmで低消費電力志向だと判ってるから
現行世代のスループットをターゲットにしたコアだろ？
MSはAMDのSoCになるらしいからPowerじゃないんじゃないか？

51:Socket774
11/10/27 21:08:58.22 +a53G7Tz
ARMなら効率も設計自由度もコストも市場環境的にも優位
最新技術をキャッチアップしたいならARMを使うのも手堅い

これからIBM自体がARMに走ってもそれほど驚かないくらい

52:Socket774
11/10/27 21:12:02.00 +a53G7Tz
>>50
現行世代並みのスループット

53:Socket774
11/10/27 21:14:38.26 sGYvlMJa
ARMは魔法のアイテムじゃないぞ

54:Socket774
11/10/27 21:15:29.88 +a53G7Tz
もちろん
だがIBMも魔法使いじゃないしな

55:Socket774
11/10/27 22:04:14.78 d4vvlLlg
>>50
現行の箱もAMDが統合設計したCPU＋GPU1チップコアだし
GFはIBMのプロセスグループだからPowerコアの設計変えずにSoC化するのに有利だろ

56:Socket774
11/10/27 22:18:12.76 BkS80NSl
次世代箱はFSAでプログラミングするんだろうか。

57:Socket774
11/10/27 22:29:42.34 +hQYM3Yu
Cell2ではPPEはお払い箱になってARMに変わるのは決定済みだよ。
URLﾘﾝｸ(blog.esuteru.com)

ARMはIBMと共同開発しているから、IBMにとっては技術の横展だね。
IBMにとってCellでの用途開発で苦しんだのは黄犬Linuxが絶滅種寸前だった
からで、ARMでWindows8が走ると用途が広がるからね。SPE自体のコンパイラは
IBM謹製でお手の物だし、ARM/SPEのマルチCPUはすごい事になりそう…
あと、CPUチップ内でのARMのバスとIBMのバスは接続技術を開発済みだよ。
ARM/SPEの構成ならARM用とIBM用の各周辺回路のどちらでも使えるみたい。

58:Socket774
11/10/27 22:38:29.25 BkS80NSl
おお、そうなのか。

59:Socket774
11/10/27 22:46:35.77 yC3sUmy2
>>57
乞食クズブログのURL貼るなボケ

60:Socket774
11/10/27 22:47:57.13 JrjwHkPq
その内容だとcell2じゃなくて
armの何かだろ

61:Socket774
11/10/27 23:09:47.57 lsXw4+Im
ARM+SPEだけど・・・読めない人はどう読んでんだ？

62:Socket774
11/10/27 23:10:53.04 +hQYM3Yu
>>60
医療とか防衛とかスパコン用にはPPEは全然役に立ってなくて、SPEの命令役
だったからね。ARMもその位置だが、Cellの時はPPEの動かし方がうまくいかず、
intelチップでWindowsを動かし、そこからPPEに命令を出し、PPEがSPEに命令
する形だったし。
面倒くさいからMercuryもCellをやめたみたいだけど…
URLﾘﾝｸ(www.mc.com)

63:Socket774
11/10/27 23:39:47.26 /cZ9SvRl
非力すぎて使えないPPEをもっと非力なARMで置き換えるのか

64:Socket774
11/10/27 23:44:37.04 U+QpyrCB
もうPS3除いてCell事業は終息してるし、ゲーム機も2014年まで先延ばしなら
ゼロベースで考えたほうが良い。少なくともSPEは互換のためだけで拡張すべきではない。

65:Socket774
11/10/28 03:48:42.60 uxT0py/S
どこにARM+SPEってかいてる？

66:Socket774
11/10/28 09:15:10.73 bVCzwYja
ARM+SPUとか意味ねーから。
ゲハは自分の無知をまず認識しろ

67:Socket774
11/10/28 12:57:48.02 Ebk/AFh4
Cortex-A7　こっちが面白そうだ
URLﾘﾝｸ(pc.watch.impress.co.jp)

68:Socket774
11/10/28 18:21:48.03 ykbIX3om
64bitの新命令セットARMv8きたがな

69:Socket774
11/10/28 19:28:17.59 ANkZ9EDu
ARMv8は2012、3年頃にチップが登場して
2013、4年頃には搭載された製品か

70:Socket774
11/10/28 19:29:12.41 ANkZ9EDu
新市場開拓なら名称もCortexから変わりそうだな

71:Socket774
11/10/28 21:39:37.63 ISgdXLYI
これか。もう最初のモデルとコンパイラが出回っているのか。
URLﾘﾝｸ(www.electronista.com)

72:Socket774
11/10/28 21:58:03.65 8J0wjmaF
そろそろメモリが4GB超えるから移行しただけじゃね
ARMで変わるならOpenSPARCで変わってただろ

73:Socket774
11/10/29 00:08:37.56 vGX3+EAr
ARM始まったな。

74:Socket774
11/10/29 19:26:36.33 iNqdvA4W
PowerコアはWiiUで終わりなのか　さびしいのう

75:Socket774
11/10/30 00:31:26.92 wSXfHyUw
URLﾘﾝｸ(www.arm.com)
命令長は32bit固定で、レジスタフィールドは5bitか

76:Socket774
11/10/30 03:35:40.78 K7d+RoXx
へーレジスタ増やすんだ
普通のRISCになったな

NEONは従来の128bitx16 or 64bitx32ではなくて
下位ビットのみ共有して128bit or 64bit x32になるということね

77:Socket774
11/10/30 10:54:29.95 2xBo3Uq2
☆ARMの次世代core, SoCについて語るスレ #001☆
ｽﾚﾘﾝｸ(jisaku板)

とりあえず建てといた。

78:Socket774
11/10/31 00:13:57.64 Zmdm7KSJ
ARMv8
URLﾘﾝｸ(pc.watch.impress.co.jp)

79:Socket774
11/10/31 00:20:01.30 hSXKN7Rt
命令長32Bitとな

80:Socket774
11/10/31 01:39:39.59 71p1k9kP
別に普通じゃね
PPCもMIPSもSPARCも命令長32bitだ

条件実行フィールド削る分でレジスタフィールド拡大するんだろうな

81:Socket774
11/10/31 06:19:51.08 R14/KgF7
>>78
>AMCCの発表によると、「X-Gene」の最大動作周波数は3GHz、待機時消費電力は300mW未満。
300mW未満に笑った。これはプロセッサコアのIdle powerを単純にコア数倍してるだけだね。
サーバープロセッサのIdle powerはほとんどがコア以外の成分だからこんなに減らせない。
1コアのIdle powerを約10mWとすると32コアくらい積んでくる予定かな？

82:Socket774
11/11/02 18:02:31.93 qtcEsICV
理研と富士通のスパコン「京」、10ペタフロップスを達成
URLﾘﾝｸ(www.rbbtoday.com)

83:Socket774
11/11/02 18:54:29.83 2sy8VIVP
>>82
URLﾘﾝｸ(pr.fujitsu.com)

CPUが増えて速度が上がっているのに実行時間が前回よりも長いということは、
前回よりもサイズの大きい計算をしたんだな。

84:Socket774
11/11/02 18:58:11.90 2pf8QHcu
紆余曲折有ったけどよくやったな
次の世代はどうなるのかな

85:Socket774
11/11/02 19:44:05.62 EbMxVKzY
ありません

86:Socket774
11/11/04 02:36:55.25 DcmrmQit
スーパースカラとマルチコアは、どっちもパイプラインを複数用意してますが
「パイプライン」≠「コア」ならコアは具体的にどの部分を指してるんですか？
制御部のことかなって思いましたが、スーパースカラも各々のパイプラインを制御する
制御部は必要だと思うので違う気がしました。

87:Socket774
11/11/04 04:01:38.52 QCGb5Kp8
>>86
一番簡単な考え方はこんなもんか？

スーパースカラー …… ステージを分割しユニットを複数実装することで「１つのスレッド」を並列実行するための技術
マルチコア …… 入力から出力までの１単位であるコアを複数実装し「複数のスレッド」を独立して並列実行するための技術
SMT（HTT） …… スーパースカラーを拡張することで「複数のスレッド」を並列実行しているかのように見せる技術

パイプラインとコアの違いは直列か並列かと処理できる能力の違いだね。
パイプラインはベルトコンベアで作業する人間１人で、コアはそのコンベア１本って感じ。

88:Socket774
11/11/04 05:27:58.84 gUSV43lT
>>87
なるほど、スレッドの数の違いですか。
並列処理のハザード検出とか大変だろうな（多少は必要でしょうけど）
と思ってたのですが、別々のスレッドならそれほど心配しなくてもよさそうですね。
とてもわかりやすい説明有難うございますm(_ _)m

89:Socket774
11/11/04 14:33:21.18 tsu7Pvfb
AMD、大規模なリストラを実施

URLﾘﾝｸ(pc.watch.impress.co.jp)

さようならAMD

90:Socket774
11/11/04 16:50:40.03 Moxb7+zr
うわぁ･･･

91:Socket774
11/11/05 05:39:27.19 knogqZxw
一つの時代が終わったな。今後はIntel対ARMが本格化するのだろうか。
生産に関してはどうか。AMDを主要顧客としていたGFはどうするのだろうか。

92:Socket774
11/11/05 07:09:13.26 oux3Fupy
>>91
逆に危機感を持って本気出して来るってことは考えられないかな?頑張って欲しいな

93:Socket774
11/11/05 09:15:27.13 nSjbwRr9
求人する>有能さを見極める>リストラする　というサイクルを
回して有能な人間の濃度を高めているだけなのでは

94:Socket774
11/11/05 09:23:28.85 3hTz23j3
>>93
社会に出てみるのをオススメしておく

95:Socket774
11/11/05 09:30:01.01 6H1oJD1y
日本企業と米国企業でリストラの意味がだいぶ違うことを社会人なら知っておくべきｗ

96:Socket774
11/11/05 12:32:46.28 w3HSRgUz
リストラは首切りを意味する和製語なんだよ！！なんだｔｔ

97:Socket774
11/11/05 13:51:59.22 JUY1imzA
またの名は構造改革

98:Socket774
11/11/05 14:13:11.82 grJTobZV
業績好調なのに大量首切りやった会社は例外なく落ちぶれてる。

99:Socket774
11/11/05 14:18:35.80 Jm1rArRd
え、今は落ちぶれてないの？

100:Socket774
11/11/05 14:59:59.36 6H1oJD1y
大量首切りなんて業績好調な大企業なんて普通にやってんだろ。
新卒3000人採用、数ヶ月後2000人削減

101:Socket774
11/11/05 15:35:46.59 9ww8bgSH
例外なく落ちぶれるｗｗ
Intelだってリストラやったことあるけどね

新CEOが就任して注力する部分が決まったからそれ以外の贅肉はそぎ落とすということでしょ
そぎ落とす部分が本当にいらないのかどうかは分からんけどね
2月のAnalyst Dayで方向性は見えてくるんじゃない

102:Socket774
11/11/05 16:56:21.98 hN4Jy1Vp
インテルが1万人レイオフを行ったときは
Core2で挽回し始めていて、その裏でNehalemアーキ開発も進んでいた

今のAMDは……

103:Socket774
11/11/05 17:17:33.74 gqLPNyoW
空っぽだな

104:Socket774
11/11/05 19:41:18.38 xAARp2gD
10%って何人なんだろうね

105:Socket774
11/11/05 20:35:14.97 Wjwrq41X
10年度の時点で16000人か。ということは1600人。
何か撤退する分野があってそこを切るのか？

106:Socket774
11/11/05 20:42:56.94 xAARp2gD
centaurが16社できるぞ

107:Socket774
11/11/05 21:21:53.72 3hTz23j3
AMDの製品ラインの中で、現在から将来に渡ってダメなのは
どうみてもBulldozerなんだが、
ここ手放すと終焉が見える。

108:Socket774
11/11/05 22:07:51.09 TcWmJEa8
>>102
Intelのリストラが話として出てきたのは2004年じゃないか？ちょっと記憶が怪しいが。C2Dの前なのは確か。
ただしエンジニア(R&D)は減らさず逆に増強されたはず。
あの頃はOpteronにやられてたから価格競争に耐えられるような組織作りを迫られてたんだよな。
リストラの実施とPentiumDの価格改定が重なった2006年の第2四半期は大きく業績を落とした。
ただリーマンショックの時には既に組織改革が粗方終わってたので上手く乗り切れたね。

109:Socket774
11/11/05 23:15:05.74 O0U6bSI1
URLﾘﾝｸ(www.computerworld.jp)

110:Socket774
11/11/06 00:06:26.80 Nt3idcCl
ごめん、2004年は大嘘。
Intelが2006年の第1四半期に前年同期比で4割ほど減益だったのが始まりっぽい。
URLﾘﾝｸ(www.intel.co.jp)

決算の発表から一週間後に投資家へリストラによる経営体質の改善を約束。
URLﾘﾝｸ(news.cnet.com)
>The comprehensive project, which will look at ways to cut costs per unit and improve employee productivity, will take place over the next 90 days, he said.
(略)
>In an effort to overcome its loss of market share amid a slower-growing overall market, Intel plans to launch its largest product refresh in years.
>
>"New products based on the Core microarchitecture for power and performance will be launched this summer and refresh the Intel product line in all segments," Otellini said.
>
>Three new chips, one for each of the Core market segments, will be part of the rollout: Woodcrest for servers in June, Conroe for desktops in July, and Merom for notebooks in August.

文脈的にはCMAを採用した製品を6～8月に前倒しで投入するというのもリストラクチャリングの一環。

6月にはMarvellへXScaleを売却。
URLﾘﾝｸ(news.cnet.com)

2006年第2四半期の、前四半期より更に低調な決算を発表した翌日(7/20)には役員人事。
URLﾘﾝｸ(pc.watch.impress.co.jp)

111:Socket774
11/11/06 00:49:17.48 UAQkgGYY
世の中には最高益出したと同時に開発者を大量リストラしたスクエニって企業もあるのよ。

112:Socket774
11/11/06 01:09:50.77 CcEL+lwI
あそこは開発を自社で抱えたくないんでしょ

113:Socket774
11/11/06 01:24:19.83 H60KplLz
結局どこに事業ドメインをおくかでしょ。

AMDは半導体を外に出しちゃったしATIも一定の成果あげちゃったし
営業にいたってはIntelのパワーゲームに勝てるわけないし

理論設計だけでやってけるか謎だけど、Intel一社になったらx86はマイナー転落だろうな。

114:Socket774
11/11/06 01:32:51.18 ecJIB34Q
スクエニは確かクビ切ったのと同時に新入社員も大量に入れてるな
社長がイエスマン欲しいのか、若手7割にしたら問題解決とか言ってたし

AMDは厳しそうだな・・・ATI買収しといて良かったね
ってくらいか
単体ならまず死んでる

115:Socket774
11/11/06 01:39:55.74 gZZxRbNS
>>114
スクエニは組織を新しくしたいのか。
毛色の違う会社になるのかも。

116:Socket774
11/11/06 03:25:15.07 In7LY003
コンピュータの高性能化が終わったら科学技術の進歩はどうなるんだ？

117:Socket774
11/11/06 05:15:28.01 7JHbn030
AMDが終わっても、アーキテクチャ間の競争は終わらない。

118:Socket774
11/11/06 10:20:21.92 UeaW747B
AMDの存在はコンピュータの歴史全体から見ると
あってもなくてもたいしてかわらん程度の影響度でしかない。
ARMの方がはるかにでかいよね。

119:Socket774
11/11/06 10:46:42.31 uUPBubTs
>>118
結局はx86互換メーカーの1つでしかないから、AMD
ところで、未だに？オクでSUNのSparc機が出たりしてるが、買った人いる？
俺は、Blade150買ったけど、、たいして役にたってない。

120:Socket774
11/11/06 10:53:48.88 uUPBubTs
SpecCPU2000辺りだとUltaraSparc3の1.2GhzがPen4-2Ghzぐらいの性能だけど
実際のアプリでの性能差だとどうなんだろ？

121:Socket774
11/11/06 11:01:11.44 H60KplLz
コンピュータの歴史全体という視点からなら、AMDがないとIntelは成り立たなかった。

Intelは単なる半導体メモリの製造技術しかなく、一方AMDはCPU周辺回路設計技術があり、
AMDからの技術供与でIntelCPUが成り立った。　ともにフェアチャイルドからの独立組みな。

122:Socket774
11/11/06 11:14:18.53 uUPBubTs
SUNのSparcが登場したころは、x86は行き詰まり死滅するはずだったが、、
現に、性能では386/486より上で俺は「いつかはSUNやHPのUNIX機を買うぞ」
と思い、十数年、、いざ買ってみると「なんだ、この程度か。」と拍子抜け。
何か普通のPCとは違う世界を味わえるかと思ったが的ハズレだった。

123:Socket774
11/11/06 11:49:04.48 gZZxRbNS
うお、フェアチャイルドがもとだったのか！？
これは目から鱗。

124:Socket774
11/11/06 12:22:51.16 jXisSrix
486/Pentium時代は、IntelはRISC勢にぼろ負けしてた
ただしその後、Intelはチップ内部にRISC的な設計思想をかなり取り入れ、
従来のCISCの命令セットの互換を保ったままCPU内部をRISCとCISCのいいとこどりみたいなのに進化させて、
RISCの利点がなくなったけどな

125:Socket774
11/11/06 12:38:25.88 TNhtuW9t
>122
90年代ならAlphaあたりはx86と格の違いを見せ付けてたんだけどな

日本語で一番詳しいのはando さんのところか。他のサイトはもっと頑張らないと
　AMCCのARMv8プロセサX-Gene
　Calxedaのサーバ用4コアARM Cortex-A9チップ
　URLﾘﾝｸ(www.geocities.jp)

どちらもモバイルとはインターフェイスのリッチさが違うしECC使えたりで
なんちゃってサバ仕様ではなく本気だなって印象

126:Socket774
11/11/06 12:42:14.89 gZZxRbNS
Andoさんは別格。

127:Socket774
11/11/06 13:03:49.84 NSXl9wKe
andoさんは確か富士通のSPARCアーキテクトで、仕事やめてからも、
大学で非常勤かなんかで講師やってるんじゃなかったっけ？

128:Socket774
11/11/06 13:23:17.37 gZZxRbNS
SPARCに絡んでたのは聞いてたが、アーキテクトだったのか。
すげぇｗ

129:Socket774
11/11/06 16:17:20.23 UeaW747B
>>121
なんでこういうデタラメを平気で書く人がAMD周辺からはあとを絶たないんだろうか。
Intelは自社のメモリを拡販するためにプロセッサを作ったのが事の始まり。
AMDはプロセッサは後発参入なんだが。

130:Socket774
11/11/06 16:21:57.35 JxM2qe8P
intelのセカンドソ－スでは

131:Socket774
11/11/06 17:05:41.70 u/JJbn9o
>>125
一つ上の記事が気になった。MIPS系だろうか。

132:Socket774
11/11/06 17:42:20.30 L8kSdmbW
>>129
だよな。AMDはx86の生産委託を受けたって企業ってイメージしか無いわ。

133:Socket774
11/11/06 17:47:12.12 gZZxRbNS
元DECのエンジニアが多いんだったっけ？

134:Socket774
11/11/06 17:58:04.43 u/JJbn9o
>>133
とりあえず今話題にしているAMDプロセッサの黎明期って意味では
DECのエンジニアは関係ない。AM2900の顧客がDECだったとかは関係あるかもしれないが。

135:Socket774
11/11/06 17:59:46.43 gZZxRbNS
ダーク・メイヤーが元DECだったのが印象深くてね。
黎明期はまだDEC色はなかったんだね。

136:Socket774
11/11/06 18:02:07.67 H60KplLz
>>129
なんでこういう無知を平気書く人がIntel周辺からは後を絶たないんだろうか。
「プロセッサ」「CPU」ってぇのを半導体で集積回路を起こした「マイクロプロセッサ」だけしか知らないからだろうなｗ

Intelがプロセッサを作ったのは日本のビジコン社から電卓用チップの製造委託を受けたのが事の始まり。
結局Intelだけでは設計できず、ビジコンから嶋さんが設計に入ってようやく完成したのがi4004。
電卓用ではなく汎用にしたらいいんじゃね？的な発想はIntel側から出たが、結局理論設計やったのは嶋さん。

i4004で味をしめたIntelはその後i8008開発したけど失敗、さらにi8080開発しようとしてテンでだめだったから
結局嶋さんをヘッドハントしてようやく完成にこぎつけた。

そもそもIntelが世界で始めて開発したのは「マイクロ」コンピュータであって、おもちゃに毛が生えたものでしかない。
当時は汎用機のCPUが中心で、コアメモリや磁気メモリ中心だったところに半導体メモリに目をつけたのがIntel。
一方のAMDは汎用機のCPUの周辺回路をマイクロチップ化することで事業をスタートした。

AMDは周辺回路のほかに不揮発性メモリの技術もあって、Intelはこれらの技術もライセンス供与を受けている。

137:Socket774
11/11/06 18:05:14.84 gZZxRbNS
>>136
日本人すげーｗ

138:Socket774
11/11/06 18:12:26.70 gZZxRbNS
嶋正利
URLﾘﾝｸ(ja.wikipedia.org)

こんなすごい人がいたなんて知らなかった！
CPUなんてものは最初から欧米の人間が設計の中心だと思ってた。

＞嶋は「欧米の人たちと比べても、自分が劣るなどと決して思ったことはありません。
＞機会さえあれば日本人も創造的開発はできます」[7]と述べている。

勇気付けられるね。

139:Socket774
11/11/06 18:16:40.94 7JHbn030
×日本人がすごい
○嶋さんがすごい

あと池田敏雄とか
エンジニアリングに国境はない

140:Socket774
11/11/06 18:38:05.20 H60KplLz
いやいやいや、日本人も結構スゴイんですよ？

半導体も真空管もリレーも使わずにフェライトコアだけで論理回路を構成するパラメトロンとか日本人の発明ですぜ。
パラメトロン計算機とか上野の博物館で隅に追いやられて忘れ去られてるけど…。

141:Socket774
11/11/06 18:54:34.80 UeaW747B
>>136
このスレならそれくらい常識。
ネットで検索して多少はまともなレスができたようだが、
Intel的にはビジコンの件もDRAMを売りたいからむしろマイクロプロセッサがメモリの周辺ICの感覚だったのよ。
で、AMDがなければIntelがなかったという論拠はなんなんだろうか?
セカンドソースって米国と日本のメーカーを含めて何社もあった中のAMDは一つにしかすぎんのだが。

142:Socket774
11/11/06 18:58:30.49 UeaW747B
ちなみにIntelの創業者のノイスは世界初の集積回路の発明者で、
マイクロプロセッサ、SRAM、DRAMの発明はTIと並んでIntelが最初。
4004は嶋さん自身も言っているとおり、メインフレームのアーキテクチャの影響は受けてない。

143:Socket774
11/11/06 19:34:50.14 UUUJ6fve
>>139
俺が最初に嶋正利について知ったとき感じたのはこの人のすごさよりも
日本企業のビジネス感覚、人材活用ののしょぼさ、間抜けっぷりへの失望だった。

144:Socket774
11/11/06 21:59:51.68 H60KplLz
>>141
> Intel的にはビジコンの件もDRAMを売りたい
i4002はDRAMではない。嘘の上塗り恥ずかしいよ。

145:Socket774
11/11/06 22:01:03.61 H60KplLz
>>142
で、どこのだれがi4004がメインフレームのアーキテクチャだなどと主張を？

146:Socket774
11/11/06 22:03:08.08 xLjXsWBB
>>144
横から失礼
それはおまえの認識不足か読み違ってるだけ

147:Socket774
11/11/06 22:04:07.66 c5UKFg5N
AMDの設立って1969年でセカンドソースはじめたのってi8088の1979年くらいからだろ
製品がでる10年も前からセカンドソースの一つってどんだけオーパーツ？

148:えるえる
11/11/06 22:21:19.61 UeaW747B
4002
The RAM chip stored four 80-b numbers and additionally the chip had an output port.
The use of three-transistor dynamic memory cells made the RAM chip feasible.

three-transistor dynamic memory cells
誰とはいわないけど。嘘の上塗りってほんとに恥ずかしいですね。わらい。

149:Socket774
11/11/06 22:24:24.08 H60KplLz
>>147
セカンドソースはi8085からなのと、i8080のデッドコピーをAMDも作っているから、
その意味ではAMDは1975年くらいから互換プロセッサメーカだった。
ただその当時からAMDはオリジナルCPUだしてるけどね。

で。
i8080はおろかi8085にいたるまでIntelはDRAMコントローラを出すことができなかったし、
i8085に至ってはメモリを接続するのにアドレスとバスを分離するのに自社外のバスコントローラを必要とした。
半導体メモリの拡販のためのプロセッサ開発なんていうのは相当苦しい後付の理由だね。
事実だとしても、Intelは自力じゃ自社のマイクロプロセッサに自社のメモリをつけることができないという
間抜けっぷりをさらしたことになる。

AMD（というかその他の半導体メーカ）はマイクロプロセッサ開発においてはIntelに水を開けられていたのは事実。
嶋さんがZilogに移ってZ80出したおかげでひっくり返されて、IBMが8088/80286採用するまで沈んでたけど。

AMDはバスコントローラやFPU、時代が下ってからは不揮発性メモリなどの技術を押さえ、
この部分でIntelに対しライセンス供与を行っている。

150:Socket774
11/11/06 22:25:23.29 H60KplLz
>>148
あら失礼。

151:えるえる
11/11/06 22:26:11.87 UeaW747B
4004はテッドホフ=アーキ担当、嶋=実装担当
みたいなイメージなのかな。

もともとコンピュータ史に興味があれば、
IBM > CRAY, Intel, DEC, UNIVAC > Sun, Motorola > AMD
としか思わないはずなので、
ネット見ながら応戦しているのがばればれである。

152:Socket774
11/11/06 22:28:43.25 UnBk6tkg
つうか70年代当時に販売担当上級副社長だったエド・ゲルバッハが「我々は
マイクロプロセッサをメモリ製品の拡販の手段と考えていた」と語っているんで、
そこら辺は常識の範囲だろ。

153:えるえる
11/11/06 22:29:48.49 UeaW747B
>>149
そんなに堅く考える必要性ないだろ。
今みたいにIntelに自社の支配力がない時代には、他社と補完路線で商売やってたってだけのような。
セカンドソースは自社で製品安定供給できる製造体制ととのえば、利益ないからやめたくなるんじゃないの?

154:Socket774
11/11/06 22:29:52.81 H60KplLz
>>151
> 4004はテッドホフ=アーキ担当、嶋=実装担当
それはさすがに嶋さん怒るな。

> ネット見ながら応戦しているのがばればれである。
というレッテル貼りしたいのがミエミエなわけだけが、
コンセプトメーカしか並べられず半導体メーカを出せていないあたりでニワカってレッテル貼りかえせばいいのかな ;-)

155:Socket774
11/11/06 22:34:29.76 H60KplLz
>>153
実際その状況になったのは i80286が安定してからだよね。

Intelはセカンドソーサを何度かつぶしにかかってるけど、AMDはそのたびにしぶとく生き残ってる。
背景の一つにクロスライセンスがあるわけだけど、前に更新したのが2001年だからそろそろ切れるのかもね。

156:Socket774
11/11/07 00:47:53.34 598dwazn
携帯電話が地球シミュレータと同等の演算能力を持つというのか｡
ARM恐るべし

157:Socket774
11/11/07 04:17:23.77 L773e4Yw
Core 2 Duo はキビキビしすぎて少しでもプログラムが
遅れてタイミングがズレるとにエラーになる事が多い。
WMPみたいに、しぶといプログラムはエラーにならず、
開始するのに時間がかかる。P4の、もっさりの方が快適
なんだが、熱に弱いのがネック。

158:Socket774
11/11/07 04:58:20.16 +h1mwsvo
えるえるって前にトンデモ理論振りかざして
ボコボコにされてたやつじゃねえか・・・

159:Socket774
11/11/07 07:59:19.61 4hSB2nzz
まあ言ってることは間違ってはいない

160:Socket774
11/11/07 09:29:25.35 tIhiyhKc
>>153
×Intelに自社の支配力がない時代
○Intelに自社の開発力がない時代
そう言えばMotoは自社で6800の周辺チップ一通り揃えてたけど
性能や価格面ではダメダメだったのを思い出した

161:Socket774
11/11/07 11:15:11.29 vqJLMGpp
リファレンスを提示するとかが主で、性能や価格を頑張らない
ものってのが昔はあった気がする。
どこもかしこも世知辛い今はもうなさそうだが。
モトローラが該当するかどうかは知らない

162:Socket774
11/11/07 16:14:07.75 uNNC+L/4
富士通、最大23.2PFLOPSを実現するスパコンを発売～京で用いた技術をさらに発展
URLﾘﾝｸ(pc.watch.impress.co.jp)

40nmで16コアで1.848GHzで110W

163:Socket774
11/11/07 17:41:17.11 vqJLMGpp
IXfx のダイサイズはかなり大きい

IIIVfx 45nm 8Core 513mm2
URLﾘﾝｸ(journal.mycom.co.jp)

IXfx 40nm 16Core
URLﾘﾝｸ(pc.watch.impress.co.jp)

164:Socket774
11/11/07 18:00:54.19 mETZ5tg9
消費電力倍かよ。
フル構成時のシステム消費電力凄い
事になりそうだな。

165:Socket774
11/11/07 18:11:35.63 vqJLMGpp
同じ1PFLOPSのシステム同士で比べたら
VIIIfxからIXfxでノード数が半分近くに減るから
インターコネクトチップやらなんやらの分だけ電力は減るだろう

IXfxのダイサイズがかなり恐ろしいことになってそうなのが気になる。
Tukwila も超えて最大級なんじゃないのかな

POEWR7 567mm2
POWER6 341mm2
SPARC64 VIIIfx 513mm2
SPARC64 VII 445mm2
Tukwila 699mm2
Montecito 596mm2
Westmere-EX 513mm2
Nehalem-EX 684mm2
Magny-Cours 346mm2x2 MCM
GTX580 520mm2
Radeon HD6970 389mm2

166:Socket774
11/11/07 18:49:14.06 mHeWIMwy
コピペ情報

SPARC64 IXfx
TMSC 40nm
ダイサイズ 21.9 mm × 22.1 mm
トランジスタ数約 18 億 7000 万個

SPARC64 VIIIfx
富士通45nm
ダイサイズ 22.7 mm × 22.6 mm
トランジスタ数約 7 億 6000 万個

167:Socket774
11/11/07 19:10:05.65 bCCRVu4f
富士通先端プロセスェ……

168:Socket774
11/11/07 19:45:33.28 gMmqsDRj
>>154
フェデリコ・ファジンを忘れてもらっては困るでござるよ。彼も嶋さんとザイログ行っちゃったけどね。
ピーナッツでIBMが出した2ndソース要求が元々だけど、MILスペックを取ってたのはAMDだけだったからアタマ一つ飛び抜けてた。

169:Socket774
11/11/07 21:26:10.62 fmSbxnKO
ここで IBM fab club について一言↓

170:Socket774
11/11/07 23:12:17.05 UlJ7ISjD
>>158
そんなことあったか?

171:Socket774
11/11/07 23:32:04.50 mHeWIMwy
妄想垂れ流してた漢字コテハンのやつが使ってた
もう一つの名前がえるえるだとおもってたけど違うのか

172:Socket774
11/11/07 23:35:44.59 UlJ7ISjD
このあたりかな。1年前の。結構いまみると他のレスよりまともだと思うが。
URLﾘﾝｸ(www.varusu.com)

173:Socket774
11/11/08 00:03:29.63 whGG3rJt
日本発のCPUアーキテクチャを開発してほしい。
ARMに対抗するようなヤツ。

174:Socket774
11/11/08 00:05:11.31 NQmcsU5G
あるだろw SHとか。

175:Socket774
11/11/08 00:54:43.81 siJmdRDd
M2090(GF110) 40nm 520mm 177GB/s 6GB TDP225W
　LINPACK 346? GFLOPS/理論値 665GFLOPS = 0.52?
SPARC64 IXfx 40nm 484mm 85GB/s 64GB 110W
　LINPACK 220? GFLOPS/理論値 236.5GFLOPS = 0.93?

GPUもTufuみたいなインターコネクトでつなげば実効効率あがるのかな。
しかしそうするとコスト差が小さくなるはず

176:Socket774
11/11/08 00:56:14.51 +6Q8QlOQ
震災でルネサスから出荷とまって自動車産業に大打撃与えたのってSHだっけ？

177:Socket774
11/11/08 02:25:10.88 xQnlrl77
>>164
ワットパフォーマンスは上がるだろ
だから実質的に消費電力が減る

178:Socket774
11/11/08 02:38:01.96 4J5KFli2
TSMCのプロセスでも1.8GHzぐらいなら出せるんだ

179:Socket774
11/11/08 03:14:21.38 4AFzjJ75
>>178
TSMCと富士通でどっちがクロック出しやすいかはしらないが、
TSMCは40nmで倍のコア数（トランジスタは2倍弱？）の模様。

180:179
11/11/08 03:15:38.40 4AFzjJ75
上の方に書いてあったか。二倍強だ。
28nm移行も、みたいに書いてあったけど28nmはみんなが
TSMCに委託するからバックオーダー抱えまくりじゃん。

181:Socket774
11/11/08 06:26:18.59 JWtVALlg
SPARC64はハイエンド側に追いやられてどんづまりだと思っていたが、
まさかHPCで生きのこるとは。

182:Socket774
11/11/08 06:37:19.82 siJmdRDd
IXfx は特化CPU、T4も特化CPU、もし両方生き残れれば
汎用ではないことが生き残りの理由ってことになるのかな

183:Socket774
11/11/08 07:14:54.67 JWtVALlg
メインストリームから外れた以上、ニッチに特化するのは必要条件、
って当たり前すぎて面白くないけど。
全ては(チップアーキテクチャの優劣とは無関係に)強力なユーザーを捕まえられるかどうか、
そのユーザーが生き残れるかどうか、にかかっていると思う。AlphaはDECとともに倒れた。
RISCのもう一つの雄、ハイエンドには行けなかったMIPSはどうなるかな。

184:Socket774
11/11/08 09:46:57.26 MhLpVB9N
Bladeワークステｰションを買って、Solaris使えばスパコン気分が味わえるはず。

185:Socket774
11/11/08 10:13:35.78 JWtVALlg
豆腐もつけないと……

186:Socket774
11/11/08 12:57:09.18 MhLpVB9N
>>181
元からハイエンド向けに作られたのがSparc64じゃないの？
端から、PCや携帯なんて考慮してない。

187:Socket774
11/11/08 13:16:02.11 cCvfqTaO
そういやItaniumってまだ息してたっけ？

188:Socket774
11/11/08 13:22:39.10 rD8+vPdx
来年、32nmのが出るので、まだ息はしている。
hpが採用している限り、やめられないだけな気もするけど。

189:Socket774
11/11/08 14:24:09.71 DRZy98ol
>>183
中国のスマートフォンやHPCはMIPSベースだべ

190:Socket774
11/11/08 15:21:10.07 czzaVWbf
MACオタが消えると本当に誰も口上に載せないな＞POWER

191:Socket774
11/11/08 16:09:58.18 065VaUjw
URLﾘﾝｸ(news.mynavi.jp)

なお、同社ではGPUコンピューティングやIntelのMICアーキ
テクチャなどについても、

「IntelのKnightシリーズは8SIMD、GPGPUは16SIMDだと思っており、
単に演算器を増やすほうがコアを増やすよりも確かに増やす
トランジスタ数の問題では楽になる。
しかし、もう1つの問題として、超並列演算を低消費電力で
実現するためにはインタコネクトをCPUに内蔵する必要がある。
我々はTofuで、その第一歩を築けた。
我々のほか、こうしたアプローチが現在出来ているのは
IBMがBlue Geneで実現しているだけであることを考えれば、
我々が一番Exaスケールの実現に近いと思っている」

と、2018-2020年ころが目標とされているExaスケールを20MW
程度で実現するのに、最も近いのは富士通であることを強調した。

192:Socket774
11/11/08 16:47:48.56 ByYh8jJ6
富士通研、CPUの廃熱を用いた冷却用冷水製造技術を開発
URLﾘﾝｸ(news.mynavi.jp)

富士通ノリノリですね

193:Socket774
11/11/08 17:49:53.61 08YawsXY
理研の建物が既にそうなんじゃないのかという気がする（プレスリリース日がFXと同じだし）んだけど、実際はどうなんだろう。

194:Socket774
11/11/08 19:14:09.33 whGG3rJt
富士通すげぇな。

195:Socket774
11/11/08 20:08:38.70 9JctjHde
富士通はいいから早くJapanistの製品版と64bitドライバをリリースしろ

196:Socket774
11/11/08 23:26:19.31 czzaVWbf
関係ないけど，大学時代富士通のスパコンでOAKが使えたのには笑った｡

197:Socket774
11/11/09 00:05:01.16 7cxnclMt
本当に全く関係ないな。

198:Socket774
11/11/09 01:02:11.88 gwae3QrI
>>178
SPARC T4 は 3GHz だよ

199:Socket774
11/11/09 10:13:37.93 kkv8OM+F
シンプル・低クロック・ローパワー・メニーコアだったNiagaraが
どんどん普通のパフォーマンスコアに近づいていく一方で
またARMで同じ歴史をもう一回繰り返そうとしている件

200:Socket774
11/11/09 13:38:46.51 S7d2/MTH
つまりARMがハイパフォーマンス指向で行き詰まった後RXマイコンの時代が来るというわけだな。

201:Socket774
11/11/09 14:00:38.48 kkv8OM+F
RXのARMに対する優位性がよくわからない。
ルネサスの全面サポートがあるからマイコンにはいいんだろうけど、
それはD/Aコンバータ買ったらおまけで付いてきたコアがたまたまRXだった、みたいな話で、
別におまけはARMでも構わないだろう、と。

202:Socket774
11/11/09 15:38:17.66 kVU5uXh9
Niagaraの失敗を見てもAMDは何も学ばなかったようだな。

203:Socket774
11/11/09 18:49:14.26 Vban78Wt
>>196
大型コンピューター用のOAKはJEFっていうんだぜ。

204:Socket774
11/11/10 09:43:36.82 GMIxkngh
Niagaraは失敗じゃないyo!

205:Socket774
11/11/10 18:44:32.62 Kfh1/tzs
URLﾘﾝｸ(livedoor.blogimg.jp)

206:Socket774
11/11/10 21:28:10.30 vtMmLWuT
糞なコアをたくさん積んでも糞は糞でしかない。

207:Socket774
11/11/10 22:30:50.00 SUJUpFk+
>>205
流石のビッグブルー。

208:,,・´∀｀・,,）っ-○○○
11/11/11 01:51:27.39 lEV7BMte
>>201
ARMはでかすぎるだろｗｗｗ
携帯電話にPentium 4を載せようって言ってるようなもの。

RXはM16Cの系譜で十分な実績がある。ボタン電池で動くような機器にも使われてるぜ。
とはいっても三菱を中心とした国内家電メーカーのガラパゴスプラットフォームが主戦場なんだけどね。

209:Socket774
11/11/11 11:00:05.55 y5bnUGEx
ARMv8でレジスタ倍増して、コンディションビットが削られて、
なんか普通のRISCになってきた件
実はMIPSで良くね?

210:,,・´∀｀・,,）っ-○○○
11/11/11 21:03:47.91 lEV7BMte
MIPSってARMが台頭してから斜陽って印象あるけどいまだに時価総額ではIntelの倍もあるんだよな。

211:Socket774
11/11/11 21:39:52.54 BQdc+Z2g
んな馬鹿な

212:,,・´∀｀・,,）っ-○○○
11/11/11 22:02:16.40 lEV7BMte
URLﾘﾝｸ(finance.yahoo.com)
Market Cap: 273.30M

URLﾘﾝｸ(finance.yahoo.com)
Market Cap: 122.51B

MとB読み間違えてた

213:Socket774
11/11/11 22:07:37.99 ZsiHYzJb
だんごも人間だなｗ

214:Socket774
11/11/11 22:11:38.97 UARXw3tP
えっ

215:Socket774
11/11/11 23:11:31.66 /rubVh8/
lol

216:Socket774
11/11/11 23:38:51.01 sbpA7QMM
URLﾘﾝｸ(news.mynavi.jp)
> オペコードは32bitで、レジスタ指定ビットは5bitとなる。命令によってはこれに32bitまたは64bitのオペランドが続く。
32/64/96bit可変長? 相変わらずRISCらしくない。Thumb-2もそうだけど。

217:Socket774
11/11/11 23:52:37.78 FN/1HnC6
>>75の資料にはそんなこは書かれていない
ライターの勘違いだろ

218:,,・´∀｀・,,）っ-○○○
11/11/11 23:54:36.10 lEV7BMte
x86フォーマットの利点を部分的に取り入れた形だね。
従来のARMのようなリテラルプールからのロードはコストが大きい。
命令フェッチと同時に即値が得られるメリットは大きい。

219:,,・´∀｀・,,）っ-○○○
11/11/11 23:55:17.93 lEV7BMte
>>217
まあ単なるリテラルプールかもしれないね

220:Socket774
11/11/12 00:07:47.27 IvUr1heL
A64はThumbなしでx86のオブジェクトコードサイズに対抗出来るのか?

221:Socket774
11/11/12 00:44:55.20 yYVXMI0w
レジスタフィールドに各5bit使っちゃうとさすがに16bit化はできなそうだよな

222:Socket774
11/11/12 01:06:38.48 8gOK4EVR
ThumbもコンディションビットもARMの差別化要因だったのに、
それを捨てての32レジスタ化はやや疑問

223:,,・´∀｀・,,）っ-○○○
11/11/12 01:29:11.61 rlP+RKEI
汎用レジスタは31本じゃね？
32本目はゼロレジスタなのか、あるいは特別な意味（たとえば11111＝即値参照）を持つのか
どっちやろね？

224:Socket774
11/11/12 02:19:52.00 U45BaRXO
ゼロレジスタはあるようだが32本目として実装されてるのかは分からんな。

225:Socket774
11/11/12 02:54:07.90 yYVXMI0w
知らなかったがNECのV800シリーズはリテラルがあるときだけ32bitで通常命令は16bitだったのな
URLﾘﾝｸ(www.cqpub.co.jp)

226:Socket774
11/11/12 11:24:50.41 IvUr1heL
31か32かは問題ではない

227:,,・´∀｀・,,）っ-○○○
11/11/12 11:53:51.03 rlP+RKEI
問題あるよ。11111Bがレジスタではない別のオペランドを表現できる可能性があるからね。

228:Socket774
11/11/12 12:03:31.81 8gOK4EVR
いやそれもちょっとは問題だけど、レジスタ指定が4bitか5bitかに比べれば些細な問題だろう

229:,,・´∀｀・,,）っ-○○○
11/11/12 12:10:35.57 0Rl4D2Is
Knights*のSIMDは5ビットになるけどね

230:Socket774
11/11/12 17:29:41.07 tY9Kax8N
IEE７５４形式の単精度型で表現できる数の最大の正の数
正規化された数で最小の正の数、最小の正の数がわかりません
おしえてくださいｍｍ

231:Socket774
11/11/12 17:56:13.02 BqqThEFE
逆にベクトル演算は32本じゃ足りないのでは?

232:,,・´∀｀・,,）っ-○○○
11/11/12 18:28:59.08 9Qg5HDCp
16x16単精度の行列積でギリギリ足りる程度。

233:Socket774
11/11/12 22:17:49.39 8gOK4EVR
512bit*32本ってSPEの128bit*128本と同じサイズなのか。

234:,,・´∀｀・,,）っ-○○○
11/11/12 22:26:53.12 9Qg5HDCp
更に4つのスレッドごとにあるから4倍だね。
SIMDレジスタだけで1コアあたり8KB。
冷静に考えると凄い量だよな。

235:Socket774
11/11/12 23:06:16.05 8gOK4EVR
多い分だけL1キャッシュ並のレイテンシなんじゃないの?

236:Socket774
11/11/13 00:03:21.42 jL9bcfGb
IPFは未だにL1$のレーテンシが1だが

237:Socket774
11/11/13 00:13:00.04 014AhMR2
クロックいくつの話だろう

238:,,・´∀｀・,,）っ-○○○
11/11/13 01:16:19.61 T27q85rv
>>235
L1キャッシュのアクセスはタグ引きがあるから番号と物理位置がすぐに求まるレジスタファイルには勝てない。
レジスタリネーミングとかやりだすとまた話は別だけどね。

239:,,・´∀｀・,,）っ-○○○
11/11/13 01:22:12.27 T27q85rv
GPUでは数十KBあるけどやはりレイテンシは大きいらしいね。
使いやすくするために次世代Teslaではレジスタファイルの階層化やるって話だから
キャッシュとあんまり変わらなくなるかも。

240:Socket774
11/11/13 01:36:08.54 AFjtl6VE
Knights Cornerを安価にばらまいてくれたら
いろいろやってみる機会ができて面白いだろうになあ
一般向けでバーゲン価格はありえないかもしれないけど

241:Socket774
11/11/13 02:00:17.52 Utilcmxj
>>239
＞GPUでは数十KBあるけどやはりレイテンシは大きいらしいね。
シェアードメモリのことかな？
やっぱいくつかで共有するとアービトレーションでレイテンシかかるのかな。

242:,,・´∀｀・,,）っ-○○○
11/11/13 02:31:37.97 T27q85rv
いや、レジスタファイルそのものがでかい。
単精度×32768本って何バイト？

243:Socket774
11/11/13 03:13:38.55 Utilcmxj
えっ、レジスタなのにレイテンシ大きいの？
最悪じゃん。

244:Socket774
11/11/13 03:44:13.48 DOg34JEF
それを隠蔽するのがGPUの真骨頂だからなぁ　＞レイテンシを最適化するCPUとスループットを最適化するGPU

数百クロックのメモリレイテンシを隠蔽するために長大なパイプラインと膨大なレジスタが必要になるわけで。
そして膨大なレジスタの搭載でレイテンシが長くてもパイプラインである程度は隠蔽できるしね。
フルHDなら常に200万スレッドが並走しているからレイテンシよりも容量を取ってもおかしくない。

245:Socket774
11/11/13 07:11:40.39 LN6eg/Tp
GPUは、レジスタへのアクセス（とシェアードメモリ）はレイテンシがマルチスレッドで完全に隠蔽できて、実質1クロック

246:Socket774
11/11/13 22:38:45.60 lCs86oaR
>>244
200万スレッドw
1pixel1スレッドw
どんだけ無駄な設計だよw

247:,,・´∀｀・,,）っ-○○○
11/11/13 22:42:46.62 T27q85rv
512SPで8192スレッドくらいだったような。

248:Socket774
11/11/13 22:44:39.56 y3Ce4y6z
>>246
シェーダープログラム書いてみ？　１ピクセル１スレッドだから。

249:,,・´∀｀・,,）っ-○○○
11/11/13 22:48:12.02 T27q85rv
同時処理するわけじゃないからね。

250:Socket774
11/11/13 22:48:32.89 014AhMR2
物事は様々な抽象レベルで考えるんだ

251:Socket774
11/11/13 23:12:55.54 lCs86oaR
>>248
GPUってデバッガで実行過程をトレースすることもできないのに
シェーダのソースコードだけから物理的な動作を推測するのは無理があるわw

252:Socket774
11/11/13 23:45:12.33 LN6eg/Tp
Parallel Nsight使え

253:Socket774
11/11/13 23:52:49.81 Utilcmxj
なるほど。
GPUはレイテンシをうまく隠蔽してるんだね。

254:Socket774
11/11/14 00:26:23.84 ak2saiFA
CPU　ヨボヨボで1つのことしかこなせない老人
GPU　いろんな人から多くの仕事を任せられる若者

って感じか

255:Socket774
11/11/14 00:33:54.70 FGGcGxSM
CPU　少数だけど頭が柔らかい人
GPU　いっぱいいるけど頭が硬い人

こんな感じだろ

256:Socket774
11/11/14 00:36:44.30 Bvkz2l47
CPU … 数個の複雑な仕事をこなせる職人
GPU … 数千単位の単純な仕事をこなす工場

ってカンジだと。
生産性では大量生産な工場に敵わないが、
オーダーメイドでいろいろな仕事を熟せるCPUさん。

257:Socket774
11/11/14 00:40:02.34 +CNvzy9s
CPUは老練な感じがするね。

258:,,・´∀｀・,,）っ-○○○
11/11/14 00:57:34.26 JD7xK2Zg
何か指示をしたら全員同じ動きをする人々

259:Socket774
11/11/14 01:03:05.37 +CNvzy9s
日本人みたいだな。

260:Socket774
11/11/14 02:38:22.79 /X0n8WLm
>>238
タグ引きはL1では並列に行うからレイテンシは増やさないよ
レジスタファイルはポート数大きいしレイテンシで特に有利ということはない

レジスタの見かけのレイテンシが小さく見えるのは
実行ユニット間でのフォワーディングがあるからだよ

>>239
NVIDIAがレジスタキャッシュを導入するのは消費電力を減らすのが主な目的らしい
CPUもレジスタキャッシュを持ったものはあるけど
これはポート数を増やすのがしんどいから見かけのポート数を増やすのが目的

AMDのVLIWはフォワーディングでレジスタのレイテンシを隠蔽している

>>248
GPUで言うところのスレッドは複数スレッドでPCを共有しているから
CPUのスレッドとは数え方が違う
言うまでもないかもしれないが

261:Socket774
11/11/14 16:38:51.48 cQRpyNQk
D.E Shaw研究所はAntonと呼ぶ分子動力学(Molecular Dynamics:MD)計算専用のスパコンを開発し、その最初のシステムでのシミュレーション結果を発表した。

タンパク質のフォールディングではミリ秒程度のシミュレーションを
行わないとどのように折りたたまれて行くかが分からないのであるが、
汎用スパコンでのシミュレーションでは1日掛かって100ns程度に
相当するシミュレーションしか出来ず、msのシミュレーションには
何万日も掛かってしまうので、実用的ではない。
これを専用アーキテクチャで100倍程度加速すれば、実行可能な範囲に
入るというのがAnton開発の狙いである。

D.E.Shaw氏が創立したD.E.Shaw & Coは運用資産2.5兆円の
世界最大規模のヘッジファンドであるが、現在は、Shaw氏は
ヘッジファンドの日常のマネジメントには携わらず、
D.E.Shaw Researchのチーフサイエンティストとして、
MDのアルゴリズムやAntonシステムの開発を行っているという。
そして、同研究所の運用費用はShaw氏のポケットマネーで賄われていると
言われている。

このAntonの512ノードシステムの最初の2台が完成し、それを用いて、
2万3,558原子のDHFR(5DFR)では10.4μs/day、11万6,650原子の
T7Lig(1AOI)では3.06μs/dayの性能を達成した。
URLﾘﾝｸ(news.mynavi.jp)

262:,,・´∀｀・,,）っ-○○○
11/11/14 17:38:53.58 JD7xK2Zg
>>260
論理レジスタと物理レジスタのマッピングが一致してる場合においてはレジスタ番号から
レジスタファイル上の位置の算出は低コストでできるでしょ。

キャッシュはヒットを確認してからはじめて転送できるので、確実にデータの存在が保証される
レジスタと同等のレイテンシってことはないはず（あくまで同等の容量と仮定した場合の話）

263:Socket774
11/11/14 23:41:47.15 MWtnjh65
バフェット氏のバークシャー、ＩＢＭ株を107億ドルで購入－ＣＮＢＣ
URLﾘﾝｸ(www.bloomberg.co.jp)

264:Socket774
11/11/15 01:13:02.64 RPSb6iGS
>>262
レジスタファイルはアドレッシングは簡単でもポート数が多いのでレイテンシが大きくなるという話だよ

265:,,・´∀｀・,,）っ-○○○
11/11/15 01:22:09.78 Cr2GvgSQ
それはL1のRead/Writeポート数を増やしても同じことだ

266:Socket774
11/11/15 01:28:39.77 P4uo+OFN
まぁ、DRAMのレイテンシに比べたらかわいいもんだ。

267:Socket774
11/11/15 08:40:11.45 alKNyBpn
日本の家電メーカーはこぞってARMに向かっているのだね。

東芝「レグザ」，パナソニック「ビエラ」など，最新テレビの映像エンジンを支えるARMのCPUコア
URLﾘﾝｸ(www.4gamer.net)

268:Socket774
11/11/15 08:54:47.31 CtWv9QlY
>>265
L1はせいぜい2ポートとかだけど
レジスタファイルはSNBのPRFなら多分7ポートとかそれくらい

そもそもレジスタファイルのレイテンシはほとんどの場合隠蔽される

269:Socket774
11/11/15 09:00:12.30 alKNyBpn
ついでに、ARM Technical Symposia 2011 Japanの他の記事
URLﾘﾝｸ(www.4gamer.net)
URLﾘﾝｸ(www.4gamer.net)
URLﾘﾝｸ(www.4gamer.net)

270:Socket774
11/11/15 23:19:14.66 dOqUwe6R
このｽﾚはKnights Cornerの話が
あまり出てきてなさそうだね

将来、京を負かすかもしれないぞ?

271:Socket774
11/11/15 23:33:03.32 M+XUj+BO
じゃあ、お前がネタ振りすればいいだろ
最近なんかトピックあったっけ？

272:Socket774
11/11/16 01:40:17.71 dgvdiitO
こないだIntelが複数のペタ級スパコンに採用されたよ！！って発表して以来特になんもない

273:,,・´∀｀・,,）っ-○○○
11/11/16 03:04:06.02 iPcYYMFW
機密保持契約破ってまで話したがるベンダーもユーザーもいないでしょ。

274:Socket774
11/11/16 03:16:41.93 VoaI1vrk
米国国策事業に組み込まれたからどうでもええわ

275:,,・´∀｀・,,）っ-○○○
11/11/16 03:25:02.22 iPcYYMFW
東大の次期スパコン、中国の大手IT企業浪潮と提携とか、おまいらがスルーしてただけで、
今年の7月以降大きな話題だらけだったしな。
あとは次のIDFあたりを待つくらいか。

276:Socket774
11/11/16 03:27:33.27 qvMADfQv
個人向けに売ってくれることを祈るだけｗ

277:Socket774
11/11/16 03:39:29.08 tLFbwzqP
>「Intel Federalは世界最高のスパコンを作り上げることを目的として
>米国政府と協力して立ち上げた」と米国政府との緊密性をアピール

278:Socket774
11/11/16 04:32:36.71 7nRxkD9l
大学研究機関が主要顧客なんだし
Knightsはもっと情報出してもいいとおもうんだけどな

279:Socket774
11/11/16 04:53:51.39 dgvdiitO
こないだCERNが出した発表でも使ったのKnightsFerryだったしパートナーのとこにもまだCornerは届いてないとか？

280:,,・´∀｀・,,）っ-○○○
11/11/16 07:27:06.84 iPcYYMFW
現状、Larrabee 1の倍精度強化版である以上の何かだとは思ってないんだけどな。

281:Socket774
11/11/16 07:50:46.96 a0ElPuLG
【スパコン世界一「京」の全貌】
「世界最速」を実現したアーキテクチャ
URLﾘﾝｸ(itpro.nikkeibp.co.jp)
新機能満載のCPUとTofuインターコネクト
URLﾘﾝｸ(itpro.nikkeibp.co.jp)
プログラム実行とMPI通信を高速化
URLﾘﾝｸ(itpro.nikkeibp.co.jp)

282:Socket774
11/11/16 08:15:48.84 ztjVMwFg
東大の次期スパコンってこれじゃないの？

東京大学情報基盤センター、スパコンシステム刷新--PRIMEHPC FX10を4800ノード
URLﾘﾝｸ(japan.zdnet.com)

283:Socket774
11/11/16 08:44:02.75 CXSQmpeK
>>279
Cornerは22nmノードだから、今作ってるところ

のはず

284:Socket774
11/11/16 20:06:40.30 /RfE+OZP
64bit後発組は、先発組にくらべてデコーダ負荷が軽くなる命令セット採用しやすくなるから有利じゃね？
先発組は、互換性維持したまま性能揚げないといけないので、デコーダがどんどん複雑になるが、
後発組はデコーダがシンプルになる命令セットにできるからな

285:,,・´∀｀・,,）っ-○○○
11/11/16 20:52:47.09 iPcYYMFW
PRIMERGY RX300のほうならいけるかなと思ったけどはPCIeボード刺さりそうに無いな。
RICCの入れ替えには使えそう。

286:Socket774
11/11/16 21:31:50.36 /QFnuRJw
MICが東大のスパコンで使われるって何処情報なん？
研究開発には使用してるみたいだけど

287:,,・´∀｀・,,）っ-○○○
11/11/16 21:56:55.99 iPcYYMFW
研究開発だけして使わない手は無いでしょ
まあ、東大のアカポス受け入れ先の国研あたりならいくらでも入る余地はあると思ってるが。

Opteronはなくなったとは思ったがVenusは意外だった。

288:Socket774
11/11/16 22:02:14.06 lo5v5tzi
KnightsCorner来たよ
URLﾘﾝｸ(www.xbitlabs.com)

289:Socket774
11/11/16 22:06:05.26 /QFnuRJw
何だルーマーでもなく妄想を吹聴してただけか

290:,,・´∀｀・,,）っ-○○○
11/11/16 22:10:26.67 iPcYYMFW
倍精度で1Tなら単精度だと2Tは出るのか。

291:Socket774
11/11/16 22:10:46.59 hj3oZ/F8
>>288
> Interestingly, but the KNC accelerator is not just a PCI Express accelerator like its predecessor,
> the Knights Ferry compute accelerator for software developers,
> but looks like CPU that plugs into a socket or a special adapter.
何気にすごい事書いてあるんだけど

292:Socket774
11/11/16 22:11:24.24 hj3oZ/F8
QPI版ktkrってこと？

293:,,・´∀｀・,,）っ-○○○
11/11/16 22:25:51.15 iPcYYMFW
京は早くも国会版事業仕分けで予算削減対象に祭り上げられてるがMICの影響もあるんだろうな。
日本主導の技術ってなんでこうもガラパゴス化するんだろうな。

WiMAX2がdocomoのLTE帯域増加より先行するとか。

294:,,・´∀｀・,,）っ-○○○
11/11/16 22:36:45.46 iPcYYMFW
あれ？ひょっとしてWestmere-EXと同じLGA1567か？
URLﾘﾝｸ(img.club.pchome.net)

295:Socket774
11/11/16 23:14:17.10 02wRMdCb
Itaniumとか見てると、システムベンダもIntelの非主流チップの舟には乗りにくいんじゃないか

296:Socket774
11/11/16 23:20:46.78 PRQQPRpb
URLﾘﾝｸ(www.xbitlabs.com)
これじゃメモリ帯域足りなすぎで実効性能出ないっしょ

297:,,・´∀｀・,,）っ-○○○
11/11/16 23:34:40.11 iPcYYMFW
DRAM混載前提だな

298:Socket774
11/11/16 23:35:23.14 tw/xpRHh
Intelは、新アーキテクチャで技術的に優れてるけれど互換性が無い新CPUを作るも商業的に成功せず、
自社の互換性があるCPUが商業的に成功してきた

IA64でも、過去のインテルのCPUの法則とおなじようになった

いまや、PA-RISCの後継機として、HP-UX専用CPU化してるな

299:Socket774
11/11/16 23:42:06.64 t32s0ZdB
メニーコアにソフトウェアの対応は追いつくのかな?
多少ワットパフォーマンスが落ちる程度なら、従来通りのリッチコアの方が
ソフトウェアは数段書きやすいような。

300:Socket774
11/11/16 23:47:17.16 EkOolI4e
Itaniumって技術的に優れてるの?
最初から全然ダメにしか見えなかったが。

301:Socket774
11/11/16 23:59:29.81 6Og8WK5r
TSVか

302:301
11/11/17 00:00:31.91 6Og8WK5r
>297 宛な

303:Socket774
11/11/17 00:04:54.79 na+c1KzK
まあ来る来る言ってなかなか来ない技術の一つですがね……

URLﾘﾝｸ(202.218.219.41)
> 450mmウエハー、EUV、TSV、半導体製造の最新技術は実用化のめども立たず

304:Socket774
11/11/17 00:22:26.40 umKNouZr
短波長のEUVへ移行せずに16nmを製造するって？　マジか
おじさんは頭が古いからびっくりだ

305:Socket774
11/11/17 00:27:27.73 umKNouZr
URLﾘﾝｸ(news.mynavi.jp)
Wide IO Mobile RAMは約1200の端子だからTSV

これはTSVの実用化には該当しないの？

306:Socket774
11/11/17 00:40:05.50 na+c1KzK
サンプル出荷は出来た。予定通り2012年中に量産も開始できるかもしれない。
しかし離陸できるかどうかは、なんともわからんのですよ。

URLﾘﾝｸ(pc.watch.impress.co.jp)
> TSVの量産準備ができているかどうかについては、JEDEC内部でも見解がわかれている。
> 今回のカンファレンスでBill Gervas氏はTSVは少なくとも2016年まではスピードイー
> ルドの面から準備が整わないと発言。それに対して、メモリの部会を束ねるDesi Rhoden
> (デジー・ローデン)氏(Chairman, JEDEC JC-42: Solid State Memories)が、「JEDECの
> 見解は、TSVは現在すでに準備ができているというものだ」と反駁する一幕があった。

307:Socket774
11/11/17 00:42:20.21 Kbxcu78w
メモリ側の方という意味では該当しますよ。ただこれはあくまで容量・速度を稼ぐためのメモリ内部のTSVであって、この後ロジックと接続するという工程があり、
そこに関してはまだこれから開発するという段階です。メモリ内部のTSVの応用ではサーバー向け大容量モジュール(32～64GB)が開発され既にサンプル出荷されています。
兎にも角にも問題はロジックとメモリとの積層で、ここでは後工程メーカー（パッケージング、ダイ加工・接続など）、半導体ファブなどとの連携が必要ですし、
デバグ・テストも相当な苦労が要ります。それと当然ですが加工自体が相当な歩留まりを落とす要因でありますから、メリットがそれを上回るかできる限り不良品を出さないかの
努力がまだ追いついていませんでしょうね。下手に加工失敗すればウェハでは良品でも不良品になっちゃいますから。

308:Socket774
11/11/17 00:48:48.85 mNtps0XJ
マジでDRAM混載しないかな。
セットでイイじゃん、もう。
レイテンシ劇減りでみんなハッピー。

309:Socket774
11/11/17 00:54:05.50 Kbxcu78w
熱（はあと）
積層接続間の経年劣化も結構気になるところではあります。

310:Socket774
11/11/17 00:57:13.27 mNtps0XJ
フォン・ノイマンが現代を生きていたら、プロセッサの性能は違っていただろうか･･･

311:Socket774
11/11/17 05:48:36.96 gmf+EPHn
熱問題が出るような用途は
積層でなくてシリコンインターポーザ使うんでないの？

312:Socket774
11/11/17 10:58:40.25 2dHuUS9E
TSVじゃないけどTSVと同じように使える積層チップはすでにソニーが実用化して使用してるな
原理上２層までしか無理で３層以上には使えないけどMCLってやつ

313:Socket774
11/11/17 14:46:24.90 umKNouZr
2004年にはこんなこと言ってたのにな

>米Intel社は2009年の32nm世代半導体製造技術量産に向けて，波長が
>13.4nmの光源を使うEUV(extreme ultraviolet：極紫外線)リソグラフィ技術を
>研究してきたが，それが実用化に向けた開発段階になったことを明らかにした。
URLﾘﾝｸ(techon.nikkeibp.co.jp)

314:Socket774
11/11/17 15:02:52.92 VVYxBFrh
EUVは光源出力が量産レベルには足りない
数年前はEUVマスクの欠陥を検査する方法が無いとかいう笑えない話もあったが解決したのかな

315:Socket774
11/11/17 19:50:39.26 CIVizuwi
KLAが開発したじゃなかったっけ？
後はレジストと一番最大な問題光源だな。

未だに平均30Wで15WPHとか話しにならん

316:Socket774
11/11/17 22:33:32.53 y57/jaoC
印刷以外の方法でトランジスタ形成できないものか。

317:Socket774
11/11/17 23:17:51.97 U99XJNWw
電子ビーム直描

318:Socket774
11/11/17 23:20:04.21 mNtps0XJ
ちょｗ量産でｗｗｗ

319:Socket774
11/11/18 00:40:22.80 XqnW1ixr
印刷以外の方法で　同じくらい安く　トランジスタ形成

320:Socket774
11/11/19 10:45:29.51 xIm2Liy1
タンパク質の勝手に整列する性質を利用して云々というのを
いつぞや新聞か何かで見たような。

321:Socket774
11/11/19 13:01:28.68 PjvX6VpV
DNAコンピュータの原理を改良して配線づくりか。新しいな。

322:Socket774
11/11/19 13:21:17.33 ZQ7Ge7PR
新聞でたまに◯◯技術を開発みたいなのがでるが、
ああいったのの９割以上は実用化せずにお蔵入りだからな

323:Socket774
11/11/20 09:37:33.71 UCJ0QIk0
価格を下げたり利益を出したりするのはもっと難しい
レアメタルみたいに痛い目を見ないとｗ

324:Socket774
11/11/21 23:40:51.51 wUvFXnJ5
URLﾘﾝｸ(cybergarden.cocolog-nifty.com)

AMDの32nmは歩留まりで苦戦しているが、Intelよりトランジスタが小さい。なんで20億トランジスタが300平方mmなんだ?
GLOBALFOUNDERIESは凄いことをしている。最高だぜ!

325:Socket774
11/11/21 23:46:43.31 zfmv3eWw
>>324
The Interlagos chip has a total of 2.4 billion transitions, which means the Valencia chip has 1.2 billion.
URLﾘﾝｸ(www.theregister.co.uk)

実は12億トランジスタでした
最初20億とでたのは間違い

326:Socket774
11/11/22 00:38:01.26 GCEFOAA9
モジュールx4とL3だけで12億超えそうだけどな

327:Socket774
11/11/22 00:57:42.87 XVOOGEAh
間違いというかてきとーに見積もっただけですかね。にしてもかなりスカスカな感じです。まあダイ写真見ても明らかですけど。
ノースブリッジは既存のK10からかなり流用したというらしいので、そこら辺のレイアウトが甘いんでしょうかね。
といっても1Module+L2で213MいくのでL3とあわせるとどう考えても足りんような気がします。

一応GPUにトランジスタを使えばかなりの密度には詰め込めるようなので、GFの32nmSOIは性能より密度重視なのでしょう。
（Llano 4Coreは1450Mに対して228mm^2で1mm^2あたり6.36M、Bulldozerを2Bとしたときの1mm^2あたりの密度はほぼ同じ6.35M）

328:,,・´∀｀・,,）っ-○○○
11/11/22 01:07:33.62 reyen26Y
どっちでもいいじゃん。
トランジスタの量は結果を得るためのコストであって、消費者が求める結果（性能）そのものではない。
本当に20億も使ってこんな程度のものしか作れないならx86から逃げてもまともなもの作れないぜ。

329:,,・´∀｀・,,）っ-○○○
11/11/22 01:10:33.41 reyen26Y
>>327
低クロック動作だと密度あげられるからね。
CPUでもL3キャッシュのクロックをコアより落とし密度をあげて容量増やすのは常套手段だし
（キャッシュの場合クロックだけじゃなくて平均アクセス頻度も少ないけど）

330:,,・´∀｀・,,）っ-○○○
11/11/22 22:13:22.64 reyen26Y
俺のスレストぶりは半端ない

331:Socket774
11/11/22 22:14:38.05 o4wpKpTF
おまえってセコンドガレッジやってるほう？
たまには更新しろよ

332:,,・´∀｀・,,）っ-○○○
11/11/22 22:28:26.84 reyen26Y
レンタル料3年分纏め払いしてそれ以降払ってない。
故に今月いっぱいで閉鎖。

333:Socket774
11/11/23 02:02:38.97 ZSEGTZX/
だんごさん、AVXやってる？
あれ速い？
SSE2系の延長で考えていい？

334:Socket774
11/11/23 12:42:11.78 vYM1HkSG
なぜここで
ム板の汗スレじゃいかんのか

335:Socket774
11/11/23 14:24:38.07 sEh8QXTP
インデックス修飾はどのような目的で作られたアドレッシングモードなのか
教えてください

336:Socket774
11/11/23 17:28:42.10 Q+Hu7iID
x = ar[3];

337:Socket774
11/11/26 10:07:02.49 RNSKGm+6
ソフトウェアトランザクショナルメモリのハードウェア支援は
Rockと共に消失?

338:Socket774
11/11/26 11:14:55.81 E514+JLY
64バイトのキャッシュラインを単位に、複数のラインを同時に書き換え監視したり
atomicに更新できたりすると、夢がひろがりんぐ。

339:Socket774
11/11/26 13:19:37.46 Tml2pRZY
>>337
BG/Qで復活

340:Socket774
11/11/26 13:25:17.55 E514+JLY
URLﾘﾝｸ(news.mynavi.jp)
これだ! 素晴らしい。

341:Socket774
11/11/26 17:16:29.03 s4W95dtS
tbbのcache_aligned_allocatorとatomic使えばよくね？

342:Socket774
11/11/26 17:39:32.64 gxKc78+W
>>341
TBBのatomicってよく知らないけどただのクリティカルセクションじゃないの？
だとすると複数のクリティカルセクションを合成したときにデッドロックが発生する可能性がある
STMはそれをプログラマが特に考慮する必要がない

ただ、純粋にソフトウェアで実装するとマジで重いので
バリアとかをハードウェアで実装して高速化する

343:Socket774
11/11/26 17:41:32.96 gxKc78+W
変な書き方をしてしまった
クリティカルセクション -> ロックを使ったクリティカルセクション

344:Socket774
11/11/26 19:25:30.11 E514+JLY
ロックを使った排他制御は、メニーコアにスケールさせたときに性能劣化が激しいのも問題。
クアッドコアで1コアが共有資源をロックして、他3コアを待たせるのは許容範囲でも、
メニーコアで他の15コアとか63コアとかを待たせると、結果として待ちだらけになってしまうからね。

345:Socket774
11/11/26 19:45:43.93 JqHPUTc4
ロックとかスヌープとかないようにできないんかな。
コア増えるほど頭打ちになってくじゃん。

346:Socket774
11/11/26 20:03:55.74 E514+JLY
BG/Qのmulti-versioned cacheは他アーキテクチャに広まればかなり有望かと。

347:Socket774
11/11/26 20:09:44.85 izktWWga
Itaniumにも似たような機能なかったっけ

348:Socket774
11/11/26 20:17:57.37 E514+JLY
無いと思う。
> BG/Qが実用化されると、トランザクションメモリのハードウェアサポートを
> 持つ初めてのプロセサとなる。
と本文にもある。

349:Socket774
11/11/26 21:16:39.80 s4W95dtS
>>344-345
parallel_reduceを使えばロックは結構な割合で削減できるしパフォーマンスもコア数に比例して上がる事が多い

350:Socket774
11/11/26 21:25:49.48 E514+JLY
>>349
ここでやりたいのは並列処理じゃなくて、
たとえば一つの連結リスト(同等の機能を提供する構造であれば何でもいいが)という共有資源に対して
どう効率よく並行アクセスを許すか、という話なのだ。

351:Socket774
11/11/27 03:06:32.10 g/uiiUxD
>>344
待たなかったら正常動作しないんだからしょうがない
４個と１６個じゃプログラム設計から変えないとならんがメモリは一本だからヤル気出ねぇ

352:Socket774
11/11/27 04:40:03.01 S3cb5ypX
よく最適化された同期ルーチンは
ほぼmfenceのコスト
つまりロード・ストアキューのフラッシュのコスト
なんでSTMだろうがロックだろうがあんまりかわらん

まぁOpenMPですら多くの場合ろくに最適化されてない
最適化されたロックは自作するほかないという現状は問題ではあるが

353:Socket774
11/11/27 06:25:35.19 X4h1uf+C
この場合に着目している排他制御のコストは
ロック方式の場合、実際にロックが衝突してスピンで待たされる事象かと。
STMというロックのない同期(代わりにリトライはあるが)をいかに低コストで実装するかを考えたときに
IBMの回答がマルチバージョン化L2キャッシュによるハードウェア支援。
RockはL1だけだったので一歩踏み込んでいる。

しかし、トランザクション中、プロセスコンテキストスイッチとかL2をフラッシュするような事象に
対応できるのだろうか……?
ひょっとしてHPC限定なのだろうか。

354:Socket774
11/11/27 07:22:01.68 6jXdGQU6
結局、マルチバージョンとか楽観的並行制御とか
トランザクション処理で研究されてきた手法になるのか……？

355:Socket774
11/11/27 11:01:23.94 l+fyjYfS
マルチスレッドや同期の説明が詳しいアーキテクチャの本ってないの?

356:Socket774
11/11/27 14:03:05.27 8LUvJufy
これかな
URLﾘﾝｸ(www.amazon.co.jp)

357:Socket774
11/11/27 18:41:19.85 S3cb5ypX
STMでもコア間通信をメモリシステムを介しておこなう以上
衝突がなくてもメモリオーダリングを保証する必要がある
現代のx86CPUではここにコストがかかってしまう

358:Socket774
11/11/27 19:26:52.36 +BBan95l
>>357
x86を駆逐すると言われているARMだと低コストなの？

359:Socket774
11/11/27 20:05:56.75 QOcm5FUv
>>355
まずはTanenbaum先生から学ぶのを強くおすすめしておく。
URLﾘﾝｸ(www.amazon.co.jp)
> モダンオペレーティングシステム原書第2版 [単行本]

360:Socket774
11/11/27 20:06:05.30 bo6+qjty
>>358
誰がそんな寝言を?

361:355
11/11/27 23:14:49.27 l+fyjYfS
>>356, >>359
thx。今度買って読んでみるなり。最近めっきりソフト事情わからんので。

362:Socket774
11/11/28 00:49:48.08 nZys/Ktu
>>360
そういえばAMDスレの気違いが言ってたな。

363:Socket774
11/11/28 00:51:26.04 OvAxwLmt
スーパーファミコンについて質問だけど、
スーパーファミコンのCPUは16bitで、
メモリ容量は64KBまでしか扱えないはずだけど、
メインRAMだけで128KBも搭載しているのはどうして？

364:Socket774
11/11/28 00:55:52.14 cYUakT45
セグメント方式を採用してるのかな？

365:Socket774
11/11/28 01:00:00.72 G530zl56
>>363
SFC/SNESのCPUは65816互換の16bitチップで24bit(16MB)のメモリ空間を持つ。
命令カウンタやアドレスレジスタは16bit長なんでバンクアクセスだけど。

366:Socket774
11/11/28 01:00:01.50 nZys/Ktu
>>363
URLﾘﾝｸ(ja.wikipedia.org)(%e3%82%b3%e3%83%b3%e3%83%94%e3%83%a5%e3%83%bc%e3%82%bf)
アドレスは24bit。

367:Socket774
11/11/28 01:22:03.41 OvAxwLmt
なるほど。
残りの8Mbitはどうやってメモリ空間を確保しているんですか？

でもCPUが16bitだから、一度に扱えるプログラムの最大量は64KBが限度ですか？

368:Socket774
11/11/28 01:28:21.03 PWNpyKXW
君のパソコンにも付いているx86の元祖16bit CPUのi8086だって16bit CPUで1MBも扱えたよ。

369:Socket774
11/11/28 01:32:42.11 G530zl56
>>367
基本は16bitアドレス＋8bitのバンクレジスタ値＝24bitアドレスだが、24bitダイレクトアドレスを
扱う命令も持ってる

URLﾘﾝｸ(hp.vector.co.jp)

370:Socket774
11/11/28 01:37:38.49 OvAxwLmt
つまり、16MBのメモリ空間を256個に分割し、
16bitCPUから64KBのメモリ256個にアクセスできるように見せているんですか？

371:Socket774
11/11/28 07:23:57.83 4zQT3kTK
>>357
え？
キャッシュ経由、あるいは内部バス経由で届かなかったっけ？

372:Socket774
11/11/28 12:50:08.20 j/RjBP71
>>371
チップ内バス経由でもコストがかかるということ
大体だけどロードストア片方なら50cycle両方なら100cycleくらいかかる

373:Socket774
11/11/28 19:27:51.22 4zQT3kTK
>>372
把握

しかしFXのインターコアレイテンシでかいな・・・
昨日Sandraで計ったが棒グラフが飛び出してやがる

374:Socket774
11/11/28 19:29:37.91 cYUakT45
いつもメモリアクセスが足を引っ張る。

375:Socket774
11/11/28 21:38:22.70 OvAxwLmt
ここにはSFCのCPUは64KB×256バンクと書いてある

URLﾘﾝｸ(www.d-colors.net)

376:Socket774
11/11/29 10:32:45.64 ESmoCS4I
65816は24ビットアドレッシングに対応してるんだよね?
64180みたいに、64KB空間内に別のアドレス領域を呼び出す形じゃないと
バンク「切り替え」とは呼びづらい印象

377:Socket774
11/11/29 18:45:38.37 V664wuwR
65816は一部のアドレッシングモードで24ビットリニアアドレスに対応している
>>369のリンク先が正確

かなり嫌なCPUだった

378:Socket774
11/11/29 18:59:50.87 BsFBzaDa
マルチコアから高性能コアで進化を目指すインテルのCPU
URLﾘﾝｸ(plusd.itmedia.co.jp)

379:Socket774
11/11/29 19:03:54.17 V664wuwR
でもないな
スタック相対アドレッシングが二つ抜けている

380:Socket774
11/11/29 19:13:37.34 s/l3GAGD
>>378
うん
やっぱこの企業アホだわ・・・

381:Socket774
11/11/29 19:25:33.48 V664wuwR
と、中卒ひきこもりが申しております

382:Socket774
11/11/29 19:35:17.22 BsFBzaDa
ID:s/l3GAGD

Socket AM3/AM3+マザー総合 Part4
596 ：Socket774[sage]：2011/11/29(火) 01:18:48.37 ID:s/l3GAGD
>>595
オンボならソレくらい大目に見てやれよ・・・
価格から言えばC/P最強なだけある

それでもBulldozerを買った漏れは豪傑
588 ：Socket774[sage]：2011/11/29(火) 01:21:01.38 ID:s/l3GAGD
>>586
俺貴族か
なら貴族らしく憐れな民をAMDへと導いていかねばならぬな

【AM3+】AMD FX総合 2台目【Bulldozer】
481 ：Socket774[sage]：2011/11/29(火) 11:23:00.18 ID:s/l3GAGD
k15statはよ

【AM3+】AMD FX総合 2台目【Bulldozer】
489 ：Socket774[sage]：2011/11/29(火) 17:46:39.65 ID:s/l3GAGD
>>486
実際はCPUとかの場合色々と要素があるから単純にはいかないけど
まぁ大まかにはそうだね

それでもBulldozerを買った漏れは豪傑
603 ：Socket774[sage]：2011/11/29(火) 19:06:50.68 ID:s/l3GAGD
>>601
同感

マジな話、自身で使ってみるまでわかんねぇ

383:Socket774
11/11/29 21:57:03.94 M4jKqbzM
CPUは1Gヘルツぐらいにクロック周波数を抑え、
コアを16コアぐらいにした方がいいんじゃないの？

384:Socket774
11/11/29 21:58:08.94 q0VU5NZY
つ「シングルスレッド性能」

385:Socket774
11/11/29 22:09:19.79 P5LxLEmN
処理にはほぼ必ず並列化できない部分があり、アムダールの法則により、
シングルスレッド性能は依然として重要。
メニーコアCPUの代表・SPARC T1は1.4GHzの低クロックコアで始まったが、
最新のT4では3.0GHzの「普通の」コアになっている。

386:Socket774
11/11/29 22:11:13.10 lRNv0DQ2
EPIC+OoOEでも1GHzじゃC2Dに負けるな

387:Socket774
11/11/29 22:30:11.28 M4jKqbzM
>>384-385
だよね。
OSやソフトが必ずしもマルチコアに対応しているとは限らないから。

388:Socket774
11/11/29 23:14:17.83 rW23Gh8f
PGの立場からすると性能を上げるためのマルチスレッドって難しいし面倒なんだよね
排他処理だとか同期だとか何だとか
GPGPUが何だとか騒がれててもなかなか一般用途に降りてこないのはそのせい

GPGPUを本気で普及させたいなら、勝手に並列化してくれるコンパイラが必須だと思うわ
何も考えなくても勝手にMMXやSSE使ってくれるIntelコンパイラみたいにさ

389:Socket774
11/11/29 23:24:05.91 AXPxuOSq
ICCはそんなに賢くないよ。使ったことあるの？
SIMD化できるのは単純なループ位
まともにSIMDを活用するにはintrinsicsを使わざるを得ないのが現状

GPUを使った自動アクセラレーションとか実用には程遠い
OpenMP程度のセマンティクスすらGPUコードの自動生成とかできない
そもそもGPUでまともな性能を出すためにはアルゴリズムから調整しなおす必要がある
GPUにポートしたのにCPUよりワットパフォーマンスが悪化するなんてことは簡単に起きる

どうせ人力が必要ならせめて書きやすくしたいよねってことでC++AMPとかが提案されている

390:Socket774
11/11/29 23:41:46.71 s/l3GAGD
>>381
残念ながら高卒だ
まぁアホなのは自他ともに認める

391:Socket774
11/11/30 00:37:54.44 U/q7yGsd
先日のIDFでIntelはCilk Plusをアピールしてたな
Xeon用のコードを書いておけばMICへの対応はリコンパイルだけで良いと

392:Socket774
11/11/30 00:39:55.06 5tFd22DD
>>390
正直でいいなｗ
まあ統計では高卒以下って決して少数派じゃないんだけどね。

393:Socket774
11/11/30 01:13:54.75 Dw2YNB+j
>>378
Intelすげぇな･･･
わくわくしてきたぞ。

394:Socket774
11/11/30 02:14:33.62 sDhY0nUo
スマートフォンや組み込み向けでGPUを積極的に利用する動きが盛んだから
そこから逆輸入される展開もありじゃね

395:Socket774
11/11/30 17:48:59.46 LwEgcoZn
ゲームにしか使われてないじゃん

396:Socket774
11/11/30 20:15:28.61 j5ymgfwb
米クレイ、京大からスパコン受注　富士通「京」に競り勝つ
スーパーコンピューター専業の米クレイ（ワシントン州）が、京都大学の次期スパコンを受注した。
学術情報メディアセンターに納入、2012年５月に稼働させる。旧帝大７校が海外製スパコンを主要機種として採用するのは初めて。
京大は1969年以来、富士通の牙城だった。受注額は外部記憶装置などを含め40億円未満。クレイは今回の受注を機に、国立大学や公共研究機関への販売を強化する。

397:Socket774
11/11/30 20:25:41.66 aBgYbdRO
>>388
ソフト屋さんでもマルチスレッドってそんなに難しいの?
俺はBASICやC、Javaの基礎しか知らないタコなんだけど。

マシンを会社組織になぞらえて、この処理は山田さん（山田スレッド）、この処理は鈴木さん（鈴木スレッド）
忙しいときにはみんなで手分けする、呼び出し（メッセージ）をやり取りして。
単純だけど大量の処理は下請けの爺費有(GPU)さんに外注する。

そんな素人の考えじゃだめなのかな

398:Socket774
11/11/30 20:56:23.47 5mvHBE8Z
>>397
山田さんの仕事の結果次第で鈴木さんの仕事が変わるような処理が多い

399:Socket774
11/11/30 21:27:41.42 sDhY0nUo
>>395
んなこたぁない
普通の操作の画面遷移にGPU支援使うのはもう当たり前になって来てる
GPGPUもどんどん使っちゃおうぜって流れも

400:Socket774
11/11/30 21:31:29.94 BSOM0wor
>>397
「アムダールの法則」
www.ne.jp/asahi/comp/tarusan/AMDAHAL.jpg

401:Socket774
11/11/30 21:41:50.37 BSOM0wor
間違えて画像だけのそれも不完全URL張ってしまった…

古いがわかりやすいブログ記事
URLﾘﾝｸ(www.ne.jp)
同トランジスタ数でコア数を変えた場合の性能グラフ
URLﾘﾝｸ(www.ne.jp)
HTやBulldozerのような手法が有効な理由のグラフ
URLﾘﾝｸ(www.ne.jp)

402:397
11/11/30 22:02:46.68 aBgYbdRO
進捗報告会議・対応再検討スレッドも必要になるのか
動的にコードを書き換えて再コンパイル・リンクみたいで訳わからなくなるわ

403:Socket774
11/11/30 22:07:08.66 +rXwWkIl
>>396
クレイってことは、これOpteronなのか？

404:Socket774
11/11/30 22:09:59.15 2uIjQAjY
>>397
> 忙しいときにはみんなで手分けする、呼び出し（メッセージ）をやり取りして。
手分けする処理を予め決めておかないといけない
呼び出しあってﾃﾞｯﾄﾞﾛｯｸが発生するとｱｳﾄ

とはいえ、ﾏに任される現状のままではﾏﾙﾁｽﾚｯﾄﾞ化は進まないね。
ｺﾝﾊﾟｲﾗやﾊｰﾄﾞの支援も欲しい。
依存関係がなくて空きコアがあれば、自動でｽﾚｯﾄﾞを分ける、
くらいのｺﾝﾊﾟｲﾗとﾊｰﾄﾞは作れるはず。

405:Socket774
11/11/30 22:14:42.80 6LhwoOoq
仮想化サーバのように、無関係な処理を持ってこない限り、
依存関係がない、ということは無い。

406:,,・´∀｀・,,）っ-○○○
11/11/30 22:29:33.52 BLsBPrps
>>403
Xeonもあるからなぁ。
Magny-Coursからのアップグレードならともかく、Opteronを今選ぶ意味ってあんま無い気がするんだが。

407:Socket774
11/11/30 22:30:14.73 oo875wwP
>>404
C言語の仕様で依存関係の有無を判定するのは無理だろ
ポインタで指された先の領域がどこかでオーバーラップしてるかもしれないんよ

408:Socket774
11/11/30 22:32:01.92 oo875wwP
>>406
XE6らしいよ
URLﾘﾝｸ(dreammakerk.blog92.fc2.com)

409:Socket774
11/11/30 22:56:30.75 QJ/zeYrz
2位じゃダメですね、入札も

410:Socket774
11/11/30 23:15:21.40 jT2q8XBk
>>397
マルチスレッド自体は別に難しくないぞ
山田さんが営業して、鈴木さんが電話番して、佐藤さんが会計処理するみたいな感じなら

難しいのは3人で分担して会計処理をして早く仕事を終わらせろって言われた場合
分担をきちんと決めておかないと作業が重複して無駄になるし、
二人以上同時に同じ書類を見られないから、誰かが使ってたら使い終わるまで待たなきゃいけなかったり
Aを処理するためにはBとCの情報が必要で、Bを処理するためにはDを…なんて場合もあるし

そういった諸々を勘案してプログラムを作るのが面倒くさくて難しいってお話

411:Socket774
11/12/01 15:14:20.44 Do65qa+4
64kBの頃にはメモリーを確保するのに少しの量、少しの期間の占有も
無駄は省かなければ、みたいな感じがあったが、
今、メモリーを少し余分な期間や分量を確保してもあまり気にしていない
プログラマは多いだろう。保守性の高さとか、メモリー最適化よりも
優先したいことことがいくつか考えられる。

今はせいぜい1ソケット20スレッドくらいだから、どのスレッドも常に
フル稼働するのがハードを生かすよいソース、と考えている。
もしも使えるスレッド数が数桁ほど増えたら、立ち上げたスレッドに
暇そうにしてる時間があってもあまり気にしなくなるかもしれない

412:Socket774
11/12/01 15:36:56.78 wde0wUa6
リッチコアはコスト高いが、
メニーコアのインターコネクトはもっとコスト高い。

413:Socket774
11/12/01 15:37:35.92 Do65qa+4
>>403
12年のはOpteronだな。予定通りに14年に追加があるならそっちは
インターコネクトがPCI-EのCascade だから、その時点で性能のいい方になるだろう

414:Socket774
11/12/03 02:14:38.21 0PWAawPk
ﾌﾞﾙの評価が、意外と悪くない
URLﾘﾝｸ(news.mynavi.jp)
大原評

・サーバ用のCPUとして使う限りはSandyに匹敵する性能
・これをデスクトップPC向けに流用したことが論外、暴挙。
みたいな感想が書かれている。
デスクトップPC用のCPUとして使う限り、PhenomIIと比べても少し劣る性能しか出ない。とね。

415:Socket774
11/12/03 02:35:04.73 go6ULmKY
大原自身は最初のころより随分発言が変わってるけどなｗ

URLﾘﾝｸ(ascii.jp)

＞独立した3つのALU命令と3つのLoad命令であれば、実質1.5サイクルで処理できることになる。
つまり、単純に「IPCが減った」と言い切れない構成に変わったわけだ。
Load命令＋ALU命令であっても、実質的なスループットはむしろK10よりも向上する可能性が高い。

それが

＞本来ならIPCが3→2に下がっているのだから、これを補うためには動作周波数を50%引き上げる必要がある。

416:Socket774
11/12/03 03:14:49.56 OjyaBmr3
庇おうとして庇いきれなかった
最低限現行アーキテクチャと同等の性能はあるだろうという低めの予想をも下回った

417:Socket774
11/12/03 03:16:16.80 dcYG1PdD
1年くらい前はAMD自身がK10→BullはIPCも向上するって言ってたから

418:Socket774
11/12/03 04:07:35.11 cj9P9sX8
実行ユニットが減ったから2命令でぴったり張り付いてるグラフはある意味笑えた

419:Socket774
11/12/03 06:50:25.61 2a8NDgog
相変わらず長い

420:Socket774
11/12/03 13:36:44.51 qVme7aJ5
噂: 3GHzCPU、768MBRAM…国内開発者がWii Uの具体的なスペックをリーク
URLﾘﾝｸ(gs.inside-games.jp)

421:Socket774
11/12/03 14:17:45.46 Jvwn3hJZ
G3系と970系で若干違うとはいえ
Broadwayの拡張がXenon風PowerPCのクアッドというのはわかりやすいが、
DRAM内蔵等で差異化できないと
本当にXbox360を遅れて出しただけになってしまうな。

次ページ