CPUアーキテクチャについて語れ 8at JISAKU
CPUアーキテクチャについて語れ 8 - 暇つぶし2ch300:・∀・)っ-○◎●
07/05/13 10:00:43 4phbdK/b
あたまがわるいひとが無理してむずかしいことを書こうとすると
不要に英単語をちりばめて自体を読みづらくすることくらいしかできない
※無論全部英文で書くことなんてできない。おそらくTOEIC300レベルだから

むろん内容自体は大したことは言っていない

301:MACオタ
07/05/13 10:18:16 mSmGJBHJ
TheRegisterのPOWER6サーバーに関する報道す。今月中にも発表されるが、対応OS
であるAIX 5.4わ遅れるとのことす。
URLリンク(www.theregister.co.uk)
  ---------------------------
  Most notably, IBM has shifted from an out of order design with Power5's integer
  units to an in order design with Power6. Such a drastic change will require first
  AIX 5.4 and then a full software recompile should customers want to see maximum
  performance.
  ---------------------------
Power Mac G5発売時のOS Xの状況と同じす(笑) Ashlee Vance記者自身わ、まだ
POWER6の製造問題を疑っているみたいす。チップとして歩留まりが悪そうなのわ当然
すけど、意図的にFUDをバラまいてるヒトがいるのかもしれないす。
  ---------------------------
  We've heard consistent speculation that a manufacturing issue has crippled IBM's
  ability to produce Power6 chips above 3.5GHz. Customers, however, were promised
  that the initial Power6-based systems will indeed come in above 4.0GHz, during the
  recent IBM ParterWorld event in St. Louis.
  ---------------------------
  

302:・∀・)っ-○◎●
07/05/13 10:19:00 4phbdK/b
>>290
spu-gccは一応、SCE純正のコンパイラなんだけどな。

ただ、メモリレイアウト云々にめんどくさいことに気を遣わなきゃいけないのは
最初からSIMD化するんだよね。
SCEも明示的にSIMD組み込み関数使えば性能が16倍出ますよって公言してる。

確かにspu-gccで明示的にSIMD化すればかなり性能良いコード吐く。
スケジューリングも悪くない。

そもそもスカラが遅いのはCellのアーキテクチャ・実装の問題だと思ってる。
SSEみたいにパーシャルリード・ライトをサポートすればかなり変わってくる筈。

303:MACオタ>302 さん
07/05/13 10:24:17 mSmGJBHJ
>>302
  -------------------
  パーシャルリード・ライトをサポート
  -------------------
>>300のように他人を非難するなら、ここわ」「ワードやバイトデータのロード/ストア」
とか書くべきかと。。。

304:Socket774
07/05/13 10:30:00 3XsG4Rg1
>>301
> a full software recompile

ああ、やっぱそうなのね

305:・∀・)っ-○◎●
07/05/13 10:34:22 4phbdK/b
あと、レトロ人間君はそんなに英単語使いたいなら全部英文で書いてください。
And Letroman, if you like to write English-terms so much, please write without Japanese.

306:・∀・)っ-○◎●
07/05/13 10:35:38 4phbdK/b
おっとRetromanだったかな。綴りがわかりません><


307:・∀・)っ-○◎●
07/05/13 10:40:05 4phbdK/b
① パーシャルリード・ライトをサポート

② ワードやバイトデータのロード/ストアをサポート

どっちが回りくどいかね。
SSEのmovss/movsdはパーシャルリード・ライトでしょう
少なくとも1バイトの読み書きは聞いたことがない。
pinsrb/pextrbはSSE4で初めてサポートされる機能だ


308:・∀・)っ-○◎●
07/05/13 10:45:47 4phbdK/b
もっともパーシャルリードかどうかは実装依存だ。

第一要素にスカラデータをロードしろという仕様はあるが
その他の要素は不定するように仕様で決まってる。

pinsrw/pextrw/maskmovq/maskmovdquはパーシャルライトだな

309:263
07/05/13 10:52:35 QCrMuaRU
>>268
あいてしてくれて、ありがとう
すんませんね、なにぶんしろーとなもんでw

310:・∀・)っ-○◎●
07/05/13 10:56:23 4phbdK/b
SPEネタその続き。
16バイト境界にあわせても、ストア時にパディング領域を破壊していいかどうかの情報は
コンパイラにはわからないので、保持のためのコードを生成してしまうね。
結局SIMD組み込み関数を明示的に使うしかなかったり。

そもそもLSが256KBしかない。
パディングなんてしてられないでしょ。

311:Socket774
07/05/13 11:24:18 esNK0p2y
>>305
団子さん、はっきり言ってしつこすぎだ。
内容に対する突っ込みが>>265だけで、英単語云々に対する
突っ込みが黙々と続くのはいかがなもんかとおもうぞ。

312:・∀・)っ-○◎●
07/05/13 11:44:28 4phbdK/b
内容がないんだからそこくらいしか突っ込むところ無いじゃん
いまだにvectorの意味を誤解してるし

313:・∀・)っ-○◎●
07/05/13 12:11:02 4phbdK/b
ちなみに内容なんて、前スレで論破された記憶を喪失して
同じことを連呼してる以上のことは何もない。

したがって、何も理解しようとする必要なんてない。
英単語に置き換えて読みづらくしてるだけで相変わらず知識の狭さを露見してるだけ。

無理して英語を使おうと必死な痛い子よりもお塩ロックのほうがまだ聴けるよ
ファッキンライト

314:MACオタ>団子 さん
07/05/13 12:34:16 mSmGJBHJ
>>307-308
  ---------------------
  どっちが回りくどいかね。
  ---------------------
分野にもよるのかも知れないすけど、パーシャルリード・ライトという用語わ、バーストアクセスの方が
普通であるメモリやバス、ネットワークのアクセスで使うす。
URLリンク(www.google.co.jp)

315:MACオタ@続き
07/05/13 12:35:06 mSmGJBHJ
ただQWORD以外のスカラデータでのロード/ストアわ、CELL BEが生き残ることができれば将来
の実装で追加される可能性わ大きいと思うす。歴史を鑑みても初期のAlpha AXPの実装もこんなんす。
URLリンク(www.hpl.hp.com)
  --------------------
  Only aligned longwords or quadwords may be accessed: an aligned
  longword is a four-byte datum whose address is a multiple of four; an
  aligned quadword is an eight-byte datum whose address is a multiple of
  eight.
  --------------------
微細化でトランジスタや配線が楽になれば、LSがマルチポート化されてMFCとSPUが並列動作
できるようになるのも、ありそうな話す。

そういう意味でわ団子さんの最近の文句もPower.orgやIBMのフォーラムでもっと大っぴらに書けば
建設的展開があるかもしれないす。

316:・∀・)っ-○◎●
07/05/13 12:54:19 4phbdK/b
過渡期の技術など、残る必要ない。
過去の資産を受け継いできたIntelプロセッサに部分技術が採り入れられて
Cellの役目は終わり。

317:Socket774
07/05/13 12:58:23 zMR3hkxO
そういえばLarrabeeってどうよ
URLリンク(arstechnica.com)

318:MACオタ>団子 さん
07/05/13 12:58:54 mSmGJBHJ
>>316
  --------------------
  Intelプロセッサに部分技術が採り入れられてCellの役目は終わり。
  --------------------
まあ確かにAlpha自体がその良い前例す。

319:Socket774
07/05/13 13:04:06 2HN+BF3d
>>302
配列じゃない独立データだったら、パディング入れてメモリアクセスがシン
プルになってコードサイズが減少する分を考慮すると、パディングの増分を
埋め合わせて黒字になったりする。とはいえ、さっさとスカラアクセス入れ
やがれってのは同意。

なんにせよ、できるだけレジスタに載せるとか、SIMD命令の明示的な利用ま
で含めてチューニングすれば「スカラ」なコードもかなり救える。そんなの
めんどくさくてやってられっか、という意見はもっともだが、CODECが速い
のはそこらへんのテクニックを総動員しているからだったりする。

決して「CODEC向きのプロセッサだから」じゃないんだよ。

320:Socket774
07/05/13 13:05:39 KbejpFwJ
関係ないけど
「Sonyはついに狂ったのか?」by 安藤さん

321:Socket774
07/05/13 13:09:52 zMR3hkxO
ビキニトップをペイントと見抜く眼力はさすが

322:MACオタ>320 さん
07/05/13 13:10:08 mSmGJBHJ
>>320
このスレッド向けの話題だと、APLの件でSUNから散々な仕打ちを受けた安藤氏がRock開発遅延
の報道で嬉しそうなのが。。。

323:Socket774
07/05/13 13:22:06 zMR3hkxO
Larrabeeでなくて?

324:Socket774
07/05/13 18:32:15 Cocyux0E
>>320-323 リンク貼ってください
URLリンク(www.geocities.jp)

>>323
> a subset of the x86 ISA that includes some GPU-specific extensions
ISAかデコーダがグタグタになる悪寒。512ビット幅のベクトルユニットってのも。
あと、
10コア以上でL2$共有って、>10ポートのメモリで同時アクセス可能?

325:Socket774
07/05/13 18:55:22 2HN+BF3d
>>324
> 10コア以上でL2$共有って、>10ポートのメモリで同時アクセス可能?

コア毎に専属の領域を設けるとコア-メモリのIFは無理なく作れるが、その外
が大変。L2をマルチバンクメモリにするとバスとバッファに面積を食われる。

326:・∀・)っ-○◎●
07/05/13 20:36:32 4phbdK/b
どのみちレイテンシすさまじいんだからおもっきしリッチな命令を
コンプレックスデコーダでデコードさせるんでない?
x86は一応15バイト命令まではいける。


327:Socket774
07/05/14 16:00:54 4RkPiqF4

URLリンク(www.procable.jp)
URLリンク(www.procable.jp)
>IBMやモトローラなど、デジタルの欠落の怖さを知り尽くしているメーカー

328:MACオタ
07/05/14 19:02:40 T+HlRhKp
IBMがpSeriesのホームページにPOWER6サーバー発表のリンクを載せてしまって
発表日が5/22とバレちゃったす。リンク先自体わ存在しないすけど。。。
今のところ訂正されてないみたいす。
URLリンク(www-03.ibm.com)
同時期にAIX 6の概要も公開するみたいすね。

329:Socket774
07/05/15 00:07:40 DAK+PHlT
おもろいな。学閥とか持ち出して来た。分かりやすく説明するのが得意なのは
分からない奴の気持ちが分かってるということだからな。
頭の良さとは関係ない。学者が教師として適格かどうかなんてどうでもいいのと同じ。


330:Socket774
07/05/15 00:31:48 ugtYNHZl
キチガイは怖いな

331:・∀・)っ-○◎●
07/05/15 01:49:53 g2fqtQte
>>329
いや、問題大あり。

民間資金や競争資金引っ張ってこなくとも潤沢に固定予算もらえてた時代ならいざしらず
校費等は大幅削減だからネクラ学者さんは総あぼーんの構図だな。

いまどきブンケイ相手にでも研究概要説明できない学者さんは資金の調達できねーわなw
つーか営業力のある教授さんって民間で揉まれた人が多いと思う。

332:・∀・)っ-○◎●
07/05/15 01:55:33 g2fqtQte
講義内容を学生が評価する制度も始まってたと把握してるが

333:Socket774
07/05/15 13:05:50 Qhik7DiC
そもそもレトリック=聞伝の不必要に英語句に置き換えてものを書く癖は、
本人はかっこいいと思っているのだろうが、知的でもなければ技巧的でもない。
ただ無駄に読みづらくしてるだけで、珍走団の当て字と同じくらいDQN臭い。

334:Socket774
07/05/15 21:45:22 RbudYLPI
Sun, allies broaden open-source chip push
URLリンク(news.com.com)

Niagara2もオープンソース化される模様

335:Socket774
07/05/16 14:28:44 /mFcQcRx
相変わらず尾ひれにしか食いつかない魚だねぇ。。。

336:Socket774
07/05/16 22:18:29 6MqYh9iO
Sun licenses tech to ARM
URLリンク(www.theinquirer.net)

NiagaraみたいなARMが出るのかな?

337:Socket774
07/05/16 22:28:39 6MqYh9iO
サンの新しいチップ、UltraSPARC T2とVictoria Fallsに何が期待できるのか?
~さらなる省電力とパフォーマンスの向上に向けたサンの挑戦~
URLリンク(jp.sun.com)

Victoria Fallsはニコイチで256スレッドを実現

338:MACオタ>337 さん
07/05/16 22:37:07 DXFF0AHi
>>337
  ----------------
  Victoria Fallsはニコイチで256スレッドを実現
  ----------------
SMP対応ってだけす。
URLリンク(japan.zdnet.com)
  ================
  Victoria Fallsは、Niagara 2チップを2基搭載するサーバ向けチップ。
  ================

339:Socket774
07/05/16 22:38:56 Bk+6QBGT
>>336-337
向こうとのマルチうぜー

340:Socket774
07/05/16 23:01:47 dpwRmuBu
>>337は256スレッド、>>338は128スレッドになってるね

341:Socket774
07/05/17 00:27:50 CFvy1yPf
>>339
すまなかった
もうやらない

342:Socket774
07/05/17 13:53:05 Pa5lcBrt
「----------------」と「================」、うぜー

343:Socket774
07/05/17 18:20:08 ZOtzqh2A
「~(主語)~わ~(述語)~す。」、うぜー

344:Socket774
07/05/17 19:07:30 hq7DgWgr
>>342-34
こっちでも粘着か

345:Socket774
07/05/17 22:34:55 t/dagiTx
うぜーうぜー、うぜー

346:Socket774
07/05/18 17:40:00 G+bTfjwm
韓国女子高生

URLリンク(bbs.enjoykorea.jp)

347:Socket774
07/05/18 19:50:07 4m+N1Mb2
うぜー

348:Socket774
07/05/18 19:57:54 HZNiIH2b
IBM、間もなく「POWER6」プロセッサ搭載サーバをリリースへ
URLリンク(japan.cnet.com)

349:Socket774
07/05/19 00:06:32 V3d6ErrN
セガサターンの、32bitCPU2つで64bit級!
みたいに、メニイコアCPUで、コア複数使って32,64,128,256bitを再現してくれないかな。
無理だな。

350:・∀・)っ-○◎●
07/05/19 00:22:19 fxEwOSS4
情報弱者を騙すための宣伝文句じゃん。

疑似128ビットマシンなら大学の情報処理センターにあったなぁ

351:Socket774
07/05/19 01:09:59 oHwoEMKx
>>349
SPARCの仕様には128bit浮動小数点演算命令が有るよ。
命令自体が実装されているのか、例外からルーチン呼んで計算してるのか知らんけど。

352:MACオタ
07/05/19 01:31:41 kXRlW1BL
あまりにも。。。イタいす(笑)
URLリンク(upyolic.ath.cx)
  ----------------------
  PowerPCとの互換性も期待される優秀なプロセッサであるPOWER6、Intelのインチキな
  オモチャのハードウェアもどきではなく、PowerPCのMacもぜひ復活させてもらいたいですね。
  ----------------------

353:MACオタ
07/05/19 01:38:29 kXRlW1BL
>>348 さん
これ、CNETの英文記事の原題わ"IBM to debut Power6 servers Tuesday"ってことで、
>>328わ正しかったす。 当然すけど。。。
URLリンク(news.com.com)

>>350 団子 さん
  --------------------------
  疑似128ビットマシンなら大学の情報処理センターにあったなぁ
  --------------------------
どのマシンのことすか?

354:Socket774
07/05/19 02:13:49 4KeLygxc
vanguard?

355:Socket774
07/05/19 10:40:57 e1N5P+oy
>>353
つか本文に5月22日ってはっきり書いてあるじゃん
英語は読めても日本語は読めないんだな

356:Socket774
07/05/19 14:42:31 r/AoOl6f
本文に5月22日ってはっきり書いてあるす。
英語わ読めても日本語わ読めないんすね。

なるほど

357:・∀・)っ-○◎●
07/05/20 01:15:11 fYWDPP0c
教授がほざいてただけだからなぁ。
ソフトウェアで128ビットのアドレス空間をシミュレートしてるだとか

思い違いで、実は四倍精度浮動小数が使えるだけとかって落ちも十分考えられ。
実物見たこと無いし。



Sunは基本的に複雑なオペレーションはOSが無効命令をトラップして実行する
って思想だよな。

358:Socket774
07/05/20 01:42:44 KFUhKkDI
>>357
巨大論理アドレス空間のならいろいろあるけど
大型機由来のセグメントのあるやつ(x86含む)はたいてい巨大だ

思想もなにも後でインプリしたとき遅いだろ

359:MACオタ>団子 さん
07/05/20 07:46:37 basf+1Lb
>>357
  ------------------
  教授がほざいてただけだからなぁ。 [以下、略]
  ------------------
また口からでまかせすか。。。

360:MACオタ>団子 さん
07/05/20 08:04:03 basf+1Lb
ここで油売ってるより、また「もっさり」スレッドがTXネタで伸びてるすよ。
スレリンク(jisaku板:258-番)
  -------------------
  258 :Socket774:2007/05/18(金) 00:00:00 ID:HcBSNHdn
>>257
マジレスしとくと
OCerには日常茶飯事だよ
耐久探るのに、Orthos or TX or TAT回しながら、ブラウズなんてのは結構頻繁、
そこで直ぐ気付くのが>3だったりする
  [中略]
  282 :Socket774:2007/05/18(金) 00:56:42 ID:HcBSNHdn
  >>277
  やってみた?
  結果>50だったでしょ?
  E6700を見る限りじゃ超もっさり+鈍足TX(2MTrips/sec未満)だろ。
  見てて可哀そうになったw
  -------------------



361:Socket774
07/05/20 13:34:24 9FOaoPIu
MACオタの引用うぜー

362:・∀・)っ-○◎●
07/05/20 14:05:43 fYWDPP0c
時刻だけは凄いな。
「わざわざ速度リミッタ紹介してるんだから、使えよwwww」
とだけレスするにも面倒だ


363:MACオタ
07/05/20 17:51:15 basf+1Lb
TheRegister経由のPOWER6情報す。
Oracleが8-way POWER6/4.7GHz搭載のp570のベンチマーク結果を公開しているす。
URLリンク(www.theregister.co.uk)
URLリンク(www.oracle.com)
URLリンク(www.oracle.com)
URLリンク(www.oracle.com)

364:MACオタ@続き
07/05/20 17:59:04 basf+1Lb
上の話すけど、Oracle 11i (11.5.10)のMedium Configuration Benchmark で、レスポンス時間[秒]
でこういった結果す。POWER5に対して十分性能を上げてきたと見るべきかと思うす。
POWER6/4.7GHz x 8 (2100 users): 0.625 [sec]
 POWER5+/2.2GHz x 8 (2000 users): 0.983 [sec]

365:MACオタ@続き
07/05/20 18:16:18 basf+1Lb
POWER5+とPOWER6の結果の比較としてわ、こちらの方が正しいやりかたかもしれないす。
URLリンク(www.realworldtech.com)
  -------------------------
  8 core Power6 4.7Ghz 2700 users @0.702sec repsonse time
  8 core Power5+ 2.2Ghz 1400 users @0.712sec response time
  -------------------------
同じ応答時間で、約2倍のユーザー数を処理しているす。

366:Socket774
07/05/20 18:24:50 z3qYfrTl
へぇ、立派なもんやね。
でもこの手のベンチで高得点出すのってどんどんクラスタ化されていってるような…
商機あんのかね?
1年後にはSMTが再導入されたNeharemが控えてるし、商売としては厳しそうな気がするのだが…

367:Socket774
07/05/20 19:19:58 mdtJk1va
ATI-AMDのR600について語る奴はおらんのか?面白そうだぞ。

368:Socket774
07/05/20 19:35:32 beMuSC86
>>367
それはGPUだろう。蛋白質解析とかGPGPUのスコアでも出ないと。

369:MACオタ
07/05/20 19:38:35 basf+1Lb
ベンチマークの詳細を見ると、
  ・8 x 4.7GHz IBM POWER6 processor chip (SMT-enabled), each witth L2 Cache of
   4MB per core and L3 Cache of 32MB per single Core Module (SCM)
とあるす。POWER5の時と同様にSCM版が先行して、MCMのハイエンド構成わ遅れるということに
なりそうす。
ちなみにOSわPOWER6完全対応じゃないAIX 5.3で、当然POWER6用にリコンパイルなんて
されてない市販のOracle E-Business Suite 11i (11.5.10)のベンチすから、既存アプリでin-order
の悪影響で性能が上がらないという心配わ、大きな問題になるわけじゃない模様す。


370:Socket774
07/05/21 00:48:21 ZLOm1OG/
もうじき問題点もばれるよ。
power.orgの記述はまんざらガセじゃない。

371:MACオタ>370 さん
07/05/21 01:20:44 iRi2b267
>>370
SPECだとリコンパイル済みだし、既存アプリでの問題があったとしても検証結果が一般に
理解される形で公開されるのわ、難しいかと思うす。

372:Socket774
07/05/21 02:09:08 Abac/PjX
>>371
compilerのp6 scheduling対応はまだ不十分だと思う
それ以外にも…

373:MACオタ
07/05/22 05:29:24 TVO4r9wN
既報通りPOWER6搭載のp570が発表されたす。
URLリンク(www-03.ibm.com)
  ------------------------------
  The System p 570 server offers clients 2- to 16-core POWER6 processor configurations at
  speeds of 3.5, 4.2 or 4.7 GHz in an easily expandable 4U (4 EIA units) rack mount modular
  package. Each p570 building block accommodates two processor cards, each of which
  provides two 64-bit POWER6 processor cores, 8 MB of Level 2 (L2) cache and 32 MB of
  Level 3 (L3) cache. The p570 provides memory capacity of up to 192 GB per building block
  or 768 GB per system, depending on memory speed
  ------------------------------

374:MACオタ@続き
07/05/22 05:45:46 TVO4r9wN
4.7GHz版に関してわ、秋になるまで入手不可能というオチがついているすけど、TheRegisterの
記事でわ、製造上の問題でわ無いとのコメントが出ているす。
URLリンク(www-03.ibm.com)
  ---------------------------
  - The 4.2 GHz POWER6 2-core processor card with eight memory DIMM slots
   (FC 5621) . available only for model upgrades from 9117-570 to 9117-MMA . and the
   4 GB, 8 GB and 4/8 GB 533 MHz DDR2 POWER5 memory features (FCs 7893, 7894
   and 4495) are planned for availability November 16, 2007.
  - Model upgrades from 9117-570 to 9117-MMA that include the 4.2 GHz POWER6 2-
   core processor card with twelve memory DIMM slots (FC 5622) are planned to begin
   September 7, 2007.
  ---------------------------
URLリンク(www.theregister.co.uk)
  ---------------------------
  McCredie denied speculation that IBM will struggle to produce enough of the 4.7GHz chips
  to satisfy near-term demand.
  "We have been enjoying very good yields and supply capability," he said.
  ---------------------------

375:MACオタ@続き
07/05/22 06:00:14 TVO4r9wN
SPECの結果わ、こちらす。
URLリンク(www-03.ibm.com)
             SPECint_2006     SPECfp_2006 (いずれも peak/base)
 POWER6/4.7GHz   21.6/17.8        22.3/18.7
 Woodcrest/3GHz   18.1/17.5        17.7/17.1
Montecito/1.6GHz   15.7/14.5        18.1/17.3

参照:
Woodcrest/3.0GHz
 Int: URLリンク(www.spec.org)
 Fp: URLリンク(www.spec.org)
Montecito/1.6GHz/24MB L2
 Int: URLリンク(www.spec.org)
 Fp: URLリンク(www.spec.org)

376:MACオタ@ここまで
07/05/22 06:06:03 TVO4r9wN
その他の各種業界標準ベンチマークの結果わ、こちらに掲載されているす。
URLリンク(www-03.ibm.com)

377:Socket774
07/05/22 21:08:24 Ba8l/F+m
     /.:.:\ +          ,..-─- 、
  く\ノ.:.:.:.:.:.: \       /. : : : : : : : : : \
   \\:.:.:.:.:.:.:__ヽ     /.: : : : : : : : : : : : : : ヽ
     \\:./       ,!::: : : :,-…-…-ミ: : : : :',  
      \\      {:: : : : :i '⌒_, ,_⌒' i: : : : :}  
        \\     {:: : : : | ェェ  ェェ |: : : : :}
.        \\.   { : : : :|   ,.、   |:: : : :;!  
            rヘ \_ ..ヾ: :: :i r‐-ニ-┐ | : : :ノ  
          }  >'´.-!、 ゞイ! ヽ 二゙ノ イゞ‐′
         |    -!   \` ー一'´丿
         ノ    ,二!\   \___/   /`丶、
        /\  /   \\  /~ト、   /    l \
       / 、 `ソ!     \\l::::|ハ/     l-7 _ヽ
      /\  ,へi       r''ー-ゝ_`ヽ、    |_厂 _゙:、
      ∧   ̄ ,ト|      >‐ ̄`    \.  | .r'´  ヽ、
     ,ヘ \_,. ' | |      丁二_   7\、|イ _/ ̄ \
     i   \   ハ∟       |::::|`''ー-、,_/  /\_  _/⌒



378:Socket774
07/05/22 21:46:14 BtmcHDPF
URLリンク(pc.watch.impress.co.jp)
この写真みればだいたいわかる

379:Socket774
07/05/22 22:47:45 JvCGJhc/
POWER6Mac期待してもいいよね?

380:Socket774
07/05/22 22:52:41 JlBdBpsF
…真性?

381:Socket774
07/05/22 23:01:33 nIOXaSJh
>>378
ずいぶん細かいところまで四角く切ってるよね
下の方の階層は細かく切らないのが最近の傾向かと思ってたけど
そうでもないのかな

382:Socket774
07/05/23 00:19:07 Muwzv6NS
インテルがHPCに本腰,専用プラットフォームの普及狙う
URLリンク(itpro.nikkeibp.co.jp)

> S3000PT仕様のボードが搭載できるプロセサ数は1個だけ。
> その代わり,大きさは通常のサーバー用マザーボードの半分で,
> 1Uのサーバー機に2枚搭載する形を採る。ボードに搭載した
> メイン・メモリーを1個のプロセサが占有できる。

383:Socket774
07/05/23 00:56:52 YMv2wvTc
>>381
っていうかデュアルコアのはずなのにどことどこが同じコアなのか分からん。
下側で左右にコアがあると思うのだが微妙にレイアウトが違うような。
光の加減かな。



って書こうとしたら下にスクロールしてないことに気づいた。
細かく区切ってあるのは徹底したチューニングの成果ということなんだろうか。
これで0.75V以下~1.3V以上まで動かせるんだから凄い。
Conroeみたい。

384:Socket774
07/05/23 01:03:16 XZfCWfn/
シリコンウェハーよりでかいチップなんてありえないだろ。

385:Socket774
07/05/23 01:15:41 8EK7dVFx
ボードの大きさが半分てことだろ

386:Socket774
07/05/23 02:33:48 MNGl3NIk
MIPS tips new 32-bit MPU core
URLリンク(www.eetimes.com)

387:Socket774
07/05/23 03:08:23 a/YITAtA
一生懸命張るのはいいんだけど…
単なるURL indexというか、なんというか、
自分の考えは?
いや、いいんだけれども

388:Socket774
07/05/23 12:15:52 rvrOguWK
>>375
なんでWoodcrestと比べてんの?

389:Socket774
07/05/23 23:34:56 UnOv+CAJ
>>387
すまなかった
もうやらない

390:MACオタ>388 さん
07/05/24 20:41:59 BOWgln3Y
>>388
Pentium 4以来、SPECintの王者わx86だからす。

391:MACオタ
07/05/25 01:17:40 6ojiKhut
IBM他4社連合が、製造プロセスの共同開発を更新したというネタわ既報かと思うす。
URLリンク(pc.watch.impress.co.jp)
で、この中でSamsung、Infineon、Chartaredわ以前から手を組んでいたすけど、
URLリンク(www.itmedia.co.jp)
今回わFreescaleが加わったのがミソかと思うす。しかも面白いことにFreescaleのプレスリリース
わ他の3社と微妙に異なっていてSOIプロセスの共同開発についての文言が含まれているす。
URLリンク(media.freescale.com)
  --------------------------
  The agreement includes Complementary Metal Oxide Semiconductor (CMOS) and
  Silicon-on-Insulator (SOI) technologies as well as advanced semiconductor research and
  design enablement transitioning at the 45-nanometer generation.
  --------------------------
Freescaleにとってわ、Phillips, STMicroとのCrolles連合の失敗を意味するかと思うすけど、
Power.org加入とIBMとのプロセス共同開発でAIMでPowerPCを始めたスタート点に立ち戻った
とも言えるかと思うす。

392:MACオタ
07/05/25 01:27:10 6ojiKhut
こちらもPowerPCネタすけど、開催中のMicroprocessorr ForumでAMCCが新PowerPC 440
"Titan"を発表したす。
URLリンク(www.eetimes.com)
  -----------------------
  The 90nm Titan is a dual-core processor that hits 2 GHz in bulk CMOS to deliver
  8,000 Dhrystone MIPS.
  -----------------------
高速化のミソわ、ダイナミックサーキットによるプロセッサ設計の雄、Intrinsityの技術を
導入したことにあるす。ちなみにこのIntrinsityもサマセット研時代のPowerPC技術者の
会社す。
Intrinsityの初期製品わMIPSベースだったすけど、これPowerPCのライセンスが高くて
MIPSを選んだといういわくつきの話す。Power.org以前のPowerPCの戦略の不味さが
改めて明らかになったとも言えるかと思うす。

ちなみにPPC440コアの代表的製品といえばBlue Gene/Lすけど、果たしてAMCC/Intrinsity -> IBM
という痛快極まりない技術の逆転わ有るすかね。。。

393:MACオタ@続き
07/05/25 01:37:22 6ojiKhut
"Titan"の成果わ、POWER6に続いて「回路設計レベルの革新で性能を上げる」ということが
可能であることを証明したす。
Penrynの"Radix-16"除算回路の投入も含めて、この方針が当座の性能向上のトレンドになる
気がするす。これわ設計に費やすコストやマンパワーの増大につながると思うすけど、
なんだか技術者をリストラしつつあるらしい某社の先見性の無さっぷりって。。。

394:Socket774
07/05/25 01:44:46 YPUxFNec
FreescaleがSOI含めIBMと協業する話は1月に既出す。

395:MACオタ>394 さん
07/05/25 01:55:56 6ojiKhut
>>394
これすね。
URLリンク(www-06.ibm.com)
IBMわバルクシリコンでSamsungやInfineon, SOIでChartaedやFreescaleと以前から提携
している訳すけど、ここで面白いのわ今回の発表に今までIBMを中心とするプロセス開発
連合の一員だったSonyと東芝が入っていないことす。
この辺に、今回のリリースの意図があるすかね。。。
  ----------------------
  また5社は5月24日、都内で32nmプロセス共同開発に関する記者発表を行ない、その
  取り組みを日本企業に向けてアピールした。
  ----------------------


396:Socket774
07/05/25 01:57:37 XYN0T54V
そういや↓この件はどうなったの?
URLリンク(enterprise.watch.impress.co.jp)

397:・∀・)っ-○◎●
07/05/25 01:59:31 7M5pJbNR
ノート向けのPPC64はFreescaleには期待せんよ
もっともPowerBookはもう二度とでないだろうが


398:Socket774
07/05/25 02:01:45 XYN0T54V
> Sonyと東芝が入っていない

↓この絵には書いてあるけど…
URLリンク(pc.watch.impress.co.jp)

399:MACオタ>396 さん
07/05/25 02:02:46 6ojiKhut
>>396
質の悪い株屋に買収されて、事業を切り売りされるんじゃないかと恐れていたすけど、
単に良いスポンサーが付いて経営が安定する方向に向かってる模様す。

400:MACオタ>398 さん
07/05/25 02:04:22 6ojiKhut
>>398
"Research"(基礎研究)にしか入っていないすけど?

401:Socket774
07/05/25 02:04:35 XYN0T54V
>>398にはAMDも書いてあるね

402:Socket774
07/05/25 02:05:54 XYN0T54V
>>400
へ?もともと、そういう位置づけでしょ?

403:MACオタ@補足
07/05/25 02:06:38 6ojiKhut
ちなみにそのスライドの"Common Platform Manufacturing"ってのわ、同一の設計でどの会社でも
製造できるというレベルの話すから、ファウンダリ企業にしか関係無いと思われるす。


404:MACオタ>402 さん
07/05/25 02:07:59 6ojiKhut
>>402
CELL BEをSonyとIBMのどちらでも製造できるという点で、現状のIBM-Sony-東芝連合わ
"Common Platform Manufacturing"レベルかと。。。

405:Socket774
07/05/25 02:13:09 YPUxFNec
そもそも今回の発表はバルクであってSOIじゃないでしょ。
SONY、東芝はSOI組なんだから。

ちなみに32nm以降の協業についてのプレスリリース
URLリンク(www-06.ibm.com)

406:Socket774
07/05/25 02:13:15 XYN0T54V
そらあんたの思い込みでしょ

407:Socket774
07/05/25 02:16:00 XYN0T54V
>>406>>404
わかると思うけど

408:MACオタ>407 さん
07/05/25 02:33:49 6ojiKhut
>>407
思い込みでチップの製造を他の会社に移管できるなら、今頃AMDのプロセッサわUMCで
製造されていた筈かと(笑)

409:Socket774
07/05/25 02:36:49 XYN0T54V
なんか噛み合ってないな
まあいいや 説明するのめんどい
おやすみ

410:Socket774
07/05/25 02:46:00 /eUBhKTg
組込のチマチマしたCPUなんざどーでも良いと
内心思っているオレガイル

411:Socket774
07/05/25 02:47:26 /ebs1hSy
でもこれから何年かは自動車向けのCPUの覇権争いが面白そうだよ

412:Socket774
07/05/25 02:49:26 /eUBhKTg
softwareの方が大変

413:Socket774
07/05/25 02:55:02 /ebs1hSy
それはご愁傷様

414:Socket774
07/05/25 10:39:21 fUKbherf
POWERの話になると比較にならんぐらい生き生きするな。
昔から思ってたんだが何でPOWERオタと名乗らないんだ?>MACオタ

415:Socket774
07/05/25 11:31:58 aLBUbQUc
>>414

同意

416:Socket774
07/05/25 15:10:48 5kaRtAE5
【MPF07】米MIPS社が新CPUコア「74K」の詳細を発表,「合成可能なコアで1GHzの壁を超えた」
URLリンク(techon.nikkeibp.co.jp)

ついに合成でも1GHz出るようになったんやね
しかし、パイプラインは17段でアウトオブオーダー採用とは

417:Socket774
07/05/25 15:15:21 5kaRtAE5
そしてケータイでも1GHz到達というお話

【MPF07】米QUALCOMM社,1GHz動作のアプリ・プロセサ「Scorpion」と次世代プラットフォーム「Snapdragon」の詳細を明らかに
URLリンク(techon.nikkeibp.co.jp)

IntelとAMDの1GHz競争も今は昔、か

418:Socket774
07/05/25 15:47:32 b5hOWJJk
車1台には6インチウェハ分の半導体が搭載
URLリンク(pc.watch.impress.co.jp)

419:MACオタ
07/05/25 17:59:42 6ojiKhut
POWER6の国内発表会の記事を読んだヒトも多いかと思うす。
URLリンク(enterprise.watch.impress.co.jp)
注目わパッケージで、この写真のようにL3を外付けにすることを前提にしたSCM(Single Chip Module)
での製造から開始されている点す。
URLリンク(enterprise.watch.impress.co.jp)
ちなみにPOWER5わ最小構成でもeDRAM L3をパッケージに混載したDCMが基本で、SCMわ
単に同じパッケージからL3チップが取り外されているだけす。
 ・POWER5 SCM: URLリンク(www.ibm.com)
 ・POWER5 DCM: URLリンク(www-03.ibm.com)

明らかに初期からブレードサーバーやワークステーションクラスの製品等、ローエンド構成にも
搭載する意欲満々に見えるす。

420:Socket774
07/05/25 18:23:45 i6JnI7Wm
PPCの9シリーズと統合しただけなんじゃないの?

421:MACオタ>420 さん
07/05/25 18:38:06 6ojiKhut
>>420
そういう意味す。ただPPC9xx自体わ外販してるチップすから、それがすぐさまPPC9xxの消滅を
意味する訳じゃ無いす。

422:Socket774
07/05/25 21:23:53 0OeUO3H3
「ビジネス開発にHPCを」、IntelがHPC普及に向け専門組織を新設
URLリンク(enterprise.watch.impress.co.jp)

>>382と同じネタかな?
HPC分野ではメモリ帯域を稼ぐため、メインメモリを1つのCPUに占有させるというところか
まあ、マルチコアなんで1CPUって言っても実はSMPじゃんって話はあるが

423:Socket774
07/05/26 11:33:57 ctmJLC3v
PPC9xxは使い道が限られてるからな…
CoreやAthlonと同じで。

424:Socket774
07/05/29 23:26:05 HVQ65ILd
IBM's Power6 architecture goes down the Itanic route
URLリンク(www.theinquirer.net)

POWER6はインオーダだからダメってのはあまりにも乱暴
ただ、アウトオブオーダやめなければ3GHzくらいでも今の性能出るんじゃないか
って気もするし、それなら電力あたりの性能はむしろそっちの方がいいんじゃ
ないかって気もするし

結論: Intel Core 最強w

425:Socket774
07/05/30 00:20:51 7bRoM0B9
POWER6は驚くほど速くはない!?
URLリンク(www.geocities.jp)
SPECint2006では・・・クロックがが1/3しかないItanium 2と比較して,ベース
では2割,ピークでも4割程度のアドバンテージしかありません。
SPECfp2006も・・・Itanium 2と比較すると,ベースで8%,ピークで23%という
アドバンテージです。
この程度であれば,Itanium 2がMontvaleで追いつけないというほどの性能差ではありません。
やはり,クロックを上げると相対的にメモリレーテンシが増加する効果や,
コアをインオーダ化したこと等により1サイクル当たりの命令実行数
(Instruction per Cycle:IPC)は低下しているようです。

426:Socket774
07/05/30 00:24:06 mIOLNfnp
>>424
Pentium4 2.53GHzが55Wくらいで、AthlonXP 2200+が80Wくらいだっけ
そんな時代を思い出すな。

AthlonXP<クロック上げるとか馬鹿のやることじゃね?w

427:Socket774
07/05/30 00:30:23 9Pi+Pcj0
>>424
OoOが電力効率悪い理由は性能向上幅以上にトランジスタを注ぎ込まないといけないから。

428:Socket774
07/05/30 00:40:15 UALXv4Ar
ARMv7のマルチプロセッサ拡張
URLリンク(pc.watch.impress.co.jp)

429:MACオタ>425 さん
07/05/30 00:45:25 Yeer8U2G
>>425
いちおう、安藤氏のその意見に関する私の感想わこちらす。
スレリンク(jisaku板:548番)
peakの結果の方でわ十分引き離しているすから良いんじゃないすかね。。。

430:Socket774
07/05/30 01:22:25 /kcySFd7
トランジスタをつぎ込んでIPCを向上させても、トランジスタ数に比例して性能が向上することはない。
かといって、IPCを向上させずに周波数だけを上げても、周波数に比例して性能が向上することはない。

431:Socket774
07/05/30 02:05:32 uHJt7RE4
Pentium4 2.53GHz TDP61W
AthlonXP 2200+ TDPmax67W、TDPtyp61W

432:Socket774
07/05/30 02:15:39 uHJt7RE4
Pentium4 2.53GHz 最大電流*電圧80W
AthlonXP 2200+  最大電流*電圧68W

433:Socket774
07/05/30 18:47:29 CB682ZJ8
>>430
ついでに、単純にマルチコアにしても、コア数に比例して性能が向上することはない。

434:Socket774
07/05/31 00:29:35 +wcTBWA4
SMPでリニアに伸びるのは8CPUぐらいまでだったような。
20CPUぐらいで頭打ちになるんだったかな。

435:Socket774
07/05/31 01:34:46 5Tk5PeeV
のびねェよ
どんな単純なin cache loopでハカッテンダか

436:Socket774
07/05/31 11:29:53 m0XuhTpq
IBMがPOWER6Macを出さない方が問題だ。

437:Socket774
07/05/31 12:43:24 97NLY2+b
MacとMacOSの販売権はAppleにあるのになんでIBMが?

438:Socket774
07/05/31 16:28:43 2TZXESHq
IBMがPowerBook用G5を出さなかったのでMacがIntelに乗り換えた、
みたいな話じゃないのか。

439:Socket774
07/05/31 19:01:45 +EsokglI
PowerPCはバカ売れしてるんだが、アップルはパソコンメーカーでは4位程度のメーカーだったので
PowerPC出荷量の1-2%に過ぎなかった。

だから後回しにされた、というわけだ。


このスレはまた別の話だが、自作住人ってなぜか、8コアとか4.7GHzとか、そこら辺の「単語だけ」に反応するよな

440:Socket774
07/05/31 21:46:07 AaTJk+Q1
物事を一個の数値などに単純化しすぎると万人に分かり易くなる
その反面、物事の繊細な本質が見えなくなる
ベンチの性能性能言ってるヤシらだって同じアナのムジナ

441:MACオタ>439 さん
07/05/31 22:25:06 2PTa9e5w
>>439
  -------------------
  PowerPC出荷量の1-2%
  -------------------
組込向けの10倍以上の単価すから、売上に換算すると結構な割合になるすけど。。。
問題わIntelに対抗できるだけの開発費にペイするかどうかってことかと思われるす。

442:Socket774
07/05/31 23:21:21 jtygb6Va
>>439-440
例えばゲーマーだったら、ゲームを快適に楽しみたい、という目的が有って組むけど、
組むこと自体が目的だったら、単語や数値にこだわるのも自然では?
日常使用では、一部の用途を除けば、普通のPCで十分だし。

443:Socket774
07/06/01 00:00:12 WzMifvmK
E6850なんか3GHzでTDP65w。
Power6の存在価値がMacであるかといわれるとかなり微妙。

444:440
07/06/01 02:47:43 SiuhZr8w
>>442
言いたかったのは単純化しすぎた数値にばかり着目すると
結局、変な代物ができあがると言うこと。
cellしかり、点数教育しかり
そしてlinpackだけが速くてその実、使い物にならないcomputerしかり

445:Socket774
07/06/01 03:02:13 NjWj7TXW
>>444
そういう設計だと割り切って作られてる製品を、知っている単語だけで反応し、分かりやすい解説が入るまで叩けないんだよな

446:Socket774
07/06/01 23:32:19 QUNfC2Zd
競争相手としてのPowerPC Macは欲しかったな。

447:Socket774
07/06/02 00:11:35 jbhfMETz
どの市場でも二、三の勢力が競争してるのがいいんだけど、
2,3割のシェア取れなければやっていけないから。

448:・∀・)っ-○◎●
07/06/02 04:36:54 v+AN2/M3
Meromと張り合えるのはPWRficientくらいしかない

449:Socket774
07/06/02 06:46:46 EzwA+Sgl
POWER6の動作電圧の広さもなかなか

450:Socket774
07/06/03 23:56:36 blpDVZUU
URLリンク(pc.watch.impress.co.jp)

451:Socket774
07/06/04 00:26:52 3T+mlpe/
Windows VistaをPPCに移植してそっちをライバルにでもなんでもしてくれ

マカーはx86になって幸せを満喫しているんだよ

452:・∀・)っ-○◎●
07/06/04 00:33:04 lC/IGYNE
IntelにとってはAppleは高値のXeonとMeromだけを買ってくれるいい客だもんな
にしてもClovertown 3GHzは異常に安いが。



453:Socket774
07/06/04 02:04:22 qSi407+l
>>451
IntelがPPCを作り、MSがPPC版Vistaを出せば、全て解決。
x86と同レベルのモノを作ることは、両者にとって困難ではないだろう。

454:Socket774
07/06/04 02:14:57 Fm9PoG+L
素性はいいからな

455:Socket774
07/06/04 13:09:42 hunJO2CG
VistaではなくXPでお願いっ><

456:Socket774
07/06/04 13:43:57 qSUy4G0i
世界初のGPUを使ってサクサク動く画像編集ソフト「Pixelmator」
URLリンク(gigazine.net)

Intelアボーン

457:Socket774
07/06/04 15:33:26 /58af8vC
Adobeアボーンの方がいい…。

458:Socket774
07/06/04 23:49:35 XdYG8Al+
Sun puts a T1 on an FPGA
URLリンク(www.theinquirer.net)

FPGAベースのSPARCコア
どうすか?

459:Socket774
07/06/05 00:25:48 wwj1N8r4
>>453
次世代XBOX用CPUじゃだめなの?

460:Socket774
07/06/06 20:59:54 ChcJKd3f
【DAC2007】IBM社、45nm製造ASICにSOIとエンベデッドDRAMを採用
URLリンク(www.eetimes.jp)

【DAC 2007】米IBM,45nmSOIや0.13μm液浸,Si貫通ビアなどのASICを発表
URLリンク(techon.nikkeibp.co.jp)

461:Socket774
07/06/06 23:32:44 DZwHYlDQ
京速のアーキテクチャまだ決まってなかったらしいな

462:Socket774
07/06/06 23:53:04 GN/V5iug
寄せ集めだろ
ここ数年、何やってたんだか

463:Socket774
07/06/07 00:06:53 OxOjGKY/
プロジェクトを遅らせるほど技術の進歩で京速を達成するのが容易になりますw

464:Socket774
07/06/07 01:16:17 lOpeRYuU
ライバルも進化する
イタチごっこ
忘れちゃいないだろうな

465:MACオタ
07/06/07 20:49:10 OCp7RXQD
ここのところPOWER6関連で、海外の掲示板等で紹介されていた特許や論文を漁っていたす。
POWER6に関してわ、高速化の代償として整数演算ユニット(FXU)がインオーダー実行になっている
ことが以前から指摘されていたすけど、これ以外にもコアに機能上のトレードオフとして削減された
部分やや改善が加えられた部分があるす。以下、興味深い点について書き残しておくす。
長くなるかと思うすけど、勘弁して欲しいす。

■レジスタリネームの削除
FXUでOoOEを削ったことに加えて、OoOEを残したFPUやVUでもレジスタリネーム機能を完全に
削っているす。つまり、ちゃんとpowerアーキテクチャで定義された32個レジスタを有効活用しないと、
レジスタ競合で始終パイプランが停止してしまうということになるす。
ただしHPC Linpackの成績を見ると、POWER4/5と同程度のパイプライン段数であるにもかかわらず
リネームレジスタ数を72->120に大増強したPOWER5とそれほど変わらない効率を出しているす
(POWER5: 84.8%, POWER6: 79.6%, 共にp570 16-way)。
命令キューも小さくなっていることでキャッシュにヒットしてデータが連続的に供給される限りわ、
シンプルな構造にしたことが成功していることが判るす。
ちなみにリネームレジスタわ存在しないものの、後述する投機実行機能に使う一時使用のための
レジスタファイルが一セット用意されている模様す。




466:MACオタ@続き
07/06/07 20:56:23 OCp7RXQD
■load/branch lookahead機能
L1キャッシュやTLBのミスで発生する長期のストール時に実行する一種の投機実行機能なんすけど、
「実行」する訳じゃない。。。ってのが面白いところす。
in-orderでリネームレジスタを持たないという設計により、投機実行中にレジスタの書き換え等、
プロセッサの内部状態が変わるようなことが一切できないす。そこで、冬季実行している間の
実行結果わ捨てて、L1キャッシュへのプリフェッチや分岐テーブルの更新のようなプロセッサの
内部状態を変えない動作のみを行うす。ストールが終わって後続の命令が開始されると、必要な
データがL1に入っていたり、分岐予測の精度が上がっていたりして万々歳ということになるす。

この機能、OoOEと違ってパイプラインバブルを埋めることわ出来ないすけど、普通のin-order実行
で問題となるキャッシュミス等での完全停止の対策としてわ面白いす。バブルについてわ高い動作
クロックと整数命令の実行レイテンシを1に削減したことで影響わ少ないという考えだと思われるす。

ちなみに投機実行中に全くレジスタに書き込めないと、本来の目的である後続のload命令や分岐
命令の実行まで行き着くことすらできないんで一時使用のためのレジスタファイルを一セット持って、
投機実行中の演算結果を書き込むようにしている模様す。



467:MACオタ@続き
07/06/07 21:02:26 OCp7RXQD
■プレデコードの強化
私わ以前から「POWER6わNetburstの衣鉢を継ぐ」とか書いているすけど、これもトレースキャッシュ
に近い機能す。RISCでわ下のメモリ階層からL1命令キャッシュに読み込む段階でプレデコードを行う
すけど、以前わ実行パイプラインで行っていた命令のグループ化の大半をこのプレデコードの段階で
行う模様す。
命令ごとに必要とするリソースを示すビットとグループ境界の参考用に使うビットが付加されるために、
L1キャッシュ内の命令わ32-bit幅のpower命令より若干肥大化するす。この肥大化分が64KBという
L1命令キャッシュのサイズに含まれているかどうかわ不明す。

ちなみにFXUのin-order化/FPUのOoOEの規模縮小により命令のcrackingやらmillicoding (より単純な
命令への変換機能)わ無くなった模様す。複数の実行ユニットを使用する命令わ存在するす。
後述の整数乗除算命令なんかわ、その一例す。

468:MACオタ@続き
07/06/07 21:09:05 OCp7RXQD
■命令ディスパッチレベルのSMT
以前に、
スレリンク(jisaku板:818番)
  ----------------------------
  issue queue内部でOoOE機構を持たないプロセッサにSMTって実装する意味があるすか(笑)
  ----------------------------
なんてことを書いた覚えがあるすけど、なんとPOWER6わ2つのスレッドから7命令をグループ化して
ディスパッチすることでSMTを実現しているす。グループ生成の制限わ、まず優先スレッドから
in-orderかつ所要リソースがダブらないという制限で最大5命令で、残りをサブスレッドから。。。
というモノす。場合によってわサブスレッドの命令のほうが多くなる筈す。

ちなみにPOWER4/5わ命令キューにサイクルあたり5命令のグループをディスパッチして、命令キュー
からアウトオブオーダーで7命令をイシューするという設計だったすけど、OoOEを縮小した分最初から
静的に7命令をイシューするようになったとも言えるす。なんとなく更にVLIW的になったという気もするす。

469:MACオタ@続き
07/06/07 21:14:55 OCp7RXQD
■FPUによる整数乗算/除算の実行
おかげで従来パイプライン化されていなかった整数乗除算がパイプライン化されるす。ただし
スループットわ2。

■FPUの逆数/平方根近似値命令の高精度化
14-bit精度になったとのことす。そのまま使えそうな値すね。

■FPUパイプラインの改善
除算や平方根のようにパイプラインを何周もする長レイテンシの命令がFPUを占有している間に、
前述の一時使用レジスタをその手の命令に回すことで後続の命令をパイプラインに投入できる
ようになっているす。
ただし論文でも「リネームレジスタが無いのでシングルスレッドでの効果わ今一つ」とあるす。
ただし片側のスレッドが除算とかを実行中に、もう一つのスレッドからのFPU命令をどんどん投入
できるそうす。

■単精度浮動小数点わ実行レイテンシが大きい?
倍精度FP演算わ6-cycle後の後続命令に結果をフォワードできるとのことすけど、単精度わ
丸めの追加処理が複雑になるのでフォワードが遅くなるらしいす。


470:MACオタ@続き
07/06/07 21:19:36 OCp7RXQD
■VMX (AltiVec)
VMXのイシューポートが一つだけになって、演算とvpermを同時実行できなくなっているという噂が
流れているすけど、それわ無い模様す。
特許でもVMXユニットが2つ(多分VIU/VFPUとVPERM)という実装例が記述されているし、何より
ダイ写真でベクトルレジスタが2ブロックあって、2つのパイプランが並列実行することを示しているす。
(POWER4以来、IBMの設計わパイプラインごとにレジスタを割り当てている。例えばFXU0とFXU1の
GPRわ別でそれぞれ32個づつある)

どうやらFPUとVMXの関係わ、PPEとよく似ていて命令キューを共有し、FPU命令とAltivec命令を
任意の組み合わせでサイクルあたり2つイシューできる模様す。

謎なのわダイ写真を見る限り、ベクトルレジスタが64-bit幅づつ2つに分割されていることで
四則演算ならともかくシフトやpermuteで不都合が無いのか非常に不思議す。

■リネームレジスタの話の続き
リネームレジスタを削ったかわりに、演算やロードの結果を引数として使う場合の優遇措置わ
色々ある模様す。

471:MACオタ@ここまで
07/06/07 21:22:34 OCp7RXQD
まとめるとベンチマークに現れている高性能っぷりわ、in-order実行の問題であるキャッシュミス等
によるストールが各種の新機軸によってうまくカバーされたことを証明しているかと思うす。
CELLのSPEでわ、そもそもストールが発生しないようにLSを採用した訳すけど、同じIBM社内で
in-orderでの性能向上策として色々考えていることが判るす。
POWER6の手法わ将来のPPEの実装にも適用できるネタであることも今後の注目点じゃないすかね。

IBMわ昔から「割り切った」設計をする癖があるすけど、今回の割り切りネタわ
  「パイプラインバブルわ放置」 
ってところに見えるす。キャッシュ/TLBミスによる長期の停止がIPC低下の主要な原因である
認識わCELL BEの設計方針にも通じるすね。

一方で、数年振りにSPECintの王者の地位を譲ったIntelが今後何をやってくるかわ楽しみす。
IBMと違ってIntelわ 「割り切らない」 会社す。
IBMがPOWER4で「クロックを上げれば命令の実行レイテンシわ多少悪くても良い」と考えた時に、
Intelわ超高クロックのPentium4の上に更に倍クロックのALUを内蔵することで命令のレイテンシを
短縮したす。同じくIBMがデュアルコアわL1をwrite-throughにしてL2で同期すれば良いと考えた時、
IntelわL1をcopy backのままにして、L1間のスヌープを実装したす。
Intelわ既知の性能向上策を決してサボらない会社す。powerを支持する私にとってIntelわ常に
恐ろしい競合相手す。

472:MACオタ@補足
07/06/07 21:23:59 OCp7RXQD
今回参考文献サボったすけど、ほぼソースわあるので質問があれば紹介するす。


473:Socket774
07/06/07 21:27:56 Lm3TZOZJ
IBMとAppleはなぜPOWER6 Macを出さないのか。

474:Socket774
07/06/07 21:30:49 0a8Hjx0P
IntelとPCメーカーはなぜItanium2 PCを出さないのか。

475:Socket774
07/06/07 21:40:31 FiPhouRT
>>470
> 謎なのわダイ写真を見る限り、ベクトルレジスタが64-bit幅づつ2つに分割されていることで
> 四則演算ならともかくシフトやpermuteで不都合が無いのか非常に不思議す。

AMDのPhenomは80bitと64bitに分割されているように見えるが
URLリンク(www.techreport.com)
シャッフルやシフトのスループットは1だな

476:Socket774
07/06/07 21:49:48 FiPhouRT
POWER6の半分程度のクロックだから参考にならないかもな

477:MACオタ>475 さん
07/06/07 21:51:38 OCp7RXQD
>>475
分割されたブロックの距離が妙に遠いすよ。

ダイ写真の方わ>>378のリンク先でも見て欲しいすけど、上側コアの左端がVMXユニットで、
見ての通り128-bit幅のレジスタが2ブロック見える筈が64-bit幅と思しきブロック(赤銅色に見える
四角)が4つあるす。


478:Socket774
07/06/07 22:18:09 SMH/5DS3
トレースキャッシュに続いてランアヘッドも実用化か
Rotenbergはヒーローだな

479:Socket774
07/06/07 22:19:02 SMH/5DS3
何度も言うけどトレースキャッシュとプリデコードキャッシュは全くの別物だから

480:・∀・)っ-○◎●
07/06/07 22:36:23 /oFgfG4i
CellのSPEでもVPERM相当ユニットはLSU側のポートだったな


481:MACオタ>団子 さん
07/06/07 22:46:37 OCp7RXQD
>>480
ちと話わ変わるすけど、PPEのVMXがハーフスピードって話わ、何を探せば書いてあるすか?

482:・∀・)っ-○◎●
07/06/07 22:52:21 /oFgfG4i
もちろん実測。
あとIBMのサイトにも図でそう書いてあったがURLは忘れた。

483:MACオタ>団子 さん
07/06/07 23:00:43 OCp7RXQD
>>482
  ----------------
  あとIBMのサイトにも図でそう書いてあったがURLは忘れた。
  ----------------
そういうの探したすけど、見つからなかったす。
ところでFGMTでソフト的にわクロック半分のプロセッサが2つに見える筈すから、実測だと半分で
当たり前なんじゃないすか?

484:・∀・)っ-○◎●
07/06/07 23:31:26 /oFgfG4i
「PPE VMX 半速」でググったら俺のカキコしかなくてワロタ

むろん両コンテクスト動かして合計スループットを計測した上で言ってる。
フェッチ・デコードが1コンテクストあたり1命令/clkなだけで演算ユニットのポートの
縛りがないことは判明。



IBMのサイトに明示してあったんだが今探しても見つからん

URLリンク(forum.beyond3d.com)

> XENON's VMX floating simd unit longer than PPS's, because dotproduct,DX compression instructions etc
>
> PPS's vmx contain 8 floating units, but i dont know why,
> it has more facilities:
>
> 1. 2*4 ways floating simd unit
> 2. 1*8 ways simd
> 3. yield problem or higher frequency
> 4. VMX run at half speed
> __________________
> Version of Majic12

485:Socket774
07/06/07 23:41:41 FiPhouRT
演算器内で処理が完結するなら、レジスタが分離していても
Vpermやシャッフルで不都合は起きないような気がしてきた

ところで、2つのスレッドを実行できるということは
レジスタセットは各パイプラインごとに2つあるのか?

486:MACオタ>団子 さん
07/06/07 23:43:19 OCp7RXQD
>>484
引用先わ私も検索で引っ掛けたすけど、ポストしたヒトの推測に過ぎないす。

487:MACオタ>485 さん
07/06/07 23:47:58 OCp7RXQD
>>485
  ------------------
  レジスタセットは各パイプラインごとに2つあるのか?
  ------------------
そうす。lookahead用の予備も入れるとパイプラインごとに4つということに。
結果的にレジスタの面積わ、リネームレジスタが120あったPOWER5とほぼ同じす。

488:Socket774
07/06/07 23:52:30 M+M1lLB2
命令ごとに必要とするリソースを示すビットとグループ境界の参考用に使うビットが付加されるために、
L1キャッシュ内の命令わ32-bit幅のpower命令より若干肥大化するす。

EPICみたいだな。

489:Socket774
07/06/07 23:53:47 hHjzXuep
Qualcommの携帯電話向けプロセッサ「Scorpion」
~独自実装で1GHz駆動を実現
URLリンク(pc.watch.impress.co.jp)

490:・∀・)っ-○◎●
07/06/07 23:59:20 /oFgfG4i
MPC7450でいうVSIUパスの命令くらいしかまともに計ってないけど
2スレッド使っても綺麗にPPC G4のクロック当たり半速程度しか出ない。

ちなみにSPEは等速かな。むしろ実効ではレジスタ数分伸びた。


491:MACオタ>団子 さん
07/06/08 00:10:53 z+wK8eWd
>>490
7450のマニュアル(Figure.1-1とか)を見てもらえば判るすけど、G4+わVSFX, VCFX, VFPU, VPERMの
4つのAltivecユニットに任意の組み合わせでサイクルあたり2命令を送ることができるすから、
G5を含むIBMの実装より、場合によってわ2倍速いす。
URLリンク(www.freescale.com)

492:・∀・)っ-○◎●
07/06/08 00:14:53 jfss7MXI
じゃあその「場合」からは外れるな。
これはMPC7450系よりPPC970系のほうが速いベンチ

URLリンク(www.openwall.com)




493:・∀・)っ-○◎●
07/06/08 00:26:35 jfss7MXI
8flops * 3.2GHz * 7.5 = 192GFlops

どうみてもVMX半速 +7SPEで計算合います。本当にありがとうございました
※もっとも厳密には3.2GHzじゃなくて3192MHzなんだが

8SPEは217GFLOPSだったっけ?やっぱりVMX半速で計算合うね


494:MACオタ>団子 さん
07/06/08 00:45:42 z+wK8eWd
>>493
これで、パイプラインの内部が見えないすか?
URLリンク(www.alphaworks.ibm.com)

495:・∀・)っ-○◎●
07/06/08 00:51:20 jfss7MXI
既にデータとってるし。

汎用ALUとVPUは実は同時発行できない

496:MACオタ>団子 さん
07/06/08 00:57:06 z+wK8eWd
>>495
  --------------
  汎用ALUとVPUは実は同時発行できない
  --------------
それ普通「半速」とわ呼ばないと思うすけど。。。

497:・∀・)っ-○◎●
07/06/08 00:59:42 jfss7MXI
いや?
半速でしかもそれだって話だが。
だからこそG4 1.42GHzより性能悪いことすらある。

498:MACオタ@訂正
07/06/08 07:09:05 z+wK8eWd
今気付いたすけど、>>469のこれ間違いす。
 誤: ただしスループットわ2。
 正: ただしスループットわ0.5。




499:Socket774
07/06/08 09:55:52 SUTtHFb0
>>472
> 今回参考文献サボったすけど、ほぼソースわあるので質問があれば紹介するす。

時間があれば参考文献も読んでみたいので、紹介ヨロシク。

500:Socket774
07/06/08 11:24:28 lO8SGlCb
CBE PPUのVMXは半速じゃないよ。
クソシーケンス喰わせりゃ激遅になるだろう。

501:MACオタ>499 さん
07/06/08 20:55:36 z+wK8eWd
>>499
羅列しておくす。
■講演資料
"POWER6 Technology Overview" URLリンク(www.nevicare.nl)
■論文
"P6 Binary Floating-Point Unit" URLリンク(www.lirmm.fr)
"The Physical Design of the POWER6 Microprocessor," (ISSCC 2007) 出所不明
"A 5GHz+ Binary Floating-Point Adder for the POWER6 Processor" URLリンク(www.ece.ucdavis.edu)
■特許 URLリンク(appft1.uspto.gov)
20060101241 "Instruction group formation and mechanism for SMT dispatch"
20060149933 "Branch lookahead prefetch for microprocessors"
20060149934 "Using a modified value GPR to enhance lookahead prefetch"
20060149935 "Load lookahead prefetch for microprocessors"
20060179346 "Method for checkpointing instruction groups with out-of-order floating point instructions in a multi-threaded processor"
20060184772 "Lookahead mode sequencer"
■その他
URLリンク(gcc.gnu.org)

502:499
07/06/08 22:38:09 SUTtHFb0
>>501
サンクス。

503:MACオタ
07/06/08 23:12:15 z+wK8eWd
京速計算機プロジェクトってお取り潰しになるんじゃないすか?
URLリンク(www8.cao.go.jp)
  -------------------
  さらに、本計算機の目標性能も0.5ペタFLOPS と低いこ
  とから、国家プロジェクトとしてベクトル計算機の開発に本格的に着
  手する必要性が必ずしも明確となっていない。同様に、「逐次処理計
  算機部」についても、目標性能は1.0ペタFLOPS と低いため、国家
  プロジェクトとして開発に着手する必要性が必ずしも明確ではない
  という点が挙げられる
    。。。
  さらに、仮に本プロジェクトの提案のとおり、「大規模処理計
  算機部」、「逐次処理計算機部」、「特定処理計算加速部」の3部構成を
  とることとした場合、それらを密に結合する必然性が必ずしも明確で
  なく、したがって密な結合を担うこととしている「異機種間接続超高
  速インターコネクション部」を開発する必要性も明確ではない。
  -------------------

504:Socket774
07/06/09 00:17:06 +cl7l/KQ
>>503
もう、時代の曲がり角はとっくに過ぎているのに
なのに20年来の延長線上で恐竜が呉越同舟
時間と労力の無駄使い。
気の毒だが、不要といえばもう不要なものなのかも。
公の文章に載るようじゃ末期症状。
逆に日本のsoftwareの発展にとっては明るい材料かも。
気の毒だが。

505:Socket774
07/06/09 00:27:18 7JZlOV4/
スレリンク(jisaku板:36番)

506:Socket774
07/06/09 00:53:56 wA13ajxS
最新(?)の議事概要(案)はこちら
URLリンク(www8.cao.go.jp)

507:Socket774
07/06/09 00:55:33 wA13ajxS
そんときの配布資料がこれ
URLリンク(www8.cao.go.jp)

508:Socket774
07/06/09 01:02:42 A41g6ChJ
これは、だめかも知れない…orz

509:・∀・)っ-○◎●
07/06/09 06:04:29 pT0bFs6z
>>500
はい?どうみても半速ですが。
もちろん2スレッド食わせてますよ。

510:MACオタ>505 さん
07/06/09 07:00:26 EMxJLxfn
>>505
確かに日付的にも古いネタで失礼したす。

511:Socket774
07/06/10 23:56:28 G1K9FyWr
Intelが進める、32コアCPU「Larrabee」
URLリンク(pc.watch.impress.co.jp)

512:Socket774
07/06/11 15:13:47 p9ucv6e7
これからプログラムの勉強する香具師がわざわざx86のアセンブラなんか触るのか?
どうも先には行き止まりが見えるような希ガス

513:Socket774
07/06/11 15:40:25 ofkhG31A
え、独学なら普通x86じゃない…?

514:Socket774
07/06/11 17:17:00 ereyh0Xr
まー最適化をある程度見限ってJavaやC++つー手もあるけれど。
非x86つーと昔のPowerPCMacくらいか。
更にそれ以外となると入手の敷居が一気に高くなる。

515:・∀・)っ-○◎●
07/06/11 21:31:27 kQKbSO0n
新品でプログラミングの勉強用にPPCマシン手に入れようと思ったら今や最も手軽なのがPS3
てか唯一の選択肢。


まあ俺はPPC Mac確保しといたけど。

516:Socket774
07/06/11 22:13:58 KDWVWLfu
>>513
まーねー、他の選択肢がことごとく絶滅したからね(または敷居が高すぎる)。
目的を何にするかにもよるが x86 は純粋なアセンブラの勉強としては
不向きだな。

517:・∀・)っ-○◎●
07/06/11 22:22:59 kQKbSO0n
勉強用はCASL-II/COMET-IIでいいじゃん。

518:Socket774
07/06/11 22:27:01 VSslfRui
なんという情報処理技術者試験www

電子工作とかやるんならZ80もいいと思うんだけど
パソコンとはるとx86以外見当たらんなー

519:・∀・)っ-○◎●
07/06/11 22:27:02 kQKbSO0n
x86はアドレッシングも楽だしアセンブリ言語で組みやすいだろ。
バイナリコード直接叩くわけじゃあるまいに

あとRISCの単純さ・直交性は人間のためじゃなくて高級言語コンパイラの為。

520:Socket774
07/06/11 22:29:03 vPDHJOXc
あぼ~んが多いな。

521:Socket774
07/06/11 22:42:51 /vQSZ4oB
x86はアセンブラ組みやすいし読みやすいぞ。8086の頃の悪評に引きずられてるんだろうけど
386以降のいわゆるx86は別物だ。

522:Socket774
07/06/11 23:57:49 ZEZsU2em
最近、x86を批判して通ぶってる奴が多い気がする。

523:MACオタ>522 さん
07/06/12 00:04:13 3acacnku
>>522
申し訳無いとわ思うすけど、この21世紀にデコードのボトルネックを解消したのしないのと
自慢してるのがイタいのわ事実す。
当のIntelですら、トレースキャッシュでこの手の問題から開放された筈だったすけど。。。

524:Socket774
07/06/12 00:16:36 9b6vHxQn
トレースキャッシュとプリデコードッキャッシュは別もんだと
一体何度言ったら。。。

525:MACオタ>524 さん
07/06/12 00:31:15 MDfzQR8J
>>524
固定長命令であれば実行時のデコードの並列化わ容易なので「デコードのボトルネック」なんて
存在し得ない。。。という話であって、プレデコード云々わ関係無いす。

もちろんプレデコードだって楽になる訳すけど。

526:MACオタ
07/06/12 00:36:16 MDfzQR8J
ところで「プレデコードキャッシュ」ってあまり聞かない用語だな。。。と思って調べてみたら、
AMD K6が命令キャッシュをそう呼んでたすね。
異常に固執してる理由が理解できたす(笑)

私が書いているのわ、RISC一般の技術的な話なので関係無いと思って欲しいす。


527:Socket774
07/06/12 01:11:04 9b6vHxQn
>>526
あいわらず重箱の隅ばかりつついて本質が見えないやつだな

デコード済みの命令をキャッシュするものは、トレースキャッシュとは全くの別物

間違える学生が出てくると可哀想だしね

528:Socket774
07/06/12 01:15:57 9b6vHxQn
トレースキャッシュは(分岐をまたいだ場合の)命令フェッチバンド幅を改善するもので

はっきり言ってあんまり関係ない

529:Socket774
07/06/12 02:23:14 qq7wRrjd
仮にデコードが性能のボトルネックというならば
L1 cache latencyを減らし
L1 band widthを広げ
単に周波数を上げればいい
こんな楽な話なら誰も苦労はない。

530:Socket774
07/06/12 02:27:38 sn3C1Sz4
>L1 cache latencyを減らし
>L1 band widthを広げ
>単に周波数を上げればいい

想像して文章化するのは楽かもしれんが、
どれもあまり楽な作業には見えないんだが…

531:Socket774
07/06/12 02:31:54 qq7wRrjd
全体をはやくするよるり
はるかに楽

532:Socket774
07/06/12 02:33:18 qq7wRrjd
そして、本当に速いコンピューターを造るより(ry

533:Socket774
07/06/12 06:35:01 z0xtk4Yc
>>529は全体を速くしろと言ってるのと同義じゃん。
単に周波数を上げろ、ってそれが出来れば苦労しねえw

534:Socket774
07/06/12 14:05:13 d3BHTW54
>>533
>単に周波数を上げろ、ってそれが出来れば苦労しねえw

この板ではいとも簡単に数十パーセント上げてる人多いけどね。

535:Socket774
07/06/12 14:26:24 4w3k7zFW
OCと定格を上げるのは別

536:Socket774
07/06/12 14:36:07 d3BHTW54
まぁそうだけどね。
「上げるのが難しい」みたいな書き方するから。

あまり熱くせずに上げるのが難しいというか、消費電力とのトレードオフで
理想的な並列度、キャッシュサイズ、動作周波数が導出されるのであって、
周波数を上げるのが難しいから(いや実際難しいんだけどさ)大変だというような
簡単な話じゃないじゃん。グダグダですまんが。

537:Socket774
07/06/12 15:13:40 z0xtk4Yc
単に周波数を上げるのが簡単なら並列もくそもなく
単に周波数を上げるだけでいいだろうがw

538:Socket774
07/06/12 15:29:38 dKdjYBjD
>>536
経済性を度外視して良いならば、今のPC用CPUのクロックを上げるのは簡単だろ。
COMPUTEXではC2Dを液体窒素で冷却してオーバー5GHzのデモをやったところがあるらしいから。
URLリンク(techon.nikkeibp.co.jp)
でも、そういう話をしている訳じゃないだろ。分かってはいるみたいだが。

しかし、5GHz超でやることが円周率の計算って、他に使い道はないのかw

539:Socket774
07/06/12 17:04:19 tY9GwOwo
>>537
それなんてP4?

540:Socket774
07/06/12 20:14:28 aLTHOdm3
>>526
>ところで「プレデコードキャッシュ」ってあまり聞かない用語だな。。。と思って調べてみたら
ちょっ、MACオタがまともなことばづかい.....

541:Socket774
07/06/12 20:17:55 GjgVlMc2
>>540
ワロタw

~あまり聞かない用語すね。。。

542:Socket774
07/06/12 23:57:25 3fdUXTLK
>>503
京速ぽしゃるな。間違いない。

次世代スパコン、日立など3社で共同開発
URLリンク(www.nikkei.co.jp)

543:Socket774
07/06/13 00:07:36 9iVvw2ns
この記事からは、ぽしゃる訳が読みとれん…
りけんが投げ出した?

544:Socket774
07/06/13 00:15:23 Vcm54YBE
世界一の性能目指すのに3社連合なんてありえないでしょ

545:Socket774
07/06/13 00:15:34 9iVvw2ns
12日、3社連合で実施する方針を決め…
今後2年間で部品選定などの最終設計を詰め、2010年度の完成を目指す
ここか

546:Socket774
07/06/13 00:18:51 9iVvw2ns
3社連合なんて最初から予定調和でしょ。
今まで方針が公に決まらなかったこと
今から設計、作り始めて2年あまりで稼働までもってくことw
この辺では?
OSとかsystemsoft、アプリ絶対間に合わない

547:Socket774
07/06/13 00:24:02 CZHwQSW/
結局、富士通とNEC+日立の2案が
まとまらなかったってことだろw
どっちかばっさり切って退場してもらう決断もできなかった。
中途半端のシステムになるの目に見えてるよ。

URLリンク(techon.nikkeibp.co.jp)
「2案の大きな違いはマイクロプロセサ1個の演算性能とそれを
いくつ利用するか,の違いにある」(理研)と説明する。目標とする
10PFLOPSを実現する上でマイクロプロセサ1個の性能と総数の
選び方にいくつかの選択肢がある。例えば,10GFLOPSの
マイクロプロセサを100万個用いて実現するか,100GFLOPSの
マイクロプロセサを10万個用いて実現するか,といった選択肢である。

50GFLopsで20万個ですか?

548:Socket774
07/06/13 00:26:33 9iVvw2ns
使いやすい物が出来ない
速い物が出来ない
まともに動くものが出来ない
あなたの落とした斧はどれですか?

549:Socket774
07/06/13 00:28:30 9iVvw2ns
>>548
50Gなら5個、10個でそ
10万20万はペタのレンジが目標の個数かと

550:Socket774
07/06/13 00:28:46 Vcm54YBE
> 中途半端のシステムになるの目に見えてるよ。

そうそう、そういうこと。

551:Socket774
07/06/13 00:39:23 Vcm54YBE
>>549
  10GFLOPS×100万
=100GFLOPS× 10万
= 50GFLOPS× 20万

ってことでしょ?
さすがは聞伝くんだね
まあ、今から50GFLOPSの石を作ってる時間は無いと思うけど

552:Socket774
07/06/13 01:08:19 JG2WjFw+
誉められた訳では無さそうだな。
石はたぶん出来るよ。石だけは。
石が出来ることnearly equall computer systemが完成すること
彼らにとっては

553:Socket774
07/06/13 01:09:35 JG2WjFw+
入れ物も多分できるら。

554:Socket774
07/06/13 01:49:13 QAejXdvb
> 誉められた訳では無さそうだな。

馬鹿にしてすまなかった そのことについては謝る

10GFLOPSってのは、おそらく富士通のスカラ
100GFLOPSってのは、おそらくNECのベクタ
どちらも、元になるアーキテクチャがあるんだから作れる見込みはあるんだろう
でも、今から50GFLOPSなんていう石(新アーキ?)は作れないんじゃないの?ってこと
ああ、NECの石を半分の性能で作ればいいのか(意味ねえw)

ソフトがなけりゃ石だけ(あるいは入れ物だけ)あっても仕方ないってのはその通り
なんだけど、それはまた別の話

555:Socket774
07/06/13 02:14:41 QAejXdvb
URLリンク(grape.astron.s.u-tokyo.ac.jp)
> と、この辺まで 6/3 に書いたのですが、 6/12 になって「三社連合でやる」と
> アナウンスがあった模様です。これはおそらくアーキテクチャを1つにはしなかった、
> ということですから、私としては間違った方向ではないと思います。 2つなり3つなり
> 作ってそれがちゃんと相補的なものになっているかどうかが課題でしょう。問題は、
> 一つに絞ろうとした段階で無理がきていないかです。

あれ、結局複合型なのか?

556:Socket774
07/06/13 02:30:01 wWkhH4LX
>>555
繋ぐだけでしょ。悪く言えば。
その高速接続の必要性に文系からケチが付いたんじゃないのかな。
それぞれ勝手に作って繋ぎますって
手前らの都合で変な物でっち上げやがって
ってわけか

557:Socket774
07/06/13 02:37:29 wWkhH4LX
単体についてもケチ付く度にかさ上げ->仕様変更
10Gってのは今となっては見所無いな
単体の理論≒見かけ性能を上げるためにあの手この
せこい手

558:Socket774
07/06/13 02:39:07 wWkhH4LX
さすがに一からは作らんでしょw

559:Socket774
07/06/13 02:40:10 lc87I9Ju
超伝導素子のCPUってまだ出ないのかな。ルータの試作はできてるらしいけど。
水冷するくらいなら冷凍機もたいして違わんと思うし、かべは低くなってきてるはず。


560:Socket774
07/06/13 02:42:39 mzY8h5N8
ある大型の公共事業案件に入札しようとした会社全てに落札させ、
お金を全ての会社に配ることにしました。めでたしめでたし。
>>555


561:Socket774
07/06/13 02:43:07 wWkhH4LX
ゲートの集積とかどーすんだ
しらんけど

562:Socket774
07/06/13 03:04:15 iPxjk4gP
>>559
トランジスタのスイッチングがいくら速くても
CMOSと同等の集積度が実現できない時点で勝負にならない

563:Socket774
07/06/13 09:46:29 tqmXM3ki
Intelがコンパイラ改良でスコアを上げてきた
Xeon5160 3.0GHz
SPECint2006 = 20.8
URLリンク(www.spec.org)

564:Socket774
07/06/15 00:08:55 l8fKxgpo
次世代スーパーコンピュータ概念設計評価報告書 出ました
URLリンク(www.mext.go.jp)

結論としては
> 本システム構成案は複合システムであるという大きな特徴を有し、世界的
> 主流となっているスカラプロセッサに演算加速機構を付加したプロセッサ
> と、我が国が強みをもつベクトルプロセッサの改良型となる新しい汎用
> プロセッサを同時に開発するものである。
とのこと

あと、面白かったのは↓このあたり
> なお、スーパーコンピュータそのものの市場は必ずしも大きくなく、今後の急激な
> 拡大も期待できないことから、プロセッサ技術を情報家電の国際的競争力の強化に
> 活用できるようにするなどの視点も重要である。

ベクトルCPUを搭載したPCエンジン萌えw

565:Socket774
07/06/15 00:12:38 l8fKxgpo
この記事が一番わかりやすかったかな?

次世代スパコンはスカラーとベクトルの複合型に,日立/NEC/富士通の「3社連合」で開発へ
URLリンク(techon.nikkeibp.co.jp)

しかし日立が何をやるのかは謎

566:Socket774
07/06/15 00:38:40 tDoErVrM
スカラー、ベクトル、日立の三題囃しなら
疑似ベクトル

567:Socket774
07/06/15 01:08:32 fA4TnNzo
携帯電話用プロセサでスパコンを構築が今の流れだろ。

568:Socket774
07/06/15 01:10:59 qDSXRzlG
演算加速機構ってなんだろね?
「~を付加したプロセッサ」って書いてあるから
クリアスピードみたいなのとは違うのかな

569:Socket774
07/06/15 01:21:05 qDSXRzlG
>>567
スーパーHコンピュータか なんかエッチだな
恥丘シミュレータとか

570:元
07/06/15 01:55:57 F6redfqx
ワロタ

571:Socket774
07/06/15 01:57:16 pw/H2CwG
>>394
に対する評価報告

>① 革新性
>システム構成案は、スカラプロセッサ、ベクトルプロセッサ、各演算部内部のネッ
>トワーク構成、両演算部のアーキテクチャなどについて、革新性の高い部分を有する。
>ただし、両プロセッサについては、基本的に従来のプロセッサ構成の延長上にある
>ことから、改良はなされているものの、新規の系統の技術という観点においては、革
>新性は限定的である。一方、コンピュータ技術は積み重ねで成り立っており、単に独
>創的なだけでは、技術として定着しないことにも留意すべきである。
>今後、両演算部を一つのシステムとして活用するシステムソフトウェアの開発に期
>待したい。

革新性がないと報告されてしまいました

572:Socket774
07/06/15 02:01:37 P+sEboHH
新規制もないし
互換性もないよ

573:Socket774
07/06/15 02:05:25 P+sEboHH
システムソフトウェアの開発に期待するのは勝手だけど
そっちは予算0だったりして
まあ頑張りな。金貰った以上、よそに頼らず自力でやってご覧、一回くらい。

574:Socket774
07/06/15 02:50:21 9D6a4gQt
>>566
SR11000。

>>568
SIMD拡張とかアレイプロセッサブロックとかじゃない?

温度スケーリングやんないのかやるわけ無いか開発会社にいないし。

575:Socket774
07/06/15 03:12:54 55Dpun1n
>その結果、HPCC 過半数目標はシステム全体の性能を評価するものとしては必ずしも適切ではないこと、
>HPCC 過半数目標を達成するシステムは、Linpack 性能、汎用性、消費電力、設置面積
>などの目標及び予算上の制約を満足しないことが明らかになった。
>これを踏まえ、作業部会においてこれら目標間のプライオリティに関する議論を行った結果、
>HPCC 過半数目標より汎用性、消費電力、設置面積などの目標の達成がより重要であることから、
>HPCC 過半数目標そのものを変更すべきであるとの結論に至った。
>新たな性能目標のための評価項目としては、
>  ①多様なアプリケーションの実効性能の評価に資するものであること
>  ②ある程度世界的にも認知されていること
>との視点から、「HPCC Award 4項目」が適切であり、新たな性能目標としては、
>「HPCC Award 4項目において最高性能を達成する」とすることが適当であると考える。

HPCC Award 4項目中2つは「京速を使ってこんな研究をしましたすごいでしょ」で賞が奪れる。
残り2つは、ノード間のインターコネクト、I/Oとファイルシステムの二点が革新的だと認められねば奪れない。

>CPU やノードの信頼性向上については、キャッシュのECC 機能、内蔵RAM のパリティ検査など、
>故障診断のための十分な対策も取られており、評価できる。
>ただし、システム規模を考慮すると、それらの対策による構成要素の信頼性の向上に加え、
>更なる故障への対策が必要であると考える。

信頼性も足りないと報告されてしまいました。

576:Socket774
07/06/15 22:57:09 3nCxAE7Z
>>574
> 温度スケーリングやんないのか

東芝ネタ?

577:Socket774
07/06/15 23:08:04 QlFlJbog
JAMSTEC、地球シミュレータの有償利用サービスを拡大
URLリンク(pc.watch.impress.co.jp)

578:Socket774
07/06/15 23:44:59 +i7eJ7fF
>>576
Yes。

579:Socket774
07/06/16 03:55:05 elT2K0ah
諌早湾に要らぬ堰を作るようなものかな
それがどんなに高い堰で広大な耕地の開拓であっても
いまや不要な物には変わりない
ましてや死体累類の上にlinpakが何テラflopsだとか
あれは高みの見物気分なのかな
社会的にも科学的にも無意味どころか害しかもたらさない
税金ばらまきに群がり麗しき山河を汚すゼネコンの業界腐敗体質と
あまりにも似ている
コモデティーにコテンパンにのされて自業自得

580:Socket774
07/06/16 03:57:04 elT2K0ah
実力で食えないなら
ダニのように血税にたからず
撤退しなさい

581:Socket774
07/06/16 04:00:01 elT2K0ah
出来損ないのゴミみたいなハードウェアをソフト部門に押し受けて
遅いはずはないとかほざいて
延々欠陥探しをさせて
死人がでて知らん顔
そんな物になぜ国は税金使う
止めなさい

582:Socket774
07/06/16 04:02:58 elT2K0ah
欠陥コンピューター
ゴミコンピューター
使う人を不幸にするコンピューター
ゴミみたいな論文書き散らかしてパルプ資源を無駄にして
すぐスクラップにするだけのコンピューター

583:Socket774
07/06/16 11:20:49 c3pmJz/U
> 死体累類

死屍累々じゃね?

584:Socket774
07/06/16 12:15:06 p1UJkUSL
地球シミュレータ,産業界向けに有償利用サービスを拡大--成果非公開での利用が可能に
URLリンク(techon.nikkeibp.co.jp)

585:Socket774
07/06/16 12:24:34 jbOlHIjm
【VLSI速報】東芝がCellのSPUを完全自動設計,面積を30%削減しつつ4GHzの周波数を達成
URLリンク(techon.nikkeibp.co.jp)

SPU単体とは言え、全自動で4GHzってのはすごいね

586:Socket774
07/06/16 12:45:34 RGmzfI6M
そんなことはどうでもいい

URLリンク(www.scei.co.jp)
4GHzを超えるクロックを実現

URLリンク(journal.mycom.co.jp)
1.4V/56℃で5.6GHzでの動作を確認

587:Socket774
07/06/16 13:06:46 jbOlHIjm
どうでもよくないでしょ
全自動で設計できるかどうかってのは、IPとして商売する上では重要なことだよ

588:・∀・)っ-○◎●
07/06/16 13:15:46 qMnq9V8b
4GHzで動くのは元々なので、実は「面積縮小」のほうが結構重要だったりする。
歩留まりも上げられるし、同じ面積ならユニットを増強する方向にも持って行ける。


Larrabeeの1コアのサイズって今のSPEを45nm工学縮小したくらいのサイズのようだね
もっともL2キャッシュやCSI・メモコンは外に別個にあるようなので、ロジック部だけで
考えればLarrabeeのコアはSPUよりやや大きい。





589:Socket774
07/06/16 13:16:19 gOkEv8jK
面積30%減ってのも情報家電なんかで使う上では
コスト的にかなりポイント高い

590:Socket774
07/06/16 13:18:00 gOkEv8jK
被った
失礼

591:Socket774
07/06/16 13:24:14 AAncA++b
テレビにCellが使われる日は訪れるのだろうか?
東芝はテレビにDDR2メモリ使ってるにょ、とかいうのを売りにしてるからそのうち来るのかも。

592:Socket774
07/06/16 14:06:09 f1XmZbGo
てか面積30%減て尋常ではないんだが>>586は間違いなくアホ

593:Socket774
07/06/16 14:20:38 RGmzfI6M
はあ?
おれが反応したのはここなわけだが
>4GHzってのはすごいね

594:Socket774
07/06/16 14:25:36 yQ5Dir22
>>593
また内容考えずに、パソコン視点でしか突っ込めない方ですか?

595:Socket774
07/06/16 14:26:13 2Kkbnnp9
そうそう、アフォなのは>>586じゃなくて>>585
すでに4GHzで動くものはあるんだから、全自動でできるかどうかなんて
どうでもいい

596:Socket774
07/06/16 14:30:59 RGmzfI6M
ラボレベルで達成した数値の無意味さを揶揄しただけなのに
とんちんかんな反応するアホばっか

597:Socket774
07/06/16 14:33:25 2Kkbnnp9
アホばっかりで疲れるよね

598:Socket774
07/06/16 14:33:35 yQ5Dir22
>>596
まさに>>586でお前が書いた1行目がピッタリだな

そんなことはどうでもいい

599:Socket774
07/06/16 14:38:00 RGmzfI6M
>>598
しつこいなデブ
無意味だからこそ一行目に「そんなことはどうでもいい」とエクスキューズをつけた
わかってることを繰り返すなアホ

600:Socket774
07/06/16 14:45:59 UKngPFP3
配線遅延やらスキューやらを考えると
面積70%化で6GHzくらい行ってくれないと

601:Socket774
07/06/16 14:47:32 V/QSlehr
コンパクションすると、むしろ配線的には厳しいんですが…

602:Socket774
07/06/16 15:01:15 V/QSlehr
で、まさに厳しそうなところを追加のツール(クロック系、太幅配線)で
対応したという話ではないのかな?発表聞いたわけでも論文読んだわけでも
ないから、わからんけど

603:Socket774
07/06/16 15:15:02 V/QSlehr
つか30%も小さくしてキャパシタとか足りてるのか?
こりゃ論文読んだ方がいいかな

604:MACオタ>585 さん
07/06/16 16:00:53 qcd6RBae
>>585
"Synthesizable"を「自動設計」って訳すのわ、適当なんすかね?

605:MACオタ
07/06/16 19:16:28 qcd6RBae
POWER6のSPEC2006のデータがSPECのサイトで公開されたす。
■INT2006: URLリンク(www.spec.org)
■FP2006: URLリンク(www.spec.org)
■INT2006_rate
 (2-way) URLリンク(www.spec.org)
 (4-way) URLリンク(www.spec.org)
 (8-way) URLリンク(www.spec.org)
 (16-way) URLリンク(www.spec.org)
■FP2006_rate
 (2-way) URLリンク(www.spec.org)
 (4-way) URLリンク(www.spec.org)
 (8-way) URLリンク(www.spec.org)
 (16-way) URLリンク(www.spec.org)

606:MACオタ@続き
07/06/16 19:19:04 qcd6RBae
peakのコンパイラオプションすけど、INT/FP共にAltiVec (VMX)オプションをつけて成績アップ
という傾向が見えるす。時期XLC/XLFで自動ベクトル化オプションが付けば、baseも現在の
peak並に改善する見通しかと思われるす。


607:MACオタ@続き
07/06/16 19:22:35 qcd6RBae
ボクシングの採点スタイルでCoreマイクロアーキと比較したい方わ、この辺見ると良いす。
URLリンク(www.realworldtech.com)
  -------------------------
  Subtest Power6 Woodcrest Score
  400.perlbench 13.7 24.1 9:10
  401.bzip2 16.1 16.1 10:10
  403.gcc 19.8 18.0 10:10
  429.mfc 36.8 20.8 10:9
  445.gobmk 17.9 21.4 9:10
  456.hmmer 17.1 20.0 9:10
  458.sjeng 14.9 19.6 9:10
  462.libquantum 96.6 31.2 10:7
  464.h264ref 30.6 32.9 10:10
  471.omnetpp 18.5 14.4 10:9
  473.astar 13.8 15.2 10:10
  483.xalancbmk 18.3 24.6 9:10
  Total: 21.6 20.8
  -------------------------

608:MACオタ
07/06/16 21:29:08 qcd6RBae
IBMのCTO Bernard Meyersonのインタビューす。
URLリンク(www.edn.com)
POWER6, 物議を呼んだエアギャップ技術, Intelとの競合など、色々語っていて読み応えあるす。

609:Socket774
07/06/16 21:34:32 OvBb9yz/
>>607
DRAW てw

610:Socket774
07/06/17 00:08:14 BxqqZavo
>>604
別に"Synthesizable"を「自動設計」って訳したわけじゃないと思うけど
「完全自動設計」って書くことに何か問題でも?

611:MACオタ>604 さん
07/06/17 00:15:24 Kp8SxLEQ
>>610
  -----------------
  別に"Synthesizable"を「自動設計」って訳したわけじゃないと思うけど
  -----------------
記事の冒頭をもう一度読んで欲しいす。
URLリンク(techon.nikkeibp.co.jp)
  =================
  東芝がマイクロプロセサ「Cell」のSPUを完全自動設計で実装した例を紹介した(講演番号5-4)。
  =================
当該講演のタイトルわ、"A Design Methodology Realize an Over GHz Synthesizable Streaming
Processing Unit"す。

612:Socket774
07/06/17 00:16:24 5n9Xca7K
>>607
総合するとほぼdrawでも、内訳見ると
得手不得手の特徴が出ているな…
> 400.perlbench 13.7 24.1 9:10
> 462.libquantum 96.6 31.2 10:7

613:Socket774
07/06/17 00:17:24 xLg5r3T8
>>607
URLリンク(www.geocities.jp)

    /||ミ
   / ::::||
 /:::::::::::||____
 |:::::::::::::::||      ||ガチャ
 |:::::::::::::::||      || ,,―‐.                  r-、    _,--,、
 |:::::::::::::::||  ,―-、 .| ./''i、│  r-,,,,,,,,,,,,,,,,,,,,,,,,―ー.    ゙l, `"゙゙゙゙゙ ̄^   \
 |:::::::::::::::|| /   \ ヽ,゙'゙_,/   .゙l、         `i、   \ _,,―ー'''/  .,r'"
 |:::::::::::::::||´ .,/^'i、 `'i、``     `--‐'''''''''''''''"'''''''''''゙     `゛   .丿  .,/
 |:::::::::::::::|| . ,/`  ヽ、 `'i、                        丿  .,/`
 |:::::::::::::::|| 丿    \  .\                      ,/′ 、ヽ,,、
 |:::::::::::::::||'"     || ゙'i、  ‘i、.r-、      __,,,,,,,,--、     / .,/\ `'-,、
 |:::::::::::::::||      ||  ヽ  .]゙l `゙゙゙゙"゙゙゙゙ ̄ ̄     `'i、  ,/ .,,/   .ヽ  \
 |:::::::::::::::||      ||   ゙ヽ_/ .ヽ_.,,,,--―――ー-ノ_,/゙,,/′     ゙l   ,"
 |:::::::::::::::||      ||        `             ゙‐''"`        ゙'ー'"
 |:::::::::::::::||      ||
 \:::::::::::|| ̄ ̄ ̄ ̄
   \ ::::||
    \||



614:Socket774
07/06/17 00:18:43 5n9Xca7K
完全自動設計ってスゲーな
人手の関与なしかw

615:Socket774
07/06/17 00:26:12 BxqqZavo
>>611
タイトルを訳したんじゃなくて内容の説明が書いてあるだけじゃないの?

616:Socket774
07/06/17 00:27:03 BxqqZavo
>>614
すごいでしょ?すごいことなんだよ

617:Socket774
07/06/17 00:30:37 5n9Xca7K
すごいというか、あきれるというか
篠沢教授の「書いた人素人」説にドーンと10万円

618:Socket774
07/06/17 00:32:44 BxqqZavo
>>608
つか「物議を醸す」じゃね?

619:Socket774
07/06/17 00:33:58 BxqqZavo
>>617
あ、玄人の方でしたか
それは失礼

620:Socket774
07/06/17 01:02:40 Ucg5+yXd
ん、R-CUBEに沿って高位設計やったというか、SystemCから動作合成したのかと思ったよ。

621:Socket774
07/06/17 01:36:51 BxqqZavo
そこまでやんないと全自動って言っちゃだめ?
きびしいなあ

622:Socket774
07/06/19 15:51:04 zJAgVdxo
パナソニック、世界初45nmプロセスのシステムLSI
URLリンク(pc.watch.impress.co.jp)

623:Socket774
07/06/19 16:25:42 Dwt+mVea
MPUを作れるほどの性能じゃないだろうけど凄いなあ。
液浸リソも導入してるし。

624:MACオタ>622-623 さん
07/06/19 17:29:07 m1s4HKDZ
>>622-623
  -----------------
  MPUを作れるほどの性能じゃないだろうけど
  -----------------
読めば判るように、45nm、液浸リソ、歪みトランジスタ、low-kと新技術満載で、
十分ハイエンドプロセッサ用トランジスタを製造できるす。

韓国がメモリで日本を追い越したことでも、AMDのようなチンピラ企業がCPU市場で
幅を利かせていることからも判る様に、半導体産業って超高価な製造装置を揃えて
ちゃんとしたレシピを教えてもらえれば、ある水準迄わ何とかなるす。

625:Socket774
07/06/19 17:37:13 EcwKucep
もう45nm量産開始か
Intelより早いな

626:MACオタ>625 さん
07/06/19 17:39:32 m1s4HKDZ
>>625
「量産」と言っても規模がIntelとわ違うような気がするす。

627:Socket774
07/06/19 19:18:52 4LrXkv6m
量産ならIntelはもう開始してるんじゃない?
Harpertownは9月か10月に出荷予定だから。

628:Socket774
07/06/19 19:18:55 ZWw6tH4a
>>623
>>622に、CPUとグラフィックを統合したSoCを45nmで作る、と出ているんですが。

AM34(AM33)ってオリジナルアーキテクチャらしいけど、
CPUからソフト開発まで自分のところでやってしまうのか。

629:Socket774
07/06/19 20:38:55 /kxj7yuS
>>627
>9月か10月
2-3ヶ月引いてみれ
大体こうなるでそ
URLリンク(enterprise.watch.impress.co.jp)


630:Socket774
07/06/19 22:45:21 Ue7tOmG0
省電力用のトランジスタとハイパフォーマンス用のトランジスタじゃ
作りが全然違うでしょ

631:Socket774
07/06/19 23:32:57 Ue7tOmG0
たとえば、ゲート長を比較して見ると、
松下の45nmプロセスのゲート長は40nmである。
これはIntelの65nmプロセスのゲート長35nmより長い。
URLリンク(journal.mycom.co.jp)
また富士通はゲート長40nmを90nmプロセスですでに達成している。
URLリンク(journal.mycom.co.jp)

もちろんゲート長だけで全てが決まるわけではないが、このことから
推測できるのは、今回の松下の45nmプロセスは省電力向けのプロセス
であり、汎用CPUを作るのに必要なハイパフォーマンス向けのプロセス
ではないであろうということだ。

632:Socket774
07/06/20 00:23:15 WlIH5ol+
ハイパフォーマンス向けじゃないね。
だから何?

633:Socket774
07/06/20 00:51:54 R7jIE7l7
>>624
要素技術だけで判断されても困る。
歪Siは性能を上げる代わりにリーク電流を抑える方向にも使えるし。
だいたいPanasonic自身がITRSの45nm Low Standby Powerと比較してるじゃん。
LSTPの場合ゲート絶縁膜が厚いからMPUには向かないよ。

634:631
07/06/20 01:00:12 u5HmCUkf
>>632
松下の45nmプロセスでハイエンドプロセッサを作れると書いてる人がいたから
説明してあげたの

635:MACオタ>631 さん
07/06/20 01:08:09 OgFpxvHt
>>634
発表したプロセスそのままでハイエンドプロセッサクラスのトランジスタが製造できるという
誤解を与えたのわ失礼したすけど、単に発表されたプロセスが低消費電力チップ向けなだけで、
工場設備自体わハイエンドプロセッサの製造にも使えるレベルだと思われるす。


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch