07/05/25 01:27:10 6ojiKhut
こちらもPowerPCネタすけど、開催中のMicroprocessorr ForumでAMCCが新PowerPC 440
"Titan"を発表したす。
URLリンク(www.eetimes.com)
-----------------------
The 90nm Titan is a dual-core processor that hits 2 GHz in bulk CMOS to deliver
8,000 Dhrystone MIPS.
-----------------------
高速化のミソわ、ダイナミックサーキットによるプロセッサ設計の雄、Intrinsityの技術を
導入したことにあるす。ちなみにこのIntrinsityもサマセット研時代のPowerPC技術者の
会社す。
Intrinsityの初期製品わMIPSベースだったすけど、これPowerPCのライセンスが高くて
MIPSを選んだといういわくつきの話す。Power.org以前のPowerPCの戦略の不味さが
改めて明らかになったとも言えるかと思うす。
ちなみにPPC440コアの代表的製品といえばBlue Gene/Lすけど、果たしてAMCC/Intrinsity -> IBM
という痛快極まりない技術の逆転わ有るすかね。。。
393:MACオタ@続き
07/05/25 01:37:22 6ojiKhut
"Titan"の成果わ、POWER6に続いて「回路設計レベルの革新で性能を上げる」ということが
可能であることを証明したす。
Penrynの"Radix-16"除算回路の投入も含めて、この方針が当座の性能向上のトレンドになる
気がするす。これわ設計に費やすコストやマンパワーの増大につながると思うすけど、
なんだか技術者をリストラしつつあるらしい某社の先見性の無さっぷりって。。。
394:Socket774
07/05/25 01:44:46 YPUxFNec
FreescaleがSOI含めIBMと協業する話は1月に既出す。
395:MACオタ>394 さん
07/05/25 01:55:56 6ojiKhut
>>394
これすね。
URLリンク(www-06.ibm.com)
IBMわバルクシリコンでSamsungやInfineon, SOIでChartaedやFreescaleと以前から提携
している訳すけど、ここで面白いのわ今回の発表に今までIBMを中心とするプロセス開発
連合の一員だったSonyと東芝が入っていないことす。
この辺に、今回のリリースの意図があるすかね。。。
----------------------
また5社は5月24日、都内で32nmプロセス共同開発に関する記者発表を行ない、その
取り組みを日本企業に向けてアピールした。
----------------------
396:Socket774
07/05/25 01:57:37 XYN0T54V
そういや↓この件はどうなったの?
URLリンク(enterprise.watch.impress.co.jp)
397:・∀・)っ-○◎●
07/05/25 01:59:31 7M5pJbNR
ノート向けのPPC64はFreescaleには期待せんよ
もっともPowerBookはもう二度とでないだろうが
398:Socket774
07/05/25 02:01:45 XYN0T54V
> Sonyと東芝が入っていない
↓この絵には書いてあるけど…
URLリンク(pc.watch.impress.co.jp)
399:MACオタ>396 さん
07/05/25 02:02:46 6ojiKhut
>>396
質の悪い株屋に買収されて、事業を切り売りされるんじゃないかと恐れていたすけど、
単に良いスポンサーが付いて経営が安定する方向に向かってる模様す。
400:MACオタ>398 さん
07/05/25 02:04:22 6ojiKhut
>>398
"Research"(基礎研究)にしか入っていないすけど?
401:Socket774
07/05/25 02:04:35 XYN0T54V
>>398にはAMDも書いてあるね
402:Socket774
07/05/25 02:05:54 XYN0T54V
>>400
へ?もともと、そういう位置づけでしょ?
403:MACオタ@補足
07/05/25 02:06:38 6ojiKhut
ちなみにそのスライドの"Common Platform Manufacturing"ってのわ、同一の設計でどの会社でも
製造できるというレベルの話すから、ファウンダリ企業にしか関係無いと思われるす。
404:MACオタ>402 さん
07/05/25 02:07:59 6ojiKhut
>>402
CELL BEをSonyとIBMのどちらでも製造できるという点で、現状のIBM-Sony-東芝連合わ
"Common Platform Manufacturing"レベルかと。。。
405:Socket774
07/05/25 02:13:09 YPUxFNec
そもそも今回の発表はバルクであってSOIじゃないでしょ。
SONY、東芝はSOI組なんだから。
ちなみに32nm以降の協業についてのプレスリリース
URLリンク(www-06.ibm.com)
406:Socket774
07/05/25 02:13:15 XYN0T54V
そらあんたの思い込みでしょ
407:Socket774
07/05/25 02:16:00 XYN0T54V
>>406は>>404ね
わかると思うけど
408:MACオタ>407 さん
07/05/25 02:33:49 6ojiKhut
>>407
思い込みでチップの製造を他の会社に移管できるなら、今頃AMDのプロセッサわUMCで
製造されていた筈かと(笑)
409:Socket774
07/05/25 02:36:49 XYN0T54V
なんか噛み合ってないな
まあいいや 説明するのめんどい
おやすみ
410:Socket774
07/05/25 02:46:00 /eUBhKTg
組込のチマチマしたCPUなんざどーでも良いと
内心思っているオレガイル
411:Socket774
07/05/25 02:47:26 /ebs1hSy
でもこれから何年かは自動車向けのCPUの覇権争いが面白そうだよ
412:Socket774
07/05/25 02:49:26 /eUBhKTg
softwareの方が大変
413:Socket774
07/05/25 02:55:02 /ebs1hSy
それはご愁傷様
414:Socket774
07/05/25 10:39:21 fUKbherf
POWERの話になると比較にならんぐらい生き生きするな。
昔から思ってたんだが何でPOWERオタと名乗らないんだ?>MACオタ
415:Socket774
07/05/25 11:31:58 aLBUbQUc
>>414
同意
416:Socket774
07/05/25 15:10:48 5kaRtAE5
【MPF07】米MIPS社が新CPUコア「74K」の詳細を発表,「合成可能なコアで1GHzの壁を超えた」
URLリンク(techon.nikkeibp.co.jp)
ついに合成でも1GHz出るようになったんやね
しかし、パイプラインは17段でアウトオブオーダー採用とは
417:Socket774
07/05/25 15:15:21 5kaRtAE5
そしてケータイでも1GHz到達というお話
【MPF07】米QUALCOMM社,1GHz動作のアプリ・プロセサ「Scorpion」と次世代プラットフォーム「Snapdragon」の詳細を明らかに
URLリンク(techon.nikkeibp.co.jp)
IntelとAMDの1GHz競争も今は昔、か
418:Socket774
07/05/25 15:47:32 b5hOWJJk
車1台には6インチウェハ分の半導体が搭載
URLリンク(pc.watch.impress.co.jp)
419:MACオタ
07/05/25 17:59:42 6ojiKhut
POWER6の国内発表会の記事を読んだヒトも多いかと思うす。
URLリンク(enterprise.watch.impress.co.jp)
注目わパッケージで、この写真のようにL3を外付けにすることを前提にしたSCM(Single Chip Module)
での製造から開始されている点す。
URLリンク(enterprise.watch.impress.co.jp)
ちなみにPOWER5わ最小構成でもeDRAM L3をパッケージに混載したDCMが基本で、SCMわ
単に同じパッケージからL3チップが取り外されているだけす。
・POWER5 SCM: URLリンク(www.ibm.com)
・POWER5 DCM: URLリンク(www-03.ibm.com)
明らかに初期からブレードサーバーやワークステーションクラスの製品等、ローエンド構成にも
搭載する意欲満々に見えるす。
420:Socket774
07/05/25 18:23:45 i6JnI7Wm
PPCの9シリーズと統合しただけなんじゃないの?
421:MACオタ>420 さん
07/05/25 18:38:06 6ojiKhut
>>420
そういう意味す。ただPPC9xx自体わ外販してるチップすから、それがすぐさまPPC9xxの消滅を
意味する訳じゃ無いす。
422:Socket774
07/05/25 21:23:53 0OeUO3H3
「ビジネス開発にHPCを」、IntelがHPC普及に向け専門組織を新設
URLリンク(enterprise.watch.impress.co.jp)
>>382と同じネタかな?
HPC分野ではメモリ帯域を稼ぐため、メインメモリを1つのCPUに占有させるというところか
まあ、マルチコアなんで1CPUって言っても実はSMPじゃんって話はあるが
423:Socket774
07/05/26 11:33:57 ctmJLC3v
PPC9xxは使い道が限られてるからな…
CoreやAthlonと同じで。
424:Socket774
07/05/29 23:26:05 HVQ65ILd
IBM's Power6 architecture goes down the Itanic route
URLリンク(www.theinquirer.net)
POWER6はインオーダだからダメってのはあまりにも乱暴
ただ、アウトオブオーダやめなければ3GHzくらいでも今の性能出るんじゃないか
って気もするし、それなら電力あたりの性能はむしろそっちの方がいいんじゃ
ないかって気もするし
結論: Intel Core 最強w
425:Socket774
07/05/30 00:20:51 7bRoM0B9
POWER6は驚くほど速くはない!?
URLリンク(www.geocities.jp)
SPECint2006では・・・クロックがが1/3しかないItanium 2と比較して,ベース
では2割,ピークでも4割程度のアドバンテージしかありません。
SPECfp2006も・・・Itanium 2と比較すると,ベースで8%,ピークで23%という
アドバンテージです。
この程度であれば,Itanium 2がMontvaleで追いつけないというほどの性能差ではありません。
やはり,クロックを上げると相対的にメモリレーテンシが増加する効果や,
コアをインオーダ化したこと等により1サイクル当たりの命令実行数
(Instruction per Cycle:IPC)は低下しているようです。
426:Socket774
07/05/30 00:24:06 mIOLNfnp
>>424
Pentium4 2.53GHzが55Wくらいで、AthlonXP 2200+が80Wくらいだっけ
そんな時代を思い出すな。
AthlonXP<クロック上げるとか馬鹿のやることじゃね?w
427:Socket774
07/05/30 00:30:23 9Pi+Pcj0
>>424
OoOが電力効率悪い理由は性能向上幅以上にトランジスタを注ぎ込まないといけないから。
428:Socket774
07/05/30 00:40:15 UALXv4Ar
ARMv7のマルチプロセッサ拡張
URLリンク(pc.watch.impress.co.jp)
429:MACオタ>425 さん
07/05/30 00:45:25 Yeer8U2G
>>425
いちおう、安藤氏のその意見に関する私の感想わこちらす。
スレリンク(jisaku板:548番)
peakの結果の方でわ十分引き離しているすから良いんじゃないすかね。。。
430:Socket774
07/05/30 01:22:25 /kcySFd7
トランジスタをつぎ込んでIPCを向上させても、トランジスタ数に比例して性能が向上することはない。
かといって、IPCを向上させずに周波数だけを上げても、周波数に比例して性能が向上することはない。
431:Socket774
07/05/30 02:05:32 uHJt7RE4
Pentium4 2.53GHz TDP61W
AthlonXP 2200+ TDPmax67W、TDPtyp61W
432:Socket774
07/05/30 02:15:39 uHJt7RE4
Pentium4 2.53GHz 最大電流*電圧80W
AthlonXP 2200+ 最大電流*電圧68W
433:Socket774
07/05/30 18:47:29 CB682ZJ8
>>430
ついでに、単純にマルチコアにしても、コア数に比例して性能が向上することはない。
434:Socket774
07/05/31 00:29:35 +wcTBWA4
SMPでリニアに伸びるのは8CPUぐらいまでだったような。
20CPUぐらいで頭打ちになるんだったかな。
435:Socket774
07/05/31 01:34:46 5Tk5PeeV
のびねェよ
どんな単純なin cache loopでハカッテンダか
436:Socket774
07/05/31 11:29:53 m0XuhTpq
IBMがPOWER6Macを出さない方が問題だ。
437:Socket774
07/05/31 12:43:24 97NLY2+b
MacとMacOSの販売権はAppleにあるのになんでIBMが?
438:Socket774
07/05/31 16:28:43 2TZXESHq
IBMがPowerBook用G5を出さなかったのでMacがIntelに乗り換えた、
みたいな話じゃないのか。
439:Socket774
07/05/31 19:01:45 +EsokglI
PowerPCはバカ売れしてるんだが、アップルはパソコンメーカーでは4位程度のメーカーだったので
PowerPC出荷量の1-2%に過ぎなかった。
だから後回しにされた、というわけだ。
このスレはまた別の話だが、自作住人ってなぜか、8コアとか4.7GHzとか、そこら辺の「単語だけ」に反応するよな
440:Socket774
07/05/31 21:46:07 AaTJk+Q1
物事を一個の数値などに単純化しすぎると万人に分かり易くなる
その反面、物事の繊細な本質が見えなくなる
ベンチの性能性能言ってるヤシらだって同じアナのムジナ
441:MACオタ>439 さん
07/05/31 22:25:06 2PTa9e5w
>>439
-------------------
PowerPC出荷量の1-2%
-------------------
組込向けの10倍以上の単価すから、売上に換算すると結構な割合になるすけど。。。
問題わIntelに対抗できるだけの開発費にペイするかどうかってことかと思われるす。
442:Socket774
07/05/31 23:21:21 jtygb6Va
>>439-440
例えばゲーマーだったら、ゲームを快適に楽しみたい、という目的が有って組むけど、
組むこと自体が目的だったら、単語や数値にこだわるのも自然では?
日常使用では、一部の用途を除けば、普通のPCで十分だし。
443:Socket774
07/06/01 00:00:12 WzMifvmK
E6850なんか3GHzでTDP65w。
Power6の存在価値がMacであるかといわれるとかなり微妙。
444:440
07/06/01 02:47:43 SiuhZr8w
>>442
言いたかったのは単純化しすぎた数値にばかり着目すると
結局、変な代物ができあがると言うこと。
cellしかり、点数教育しかり
そしてlinpackだけが速くてその実、使い物にならないcomputerしかり
445:Socket774
07/06/01 03:02:13 NjWj7TXW
>>444
そういう設計だと割り切って作られてる製品を、知っている単語だけで反応し、分かりやすい解説が入るまで叩けないんだよな
446:Socket774
07/06/01 23:32:19 QUNfC2Zd
競争相手としてのPowerPC Macは欲しかったな。
447:Socket774
07/06/02 00:11:35 jbhfMETz
どの市場でも二、三の勢力が競争してるのがいいんだけど、
2,3割のシェア取れなければやっていけないから。
448:・∀・)っ-○◎●
07/06/02 04:36:54 v+AN2/M3
Meromと張り合えるのはPWRficientくらいしかない
449:Socket774
07/06/02 06:46:46 EzwA+Sgl
POWER6の動作電圧の広さもなかなか
450:Socket774
07/06/03 23:56:36 blpDVZUU
URLリンク(pc.watch.impress.co.jp)
451:Socket774
07/06/04 00:26:52 3T+mlpe/
Windows VistaをPPCに移植してそっちをライバルにでもなんでもしてくれ
マカーはx86になって幸せを満喫しているんだよ
452:・∀・)っ-○◎●
07/06/04 00:33:04 lC/IGYNE
IntelにとってはAppleは高値のXeonとMeromだけを買ってくれるいい客だもんな
にしてもClovertown 3GHzは異常に安いが。
453:Socket774
07/06/04 02:04:22 qSi407+l
>>451
IntelがPPCを作り、MSがPPC版Vistaを出せば、全て解決。
x86と同レベルのモノを作ることは、両者にとって困難ではないだろう。
454:Socket774
07/06/04 02:14:57 Fm9PoG+L
素性はいいからな
455:Socket774
07/06/04 13:09:42 hunJO2CG
VistaではなくXPでお願いっ><
456:Socket774
07/06/04 13:43:57 qSUy4G0i
世界初のGPUを使ってサクサク動く画像編集ソフト「Pixelmator」
URLリンク(gigazine.net)
Intelアボーン
457:Socket774
07/06/04 15:33:26 /58af8vC
Adobeアボーンの方がいい…。
458:Socket774
07/06/04 23:49:35 XdYG8Al+
Sun puts a T1 on an FPGA
URLリンク(www.theinquirer.net)
FPGAベースのSPARCコア
どうすか?
459:Socket774
07/06/05 00:25:48 wwj1N8r4
>>453
次世代XBOX用CPUじゃだめなの?
460:Socket774
07/06/06 20:59:54 ChcJKd3f
【DAC2007】IBM社、45nm製造ASICにSOIとエンベデッドDRAMを採用
URLリンク(www.eetimes.jp)
【DAC 2007】米IBM,45nmSOIや0.13μm液浸,Si貫通ビアなどのASICを発表
URLリンク(techon.nikkeibp.co.jp)
461:Socket774
07/06/06 23:32:44 DZwHYlDQ
京速のアーキテクチャまだ決まってなかったらしいな
462:Socket774
07/06/06 23:53:04 GN/V5iug
寄せ集めだろ
ここ数年、何やってたんだか
463:Socket774
07/06/07 00:06:53 OxOjGKY/
プロジェクトを遅らせるほど技術の進歩で京速を達成するのが容易になりますw
464:Socket774
07/06/07 01:16:17 lOpeRYuU
ライバルも進化する
イタチごっこ
忘れちゃいないだろうな
465:MACオタ
07/06/07 20:49:10 OCp7RXQD
ここのところPOWER6関連で、海外の掲示板等で紹介されていた特許や論文を漁っていたす。
POWER6に関してわ、高速化の代償として整数演算ユニット(FXU)がインオーダー実行になっている
ことが以前から指摘されていたすけど、これ以外にもコアに機能上のトレードオフとして削減された
部分やや改善が加えられた部分があるす。以下、興味深い点について書き残しておくす。
長くなるかと思うすけど、勘弁して欲しいす。
■レジスタリネームの削除
FXUでOoOEを削ったことに加えて、OoOEを残したFPUやVUでもレジスタリネーム機能を完全に
削っているす。つまり、ちゃんとpowerアーキテクチャで定義された32個レジスタを有効活用しないと、
レジスタ競合で始終パイプランが停止してしまうということになるす。
ただしHPC Linpackの成績を見ると、POWER4/5と同程度のパイプライン段数であるにもかかわらず
リネームレジスタ数を72->120に大増強したPOWER5とそれほど変わらない効率を出しているす
(POWER5: 84.8%, POWER6: 79.6%, 共にp570 16-way)。
命令キューも小さくなっていることでキャッシュにヒットしてデータが連続的に供給される限りわ、
シンプルな構造にしたことが成功していることが判るす。
ちなみにリネームレジスタわ存在しないものの、後述する投機実行機能に使う一時使用のための
レジスタファイルが一セット用意されている模様す。
466:MACオタ@続き
07/06/07 20:56:23 OCp7RXQD
■load/branch lookahead機能
L1キャッシュやTLBのミスで発生する長期のストール時に実行する一種の投機実行機能なんすけど、
「実行」する訳じゃない。。。ってのが面白いところす。
in-orderでリネームレジスタを持たないという設計により、投機実行中にレジスタの書き換え等、
プロセッサの内部状態が変わるようなことが一切できないす。そこで、冬季実行している間の
実行結果わ捨てて、L1キャッシュへのプリフェッチや分岐テーブルの更新のようなプロセッサの
内部状態を変えない動作のみを行うす。ストールが終わって後続の命令が開始されると、必要な
データがL1に入っていたり、分岐予測の精度が上がっていたりして万々歳ということになるす。
この機能、OoOEと違ってパイプラインバブルを埋めることわ出来ないすけど、普通のin-order実行
で問題となるキャッシュミス等での完全停止の対策としてわ面白いす。バブルについてわ高い動作
クロックと整数命令の実行レイテンシを1に削減したことで影響わ少ないという考えだと思われるす。
ちなみに投機実行中に全くレジスタに書き込めないと、本来の目的である後続のload命令や分岐
命令の実行まで行き着くことすらできないんで一時使用のためのレジスタファイルを一セット持って、
投機実行中の演算結果を書き込むようにしている模様す。
467:MACオタ@続き
07/06/07 21:02:26 OCp7RXQD
■プレデコードの強化
私わ以前から「POWER6わNetburstの衣鉢を継ぐ」とか書いているすけど、これもトレースキャッシュ
に近い機能す。RISCでわ下のメモリ階層からL1命令キャッシュに読み込む段階でプレデコードを行う
すけど、以前わ実行パイプラインで行っていた命令のグループ化の大半をこのプレデコードの段階で
行う模様す。
命令ごとに必要とするリソースを示すビットとグループ境界の参考用に使うビットが付加されるために、
L1キャッシュ内の命令わ32-bit幅のpower命令より若干肥大化するす。この肥大化分が64KBという
L1命令キャッシュのサイズに含まれているかどうかわ不明す。
ちなみにFXUのin-order化/FPUのOoOEの規模縮小により命令のcrackingやらmillicoding (より単純な
命令への変換機能)わ無くなった模様す。複数の実行ユニットを使用する命令わ存在するす。
後述の整数乗除算命令なんかわ、その一例す。
468:MACオタ@続き
07/06/07 21:09:05 OCp7RXQD
■命令ディスパッチレベルのSMT
以前に、
スレリンク(jisaku板:818番)
----------------------------
issue queue内部でOoOE機構を持たないプロセッサにSMTって実装する意味があるすか(笑)
----------------------------
なんてことを書いた覚えがあるすけど、なんとPOWER6わ2つのスレッドから7命令をグループ化して
ディスパッチすることでSMTを実現しているす。グループ生成の制限わ、まず優先スレッドから
in-orderかつ所要リソースがダブらないという制限で最大5命令で、残りをサブスレッドから。。。
というモノす。場合によってわサブスレッドの命令のほうが多くなる筈す。
ちなみにPOWER4/5わ命令キューにサイクルあたり5命令のグループをディスパッチして、命令キュー
からアウトオブオーダーで7命令をイシューするという設計だったすけど、OoOEを縮小した分最初から
静的に7命令をイシューするようになったとも言えるす。なんとなく更にVLIW的になったという気もするす。
469:MACオタ@続き
07/06/07 21:14:55 OCp7RXQD
■FPUによる整数乗算/除算の実行
おかげで従来パイプライン化されていなかった整数乗除算がパイプライン化されるす。ただし
スループットわ2。
■FPUの逆数/平方根近似値命令の高精度化
14-bit精度になったとのことす。そのまま使えそうな値すね。
■FPUパイプラインの改善
除算や平方根のようにパイプラインを何周もする長レイテンシの命令がFPUを占有している間に、
前述の一時使用レジスタをその手の命令に回すことで後続の命令をパイプラインに投入できる
ようになっているす。
ただし論文でも「リネームレジスタが無いのでシングルスレッドでの効果わ今一つ」とあるす。
ただし片側のスレッドが除算とかを実行中に、もう一つのスレッドからのFPU命令をどんどん投入
できるそうす。
■単精度浮動小数点わ実行レイテンシが大きい?
倍精度FP演算わ6-cycle後の後続命令に結果をフォワードできるとのことすけど、単精度わ
丸めの追加処理が複雑になるのでフォワードが遅くなるらしいす。
470:MACオタ@続き
07/06/07 21:19:36 OCp7RXQD
■VMX (AltiVec)
VMXのイシューポートが一つだけになって、演算とvpermを同時実行できなくなっているという噂が
流れているすけど、それわ無い模様す。
特許でもVMXユニットが2つ(多分VIU/VFPUとVPERM)という実装例が記述されているし、何より
ダイ写真でベクトルレジスタが2ブロックあって、2つのパイプランが並列実行することを示しているす。
(POWER4以来、IBMの設計わパイプラインごとにレジスタを割り当てている。例えばFXU0とFXU1の
GPRわ別でそれぞれ32個づつある)
どうやらFPUとVMXの関係わ、PPEとよく似ていて命令キューを共有し、FPU命令とAltivec命令を
任意の組み合わせでサイクルあたり2つイシューできる模様す。
謎なのわダイ写真を見る限り、ベクトルレジスタが64-bit幅づつ2つに分割されていることで
四則演算ならともかくシフトやpermuteで不都合が無いのか非常に不思議す。
■リネームレジスタの話の続き
リネームレジスタを削ったかわりに、演算やロードの結果を引数として使う場合の優遇措置わ
色々ある模様す。
471:MACオタ@ここまで
07/06/07 21:22:34 OCp7RXQD
まとめるとベンチマークに現れている高性能っぷりわ、in-order実行の問題であるキャッシュミス等
によるストールが各種の新機軸によってうまくカバーされたことを証明しているかと思うす。
CELLのSPEでわ、そもそもストールが発生しないようにLSを採用した訳すけど、同じIBM社内で
in-orderでの性能向上策として色々考えていることが判るす。
POWER6の手法わ将来のPPEの実装にも適用できるネタであることも今後の注目点じゃないすかね。
IBMわ昔から「割り切った」設計をする癖があるすけど、今回の割り切りネタわ
「パイプラインバブルわ放置」
ってところに見えるす。キャッシュ/TLBミスによる長期の停止がIPC低下の主要な原因である
認識わCELL BEの設計方針にも通じるすね。
一方で、数年振りにSPECintの王者の地位を譲ったIntelが今後何をやってくるかわ楽しみす。
IBMと違ってIntelわ 「割り切らない」 会社す。
IBMがPOWER4で「クロックを上げれば命令の実行レイテンシわ多少悪くても良い」と考えた時に、
Intelわ超高クロックのPentium4の上に更に倍クロックのALUを内蔵することで命令のレイテンシを
短縮したす。同じくIBMがデュアルコアわL1をwrite-throughにしてL2で同期すれば良いと考えた時、
IntelわL1をcopy backのままにして、L1間のスヌープを実装したす。
Intelわ既知の性能向上策を決してサボらない会社す。powerを支持する私にとってIntelわ常に
恐ろしい競合相手す。
472:MACオタ@補足
07/06/07 21:23:59 OCp7RXQD
今回参考文献サボったすけど、ほぼソースわあるので質問があれば紹介するす。
473:Socket774
07/06/07 21:27:56 Lm3TZOZJ
IBMとAppleはなぜPOWER6 Macを出さないのか。
474:Socket774
07/06/07 21:30:49 0a8Hjx0P
IntelとPCメーカーはなぜItanium2 PCを出さないのか。
475:Socket774
07/06/07 21:40:31 FiPhouRT
>>470
> 謎なのわダイ写真を見る限り、ベクトルレジスタが64-bit幅づつ2つに分割されていることで
> 四則演算ならともかくシフトやpermuteで不都合が無いのか非常に不思議す。
AMDのPhenomは80bitと64bitに分割されているように見えるが
URLリンク(www.techreport.com)
シャッフルやシフトのスループットは1だな
476:Socket774
07/06/07 21:49:48 FiPhouRT
POWER6の半分程度のクロックだから参考にならないかもな
477:MACオタ>475 さん
07/06/07 21:51:38 OCp7RXQD
>>475
分割されたブロックの距離が妙に遠いすよ。
ダイ写真の方わ>>378のリンク先でも見て欲しいすけど、上側コアの左端がVMXユニットで、
見ての通り128-bit幅のレジスタが2ブロック見える筈が64-bit幅と思しきブロック(赤銅色に見える
四角)が4つあるす。
478:Socket774
07/06/07 22:18:09 SMH/5DS3
トレースキャッシュに続いてランアヘッドも実用化か
Rotenbergはヒーローだな
479:Socket774
07/06/07 22:19:02 SMH/5DS3
何度も言うけどトレースキャッシュとプリデコードキャッシュは全くの別物だから
480:・∀・)っ-○◎●
07/06/07 22:36:23 /oFgfG4i
CellのSPEでもVPERM相当ユニットはLSU側のポートだったな
481:MACオタ>団子 さん
07/06/07 22:46:37 OCp7RXQD
>>480
ちと話わ変わるすけど、PPEのVMXがハーフスピードって話わ、何を探せば書いてあるすか?
482:・∀・)っ-○◎●
07/06/07 22:52:21 /oFgfG4i
もちろん実測。
あとIBMのサイトにも図でそう書いてあったがURLは忘れた。
483:MACオタ>団子 さん
07/06/07 23:00:43 OCp7RXQD
>>482
----------------
あとIBMのサイトにも図でそう書いてあったがURLは忘れた。
----------------
そういうの探したすけど、見つからなかったす。
ところでFGMTでソフト的にわクロック半分のプロセッサが2つに見える筈すから、実測だと半分で
当たり前なんじゃないすか?
484:・∀・)っ-○◎●
07/06/07 23:31:26 /oFgfG4i
「PPE VMX 半速」でググったら俺のカキコしかなくてワロタ
むろん両コンテクスト動かして合計スループットを計測した上で言ってる。
フェッチ・デコードが1コンテクストあたり1命令/clkなだけで演算ユニットのポートの
縛りがないことは判明。
IBMのサイトに明示してあったんだが今探しても見つからん
URLリンク(forum.beyond3d.com)
> XENON's VMX floating simd unit longer than PPS's, because dotproduct,DX compression instructions etc
>
> PPS's vmx contain 8 floating units, but i dont know why,
> it has more facilities:
>
> 1. 2*4 ways floating simd unit
> 2. 1*8 ways simd
> 3. yield problem or higher frequency
> 4. VMX run at half speed
> __________________
> Version of Majic12
485:Socket774
07/06/07 23:41:41 FiPhouRT
演算器内で処理が完結するなら、レジスタが分離していても
Vpermやシャッフルで不都合は起きないような気がしてきた
ところで、2つのスレッドを実行できるということは
レジスタセットは各パイプラインごとに2つあるのか?
486:MACオタ>団子 さん
07/06/07 23:43:19 OCp7RXQD
>>484
引用先わ私も検索で引っ掛けたすけど、ポストしたヒトの推測に過ぎないす。
487:MACオタ>485 さん
07/06/07 23:47:58 OCp7RXQD
>>485
------------------
レジスタセットは各パイプラインごとに2つあるのか?
------------------
そうす。lookahead用の予備も入れるとパイプラインごとに4つということに。
結果的にレジスタの面積わ、リネームレジスタが120あったPOWER5とほぼ同じす。
488:Socket774
07/06/07 23:52:30 M+M1lLB2
命令ごとに必要とするリソースを示すビットとグループ境界の参考用に使うビットが付加されるために、
L1キャッシュ内の命令わ32-bit幅のpower命令より若干肥大化するす。
EPICみたいだな。
489:Socket774
07/06/07 23:53:47 hHjzXuep
Qualcommの携帯電話向けプロセッサ「Scorpion」
~独自実装で1GHz駆動を実現
URLリンク(pc.watch.impress.co.jp)
490:・∀・)っ-○◎●
07/06/07 23:59:20 /oFgfG4i
MPC7450でいうVSIUパスの命令くらいしかまともに計ってないけど
2スレッド使っても綺麗にPPC G4のクロック当たり半速程度しか出ない。
ちなみにSPEは等速かな。むしろ実効ではレジスタ数分伸びた。
491:MACオタ>団子 さん
07/06/08 00:10:53 z+wK8eWd
>>490
7450のマニュアル(Figure.1-1とか)を見てもらえば判るすけど、G4+わVSFX, VCFX, VFPU, VPERMの
4つのAltivecユニットに任意の組み合わせでサイクルあたり2命令を送ることができるすから、
G5を含むIBMの実装より、場合によってわ2倍速いす。
URLリンク(www.freescale.com)
492:・∀・)っ-○◎●
07/06/08 00:14:53 jfss7MXI
じゃあその「場合」からは外れるな。
これはMPC7450系よりPPC970系のほうが速いベンチ
URLリンク(www.openwall.com)
493:・∀・)っ-○◎●
07/06/08 00:26:35 jfss7MXI
8flops * 3.2GHz * 7.5 = 192GFlops
どうみてもVMX半速 +7SPEで計算合います。本当にありがとうございました
※もっとも厳密には3.2GHzじゃなくて3192MHzなんだが
8SPEは217GFLOPSだったっけ?やっぱりVMX半速で計算合うね
494:MACオタ>団子 さん
07/06/08 00:45:42 z+wK8eWd
>>493
これで、パイプラインの内部が見えないすか?
URLリンク(www.alphaworks.ibm.com)
495:・∀・)っ-○◎●
07/06/08 00:51:20 jfss7MXI
既にデータとってるし。
汎用ALUとVPUは実は同時発行できない
496:MACオタ>団子 さん
07/06/08 00:57:06 z+wK8eWd
>>495
--------------
汎用ALUとVPUは実は同時発行できない
--------------
それ普通「半速」とわ呼ばないと思うすけど。。。
497:・∀・)っ-○◎●
07/06/08 00:59:42 jfss7MXI
いや?
半速でしかもそれだって話だが。
だからこそG4 1.42GHzより性能悪いことすらある。
498:MACオタ@訂正
07/06/08 07:09:05 z+wK8eWd
今気付いたすけど、>>469のこれ間違いす。
誤: ただしスループットわ2。
正: ただしスループットわ0.5。
499:Socket774
07/06/08 09:55:52 SUTtHFb0
>>472
> 今回参考文献サボったすけど、ほぼソースわあるので質問があれば紹介するす。
時間があれば参考文献も読んでみたいので、紹介ヨロシク。
500:Socket774
07/06/08 11:24:28 lO8SGlCb
CBE PPUのVMXは半速じゃないよ。
クソシーケンス喰わせりゃ激遅になるだろう。
501:MACオタ>499 さん
07/06/08 20:55:36 z+wK8eWd
>>499
羅列しておくす。
■講演資料
"POWER6 Technology Overview" URLリンク(www.nevicare.nl)
■論文
"P6 Binary Floating-Point Unit" URLリンク(www.lirmm.fr)
"The Physical Design of the POWER6 Microprocessor," (ISSCC 2007) 出所不明
"A 5GHz+ Binary Floating-Point Adder for the POWER6 Processor" URLリンク(www.ece.ucdavis.edu)
■特許 URLリンク(appft1.uspto.gov)
20060101241 "Instruction group formation and mechanism for SMT dispatch"
20060149933 "Branch lookahead prefetch for microprocessors"
20060149934 "Using a modified value GPR to enhance lookahead prefetch"
20060149935 "Load lookahead prefetch for microprocessors"
20060179346 "Method for checkpointing instruction groups with out-of-order floating point instructions in a multi-threaded processor"
20060184772 "Lookahead mode sequencer"
■その他
URLリンク(gcc.gnu.org)
502:499
07/06/08 22:38:09 SUTtHFb0
>>501
サンクス。
503:MACオタ
07/06/08 23:12:15 z+wK8eWd
京速計算機プロジェクトってお取り潰しになるんじゃないすか?
URLリンク(www8.cao.go.jp)
-------------------
さらに、本計算機の目標性能も0.5ペタFLOPS と低いこ
とから、国家プロジェクトとしてベクトル計算機の開発に本格的に着
手する必要性が必ずしも明確となっていない。同様に、「逐次処理計
算機部」についても、目標性能は1.0ペタFLOPS と低いため、国家
プロジェクトとして開発に着手する必要性が必ずしも明確ではない
という点が挙げられる
。。。
さらに、仮に本プロジェクトの提案のとおり、「大規模処理計
算機部」、「逐次処理計算機部」、「特定処理計算加速部」の3部構成を
とることとした場合、それらを密に結合する必然性が必ずしも明確で
なく、したがって密な結合を担うこととしている「異機種間接続超高
速インターコネクション部」を開発する必要性も明確ではない。
-------------------
504:Socket774
07/06/09 00:17:06 +cl7l/KQ
>>503
もう、時代の曲がり角はとっくに過ぎているのに
なのに20年来の延長線上で恐竜が呉越同舟
時間と労力の無駄使い。
気の毒だが、不要といえばもう不要なものなのかも。
公の文章に載るようじゃ末期症状。
逆に日本のsoftwareの発展にとっては明るい材料かも。
気の毒だが。
505:Socket774
07/06/09 00:27:18 7JZlOV4/
スレリンク(jisaku板:36番)
506:Socket774
07/06/09 00:53:56 wA13ajxS
最新(?)の議事概要(案)はこちら
URLリンク(www8.cao.go.jp)
507:Socket774
07/06/09 00:55:33 wA13ajxS
そんときの配布資料がこれ
URLリンク(www8.cao.go.jp)
508:Socket774
07/06/09 01:02:42 A41g6ChJ
これは、だめかも知れない…orz
509:・∀・)っ-○◎●
07/06/09 06:04:29 pT0bFs6z
>>500
はい?どうみても半速ですが。
もちろん2スレッド食わせてますよ。
510:MACオタ>505 さん
07/06/09 07:00:26 EMxJLxfn
>>505
確かに日付的にも古いネタで失礼したす。
511:Socket774
07/06/10 23:56:28 G1K9FyWr
Intelが進める、32コアCPU「Larrabee」
URLリンク(pc.watch.impress.co.jp)
512:Socket774
07/06/11 15:13:47 p9ucv6e7
これからプログラムの勉強する香具師がわざわざx86のアセンブラなんか触るのか?
どうも先には行き止まりが見えるような希ガス
513:Socket774
07/06/11 15:40:25 ofkhG31A
え、独学なら普通x86じゃない…?
514:Socket774
07/06/11 17:17:00 ereyh0Xr
まー最適化をある程度見限ってJavaやC++つー手もあるけれど。
非x86つーと昔のPowerPCMacくらいか。
更にそれ以外となると入手の敷居が一気に高くなる。
515:・∀・)っ-○◎●
07/06/11 21:31:27 kQKbSO0n
新品でプログラミングの勉強用にPPCマシン手に入れようと思ったら今や最も手軽なのがPS3
てか唯一の選択肢。
まあ俺はPPC Mac確保しといたけど。
516:Socket774
07/06/11 22:13:58 KDWVWLfu
>>513
まーねー、他の選択肢がことごとく絶滅したからね(または敷居が高すぎる)。
目的を何にするかにもよるが x86 は純粋なアセンブラの勉強としては
不向きだな。
517:・∀・)っ-○◎●
07/06/11 22:22:59 kQKbSO0n
勉強用はCASL-II/COMET-IIでいいじゃん。
518:Socket774
07/06/11 22:27:01 VSslfRui
なんという情報処理技術者試験www
電子工作とかやるんならZ80もいいと思うんだけど
パソコンとはるとx86以外見当たらんなー
519:・∀・)っ-○◎●
07/06/11 22:27:02 kQKbSO0n
x86はアドレッシングも楽だしアセンブリ言語で組みやすいだろ。
バイナリコード直接叩くわけじゃあるまいに
あとRISCの単純さ・直交性は人間のためじゃなくて高級言語コンパイラの為。
520:Socket774
07/06/11 22:29:03 vPDHJOXc
あぼ~んが多いな。
521:Socket774
07/06/11 22:42:51 /vQSZ4oB
x86はアセンブラ組みやすいし読みやすいぞ。8086の頃の悪評に引きずられてるんだろうけど
386以降のいわゆるx86は別物だ。
522:Socket774
07/06/11 23:57:49 ZEZsU2em
最近、x86を批判して通ぶってる奴が多い気がする。
523:MACオタ>522 さん
07/06/12 00:04:13 3acacnku
>>522
申し訳無いとわ思うすけど、この21世紀にデコードのボトルネックを解消したのしないのと
自慢してるのがイタいのわ事実す。
当のIntelですら、トレースキャッシュでこの手の問題から開放された筈だったすけど。。。
524:Socket774
07/06/12 00:16:36 9b6vHxQn
トレースキャッシュとプリデコードッキャッシュは別もんだと
一体何度言ったら。。。
525:MACオタ>524 さん
07/06/12 00:31:15 MDfzQR8J
>>524
固定長命令であれば実行時のデコードの並列化わ容易なので「デコードのボトルネック」なんて
存在し得ない。。。という話であって、プレデコード云々わ関係無いす。
もちろんプレデコードだって楽になる訳すけど。
526:MACオタ
07/06/12 00:36:16 MDfzQR8J
ところで「プレデコードキャッシュ」ってあまり聞かない用語だな。。。と思って調べてみたら、
AMD K6が命令キャッシュをそう呼んでたすね。
異常に固執してる理由が理解できたす(笑)
私が書いているのわ、RISC一般の技術的な話なので関係無いと思って欲しいす。
527:Socket774
07/06/12 01:11:04 9b6vHxQn
>>526
あいわらず重箱の隅ばかりつついて本質が見えないやつだな
デコード済みの命令をキャッシュするものは、トレースキャッシュとは全くの別物
間違える学生が出てくると可哀想だしね
528:Socket774
07/06/12 01:15:57 9b6vHxQn
トレースキャッシュは(分岐をまたいだ場合の)命令フェッチバンド幅を改善するもので
はっきり言ってあんまり関係ない
529:Socket774
07/06/12 02:23:14 qq7wRrjd
仮にデコードが性能のボトルネックというならば
L1 cache latencyを減らし
L1 band widthを広げ
単に周波数を上げればいい
こんな楽な話なら誰も苦労はない。
530:Socket774
07/06/12 02:27:38 sn3C1Sz4
>L1 cache latencyを減らし
>L1 band widthを広げ
>単に周波数を上げればいい
想像して文章化するのは楽かもしれんが、
どれもあまり楽な作業には見えないんだが…
531:Socket774
07/06/12 02:31:54 qq7wRrjd
全体をはやくするよるり
はるかに楽
532:Socket774
07/06/12 02:33:18 qq7wRrjd
そして、本当に速いコンピューターを造るより(ry
533:Socket774
07/06/12 06:35:01 z0xtk4Yc
>>529は全体を速くしろと言ってるのと同義じゃん。
単に周波数を上げろ、ってそれが出来れば苦労しねえw
534:Socket774
07/06/12 14:05:13 d3BHTW54
>>533
>単に周波数を上げろ、ってそれが出来れば苦労しねえw
この板ではいとも簡単に数十パーセント上げてる人多いけどね。
535:Socket774
07/06/12 14:26:24 4w3k7zFW
OCと定格を上げるのは別
536:Socket774
07/06/12 14:36:07 d3BHTW54
まぁそうだけどね。
「上げるのが難しい」みたいな書き方するから。
あまり熱くせずに上げるのが難しいというか、消費電力とのトレードオフで
理想的な並列度、キャッシュサイズ、動作周波数が導出されるのであって、
周波数を上げるのが難しいから(いや実際難しいんだけどさ)大変だというような
簡単な話じゃないじゃん。グダグダですまんが。
537:Socket774
07/06/12 15:13:40 z0xtk4Yc
単に周波数を上げるのが簡単なら並列もくそもなく
単に周波数を上げるだけでいいだろうがw
538:Socket774
07/06/12 15:29:38 dKdjYBjD
>>536
経済性を度外視して良いならば、今のPC用CPUのクロックを上げるのは簡単だろ。
COMPUTEXではC2Dを液体窒素で冷却してオーバー5GHzのデモをやったところがあるらしいから。
URLリンク(techon.nikkeibp.co.jp)
でも、そういう話をしている訳じゃないだろ。分かってはいるみたいだが。
しかし、5GHz超でやることが円周率の計算って、他に使い道はないのかw
539:Socket774
07/06/12 17:04:19 tY9GwOwo
>>537
それなんてP4?
540:Socket774
07/06/12 20:14:28 aLTHOdm3
>>526
>ところで「プレデコードキャッシュ」ってあまり聞かない用語だな。。。と思って調べてみたら
ちょっ、MACオタがまともなことばづかい.....
541:Socket774
07/06/12 20:17:55 GjgVlMc2
>>540
ワロタw
~あまり聞かない用語すね。。。
542:Socket774
07/06/12 23:57:25 3fdUXTLK
>>503
京速ぽしゃるな。間違いない。
次世代スパコン、日立など3社で共同開発
URLリンク(www.nikkei.co.jp)
543:Socket774
07/06/13 00:07:36 9iVvw2ns
この記事からは、ぽしゃる訳が読みとれん…
りけんが投げ出した?
544:Socket774
07/06/13 00:15:23 Vcm54YBE
世界一の性能目指すのに3社連合なんてありえないでしょ
545:Socket774
07/06/13 00:15:34 9iVvw2ns
12日、3社連合で実施する方針を決め…
今後2年間で部品選定などの最終設計を詰め、2010年度の完成を目指す
ここか
546:Socket774
07/06/13 00:18:51 9iVvw2ns
3社連合なんて最初から予定調和でしょ。
今まで方針が公に決まらなかったこと
今から設計、作り始めて2年あまりで稼働までもってくことw
この辺では?
OSとかsystemsoft、アプリ絶対間に合わない
547:Socket774
07/06/13 00:24:02 CZHwQSW/
結局、富士通とNEC+日立の2案が
まとまらなかったってことだろw
どっちかばっさり切って退場してもらう決断もできなかった。
中途半端のシステムになるの目に見えてるよ。
URLリンク(techon.nikkeibp.co.jp)
「2案の大きな違いはマイクロプロセサ1個の演算性能とそれを
いくつ利用するか,の違いにある」(理研)と説明する。目標とする
10PFLOPSを実現する上でマイクロプロセサ1個の性能と総数の
選び方にいくつかの選択肢がある。例えば,10GFLOPSの
マイクロプロセサを100万個用いて実現するか,100GFLOPSの
マイクロプロセサを10万個用いて実現するか,といった選択肢である。
50GFLopsで20万個ですか?
548:Socket774
07/06/13 00:26:33 9iVvw2ns
使いやすい物が出来ない
速い物が出来ない
まともに動くものが出来ない
あなたの落とした斧はどれですか?
549:Socket774
07/06/13 00:28:30 9iVvw2ns
>>548
50Gなら5個、10個でそ
10万20万はペタのレンジが目標の個数かと
550:Socket774
07/06/13 00:28:46 Vcm54YBE
> 中途半端のシステムになるの目に見えてるよ。
そうそう、そういうこと。
551:Socket774
07/06/13 00:39:23 Vcm54YBE
>>549
10GFLOPS×100万
=100GFLOPS× 10万
= 50GFLOPS× 20万
ってことでしょ?
さすがは聞伝くんだね
まあ、今から50GFLOPSの石を作ってる時間は無いと思うけど
552:Socket774
07/06/13 01:08:19 JG2WjFw+
誉められた訳では無さそうだな。
石はたぶん出来るよ。石だけは。
石が出来ることnearly equall computer systemが完成すること
彼らにとっては
553:Socket774
07/06/13 01:09:35 JG2WjFw+
入れ物も多分できるら。
554:Socket774
07/06/13 01:49:13 QAejXdvb
> 誉められた訳では無さそうだな。
馬鹿にしてすまなかった そのことについては謝る
10GFLOPSってのは、おそらく富士通のスカラ
100GFLOPSってのは、おそらくNECのベクタ
どちらも、元になるアーキテクチャがあるんだから作れる見込みはあるんだろう
でも、今から50GFLOPSなんていう石(新アーキ?)は作れないんじゃないの?ってこと
ああ、NECの石を半分の性能で作ればいいのか(意味ねえw)
ソフトがなけりゃ石だけ(あるいは入れ物だけ)あっても仕方ないってのはその通り
なんだけど、それはまた別の話
555:Socket774
07/06/13 02:14:41 QAejXdvb
URLリンク(grape.astron.s.u-tokyo.ac.jp)
> と、この辺まで 6/3 に書いたのですが、 6/12 になって「三社連合でやる」と
> アナウンスがあった模様です。これはおそらくアーキテクチャを1つにはしなかった、
> ということですから、私としては間違った方向ではないと思います。 2つなり3つなり
> 作ってそれがちゃんと相補的なものになっているかどうかが課題でしょう。問題は、
> 一つに絞ろうとした段階で無理がきていないかです。
あれ、結局複合型なのか?
556:Socket774
07/06/13 02:30:01 wWkhH4LX
>>555
繋ぐだけでしょ。悪く言えば。
その高速接続の必要性に文系からケチが付いたんじゃないのかな。
それぞれ勝手に作って繋ぎますって
手前らの都合で変な物でっち上げやがって
ってわけか
557:Socket774
07/06/13 02:37:29 wWkhH4LX
単体についてもケチ付く度にかさ上げ->仕様変更
10Gってのは今となっては見所無いな
単体の理論≒見かけ性能を上げるためにあの手この
せこい手
558:Socket774
07/06/13 02:39:07 wWkhH4LX
さすがに一からは作らんでしょw
559:Socket774
07/06/13 02:40:10 lc87I9Ju
超伝導素子のCPUってまだ出ないのかな。ルータの試作はできてるらしいけど。
水冷するくらいなら冷凍機もたいして違わんと思うし、かべは低くなってきてるはず。
560:Socket774
07/06/13 02:42:39 mzY8h5N8
ある大型の公共事業案件に入札しようとした会社全てに落札させ、
お金を全ての会社に配ることにしました。めでたしめでたし。
>>555
561:Socket774
07/06/13 02:43:07 wWkhH4LX
ゲートの集積とかどーすんだ
しらんけど
562:Socket774
07/06/13 03:04:15 iPxjk4gP
>>559
トランジスタのスイッチングがいくら速くても
CMOSと同等の集積度が実現できない時点で勝負にならない
563:Socket774
07/06/13 09:46:29 tqmXM3ki
Intelがコンパイラ改良でスコアを上げてきた
Xeon5160 3.0GHz
SPECint2006 = 20.8
URLリンク(www.spec.org)
564:Socket774
07/06/15 00:08:55 l8fKxgpo
次世代スーパーコンピュータ概念設計評価報告書 出ました
URLリンク(www.mext.go.jp)
結論としては
> 本システム構成案は複合システムであるという大きな特徴を有し、世界的
> 主流となっているスカラプロセッサに演算加速機構を付加したプロセッサ
> と、我が国が強みをもつベクトルプロセッサの改良型となる新しい汎用
> プロセッサを同時に開発するものである。
とのこと
あと、面白かったのは↓このあたり
> なお、スーパーコンピュータそのものの市場は必ずしも大きくなく、今後の急激な
> 拡大も期待できないことから、プロセッサ技術を情報家電の国際的競争力の強化に
> 活用できるようにするなどの視点も重要である。
ベクトルCPUを搭載したPCエンジン萌えw
565:Socket774
07/06/15 00:12:38 l8fKxgpo
この記事が一番わかりやすかったかな?
次世代スパコンはスカラーとベクトルの複合型に,日立/NEC/富士通の「3社連合」で開発へ
URLリンク(techon.nikkeibp.co.jp)
しかし日立が何をやるのかは謎
566:Socket774
07/06/15 00:38:40 tDoErVrM
スカラー、ベクトル、日立の三題囃しなら
疑似ベクトル
567:Socket774
07/06/15 01:08:32 fA4TnNzo
携帯電話用プロセサでスパコンを構築が今の流れだろ。
568:Socket774
07/06/15 01:10:59 qDSXRzlG
演算加速機構ってなんだろね?
「~を付加したプロセッサ」って書いてあるから
クリアスピードみたいなのとは違うのかな
569:Socket774
07/06/15 01:21:05 qDSXRzlG
>>567
スーパーHコンピュータか なんかエッチだな
恥丘シミュレータとか
570:元
07/06/15 01:55:57 F6redfqx
ワロタ
571:Socket774
07/06/15 01:57:16 pw/H2CwG
>>394
に対する評価報告
>① 革新性
>システム構成案は、スカラプロセッサ、ベクトルプロセッサ、各演算部内部のネッ
>トワーク構成、両演算部のアーキテクチャなどについて、革新性の高い部分を有する。
>ただし、両プロセッサについては、基本的に従来のプロセッサ構成の延長上にある
>ことから、改良はなされているものの、新規の系統の技術という観点においては、革
>新性は限定的である。一方、コンピュータ技術は積み重ねで成り立っており、単に独
>創的なだけでは、技術として定着しないことにも留意すべきである。
>今後、両演算部を一つのシステムとして活用するシステムソフトウェアの開発に期
>待したい。
革新性がないと報告されてしまいました
572:Socket774
07/06/15 02:01:37 P+sEboHH
新規制もないし
互換性もないよ
573:Socket774
07/06/15 02:05:25 P+sEboHH
システムソフトウェアの開発に期待するのは勝手だけど
そっちは予算0だったりして
まあ頑張りな。金貰った以上、よそに頼らず自力でやってご覧、一回くらい。
574:Socket774
07/06/15 02:50:21 9D6a4gQt
>>566
SR11000。
>>568
SIMD拡張とかアレイプロセッサブロックとかじゃない?
温度スケーリングやんないのかやるわけ無いか開発会社にいないし。
575:Socket774
07/06/15 03:12:54 55Dpun1n
>その結果、HPCC 過半数目標はシステム全体の性能を評価するものとしては必ずしも適切ではないこと、
>HPCC 過半数目標を達成するシステムは、Linpack 性能、汎用性、消費電力、設置面積
>などの目標及び予算上の制約を満足しないことが明らかになった。
>これを踏まえ、作業部会においてこれら目標間のプライオリティに関する議論を行った結果、
>HPCC 過半数目標より汎用性、消費電力、設置面積などの目標の達成がより重要であることから、
>HPCC 過半数目標そのものを変更すべきであるとの結論に至った。
>新たな性能目標のための評価項目としては、
> ①多様なアプリケーションの実効性能の評価に資するものであること
> ②ある程度世界的にも認知されていること
>との視点から、「HPCC Award 4項目」が適切であり、新たな性能目標としては、
>「HPCC Award 4項目において最高性能を達成する」とすることが適当であると考える。
HPCC Award 4項目中2つは「京速を使ってこんな研究をしましたすごいでしょ」で賞が奪れる。
残り2つは、ノード間のインターコネクト、I/Oとファイルシステムの二点が革新的だと認められねば奪れない。
>CPU やノードの信頼性向上については、キャッシュのECC 機能、内蔵RAM のパリティ検査など、
>故障診断のための十分な対策も取られており、評価できる。
>ただし、システム規模を考慮すると、それらの対策による構成要素の信頼性の向上に加え、
>更なる故障への対策が必要であると考える。
信頼性も足りないと報告されてしまいました。
576:Socket774
07/06/15 22:57:09 3nCxAE7Z
>>574
> 温度スケーリングやんないのか
東芝ネタ?
577:Socket774
07/06/15 23:08:04 QlFlJbog
JAMSTEC、地球シミュレータの有償利用サービスを拡大
URLリンク(pc.watch.impress.co.jp)
578:Socket774
07/06/15 23:44:59 +i7eJ7fF
>>576
Yes。
579:Socket774
07/06/16 03:55:05 elT2K0ah
諌早湾に要らぬ堰を作るようなものかな
それがどんなに高い堰で広大な耕地の開拓であっても
いまや不要な物には変わりない
ましてや死体累類の上にlinpakが何テラflopsだとか
あれは高みの見物気分なのかな
社会的にも科学的にも無意味どころか害しかもたらさない
税金ばらまきに群がり麗しき山河を汚すゼネコンの業界腐敗体質と
あまりにも似ている
コモデティーにコテンパンにのされて自業自得
580:Socket774
07/06/16 03:57:04 elT2K0ah
実力で食えないなら
ダニのように血税にたからず
撤退しなさい
581:Socket774
07/06/16 04:00:01 elT2K0ah
出来損ないのゴミみたいなハードウェアをソフト部門に押し受けて
遅いはずはないとかほざいて
延々欠陥探しをさせて
死人がでて知らん顔
そんな物になぜ国は税金使う
止めなさい
582:Socket774
07/06/16 04:02:58 elT2K0ah
欠陥コンピューター
ゴミコンピューター
使う人を不幸にするコンピューター
ゴミみたいな論文書き散らかしてパルプ資源を無駄にして
すぐスクラップにするだけのコンピューター
583:Socket774
07/06/16 11:20:49 c3pmJz/U
> 死体累類
死屍累々じゃね?
584:Socket774
07/06/16 12:15:06 p1UJkUSL
地球シミュレータ,産業界向けに有償利用サービスを拡大--成果非公開での利用が可能に
URLリンク(techon.nikkeibp.co.jp)
585:Socket774
07/06/16 12:24:34 jbOlHIjm
【VLSI速報】東芝がCellのSPUを完全自動設計,面積を30%削減しつつ4GHzの周波数を達成
URLリンク(techon.nikkeibp.co.jp)
SPU単体とは言え、全自動で4GHzってのはすごいね
586:Socket774
07/06/16 12:45:34 RGmzfI6M
そんなことはどうでもいい
URLリンク(www.scei.co.jp)
4GHzを超えるクロックを実現
URLリンク(journal.mycom.co.jp)
1.4V/56℃で5.6GHzでの動作を確認
587:Socket774
07/06/16 13:06:46 jbOlHIjm
どうでもよくないでしょ
全自動で設計できるかどうかってのは、IPとして商売する上では重要なことだよ
588:・∀・)っ-○◎●
07/06/16 13:15:46 qMnq9V8b
4GHzで動くのは元々なので、実は「面積縮小」のほうが結構重要だったりする。
歩留まりも上げられるし、同じ面積ならユニットを増強する方向にも持って行ける。
Larrabeeの1コアのサイズって今のSPEを45nm工学縮小したくらいのサイズのようだね
もっともL2キャッシュやCSI・メモコンは外に別個にあるようなので、ロジック部だけで
考えればLarrabeeのコアはSPUよりやや大きい。
589:Socket774
07/06/16 13:16:19 gOkEv8jK
面積30%減ってのも情報家電なんかで使う上では
コスト的にかなりポイント高い
590:Socket774
07/06/16 13:18:00 gOkEv8jK
被った
失礼
591:Socket774
07/06/16 13:24:14 AAncA++b
テレビにCellが使われる日は訪れるのだろうか?
東芝はテレビにDDR2メモリ使ってるにょ、とかいうのを売りにしてるからそのうち来るのかも。
592:Socket774
07/06/16 14:06:09 f1XmZbGo
てか面積30%減て尋常ではないんだが>>586は間違いなくアホ
593:Socket774
07/06/16 14:20:38 RGmzfI6M
はあ?
おれが反応したのはここなわけだが
>4GHzってのはすごいね
594:Socket774
07/06/16 14:25:36 yQ5Dir22
>>593
また内容考えずに、パソコン視点でしか突っ込めない方ですか?
595:Socket774
07/06/16 14:26:13 2Kkbnnp9
そうそう、アフォなのは>>586じゃなくて>>585
すでに4GHzで動くものはあるんだから、全自動でできるかどうかなんて
どうでもいい
596:Socket774
07/06/16 14:30:59 RGmzfI6M
ラボレベルで達成した数値の無意味さを揶揄しただけなのに
とんちんかんな反応するアホばっか
597:Socket774
07/06/16 14:33:25 2Kkbnnp9
アホばっかりで疲れるよね
598:Socket774
07/06/16 14:33:35 yQ5Dir22
>>596
まさに>>586でお前が書いた1行目がピッタリだな
そんなことはどうでもいい
599:Socket774
07/06/16 14:38:00 RGmzfI6M
>>598
しつこいなデブ
無意味だからこそ一行目に「そんなことはどうでもいい」とエクスキューズをつけた
わかってることを繰り返すなアホ
600:Socket774
07/06/16 14:45:59 UKngPFP3
配線遅延やらスキューやらを考えると
面積70%化で6GHzくらい行ってくれないと
601:Socket774
07/06/16 14:47:32 V/QSlehr
コンパクションすると、むしろ配線的には厳しいんですが…
602:Socket774
07/06/16 15:01:15 V/QSlehr
で、まさに厳しそうなところを追加のツール(クロック系、太幅配線)で
対応したという話ではないのかな?発表聞いたわけでも論文読んだわけでも
ないから、わからんけど
603:Socket774
07/06/16 15:15:02 V/QSlehr
つか30%も小さくしてキャパシタとか足りてるのか?
こりゃ論文読んだ方がいいかな
604:MACオタ>585 さん
07/06/16 16:00:53 qcd6RBae
>>585
"Synthesizable"を「自動設計」って訳すのわ、適当なんすかね?
605:MACオタ
07/06/16 19:16:28 qcd6RBae
POWER6のSPEC2006のデータがSPECのサイトで公開されたす。
■INT2006: URLリンク(www.spec.org)
■FP2006: URLリンク(www.spec.org)
■INT2006_rate
(2-way) URLリンク(www.spec.org)
(4-way) URLリンク(www.spec.org)
(8-way) URLリンク(www.spec.org)
(16-way) URLリンク(www.spec.org)
■FP2006_rate
(2-way) URLリンク(www.spec.org)
(4-way) URLリンク(www.spec.org)
(8-way) URLリンク(www.spec.org)
(16-way) URLリンク(www.spec.org)
606:MACオタ@続き
07/06/16 19:19:04 qcd6RBae
peakのコンパイラオプションすけど、INT/FP共にAltiVec (VMX)オプションをつけて成績アップ
という傾向が見えるす。時期XLC/XLFで自動ベクトル化オプションが付けば、baseも現在の
peak並に改善する見通しかと思われるす。
607:MACオタ@続き
07/06/16 19:22:35 qcd6RBae
ボクシングの採点スタイルでCoreマイクロアーキと比較したい方わ、この辺見ると良いす。
URLリンク(www.realworldtech.com)
-------------------------
Subtest Power6 Woodcrest Score
400.perlbench 13.7 24.1 9:10
401.bzip2 16.1 16.1 10:10
403.gcc 19.8 18.0 10:10
429.mfc 36.8 20.8 10:9
445.gobmk 17.9 21.4 9:10
456.hmmer 17.1 20.0 9:10
458.sjeng 14.9 19.6 9:10
462.libquantum 96.6 31.2 10:7
464.h264ref 30.6 32.9 10:10
471.omnetpp 18.5 14.4 10:9
473.astar 13.8 15.2 10:10
483.xalancbmk 18.3 24.6 9:10
Total: 21.6 20.8
-------------------------
608:MACオタ
07/06/16 21:29:08 qcd6RBae
IBMのCTO Bernard Meyersonのインタビューす。
URLリンク(www.edn.com)
POWER6, 物議を呼んだエアギャップ技術, Intelとの競合など、色々語っていて読み応えあるす。
609:Socket774
07/06/16 21:34:32 OvBb9yz/
>>607
DRAW てw
610:Socket774
07/06/17 00:08:14 BxqqZavo
>>604
別に"Synthesizable"を「自動設計」って訳したわけじゃないと思うけど
「完全自動設計」って書くことに何か問題でも?
611:MACオタ>604 さん
07/06/17 00:15:24 Kp8SxLEQ
>>610
-----------------
別に"Synthesizable"を「自動設計」って訳したわけじゃないと思うけど
-----------------
記事の冒頭をもう一度読んで欲しいす。
URLリンク(techon.nikkeibp.co.jp)
=================
東芝がマイクロプロセサ「Cell」のSPUを完全自動設計で実装した例を紹介した(講演番号5-4)。
=================
当該講演のタイトルわ、"A Design Methodology Realize an Over GHz Synthesizable Streaming
Processing Unit"す。
612:Socket774
07/06/17 00:16:24 5n9Xca7K
>>607
総合するとほぼdrawでも、内訳見ると
得手不得手の特徴が出ているな…
> 400.perlbench 13.7 24.1 9:10
> 462.libquantum 96.6 31.2 10:7
613:Socket774
07/06/17 00:17:24 xLg5r3T8
>>607
URLリンク(www.geocities.jp)
/||ミ
/ ::::||
/:::::::::::||____
|:::::::::::::::|| ||ガチャ
|:::::::::::::::|| || ,,―‐. r-、 _,--,、
|:::::::::::::::|| ,―-、 .| ./''i、│ r-,,,,,,,,,,,,,,,,,,,,,,,,―ー. ゙l, `"゙゙゙゙゙ ̄^ \
|:::::::::::::::|| / \ ヽ,゙'゙_,/ .゙l、 `i、 \ _,,―ー'''/ .,r'"
|:::::::::::::::||´ .,/^'i、 `'i、`` `--‐'''''''''''''''"'''''''''''゙ `゛ .丿 .,/
|:::::::::::::::|| . ,/` ヽ、 `'i、 丿 .,/`
|:::::::::::::::|| 丿 \ .\ ,/′ 、ヽ,,、
|:::::::::::::::||'" || ゙'i、 ‘i、.r-、 __,,,,,,,,--、 / .,/\ `'-,、
|:::::::::::::::|| || ヽ .]゙l `゙゙゙゙"゙゙゙゙ ̄ ̄ `'i、 ,/ .,,/ .ヽ \
|:::::::::::::::|| || ゙ヽ_/ .ヽ_.,,,,--―――ー-ノ_,/゙,,/′ ゙l ,"
|:::::::::::::::|| || ` ゙‐''"` ゙'ー'"
|:::::::::::::::|| ||
\:::::::::::|| ̄ ̄ ̄ ̄
\ ::::||
\||
614:Socket774
07/06/17 00:18:43 5n9Xca7K
完全自動設計ってスゲーな
人手の関与なしかw
615:Socket774
07/06/17 00:26:12 BxqqZavo
>>611
タイトルを訳したんじゃなくて内容の説明が書いてあるだけじゃないの?
616:Socket774
07/06/17 00:27:03 BxqqZavo
>>614
すごいでしょ?すごいことなんだよ
617:Socket774
07/06/17 00:30:37 5n9Xca7K
すごいというか、あきれるというか
篠沢教授の「書いた人素人」説にドーンと10万円
618:Socket774
07/06/17 00:32:44 BxqqZavo
>>608
つか「物議を醸す」じゃね?
619:Socket774
07/06/17 00:33:58 BxqqZavo
>>617
あ、玄人の方でしたか
それは失礼
620:Socket774
07/06/17 01:02:40 Ucg5+yXd
ん、R-CUBEに沿って高位設計やったというか、SystemCから動作合成したのかと思ったよ。
621:Socket774
07/06/17 01:36:51 BxqqZavo
そこまでやんないと全自動って言っちゃだめ?
きびしいなあ
622:Socket774
07/06/19 15:51:04 zJAgVdxo
パナソニック、世界初45nmプロセスのシステムLSI
URLリンク(pc.watch.impress.co.jp)
623:Socket774
07/06/19 16:25:42 Dwt+mVea
MPUを作れるほどの性能じゃないだろうけど凄いなあ。
液浸リソも導入してるし。
624:MACオタ>622-623 さん
07/06/19 17:29:07 m1s4HKDZ
>>622-623
-----------------
MPUを作れるほどの性能じゃないだろうけど
-----------------
読めば判るように、45nm、液浸リソ、歪みトランジスタ、low-kと新技術満載で、
十分ハイエンドプロセッサ用トランジスタを製造できるす。
韓国がメモリで日本を追い越したことでも、AMDのようなチンピラ企業がCPU市場で
幅を利かせていることからも判る様に、半導体産業って超高価な製造装置を揃えて
ちゃんとしたレシピを教えてもらえれば、ある水準迄わ何とかなるす。
625:Socket774
07/06/19 17:37:13 EcwKucep
もう45nm量産開始か
Intelより早いな
626:MACオタ>625 さん
07/06/19 17:39:32 m1s4HKDZ
>>625
「量産」と言っても規模がIntelとわ違うような気がするす。
627:Socket774
07/06/19 19:18:52 4LrXkv6m
量産ならIntelはもう開始してるんじゃない?
Harpertownは9月か10月に出荷予定だから。
628:Socket774
07/06/19 19:18:55 ZWw6tH4a
>>623
>>622に、CPUとグラフィックを統合したSoCを45nmで作る、と出ているんですが。
AM34(AM33)ってオリジナルアーキテクチャらしいけど、
CPUからソフト開発まで自分のところでやってしまうのか。
629:Socket774
07/06/19 20:38:55 /kxj7yuS
>>627
>9月か10月
2-3ヶ月引いてみれ
大体こうなるでそ
URLリンク(enterprise.watch.impress.co.jp)
630:Socket774
07/06/19 22:45:21 Ue7tOmG0
省電力用のトランジスタとハイパフォーマンス用のトランジスタじゃ
作りが全然違うでしょ
631:Socket774
07/06/19 23:32:57 Ue7tOmG0
たとえば、ゲート長を比較して見ると、
松下の45nmプロセスのゲート長は40nmである。
これはIntelの65nmプロセスのゲート長35nmより長い。
URLリンク(journal.mycom.co.jp)
また富士通はゲート長40nmを90nmプロセスですでに達成している。
URLリンク(journal.mycom.co.jp)
もちろんゲート長だけで全てが決まるわけではないが、このことから
推測できるのは、今回の松下の45nmプロセスは省電力向けのプロセス
であり、汎用CPUを作るのに必要なハイパフォーマンス向けのプロセス
ではないであろうということだ。
632:Socket774
07/06/20 00:23:15 WlIH5ol+
ハイパフォーマンス向けじゃないね。
だから何?
633:Socket774
07/06/20 00:51:54 R7jIE7l7
>>624
要素技術だけで判断されても困る。
歪Siは性能を上げる代わりにリーク電流を抑える方向にも使えるし。
だいたいPanasonic自身がITRSの45nm Low Standby Powerと比較してるじゃん。
LSTPの場合ゲート絶縁膜が厚いからMPUには向かないよ。
634:631
07/06/20 01:00:12 u5HmCUkf
>>632
松下の45nmプロセスでハイエンドプロセッサを作れると書いてる人がいたから
説明してあげたの
635:MACオタ>631 さん
07/06/20 01:08:09 OgFpxvHt
>>634
発表したプロセスそのままでハイエンドプロセッサクラスのトランジスタが製造できるという
誤解を与えたのわ失礼したすけど、単に発表されたプロセスが低消費電力チップ向けなだけで、
工場設備自体わハイエンドプロセッサの製造にも使えるレベルだと思われるす。
636:Socket774
07/06/20 01:19:42 u5HmCUkf
了解
ただ>>633も言ってるように、要素技術だけじゃ判断できないよ
インテグレーションが重要なわけだからね
装置買ってくればいっちょ上がりだなんて、ハイエンドのプロセス作ってる
人たちに失礼だと思うよ
637:Socket774
07/06/20 01:24:20 u5HmCUkf
あ、低消費電力に特化したプロセスが、ハイエンドのプロセスに劣るって
言ってるわけじゃないから、念のため
638:MACオタ>636 さん
07/06/20 01:39:02 OgFpxvHt
>>636
>>624を読み直してもらえば判ると思うすけど、装置だけと書いたつもりわ無いす。
製造法にも特許わ有ることでもあるし。。。
639:Socket774
07/06/20 02:05:21 u5HmCUkf
ああ、そうね
「装置買ってくればいっちょ上がり」ってのは取り消すよ
でも、「工場設備自体わハイエンドプロセッサの製造にも使えるレベル」だからって
「十分ハイエンドプロセッサ用トランジスタを製造できる」なんて気安く言ってほしくないな
640:Socket774
07/06/20 03:22:58 neDffndi
ハイエンドでなくとも45nを作れない
自称ハイエンド・メーカーの落ちぶれた末裔が
必死のスレはここですか
641:・∀・)っ-○◎●
07/06/20 06:48:59 ON5x0qjV
独力開発を諦めたGKさんじゃねーの?
642:Socket774
07/06/20 10:12:30 K8GEcSmJ
IBM勢の惨めな事w
643:MACオタ
07/06/21 00:54:38 pNWcD04K
>>608のパート2が掲載されているす。
URLリンク(www.edn.com)
今回わ主としてファウンダリや設計サービスビジネスについて語っているす。
あと余談的にCELLの応用について触れているすね。
--------------------
Q: Do you foresee the alternative energy market as an opportunity, as well?
Reeves: We’re looking at how the Cell processor can improve the efficiencies of energy
distribution and management.
--------------------
644:Socket774
07/06/21 01:16:57 ZdEEI9ji
POWER6 Macの話はまだですか。
645:Socket774
07/06/21 01:28:04 eByXhLwi
Intelの方がいい仕事してるのにPOWERに戻る意味ないじゃん
646:Socket774
07/06/21 08:25:57 wgKh30DU
POWER6は性能はダントツだよな。
647:Socket774
07/06/21 09:00:15 fiJ+daSA
PowerBook用の省電力PPCが出来ればPPCに戻るんじゃないか。と非現実的な話。
648:Socket774
07/06/21 10:53:41 w/yy/UeF
アップルはたしかにPCメーカーとしてはシェア大きいほうだけど、PowerPCの売り上げからみたらたいしたことないので
作ってもらえない
649:Socket774
07/06/21 13:27:25 fY2+aU7P
出来ればって、単純な話、IBMには出来ないんじゃないの
Intelの45nmプロセスに勝るようなCPUは
だいたい970FXとかで開発失敗したのが、アップル撤退の原因じゃないか
650:Socket774
07/06/22 01:01:21 Q39GCPBs
>>646
お値段もダントツらしいよ
651:Socket774
07/06/22 07:42:01 ELgAFMAg
メモリやI/Oのバンド幅増やしすぎで自爆しました
652:MACオタ
07/06/23 12:19:06 P6ZL+h52
nVidiaが株主総会で「プロセッサにわ参入しない」と語ったとのことす。
URLリンク(www.theinquirer.net)
本業に専心するのわ、悪いことじゃ無いと思うす。
653:Socket774
07/06/23 18:26:07 Nyp8cojH
そらCPUやっても勝ち目ないしな
654:Socket774
07/06/23 19:31:50 Khh2W8zZ
>>653
しかしやってたら商売広がるだろ。
PDAとかSTBとかCPUとGPUがワンチップならメリットは大きい。
Transmetaに出てきて欲しいところですが、まあ夢のまた夢ですな……
655:Socket774
07/06/23 19:40:23 +4U3v1vY
MediaGXという略
656:Socket774
07/06/23 19:44:24 oBe4ZBD4
Intelその他の汎用プロセッサ屋が莫大な金を費やし
長年積み上げてものをいったいなんだと思っているのか
ヘタに突っ込むと大火傷を負う
657:Socket774
07/06/23 19:46:22 Bm2eURUf
ファブレス企業がCPUに参入してもな…
Transmeta、がーんばっ
658:MACオタ>654 さん
07/06/23 20:52:37 P6ZL+h52
>>654
-------------
しかしやってたら商売広がるだろ。
-------------
SOCで勝負するなら、プロセッサわIPとして買ってくれば良いす。
そういえば、先ごろ中国企業もIBMからPowerPC4xxのライセンス買ってたす。
URLリンク(www.eetimes.com)
659:・∀・)っ-○◎●
07/06/23 21:00:08 dKNl7abl
竜芯はもろパクリだっけ
660:Socket774
07/06/24 04:01:42 FMvc+QSB
モドキだ。
ハゲが
661:Socket774
07/06/24 07:37:43 n3ZrAQsp
刻印削ってリマークじゃなかったっけか。
662:Socket774
07/06/24 08:21:32 5WlZWSzO
刻印削ってリマークは漢芯
龍芯はMIPSもどき(今はライセンスとってMIPS互換にしてる)
663:Socket774
07/06/26 00:33:38 Jny78Hed
44th Design Automation Conference - プロセッサは1,000コアへと向かう
URLリンク(journal.mycom.co.jp)
ポラックの法則vsアムダールの法則ってところか
664:Socket774
07/06/26 01:14:09 DsnEwNEJ
タスクマネージャが大変なことになりますなぁ
665:Socket774
07/06/26 01:19:39 aGbb2xJH
>>663
>プロセッサは1,000コアへと向かう
んなこと書いてねえぞ
666:Socket774
07/06/26 01:49:58 BHBR8AFO
> トランジスタ数は・・・2015年には1,000億個を突破する
って、原子の大きさとバランス取れてる? > 計算できる人
667:Socket774
07/06/26 04:07:19 G4trD4Yl
集積度だけでしか進歩の指標が語れないヤシには言わしておけばいい。
その頃奴らは引退済み、へたすりゃ棺桶の中。
昔ふかした言の葉の責任なんてどこ吹く風の現世利益だろ。
668:MACオタ
07/06/26 18:46:31 E+b+TZBO
Hot Chips 19のプログラムが掲載されているす。
初日 URLリンク(www.hotchips.org)
二日目 URLリンク(www.hotchips.org)
初日のPOWER6関連のセッション、GPU/大規模マルチコアのセッション。
二日目のPCのモバイル技術のセッションあたりが、このスレッドの対象すかね。。。
669:Socket774
07/06/26 22:23:28 ztJbnYgY
単純計算でシリコン系原子が0.2nm間隔で詰め込んであるとして
10mm^2には、(5*10^7)^2で25*10^14個入る(縦方向無視)
2500兆個/1500億トランジスタだとぼちぼちやばそうだね。
670:MACオタ
07/06/26 22:25:47 E+b+TZBO
Blue Gene/Pのプレスリリースす。
URLリンク(www-03.ibm.com)
---------------------
Four IBM (850 MHz) PowerPC 450 processors are integrated on a single Blue Gene/P
chip. Each chip is capable of 13.6 billion operations per second.
---------------------
・PPC450: Quad 850MHz PPC440 core with "Double Hummer" FP-APU
・1 petaflops at 294,912-processor
・up to 884,736-processor
・optical rack-to-rack interconnect
671:MACオタ@補足
07/06/26 22:35:03 E+b+TZBO
とりあえず884,736-processorの最大構成で2-PetaFlopsわ超えるす。同じPPC44xベースの
コアが90nmバルクCMOSで2GHzを超えることが可能なことも証明されているすから(>>392参照)、
Blue Geneわ、このままの設計でも数年以内に5-PetaFlopsを超えるロードマップわ現実的す。
672:Socket774
07/06/26 23:24:04 ix5r8O73
サン、「Constellation System」を発表--スパコン格付の首位も視野に
URLリンク(japan.cnet.com)
673:Socket774
07/06/26 23:37:49 Zn5uK/0n
米大学がFPGAで「デスクトップ・スーパーコンピュータ」を試作
URLリンク(techon.nikkeibp.co.jp)
エロい人解説ぷりーず
674:Socket774
07/06/26 23:39:39 Zn5uK/0n
組み込み向けの32ビットMIPS系コアで初めてスーパースカラ方式を導入,74Kコアの開発担当者に聞く
URLリンク(techon.nikkeibp.co.jp)
まだまだARMには負けてないぜ!って感じ
それにしても見出しながっ!
675:Socket774
07/06/27 01:05:44 QlCIbu3J
ファットツリーか
Blue Geneってなんだっけ?
676:Socket774
07/06/27 01:15:19 nzpHibNm
>>672
TACCが10月15日までにAdvanced Micro Devices(AMD)から十分な数の「Barcelona」チップを調達できれば、
さらにSunは、AMDの出方を待つ必要がある。
同システムが次のトップ500ランキングを制することができるかどうかは、
2007年第3四半期に発売予定のBarcelonaが調達できるかどうかにかかっている。
Bechtolsheim氏は「すべてはAMD次第だ」と語った。
遅れそうだから相当プレッシャーかけてんだろな・・・
677:Socket774
07/06/27 01:20:48 QlCIbu3J
プレッシャー掛けたところで出ないもんは出ないだろ
678:Socket774
07/06/27 01:35:36 Kgk8gcuA
Sun,ペタフロップスを実現可能なSolaris機を披露へ
URLリンク(techon.nikkeibp.co.jp)
当初のピーク性能は105TFLOPSだが,2007年中にピーク性能を
421TFLOPSに引き上げる計画である。
IBM社の次世代BlueGene,米Argonne研が導入へ
URLリンク(techon.nikkeibp.co.jp)
今回のBlue Gene/Pの演算性能は114TFLOPS。
2007年秋には3万2768個のプロセサから成るシステムになる。
各プロセサは,4個のCPUコアを1チップ上に集積した,いわゆる
クアッド・コアである。
今年は誰もペタには届きそうにないな。
679:Socket774
07/06/27 03:05:57 vj0xdvjG
積和演算機の数だけならちょろいはずなのにね
あとはどうでもいいんだから
680:Socket774
07/06/27 19:16:27 HFdK6zGW
IBM、最大3Peta FLOPSの世界最速スパコン
「Blue Gene/P」
URLリンク(pc.watch.impress.co.jp)
インテル、vProとItanium 2のロードマップを解説
URLリンク(pc.watch.impress.co.jp)
スーパーコンピュータTop500、IBMが依然トップ。日本勢はトップ10圏外に
URLリンク(www.itmedia.co.jp)
681:Socket774
07/06/27 22:37:15 mcPp6Xxf
>>675
3次元トーラス
682:Socket774
07/06/28 00:42:35 HUDJTTjS
>>679
あとはお金の問題じゃね?
683:Socket774
07/06/28 04:10:47 WZZ72fSE
いくら金かけたってまともなもの造る能力ないくせに
金が足りないせいにしやがって言い訳三昧
ノータリンどもが
684:Socket774
07/06/28 11:12:57 WGkUH28C
スパコンに掛かる金って、開発費よりも部品代だろ。
金に糸目を付けず、贅沢なネットワーク構成にすれば、それなりに性能出るだろ。
685:Socket774
07/06/28 11:59:25 ixXLcdbB
使われるチップの開発コストに比べれば、製造原価なんて微々たるもんだよ
686:Socket774
07/06/28 12:25:09 WGkUH28C
スパコン専用プロセッサより汎用CPUを使うほうが多いと思うんだが、
「使われるチップの開発コスト」って、ネットワークスイッチのこと?
687:MACオタ
07/06/28 20:26:22 B7qBBFTo
BG/LとBG/Pの比較表す。
URLリンク(www-03.ibm.com)
ドラフト版RedBookにわ、新たに加えられたSMPモードについての解説もあるす。
URLリンク(www.redbooks.ibm.com)
----------------------
First is Symmetric Multi-Processing (SMP) mode in which CPU 0 (MPI
rank 0) runs the program’s main process. (Figure 2-3) The program can spawn up to 3
additional threads on the remaining processors.
----------------------
688:Socket774
07/06/28 23:23:56 iPeGFs38
>>683
ほんと聞伝くんは読解力ないんだから
689:MACオタ
07/06/28 23:50:04 B7qBBFTo
牧野先生の京速計算機へのコメントが来てるす。
URLリンク(grape.mtk.nao.ac.jp)
5年前の基準で
--------------------
メモリバンド幅が性能を決めるアプリケーションでも P4 のほうが ES の
4倍価格性能比が良い
--------------------
だそうす。現状は更に。。。
690:Socket774
07/06/28 23:51:51 EnPxIiIY
【レポート】44th Design Automation Conference - Synthetic Biologyは新技術の夜明けとなるか
URLリンク(journal.mycom.co.jp)
691:Socket774
07/06/29 00:29:08 bCM0L7ri
だから、LarrabeeをアクセラレータにしてXeonでTSUBAMEみたいなクラスタ組めばいいって
言ってんじゃんよお
692:・∀・)っ-○◎●
07/06/29 00:32:55 P/e28P4p
つーか、NehalemとLarrabeeの混成はサポートしてるって。
ソケット互換かは知らん。
4~8コア+32コアの変則デュアルソケットは面白そうだな
693:Socket774
07/06/29 00:35:15 BfOScunX
LarrabeeはPCI Expressボードで提供されるんだからソケット互換もクソもない
694:・∀・)っ-○◎●
07/06/29 00:38:01 P/e28P4p
あれ?CSIでダイレクトにリンクする構想って消えた?
695:Socket774
07/06/29 00:45:51 SfPK+Qsm
>>691
>TSUBAMEみたいな
Opteronよりピークの低いCSに使い道はなかったわけで、
Xeonで100Gflops、Larrabeeで1Tflopsぐらいにしとかなきゃ
駄目駄目。
696:Socket774
07/06/29 00:47:20 cNsDc3+L
URLリンク(amb.sakura.ne.jp)
697:Socket774
07/06/29 00:59:12 bCM0L7ri
>>696
ほお
698:Socket774
07/06/29 01:16:09 SfPK+Qsm
>>689
>メモリバンド幅が性能を決めるアプリケーションでも P4 のほうが ES の
>4倍価格性能比が良い
Pen4からXeon SMPにすることで数倍価格性能比を悪化できる
ことを5年前に何割の人がきづいてたかな?
HPC→ハイエンド→Xeon dualみたいな短絡で
屑をつかまされた人もいるはず。
帯域のスケールしないSMPはHPCでは役に立たないということ。
価格あたりのメモリ帯域を最大にしようという製品展開が
少なくともHPC用には存在しなかったというのも問題じゃ。
699:Socket774
07/06/29 01:18:05 4R+hvoYV
何でこんなもんが「ほう」なの
700:Socket774
07/06/29 01:19:50 4R+hvoYV
帯域で言ったならOpteronもドングリの背比べ
中の方はひたすら遊んでる
701:Socket774
07/06/29 01:22:22 4R+hvoYV
キャッシュ頼りのアーキテクチャに
単にメモリバンド増やしたって
実行転送レートは意外と上がらず
中もメモリもぎくしゃくスカスカ
分かっている人以外と少ない
702:・∀・)っ-○◎●
07/06/29 02:18:25 P/e28P4p
>>693
>>696
703:Socket774
07/06/29 02:29:03 jtWDn1r5
Larrabeeも登場は2010年になるかもという話まであるしなあ。
さすがにそこまで時間があればボードでもソケットでもリリース出来るかもね。
もっとも2010年なんて情報はあまり信じてないのだが。
ところでCSIとGeneseoってもしかして似てる?
HyperTransportとHTXみたいな関係を想像してしまった。
そこら辺の情報ってあるかな。
704:Socket774
07/06/29 23:55:26 wzwQW5bp
日立のスパコン「SR11000モデルJ2」、TOP500で国産スカラー型の首位に
URLリンク(japan.cnet.com)
Freescale、ARM9コアのマルチメディアプロセッサ「i.MX27」の量産を開始
URLリンク(journal.mycom.co.jp)
705:Socket774
07/06/30 00:11:55 T+PuKKyO
Intel kills off Colorado plant
URLリンク(www.theinquirer.net)
またTSMCですか
706:Socket774
07/06/30 00:12:19 8JWBIJwr
J2って…
プレスに何渡した
707:MACオタ>704 さん
07/06/30 00:12:44 SDr9HmSf
>>704
でもSR11000 Model JのプロセッサわIBMのPOWER5す。
URLリンク(www.hitachi.co.jp)
708:Socket774
07/06/30 00:25:00 T+PuKKyO
URLリンク(www.hitachi.co.jp)
> 「SR11000 モデルJ2」は、「SR11000モデルK2」(2006年9月発表)と同等性能のものです。
とあるので、J2はおそらくPOWER5+なのであろう
709:MACオタ>708 さん
07/06/30 00:31:21 SDr9HmSf
>>708
こちらの資料だと、ノード数が増えただけとのことす。
URLリンク(www.cc.u-tokyo.ac.jp)
710:Socket774
07/06/30 00:33:55 po3KxtGU
Jに戻して紛らわしス
711:Socket774
07/06/30 13:43:26 EttmY6yj
URLリンク(www.cc.u-tokyo.ac.jp)
> 2006年11月末にSR11000のCPUクロックを1.9GHzから2.3GHzへ変更しました。
とあるので、ノード数を増やす前にCPUは既に変更されていたと思われる
CPUだけが変更されているため、K2ではなくJ2と呼んでいるのではないか
712:Socket774
07/06/30 13:58:58 h3S9wXfP
チャウチャウ犬
713:Socket774
07/06/30 14:52:09 YEc0u5Eh
ちがうんだ
714:MACオタ>711 さん
07/06/30 15:03:46 SDr9HmSf
>>711
確かに2.3GHzだとPOWER5+す。日立もサービス良いすね(笑)。
715:Socket774
07/07/03 02:57:24 FvDQhDHt
Xscaleとかを45wとか65wで走らせたら凄そうな気がするな
パイプラインを段とかにしてOoO強化してキャシュも増やす
x86より2.3割くらいマシでもコストとソフト資産で逆転されるかorz
716:Socket774
07/07/03 02:58:20 FvDQhDHt
12段くらいね orz
717:Socket774
07/07/03 11:10:01 0cpbN6+d
半角使え
718:Socket774
07/07/03 23:28:38 TEZVJKR2
半角とは?
719:Socket774
07/07/03 23:41:03 vUmgKgwW
ふと、何故 半角/全角と呼ぶのか疑問に思ってググってみたが分からなかった。
何故「角」を使うのだろうか?
720:Socket774
07/07/04 00:43:25 INSpNaYB
>>718
Xscale等英字は1バイト文字を使え、って言いたいのでしょう。
>>719
かく 【角】(名・形動)
(1) 四角。方形。また、四角なさま。
で、縦横同じ大きさ(正方形)の活字が全角、その半分が半角、ってだけでしょう。
721:突く突く某氏
07/07/04 00:58:37 mmMYO9us
ここは子供電話相談室じゃネーゾ、ゆとり共メ。
URLリンク(e-words.jp)
URLリンク(www.mojifont.com)
URLリンク(ke-sci.kj.yamagata-u.ac.jp)
URLリンク(www.nakanihon.co.jp)
722:Socket774
07/07/04 01:03:23 VxaBCYsg
ヘ_ヘ
ミ ・ ・ ミ
( ° )~
723:Socket774
07/07/04 01:52:16 w3D5UVKE
voidさんはそんなこと言わない
724:Socket774
07/07/04 02:00:52 VxaBCYsg
ねこみみです。
725:Socket774
07/07/04 02:14:05 w3D5UVKE
ということにしたいのですね:)
726:Socket774
07/07/04 22:11:57 BpbNGvKb
NECエレ,1チップ・ケータイSoC「M2」を発表し,低電力化技術を披露
URLリンク(techon.nikkeibp.co.jp)
量子コンピュータに向け,JSTとNTTが超電導で原子を捕捉
URLリンク(techon.nikkeibp.co.jp)
727:Socket774
07/07/04 22:30:56 ifSmbIBU
>>715
シンクライアントは最近、それなりに伸びてきているけどね…まだまだまだまだ
728:突く突く某氏
07/07/05 00:29:47 pMb1rStG
>>726
このてのニュースは殆どがゴミ情報
見る目を養おう
729:Socket774
07/07/05 22:54:48 fTqFxBNa
>>728
どっちのニュースに対して言ってんだよ
730:Socket774
07/07/06 22:44:56 IaQVZoq2
マルチコア時代の牽引役は最新メモリーアクセス技術
URLリンク(www.ednjapan.com)
階層化がキモなのかな
731:Socket774
07/07/07 02:54:49 smtfJ37A
10年~数年遅れでスカラー・スパコンの後追いしてる感が拭えなくて
さすれば、将来は見えてしまうわな
732:Socket774
07/07/07 03:02:15 smtfJ37A
動作周波数を上げることだけで処理性能を高めることができなくなった
プロセッサの動作周波数を上げると、それに比例して消費電流が増加する
半導体製造プロセスの微細化が進み、1つのチップ上に膨大な数のトランジスタを集積できるようになった
複数のプロセッサコアを1つのチップに組み込むことを可能にした
(というか他に手が無くなった)
クロック周波数を抑えて消費電力を削減しつつ、プロセッコアサの数を増やすことでパフォーマンスを向上させる手法がトレンドとなった。
これが、マルチコアプロセッサが主流となった理由
(アイデアが無くなった)
マルチコアプロセッサにおけるキャッシュメモリーの在り方だ
●階層メモリー構造
_, ._
( ゚ Д゚) 脳味噌あるのかよ
733:Socket774
07/07/07 03:26:02 kcr+Ivz2
>(というか他に手が無くなった)
>(アイデアが無くなった)
ha!
734:Socket774
07/07/07 03:29:37 +pZxdLl2
「遠くは高い」は物理法則から導かれる原則だからなぁ。同じような道を進まざるをえないんジャマイカ。
まあ、将来は見えているよな…
735:Socket774
07/07/07 03:31:21 fBsaN366
ha!じゃネーよ
ノータリンのハゲが
736:Socket774
07/07/07 06:07:05 L8pRsDVw
マリリンモンロ~、の~たり~ん、の~たり~ん、の~たり~んw
737:Socket774
07/07/07 11:19:38 hHa7etKl
ごめん、何が面白いのかわからない
ノータリンなんて死語だろ、とかそういう話?
738:Socket774
07/07/07 11:31:39 EvzDQeYt
70年代、80年代、90年代
さんざんやって来てるのに、また悪あがきをするという・・・・
739:Socket774
07/07/07 12:01:09 RjhlHM/y
野坂昭如かよ
おまえいくつやねん
740:Socket774
07/07/07 12:21:13 hHa7etKl
おじいちゃんきちゃった?
741:Socket774
07/07/07 16:42:55 3MyPhUh0
>>731
将来はどうなるんですか?
742:736
07/07/07 17:43:18 L8pRsDVw
>>739正解!
元歌は「マリリンモンローノーリターン」
743:Socket774
07/07/07 17:52:20 zu0C91eL
なんだおじいちゃんじゃないのか
744:Socket774
07/07/07 17:58:20 sM482XGF
かみさんいるの~?
僕いないの~!ところでかみさんよくイクんだって?ちょんちょん!
745:Socket774
07/07/07 20:08:32 sM482XGF
ところであんた写真好き?ちょろちょろぱっぱのさ!ニタニタじんじんで!
や~ったらしいんだから!すけべえが!
そんなの見て「お~!」なんでしょ?「お~!」なんだろ!この~!
・・・古すぎてわからんか・・・・
746:Socket774
07/07/07 20:54:26 lkngFqdw
いらないからそういうの
747:Socket774
07/07/09 20:35:44 ClkFYyC1
たるさんvs牧野
URLリンク(www.ne.jp)
もっとやれやれ~。たるさん頑張れ~。
ピーク馬鹿の牧野に鉄槌を。
748:Socket774
07/07/09 21:56:02 YD9eKBYN
>>747
> ピーク性能に対する実効性能が高いことは良いことであるという考えは誤解。
ややこしい言い回しだが、ユーザー/ベンダー双方が幸せなのは、実効
性能に対してコストが安い事で、更に電力比、設置面積比ってのも派生
事項でつな。そういう観点で話を詰めないと。
少なくても、実効「効率」なんてのはなんの意味も無い。
749:Socket774
07/07/09 22:22:04 jikMY4bN
命題:「ピーク性能に対する実効性能が高いことは良いことであるという考えは誤解。」
回りくどいこの命題の対偶は…
何となく気持ちは分かる気もするが(例えば、どんなに効率が悪くたって
ピークで世界一ならば、それは一つの世界一だ、等々)、
どんなに論理的でも前提が間違っていると非合理的な結論に必ず陥るものなんだよな…
いわゆる、末期症状。
750:Socket774
07/07/09 22:27:25 jikMY4bN
そんな>>748に、つ BG
751:Socket774
07/07/09 22:30:19 jikMY4bN
ピークを高めれば効率が悪くても実効性性能は高いはずだ。
今は、ひたすらこの路線だもんね、ケケケ
752:Socket774
07/07/09 22:36:09 bAQ7be57
流体屋の戯言に付き合ってたら国が滅ぶということだ
753:Socket774
07/07/09 22:38:24 YD9eKBYN
え?仮にピーク100TFで実行性能30TFと、ピーク500TFで実効30TFの
マシンが有り、前者は後者の3倍の値段で電気も3倍喰うよといったら、
前者を買うわけ?紙幣印刷機でも持っているとか?
754:Socket774
07/07/09 22:42:00 YD9eKBYN
>>753は金余りのjikMY4bN宛て
最近は、電気代ケチるために、使わないノードは電気落としてる
計算センターも多いのにな。
755:Socket774
07/07/09 22:47:19 hHNImExf
>>753
普通は実効性能に金を出しているわけだが
奇形マシンに出す金をしぶるのは普通の感覚
756:Socket774
07/07/09 22:47:26 jikMY4bN
>>754
税金だから。
757:Socket774
07/07/09 22:49:02 YD9eKBYN
>>756
高い装置買いましょうってか?
758:Socket774
07/07/09 22:51:08 jikMY4bN
冗談さておき、代弁する訳じゃないが
効率半減しても、ピーク3倍だから。
とうか、そういう論理展開だろ。
値段下げるためにコモデティー部品使って
OSLで固めてエンジニアは派遣をこき使い…という具合に。
そしてクソみたいなマシンがはびこると。
759:Socket774
07/07/09 22:53:18 YD9eKBYN
>>758
クソかどうかはユーザーが決めることだろ。
760:Socket774
07/07/09 22:54:00 jikMY4bN
>>759
使う前に気づくべきだよ。
761:Socket774
07/07/09 22:54:53 bAQ7be57
それって本当にコンピューターアーキテクチャが(の)問題なの? (w
762:Socket774
07/07/09 22:56:40 jikMY4bN
アーキテクチャに金払う訳じゃない
763:Socket774
07/07/09 22:58:49 YD9eKBYN
>>762
そう、性能にだね。
764:Socket774
07/07/09 23:00:06 jikMY4bN
>>763
半分はね。でもまともに動かないコンピューターの性能は
無と一緒ですから。
765:Socket774
07/07/09 23:03:01 bAQ7be57
>>764
>>761
766:Socket774
07/07/09 23:03:54 YD9eKBYN
>>765
ですね。
767:Socket774
07/07/09 23:04:58 jikMY4bN
>>765
アーキテクチャ、アーキテクチャ騒いでいて
いつまでもまともなコンピューター作れないって意味では
アーキテクチャの問題だろうな。
768:Socket774
07/07/09 23:06:33 hHNImExf
日本人メジャーと騒いでいても
4割打者がでてこないのと同じです
769:Socket774
07/07/09 23:08:53 jikMY4bN
いや、アーキテクチャは過程または手段的な位置付けか。
まともな事業運営が出来ない -> 変なアーキテクチャを作る -> 売れない -> 金がない -> endlessloop
770:Socket774
07/07/09 23:11:29 4VCZMt7s
>ID:jikMY4bN
そろそろオナニー終わらせろ
771:Socket774
07/07/09 23:13:51 jikMY4bN
何おこってんの?吟線に触れたか。
772:Socket774
07/07/09 23:19:35 YD9eKBYN
なんか、効率の話からずいぶん変わってるけど。
773:Socket774
07/07/10 00:04:44 hHNImExf
オナニーとか琴線とか気持ちよさそうな言葉を並べないでくれたまえ
774:Socket774
07/07/10 00:46:42 veXXli2R
7/9追記とか書いてあるよ……素人ごときにマジになんなよ。
たるさんだってせいぜい「ちょっと詳しい素人」なんだし。
775:Socket774
07/07/10 01:17:09 ZkhhtCK+
>>758
MPPの安価な構築は、Dellが承ります。
ギャーorz
776:Socket774
07/07/10 01:25:47 j5drJ8Rc
牧野必死だな。嫌な性格○出し・・・
東大はプライドだけは超一流だなw
777:Socket774
07/07/10 01:30:40 hEaEjTI5
これはいいマッチポンプですね
778:Socket774
07/07/10 01:36:41 96AK9Fpf
>>776
ベートーベンは偏屈な性格丸出しと言っても世間の評価は変わりませんよ
779:Socket774
07/07/10 01:39:59 j5drJ8Rc
牧野の評価>>769
780:Socket774
07/07/10 01:41:03 FDIR9FVj
はっきり言ってはかわいそうだけど
天文台だから
781:Socket774
07/07/10 01:45:54 FDIR9FVj
>>778
ベートーベンに失礼だぞ
782:Socket774
07/07/10 01:47:07 FDIR9FVj
でもまあ笑いを提供してくれる