CPUアーキテクチャについて語れ Part.13

CPUアーキテクチャについて語れ Part.13at JISAKU

CPUアーキテクチャについて語れ Part.13 - 暇つぶし2ch484:MACオタ
08/11/18 17:09:27 +48X3kSh
正式発表に合わせてCore i7のSPEC2006が公開されたす。
代表的なハイエンドプロセッサの成績と比較しておくす。OS等わバラバラなので参考程度に
しておいて欲しいす。
■SPECint2006
　Nehalem/3.2GHz: 30.2 (base) / 33.6 (peak)
　URLﾘﾝｸ(www.spec.org)
　Penryn/3.2GHz: 27.0 / 29.7
　URLﾘﾝｸ(www.spec.org)
　POWER6/4.7GHz: 17.8 / 21.7
　URLﾘﾝｸ(www.spec.org)
　Montecito/1.66GHz: 15.7 / 17.0
　URLﾘﾝｸ(www.spec.org)
　Barcelona/2.5GHz: 14.4 / 16.2
　URLﾘﾝｸ(www.spec.org)
　POWER5+/2.2GHz: 10.5 / 13.2
　URLﾘﾝｸ(www.spec.org)
　SPARC64 VII/2.5GHz: 11.5 / 12.6
　URLﾘﾝｸ(www.spec.org)
　Pentium4/3.8GHz: 11.6 / 12.3
　URLﾘﾝｸ(www.spec.org)

485:MACオタ＠続き
08/11/18 17:23:48 +48X3kSh
■SPECfp2006
　Nehalem/3.2GHz: 31.7 (base) / 33.6 (peak)
　URLﾘﾝｸ(www.spec.org)
　SPARC64 VII/2.5GHz: 25.0 / 28.8
　URLﾘﾝｸ(www.spec.org)
　Penryn/3.2GHz: 24.5 / 25.3
　URLﾘﾝｸ(www.spec.org)
　POWER6/5.0GHz: 20.1 / 24.9
　URLﾘﾝｸ(www.spec.org)
　Montecito/1.66GHz: 19.9 / 20.4
　URLﾘﾝｸ(www.spec.org)
　Barcelona/2.5GHz: 18.5 / 19.7
　URLﾘﾝｸ(www.spec.org)
　POWER5+/2.2GHz: 12.9 / 14.9
　URLﾘﾝｸ(www.spec.org)
　Pentium4/3.8GHz: 11.9 / 12.1
　URLﾘﾝｸ(www.spec.org)
　

486:MACオタ＠続き
08/11/18 17:57:01 +48X3kSh
■SPECint_rate2006 (8-threads)
　Dual Penryn/3.2GHz: 145 (base) / 156 (peak)
　URLﾘﾝｸ(www.spec.org)
　Dual Shanghai/2.7GHz: 113 / 136
　URLﾘﾝｸ(www.spec.org)
　Single Nehalem/3.2GHz: 117 / 124
　URLﾘﾝｸ(www.spec.org)
　Dual POWER6/4.7GHz: 108 / 122
　URLﾘﾝｸ(www.spec.org)
　Quad Windsor/3.2GHz: 102 / 119
　URLﾘﾝｸ(www.spec.org)
　Dual Barcelona/2.5GHz: 92.7 / 108
　URLﾘﾝｸ(www.spec.org)
　Quad Montecito/1.6Ghz: 94.7 / 102
　URLﾘﾝｸ(www.spec.org)
　Dual POWER5+/2.1GHz: 47.9 / 53.3
　URLﾘﾝｸ(www.spec.org)
　Single SPARC64 VII/2.52GHz: 36.9 / 40.8
　URLﾘﾝｸ(www.spec.org)
　

487:MACオタ＠続き
08/11/18 18:11:56 +48X3kSh
■SPECfp_rate2006 (8-threads)
　Dual Shanghai/2.7GHz: 105 (base) / 118 (peak)
　URLﾘﾝｸ(www.spec.org)
　Dual POWER6/4.7GHz: 102 / 115
　URLﾘﾝｸ(www.spec.orgcpu2006)
　Quad Windsor/3.2Ghz: 95.3 / 103
　URLﾘﾝｸ(www.spec.org)
　Dual Penryn/3.4GHz: 87.2 / 95.6
　URLﾘﾝｸ(www.spec.org)
　Dual Barcelona/2.5GHz: 86.3 / 94.7
　URLﾘﾝｸ(www.spec.org)
　Quad Montecito/1.6GHz: 87.4 / 90.8
　URLﾘﾝｸ(www.spec.org)
　Single Nehalem/3.2GHz: 82.9 / 86.1
　URLﾘﾝｸ(www.spec.org)
　Dual POWER5+/2.1GHz: 57.2 / 62.5
　URLﾘﾝｸ(www.spec.org)
　Single SPARC64 VII/2.52GHz: 33.6 / 35.2
　URLﾘﾝｸ(www.spec.org)

488:MACオタ＠ここまで
08/11/18 18:15:09 +48X3kSh
>>484-485のシングルタスクのSPECint/SPECfpにshanghaiの登録が無いのわ残念
すけど、Nehalemのスゴさわ揺るがないす。

なお、int, fp共にrateの成績に関してわSMTをサポートしているプロセッサわ若干不利である
ことを割り引いて見て欲しいす。Nehalem, POWER6, POWER5+, SPARC64 VIIが該当するす。

489:レトリック君
08/11/18 21:00:17 gh72A97A
ふ～ん。たかがﾍﾞﾝﾁ、されどﾍﾞﾝﾁ、なんだか時代の切り替わりを感じるな…
こーれでcore当たりのLinpackも速かったら、top５００はCPUの総数と網だけが勝負のでｋ(ry

490:MACオタ＞レトリックさん
08/11/18 21:53:45 WfyMrGQ0
>>489
　　-----------------
　　たかがﾍﾞﾝﾁ、されどﾍﾞﾝﾁ、
　　-----------------
『たかが』すか？一般にプロセッサアーキテクチャの研究でわ、典型的命令ミックスとして
SPEC CPUを使う筈すけど。。。

491:Socket774
08/11/18 22:06:07 dYKQiGgk
>>490
それは「されど」のほうだな

492:Socket774
08/11/19 01:05:07 5j5hQRMW
>>490
「たかが」のほうでは、
研究者はみんな「こんなのあてにならんよな」と思いながら、他に代わるものもないのでしぶしぶ使っている

493:MACオタ＞492 さん
08/11/19 01:13:53 3Hv7OFZy
>>492
　　------------------
　　研究者はみんな「こんなのあてにならんよな」と思いながら、
　　------------------
早速、知ったかさんが現れた様す(笑)
URLﾘﾝｸ(www.spec.org)
　　==================
　　The benchmark programs are developed from actual end-user applications, as opposed to being
　　synthetic benchmarks.
　　==================
反面、CELL/B.E.やGPGPUのようなプログラミング手法そのものの変革が必要なシステムわ
テストできないということになるす。

494:Socket774
08/11/19 01:26:36 5j5hQRMW
>>493
はあ、それは理想ではあるけどな…
部外者は気楽なこって

495:レトリック君
08/11/19 01:33:38 YSszBjB7
変革だとさｗ
CELL/B.E.やGPGPUでintのgccとか計ってみなってｗ
万が一うごいたら…の話だが。

496:Socket774
08/11/19 01:35:11 s26reCql
>>495
多分すげー遅いだろうな、0.1とかw

497:Socket774
08/11/19 07:25:04 of4tviNn
>>>493って自己紹介上手いな

498:MACオタ
08/11/19 18:52:04 5QkxaR/H
>>482で紹介した今年下半期のTop500すけど、今回からシステムの消費電力も一部公表されて
いるす。そこで、アーキテクチャごとの電力効率をまとめてみたす。
なお、クラスタシステムわインタコネクトの違いで電力効率が大きく変わるので、ケチってギガイ
ーサを使っているシステムわ除いたす。明らかにおかしいと思われるデータも除いたす。

■スーパーコンピュータの電力効率
　　プロセッサ / 電力効率 [MFlops/W]
　　IBM PowerXCell 8i / 498.4 (最高536.2, 最低444.9)
　　IBM Blue Gene/P (PPC450) / 367.8 (最高371.7, 最低357.1)
　　IBM Blue Gene/L (PPC440) / 206.6 (最高208.3, 最低203.8)
　　Intel QC Harpertown / 203.5 (最高265.8, 最低 124.9)
　　Intel QC Clovertown / 170.8 (最高207.0, 最低 130.5)
　　AMD QC K8L / 154.9 (最高 231.6, 最低 113.8)
　　IBM POWER6 / 87.4 (最高95.6, 最低 69.9)
　　Intel DC Woodcrest / 84.5 (最高 102.9, 最低 57.4)
　　AMD DC K8 / 43.9 (最高 81.5, 最低 27.1)
　　Intel DC Itanium2 / 57.1
　　IBM POWER5+ / 40.0
　　IBM POWER5 / 39.0
　　NEC 地球シミュレータ (SX-6) / 11.2

マルチコア化とプロセスの縮小が、電力効率向上の大きな要因になっていることが判るす。
Intelの45nmプロセス世代の汎用プロセッサがBlue Gene/L (130-nmプロセスのPPC440コア
SoC)に電力効率で追いついているのわ、たいしたモノだと思うす。
POWER6わ巨大コアのデュアルコアチップとしてわ意外に頑張っているのと、POWER5の電力
効率の悪さがちと目立つす。

499:MACオタ
08/11/19 20:07:20 5QkxaR/H
>>484-487のBloomfieldのSPEC CPU2006すけど、AcesHardware掲示板の投稿によると
シングルプロセスの結果も"rate"も両方ともにターボモードの恩恵を受けているとの話す。
URLﾘﾝｸ(aceshardware.freeforums.org)
　　--------------------------
　　The all architecture help on SPEC, it is not that simple to find a reason for the boost.
　　Memory help, The cores are improved. With regular cooling, in 99% of the case, turbo
　　will kick in, you rarely get to the max power ...
　　when you run spec , you ll get your 2 bin turbo boost, then you run SPEC_FP_RATE, you'll
　　get 1 bin turbo boost. I just checked with my Buddy Rahul, the Spec Gurus.
　　--------------------------

500:Socket774
08/11/19 20:54:26 Qm2CbA2d
どこに行っても馬鹿にされてるんだね

501:MACオタ
08/11/19 21:37:29 5QkxaR/H
IBMがバイナリトランスレーションの専門企業Transitiveを買収したす。
URLﾘﾝｸ(www.theregister.co.uk)
記事にもあるようにTransitiveのQuickTransit技術わ、AppleのRosetta、IBMのPowerVM Lx86,
HPのSolaris実行環境等に採用されているす。
古くわ、こういうニュースもあったすね。。。
URLﾘﾝｸ(www.watch.impress.co.jp)

前述のようにIBMわPOWERサーバーにおけるx86版Linuxアプリの実行環境としてPowerVM Lx86
を提供しているすけど、経営危機のSunの顧客を狙ってSolarisでも同様の戦略を取ると思われる
す。加えてTransitive社自体を手に入れることにより、他のプラットフォームへのSunの顧客の
流出を邪魔することを狙っているのかもしれないす。

502:Socket774
08/11/19 21:49:48 htNw1R0N
普通の日本語書けばいいのに。

503:MACオタ
08/11/19 22:16:28 5QkxaR/H
Top500ランキングに関してわ、JAXAのSPARC64 VIIシステムで222位にランクされた富士通が、
微妙なリリースを出しているす。
URLﾘﾝｸ(pr.fujitsu.com)
　　------------------------
　　当社のハイエンドテクニカルコンピューティングサーバ「FX1」を中核としたこのシステムは、
　　世界トップレベルとなる89％以上の実行効率(注1)を実現し、このたびのTOP500リストに
　　掲載されている日本のシステムでは最も高い実行効率となります。
　　------------------------
理論ピーク性能とLinpackの結果の比である実行効率に関してわ、従来からItaniumベースのSGI
のシステムが優れており、今回のランキングでもJAXAのクラスタより大規模なシステムで90%以上
を達成しているモノもあるす。
　44位　URLﾘﾝｸ(www.top500.org)

504:Socket774
08/11/19 22:28:19 C+Mzyu9E
ふーん

505:MACオタ
08/11/19 22:36:15 5QkxaR/H
CrayがXeon搭載のデスクサイド・スーパーコンピュータ CX1を発表したす。
URLﾘﾝｸ(www.cray.com)
中身わ、ただのブレードサーバー筐体なんすけど、Xeonと共にNvidiaのTesla C1060を搭載
したGPGPUノードなんてのも詰め込めるところが新しい目す。
URLﾘﾝｸ(investors.cray.com)
LinuxベースのクラスタOSとしてわ、割と有名なRocksとセットでも売る模様す。
URLﾘﾝｸ(investors.cray.com)

今のところ搭載CPUわHarpertown Xeonすけど、Nehalem-EPが発表されれば搭載すると
思われるす。

506:レトリック君
08/11/19 22:41:47 TFsmRcG1
top500等、だれもがアクセスできるところにある公知情報を延々コピペは控えめがよろしいかと

507:MACオタ＞レトリックさん
08/11/19 22:48:41 5QkxaR/H
>>506
私の投稿で引用で囲った文章だけがコピペす。
どれをコピペと思い込んでるすかね(笑)

508:レトリック君
08/11/19 22:54:05 TFsmRcG1
言うと思ったｗ
ﾘﾝｸ張るにしても宣伝臭い情報などは見抜いてもう少し有用なﾈﾀか吟味して精選したら？

509:Socket774
08/11/19 23:01:22 C+Mzyu9E
クスクスクス

510:Socket774
08/11/19 23:03:42 Qm2CbA2d
コピペのみに徹していれば
馬鹿にされることも無いだろうに

511:Socket774
08/11/20 19:39:33 rRN0eQB1
反応してるやつはみんなオタの仲間

512:Socket774
08/11/20 21:14:47 5o0+HOhA
MACヲタに嫉妬するのはみっともないですよｗ
自分の無能さに気づきなさいｗ

513:Socket774
08/11/20 22:24:45 uGazwTHV
はーい

514:Socket774
08/11/21 22:46:01 O2oDhAtj
ちょっと面白い記事だが、ブロック毎に休止させる手段との整合性が気になった。

単一電力で動作するレベル・シフター、システム構成の簡素化に役立つ（2008/11/21公開）
URLﾘﾝｸ(eetimes.jp)

515:MACオタ
08/11/21 23:07:37 KjSGo7TB
SGIがx86版Blue Geneとも言うべき製品"Molecule machine"をSC08でデモしたらしいす。
URLﾘﾝｸ(www.theregister.co.uk)
　- Dual-core Atom N330/1.6GHz
　- プロセッサ、2GBメモリ(4 x 512KB DDR2 DIMM)、インタコネクトチップをボード上に配置
　- "Kelvin"と呼ぶセラミックカートリッジに上記のボードを2枚収納
　- Kelvinを電源、ネットワーク、冷却機構を内蔵したバックプレートに接続
　- 90個のKelvinを3Uラックに収納。 2 x 2 x 90 = 360 cores in 3U-rack
こういう言い回しをしているところを見ると、ノード間ネットワークの設計わ、まだ固まっていない模様す。
　----------------------
　The important thing to realize, explained Brown, is that if the interconnect was architected
　correctly, the entire memory inside the chassis could be searched in one second.
　----------------------

516:MACオタ＠補足
08/11/21 23:17:39 KjSGo7TB
上の話、写真つきの日本語の記事が出ていたす。
URLﾘﾝｸ(techon.nikkeibp.co.jp)
写真を見ると、上でリンクしたThe Registerの記事わ若干誤解が含まれている様す。
　　-------------------
　　ブロックは，寸法が5cm角ほどの基板2枚を空冷用の孔をはさんで張り合わせ，樹脂で
　　固めたものから成る。各基板にはマイクロプロセサとデータの経路制御用LSI，および
　　メモリ用チップを基板の裏表で計8個搭載している。マイクロプロセサには，デュアルコア
　　のAtomを用いる。このAtom は，1.3GHz動作で「x86-64」の命令セットが動作する。メモリ
　　の容量は1基板で2Gバイトである。
　　-------------------

517:MACオタ
08/11/21 23:38:59 KjSGo7TB
Top500に続いて、電力効率のコンテストGreen500とHPC Challengeの結果も発表されたす。
Green500: URLﾘﾝｸ(www.green500.org)
HPC Challenge: URLﾘﾝｸ(www.gcn.com)
なぜかHPC Challengeわ、公式サイトURLﾘﾝｸ(www.hpcchallenge.org)が未だにアップデートされて
いないす。上記の記事によると、結果わ以下の通り。
　■ G-RandamAccess
　　1. Blue Gene/P (ANL): 103 GUPS
　　2. Blue Gene/L (LLNL): 35 GUPS
　　3. RedStorm, Cray XT3 (SNL): 34 GUPS
　■ G-FFT
　　1. Blue Gene/P (ANL): 5,080 GFlops
　　2. RedStorm, Cray XT3 (SNL): 2,870 GFlops
　　3. Jaguar, Cray XT5 (ORNL): 2,773 GFlops
　■ G-HPL
　　1. Jaguar, Cray XT5 (ORNL): 902 TFlops
　　2. Blue Gene/L (LLNL): 259 TFlops
　　3. Blue Gene/P (ANL): 191 TFlops
■ EP-STREAM-Triad
　1. Jaguar, Cray XT5(ORNL): 330 TB/s
　2. Blue Gene/L (LLNL): 160 TB/s
　3. Blue Gene/P (ANL): 140 TB/s

518:Socket774
08/11/22 00:00:20 JG6FapJf
>>514
容量素子のサイズがでかくなってあまりメリットないような・・・

519:Socket774
08/11/22 01:23:41 Z/ATNrSE
MIMならともかくMOSキャパなら大した事無いだろ

520:MACオタ
08/11/22 01:47:37 TaEFwxau
Green500が発表されたので、>>498をアップデートす。
今回わ、Green500ルールで測定が行われているデータの上位3つの平均を求めてみたす。
なお、前回IBM p575 (POWER5+)のシステムで効率が異常に良いデータを除いたすけど、
Green500の審査に通っているので、今回は計算に入れたす。
■プロセッサごとのスーパーコンピュータの電力効率比較 [MFlops/W]
　1. IBM PowerXCell 8i (65nm): 532.3
　2. IBM Blue Gene/P, QC PPC450 (90nm): 371.7
　3. Intel Harpertown, QC Core2 (45nm): 241.7
　4. IBM Blue Gene/L, DC PPC440 (130nm): 208.3
　5. Intel Clovertown, QC Core2 (65nm): 188.7
　6. AMD Barcelona, QC K8L (65nm): 146.9
　7. Intel Woodcrest, DC Core2 (65nm): 109.1
　8. IBM DC POWER6 (65nm): 95.6
　9. IBM DC PPC970MP (90nm): 91.7
　10. IBM DC POWER5+ (90nm): 71.0
　11. Intel DC Itanium2 (65nm): 69.3
　12. AMD DC Opteron, DC K8 (90nm): 46.9
　13. IBM DC POWER5 (130nm): 36.3

集計法が異なるので、若干>>498と順位も変動しているす。

521:MACオタ
08/11/22 02:43:57 TaEFwxau
>>479で書いたChartered Semi.の身売り話すけど、Digitimesより続報す。
台湾訪問中のChartered CEO, Song-Hwee Chiaわ、合併交渉を否定したとのことす。
URLﾘﾝｸ(www.digitimes.com)
　　-----------------------
　　In response to rumors about Chartered seeking mergers with Taiwan's foundries,
　　Chia said it is too "risky" to talk about such issues at present. He declined to make
　　further comments concerning possible mergers.
　　-----------------------

522:Socket774
08/11/22 14:58:54 r3oHDlr8
MACオタって何してる人？
相当知識はありそうなんだから別にこんなとこに居なくともよさそうだが。

523:Socket774
08/11/22 17:11:29 rrG5Wzuy
見ての通りだろ

524:Socket774
08/11/22 19:00:25 mOknA/hF
四六時中ネット徘徊してる人？

525:Socket774
08/11/23 00:52:49 5WyXRhsf
ちょっと煽るとすぐ火がつくMACオタ（）笑

526:Socket774
08/11/23 02:41:13 meLltuXC
こんなとこ、に集まる人々

527:ﾚﾄﾘｯｸ君
08/11/23 03:17:16 z0fjO5wh
i7は単体core当たりの対C2D比実効性能をなぜ上げられることができたんだろうか
例のMNIのｺﾋﾟﾍﾈﾀを除くとw、C2Dはかなり完成度が高くて
これ以上単体実効性能を上げるのは相当難しそうな気がしていたんだが
あいつらすげえ執念だな。

あるいは、今後更に単体実効性能を上げる余地があるとすればそれはどのようにしてなのだろう。

もはや単体性能にこだわる時代でも無いのかもしれないし、
単純なﾍﾞﾝﾁでの性能比較の無意味さは食傷ぎみだが。

こういう話の方がtop500よりも面白いと思うのは個人的な趣味なのかな

528:ﾚﾄﾘｯｸ君
08/11/23 03:21:14 z0fjO5wh
つか、まぁGFLOPSだの性能云々そのものが指標として陳腐化してきて
世の中流や産業ともはや連動していないんだよな…orz

529:MACオタ＞レトリックさん
08/11/23 03:54:01 JlOdK57G
>>527
　　------------------
　　i7は単体core当たりの対C2D比実効性能をなぜ上げられることができたんだろうか
　　------------------
これだけNahelemアーキテクチャ解説の情報が溢れているというのに。。。言うに事欠いてそれすか(笑)

530:Socket774
08/11/23 04:23:38 /OqeOGVN
top500なんて昔から、国の、プロセッサ屋の、システムベンダの、宣伝用だからね

531:Socket774
08/11/23 13:51:49 BLpVXshs
>>527
基本的に「メモリ直結」と「キャッシュ増量」のお陰だろ。

あとは「ＨＴ」や「コア数ウプ」も有るが、いずれにしても大きな改良点に
珍しい手法は見当たらない。

532:Socket774
08/11/23 14:14:35 BLpVXshs
>>531
あと「メモリチャネル数が３つ」になったのも大きい。

533:,,・´∀｀・,,）っ-●◎○
08/11/23 14:31:06 lCVu0jgM
キャッシュの総容量は実は12MBから8MBに減ってるけどな

Intelの技術者が言うにはL2を小容量低レイテンシにしたことが効いてるらしいけど
512KBだと性能が落ちたとか。

534:Socket774
08/11/23 14:53:04 2UI6soHP
馬鹿来た

535:ﾚﾄﾘｯｸ君
08/11/23 16:15:15 G1s1Uj4U
レイテンシ幾つから幾つに変わったの？教えて君ﾓｰﾄ、横着ﾞｗ
中身の変化は寄与無いの？
で、そういった改良を総括するとあの実効性能の差は合理的に説明つくのだろうか、、、

536:Socket774
08/11/23 16:22:21 mf3CnZk0
> Intelの技術者が言うにはL2を小容量低レイテンシにしたことが効いてる
intelって前からそれ好きだよな…
AMDやCentaurがL1を128KBにする中で、レイテンシを優先してPentiumPro以来ずっと容量は32KB程度のままだったり
あと、L2も、Pentium4とAthlonXPで同じ256KBだった時代でも幅が256bit対64bitだったり…

537:Socket774
08/11/23 18:08:21 ElPwAhu/
MACオタのアク禁まだ～？

538:Socket774
08/11/23 18:28:47 YkTGliDB
CoppermineのL2はレイテンシ0とか無茶な数字が書いてあった気がする

539:,,・´∀｀・,,）っ-●◎○
08/11/23 23:00:00 lCVu0jgM
もともとFSB経由だったのが内部バス化されたからそういう意味でのレイテンシ0だろ
L2そのもののレイテンシが無いわけではない

540:MACオタ
08/11/24 17:04:08 Q1VJWnjX
TheINQのCharlie "Groo" Demerjianによると、Microsoftが自社ブランドの携帯電話
を開発するとの事す。プロセッサわ何とNvidia Tegra (ARMコアSoC)とのことす。
URLﾘﾝｸ(www.theinquirer.net)
Tegra製品についてわ、こちら。
URLﾘﾝｸ(www.nvidia.co.jp)
iPhone, Gphoneに続き、MSまでARM系採用を決めたことで、Intelの組込分野への
野望わ、展望が苦しくなってきたす。

541:,,・´∀｀・,,）っ-●◎○
08/11/24 17:11:27 9qM3upWO
ARMのSIMD拡張としては本家の64bit/128bit拡張よりメジャーな
WirelessMMXを普及させた張本人じゃないかIntelは

542:MACオタ＞団子さん
08/11/24 17:16:52 Q1VJWnjX
>>541
事業としてのXScaleわMarvellに売却されてしまったす。
URLﾘﾝｸ(www.intel.co.jp)

543:,,・´∀｀・,,）っ-●◎○
08/11/24 17:31:39 9qM3upWO
そうだよ。黒字出してたのにAtomを普及させるためにわざと、ね。

ARMは各ベンダーのDSPコントローラのコントロールコアとしては広く普及したけど
独自のSIMD拡張命令を普及させることに関してはうまくいかなかった。
それこそDSPベンダーの思惑があって。
WirelessMMXがMSやGNUのコンパイラで本家のSIMD拡張であるNEONをさしおいて
サポートされてる。これが現実。

で、WMMXをそこまで成功させたIntelが今度はx86命令セットそのものをサポートする
モバイルチップを投入する。
各ベンダーはともかく、開発者は画一的なアーキテクチャを望むわけよ。
アクセラレータ部分の命令セットも共通化したいわけだ。

MSが自社ブランド携帯電話でARM採用したからってどうなるもんでもないよ。
どうせハード作るのは東芝かサムスンあたりだろ。
Intelは保険としてモバイル向けLinuxの開発やってるが
あれこそMSとの交渉材料だと思ってるが。

大体に、Intelはもともと携帯電話そのものをいきなり狙う方針ではなかった。
ぶっちゃけシャープとWillcomのあれは先走りすぎた。
もともとAtomは現行世代で携帯電話で勝負する気はない。
消費電力がまだ大きすぎる。
x86コード資産を生かして製品は携帯電話とモバイルPCの中間のレンジから浸透を図る予定だったはず。

ARMに共通のソフト資産なんてあってないようなもんだからx86市場が脅かされることも無いわけだ。
（コントロールコア部分が共通化できるくらいでアクセラレータ向けのコードには互換性がない）

＞野望わ、展望が苦しくなってきたす。

こんな間抜けな個人見解は書かなきゃ良かったな。
君はコピペだけやってればいいよ
自分の頭で考えることだけはやめたほうがいい。

544:Socket774
08/11/24 17:38:45 FhG9cFU8
目糞と鼻糞の競演

545:MACオタ＞団子さん
08/11/24 17:42:00 Q1VJWnjX
>>543
火病っているところ申し訳無いすけど、MSがNvidiaと組むということわ、
　　-------------------
　　WirelessMMXがMSやGNUのコンパイラで本家のSIMD拡張であるNEONをさしおいて
　　サポートされて
　　-------------------
この部分にNvidiaのGPU/GPGPUを採用するということす。
「ARM」という部分だけに目が行って、本題を見過ごしているとわ思わないすか？

546:MACオタ
08/11/24 19:22:13 Q1VJWnjX
>>501
ITJungleのMorgan記者のIBMによるTransitive買収の分析記事す。
特に新味わ無いすけど、歴史的な経緯やIBMの戦略予想が良くまとめられているので貼っておくす。
URLﾘﾝｸ(www.itjungle.com)

547:,,・´∀｀・,,）っ-●◎○
08/11/24 21:14:52 9qM3upWO
>>545
無理だね。Tegraに採用されるコアはシェーダモデルとしては相当古い。
CUDAがサポートされてるプラットフォームくらい調べたほうがいいよ。

GeForce8からだ。それ以前は切り捨て。
もちろんTegraでもCUDAはサポートされない。アーキが別物だもの。

頭悪いんだから喋るな。わかったな？

548:MACオタ＞団子さん
08/11/24 21:26:48 Q1VJWnjX
>>547
　　-------------------
　　CUDAがサポートされてるプラットフォームくらい調べたほうがいいよ。
　　-------------------
携帯電話で科学技術計算でもすると思い込んでいるすか(笑)

携帯機器におけるマルチメディア命令の用途わ、過去のPCと同様にCPUがGPU役をやっている状況す。
専用GPUにオフロードするだけで御の字かと。

549:MACオタ＠補足
08/11/24 21:32:55 Q1VJWnjX
Intelの主張するWireless MMXの用途わ、こちらす。
URLﾘﾝｸ(www.intel.com)
　　----------------
　　- Video compression
　　- 2D and 3D graphics
　　- Image processing
　　----------------
Nvidia Tegraの主要な機能わ、こちら。
URLﾘﾝｸ(www.nvidia.co.jp)
　　----------------
　　- 最高1080p HDの映像再生
　　- 分かりやすくスムーズな3Dユーザインターフェースのための超省電力GeForce GPU
　　- 100時間を超える音声、および10時間を超えるビデオ再生のための統合メディアプロセッサ
　　- 進化したDSCおよびHDビデオカメラ処理による画像処理
　　----------------

550:Socket774
08/11/24 21:33:34 lRSdK/cM
少なくとも"GP"GPUじゃァないなあ・・・それは。

551:Socket774
08/11/24 21:40:18 WtfN7KSR
画像処理にしたってOpenGL ESで実装するのは確実だしね。
NVIDIAのGPGPUを採用とは言えないわな。

552:MACオタ＞550 さん
08/11/24 21:40:19 Q1VJWnjX
>>550
　　--------------
　　少なくとも"GP"GPUじゃァないなあ・・・それは。
　　--------------
確かに>>545でGPGPUと書いたのわ、言い過ぎだったす。

553:,,・´∀｀・,,）っ-●◎○
08/11/24 21:50:40 9qM3upWO
DX11のCompute ShaderもOpenCLもSM4.0以降が前提になってます。
はっきり言ってTegraの優位性は怪しい。

仮想敵はIntelじゃなくてAMDだろうに。
ATiのほうが組み込み向けのGPUではノウハウあるからね

NVIDIAも必死だからな。
日本法人の営業さんからして必死だもん。（あんまり言うと怒られるけど）

Tegraのデモがアレだからな。Atomの"N"270＋945GS搭載のネットブックと比較して
こっちのほうが電力効率いいですよとか

組み込み向けに作ってるのはZシリーズのほうだっつーに。
あと、SoC製品は年が明けてからだしな。45nmプロセスで周辺モジュールを統合する
という点で、ある意味NehalemのX58チップセット(65nm)より先進的なプラットフォームといえる。
＃先進的なだけで絶対性能が高いわけではないというフォローもしておく。

iPhoneをパクってWindows MobileをOSとして載せてアプリケーションのプラットフォームとして
使おうって言うならやめといたほうがいいと思うよ。
1プロセス32MBの制限に家電屋は今日も泣かされるのであった（CE6ベースだと無いんだけど）

554:MACオタ＞団子さん
08/11/24 22:44:35 Q1VJWnjX
>>553
　　---------------
　　仮想敵はIntelじゃなくてAMDだろうに。
　　ATiのほうが組み込み向けのGPUではノウハウあるからね
　　---------------
もはや存在しないような。。。
URLﾘﾝｸ(www.amd.com)
　　================
　　先に発表された非中核事業の見直しの一環として、AMDはハンドヘルドおよびデジタルTV製品
　　事業の売却を決定しており、これらは会計報告では非継続事業※1として分類されています。
　　================

555:,,・´∀｀・,,）っ-●◎○
08/11/24 23:39:01 9qM3upWO
ARMは基本命令セットと基本マイクロアーキテクチャ部分はARM社に使用料を払うことで
各ベンダーで共有することができるが、拡張部分については各社の思惑で動いてて
統一の機運が見られない。
OSでいうならPOSIX以前のUNIX派生OS乱立見たいな感じだと思えばいい。

そんな中でXScaleがARMの中で優位を誇ってた時代もあったよ。
シャープのLinux Zaurusとか東芝あたりのPDAはみんなXScale使ってた。
あとはサムスン製のARM系CPUがちらほら。
ちなみにIntelはXScale製造権を手放したわけでもないしIntel謹製のネットワーク機器向けに
いまだに使われていたりもします。WMMXの商標権もいまだに保持してます。

当のNVIDIAはAtom用のIGPを作らせてくださいとか言ってる立場だったり。
URLﾘﾝｸ(www.digitimes.com)
ま、現状PowerVR使ってるくらいだし、ないこともないだろうな。
X58見る限りNVIDIAとの関係が悪いわけでもないようだし。

556:Socket774
08/11/25 00:43:59 kr3PDdwP
ついこないだTegraにCUDA持って来るってのは言ってたよ（第一世代にはない）

Nvidia to offer parallel tech for mobile devices
URLﾘﾝｸ(www.networkworld.com)

OpenCLも組み込み視野に入れてるし、事実上競合いないからどっちが採用されても大して変わらないとは思うけど

557:MACオタ＞556 さん
08/11/25 00:53:09 vLMI/UCK
>>556
>>540のTheINQの記事によるとMicrosoft Phoneわ来年2月に発表になるという話すから、
第一世代のチップが使用されていると思われるす。
　　-------------------
　　The phone is slated to be announced at 3GSM this coming February, so if you plan on
　　attending, please look surprised when MS unveils it.
　　-------------------
GAMA Mobile World Congress (旧名3GSM)わこちら。
URLﾘﾝｸ(www.mobileworldcongress.com)

558:Socket774
08/11/25 01:03:09 kr3PDdwP
>>557
あら、Tegra自体は2009Q2だって言ってるんだけどな・・・

Nvidia to Ship Tegra Chip by Mid-2009, CEO Says
URLﾘﾝｸ(www.pcworld.com)

559:,,・´∀｀・,,）っ-●◎○
08/11/25 10:27:44 P8ZTmbPf
>>556
それならAtomにAVXが載るのが先だと思うよ。
むしろ「LarrabeeはメインストリームCPUに統合される」って話を今するくらい無意味な話題。
どっちかというと動画再生を兼ねるプロセッサとしてはLarrabeeをカットダウンしたほうが良さそうなんだが。

どうせGeForce8400GSくらい相当のコアがMIDのTDPに収まるくらいに微細化が進んだ頃の話だろ。
Compute Capability 1.0以下を設ける気はなさそうだし。8000/900/200シリーズとそれ以前じゃ全然別物。

560:Socket774
08/11/25 10:44:13 clhYEM3T
馬鹿満載

561:Socket774
08/11/25 10:58:59 TKMd4Nc7
妄想はもう食傷気味＞＜
ソース付きのネタを持ってきてよ

562:Socket774
08/11/25 20:42:43 nM63fo55
ちょっと面白いな。汎用プロセッサとFPGAの中間みたいなものか。

【ET 2008】NECエレ、構成を変更可能なストリーム処理用ASSPを開発、FPGAよりも高性能で低消費電力
URLﾘﾝｸ(eetimes.jp)

563:Socket774
08/11/25 20:51:37 CkVJodrX
＞Pentiumデュアルコアと比較すると、単位時間当たりの処理速度が15倍に向上し、

この手の売り文句は↓を思い起こさせる
URLﾘﾝｸ(monoist.atmarkit.co.jp)
URLﾘﾝｸ(biblio.yamanaka.ics.keio.ac.jp)

564:,,・´∀｀・,,）っ○×△□
08/11/25 20:52:20 xmukXtyv
N社の日本法人の某氏をして
「（ローエンド製品でのCUDAの意義は）そんなに速くならなくともCPUに処理時間の余裕ができるだけは意味があるんじゃないでしょうか」
とか自信なさげにいう代物だぜ。
ソースは俺。間違いない。

事実として8-32SP程度のローエンドGPUでCUDAやっても速くもなんともない。
処理によってはフル稼働してもCPUより遅かったりする
そんなもんをカットダウンしてモバイル向けに落とし込んでも脅威じゃねーよ。
それなら現時点であのTDPにして128bit-SSE命令を最大2つ同時実行可能（同クロックのPentiumMやK8を凌ぐ）なAtomのほうがまだ現実的で芽はあるよ。

GPGPUなんてのは本当は使いづらいけど性能がでるならということで仕方なく使うもんであって
誰も「GPUでコンピューティングしたい」訳じゃないんだぜ。変態研究者を除いて。

まぁMACオタあたりの御花畑な思考では理想のアーキテクチャに見えるかもしれないが。
本質的にはCellよりメモリの制限がきつく、用途を選ぶ。
罰ゲームでなくて何だよ。

すくなくともそのままではモバイル・組み込みには不向きだな。
SPを減らすのもありだろうけどますますマンチキンの願望とかけ離れた代物になるわな。

565:Socket774
08/11/25 21:15:53 C/1SV2Ri
使える用途で使えばいいんだよ

何にでも使おうって方が間違い

566:Socket774
08/11/25 21:23:36 DKoX2Du1
お願いですからハイエンドCPUローエンドGPUの素エンコ勝負だけにしてください（心の叫び）

567:,,・´∀｀・,,）っ-●◎○
08/11/25 21:30:46 P8ZTmbPf
モバイル機器でマルチコアは流行らん。歴史が証明してる。
今までどれだけの組み込み向けプロセッサのマルチコア版がペーパーリリースで終わったよ

MACヲタは組み込みの連中の素性を知らんのだろうが
「現場の長年のノウハウ」とか言ってC++によるOoOプログラミングすら嫌ってる奴も多くない。
いまだにサブ関数を順番に呼んでいくタスクシステムの延長でプログラム書いてる。
そんな連中がマルチコアなんてまともに使いこなせるわけが無い。
CUDA？なにそれおいしいの？

最先端プロセスにものを言わせた高クロックのシングルコアのほうが圧倒的に扱いやすいだろ。

568:Socket774
08/11/25 21:36:01 C/1SV2Ri
専用機能特化機構を積んだ方がよいのでは？
用途も特定しやすいだろうし

569:Socket774
08/11/25 21:55:56 CkVJodrX
うん。
だから組み込みではASIC・システムLSIが使われてきたし、これからも使われ続ける。
それなりの汎用処理性能が求められる携帯電話向けでは、アプリケーションプロセッサが使われる。

570:,,・´∀｀・,,）っ-●◎○
08/11/25 21:59:11 P8ZTmbPf
最近名前よく聞くフィックスターズとかサイボウズラボみたいな
灯台鏡台博士を大量に雇ってる企業だけじゃないんだよソフト屋は。

日本のソフト業界を支えてるのは三流私立・高専・専門学校卒だったりする。
（従業員の平均年齢30歳未満の世界・・・あなおそろしや）

571:Socket774
08/11/25 22:10:46 clhYEM3T
馬鹿はそれにも引っかからないから可哀想だな

572:,,・´∀｀・,,）っ-●◎○
08/11/25 22:17:21 P8ZTmbPf
>>571　そう自身を哀れむなYO

ただ、大学卒業できただけで神の子だっていう人もいるし
レベル低いよなこのスレ

573:,,・´∀｀・,,）っ-●◎○
08/11/25 22:19:20 P8ZTmbPf
ここ直しとく

×「現場の長年のノウハウ」とか言ってC++によるOoOプログラミングすら嫌ってる奴も多くない。
○「現場の長年のノウハウ」とか言ってC++によるOoOプログラミングすら嫌ってる奴も【少なく】ない。

574:,,・´∀｀・,,）っ-●◎○
08/11/25 22:21:04 P8ZTmbPf
Object-OrientedだからOoOじゃなくてOOか
しまったｗｗｗｗ

575:Socket774
08/11/25 22:40:01 4HwNPSkc
いつのながら団子さんの独壇場
おみごとです

576:ﾚﾄﾘｯｸ君
08/11/25 23:33:31 aZntt5H1
現実は…時にﾌｨｸｼｮﾝよりも奇なり
とだけ書いておくか…

577:Socket774
08/11/26 00:54:04 whKUwQ60
一口に組み込み向けと言ってもPCと変わらん物から8bitマイコン・4bitマイコンまであるわけで、
上位の方にはマルチコアが使われているでしょ。

578:Socket774
08/11/26 06:19:31 YpWkD+4P
車業界のMISRA-Cとか超保守的
ポインタの演算不可だってよ
まあコスト的にもシビアだからx86もありえないけど

579:,,・´∀｀・,,）っ-○◎●
08/11/26 15:28:55 GrKYm10I
まあ大量に数出るものについてはAtomの単価はネックになるわな。
大体にオーバースペックだろ。

Atomが狙うのは携帯電話なんかよりももっと性能が必要なレンジ。
ARMでも1GHz超えるようなものは1000円超える。
このレンジでようやく、Atomのx86資産を生かした開発効率と天秤にかけることができるわけだ。
Atomがインターネットデバイスの需要はPCから携帯機器に置き換わるって言われてる。
Intelは別に組込業界を支配しようってんじゃなくて、PCの需要がMIDシフトしていくので
飯食っていくために必然的にやらざるを得ないって話。

携帯電話などを通じて下のほうからリッチな機能を持つ支援ハードを搭載して
インターネットデバイスとしての機能強化を狙っていくのがARMやSHなどの
ハイエンド組込CPUだとすれば、インターネットデバイスとしての機能を満たすには
ほぼ十分な性能を持ったPCをベースに上のほうからコンパクト化・省電力化を
狙っていくのがローエンドx86であるAtomその他諸々。
WindowsやLinuxが動くPCをそのままコンパクトにしていく。
今年爆発的に売れたネットブックの需要も通過点。

で、いまiPhoneなんかがやろうとしてるけど、「アプリケーションの動くプラットフォーム」として
成功するには、フリーソフトも含めたソフトの充実は絶対条件だ。
そのことを踏まえ、AppleはiPodやiPhone向けのSDKを、Leopardユーザーなら無料で使えるようにした。
しかしこれもMac買わないといけないので敷居が低いとは言えない。

Atom＋Windowsベースだと、いざとなれば今使ってるPCと同じソフトがそのまま動かせるかもしれない。
これは個人を含めた開発者にもユーザーにもメリットがある。
Win32-x86向け開発ならVCはタダでも使えるし。
MSはWinCE向け開発可能なIDEをVS2008からはPro以上に引き上げちゃった。

しかもMSはCEは廃止にしてNTベースに置き換える計画打ち出してる。

580:,,・´∀｀・,,）っ-○◎●
08/11/26 15:38:13 GrKYm10I
>>577
いま需要が伸びてるデジタルフォトフレームなんかだと
ハイエンドクラスに使われてる石はデュアルコアARMとかもあるよ。
たいがい片方をDSPの制御に使ってたりするんだが。
あと日立の携帯はSHの2コアとか使ってるね。

しかし4コア以上はたいがいペーパーリリースで終わってる。

581:Socket774
08/11/26 15:41:47 m7XIjN0m
世界で最も多く出荷されたRISCプロセッサMIPSのサバイバル戦略
URLﾘﾝｸ(techtarget.itmedia.co.jp)

582:Socket774
08/11/26 16:54:49 artGzS0W
ん？
マルチコアから4コア以上に摩り替わってる気がするぞ？

583:,,・´∀｀・,,）っ-○◎●
08/11/26 17:13:58 GrKYm10I
ん？デュアルコアも「マルチ」コアに含めちゃって良いのか？
ちなみに2コアのうちDSP制御専用に使われて
ARMとしてプログラム触るのが1コアだけ、
ってパターンでもマルチコアって言っちゃって良い？
1コアがI/O周り専用でもう1コアがメイン処理用みたいなのもあるね。
DSがこのパターン。ARM7+ARM9で。

CPU＋コプロセッサっていうありがちな構成の延長として2コアまではいけるんだけど
それ以上はなかなか普及が進まないんだが。
メイン処理の分割はいろいろめんどうなのよ。

584:Socket774
08/11/26 19:58:51 whKUwQ60
少なくともルネサスとQNXは2コアでもマルチコアに含んでいる、

585:Socket774
08/11/26 20:00:00 sUKUfokU
4コアならARM11 MPCoreのNaviEngineが発表されてるやん
と思って調べたら、それを採用したアルパインの製品が出るのは2010年予定なのか

以下は組み込み開発の現実
URLﾘﾝｸ(web.archive.org)
URLﾘﾝｸ(slashdot.jp)

586:Socket774
08/11/26 20:30:06 I3bRi9P+
正直Atomは今の位置がベストだと思うけど
MooresTown出る前にSkyFireリリースされて終了じゃん？

587:ﾚﾄﾘｯｸ君
08/11/26 20:50:08 CJ6baMfg
つ AMP

588:,,・´∀｀・,,）っ-○◎●
08/11/26 20:55:06 GrKYm10I
はぁー

Skyfireってさ、
サーバサイドで前処理して携帯の画面表示用に表示データを落とし込むソフト連携型の「Webサービス」だよ。
Atomを蹴散らせせるほどの顧客を抱え込むことが出来るサービスとはとても思えない。
たとえばだけど、HTMLはテキストの解析からやらないといけないけど、DOMの構造をサーバ側で解析して
構造化されたバイナリデータにして送ればクライアント側のCPU負荷はそんなに少ないわけだ。
で、これが月額いくらとかだろこれ。

この手のよくある　株式会社＜商標名＞の新興企業の作るものって掲げるものは立派なんだけど
いざ実物が出てみるとメッキが剥がれて終了か、いつの間にか会社がなくなってたり
するパターンが多いんだけどあてになるの？

MSもコレと似たDeepfishなるWebブラウザ開発してるけど、MSのWebサービス部門は数年連続赤字だ。

589:Socket774
08/11/26 21:20:40 YpWkD+4P
まあモバイル機器はブラウザさえまともに動けば問題ないもんなー
JavascriptのJITの最適化がし易いアーキが勝利じゃね？

590:,,・´∀｀・,,）っ-○◎●
08/11/26 21:39:13 GrKYm10I
Firefox 3.1 TraceMonkey凄いな。ChromeのV8より速いぜ。
nanojitっていうらしいが

URLﾘﾝｸ(hg.mozilla.org)
やってることはV8と同じ。
V8はAMD64には対応してないがこっちは対応してる。

例によってベクトル化は難しいようだね
インタプリタ実行がネイティブコード実行になるだけでもJITのオーバーヘッド加味しても効果はある。

591:MACオタ＞皆さん
08/11/26 22:13:01 Ix4vgDrA
>>567-590
えっとモノ知らずのヒトに釣られているみたいすけど、基本的に機械制御等の多くの組込
分野わ『ホンモノ』の並列プロセスの世界す。
単一のプロセッサをOSがあたかも複数のプロセッサがあるように見せかけているPCと
異なって、本当に沢山のコントローラが並列動作しているすけど。。。

592:,,・´∀｀・,,）っ-○◎●
08/11/26 22:14:25 GrKYm10I
ｳﾞｧｶだねぇそれ言ったらPCのほうがより多くのプロセッサが走ってるよ

593:Socket774
08/11/26 22:16:05 rSn4HXd1
だから汎用プロセッサのコア数について話してんだって

594:MACオタ
08/11/26 22:19:37 Ix4vgDrA
UMCが45nm HKMGプロセスの検証を終了したとのことす。
URLﾘﾝｸ(www.eetimes.com)
　　-----------------
　　United Microelectronics Corp. has validated its high-k metal gate process with a test
　　SRAM design run at the 45nm node. The move is a step toward the company's goal of
　　offering a high-k process at the 32nm node in 2010.
　　-----------------
量産わ32nm世代からとのことす。

595:Socket774
08/11/27 00:26:30 UDYeb10r
一口に組み込みといっても、クルマのように百単位のものからリモコンのような1個のみまであってだな・・・

596:,,・´∀｀・,,）っ-○◎●
08/11/27 00:31:47 KVJ1xHPt
複数の専用プロセッサを使うことになると言ってもモジュール毎に開発グループが違うからな。
汎用コア複数だと1グループで複数のCPUをどう使うか考えないといけない。

597:Socket774
08/11/27 02:11:07 nKqRBMOg
>>588
Deepfishは死にました。

598:Socket774
08/11/27 09:50:23 zKZWX/Ru
>>596
> 複数の専用プロセッサを使うことになると言ってもモジュール毎に開発グループが違うからな。
> 汎用コア複数だと1グループで複数のCPUをどう使うか考えないといけない。

(μITRONでいう)タスク分割は組み込みの基本ですがな。
スケジューラも一般に単純だからタイムスライスでラウンドロビンなPCより
注意深く設計しないといけないよ。

599:Socket774
08/11/27 10:32:33 ai9eq4VQ
東京工業大学が世界初の大規模GPGPUコンピューティング基盤を大規模スーパコンピュータ基盤TSUBAME上に実現
URLﾘﾝｸ(www.gsic.titech.ac.jp)

らしいです
既出ですっけ？

600:Socket774
08/11/27 15:34:38 pR59hlz2
>>599
10TFも実効性能上がらなかったんだな。実効効率50%切っている。
4種類のプロセッサを協調させるのは容易ではないんだな。
京速計算機はスカラベクトル混合になるらしいけど大丈夫なんだろうか？
Linpackでも効率出にくいのに実際のアプリケーションで連携させるとなると
更に難しい気がしてしまう。

601:Socket774
08/11/28 18:16:29 ru5uBaGs
そんなことよりこいつを見てくれ。こいつをどう思う？
URLﾘﾝｸ(www.intellasys.net)

602:Socket774
08/11/28 18:36:32 uNC6M+w3
メモリスタ、来まスタ。

HP社、3次元構造のメモリスタ・チップを発表（2008/11/28）
URLﾘﾝｸ(eetimes.jp)

603:Socket774
08/11/28 18:43:34 CWy3yUzV
>>601
非同期型というのは珍しいと思う
forthチップは昔から根強い人気
ゼロサイクル通信萌え

604:Socket774
08/11/29 18:39:42 +8kVxKbM
>>600
京速のベクトル部は飾りです
偉い人にはそれがわからんのです

605:MACオタ
08/11/29 21:07:08 /fC9cO28
ベクトルと言えば、牧野教授がSX9について語っているす。
URLﾘﾝｸ(www.artcompsci.org)
　　------------------
　　これを x86 PC と比べると、例えば Opteron で DDR2-800 2チャネルだと理論値は1ソケット
　　12.8GB/s ですが実力はまあ 7GB/s くらい、これが Core 2 になると同じ理論値で実力は
　　5GB/s 程度まで低下します。
　　これは面白い状況で、 x86 並列機をソケット 100万で買うとメモリバンド幅 1GB/s 当りのコスト
　　は 14-20万円ですが、 SX9 が1ノード2億円だとすると (地球シミュレータセンターの買い値は
　　もうちょっと安いです)1GB/s 当りの価格は7万円となって、大きな差があるわけです。
　　------------------
安易にベクトル機を叩くヒトもモノ知らずに過ぎないらしい。。。ということで。
その他面白いコメントわ、こんな感じす。
　　-------------------
　　　1年前の議論で若干問題だったのは、 x86 のメモリバンド幅を理論ピーク値で評価している
　　ことです。Opteron (少なくとも 1ソケットや2ソケットなら)はまあ実力がピーク 6-7割がでるの
　　でそれほど大きな乖離はないのですが、 Core 2 は4割くらいしかでないので結 2.5倍の差に
　　なり、2倍程度の差を議論している時には結論が変わってきます。
　　　これは、HPC でベクタ向けに書かれたアプリケーションだと、Opteron のほうが Core 2 より
　　も速いこともある、ということでもあります。
　　-------------------
同時期に設計されたプロセッサにわ、優劣わ無く向き不向きがあるだけという普通の話かと。

606:Socket774
08/11/29 21:29:49 H1hlms5v
MACヲタﾀﾀﾀﾀﾀｱｱｱｧｧｧｧ...

607:MACオタ＠補足
08/11/29 21:37:11 /fC9cO28
参考までに今回、牧野教授がやっていたSTREAM Benchmarkの最新x86プロセッサによる結果す。
URLﾘﾝｸ(www.amd.com)

608:Socket774
08/11/29 21:39:17 Ila9AF2M
>>607
そこにNehalemも載せると楽しいだろうな

609:Socket774
08/11/29 22:08:58 /1+RhT2L
>>608
リンク先読めばわかるが、

もちろん、来月になって Nehalem がでてくるとメモリバンド幅の実力が Core 2 に比べて
3倍程度になるようなので、SX9 と同等になり、メモリバンド幅当りのコストとしては地球
シミュレータ当時と同様に x86 ベースの高い計算機とベクトル機で同等、 x86 で安く上げる
ことができれば1桁良い、ということになります。

とも言ってるぞ。

610:MACオタ＞608 さん
08/11/29 22:26:15 /fC9cO28
>>608
　　-----------------
　　そこにNehalemも載せると楽しいだろうな
　　-----------------
Intelによる準公式の数値わ、下記の通りす。
URLﾘﾝｸ(journal.mycom.co.jp)
　　==================
　　Stream Benchmarkで測定したメモリバンド幅は、現状のCore 2プロセサであるHarpertown
　　では、クロック3.0GHz、FSB 1600MHzのチップに800MHzのDDR2メモリをつけた場合は
　　約9.8GB/sであるが、2.66GHzクロックのNehalemに 1066MHzのDDR3メモリを接続した場合
　　は33.4GB/sと3.4倍の向上を示している。
　　==================

611:Socket774
08/11/30 00:21:48 f0SaP70u
>33.4GB/sと
3ch DDR3 1066MHzの理論地より増えているんだが

612:MACオタ＞611 さん
08/11/30 00:37:45 Cnm2ifs0
>>611
2-socketシステムでの値だと思われるす。

613:Socket774
08/11/30 03:48:46 iFAksI9b
大規模共有メモリがSXの大きな利点かと思っていたけど、
同程度のコストパフォーマンスなら楽できるSXの方が選ばれるだろうから
メモリバンド幅が壁になる分野ではマルチノードシステムも有用なんだな。

614:Socket774
08/11/30 10:40:36 BSLQ9HBk
似たような理由で、東大の情報基盤センターでも
ピーク性能が圧倒的に高いT2Kよりメモリバンド幅重視&大規模SMPのSR11000の方が
遥かに重用されてるらしい

LINPACKは通信量のオーダが計算量に比べて低いので、飾りにしかならないんだと

615:MACオタ＞614 さん
08/11/30 13:45:17 Cnm2ifs0
>>614
それ、大学の計算機センターという利用形態のために複数ノードをまたぐような並列化アプリが
少ないというだけでわ？
箱の中だけで完結する並列化しか行っていない場合わ、当たり前だと思うす。

おそらくT2K仕様も、スーパーコンピュータとしてのコストパファーマンスの悪い4-socketノードを
選択したのも、同様の事情を考慮したものと思われるす。

616:MACオタ
08/11/30 16:54:09 Cnm2ifs0
なんとなく牧野教授の『スーパーコンピューティングの将来』シリーズの過去記事を読み直して
いたすけど、半年前のRoadrunnerの1PFlops越えについて、こんなこと書いているす。
URLﾘﾝｸ(www.artcompsci.org)
　　-----------------------
　　とはいえ、やはり、ボード 4 枚も使って CELL 4 チップ、400Gflops というのは、Opteron
　　とか Xeon だけのとどれくらい違うの？というのは非常に微妙なところでしょう。同じボード
　　4枚構成で、Quad Core Xeon E5450 が載った IBM HS21 を使えばほぼ同じ性能が消費
　　電力も大きな差なしで実現できそうだからです。
　　-----------------------
今回のTop500で示された現実わ、下記の通りす。
　- x86 (K10/2.3GHz):　　　1.059 PFlops, 6.95MW, 444.9 MFlops/W
　- Cell (PowerXCell 8i):　 1.105 PFlops, 2.48MW, 152.4 MFlops/W
URLﾘﾝｸ(www.top500.org)
URLﾘﾝｸ(www.green500.org)

617:Socket774
08/11/30 17:16:06 HaHh9MQf
MACヲタタタタタタタタｱｱｱｱｱｱｱｱｱｱｱｱｱｧｧｧｧ……

618:Socket774
08/12/01 00:08:18 ZWHFUNmr
算数が出来ないMACオタ

619:MACオタ＠訂正
08/12/01 05:16:22 IovCRttr
>>616わ電力効率が上下ひっくり返っていたす。
　誤)
　　- x86 (K10/2.3GHz):　　　1.059 PFlops, 6.95MW, 444.9 MFlops/W
　　- Cell (PowerXCell 8i):　 1.105 PFlops, 2.48MW, 152.4 MFlops/W
　正)
　　- x86 (K10/2.3GHz):　　　1.059 PFlops, 6.95MW, 152.4 MFlops/W
　　- Cell (PowerXCell 8i):　 1.105 PFlops, 2.48MW, 444.9 MFlops/W

620:Socket774
08/12/01 07:23:45 iuMrr0Pa
だが情報収集だけなら人一倍だぞ

621:Socket774
08/12/03 11:06:55 7jOTbXW8
東工大、世界初のGPU採用スパコンに進化した「TSUBAME 1.2」を解説
～NVIDIA CEOフアン氏は特別講演を実施
URLﾘﾝｸ(pc.watch.impress.co.jp)

622:MACオタ
08/12/03 22:12:02 Rm/iubZB
量子色力学計算用の専用システムQCDOCがBlue Geneの先祖だったことを知っている方も
多いと思うすけど、PowerXCellをコアにした専用システム"QPACE"を紹介するす。
今回もIBMがスポンサーになっているすから、次世代Blue Geneわ似たようなモノになる可能性
もあるす。
URLﾘﾝｸ(www.itwm.fhg.de)(Dirk_Pleiter_-_Desy).pdf

623:Socket774
08/12/04 21:33:34 xGCfhHhW
４８時間以内に退職を選ばないと解雇する
正社員削減「このままだと自殺者」
URLﾘﾝｸ(www.asahi.com)

624:Socket774
08/12/05 00:26:27 aV6EPLQ5
>>622
これQCDOCに比べてあまりQCD計算専用と言えるような作りではないよね？
LS増やすかeDRAM付けるとか、そういうのはお金掛かるからダメなのかな。

625:Socket774
08/12/05 01:44:58 CILxL403
QCD専用機ｲﾗﾈ
理由：役に立たないから

626:Socket774
08/12/05 05:58:46 kT2GZMb3
QCDなんぞGPGPUでいいわ！
んじゃ次世代BlueGeneって何よ…
それこそTSUBAMEライクになるんか？

627:Socket774
08/12/05 15:51:16 f4SfpQjQ
日本IBM「加藤候補を3000人創出します」
ｽﾚﾘﾝｸ(news板)

628:Socket774
08/12/06 02:41:11 AmeHS/F+
>同労組には、これまでに７０～８０件の相談が寄せられているという。
_~~~~~~~
ほっとけつーのｗこういう和田岩。本質に関係ないから。