Intelの次世代CPUについて語ろう 40at JISAKU
Intelの次世代CPUについて語ろう 40 - 暇つぶし2ch509:Socket774
09/09/12 16:28:21 ZZ4in/5v
つーか仮想鯖ってむしろポラックの法則的にきつくね?

510:,,・´∀`・,,)っ-○○○
09/09/12 17:48:19 j3WuhvmV
この手のビジネスの本質って如何に顧客を騙して金をとるか、だからな。
LAMP環境のソフト自体はタダだがサポート料は高いぞ!

Movable Typeみたいな玄人好みのブログがCMSとして使われてること自体、非生産的。


511:Socket774
09/09/12 18:47:59 RYraBusm
まあ、クラウドって
文系がコンピュータ語るときに使う擁護だな。
流行に対して、あとから名前つけてるだけ。
本質的な研究ではない。

512:Socket774
09/09/12 18:56:20 dZ2OQG4z
>>511
コンピュータ語る文系はそんなことは言わん。 非理系の間違いだろ

513:Socket774
09/09/12 19:08:05 RYraBusm
文系というか、思考がいかにも文系チックな連中ということだな。
歴史的にみると、より小型のコンピュータの方が量産効果を発揮できて
コストとパフォーマンスで有利になっていく傾向にあるため、
一時的な例外はあるもののコンピュータの処理は大きな時間軸でみると、
どんどん多数の安価になったコンピュータに処理を分散化する方向で進化している。
ここであがっている、クラウドや仮想化といった技術は
その流れに逆行するタイプの技術である。
発想はわるくないけど、実態に合っていないので、流行らない。

514:Socket774
09/09/12 19:29:41 NdynQqm7
仮想化はともかく、クラウドは分散処理になるんじゃねーの?
クラウドって言葉が気にくわないのは分かったけど、
現に存在してサービス提供してるものを見て見ぬ振りするのは馬鹿なんじゃねーの?
言葉が問題だと思うんならもっといいコピーを考えてくれよ

つーか何この流れ

515:Socket774
09/09/12 19:29:43 Ttkb1geF
>>509
ポラックの法則はプロセッサのマルチコア化を促し、
仮想サーバによる複数ハードウェアの集約はマルチコアの主要な用途。
両者は相性が良い。

516:Socket774
09/09/12 19:34:15 Ttkb1geF
クラウドは「サーバの管理マジ勘弁」という
サーバ管理自体をビジネスにしていない(つまり大部分の)企業の
要求から来るもので
顧客から見れば仮想化や分散処理は関係がない。
しかしその実装とは大いに関連する。

517:Socket774
09/09/12 19:58:41 ZZ4in/5v
>>515
いや、それは分かってるんだけども、結局何故かシングル性能たんね、って話が
不思議と出てきてるように見えるんでそう思った

518:Socket774
09/09/12 20:01:25 RYraBusm
実際の所、サーバの統合・集約ができるのはサーバに求められている
性能需要が停滞してきたから。十分な性能があるのなら、管理がらくだから、台数は少ない方がいい。
一見サーバへの集中化が進んでいるようにみえて、
これからはサーバはどんどん小さくなってますますクライアント本意になる。

519:Socket774
09/09/12 20:03:12 RYraBusm
マルチコアはサーバの性能ニーズをこれまで以上に安価に満たすようになる。
すると、ハード・システムのコストよりも、管理サービス的な人的経費の方が大きくなるし、
こんなのアウトソーシングでやっちまえよって話になるのもムリもない。

520:Socket774
09/09/12 20:11:30 yk8q7TKe
IT Doesn't Matter か

521:Socket774
09/09/12 20:29:26 dljoSYLo
>>519
で、何年かたって今まで見られなかった機械的・人的な不具合が出始めると
自分たちでやってノウハウを蓄積しようって流れが繰り返されるんだよな

522:Socket774
09/09/12 22:04:44 UoXoNKSq
SandyBridgeは目玉であるAVX対応アプリがなきゃ、Core-i並みの性能か?_





523:,,・´∀`・,,)っ-○○○
09/09/12 23:02:52 j3WuhvmV
ロードユニット・浮動小数ユニットが増えてるので従来SSEでも恩恵はあるみたいよ。
もちろんAVXだと更に良いけど。
Intrinsicsで書かれたコードは再コンパイルするだけでAVXに対応できる(従来SSEとの両対応も可)ので
まあ時間の猶予はある。

524:Socket774
09/09/13 00:34:03 tMhawENg
FP用にポートはふえてないだろう

525:,,・´∀`・,,)っ-○○○
09/09/13 00:51:33 XYtvuRLk
ポート数は増えてないがFP演算を発行できるポートは増える。
たとえば128ビットSIMD乗算命令を2回同時発行できる。

526:,,・´∀`・,,)っ-○○○
09/09/13 00:53:24 XYtvuRLk
ついでに言うとロード用にポートは増えてないっぽい
Store Addressユニットがロード命令の発行に対応しただけに見える。

527:Socket774
09/09/13 01:04:52 tMhawENg
>>522
だいたいあってる

528:,,・´∀`・,,)っ-○○○
09/09/13 01:19:35 XYtvuRLk
とはいってもAVX使っても3オペランドと256ビット版(FP演算のいくつかのみ)が使えないくらいだぞ
まあそれが大きい物で1.4倍くらいの差になるんだけどさ


529:Socket774
09/09/13 01:25:55 p/olwFQy
CUDA使ってみたけど単精度浮動小数を大量のデータに対して
同一アルゴリズムで適用するという、きわめて限定的な使い方に
なるんだな。ビデオのエンコード・デコードぐらいしか使い道が想定
できん。

SSE系は使い勝手はいいけど実行効率はおそろしく悪いし、ここら
へんがもうちょっと改善されてくれたらな。その実行効率の解決を
目指して作ってるのがララビーなんだろうけどさ。

530:,,・´∀`・,,)っ-○○○
09/09/13 02:10:04 XYtvuRLk
>SSE系は使い勝手はいいけど実行効率はおそろしく悪いし

CUDAの効率知ってて言ってるのか?
いや、触ってみたならどういうもんなのかわかるだろうけど

531:Socket774
09/09/13 02:15:08 3f1DIYYo
>>529の言う効率は製造コスト当たりの理論演算性能じゃね?
実行効率だと完全に言葉の誤用だな

532:Socket774
09/09/13 02:26:57 IU1FyGU9
だからSSEに最適化して3%変わったら奇跡なんだって

最適化に夢見過ぎ

アルゴリズムに勝るもの無し

533:Socket774
09/09/13 04:37:20 tMhawENg
CPUのスレでアルゴリズムに勝るものなしはないだろ
それは全く独立した別の問題だ

534:Socket774
09/09/13 04:49:51 lZW/KYYS
ハード設計者やその気持ちになれる人間はプログラマやその(ry
よりも少ないからマ的発想の会話が多くなるわな

535:Socket774
09/09/13 05:17:15 tMhawENg
クラウドとかコードアナライザとかソフトよりの人間が興味ありそうな話が
伝統的にCPUのスレに多いのはソフト系の人間の絶対数が多いから仕方ない。
自分はハード系だが、コードの所用クロックを全て1クロックの狂いもなく計数できるコード神がいたとしても
次世代のCPUを予想するのに十分な知識は得られないからそのところは勘違いしないで欲しい。
最近は1コアで複数スレッドが走ったり、電力がらみで動的に性能変動するくらいだし、どんどん難しくなる一方だぜ。
現実的なコスト、納期、信頼性、電力で実現できるか否かはソフトの実効速度上の理想とは、
別のところにある問題だからな。よっていくら命令セットやコードばかりを拡大して取り上げても、
木を見て森を見ず、満足に当たる予想は立てられないし、
実際その手の推測から高確度で次世代CPU像をうまくあてられた人はみたことがない。

536:Socket774
09/09/13 05:36:29 tMhawENg
今のところ、Sandy BridgeはNehalemとSIMD等を除いては大差ない性能、
その程度しか言えないね。それ以上は与太話の域をでていないな。
Nehalemもそうであったが、電力をどれだけ削減できるかで
製品のクロックが変動するから、細かい性能差を議論するとなると、
電力が既に推定できているのが大前提になる。1-2年前時点で電力予想しろはムリゲーの世界。

537:Socket774
09/09/13 07:16:09 0aNm94qQ
加算合成みたいな処理では400%どころじゃないんですがね
AVXでやればループの回数をさらに1/4にできるでしょうね
GPUでやれって?そりゃまた失礼しました(^^

538:,,・´∀`・,,)っ-○○○
09/09/13 09:09:29 XYtvuRLk
>>532
3%wwww
君がショボいからだろ。
SSE使うか使わないかでものによっては4倍かそれ以上性能に差が開くんだけど?

特にSSEの最初の方のSは重要。
VTuneとか使ってる?


539:Socket774
09/09/13 09:11:25 sR5Rebpx
つーか用途次第だろw
SSEでどう頑張っても0.1%も変わらないアプリもあるし、SSEがあれば10倍速くなる
アプリもあるだろう

540:Socket774
09/09/13 09:12:18 sR5Rebpx
と思ったが10倍は難しいか

541:Socket774
09/09/13 09:23:10 85uTKQBK
CUDAは使ったことないから分からんが
SSEでも最適化ってかなりめんどくさかったな
ビジネスアプリだからかもしれんけど
もっと手軽に導入できる開発環境がないと
エンコやゲームみたいなアプリ以外コストをペイできる代物じゃねえ

542:,,・´∀`・,,)っ-○○○
09/09/13 09:32:16 XYtvuRLk
キャッシュローカリティ制御はどっちかというと「使わないことで」性能悪化する類のものだけどな。
その辺は平気で変わるよ。レジスタ・L1キャッシュ間の少ないメモリをこね回すだけの操作中心だと
余り効果ないけど。

無論、ヨイショされ気味のCellやCUDAをこき下ろすのにスカラ演算に弱いのを散々指摘してるから
どういう演算が並列化に向いてないかはよく把握している。

あと、スカラ命令の拡張だとpopcntとかのアクセラレーション命令使うと大幅に性能改善したりとかってのもある。
ハードウェアの特性を意識しないアルゴリズム(笑)に意味は無いよ。

たとえば8近傍画素とのメディアンとるのにクイックソートなんて使うか?
SIMD化したバブルソートのほうが速いよ。

543:Socket774
09/09/13 09:42:37 +emAUGTx
基数ソート?

544:Socket774
09/09/13 09:43:20 5kRXmoKL
万能で性能が上がる解は存在しないよなー
CPUは雑多な処理で性能上げれるようにがんばってきた
でも、雑多な処理での性能向上に回路規模などを要因として限界見えてきたので
ベクトル演算性能上げてそちらの性能を上げる方向に変えてきた

ベクトル演算性能だけで見れば、余分な回路がたっぷりついたCPUよりも
GPUの方が性能が高い。 当たり前のことだけどね

545:Socket774
09/09/13 09:45:37 IU1FyGU9
SSEなんてただCPUを売りたいがための言い訳にすぎないからな

546:Socket774
09/09/13 09:48:48 IU1FyGU9
0.4秒→0.1秒
これでも4倍はやいことになる
団子が言ってるのはそういうこと?

547:,,・´∀`・,,)っ-○○○
09/09/13 09:51:20 XYtvuRLk
>>544
SIMDだから同じだと思ってるだろ?全然演算粒度が違いすぎる。

あまり話題にならないけど、Core MAはなにげにビットスキャンとかのスカラ命令も高速化してるよ。

548:Socket774
09/09/13 09:52:12 +emAUGTx
>>546
まずプロファイリングをしろよ

549:Socket774
09/09/13 10:14:50 Es+knxil
>>545
SIMDなきゃx86は浮動小数点演算でRISCに打ち勝つことはできんかったと思う。
P6(PentiumPro)アーキテクチャでいいところまで行ったがRISCを追い抜く
ことはできなかった。


550:,,・´∀`・,,)っ-○○○
09/09/13 10:23:31 XYtvuRLk
あれは主にスタックベースの命令セットから脱却できたのが大きい
G4のAltiVecは高性能だったが、クロックが上がらなかったのと、FSBの帯域が(ry

551:Socket774
09/09/13 10:24:42 0/nyCkOa
>>549
8087の設計が古すぎたが、後方互換性を考えると仕方がなかった。
IEEEの標準仕様をそのままインプリメントしたスタック型アーキテクチャは
高速化には不向きだった。その代わり64bit倍精度浮動小数点演算を
内部的に80bitで行うため誤差が小さいという利点はあった。

SPARC V7の初期は浮動小数点ユニットを内蔵しておらず、Weitekのような
サードパーティの演算ユニットを流用していた(命令を変換するインターフェース
ユニットを介して実行)。MMUも別チップで4チップ構成だったにもかかわらず、
x86の浮動小数点演算より高速だった。いかに8087が時代遅れだったかということだな。

552:Socket774
09/09/13 13:39:59 tMhawENg
>>549
x86は以前としてFP系の方は苦手だ。全体的に速いから結果的に勝っているだけ。
x86が何故整数だけでなくFPも高速かというと、FPユニットに力をいれているからっていうより
内蔵キャッシュが強力で、クロック高めってだけ。仮にx87に限定しても最速の可能性はある。

553:,,・´∀`・,,)っ-○○○
09/09/13 14:41:16 XYtvuRLk
流石に無いわそれは。
CellやPOWERがあるし、128ビットFMA×2のSPARC64 VIII fxが控えてる。
Pentium 4で倍精度実数演算をスタックからレジスタベースに移行するSSE2が
使えるようになったことで格段に性能上がった。
HPCではPentium 3まで全く相手にされなかったこと考えればまあ、そういうことでしょ。

ちなみにx87・SSE*スカラの実効性能のほうは(HT使わないなら)36エントリの
リオーダリング機構を持つAMDのほうが依然として最強。

554:Socket774
09/09/13 14:56:48 AvzXJDPq
・・・よん?

555:,,・´∀`・,,)っ-○○○
09/09/13 15:08:30 XYtvuRLk
なんだかんだで4様(正確にはXeon)はIntelにおけるHPC本格進出の立役者

556:Socket774
09/09/13 16:03:11 tMhawENg
スカラFP対決にきまってるだろ。
SIMDはまた話が別だ。もとからx87にないしな。

557:Socket774
09/09/13 16:04:43 tMhawENg
つーか、SPEC CPUの結果はSIMDつかってないからなあ。
それであんだけいけるってことはx87でもトップレベルだろう。

558:Socket774
09/09/13 16:11:56 tMhawENg
ちなみに当時のPentium 4時代のSPEC CPUをみれば
SSE2で劇的に性能がのびたことはないのがわかる。
せいぜい10-20%程度の世界だったよ。
x86がFPでも最速クラスになったのは、RISC/IA63が相対的に弱体化したことと
地味にFPの実装を改善していた徐々にスコアが伸びていったことによる。
SIMDは関係ないし、SSE2以降のスタック廃止の成果も大きくはない。

559:,,・´∀`・,,)っ-○○○
09/09/13 18:23:13 XYtvuRLk
余計苦しいな。
PPC 970(G5)で倍精度スカラFMA×2だぜ。
CellのSPEだってSIMDユニットのプリファードスロットだけ使えば性能1/4(あるいは倍精度なら半分)だが
Enhanced~のほうなら余裕で同クロックのCore MAのx87性能は下せる。
そのくらいx87は非効率的

560:,,・´∀`・,,)っ-○○○
09/09/13 18:25:30 XYtvuRLk
そりゃSPECfpはintのほうとは違ってメモリ帯域ベンチの要素が大きいからな。
SIMDでそれだけ伸びりゃ万々歳だよ

561:Socket774
09/09/13 18:28:37 p/olwFQy
GPGPUはなんつーか特定の使い方を強制するからなぁ。
汎用性はない。これで整数も並列で高速だったらまだよかったけど。


562:Socket774
09/09/13 18:44:13 tMhawENg
URLリンク(www.nminoru.jp)
あまりSPEC CPUで最近まとまってるソースはしらないが、
とりあえずここをみるだけでも、実装の方がはるかに重要だとわかる。
例えばint/fpのスコア比は、Pentium 4やAthlon/Opetronではほぼ1対1であるが、
Pentium IIIではfpのスコアが小さい。しかし、SSE2があるDothanでもPentium III
よりましであるものの劇的に改善されているわけではない。後継のYonahではかなり改善されている。
スタックアーキテクチャではないFPUをもつRISCでもスコア比が2倍のものから
PPC G4のようにfpのスコアがやたら低いものもある。
fpがメモリ帯域依存といっているのは確かにそういう傾向はあるが、
キャッシュに依存している部分も大きい。
また、レトロなx87ベンチであるSuperPIでは、Core 2/NehalemはAMDよりも速い。

563:Socket774
09/09/13 18:46:46 tMhawENg
というわけで、x87の時のx86が極端に悪く、
SSE2導入から極端によくなったというわけではない。
実装の改善の方が命令セットの問題よりも遙かに大きいわけで、
これはコードといくらにらめっこしていても、より大域的な視点で実測データをみていかないと
わからない話である。

564:,,・´∀`・,,)っ-○○○
09/09/13 18:55:29 XYtvuRLk
> Pentium IIIではfpのスコアが小さい。しかし、SSE2があるDothanでもPentium III
> よりましであるものの劇的に改善されているわけではない。

Pentium MはPentium IIIまでと同じくSIMDユニットが64ビットなんで分解して処理しないといけない
→デコーダネック
もともとモバイル用だから浮動小数のスループット改良は余り考えてなかったっぽい。

あとYonahで改良されたのはSSE-μOps Fusionによるものだな。
上下64ビットに対するオペレーションを1つのFused μOPsとして扱えるのでデコーダのスループットが
改善&スケジューラの負担も軽くなった。
Merom以降演算ユニットの入出力が128ビット化されたのでYonah1世代限りの技術だったが
(どうやら256ビットAVX(Sandy Bridge)の内部表現として復活するらしい)

>>563
まあ、Pentium 4の時点ではSIMDユニットは64ビット半速×2だから理論スループットに
そこまで差があったわけじゃないからね

565:Socket774
09/09/13 19:03:55 tMhawENg
>>564
Yonahはその通り、結局実装なんだよな。

SSE2でスタックを廃止したおかげでFMAとかを導入できたり、回路実装しやすくなったり
最適化コンパイラを作りやすくなったり、という設計上の2次的なメリットはあるというか、
むしろそれが目的なんだろ。ある時点で、x87とSSE2とで所要クロックを比較したら差が出た程度では
移行のメリットの本質はわからない。
元々x87にある命令と同等の命令をSSE2置き換えても、実行ユニットが同じである手前、
実際の所、劇的な改善はない。

566:Socket774
09/09/13 19:12:20 Es+knxil
>>557
それは知らんかった。今まで、SIMD使っての結果だとばかり思ってたよ




567:,,・´∀`・,,)っ-○○○
09/09/13 19:14:58 XYtvuRLk
それを言っちゃうとSSE*→AVXもあまり変わらないことになるぞ
まあ事実として命令エンコーディングの改良版が使える以外はハード的にNehalem+α的なスペックと推定できるが

568:,,・´∀`・,,)っ-○○○
09/09/13 19:18:57 XYtvuRLk
>>566
騙されるな
2006とかのスコアのコンパイルオプション見てみればわかるが普通に自動SIMD化・スレッド化のスイッチ入れてるぞ。

まあ、ソースの方に手を入れての手動最適化は禁止だな。だからCellだと標準のC/C++なら動きすらしない。
(スパコントップ500のLINPACKの場合は可能)


569:Socket774
09/09/13 19:22:08 tMhawENg
スカラ/ベクトル
SISD/SIMD
の効果は別個に考えて欲しいな。
SIMD/ベクトルは汎用演算よべるものじゃないし、これを容認したら何でも有り。
SPEC CPU専用の命令と半チートユニットを追加したものが勝ちだ。
基本はFP性能といったら暗黙の了解でスカラFP。
SIMDや特定用途向けハードまでいれると何が優れているのかよくわからなくなる。

>>567
AVXはSIMDの効果がメインだろ。命令エンコーディングは後藤が騒いでいるが、
おまけの効能しかないし、これでx86が生まれかわるみたいな大げさな代物では到底ないのはわかるだろ。
一方で、SIMDとは関係なくFPユニット周りが増強されているのならば、
既存のSSEコードも再コンパイルなしで速くなるし、再コンパイルすれば更に速くなる。
しかし、Sandy Bridgeの本領を評価するにはやはりバリバリAVXと新しいポート構成に最適化された
アプリで評価する必要がある。そんな感じだろ。

570:Socket774
09/09/13 19:24:07 tMhawENg
自動SIMD化なんて使われるようになったのは最近の話だし、
まだまだ影響軽微だな。個人的にはわけがわからなくなるからSIMDは禁止にするか、
明確に別ジャンル化してほしいものだ。

571:Socket774
09/09/13 19:58:02 3f1DIYYo
SPEC CPUのCintやCfpは全ベンチマークの幾何平均だからベンチマーク毎に見ればスコアを大きく伸ばしているものもある
ID:tMhawENgはアホってことで終了

572:Socket774
09/09/13 20:00:56 lZW/KYYS
自動SIMD化というのはこういうもののこと?

>ループを解析して可能であれば SIMD 命令を使って
>ベクトル演算をするようにコンパイル

こういう事なら80年代からスパコン用コンパイラでやってるけど

573:,,・´∀`・,,)っ-○○○
09/09/13 20:51:00 XYtvuRLk
ちなみにIntel C++の-fastオプションは最速のスイッチ全てONな。
単純なループなら自動的にベクトルコード化されたコード吐く。


ちなみに言うとx87は1命令毎にfxch使わないと並列化できずにストールするから
デコーダ食いまくって全然速くならないよ。
NetBurstまでのトレースキャッシュならまだx87にも分はあった。

ついでにいうと64ビットではx87原則禁止(SSE*使用)だし。


574:Socket774
09/09/13 22:19:14 wF5113me
SandyBridge世代のアーキテクチャはSSE/AVXの強化が中心で
パイプラインにはあんまり手は入らないのかな?

デコーダがボトルネックなんて話もあるけど
結局Conroeの頃から大して変わらないままなのは
スカラのシングルスレッドでの向上はもう諦めたのかね

AMDの方はかなり手を入れるみたいだけど、どうなるやら

575:,,・´∀`・,,)っ-○○○
09/09/13 22:38:49 XYtvuRLk
Sandy Bridgeは旧来SSEも遅くしちゃいけないしAVXも対応しなきゃいけないので
デコーダのロジック部はかなり膨れあがってると思うよ。

文字通りSSEからAVXへの「Bridge」だからな。

んで、主要アプリのAVX移行が完了したあたりでSSE*を切り捨てるだろう。

もちろんいきなり使えなくなるんじゃじゃなくて、デコードの高速化のためのロジックを弱体化させるだろう。
具体的にはプリフィクスの長さ分だけストールするようになる、なんてことが考えられる。

旧来命令の切り捨てってのは繰り返してきたことだからな
P6で16ビットコードが遅くなったりもした。

576:Socket774
09/09/13 22:39:53 tMhawENg
>>571
幾何平均だからむしろ一部のベンチでスコアを伸ばしても影響軽微なんだろ。
SPEC CPUで自動ベクトル化されたスコアが登録され始めたのは比較的最近。
まあ元の話は自動ベクトル化どうこうではなくて、
x87と非SIMDのSSEで性能に大差がないって話だけどね。>>562を見ればわかる話。

577:Socket774
09/09/13 22:56:32 tMhawENg
自動ベクトル化のスコアはここ数年で登録されるようになったけど、
所詮、最低SPEC CPUベンチ特化でSIMDコードがはきだせれば高スコアがねらえるので、
自動ベクトル化を標準ベンチで認めるのはCPU、コンパイラ双方の実力をわかりにくくする
だけで個人的には反対だ。
極端なハイスコアをあげているのは自動マルチスレッド化の方が顕著だけど、
次バージョンでは評価の枠組みを整理し直して欲しいな。

578:,,・´∀`・,,)っ-○○○
09/09/13 22:58:36 XYtvuRLk
ベクトルコンピュータ否定ですか?

579:Socket774
09/09/13 23:04:45 tMhawENg
SPEC CPUの評価方法の話だろ。
自動ベクトル化、自動マルチスレッド化を有効にしたスコアは専用の項目にわけるべきだよ。
まあ、最近のマルチコアやサーバ用CPUのSIMD強化ブームをみる限りでは
黙っていても次のSPEC CPUがあるのなら整備されるのではないかと。
今のSPEC CPUの枠組みでは、自動ベクトル/マルチスレッド化は正当に評価できん。
高々十数種類しかない決まったソースコードで最適化できりゃいいからな。
実アプリに広範に対応できるような自動並列の技術はいらなくてもどうにでもなる。

580:Socket774
09/09/13 23:19:19 lZW/KYYS
SPECは元々自分のソースを走らせる人間が参考にすべきベンチで
バイナリで買うソフトの参考としては疑問がある

581:Socket774
09/09/13 23:37:22 tMhawENg
どんなベンチにも限界はあるだけど、
ただ対処できる最低限のことに対処できていないから問題なんだな。
これまで汎用CPUにおけるSIMDは、おまけ機能の話だったのが、
最近になって、マルチスレッドと並ぶ、CPUの高速化の主役としてまじめな取り組みになってきたことに
SPEC CPU側の対応がおいついてない感じ。
SPEC CPU以前はDhrystoneやWhetstoneといったもっと出来の悪いベンチや理論MIPS値で
異なるアーキテクチャ間の性能比較が語られていたのだが、
ベンチマークも常に進歩する必要がある。
まあもっと酷いのがSPEC CPUのrate。
同じSPEC CPUのプログラムをスレッド数分起動しただけの手抜き作なのに、サーバ用CPUでマルチコアが普及してからは、
むしろrateの値が語られることが多くなってしまった。次期バージョンではマルチスレッド/スループット
評価用ベンチは全く見直されること必至だろう。

582:,,・´∀`・,,)っ-○○○
09/09/13 23:42:20 XYtvuRLk
SYSmarkで良いと思うんだけどね
SPECは元々サーバサイドプログラム用ベンチの性格が強いのでエンドユーザー向けじゃない。

583:Socket774
09/09/13 23:46:08 tMhawENg
SPEC CPUはサーバサイドじゃなくてEWSだろう。
PC向けとしては使わないアプリばかり。
RISC EWSが全盛をきわめたときがSPEC CPU自体も華だった。
サーバはやっぱTPC系。SYSmarkはシステムに依存してるから、異なるアーキテクチャの比較には使えない。

584:Socket774
09/09/13 23:50:02 WBXA4NEv
わしが見るのはSAP SDベンチマークだけ

585:,,・´∀`・,,)っ-○○○
09/09/13 23:52:35 XYtvuRLk
Intel・AMDのプロセッサ+Windowsでのシステム性能比較としてはSYSmarkほど優秀な比較基準はないと思ってる
まあエンドユーザーは各ゲームのベンチで良いと思うけどさ。


586:Socket774
09/09/13 23:53:40 tMhawENg
ああ、SAPがあったか。
実際の所、SPEC CPUは、RISCが生きていた時代には新しいCPUが出るたびにチェックしてたけど
2006以降は全くといっていいほど見てないな。マルチコアでわかりにくくなったってのもあるが、
x86以外がかなり壊滅したから他アーキテクチャに興味が薄れたってのもある。

587:Socket774
09/09/13 23:59:01 IU1FyGU9
SSEに最適化はおそろしく面倒臭い

588:Socket774
09/09/13 23:59:42 tMhawENg
ぶっちゃけ、新しいCPUがでると、ありとあらゆるベンチマークを走らされて、
世界中のオタクの厳しい評価の目にさらされ、数%の速度差にまで原因に議論が及ぶ
PC向けCPUが一番性能評価の結果が信用できる。
それに比べると未だに理論flopsみたいな過去の遺物をベースに語られるHPCなどは、
実は全く客観的評価の信用ならないジャンル。

589:,,・´∀`・,,)っ-○○○
09/09/13 23:59:46 XYtvuRLk
Googleのアレはどうよ?
クラウド(笑)用のベンチとしてはそこそこ判断基準になりそう

590:Socket774
09/09/14 00:29:32 UdvOk2GD
>>586
SpecCPU2006はx86とPowerとごく一部で富士通Sparcの結果が載るぐらい。

>>588
HPC関連はCAD CAEなどのエンジニアアプリのベンチがあると思ったけど
まあ、それもx86でのベンチ結果ばかりだけどね。
(この手のアプリは今でもRISCサポートしてるものがあるが、数年後には
 消えるのかな?)



591:Socket774
09/09/14 00:32:07 zVlYa+o5
アーキテクチャとしては小幅な変更だったので
Nehalemのシングルスレッドあたりの性能は
Yorkfieldからさほど変わらなかったけど
SandyBridgeで大きく向上する可能性ある?

端的に言うとSSEやマルチスレッド処理に最適化されてない
旧来のアプリケーションでも処理が早くなるのかどうか

592:Socket774
09/09/14 00:44:15 UdvOk2GD
デスクトップスパコン SX-8i
消費電力1.5KW なぜこんなに電気食うんだ?



593:,,・´∀`・,,)っ-○○○
09/09/14 00:44:55 7XYdvvzk
無いな。
ただこれまでにも商用ソフトのいくつかはライブラリ経由で透過的にSSEを使ってるから
それなりに効果はありそうだけどね。

たとえばSSE4.2のテキストサーチAPIはかなり恩恵が大きい。
Webサーバだったり高級言語のインタプリタに実装されればかなり性能向上が期待できる。

あと、CairoとかImageMagickとかの腐れプログラムがSIMD対応改善してくれると
オープンソースアプリも含めてすっげー恩恵受けるんだが

594:Socket774
09/09/14 01:11:38 zVlYa+o5
なるほど
The free lunch is overってのが
SandyBridgeでは加速するのか

でもこのままマルチコアとSIMDで
お茶を濁すだけでは先が行き詰るのは
見えてるからなんとかしないと
マズいのでは、となんとなく思う

シングルスレッドでも性能上げるなら
投機的マルチスレッディングだ、ってのを
どこかで見た覚えもあるけど立ち消えに
なっちゃったし今後どうするんだろうね

595:Socket774
09/09/14 01:20:15 T8S2OvwL
The proceccer manufacture is overが加速

596:Socket774
09/09/14 01:23:06 kPUAlzJA
>>592
別にこれで納得しろと言うつもりはないがこんなハードらしい

CPUは90nm 400mm2 2GHz、ピン数はべらぼう、
URLリンク(journal.mycom.co.jp)
メモリはこんなん
URLリンク(journal.mycom.co.jp)

597:Socket774
09/09/14 01:45:52 kPUAlzJA
>>596
おや? 数えてみたらピン数大したことないな
2004年のパソコンCPUよりは多いけど

598:Socket774
09/09/14 04:25:37 V6Vt4THg
しかし、フリーランチが終わるとなると、旧命令の切り捨ても迂闊には出来なくなるな
今までは、切り捨てとは言っても一時的な落ち込みで、長い目で見たら確実に高速に
なっていった訳だが、今後はそうも行かない
それが困るからといっても、シングル性能の向上は実際に困難な訳で…

599:Socket774
09/09/14 06:16:51 yC813vry
IPC維持しつつクロック自体は上がっていくんじゃないの?

600:Socket774
09/09/14 06:44:28 7HKvHHZq
たしかにCairoとかSIMD対応してくれると嬉しいなぁ。
64bitが来つつある事だし、メス入れねぇかな

601:,,・´∀`・,,)っ-○○○
09/09/14 08:24:25 7XYdvvzk
話題自体は出てる
URLリンク(lists.cairographics.org)

っていうか今の所pixmanにはSSE2までの対応入ってる

602:Socket774
09/09/14 08:34:32 Q8G1gwCY
>>593
ImageMagickは構造が腐ってるからなぁ。
対抗馬となりうるGEGLはGPUへの対応が進んでるもののそれ以外の開発が停滞してるし。
意外とFFmpeg辺りが全て飲み込むかもね。ペースはゆっくりだけど開発コミュニティは活発だし。

603:Socket774
09/09/14 10:16:24 mV/b73LP
pixmanをsse2有効にしてコンパイルしてみたけど
firefoxだけでは違いがわからない…

604:Socket774
09/09/15 00:02:49 LCH6GRBI
LynnfieldのTurbo Boostで下剋上なるか
URLリンク(pc.watch.impress.co.jp)

605:Socket774
09/09/15 00:09:39 fYGKe7DC
パル男はやはりIntel系だと良い仕事をする
総括も的確でそつが無い
凄まじいIntel愛を感じる
そんなパル男が好きだ

606:Socket774
09/09/15 00:37:40 QVy6eDQd
ついにゲルシンガーがクビか
オレゴン大丈夫か?

607:MACオタ>606 さん
09/09/15 08:30:46 Y6HvA9C9
>>606
これですか… EMCへ行った様です。
URLリンク(news.cnet.com)
  -------------------
  The Wall Street Journal reported overnight that EMC is expected to announce Monday
  that it is hiring Gelsinger to run its storage products business, along with some software units.
  -------------------

608:Socket774
09/09/15 11:55:07 7oDtDUjA
そんな、ゲルたんが・・・

609:Socket774
09/09/15 14:20:55 esRh0S5A
IDFの講演まではやるのかね

610:Socket774
09/09/15 15:36:16 DkXkPeg6
ゲルシンガーが居なくなって1~3年後に表面化してきそうなこと
・Itaniumが盛り返す
・Atomの開発ペースが上がる
・XeonMPが混乱する
・HSWが混乱する
・LRBが混乱する

611:Socket774
09/09/15 15:56:28 LGSSBbGg
1155ってトリプルチャンネルになるんかね

612:Socket774
09/09/15 16:34:07 vg5ToYav
ピン数を増やさなきゃ無理じゃね
仮に未使用のピンが相当あって数的には足りたとしても、Xeonがトリプルチャンネルの間は同じスペックにはしないと思う
それにトリプルチャンネルにすると多分4層基盤じゃ無理でマザーが高くなるんじゃないかね

613:Socket774
09/09/15 18:30:05 Zk1d8WFu
メモコンをCPUに内蔵する欠点として、メモリ仕様が固定化されて
しまい、メモリ仕様によりソケットの種類が増えてしまうというのがある。
LGA1155もデュアルチャネルさ。

614:Socket774
09/09/15 18:36:15 gM4Wbfmy
CPUソケットが増えるかマザーチップセットが増えるかで結局大差ないと思うがな

615:Socket774
09/09/15 20:04:03 B4g0KbsR
ゲルたんいなくなるのか、さみしくなるな

616:Socket774
09/09/15 20:34:11 vPEBZfNK
CPU開発でオレゴンチームとイスラエルチームの
インテル内における力関係はどうなるんだろうか

617:Socket774
09/09/15 20:41:27 YKBSvkU0
ゲルが次の社長だと思っていたので衝撃だった

618:Socket774
09/09/15 20:42:58 +7doGDHu
IAGの上級副社長の一人がイスラエルチームのトップだから、
イスラエルチームの方が主導権持つようになるのかな。
もう一人はマーケティング畑の人っぽいし。

619:Socket774
09/09/15 20:52:37 w0MRwKQ2
>>609
>なお、Intelはゲルシンガー氏が予定してした基調講演について、
>マローニ氏が代わりを務めるとすでに発表している。

>>616
>Perlmutter will lead product development and architecture.
URLリンク(www.nikkeibp.co.jp)

620:Socket774
09/09/15 20:53:37 w0MRwKQ2
・デスクトップ プラットフォーム事業本部(Desktop Platform Group)
・モバイル プラットフォーム事業本部(Mobile Platform Group)
・エンタープライズ プラットフォーム事業本部(Enterprise Platform Group)
・インテルコミュニケーションズ事業本部(Intel Communications Group)

・モビリティ事業本部(Mobility Group)
・デジタル エンタープライズ事業本部(Digital Enterprise Group)
・デジタルホーム事業本部(Digital Home Group)
・デジタルヘルス事業本部(Digital Health Group)
・チャネル製品事業本部(Channel Products Group)

・PCクライアント事業部 PCG(PC Client Group)
・データセンター事業部 DCG(Data Center Group)
・ビジュアルコンピューティング事業部 VCG(Visual Computing Group)
・ウルトラモビリティ事業部 UMG(Ultra Mobility Group)
・エンベデッド・コミュニケーション事業部 ECG(Embedded and Communications Group)
・デジタルホーム事業部 DEG(Digital Home Group)

621:Socket774
09/09/15 21:27:49 w0MRwKQ2
>>618
3年前から主導権握ってたって噂も・・・
URLリンク(itl.jisakuita.net)

622:Socket774
09/09/15 21:30:04 I8VBBuu/
インテルはそろそろ事業部の統廃合を沈静化すべきだろ
何回組みなおししてるんだよと

623:,,・´∀`・,,)っ-○○○
09/09/15 22:12:35 CtE/fxwg
>>611
DDR3はクロック(帯域)の伸びしろ大きいからデュアルチャネルで十分なんだってさ。


エデン先生の次回作にご期待くだしあ><

624:Socket774
09/09/15 22:20:49 GDckeg28
>>622
ときどきシャッフルしないと組織は腐るよ

625:Socket774
09/09/15 22:27:09 UIzxxCZs
大きい組織は否応にも大企業病に罹ってしまうものではあるが
できるだけ症状を和らげるように取り組み続けなければならない

626:Socket774
09/09/15 22:32:12 HgKherU6
俺の中では名前のインパクトでチャンドラシーカとのツートップでした
>>624
特に変化の激しく早いIT業界で大企業が組織を維持しつつ生き残るには必要不可欠かもな
IBMみたいに趨勢にあわせて注力する箇所と核を残して後はバンバン切り捨てっ手法もあるけど

627:Socket774
09/09/15 23:49:05 7NNBPyJA
386の父もとうとう退社かぁ。
もう彼がいなくても開発していけると踏んでのことだろうけどな。

628:Socket774
09/09/15 23:57:37 YbxjaKB9
URLリンク(pc.watch.impress.co.jp)
> 今回の組織改編とゲルシンガー氏の退任が関係しているかはわからないが、
> 1つだけ言えるのはこの退任が明らかに急遽決まったことだということだ。

ComputerWorldはこんなタイトルつけてる
> EMC、インテルの“ミスターx86”ゲルシンガー氏を引き抜く

629:,,・´∀`・,,)っ-○○○
09/09/16 00:04:57 CtE/fxwg
ゲルジンガーまだ48歳だって?
30年勤務、逆算したら18歳からだぜ
どんだけ

630:Socket774
09/09/16 00:11:48 QlYYyY4/
Intel、32nm世代のプロセッサ「Westmere」を間もなく発表
Intelは近く開催のIDFで、組み込み向けのNehalemプロセッサ「Jasper Forest」や、
32ナノメートルプロセスを採用した「Westmere」プロセッサを披露する。
URLリンク(www.itmedia.co.jp)

631:Socket774
09/09/16 00:16:07 OZmJe1wx
え、Nehalem-EXが今年の秋だって?

632:,,・´∀`・,,)っ-○○○
09/09/16 00:23:48 swplzWif
なに寝ぼけてる。Intel製品のシュリンクのサイクルはまだ2年切ってるぞ
10月か11月くらいだったと思う。


633:,,・´∀`・,,)っ-○○○
09/09/16 00:25:33 swplzWif
↑誤爆

634:Socket774
09/09/16 00:29:09 a+rFtpW+
おまえは何を言ってるんだ

635:Socket774
09/09/16 00:39:01 bZis0b2n
誤爆?

636:,,・´∀`・,,)っ-○○○
09/09/16 00:44:27 swplzWif
Intelの技術ニュース情報ってFacebookでも配信してるんだな
多すぎて追いかけきれない><



637:Socket774
09/09/16 05:27:05 /j6uRsAs
ここに書き込む時間を削ってですね

638:Socket774
09/09/16 14:52:30 ZHm5xyqR
2chに書き込まないと  死ぬ

639:Socket774
09/09/16 18:11:19 eMWztZDV
>>638
2chに書き込んでいる動画をとってだな
それを旨くつなぎ合わせてループさせれば
2chに書き込み続けなくても良くなるよ

640:,,・´∀`・,,)っ-〇〇〇
09/09/16 20:01:00 68p7s6pD
ICC11からHalf Floatと単精度の相互変換サポートしてんのな。
もちろんユーティリティ関数でソフト的にやってるようなんだが、

Larrabeeではハード的にサポートされた機能だし、
AMDはCVT16としてBulldozerに実装予定。

やぱ、それなりに需要あんのかな。

641:Socket774
09/09/18 18:47:47 IIy925z2
JasperForestのソケットがどうなるかが気になるなあ。
現状出てる情報だとPCIe/ESI/MC/QPIを搭載ということだから

・実はLGA1156にはQuickPathとESIのピンが予約してあるので、有効化して使う
・実はLGA1366にはPCIeとESIのピンが予約してあるので、有効化して使う
・全く新規のソケットを使う

このどれかだと思うんだけどな。

642:Socket774
09/09/18 19:46:18 zcyiwlUl
・ソケットではない

てのはないか

643:Socket774
09/09/18 21:00:51 txmnUyC0
1ソケット機から2ソケット機まで展開するって事だからソケットになるんじゃね?

URLリンク(www.tcmagazine.com)
JasperForestのダイ写真と言うことだが、LynnFieldともBloomFieldとも違う・・・なあ
URLリンク(journal.mycom.co.jp)

644:Socket774
09/09/18 21:40:47 ZfoUM3Z3
Lynnfieldのダイ写真を左右反転しただけのように見える
まあ、Lynnfieldでは潰されてるっぽいPCIeとは反対側の辺にあるQPIも
有効になってそうとか多少違いはあるっぽいけど

645:Socket774
09/09/19 01:25:29 d6VDSTib
> Lynnfieldのダイ写真を左右反転しただけのように見える

同意

646:Socket774
09/09/19 02:25:00 iFgK1Go0
じつはLGA1156はQPIピンやPCI-Express x1ピンを用意されてる可能性は高そうだな
シリアルだからピンは少ないし、小規模WSならLynnfieldコアをまんま転用したほうが楽

そもそも、メモリパッドがBloomfieldとLynnfieldと同じ、って時点で
いろいろあるんだろうなと思うが

Lynnfieldは、実はBloomfieldのスーパーセットなんでないだろか

647:Socket774
09/09/19 03:03:56 KJzxBL5j
なんでわざわざ一年かけて、1366 + 9xxと1156 + 8xxに
プラットフォームを分断しちゃったんだろう?
一年かけてCPU単体のTDPが130W→95Wに下がったのかもしれないが、
素人目には、最初から8xx + 1156一本で良かったように見える。

648:,,・´∀`・,,)っ-○○○
09/09/19 07:16:59 MIzPwNhB
1366は元々Xeon用

649:Socket774
09/09/19 09:42:54 Y+YCGM/i
Lynnfield、Havendaleは元々今年の初めにでる予定だったのが、
開発遅れや不況がからんで、LGA1156の登場がこの時期まで遅れただけじゃないの?

650:Socket774
09/09/19 11:36:18 PUzI+s5u
当初からデスクトップ用は1156の1本だったけど
メモコン搭載に苦戦して伸びたからサーバー用のプラットフォームを
デスクトップのハイエンドに降ろしてきただけ

651:Socket774
09/09/19 11:43:13 0fc0DVZW
メモコンで苦戦してたらBloomfieldも出せないだろ

652:Socket774
09/09/19 11:51:06 PUzI+s5u
メモコンじゃなくてMCH(GMCH)といえばよかったか

653:Socket774
09/09/19 11:56:17 0fc0DVZW
何だ釣りか

654:Socket774
09/09/19 17:37:05 Qup38NSO
なんとまぁ

655:Socket774
09/09/19 18:38:34 6wtrrtaB
既存のLGA775でなくてわざわざ高コストなLGA1366をデスクトップにも投入しなければいけないほど
競合他社の製品が優れていたということはなさそうに思うが、
ただパフォーマンス帯でLGA775を延命しすぎると新しく出るLGA1156が売れなくなるから、
しかたなしに投入を決めたのかな。

656:Socket774
09/09/19 19:45:08 a8dIKnaR
LGA1156だとCPUからはPCIeがx16一本になるから、
X48後継のプラットフォームとしてLGA1366を出したんじゃないの?

657:Socket774
09/09/20 01:05:25 +vnVU3zP
チップセットをCPUに同梱させるとM/Bメーカーが儲からなくなるから
ってのも要因じゃないの?

658:Socket774
09/09/20 01:06:14 fQCf+q8B
確かに1156だけにしてしまったら
拡張性が物足りないという不満が出そうではある

659:Socket774
09/09/20 01:51:23 EaLULMIr
でもSandy BridgeになってもCPU側のGPU用のPCIeは全く一緒だぜ?


660:Socket774
09/09/20 02:08:40 AbZM8eX1
多分、PCIe直出しの安定や互換性が取れなかったから遅れたでは?

独自仕様のQPIやDMIなら、仕様をまげて対応、ってのもできるが
PCIeは既に公開してる規格だからなあ

661:Socket774
09/09/20 03:06:54 f2xuFsnf
お前ら、たまにはスレタイを思い出してあげて下さい。
なんで現行版がそうなったかの推論など無意味。
現にこうなっているのだから、どうしようもない。
不毛だよ。

662:Socket774
09/09/20 10:28:36 5uzsAKBf
そう。剛毛さ。

663:Socket774
09/09/20 17:40:34 /Hdrbe5h
みんなパイパソが好きなんだろ。まあそれは有る意味次世代な訳だが。

664:Socket774
09/09/20 21:08:31 uKn/02Pa
( ^ω^)がるむたうんは何時出るんだお

665:Socket774
09/09/20 21:19:50 uKn/02Pa
Σ(;^ω^)がるふたうんでした

666:Socket774
09/09/21 19:57:51 5YXcfBTn
URLリンク(forum.doom9.org)
URLリンク(forum.doom9.org)

>A Cortex A8 uses about 0.2 watts, while an Atom with chipset uses about 15 watts. They're hardly comparable.
>
>From a test done a while back on H.264 decoding with all assembly code turned off, if a Core 2
>has a speed of "1.0" per clock, while a Cortex A9 has a speed of about "0.4" per clock, a Pentium 4 has "0.38", and a Cortex A8 has about "0.28", if I recall the numbers correctly.
>I don't know if the gap closes or increases with the addition of NEON, but the Atom
>has much much worse performance than the Pentium 4, so I would expect the Cortex A9 to trash the Atom clock-for-clock; even the A8 should beat it.

667:Socket774
09/09/21 20:02:24 X97h7XNa
>>666
CPUアーキテクチャスレに戻ってくれ
ARMが自作で使えるようになったらまた来てくれ

668:,,・´∀`・,,)っ-○○○
09/09/21 20:04:12 gVZrgLZ/
無茶言いやがるな

669:Socket774
09/09/21 20:17:29 5YXcfBTn
ARM targets Intel with 2GHz multicore chips
URLリンク(news.zdnet.co.uk)
>"The sweet spot for most customers is dual-core," said Schorn, "but the base design can go up to quad-core and some partners are already building those.
> Eight way is coming. Everyone's high-end roadmap is putting down more cores, and we do that. We're headed in the direction of Intel's mainstream processors.
> We have other plans that surpass the current performance, and we'll intercept Intel in a high-margin area, not just with Atom."

670:Socket774
09/09/21 20:21:24 5YXcfBTn
>>667
2009年は「自作組み込みパソコン」元年になる
URLリンク(itpro.nikkeibp.co.jp)

671:Socket774
09/09/21 20:21:57 fEEjPmyn
>667
つarmadilo-9

最近、色々な非x86自作あるよな
組み込み向け開発とか工場の自動制御装置開発とかで

やぱPCライクな環境のほうが開発しやすいんかな?

672:Socket774
09/09/21 20:23:27 X97h7XNa
BeagleBoard出して来てどうすんだ…
ヨタ記事かどうかの見分けぐらいつくようになれ

673:Socket774
09/09/21 20:26:48 tflUMHVt
ヨタ記事つーか自分とこの雑誌の宣伝じゃないの

674:,,・´∀`・,,)っ-○○○
09/09/21 20:31:16 gVZrgLZ/
URLリンク(d.hatena.ne.jp)
製品レベルになるとスペックしょぼいんですが


A9の2GHzのデュアルコアさっさと出せよボケ
1GHzのクアッドすらまだだったよな
出る出る詐欺にも程がある


675:,,・´∀`・,,)っ-○○○
09/09/21 20:35:34 gVZrgLZ/
ARMネットブックのNetWalker(PC-Z1)は800MHzのシングルコア搭載で4万5千円。
他のネットブックの方が安いし速い。もの好き以外買う価値なし。

676:Socket774
09/09/21 21:22:11 HD0I1D/p
速さだけが重要なカテゴリじゃないだろ

677:,,・´∀`・,,)っ-○○○
09/09/21 21:42:22 gVZrgLZ/
SSDの容量も4GB
Windowsが動かない
Wineも動かない

ぶっちゃけZaurusの再来程度にしか思ってないんだが、SHARPは勇敢を通り越して無謀


ネットブックの売れ筋も8.9インチから10インチ~12インチにシフトしてる
キーピッチが狭い・画面小さいってのは使い勝手を低下させるからな

678:Socket774
09/09/21 23:07:36 HD0I1D/p
ネットブックが大型化に向かおうとしてるからMIDの隙間が広がるんでしょ
別にネットブックとして出したいわけじゃないし

679:,,・´∀`・,,)っ-○○○
09/09/21 23:08:57 gVZrgLZ/
まあニッチマーケットだな

680:Socket774
09/09/21 23:19:16 HD0I1D/p
それは否定しない

681:Socket774
09/09/21 23:19:39 X97h7XNa
iPhoneなんかも入れていいならニッチっつーわけでもないと思うけど、
まぁどうでもいい

682:Socket774
09/09/21 23:20:16 stujpaDM
なんだかんだで3G携帯電話最強すぐる

683:Socket774
09/09/22 00:36:13 EYdfUUi9
IDF Fall 2009 Preview - Nehalemの組み込み派生型「Jasper Forest」の直前情報
URLリンク(journal.mycom.co.jp)

684:Socket774
09/09/22 02:52:14 YWWACyxs
> おそらくダイの表から撮ったか、裏から撮ったかの違いで細かな形状が違って見えるのだろうが、

へえ、ダイの裏から写真撮れるんだね

685:Socket774
09/09/22 03:14:19 VbbuyuEx
Intelスレではスレ違いだが
自作板に非x86のスレが一つくらいあってもいいような気はするけどな

686:Socket774
09/09/22 03:40:16 4yXNFhhR
そう思うなら自分で建てて盛り上げろ

687:Socket774
09/09/22 04:04:59 L7N2kLwc
非x86ならHW板が妥当
アーキテクチャスレでやればいいと思うけど

688:Socket774
09/09/22 05:01:38 XCLmUi20
なんかGulftownのダイサイズが260mm2程度あるんだが
見間違いか、それしか縮まなかったのか

689:Socket774
09/09/22 11:52:34 a/cmY52b
カーナビにIntel CPU採用されるはいつか。

690:,,・´∀`・,,)っ-○○○
09/09/22 12:03:21 CYxqPFZT
XscaleのときにSONYのカーナビに使われてましたよ。
三菱みたいな強いとこは難しいと思うが、少量生産ならMoorestownにも強みはある。

691:Socket774
09/09/22 13:10:27 CRX/9xsf
ソニーのカーナビはMAPLUSの声優ナビ機能をつけるんだ

692:,,・´∀`・,,)っ-○○○
09/09/22 18:48:17 CYxqPFZT
>>688
コア6個だから上出来でしょ。

4コアなら200切るんでない?

693:Socket774
09/09/22 19:30:56 gkNAarae
Westmereはほぼシュリンクしかされてないんだから4コア出されてもな

694:Socket774
09/09/22 21:05:46 XajXPZF8
デスクトップ向けの1366はガルフタウンで終わりだよね?
サンディ以降のハイエンドプラッフォームどうなるんだ?

695:Socket774
09/09/22 21:37:38 GU1HhLsy
>>694
1365とか、そんな感じで

ハイエンドはワークステーション・DPサーバと共用、
メモリ速度を抑えてチャネル数を増やして大容量メモリ
を積めるようにするから、LGA1155とピン互換ではない。

Sandy世代もメモコン内蔵DDR3で逝くから、ピン数は増えない。
QPIの仕様も同じ。DPサーバとワークステーションで同じCPUを
使う関係で、PCIe16xはチップセット側に来る(CPU内には来ない)。

696:Socket774
09/09/22 21:47:14 WVB6aPom
Gulftownの価格と性能が判明してきたらかなり荒れそう

697:Socket774
09/09/22 21:50:18 d3DcL/ec
32nm Xeonが普通に1366で使えたら、普通に1156はいらない子になるな。

698:Socket774
09/09/22 22:22:34 +iunPblR
は?

699:Socket774
09/09/22 22:42:41 akFi9C22
Xeonが下は3000円から上は54800円までずらりと2000円刻みで20モデルぐらい展開するんなら
要らない子になるんじゃね?

700:Socket774
09/09/23 03:05:22 G/uBziyQ
ついったー@本田雅一

インテルは、すでに動作する22ナノのウェハを披露。詳細はPC Watchで笠原君がレポートすると思います
IDFではサンディブリッジの実働品でデモを行ってます<基調講演

701:Socket774
09/09/23 03:16:28 UdRkhkNx
Sandy Bridge will feature a sixth generation graphics core on the same die as the processor core and includes
AVX instructions for floating point, media, and processor intensive software

702:Socket774
09/09/23 03:23:46 UdRkhkNx
Intel is also researching 3-D Chip Stacking and other ways to integrate for
high density chip to chip connections,
small form factor and the ability to combine dissimilar technologies.

703:Socket774
09/09/23 04:58:02 OD8TN0ZT
Stackingはまだ実用までは遠いか

704:Socket774
09/09/23 05:02:13 /C380YQW
>>701
ノート用が軸だから、グラフィック入れるのか

705:Socket774
09/09/23 05:32:06 OD8TN0ZT
on the same die ってとこが思い切ったな

706:Socket774
09/09/23 06:07:04 BP8B/lwo
IDF 2009 - Intel Shows off 22nm & 32nm, Sandy Bridge Demoed
URLリンク(www.anandtech.com)

707:Socket774
09/09/23 07:53:33 UdRkhkNx
Westmere_wafer
URLリンク(www.intel.com)

708:Socket774
09/09/23 08:07:04 UdRkhkNx
Clarkdaleのダイだ

709:Socket774
09/09/23 08:09:23 BP8B/lwo
>>707
Clarkdale用のDual Coreかな?

710:Socket774
09/09/23 08:10:37 BP8B/lwo
被ったすまん

711:Socket774
09/09/23 10:34:29 +TN+s6kb
GPU混載は絶対無いと言ってた奴はどこに行った?

712:Socket774
09/09/23 11:02:57 h6gL3Lzj
俺のことか
「絶対ないよ」

713:Socket774
09/09/23 13:07:35 jeltHUBj
>>711
ノシ
市場に出るまで言い続けますんでよろしく
URLリンク(stream.4gamer.net)

714:Socket774
09/09/23 15:03:27 ogk7vUTM
>>704
3.8GHzのノートですか…w
ノートとか関係なしにメインストリームは2チップソリューションにするってだけでしょ。


715:Socket774
09/09/24 00:35:49 cLjUOjp6
Intel kicks off 32nm processor production
URLリンク(www.tcmagazine.com)
>Posted by: Cristian on September 14, 2009 16:48
>There's about one more week to go until the IDF 2009 conference in San Francisco
> and Intel has reached a major milestone by starting production of its first 32nm processors.
45nmプロセスの量産開始が07/10/25?辺りだったのでシンプルなTick-Tackモデルと比較すると1ヶ月ほど早い立ち上がり。


URLリンク(partner.alsi.kz)
・Nehalem-EXのモデルナンバーとスペック等。
・FBD2はQPIベースっぽいな。
 6倍速, 1/4幅(16+4bit)のバスだとするとFBD2-4chはDDR3-6ch相当。
 こんな感じか。

  [IMC] ─ 9.6~12.8GB/s ─ [AMB2(Mill Brook)] ─ 6.4~8.5GB/s ─ [DDR3]
   │                    └─── 6.4~8.5GB/s ─ [DDR3]
   ├─ 9.6~12.8GB/s ─ [AMB2(Mill Brook)] ─ 6.4~8.5GB/s ─ [DDR3]
   │                    └─── 6.4~8.5GB/s ─ [DDR3]
   ├─ 9.6~12.8GB/s ─ [AMB2(Mill Brook)] ─ 6.4~8.5GB/s ─ [DDR3]
   │                    └─── 6.4~8.5GB/s ─ [DDR3]
   └─ 9.6~12.8GB/s ─ [AMB2(Mill Brook)] ─ 6.4~8.5GB/s ─ [DDR3]
                         └─── 6.4~8.5GB/s ─ [DDR3]

 メモリバンド幅は38.4~51.2GB/s (DDR3-6ch相当)でメモリのキャパシティがDDR3-8ch相当(16枚)になると。

716:Socket774
09/09/24 00:39:35 cLjUOjp6
IDF 2009 - World's First Larrabee Demo, More Clarkdale, Gulftown
URLリンク(www.anandtech.com)
・表題の通りLarrabeeの動作デモがあったわけだが、、、
 "Larrabee rendered that image above using raytracing, it's not running anywhere near full performance"という注釈がついている。
 あくまでも「ちゃんと動くものがあるよ。開発は順調だよ。」というアピールに過ぎないということで、、、
 他社の競合する製品と比較する意図は無いみたいだ。おひさるてきには。

・Clarkdaleについて。
 "There's also on-package 45nm Intel graphics, which I've heard referred to as finally "good enough" graphics from Intel."
 パッケージレベルで統合されるグラフィックスコアの性能は満足できるものになりそうだと。(やっとIntelからまともなIGPが出てきた。)


 ルーマー(希望的観測)→公約 へなったネタ2つ。(既出かも
・"The demo was nothing more than proof of functionality, but Sean Maloney did officially confirm
  that Larrabee's architecture would eventually be integrated into a desktop CPU at some point in the future."
 Larrabeeもその内CPUに呑み込まれると。

・BloomfieldからGulftownへのアップグレードについて。
 "Compatibility is going to be the big story with Gulftown:
  it will work in all existing X58 motherboards with nothing more than a BIOS update."

717:Socket774
09/09/24 00:40:57 cLjUOjp6
New Larrabee silicon taped out weeks ago
URLリンク(www.semiaccurate.com)
>Plagues of bugs quashed
一通りデバッグの終わったB0シリコンが8月15日にテープアウトしていたと。

Larrabee breaks cover at last
URLリンク(www.semiaccurate.com)
>As we said earlier, B0 silicon, the bug fixed Larrabee, taped out a month ago, and would possibly be shown at IDF.
>
>Sadly, it has not come back from the fabs yet, so the demo was running on Ax silicon, most likely A6.
でもIDFには間に合わなかったよ、と。

/ そいえば、(時期的にAxシリコンの時点で)GTX 285並の性能があるという噂が出てたな。
/ URLリンク(www.tcmagazine.com)
/ >The latest Larrabee rumor is that the current samples can deliver performance comparable to Nvidia's highest-end single-GPU offer,
/ > the GeForce GTX 285.
/ Anandの記事と併せて読むと・・・ wktk

718:Socket774
09/09/24 00:45:25 cLjUOjp6
ん、h抜き忘れてた。

719:Socket774
09/09/24 01:08:36 ERUNJgmy
Larrabeeに有利なBestケースで285を越えられない、と解釈するのは意地が悪いか。
でもCPUのメモリモデルに縛られている限り
GPUの性能向上曲線に追い付けない構図が確かにある気がするぞ。

720:Socket774
09/09/24 01:12:41 T8IJkI3d
Content catalog
URLリンク(intel.wingateweb.com)

いくつかダウンロード可能になってるね

721:Socket774
09/09/24 01:47:34 iV3SgQaa
それじゃ40nm 334mm2の5870にボロ負けだな
倍近くダイサイズあるのに。
2TFlopsじゃ演算性能ですら負けてるからしょうがないか

722:Socket774
09/09/24 02:00:01 T8IJkI3d
ARCS002
How To Optimize Your Software For The Upcoming Intel(R)
Advanced Vector Extensions (Intel(R) AVX)

p.6 Sandy-Bridgeのブロック図
気になるのは port-0のAVX-HIGHとport-1のAVX-LOW
256bitを2つの128bitに分割して実行するのだろうか
だとすると現在とパフォーマンスは殆ど変わらない
可能性もある

>>478のIACAのモデルになっている架空のCPUでは
Nehalemベースにfp-add/mul/shuffleを256-bitにした構成だった

723:Socket774
09/09/24 02:11:26 BPJnjXA+
いろいろ統合しちゃって大丈夫なの
なんか、コケそうな匂いがするんだけど

724:Socket774
09/09/24 02:13:05 Q3LcmNtC
ちむなをバカにすんな

725:Socket774
09/09/24 02:20:11 sLGHvAep
>>722
SSEを64bit x2で処理してた期間を考えると妥当じゃないか。
AMDがいきなり256幅でやるCPU出してきたら対応するだろうけどさ。

726:Socket774
09/09/24 02:29:38 ERUNJgmy
Si貫通電極がポツポツと実用化されてるが
リスクを負ってもMCMを避ける理由がIntelにはあるんだろうな

727:Socket774
09/09/24 07:41:04 T8IJkI3d
Intelのサイトで質問している人がいた
URLリンク(software.intel.com)

Mark Buxton (Intel)の回答
> The chart is wrong, we will fix it. Sandy Bridge has true 256-bit FP
> execution units (mul, add, shuffle). They are on exactly the same
> execution ports as the 128-bit versions. You can get a 256-bit multiply
> (on port 0) and a 256-bit add (on port 1) and a 256-bit shuffle (port 5)
> every cycle. 256-bit FP add and multiply bandwidth is therefore 2X higher
> flops than 128. See IACA for the ports on an instruction-by-instruction basis.

適当訳
 図は間違っている 修正する
 FPユニットは256-bitで-128bitバージョンと同じ配置
 port 0: 256-bit fp-add
 port 1: 256-bit fp-mul
 port 5: 256-bit fp-shuffle



Conroeのブロック図が間違っていたことがあったな
URLリンク(pc.watch.impress.co.jp)
URLリンク(pc.watch.impress.co.jp)

728:Socket774
09/09/24 15:24:23 2RsSE6LX
15nm以降も「ムーアの法則」を維持する
URLリンク(pc.watch.impress.co.jp)

すべては22nmのために。次世代プロセスに向けて準備を進めるIntel
URLリンク(pc.watch.impress.co.jp)

729:Socket774
09/09/24 15:47:52 WedKA8Gw
32nmの出荷よりも前に22nmのSRAMか。
プロセス開発はみるからに好調って感じだな

しかし22nmパターンを波長193nmの露光で作ってるってのは
素人からみると驚きだ

730:Socket774
09/09/24 16:13:16 NQdWO/0I
32nmのSRAMウェハも2年前のIDFで公開されてるから予定通りだな
IBMも去年に22nmのSRAMを作ったけどウェハは見せてないし

731:Socket774
09/09/24 16:36:33 Zp/ZqY3w
Sandy Bridge
URLリンク(pc.watch.impress.co.jp)

732:Socket774
09/09/24 16:39:36 2n+4u0jc
32nmプロセスのアピールも凄い
他のあらゆる32/28nmプロセスより高性能高密度
URLリンク(download.intel.com)
この自信はマグニチュード8くらいあるな

733:Socket774
09/09/24 19:15:21 YTMF1bFm
クアッド32nmのSandyBridgeが2011年Q1で22nmのIvyBridgeが2011年内か
買い時に迷うな

734:Socket774
09/09/24 19:30:37 GqSvaxkL
Clarksfieldのレビュー。
URLリンク(www.anandtech.com)
C2Qより高性能で省電力。

Intel shows Larrabee doing real-time ray tracing
URLリンク(techreport.com)
>Intel didn't discuss a precise release time frame, but last we heard, Larrabee was due to ship early next year.

シリコンフォトニクス?オプティカルの実用化が迫る。2010年中にサンプル出荷。
URLリンク(techresearch.intel.com)
>Light Peak consists of a controller chip and an optical module that would be included in platforms supporting this technology.
>The optical module performs the conversion from electricity to light and vice versa, using miniature lasers and photo detectors.
>Intel is planning to supply the controller chip, and is working with other component manufacturers to deliver all the Light Peak components.
心臓部である電気→光/光→電気の変換を行うモジュールは他社任せ、と。(汚いなさすがIntelきたない
まあSATAやUSBで10Gbps以降が見えてきたのは朗報。

735:Socket774
09/09/24 19:51:06 XugWC1PL
>>電気→光/光→電気
レイテンシどんだけ

736:Socket774
09/09/24 20:21:34 0/M0Dx/E
光ネットワーク事業の一部は2年前Emcoreに売却済みだった

737:Socket774
09/09/24 22:16:30 dh3L/Pte
光配線もようやく形になってきたのか
スパコンや高性能サーバーからだろうし
PCに降りてくるのはまだまだ先なんだろうけど
徐々に置き換えていってPCでもチップ間全て
光で接続する時代が来るかもしれないんだな

738:,,・´∀`・,,)っ-○○○
09/09/24 22:31:44 Jgvf5I8y
上下128ビットが交わる演算が基本的に無いあたり、AVX-HIGHとAVX-LOWに分割するってのも
あながち間違いじゃない希ガス。たとえば1クロックずらすとか

ただ、ポート構成がどうなってるかってのは別問題で。

739:Socket774
09/09/24 22:38:14 GqSvaxkL
元のURLを読めばわかるが、Light PeakはPCの周辺機器の接続を前提とした安価なソリューション。
サーバー向けだともうFibreChannelや10GbEで既に光が使われている。
ソケット間の接続や同じダイ上のコア間の接続に光を用いるのが(広い意味で)次世代の研究。

740:,,・´∀`・,,)っ-○○○
09/09/24 22:55:20 Jgvf5I8y
ちなみにAMDは既報通りならFMA128×2+PERM128という構成
SSE5の演算ユニットを大した変更しないまま使ってる
256ビット化する余裕なんてない

新命令のFMAやIMACを積極的に使うことで性能が伸びる感じやね。
PMADDWD+PADDDみたいな殆ど使わなそうな融合演算までサポートしてるのは要するにそういうこと。
AVXの部分だけの性能だとAMDは不利な可能性高いな

741:Socket774
09/09/25 03:57:29 hyHegI17
団子ちゃんの予想 はずれたねえ
まあ良いニュースな訳だが

loadに関してはユニット自体は32bytesでロード可能だけど
L1の帯域が48bytes/cycleでネックとな

742:,,・´∀`・,,)っ-○○○
09/09/25 07:39:59 eOGmZLYb
スカラ演算主体の場合は256bit×1よりは128bit×2のほうがスループット上がる
まあ、その辺どう調理するのかは見物だな

743:Socket774
09/09/25 10:26:55 agYtyo6D
ふゅーじょん!ふゅーじょん!

744:Socket774
09/09/25 15:31:49 Cv8/DMCZ
300mm^2くらい? Clarksfield(Lynnfield)
URLリンク(pc.watch.impress.co.jp)

745:Socket774
09/09/25 23:36:19 Wb9nZjbo
IntelがClarkdaleのベンチマークデータを公開
URLリンク(pc.watch.impress.co.jp)

【IDF 2009レポート】ダディ・パルムッター氏基調講演
~Nehalemアーキテクチャの新モバイルプロセッサ
URLリンク(pc.watch.impress.co.jp)

インテル、Atomベースの家電向け新型メディア・プロセッサを発表
URLリンク(www.computerworld.jp)

インテル、32nm次世代クアッドコアXeonを前倒しで投入へ
URLリンク(www.computerworld.jp)

746:Socket774
09/09/26 14:47:50 2Eb2RNPX
あれ、32nmのクアッドってこんなに早く出るんだ。
デスクトップ用は出ないの?

747:Socket774
09/09/26 17:18:54 KiCvOpSq
Westmere-EPは6-coreじゃなかったのか・・・。
4-core版もでるということか?

748:Socket774
09/09/26 17:25:37 uv6rawWB
Xeon 5000系にも2コア版があるから、それとおなじようなローエンド向けバリエーションじゃない?

749:Socket774
09/09/26 17:29:49 J31EhfIg
このサイトは面白い記事も多いが間違いも多い

750:Socket774
09/09/26 19:48:25 GBG7J+WH
なんだよ6コア買おうと狙ってたのに周波数低いのね・・・どうすっかなー

751:,,・´∀`・,,)っ-○○○
09/09/26 20:46:00 FqUneIa2
AESアクセラレーションの需要を読んで低価格帯から先行投入と見た。


752:,,・´∀`・,,)っ-○○○
09/09/26 20:52:53 FqUneIa2
とりあえずSandy Bridgeはvpermil2psが無くなったことでパフォーマンス設計が総崩れなんだが俺的に
256ビットSIMDって用途限られるなオイ

























GPGPU(笑)よりはマシだけどな


753:Socket774
09/09/26 23:40:49 1o+VEWHU
GPGPUが使える局面なら256bitどころではないしね

754:,,・´∀`・,,)っ-○○○
09/09/27 00:01:31 FqUneIa2
これどう思う?
URLリンク(software.intel.com)


ちょっとコード書いてみたら、SSE4.1でも3倍速((Core 2@x64)くらい弾き出せることが解った。

Sandy Bridge世代ではどのみちstoreが128ビットだから <4X っていう縛りがあるんで
いくら256bit(と言う名の128bit×2並列)版Permuteで頑張っても伸びないものは伸びないし

というより、permuteがネック

755:Socket774
09/09/27 05:47:48 MtP8DQpt
Turbo boostってIntelの公式クロックアップだとしか思えなくなってきた
つまるところ、表に出てるクロックはIntelの最低保証クロックで、
Turbo Boostで常に2Bin上がってるか、上がらないかってのは
チップの当たり外れや冷却性能に依存するのかも

PCWatch出誰かが微細化すればするほどチップ間の性能のばらつきが出る、
っていってたがもしかしてこれが絡んでる?

756:Socket774
09/09/27 06:01:10 1X77UB7o
>Turbo boostってIntelの公式クロックアップ
それ以外の何なのさ
以下別スレ引用
ちなみにIntelのデータシートではターボブーストは基板設計完全透過がウリのようだぜ。
マザーボードの基板設計者からターボブーストの存在は全くみえないし、考えなくてもいいことになってる。

757:Socket774
09/09/27 06:29:50 MtP8DQpt
だとすると、今まで以上に冷却性能が大事ってことなのね
常時ブースト状態を保つためには。

そうすると、遅ればせながらケースやCPUファンの冷却性能が
今後とんでもなく性能を左右することになるんだなとカ思ってしまう

758:Socket774
09/09/27 06:48:46 7wBQ50cX
マルチコアで全部のコアのクロックあげると消費電力で悲しいことになる
一部のコアだけクロックあげるだけなら消費電力の増大が抑制されるので
電源容量と放熱の両面でまだ何とかなる場合のこすっからい一策

759:Socket774
09/09/27 06:52:48 FLnw/7Yu
色々な見方があるがNehalemで導入されたものの中でも3指には入る重要な機能

760:Socket774
09/09/27 07:05:22 MtP8DQpt
>>758
それでも、最終的に計算が速く終わるなら消費電力の収支は会ってることになるぞ?
たしかNehalem世代では消費リソースと性能向上は1:1以下でないと認可されてないはずだから

761:Socket774
09/09/27 09:35:15 1X77UB7o
>Intel Turbo Boost Technologyが、CPUコアだけに対してだけでなく、内蔵GPUにも適用されることだ。
impressの記事より引用

今後はチップセット等intel系のシステム全体で電力管理して
オーバークロックを許容する流れになるんじゃない?
電力管理技術がまさかシングルスレッドの助けになるとは以前は思いもしなかった

762:Socket774
09/09/27 11:00:51 x/R9V5LW
Turbo Boostはマルチコア化を進めるためには必須の機能だと思う。
これが無いと、コア数が増えるほど、シングルスレッド性能が落ちることになる。

763:Socket774
09/09/27 11:56:27 ZO4bjwSd
TurboBoostは、なぜか性能向上ファクタと見なされているが、
ありていに言って、全コア負荷時クロックダウン のことだわな

 高性能冷却機構は金かかるから手抜きします
 そのために全コア働かせる時にはクロック下げます

764:Socket774
09/09/27 12:07:54 Dy9idI82
冷却だけじゃなくて、供給電力の問題もあるんだし、
全コアTBの最大値で動かすなんて無理だろう。
少数のコアのクロック上げたり、パイプラインの充填率低いなら、
全コアのクロックを少し上げたりと、一定の制限の範囲内で
性能を最大限に出せるよう工夫する技術なんだから。

765:Socket774
09/09/27 15:41:41 QF+9EJTH
>>763
>全コア負荷時クロックダウン
これマルチコア化の大前提じゃん。いちいち言うことじゃない。

クロック向上できなくなったからマルチコアが出てきて、
今までは1コアあたりのクロックを抑える代わりにコア数で性能向上を維持した。
しかし1コアしか必要ないときはTDPの範囲内で本来のコア性能を出すのがTBだろ。

766:Socket774
09/09/27 15:53:25 ZO4bjwSd
低レイテンシメモリを大量に繋ごうとしたらコスト高になるから
安く上がる方法で誤魔化します →キャッシュメモリ

全コアフルスピードに耐える冷却や電源はコスト高になるから
安く上がる方法で誤魔化します →たーぼぶーすと

767:Socket774
09/09/27 16:01:30 Dy9idI82
そもそも全コアフルスピードというのが何を意味するのかわからないな。
冷却・電源にコストをかけて上限をあげたら、TBでまたクロック上げる余地が出てくるだけかと。

768:Socket774
09/09/27 16:35:12 QF+9EJTH
>>767
流れからして物理的な限界を想定してそう。
現実的なTDPの枠内でやりくりするという考えがありそうにない。

769:Socket774
09/09/27 17:46:00 np98jzow
Core2 Q9400よりclarkdale 3.33GHzのほうがずっと速いみたいだし、
一般向けはシングルコア(with HT)の高クロック品でよくね。

770:Socket774
09/09/27 18:26:56 Q4bhANl3
>>769
ソースは少し古い記事だが、
URLリンク(www.ne.jp)
ダイサイズが同じと仮定した場合のマルチスレッド効率による性能変化グラフ。
URLリンク(www.ne.jp)

1core/4threadがTejas頓挫により存在せず、4core/4threadはAtomのマーケティング上厳しいと考えると
Clarkdale(2core/4thread)の原理的な優秀さがよくわかる。

771:Socket774
09/09/27 19:36:53 ZO4bjwSd
>>768
×現実的なTDP
○現実的なコストで賄えるTDP

772:Socket774
09/09/28 00:04:19 gtT/COqG
元麻布春男の週刊PCホットライン
Turbo Boostがもたらす選択の難しさ
URLリンク(pc.watch.impress.co.jp)

【IDF 2009レポート】エリック・キム氏基調講演
~TV向けSoC「Sodaville」ことAtom CE4100を発表
URLリンク(pc.watch.impress.co.jp)

【IDF 2009レポート】AtomプロセッサコアのSoCがついに登場
URLリンク(pc.watch.impress.co.jp)

773:Socket774
09/09/28 00:11:45 otyNFB9G
Tolapai(EP80579)やCanmore(CE3100)は大失敗でFA?

774:Socket774
09/09/28 00:22:22 J7aDeXkE
検索してみると、EP80579は採用した製品があるようだから、
少なくとも大失敗ってほどでもないんじゃないの?
CE3100の方は東芝、Samsungが採用予定で製品出てないし、
製品出るときにはCE4100になってるかもしれないけど。

775:,,・´∀`・,,)っ-○○○
09/09/28 00:23:15 L7aVFlKw
AppleのiTVがあのザマだからな

まあIPRNCとかの高密度ブレードサーバなんかでそれなりに使われたが





776:Socket774
09/09/28 00:30:01 6u1EdRZc
こっちが軌道に乗るまでネットブックは止められないな

777:Socket774
09/09/28 00:31:54 P7DIv/gP
なかなか手厳しい

笠原
>開発コードネーム“Canmore”(ケーンモア)ことIntel Media Processor CE3100は、(中略)
>日本や米国では今のところ搭載した製品はリリースされていない。

福田
>Intelはテレビ受像機のベンダーやセットトップボックスのベンダーにマイクロプロセッサ
>以外のASSPを販売した経験がないとみられることから、SoCの販売は簡単ではないだろう。
>ASSPビジネスでは、開発者向けにはIDFとは違ったタイプの活動が求められる。製品分野別
>に開発者(潜在ユーザー層)を集め、製品情報や開発情報などを適切に伝える必要があるのだ。

778:,,・´∀`・,,)っ-○○○
09/09/28 00:36:25 L7aVFlKw
可能な限り安い石を載せて原価を抑えたい国内メーカー(Celeron人気も道理)が
そう簡単に採用するわけないべ

東芝はチャレンジャーにも程がある。


779:Socket774
09/09/28 01:21:49 H9ReHcPW
UniPhierとかと競合する市場?

780:,,・´∀`・,,)っ-○○○
09/09/28 01:26:55 L7aVFlKw
基本的にx86なOSを使いたいネットワーク機器向けだな


781:Socket774
09/09/28 01:40:13 vvKRY/FL
>TurboBoostは、なぜか性能向上ファクタと見なされているが、
>ありていに言って、全コア負荷時クロックダウン のことだわな
馬鹿過ぎて話にならん

782:,,・´∀`・,,)っ-○○○
09/09/28 02:50:32 L7aVFlKw
ターボブーストそのものはモバイル版Core 2 Extreme/Quadにも載ってる機能なんで。
つーか、モバイル版はかなり微妙なラインナップだな

【Penryn-QC】
QX9300 2.53GHz*4 / TDP55W / 2.8TGHz*4
Q9100 2.26GHz*4 / TDP45W / 2.53TGHz*4
Q9000 2GHz*4 / TDP45W / 2.26TGHz*4

【Clarksfield】
i7-920XM 2.00GHz*4 / TDP55W / 2.26TGHz*4/2.26TGHz*3/3.06TGHz*2/3.20TGHz*1
i7-820QM 1.73GHz*4 / TDP45W / 2.0TGHz*4/2.0TGHz*3/2.80TGHz*2/3.06TGHz*1
i7-720QM 1.60GHz*4 / TDP45W / 1.73GHz*4/1.73GHz*3/2.40GHz*2/2.80GHz*1

演算ユニットの競合率が高いとHTによる性能向上率も低くなってしまうので
4コア全部使い切れるようなケースでは、場合によってはクロックが落ちた分だけ性能ダウンになりかねない。
ただでさえL2は小さいしL3は高レイテンシなので同クロックでも性能下がるケースは多々有るはず。

783:Socket774
09/09/28 06:28:21 a96R4PUt
>>772
元麻布の記事はCPU購入選択にしか触れていないが、
ソフト開発者にも難しさは生じるんじゃないか?

あえてシングルコアしか使わない状態を狙ったコーディングをした方が
使用時の快適さが優れている、という処理もあるのではないか

784:Socket774
09/09/28 06:37:27 nLc0BeQ7
なわけねー

785:Socket774
09/09/28 07:34:25 KQ+k4qQa
>>782
なんかClarksfieldのクロックは最低保証クロックで、
実際は4コアフル稼働でも冷却やTDPが追いついてるうちは
ガンガンクロックアップするみたいなことがあるみたいだが

つまり、920XMでは、2.0Ghzが最低保証クロックで、2.26Ghzが実駆動クロックと

要するに、ノートPCの冷却系の設計が今まで以上に性能を左右する、という
各メーカーの技術力が性能と売り上げを左右するって事かも

でも、Arrandaleのクロックを見てると、下手するとArrandaleのほうが高性能な局面が出てきそうな気配が

786:Socket774
09/09/28 07:37:43 KQ+k4qQa
もしかすると、Clarksfieldではなく、高クロックのArrandaleをハイエンドに置く
ノートPCが出てきてもおかしくないな、とは感じてる

◇Core i7(Arrandale / 32nm / 2-core 4-thread)
  620M 2.66-3.33GHz L2=256kB x2 / L3=4MB TDP35W $332
  640LM 2.13-2.93GHz L2=256kB x2 / L3=4MB TDP25W $332 LV
  620LM 2.00-2.80GHz L2=256kB x2 / L3=4MB TDP25W $305 LV
  640UM 1.20-2.26GHz L2=256kB x2 / L3=4MB TDP18W $305 ULV
  620UM 1.06-2.13GHz L2=256kB x2 / L3=4MB TDP18W $278 ULV

◇Core i5(Arrandale / 32nm / 2-core 4-thread)
  540M 2.53-3.06GHz L2=256kB x2 / L3=3MB TDP35W $257
  520M 2.40-2.93GHz L2=256kB x2 / L3=3MB TDP35W $225

まあ、クロックだけ見てるとClarksfieldに配慮して意図的に抑えられてる節はありそうだな

787:Socket774
09/09/28 23:37:24 0h8VgsT8
>>785
ノートはターボあんまり当てにならなかったり同じCPUでも機種ごとに実性能違ったりしそうだね
VAIOとかCore2でもスロットリング入りまくりだったりするし全然ターボできなそう

788:Socket774
09/09/29 00:03:19 haToQdue
Intelの次世代CPU「Sandy Bridge」の正体
URLリンク(pc.watch.impress.co.jp)

789:Socket774
09/09/29 02:36:27 QkZfKYZx
>>787
>ノートはターボあんまり当てにならなかったり同じCPUでも機種ごとに実性能違ったりしそうだね

つまり糞設計のノートやTDPぎりぎりの設計のノートだと、実クロックまでしかでずに
Turbo Boostなぞ当てにできなくなると

つまるところ、ノートに1ランク上の冷却系載せることを暗に要求してるのかも

790:Socket774
09/09/29 03:11:30 yN6AplAV
Sandy Bridgeって8コアじゃないの?

791:Socket774
09/09/29 03:59:16 uUwV0BYH
そこまでひどくないだろう、Turbo Boostの時はどこかのコアが休んでる時も条件の中にあったはず
その場合の余裕を利用してTDP以内(ここが重要)にBoostするんだから、
TDPギリギリ設計のノートでも理論的には大丈夫
効かないって事はTDP以下の設計だと思われ
4コアフルに効いても大丈夫なコアはTDP下げて高く売るだろうしw

792:Socket774
09/09/29 05:19:41 k390jpKr
もうFoxtonのことを知らない奴が出てきたんだなあ

793:Socket774
09/09/29 05:42:20 uUwV0BYH
EISTで痛い目見た人が疑心暗鬼になるのはわかるけどw
個人的には期待してるよ

794:Socket774
09/09/29 07:59:48 nb6Ga07k
Sandy Bridgeで俺が求めてること
・1366ピン 
・メモリは3ch
・グラフィックコアはいらない
・その代わりキャッシュ増量

これならすごく欲しいのになぁ…


795:Socket774
09/09/29 08:14:10 xg3hTUm/
>>744
ミドルレンジから投入みたいなことをいってるから、6コア、8コア以上はそうなるんじゃね。

6-core 12-thread / 8-core 16-thread
・LGA1155
・Dual-Channel
・L3 Cahe 1xMB

796:Socket774
09/09/29 08:25:02 z/pCKLhb
ダイ写真みると、メモリインターフェイスの左が空白であいてるように見えるけど、
JasperForestみたいにQPIをそこにつけて、別チップ作る予定なのかな。

797:Socket774
09/09/29 10:26:29 ldYYqRAc
>>788
GPUコアがこんなにもでかいのかよ
メインストリームでもGPUコア無し出るよね・・・

798:Socket774
09/09/29 12:08:13 f9Lkw2dn
むしろメインストリームでは出ないと思うんだが・・・

799:Socket774
09/09/29 12:30:42 9wARI1aN
CPU価格維持の為のチップサイズ増大策だろ
次あたりで100mm2で廉価版までサポートなんて考えていると思う。

でもって、儲からない割りに色々めんどくさいペリフェラルを分離…っと。
メモリ帯域をCPU vs GPUで食い合うので現在の廉価PCと同様の位置づけになるんだろーな。
今回のでも2CPUだともろに普及帯から廉価版に落とせるだけの体力あるだろうし。

800:Socket774
09/09/29 12:32:53 NOjcFIMD
今までだってチップセットの大面積占めてたのに誰も気にしちゃいねえ。
まあ最新プロセスじゃなかったけど。

801:Socket774
09/09/29 13:47:12 93mAP1n/
AVX以外はLynnfieldと変わらないような(´・ω・`)
定格周波数を上げるチャンスでもあるが、TDP65W枠に戻してくると思われる。

802:Socket774
09/09/29 13:50:21 wPccW8K+
>>797
メインストリーム以上のユーザーに、
『IntelのGPU』内蔵してほしいなんているわけがないがね。


803:Socket774
09/09/29 15:39:30 QvCbmQqF
>>802
メインストリームの意味分かってる?

804:Socket774
09/09/29 16:02:01 1r/UUQBZ
つか、トリプルチャンネルでCPUだしてほしいなあ

805:Socket774
09/09/29 17:24:32 5ql1Nm8y
Sandy BridgeのGPUは、せめて現行のGeForce 9400M程度の
性能出るといいけど、どうなんだろうなぁ。

806:Socket774
09/09/29 17:33:10 jgrdqkw9
たぶん無理

807:Socket774
09/09/29 17:34:11 f9Lkw2dn
32nmであのダイサイズでさすがに9400M以下はないと思うけどな
いくらドライバが糞で性能を引き出せなかったとしても
倍ぐらいは性能あるんじゃね

808:Socket774
09/09/29 17:42:52 My84Wiei
>>807
>倍ぐらいは性能あるんじゃね

Intel内蔵なめんなw

809:Socket774
09/09/29 17:45:37 AebGL6eU
>>802,803
これデスクトップ買ってゲームもやりたいってパンピーに意味あるの?
オンボのGPUよりマシって位なのかな。

ワンチップにする意味が見えない。

810:Socket774
09/09/29 18:02:03 z/pCKLhb
GMAを統合するのは過渡期なんじゃないかな。
最終目標はLarrabeeのようなGPU向きのx86コアを統合して、
全部CPUで処理するだろうし。

811:Socket774
09/09/29 18:10:59 PTFQUMu2
コアも全然増えないし、なんかインパクトなくなったから行き詰って統合してるだけのような感じもしなくはない・・・


812:Socket774
09/09/29 18:34:32 jA50OkhA
いまさら4コア以上にコア数増やしたって一般ユーザーには別に利点がないし、
統合することでトータルの製造コストや故障率や不良率が下げられるんならそれに越したことはないね。

813:Socket774
09/09/29 19:34:22 s8Ml4gJa
結局AMDの主張(Fusion)は正しかったのか

814:Socket774
09/09/29 19:48:03 QvCbmQqF
>>809
メインストリーム=ゲームかよw
頭悪そう…
GPU何か気にしない層が大多数だからGPUシェアの半数以上がインテルなんだろ。
何か頭が湧いちゃってる奴がいるな。

メインストリームの意味分かってないやつやゲーム脳が何でこんなとこいるんだよw

815:Socket774
09/09/29 21:13:44 k390jpKr
俺はGMAの素性は悪くないと思っている
古い製造プロセスで作って安く売ることを重視していたから性能が犠牲になっていただけで

816:Socket774
09/09/29 21:43:55 RZI6SYmK
違う意味で言ってるんだろうけど「ゲーム脳」って表現はマヌケに見えるから避けた方が

817:,,・´∀`・,,)っ-○○○
09/09/29 22:49:38 M4SuqDTa
L3キャッシュがCPU-GPUで共用で使えるストリームバッファとして使えるなら
うまくタイルレンダしてやって性能が劇的に改善してウマーなんてこともありうる。
かもしれない

818:Socket774
09/09/29 22:54:55 d3rq0So5
そういうのはAMDに任せときゃーいいの

819:,,・´∀`・,,)っ-○○○
09/09/29 23:14:26 M4SuqDTa
机上計算だが、22nmになると8コアのLarrabeeが150mm²程度に収まる。
2GHzなら500GFLOPS程度にはなる。
Haswellは256bit FMA×2とすると3GHzのデュアルコアで200GFLOPSは出せるようになる。

x86ワンチップで0.7~1TFLOPSとか出るようになったら・・・と思うと面白すぎて仕方がない。

820:Socket774
09/09/29 23:16:27 na80JXkt
Intelはどうせドライバが追い付かないんじゃないの?

821:,,・´∀`・,,)っ-○○○
09/09/29 23:19:24 M4SuqDTa
ドライバなんていらないから全部触らせろよ

822:Socket774
09/09/29 23:33:28 z/pCKLhb
アーキの違うGPUを統合するんじゃなくて、GPU向けのx86コアなら、
3D描画の処理が特にないときは、CPUとして使えるし、
GPUとして性能足りないときは、従来型の大型コアをいくつかを3D描画に使える
なんてことがうまく行けば出来るんじゃないの?

823:Socket774
09/09/29 23:47:37 SmLLs3Ga
お、日本のトップガンの登場か?

824:,,・´∀`・,,)っ-○○○
09/09/29 23:54:10 M4SuqDTa
まあLarrabeeに関してはソフト屋だけで3000人もいてドライバが書けないなんてこたないだろ
タイミング制御が難しいVLIWならともかく、Intelにとって長らく使い慣れたx86命令を叩くだけだ。
ちょっとSIMDがワイドになっただけでソフトの組み方が変わるわけじゃない。

他のGPUネイティブの機械語いじりは地獄だけどな

825:Socket774
09/09/30 00:03:20 8Yj1TMcZ
IntelのEden氏に聞くSandy Bridgeの姿
URLリンク(pc.watch.impress.co.jp)

826:,,・´∀`・,,)っ-○○○
09/09/30 00:15:18 pBmLhIEK
>>825
くそでけぇwwwwwwwww
対Nehalemでシュリンク率70%程度としても300mm²はあるぞ
逆にGMA?の部分がそんなに大きくないような。。。

827:Socket774
09/09/30 00:35:11 QaBDVUNJ
日本語でおk

828:,,・´∀`・,,)っ-○○○
09/09/30 01:23:27 pBmLhIEK
誤答のJPEG見た

Dual Core Westmereが <79mm²か
Intelの高密度設計技術は化け物か!

って、よく考えたらPenryn-6MBで既に100mm²切ってたんだよね

なんだったんだろNehalemの巨大ダイは

829:Socket774
09/09/30 01:26:16 K3I1eXm1
>>828
スレリンク(notepc板:806番)

830:Socket774
09/09/30 01:58:18 QaBDVUNJ
メモコンが無いからだろ…

831:,,・´∀`・,,)っ-○○○
09/09/30 02:00:14 pBmLhIEK
Coreシリーズ:   GMA X4500系→Larrabee
Atom Nシリーズ: GMA 950系→?
Atom Zシリーズ: GMA X500系(PowerVR)→次世代GMA

832:Socket774
09/09/30 07:08:42 RVk8ipEx
NehalemのダイサイズがLynnfieldより小さいのに高く売れてるって...

833:Socket774
09/09/30 07:28:24 KuTCJzNY
Lynnfieldがパフォーマンス~メインストリーム向けだから仕方なく安く売ってる
安く売ってる分はチップセットに上乗せされてる

だからLynnfieldはBloomfieldより安めの設定になってるし
チップセットは1チップになったのにマザーはそこまで安くなってない

834:Socket774
09/09/30 13:03:20 dqIIBmWt
|イスラエルのハアハアで産まれたSandy Bridge

に見えた。

835:Socket774
09/09/30 14:45:45 bsAZvk1B
あれ、ダイサイズがほとんど変わりないとすると
Nehalem同様にCoreMAベースの小規模改良に留まって
パイプラインにはあんまり手が入ることもなさそうか
シングルスレッド処理も変わらず伸び悩むなら残念だ

836:Socket774
09/09/30 14:47:59 bsAZvk1B
失礼、ダイサイズじゃなくて1コアあたりのトランジスタ数

837:Socket774
09/09/30 15:20:56 BKj2YFGM
もうそこは理論限界みたいなものだからどうにかなるのを期待しても無駄
フリーランチは終わった
これからは日替わり定食

838:Socket774
09/09/30 15:29:28 z/A4D3mm
今後はチクタクチクタクじゃなくチクタクタクタク…なのか。

839:Socket774
09/09/30 15:33:01 yQcub0H1
Sandybridgeはチクに値していいと思うけどなぁ
AVXをSSE系と同等に考えてしまうのはどうも違う気が

840:Socket774
09/09/30 15:43:21 iLjE/QKy
来年そうそうにi3i5とgulftownくるんだっけ、
それで、再来年にはsandy-bridgeだと思うんだけど、
その間、つまり来年後半の予定はどんなもの? なにも無し?

841:Socket774
09/09/30 15:46:54 gQNHFXZD
>>840
来年後半にSandyだよ

842:Socket774
09/09/30 15:50:06 iLjE/QKy
>>841
マジで?!アレ?勘違いしてたかorz

843:Socket774
09/09/30 17:05:31 5Fby6vaD
その後もアイビーブリッジが予定されてる
今の所22nmまでの技術は出来ていて量産態勢までは順調らしいから
サンディが遅れることはないかと。来年秋には出るかもね、最初は32nmだから(再来年は22nmになるが)。

844:Socket774
09/09/30 17:19:38 iLjE/QKy
>>843
来年秋に出てきたとして、コア4つのから始まるのかな?
8つとかもでてくるんだっけ?

845:Socket774
09/09/30 17:32:20 Vi4URfP1
クラウド創世記
第3回:クラウドOS Azureの登場
URLリンク(thinkit.jp)

846:Socket774
09/09/30 18:13:13 bsAZvk1B
>>838>>839
次にアーキテクチャがガラッと変わるのは
オレゴン製作のHaswellって話があった覚えが

マルチコアやAVX対応でしか速くならないってのは
なんだか進化の袋小路に迷いこんだみたいで寂しいな

847:Socket774
09/09/30 18:23:13 raG6GtdE
最近PARROTを聞かなくなったがどうなったんだろうね

848:Socket774
09/09/30 18:34:48 tgFk22vj
>>846
エンコとかを早くしたいのなら、マルチコアでいいわけで。
CPUが単純に高速になる必然はもうほとんどない。
最後の牙城ゲームもいずれマルチコア対応するとすれば、
コアを増やす&効率化=進化、で問題ない。


849:Socket774
09/09/30 18:47:50 AWlqI+xz
>>848
URLリンク(www.ne.jp)

>処理はいくらでもスレッドを生成できる部分と、分割処理できない逐次処理部分の組み合わせでできている。
>マルチスレッド可能な部分では、無尽蔵にスレッドが生成できると仮定する。
>逐次処理部分ではスレッドは一つしかないと仮定する。
>両者の比率を「マルチスレッド化率」と定義する事にする。

>URLリンク(www.ne.jp)

>一部でもマルチスレッド化できない部分がある場合、
>マルチコアの性能向上が見かけ倒しになることがよくわかる。

850:Socket774
09/09/30 18:49:21 Zl7kaCQX
>>848
> CPUが単純に高速になる必然はもうほとんどない。
このスレにいるのが恥ずかしくなるような、なんたる勘違い野郎だ!
なぜターボブーストが実在しているのか、10年間考慮しつつスレをROMってろ。

851:Socket774
09/09/30 19:09:17 yeH/1/Ha
       冫─'  ~  ̄´^-、
     /          丶
    /             ノ、
   /  /ヽ丿彡彡彡彡彡ヽヽ
   |  丿           ミ
   | 彡 ____  ____  ミ/
   ゝ_//|    |⌒|    |ヽゞ
   |tゝ  \__/_  \__/ | |    __________
   ヽノ    /\_/\   |ノ  /
    ゝ   /ヽ──‐ヽ /  / 将来的にも
     /|ヽ   ヽ─'   / <  パソコンのメモリは640キロバイトもあれば十分だろう
    / |  \    ̄  /   \
   / ヽ    ‐-            ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

    (ビル・ゲイツ、1981年)

852:Socket774
09/09/30 19:40:03 bsAZvk1B
アムダールの法則で単純な並列化には限界があるんだっけ
長期的に見ると今後はスカラかベクタかという話になるのかな

853:Socket774
09/09/30 20:42:06 i2QQOulK
OCの常用耐性が伸びてくれのなら別にそれでいいよ。
GulftownでLN2耐性だけでも600MHz以上上がってるし。

854:Socket774
09/09/30 21:44:16 RXWdDV19
SpMTとか動的最適化とかが活用されるくらいになるなら、メニーコアでも性能は
伸び続けるのかもしれないけど、正直微妙な感は拭えないなぁ
というか、そういうSpMTの類は、逐次実行向けのスレッドを一本から二本にする
だけで十分だろうし

855:,,・´∀`・,,)っ-○○○
09/09/30 21:46:43 pBmLhIEK
Sandy BridgeってひょっとしてStore Address + Store DataのμOPs Fusion効かなくなった?




て言ったら、どのレベルまで最適化進めてるかわかるよな?

856:Socket774
09/09/30 22:37:37 ihLzxNb8
言語的には既に
明示的に並列実行するparallel(..;..;..) と
明示的に逐次実行するsequence(..;..;..) と 互換性のためのforループが組み込まれてもいい気がする

857:,,・´∀`・,,)っ-○○○
09/09/30 22:55:47 pBmLhIEK
それっぽいことやるのがCt


858:Socket774
09/09/30 23:00:39 OtiUe65q
GPUって構造的に細かい制御が苦手だからCPUとはすみ分けるね。
多量のデータを同一アルゴリズムで一括して処理するような用途なら
GPGPUが向いている。

859:,,・´∀`・,,)っ-○○○
09/09/30 23:11:36 pBmLhIEK
CPUでソフト的にGPUをやったらどう?

860:Socket774
09/09/30 23:20:05 OtiUe65q
>>859
性能・効率どちらもGPUとは比較にならない。
そもそも根本的に向き不向きが違う。

861:Socket774
09/09/30 23:22:51 ZKJXfjvl
GPU信者ウゼエwww

862:Socket774
09/09/30 23:26:37 OtiUe65q
誰が信者だよw
GPUはデータプロセッサでCPUはコントロールプロセッサ。
そもそも性格がまったく違う。

どっちがいい悪いって話じゃないんだよ。

863:,,・´∀`・,,)っ-○○○
09/09/30 23:34:51 pBmLhIEK
向き不向きで語れるほど今のGPUもGPUの仕事を効率的にやってるわけじゃないからね。
消費電力の大半はメモリ間のデータ転送って言われてるくらいだし。
外部バス帯域の引き上げは消費電力を上げるのでキャッシュメモリを増強して
ローカルメモリを増やしてタイルレンダするのがモバイル向けでは良く使われてるけど
ハイエンドにも通用するナウい手法。
そのうち、スカラCPUとのデータやり取りもネックになって、コア内にスカラユニット搭載とか
やるようになる。

CPUはCPUでSIMD命令の拡張とマルチコア化を進めてるので構造的には近づいてる。

864:Socket774
09/09/30 23:51:01 1W7EpwFu
>>862
ムショ帰り乙!

865:,,・´∀`・,,)っ-○○○
09/10/01 00:15:08 A2R0Imfa
LarrabeeがGPUをやるとスカラとベクトルが備わり最強に見える。
逆にGeForceがやると頭がおかしくなって死ぬ。

866:Socket774
09/10/01 00:41:46 345IjcTy
わろっしゅw

867:,,・´∀`・,,)っ-○○○
09/10/01 01:02:06 A2R0Imfa
冗談抜きにCUDAのプログラミングモデルの似非「スカラ」は狂ってる。



868:Socket774
09/10/01 01:23:16 2VPKMbWV
そりゃータダでTFLOPSが手に入ったらCPU屋さんは商売上がったりだ

869:Socket774
09/10/01 07:11:10 18czcCNs
>>867
評価用に環境を提供してもらってるんだっけ?

870:Socket774
09/10/01 09:06:04 s2YMtGaN
Sandy BridgeせめてBIO5を余裕で遊べるぐらいのGPU統合してくれよ・・・

871:Socket774
09/10/01 09:20:27 olMh8hfL
むしろどうせゲフォラデ積むんだから、イラネ。のほうが正しい気がする

872:Socket774
09/10/01 10:03:58 LH551D2J
>>870
インテルはハードをドライバが足引っ張っているから永遠に無理。

873:Socket774
09/10/01 11:40:39 uFEZi0hA
>>870
GPU統合型はメモリの帯域がネックになるから
パフォーマンスは期待出来ないだよ
X-BOXみたいに専用メモリでも乗せないと

874:Socket774
09/10/01 11:41:47 2VPKMbWV
熱容量をCPUと分け合うから、あんまり豪勢なGPU載せるのも
寂しい思いをすることになる。

875:Socket774
09/10/01 16:35:31 Q2f6H7At
>>874
それならデカいヒートシンクを載せられるようにパッケージ自体のサイズを大き(ry

用途によってメモリのサイズを変えたり、CPUのグレードを変えたりとかの自由度を捨てて
いっそう、メモリ・GPU・CPUをすべて統合してもいいんじゃないかと思ったこともある

そうなると、その統合プロセッサを生かし切れるマザボも限られてくるから、適切なマザボに直結
SSDとかもマザボに直づけしてだな…

モバイル用途にはARMプロ(ry

876:Socket774
09/10/01 19:12:37 RNLCKmrl
>>875
つまり75W~300Wまで乗るPCIeのボードに
メモリ・GPU・CPU・SSDを統合して
どのマザーにも刺さるようにしてだな(ry

877:Socket774
09/10/01 19:34:22 5xS5TNXo
単なるCPUボードだろう、それは

878:Socket774
09/10/01 20:24:45 X4NFQLE6
その「ボード」の付け替えって、新しいPC買うのと同義じゃねえか

879:Socket774
09/10/01 21:44:06 BGiDqj7b
URLリンク(www.4gamer.net)

各CUDA Coreには,1基の32bit浮動>小数点(FP32)スカラ演算器,32bit整数(Int32)スカラ演算器が内包される。
各SP内のFP32スカラ演算器は,Int>32スカラ演算器と並列に動作できる。


880:Socket774
09/10/01 22:35:10 2VPKMbWV
ISAに縛られずにアーキテクチャを一新できるのはGPUの長所だな

881:,,・´∀`・,,)っ-○○○
09/10/01 23:11:47 A2R0Imfa
ネイティブVLIWを公開してるRadeonは実質縛られてるのかな

882:Socket774
09/10/01 23:30:12 HKOvfhCa
団子的にfermiはどうなの?
頭おかしくなって死ぬの?

883:Socket774
09/10/01 23:45:41 +VlnUsUD
個人的にはノート用にDRAM混載GPUを作ってほしいのだが。

884:Socket774
09/10/02 00:14:09 +ZvHm9E/
バCUDA島

885:,,・´∀`・,,)っ-○○○
09/10/02 00:20:53 gcK5RVtI
>>882
倍精度=単精度/2にしたのは評価したい。
やっぱHPCの需要を求めるならその辺は最低限必要だよね。

問題はCellだ。
Cellは32コア@4GHzで512GFLOPS程度にしかならないんだが、IBMは続投するのかね?
LINPACKでトップ500の最上位を奪われるわけにはいかないからな。
IBMがCellから乗り換えるようなことがあれば、Teslaは長生きしそう。

886:Socket774
09/10/02 00:45:48 OL1dvGKL
唐突にあさっての方向からCell持ち出してくるあたり
相当に動揺してるのが見てとれる。
依然としてGPUは所詮GPUだと思うが、成熟期に達してあまり打つ手がないCPUに比べると
GPUはアーキテクチャ改善の余地がまだまだいくらでもあるのが面白い。

887:,,・´∀`・,,)っ-○○○
09/10/02 00:59:41 gcK5RVtI
俺は別にNVIDIAに敵対する必要ねーし
払うものさえ払って貰えるならビジネスパートナーだよ

888:,,・´∀`・,,)っ-○○○
09/10/02 01:10:50 gcK5RVtI
>依然としてGPUは所詮GPUだと思うが、成熟期に達してあまり打つ手がないCPUに比べると
>GPUはアーキテクチャ改善の余地がまだまだいくらでもあるのが面白い。

典型的な馬鹿だなー

やってることはGPUの「CPU化」だろ。
迂回経路が違うだけで、性能を追求すれば汎用性とスループットの両方をバランスよく兼ね揃えたプロセッサに行き着く


↑汎用性

    →→→Larrabee
CPU↑     ↑
   ↑     ↑
   ↑     ↑   
     →→→     スループット
       GPU     →


って、これはIntelのプレゼンの図そのまんまだな

889:Socket774
09/10/02 01:26:11 N6rzYjfK
団子はGPUのCPU化も
CPUのGPU化も否定的だと思ったが

890:,,・´∀`・,,)っ-○○○
09/10/02 01:36:31 gcK5RVtI
Cellの話題を持ち出した意味も頭が悪すぎて理解できてないようだが
あんな腐れアーキをゴリ押しでロスアラモスに大量導入させたIBMの政治力はなんだかんだで凄いってことだよ。
もっとも、あの時点でIBMにとって一番コスト当たりの倍精度演算性能が優れてたプロセッサってのは事実だからな

ちなみにLarrabeeの場合はx86/x64命令セットとIntel謹製の開発ツールという
TOP500においても最大シェアのエコシステムが既にあるので、Cellの後釜を狙う必要など最初からない。
IBMと競業関係にあるHPCベンダーだけでも十分な数は売れる。
仮にIBMがLarrabeeを採用する時にはどのみちIBMはCellを見捨てることになるだろうし

891:Socket774
09/10/02 01:37:49 3n1WK2/L
Cellって倍精度強化したバージョンはどうなった?

892:Socket774
09/10/02 01:48:18 5/nAxaQv
>>849 単一コア4スレッドHyper-Threadingが、いいてことだな。
以前デュアルコアOpteronよりシングルコアOpteronのぜんぜんいいということを聞いたことがある。

893:,,・´∀`・,,)っ-○○○
09/10/02 01:49:00 gcK5RVtI
>>889
だってさ、Teslaが1.6GHzで動いたとして、スカラ性能は400MHz相当だろ。
ミッドレンジのARM以下だべ?
ベクトルコンピュータのスカラ性能の残念っぷりってスパコンで現役だった時代からそんなもんだったらしいけどさ

まあスカラで使っても「2GHz動作のPentium」になるLarrabeeは
本物のスカラユニットを持たないGPUに対して一定のアドバンテージとなりうるかもしれないね

スカラプロセッサの中でx86の性能上の強みは生き残ったCPUアーキテクチャの実装で現状最強といっても
良いAGUを用いたメモリアクセスを様々な演算に対して畳み込むことができることだ。
無論、LarrabeeのSIMD命令についてもそのルールは適用される。
ああいうフォーマットは固定長命令のRISCじゃ絶対不可能だからな。

894:Socket774
09/10/02 01:56:32 dRjZdQnb
>>885
プロセッサあたりの性能なんてTOP500とはおよそ関係のない話なんだが。
具体的な構成が出ている話では11年11月期予定のSequoiaが最大だと思うが、
これに使われるのはたった16core200GFLOPSのプロセッサだ。


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch