AMDの次世代CPUについて語ろう第30世代

AMDの次世代CPUについて語ろう第30世代at JISAKU

AMDの次世代CPUについて語ろう第30世代 - 暇つぶし2ch700:Socket774
09/11/15 13:35:11 1na4qW8D
DOS/VマシンがCPUとGPUを別パーツに分けたように
「あれ？もう整数演算と浮動小数点・ベクトル演算を同居する意味無くね？」
と気付いてしまったのが現在

701:Socket774
09/11/15 14:00:40 9HSPvDU/
みなGPGPUにあらぬ期待をかけすぎだ。
団子はもっとプロパガンダ頑張らないと。

GPGPUはバズーカ持ったシュワルツェネッガーみたいなもんだ。
戦場の様子を一変させる破壊力。
でもやっぱりマシンガンも要るんだよ。

702:Socket774
09/11/15 14:32:47 0m/z0btM
FPUはCPUに取り込まれたし、
GPUもCPUに食われると思うが・・・

703:,,・´∀｀・,,）っ-○○○
09/11/15 14:48:52 GwkMRAwb
>>701
往年のシュワちゃんはボディービルダーだからアウターマッスルは立派だが
インナーマッスルは相対的に弱い。

銃撃戦に必要なのは瞬発力だろう

704:Socket774
09/11/15 14:51:12 CqsdRnHp
そもそも今現在、CPUで浮動小数点演算使う場面ってあるの？
職場で使う大ファイルのエクセルくらいじゃないのか。

レタッチやキャド分野ではもうGPUにどんどん移行してるし
3D描画やゲームは全部GPUで決まるし、
エンコももうGPUにどんどん移行してる。

CPUの浮動小数点を無くすのはまだ乱暴だが、現状維持程度にするというのは
ニーズからいっても非常に現実的な解だと思うが。

欲しいのはやっぱり整数演算でしょう。

705:Socket774
09/11/15 14:51:38 LG75kTK/
>>702
５年以上先にはなｗ

706:,,・´∀｀・,,）っ-○○○
09/11/15 14:56:35 GwkMRAwb
>>704
だから浮動小数も2倍になってるっつーの

707:Socket774
09/11/15 15:00:03 PQNIAS0b
>>704
×どんどん移行してる
○ゆっくり移行してる？

708:Socket774
09/11/15 15:13:12 1na4qW8D
DTMはレイテンシが命だからGPGPUとか無理
CPU並みのレイテンシでGPUを使えるAPUが将来的に望まれる

709:,,・´∀｀・,,）っ-○○○
09/11/15 15:19:07 GwkMRAwb
てかGMA内蔵Sandy Bridgeの対抗は当分K10.5のLlanoだろ
Bulldozerは鯖とエンスー向けで

710:Socket774
09/11/15 15:21:17 9HSPvDU/
こんなにFermiへの期待度が高いとは正直驚きだ。

Fermiだよな?

711:,,・´∀｀・,,）っ-○○○
09/11/15 15:24:06 GwkMRAwb
FermiはGPUとしては単体カードでGTX295を超えられるか微妙

712:Socket774
09/11/15 15:24:46 0m/z0btM
GPUを扱えるAPUってなんぞｗ
普通に、サウンドカードのチップとかコーデックが
全てソフトウェア化してCPUに取り込まれれば、解決する問題じゃん。

713:Socket774
09/11/15 15:39:51 RAbvWwq1
>>683 >>690 >>693

K8の、というかAMDの3命令/cycle哲学からして
さすがに2(ALU+AGU)は無いんじゃないの？
同様にストアだけ強化っての何だか違和感あるし
正当な進化として4(ALU+AGU)にならんのかね

714:Socket774
09/11/15 15:46:39 6zMlLZ7M
Chekib Akroutのpdfで5ページ目、Single-Core Eraの項が気になる
この先シングルスレッド性能が上がるか下がるか？って書き方だしなあ

以前どこかの記事でシングルスレッド性能は落とさないとAMDの人が言ってた気もするんだが

715:,,・´∀｀・,,）っ-○○○
09/11/15 15:50:13 GwkMRAwb
>>713
むしろストアって基本的に整数演算とペアにできないんだよね。

add [eax], ecx だとload→add→storeになるけどさ
load+add と storeで十分だろってさ。

716:,,・´∀｀・,,）っ-○○○
09/11/15 16:06:32 GwkMRAwb
ストアアドレスが確定するまでロードが出来ないことを考えるとストア専用パイプを用意して
専用のスケジューリングをする意味はあるのかなと。

アドレス値予測して投機的にロードするテクニック（Memory Disambiguation）はどこぞの特許に抵触するし。

717:Socket774
09/11/15 16:18:00 67+W7s0j
低脳うぜぇ

718:,,・´∀｀・,,）っ-○○○
09/11/15 16:21:23 GwkMRAwb
逆に言うとストアアドレスが確定するまでストアできない制限がある以上
ALU＋AGUのペアをいくら増やしても頭打ち

719:,,・´∀｀・,,）っ-○○○
09/11/15 16:22:24 GwkMRAwb
○逆に言うとストアアドレスが確定するまでストアの後ろのロード命令を先行実行できない制限がある以上

720:Socket774
09/11/15 16:32:08 67+W7s0j
メモリディスアンビグエーション＝プリフェッチ＝フェッチはどこの特許に触れますか？

721:,,・´∀｀・,,）っ-○○○
09/11/15 16:33:28 GwkMRAwb
US Patent 6591342

722:,,・´∀｀・,,）っ-○○○
09/11/15 16:36:54 GwkMRAwb
というかIntelの特許はこれ

7590825 Counter-based memory disambiguation techniques for selectively predicting load/store conflicts
URLﾘﾝｸ(www.patentgenius.com)

723:,,・´∀｀・,,）っ-○○○
09/11/15 16:57:59 GwkMRAwb
プリフェッチ君背走

724:Socket774
09/11/15 17:24:14 67+W7s0j
未だにメモリディスアンビグエーション＝プリフェッチ＝フェッチと信じてるとは驚き

725:,,・´∀｀・,,）っ-○○○
09/11/15 17:27:35 GwkMRAwb
プリフェッチ君おはよう

726:,,・´∀｀・,,）っ-○○○
09/11/15 17:32:20 GwkMRAwb
プリフェッチ君（ID:67+W7s0j）の恥ずかしいレスが見れるスレはこのスレだけ

727:,,・´∀｀・,,）っ-○○○
09/11/15 17:37:09 GwkMRAwb
ねえねえプリプリフェフェフェッチくん♥

728:Socket774
09/11/15 18:41:30 maZmd7kF
L2の速度ひとつで性能2、3割とか余裕で変わるんで
コア内部だけのユニット構成だけで性能予測しても
殆ど当たらんけどな。

729:,,・´∀｀・,,）っ-○○○
09/11/15 18:44:49 GwkMRAwb
まあパフォーマンス要因はL1が2つあることだと思う。
1つのL1の帯域・ポート数を増やすのは大変だが、クラスタ化すればスケールする。
結果的に浮動小数ユニットに2倍のスループットでデータを供給できるようになる。

730:Socket774
09/11/15 18:59:01 uFGZc0jr
Memory Disambiguationでウィスコンシン大学に訴えられてた件は和解したんだな。

Wisconsin Alumni Research Foundation settles suit against Intel
URLﾘﾝｸ(www.jsonline.com)

731:Socket774
09/11/15 19:41:47 psl1E2jj
>>597
自分も非常に気になった部分だ。

クラスタードを採用するとかしてないと無理な気がするが、其処まで面倒な事を
してるのかな？

まあいずれにしてもクラスタードはいいなあ。

IntelのHTやターボboostなんかで差をつけられたイメージが有ったが、一気に
取り戻した感じがするよ。

732:Socket774
09/11/15 19:50:30 lSnNYP9x
3年遅れているけどな

733:Socket774
09/11/15 22:15:42 0a/GhY9+
2011年の淫は3年先を逝ってるのか・・・

734:Socket774
09/11/15 23:53:47 PSAdY57M
なんつかAMD黄金時代がまたきそうだな

735:Socket774
09/11/15 23:56:31 pgD4d6yQ
もっさりスレの主をファビョらせるとはだんごせんせーもなかなかのもんじゃな

736:Socket774
09/11/16 00:32:35 DME5PNJN
でも、AMDのはまたコスト上がりそう。
今のAMDの石は、ぶっちゃけ値段を下げて無理矢理Intelとタメ貼ってるような状況だから
これで決定的な差が出せなかったら、色々きついんじゃないか・・・。
そうでなくても、今だってSOIとかIntelに比べてコストのかかるの使ってるんでしょ？

737:Socket774
09/11/16 00:44:52 PQFXVnqC
SOIの価格に関しては確かに割高ではあるけど、技術の出始めと
安定後では価格が劇的に下がるのが工業製品の常識。
詳しい価格差は明らかになってないので何ともいえないところでは
あるんだけどね。

個人的な印象としてはAMDは下の温度は下がりにくいかわりに、
OCしてもあまり温度が上がりにくい、インテルはその逆という感じ
がする。

738:Socket774
09/11/16 00:56:10 nNs3ccTR
かけるコストに見合う見返りがあるからこそずっとSOIを採用してるんでしょ
ウェハが高いからSOIは高コストなんて言っても意味ないよ
それに微細化が進んでいろんなテクニックが必須になってきてるから
相対的にウェハコストの影響は小さくなるし

739:Socket774
09/11/16 01:30:41 BLwecK3L
工業製品、特に汎用品でコストパフォーマンス以上に重要なものなんてない

740:Socket774
09/11/16 01:45:13 PQFXVnqC
>>739
じゃあインテル最悪だな。

741:Socket774
09/11/16 01:53:41 f00qFtF+
>>716
もしストア専用にパイプを足したとしても
他のALU+AGUのペア含めた制御面倒じゃないの？
果たして性能面でそんなに寄与するのだろうか

742:Socket774
09/11/16 04:29:25 Krqt6Gqh
AMDがSOI採用してるのは他に方法が無いから以外にないでしょう

最初にSOI導入したときは何も導入してないIntelにそれで勝った。

IntelはSOIの導入を飛ばしてHigh-kを実現したが、
材質や配分などを独自研究して誰よりも早く実現したのであり
そこまで至ってないAMDはSOIに頼るしかなく今に至る。

AMDもやっと2010年からHigh-k導入。

743:Socket774
09/11/16 06:09:22 UDDZWGiS
採用時はいいアイディアだったんだよ、SOI。
クラスタ化も多分そんな感じになる悪寒。

744:Socket774
09/11/16 07:46:51 xv3fRmCg
複数コアでのFPU共有は悪いアイディアではないと思う。
そこから一歩進めてコア自体を不可分に一体化するのは、
長期的にはメリットよりデメリットの方が多いと思う。

745:Socket774
09/11/16 08:05:56 xv3fRmCg
よく考えると、開発の遅れと言う形で、
短期的にも既にクラスタ化のデメリットは露出しているのだった。

仮にクラスタ化のアプローチが成功しても、Bulldozerの次の世代で
さらに4コア1モジュールに進めるのは現実的でないし、
逆にクラスタ化マズーとわかっても戻れないし、
これは分の悪い賭けだ。

746:Socket774
09/11/16 08:06:04 wW/IKRAf
シングルコアなら暇だろうと何だろうと各機能が一通り配置されてないと
いけないが、マルチコアなら暇そうにしてる機能ブロックは共有化してしまえ
（忙しそうなところだけ多重化した、でもいい）

つまり、どこも忙しくなることを目指した、ということだと思っていいのかい

747:Socket774
09/11/16 08:14:43 mmVO9cPX
データL1を1コアに2つ積んだんでしょ

748:Socket774
09/11/16 08:19:39 xv3fRmCg
>>746
FPUはともかくフェッチ・デコード段が暇なのか、というと、あまりそんな
風には思えないけど、考え方としてはそういう事。

BulldozerはSandy Bridgeよりも確実に同時実行スレッド数が多くなり、
マルチスレッド化されたアプリケーションならば整数演算能力で
上回り、256bit AVXを多用するアプリケーションでなければ浮動小数点演算でも
同等の能力を発揮する。

>>747
1コアではなく1モジュールに2つ。
1モジュール=2コアと考えるならば、ふつう。

749:Socket774
09/11/16 08:40:31 mmVO9cPX
だからデータL1を1コアに2つ積んだのをモジュール言ってんでしょ

750:Socket774
09/11/16 08:49:31 xv3fRmCg
1コア=1モジュールという言い方はAMDもしてないと思うが、
仮にそういう視点に立つと、Bulldozerはとてもでかいコアということになる。
(2倍まではいかないが)

実際そのために開発遅れたし45nmに載らなかったんだから、
そういう見方でいいのかもしれないなあ。

で、1ハードウェアスレッドあたり1個のデータL1だから、ふつう。

751:Socket774
09/11/16 10:47:03 PCRLSz6U
実際に大事なのは性能だから
AMDが見誤ってなければそれなりの商品に仕上がってるんじゃね?
何しろcore2の後だしなんだからこれで駄目だったら本当につぶれる

752:Socket774
09/11/16 11:46:09 xv3fRmCg
性能と一口に言ってくれるが、一人一人みな違う性能を求めているのが今の時代。

753:Socket774
09/11/16 13:55:36 HRZwBxZn
L1少量でL2を2コアで共有、Bulldozerの構造はC2Dの改良版に見える

一方core i7はphenom類似の構造になってるし、
隣の庭は青く見えるのかね

754:Socket774
09/11/16 14:09:19 UDDZWGiS
どっちも似てないと思うけど

755:Socket774
09/11/16 15:05:39 Krqt6Gqh
メモリ回りのアプローチが気になる

Intelは、CPUとメモリの速度の違いを吸収するために
間に多段階のキャッシュを潤沢に用意してるし、
メモリチャンネル数もハイエンドは3チャンネルにしてる。

AMDは伝統的に小容量キャッシュだが、Intelもメモコン内蔵してしまったし、
Phenom2のL3の遅さと容量の少なさも既に問題になるレベル。

1モジュール内の2ハードウェアスレッド動かしてL2が共用となると
それなりの大容量L2、L3じゃないと意味ないと思うんだよね

756:Socket774
09/11/16 15:14:33 DJXDN/Ex
メモリスタッキング

757:Socket774
09/11/16 15:57:54 f00qFtF+
今になって考えるとPhenomではやや過剰に思えるほど
L1の幅を32bytesに強化したのはBulldozerへの布石だったのかな

758:Socket774
09/11/16 16:49:38 LKdhIkOd
何を言おうと結局は体感速度にどれくらい影響してくるかだろう

759:Socket774
09/11/16 18:39:09 4v3rJRPp
Z-RAM

760:Socket774
09/11/16 19:28:39 f00qFtF+
うーん、海外のサイト見てると整数の4パイプが
2ALU&2AGUってのはまずあり得んだろうという論調が支配的だ
もしこれだと何のためのBobcatだよってなっちゃうしね
じゃあ具体的な構成は？となるとまだ定まってないが・・・

761:Socket774
09/11/16 20:01:06 f00qFtF+
このCMT原案はAndy Glewらしい・・・ｗ

762:Socket774
09/11/16 23:38:33 f00qFtF+
どうもChuck Moore氏のコメント通りなら
それぞれの整数演算ユニットで4命令/cycleできる模様
にわかには信じがたいな

763:Socket774
09/11/17 00:03:10 ZP5bH0r0
分解した後の4命令?

764:,,・´∀｀・,,）っ-○○○
09/11/17 00:09:20 ouelv6RY
URLﾘﾝｸ(www.ospn.jp)

Bulldozerの性能はこの辺で触れてる

>>762
片方のスレッド同士じゃないの？

765:,,・´∀｀・,,）っ-○○○
09/11/17 00:10:00 ouelv6RY
○片方のスレッドだけに命令供給した場合だけじゃないの？

766:Socket774
09/11/17 00:14:03 QEHAUjcr
AMDよ頼む！
BulldozerもAM3で対応してくれ頼む！

767:Socket774
09/11/17 00:21:21 mXQq1VkI
>>764

Each Bulldozer "core" is capable of 2 loads/cycle; each is a 4-way out-of-order machine
Each INT scheduler can issue 4 inst./cycle; the FP scheduler can issue 4 inst./cycle

らしいよ

768:,,・´∀｀・,,）っ-○○○
09/11/17 00:37:49 ouelv6RY
FPからみて合計4load/cycleだな。
HPCも十分狙えるんじゃないの？これ。

769:Socket774
09/11/17 01:01:02 HWM8g8Qc
>>768
HPC向けに設計してるだろ

770:Socket774
09/11/17 01:07:57 +aciI08W
ｗｋｔｋできるのはいいことだ

771:Socket774
09/11/17 01:17:28 V8eHzwsO
なんてことはない
基本的にはCoreDuoと同じか
二つのコアを融合させてL2は共有、これを基本モジュールにしてるだけ

モジュールふたつで4コアCPU扱いのデスクトップ向けダイ
モジュール4つで8コアCPU扱いのサーバー向けダイ

772:Socket774
09/11/17 01:18:19 mXQq1VkI
　　　　　　　　　　　　　　　　　　　 |
　　　　　　　　　　　　　　　　　　　 |
　　　　　 ∩＿＿＿∩　　　　　　　　　 |
　　　　　 | ノ　 _,　　,_ ヽ　　　　　　（（　 |　ﾌﾟﾗﾌﾟﾗ
　　　　 /　　●　　　● |　　　　　　　　　(=)
　　　　 |　　　　( _●_)　ミ　＿　(⌒)　　J　　））
　　　　彡､　　　|∪|　ノ
⊂⌒ヽ　/　　　ヽノ　ヽ /⌒つ
　＼　ヽ　 /　　　　　ヽ　/
　　　＼_,,ノ　　　　　　|､＿ノ

773:Socket774
09/11/17 01:20:01 MwjUAsuq
>>764
Float＞IntからInt＞Floatに変わったのか？

774:Socket774
09/11/17 01:31:50 hfDzkHHM
Opteronがスパコンランキングトップ取ったぞｗ
5位にはHD4870を使った中国のスパコンが初ランクイン

AMDがんがれ

775:Socket774
09/11/17 01:39:35 16uLYW7E
まさかの4 ALU + 4 AGUなのか
あるいはALUとAGUの対称構造を
崩した実装になるのか・・・？

776:Socket774
09/11/17 01:43:35 HWM8g8Qc
>>774
元々トップ10は全部オプテロンだったよ。
つまり5位以外はオプテロンということだ。

777:Socket774
09/11/17 01:45:21 GGQJiBg0
ALUが整数ユニットでAGUってなんぞ？

778:Socket774
09/11/17 01:45:57 sDLjTGPh
Bulldozerのコア数が大きくスケールするならFermiキラーにもなるかもな
といっても、発売時期が１年違うから比較すべきではないか

779:Socket774
09/11/17 01:50:54 hfDzkHHM
>>776
いや、前2回はOpteron＋Cell。

今回の1位は全部Opteron

780:Socket774
09/11/17 01:54:06 FWxU6oTK
微妙に話がずれてるなｗ

781:Socket774
09/11/17 01:54:07 sDLjTGPh
でもORNLの新型はOpetron+Fermiの特注品という噂

782:Socket774
09/11/17 02:05:32 +aciI08W
ALU　=　Arithmetic Logic Unit
AGU　=　Address Generation Unit

のはず
Load/Store担当です。たぶん

783:,,・´∀｀・,,）っ-○○○
09/11/17 02:42:26 ouelv6RY
正確にはロード・ストアのアドレスを生成するのと、ユニットに指令を投げる役目な。

AGUをつかってアドレスを算出
→ロードユニットに○○番地呼んでこいという指令を発行
→読んだ値をALUで利用
っていうコンボ

784:Socket774
09/11/17 03:06:46 HWM8g8Qc
>>781
どのみちオプテロン使っているな
多分詐欺スペックのフェルミ(単精度2T、倍精度1T、220W位)での計画だから、その組合せはキャンセルになるだろうね。
何せCPUソケットに挿す為には130W以下に抑える必要があり、倍精度が200G程度に落ちることになる。
それなら550mmで高コストかつ数が限られるフェルミより、180mmのHD5770使ったほうが安く大量に積めるよ。

785:,,・´∀｀・,,）っ-○○○
09/11/17 03:14:29 ouelv6RY
> 多分詐欺スペックのフェルミ(単精度2T、倍精度1T、220W位)

これ自体がなにげに詐欺だわ。
公称スペックが1.26GHz動作の単精度1.26T, 倍精度0.63T, 225W

786:Socket774
09/11/17 03:22:23 hK6y8K0D
Tsubameや天河の理論と実測の乖離具合を見るとありえないきがするんだｇ

787:Socket774
09/11/17 03:26:13 LBrdbIXa
Dresdenboyさんが予想しているように、
ALUでアドレス計算できるようにするってことかな。

788:Socket774
09/11/17 03:44:01 aiMaGKKw
焦点はただ一つ。
再びi7を超えて帰り咲けるか否か。
それしか興味ない。
もしも逆転を成し遂げられることができるならもう一台パワーユース用PCが増えるだろう。

789:Socket774
09/11/17 05:03:40 MwjUAsuq
There was one AMD patent about an AGU, which recycles intermediate results for more complex address calculations.
While I'm not sure, if this patent could be related to Bulldozer (but to Bobcat or Geode or something else instead),
it offers the possibility to use a regular ALU for address calculations with only little modifications.

これか

790:Socket774
09/11/17 07:12:56 m6pdpuqQ
Fermiって実装考えると糞だな

面積と電力食い過ぎて実用的でないな

791:Socket774
09/11/17 07:14:16 m6pdpuqQ
再びＡＭＤが盛り返しそうだな　長かった

792:Socket774
09/11/17 09:19:04 eh0jiikC
でも一番の問題は、省電力かどうかにかかってくるのでは？
多少性能がIntelより良かったとしても、TDPが130Wとかで発熱がPhenomIIより
かなり増えてしまっては、TDPがGPU込みで85WのSandy Bridgeに販売では差を
付けられる可能性もある。
URLﾘﾝｸ(en.hardspell.com)

元々日本人は省電力志向だから性能がよくても、i7の様に微妙になる可能性も
結構あると思う。

793:Socket774
09/11/17 12:19:53 HWM8g8Qc
サンディ対抗はリャノになりそうだ。
AVXのサンディvsDX11CSのリャノ。

794:Socket774
09/11/17 12:38:33 nDdpLAqK
Sandyは12SPでGPUアーキのメジャーアップ無いから
L3共有等の効果を楽観的に見てもG45(10SP)の2倍ってところだろう。
かなりCPU偏重な性能バランスだと思われる。

一方のLIano GPUは480SP、レイテンシ増加等を考慮しても4650以下は無いだろう。
95W枠でCPU部を3GHz後半～4GHz前半にできればLIanoが有利か？

…しかしこうやって考えてみるとGMAアーキのダイ効率の悪さはGT200の比じゃないな。

795:Socket774
09/11/17 13:04:41 hfDzkHHM
CPUとGPUを1パッケにするとなると、とたんにIntelのGPU部分のまずさが
浮き彫りになってくるね

796:Socket774
09/11/17 13:43:46 YaUsdhIU
>Sandyは12SPでGPUアーキのメジャーアップ無いから
それはIron Lakeではないのか？SandyのGPUは45nmのIron Lakeとサイズ
同じ位だから何かしらの強化はされていると思うんだけど。
intel発表によると3DmarkVantageでIron LakeはG45の1.5倍らしいから
大雑把に考えてシュリンクで2倍、周波数が最大で2倍で、アーキテクチャ
が変わってないならG45比で最大で6倍になる計算。
URLﾘﾝｸ(pc.nikkeibp.co.jp)
まあこれが6倍になったところでどうしようも無いんだけどな。

797:Socket774
09/11/17 14:29:12 P5Tm3QYx
Intel graphics drivers employ questionable 3DMark Vantage optimizations
3DMurk all over again?
URLﾘﾝｸ(techreport.com)

こんなこともあるからね、LIanoとの比較のときは細工してきそうだね

798:Socket774
09/11/17 14:51:20 oMwY05k8
again? っていうところがミソ。

3DMark Vantage は早く動くけれど、他はそんなに早く動きません。っていうところもミソ。

だとすると、crap(ry

799:Socket774
09/11/17 15:07:22 x11LA5fA
Opteronのセールスポイントの一つはメモリ帯域/理論flops がXeonよりも
大きい事で、HPCで採用される理由の一つだと思うが、Intelのこれ

URLﾘﾝｸ(pc.watch.impress.co.jp)
URLﾘﾝｸ(www.nec.co.jp)
＞広いメモリバンド幅、高速インターコネクト接続技術などの
＞ベクトル処理システムの開発における豊富な経験は、
＞インテル・アーキテクチャーを新たな市場へさらに前進させることができます。

が成果を出したらOpteron苦しくなりそう。Opteronだけじゃなくて
Power7やSparcVIIIもだが

800:Socket774
09/11/17 15:13:56 gJX2rr8N
>>797
細工というか、GMAが遅いならCPUを使えばいいじゃない、という本末転倒作戦だよ。
GMAがピクセル、バーテックス処理で飽和したなら、ジオメトリー処理はCPUが肩代わりする。
DirectX9のときの設計で10にも対応できるようにしたけど、性能が全く足らないので、
GMA950以前のように、またCPU頼りになっているんだろう。

801:Socket774
09/11/17 18:44:51 U370BL4N
GPU同士ならフレームなりラインなりブロックなりで
簡単に負荷分散できるんだけどね･･･

802:Socket774
09/11/17 20:19:49 k80vxkhD
intelがNVIDIAを買収すると見た。

803:Socket774
09/11/17 20:41:13 vMNn1Y32
それはない

804:Socket774
09/11/17 20:43:16 FWxU6oTK
いやそうでもない

805:Socket774
09/11/17 20:47:45 oMwY05k8
AMDがATI買うよりもはるかに難しい。
Intel自身が全てがNVIDIA並みの企業を独立してつくってNVIDIA買う方が楽。

806:Socket774
09/11/17 20:50:15 FWxU6oTK
それこそない

807:Socket774
09/11/17 20:56:57 bxYBypih
実際Intelから見てNVIDIAに欲しいものってあるの？

808:Socket774
09/11/17 20:59:36 FWxU6oTK
ない

809:Socket774
09/11/17 21:03:51 HWM8g8Qc
どのみちDX11対応でHD4650以上の性能を発揮するLIanoに対抗する術は、インテルはおろかヌビというか地球上のどの企業も持ってないない。
Propusと同程度のサイズと消費電力でCPUは4コアL2 1MでPhenomIIx4クラス、GPUはDX11対応した480SPのHD4650クラス。
しかもオンダイだからCPU-GPU間通信が高速でGPGPUも期待出来る。
正直サンディが対抗出来る気がしない。
明らかに完成度の次元が違う。

810:Socket774
09/11/17 21:06:44 3/bXTsW7
NVIDIAから技術者を引き抜く方が手っ取り早い

811:Socket774
09/11/17 21:08:34 ZP5bH0r0
2011年にK10コアなんだから、確かに次元が違うわな。

812:Socket774
09/11/17 21:09:14 XMgQralJ
"LLANO"じゃないの？　"LIANO"なの？

813:Socket774
09/11/17 21:32:22 gJX2rr8N
LLANOじゃないかな。後藤氏はずっとLlanoだし、本間文はLianoと書いてたけど、
後でLlanoの訂正してたし。

814:Socket774
09/11/17 21:36:58 oMwY05k8
Intel+NV は、AMDよりチップが大きくなりそうね。残念。

815:Socket774
09/11/17 21:43:20 FPDrH33l
LlanoはHD4650級のﾁｯﾌﾟがCPUと一つになるのかよ…やべー

816:Socket774
09/11/17 21:57:10 gLyEgX+s
480spだからチップとしては4650より上
でもメモリ帯域落ちるから4650ぐらいの性能では？ということだろ
780GみたいにGPU専用メモリつけられるなら変わってくるだろうけど

817:Socket774
09/11/17 22:26:15 r1Mczqyk
>>812
LlANO

818:Socket774
09/11/17 22:50:23 HWM8g8Qc
>>811
傑作コアのPropusの唯一の弱点のキャッシュを1Mに倍増と、サイズパフォーマンスが非常に優れたHD5000コアの融合だからね。
ターボもどきも多分搭載するだろう。
正直bulldozerが失敗しても気にしなくていい位のハイスペックだろう。
少なくともデスクトップやハイエンドノートに敵はいない。

819:Socket774
09/11/17 22:53:25 uDz5DALg
ところでLlanoってAVXとかXOPに対応してんの？

820:Socket774
09/11/17 22:54:11 eh0jiikC
>>809
でも油断はしない方がいいと思うよ、イスラエルチームはオレゴンチームと違って
秘密主義で統率が取れているチームなので、Core2の時のような隠し玉がある可能性も
結構ありそう、まだ全容が完全に明らかになったわけではないし。

821:Socket774
09/11/17 22:55:58 P5Tm3QYx
隠し玉＝ベンチ対策

822:Socket774
09/11/17 22:56:15 X4PWSu+L
K10.5

823:Socket774
09/11/17 23:01:08 Cn/8l8He
LlanoはWiiの次世代機に乗りそう

824:Socket774
09/11/17 23:31:35 k1BDvN9C
まじで？

825:Socket774
09/11/17 23:37:26 OMNI6+3Y
SPがなんぼあっても、ROP＆各種固定ユニット＆メモリ帯域とのバランスが
取れてないと（ゲームとしての）性能は出ない
ボトルネック部分をCPUによるエミュレートが少し手伝うって手が取れるくらいFusionしてると良いのだが

826:,,・´∀｀・,,）っ-○○○
09/11/17 23:38:23 ouelv6RY
>>809

> どのみち256ビットAVX対応でCell以上の性能を発揮するSandy Bridgeに対抗する術がないAMDは愚か。
まで読んだ

827:,,・´∀｀・,,）っ-○○○
09/11/17 23:55:35 ouelv6RY
というか、GMAが圧倒的なシェアを得るのに性能が強みになったことは一度たりとも無いわけで。
オフィス用途にはG41レベルですらオーバースペック過ぎるが、
一方で世の中にはアホみたいにCPUスペック要求する業務アプリがあるわけだ。

どのみちグラフィック性能が必要な人はGMAで満足するわけないわけで、
それこそディスクリートGPUを増設しろって話になる罠。
CPU側をキャッシュ容量もSIMD性能も半分の「K10.5のL3削除版」に落としてまで
Llanoの内蔵GPUを使いたい人は相当変わり者だと思うぞ。

828:Socket774
09/11/18 00:00:01 1G6YN+hd
256ビットAVX

果たしてどれくらい利用されるのかなあ

829:Socket774
09/11/18 00:03:27 PI5a3Owr
鼻くその人はいつも頓珍漢なことを言ってるけどわざとなん？

830:Socket774
09/11/18 00:04:21 mEMiSYaO
そうやって新レジスタが創設されるたびに、タスクスイッチのコストがどんどん大きくなっていく
正直かんべんしてほしい

831:Socket774
09/11/18 00:04:30 1G6YN+hd
>>827
ノートしか持ってない人でゲームもやりたい人は、潜在敵に相当な数に昇るだろう

ゲームもできて困る人はだれ一人いないと思う　　　

832:,,・´∀｀・,,）っ-○○○
09/11/18 00:12:20 r93Gw0lQ
>>831
ノートもディスクリートでいいじゃん。
ゲームも貧弱なノートでできるようなローエンド側のほうが幅が広がってる

まさかとは思うがAthlon64 X2とCore 2 DuoでSIMDユニットのスループット差が見事に現れたの忘れてないよな？

まさかLlanoがノートに載るとか思ってないよな？
ノートのプラットフォームはDenubeだろ？しっかりしろよ。

833:,,・´∀｀・,,）っ-○○○
09/11/18 00:17:18 r93Gw0lQ
ロードマップ見てきた。
載るのね。ごめん。

デスクトップからノートまで同じようにアーキ刷新するのにノートは周回遅れなのね。

834:Socket774
09/11/18 00:18:47 /G8BpzkC
アム厨火病しすぎｗｗｗ

835:Socket774
09/11/18 00:27:11 mEMiSYaO
ディスクリートGPUだと、省電力機構を細かく駆動させることが難しくなる
CPUとGPUのIdle状態監視を同時に、高い時分割で行いたいわけで

836:Socket774
09/11/18 00:29:08 9tFV0ymL
>>767
整数演算が4命令/サイクル想定だとすれば
ますますパイプラインの構成が分からんな・・・

LlanoはK10コアなのでALUとAGUが3つずつ対称だが
BobcatはALU2つに対しロード1つ、ストア1つと分離している

ところがBulldozerだけわざわざ公表しなかったということは
これらとはまた違った構成を採用している可能性が高いし

837:Socket774
09/11/18 00:30:40 Puto/hVn
>>789

838:,,・´∀｀・,,）っ-○○○
09/11/18 00:32:13 r93Gw0lQ
PCゲームはポストCrysis級のヘビー路線と韓国産MMOみたいなカジュアル路線で二極化してるから
ノートでゲームやろうって人はそれこそディスクリートか、DX9クラスで十分かのどっちかだと思う。

ちなみにネットブックでも出来るクラスのローエンドゲームが一番売上げ伸びてるそうだ。

>>835
バッテリーで3Dネトゲやるの？
電源に応じて内蔵とディスクリートを切り替える機構付ければ十分でしょ。

839:Socket774
09/11/18 00:40:21 LVcrW4DI
>>838
>PCゲームはポストCrysis級のヘビー路線と韓国産MMOみたいなカジュアル路線で二極化してるから
>ノートでゲームやろうって人はそれこそディスクリートか、DX9クラスで十分かのどっちかだと思う。

つまり、「Intelの十万クラスのゲームマシン(GeForceの最下位モデルとか付いているやつ)より
ずっと速いゲームマシンがたったの6,7万で！」とかってアピールできるわけで。
場合によっては、ずっとチップサイズの小さい Llanoのほうが
「プレミアム製品」として高く売れるかもしれない。

それに、PCゲーで最強の売上、利益を誇っているのはWoWだよ。

840:,,・´∀｀・,,）っ-○○○
09/11/18 00:43:12 r93Gw0lQ
つーか、Sandy Bridgeの内蔵GMAの性能に対して満場一致で期待外なのな。

クロックは倍以上になるしトランジスタ数も増える、L3にアクセス出来る
なによりイスラエルチームが手を入れるので大穴くらいにしとこうや。

841:Socket774
09/11/18 00:47:09 0PiOIRta
ララビがいけそうだったらGMAにも期待する

842:,,・´∀｀・,,）っ-○○○
09/11/18 00:48:41 r93Gw0lQ
> Intelの十万クラスのゲームマシン(GeForceの最下位モデルとか付いているやつ)より
> ずっと速いゲームマシン
Phenom IIのキャッシュ容量を半分にするとNehalemより世代の進んだSandy Bridgeより速くなる
理屈を教えて下さいな

843:Socket774
09/11/18 00:50:07 LVcrW4DI
>>842
もちろんゲーム性能的な意味でだよ。
今だって、デスクトップ比で超ショボイGPUが
載った製品にすごいプレミアム価格が付いてるじゃん。
ああいうのを総取りできるかもよ、って。

844:Socket774
09/11/18 00:50:43 7xfkq4AP
画面が高解像度化してきてるからGPUの性能は高い方がいいな

845:,,・´∀｀・,,）っ-○○○
09/11/18 00:56:46 r93Gw0lQ
まあ、Sandy BridgeとLlanoのGPUは同程度の面積だし、
32nmは面積当たりトランジスタ数はIntelのほうが多いし、
次のGMAは1GHz以上駆動だとかいうし、なんともいえまへんな。

846:Socket774
09/11/18 01:07:50 1G6YN+hd
ディスクリートなんて余分な金銭発生するじゃん

同じ価格で倍以上のゲーム性能　カジュアルゲーマーなら十分

847:Socket774
09/11/18 01:08:54 7xfkq4AP
>>845
32nm同士だとIBMグループの方がSRAM面積小さいけどね

848:Socket774
09/11/18 01:09:51 anBjiZBy
LlanoはPropusと同程度のサイズだから160mm2前後、サンディはネハレムと同サイズの240mm2前後でコストが倍以上違う。
CPUベンチの最高性能は少し劣るけど、総合ベンチは互換以上だろうね。

849:,,・´∀｀・,,）っ-○○○
09/11/18 01:12:25 r93Gw0lQ
URLﾘﾝｸ(pc.watch.impress.co.jp)
これね

Sandy Bridgeは4コアでPS3のCellを超える単精度浮動小数演算性能を得たわけだし
丁度L3共有なんだからソフトウェアVertex Shaderなんかやってもよさげだね
どんなギミックがあるのかはまだまだ謎だが

>>846
＞同じ価格で倍以上のゲーム性能
どっから出てきた数字ですか？

850:Socket774
09/11/18 01:14:33 anBjiZBy
>>845
トランジスタ数はAMDが多かったはず。
少なくともGPUはイスラエルキャッシュレベルの化け物効率。

851:,,・´∀｀・,,）っ-○○○
09/11/18 01:16:04 r93Gw0lQ
CPU側のキャッシュが削られてる分メモリ帯域を消費すると思うんだ。
まして、なけなしのL2キャッシュを使ってGPU側の帯域をセーブできるわけでも無し
どんなマジックで倍の性能が出せるのか逆に期待してしまいますよ。

>>848
たぶんLlanoの当て馬は2コア4スレッド＋GMAだと思う。

852:,,・´∀｀・,,）っ-○○○
09/11/18 01:16:59 r93Gw0lQ
>>850
低クロックなんだからGPUのトランジスタ密度が高いのは当たり前だが。

853:Socket774
09/11/18 01:24:26 anBjiZBy
>>849
リャノは2万円以下、サンディは3万円以上だから値段が重なることはないだろう。

それと今のインテルオンボの2倍とHD4650じゃ倍以上の性能差があるよ。
それ以前にDX11未対応でドライバもイマイチだから相手にならない。

854:Socket774
09/11/18 01:24:44 1G6YN+hd
ノートｐｃのゲーム性能なんてｇｐｕで決まってしまうだろう
同じ価格で比べると尚更

ｉ７ノートなんて買う層は当初そんなにいないだろ　
２０万近くするんじゃね？　　　

855:Socket774
09/11/18 01:28:30 1G6YN+hd
ｉ７ノートなんて出始め１年くらいは、今のクワッドcpuノートみたいな位置づけだろ

普及するまで結構かかるんじゃね？

856:,,・´∀｀・,,）っ-○○○
09/11/18 01:32:33 r93Gw0lQ
URLﾘﾝｸ(pc.watch.impress.co.jp)
とりあえずGMAの性能の叩き台はこの辺か。

こっからイスラエルがどう手を入れるか次第で化けそう。
CPUコアのAVXとどう連携させるか、になりそうだが。

857:,,・´∀｀・,,）っ-○○○
09/11/18 01:36:54 r93Gw0lQ
つかノートPCならAESアクセラレータのほうが存在大きいと思うけどな。
GPUじゃどうにもならん。128ビットじゃ並列っていうほど並列度高くないし。

つか、なんでノートが「i7」になってるんだ？
当分メインストリームは2コア（4スレッド）だろ

858:Socket774
09/11/18 01:37:43 3CQ0Cfor
インテルのオンボが嫌いなわけではないが、性能が悪いのが
どうにも許せない。オンボで7600GTぐらいの性能があったら、
文句も言わないんだけどなぁ。

859:Socket774
09/11/18 01:40:04 t6b1xznN
ノート用は2コアでもi7
リネーム商法を上回る売り方

860:,,・´∀｀・,,）っ-○○○
09/11/18 01:40:54 r93Gw0lQ
実はi740の系譜を継ぐという噂

・Vertex Shaderがソフト（CPU）処理
・なおかつFSB経由でデータやりとり

あるいみCPUとくっつけ甲斐がある。

861:Socket774
09/11/18 01:41:22 y3Zww7/l
基地外が粘着して糞スレになっちゃったなココ・・

862:Socket774
09/11/18 01:50:45 1G6YN+hd
1年後

１０万のノートでなんとかこのゲーム遊べました　(ＡＭＤ)

１５万円ノートでも、全くこのゲームが立ち上がりません　(ｉｎｔｅｌ)　　＞＜

863:,,・´∀｀・,,）っ-○○○
09/11/18 01:52:10 r93Gw0lQ
WestmereベースのCULVで低価格帯を固めたIntelに隙は無かった

864:,,・´∀｀・,,）っ-○○○
09/11/18 01:54:49 r93Gw0lQ
そもそもCeleronじゃないIntelのづあるコア積んだA4ノートなんて今でこそ6万程度で買えるのに
10万もかけて何するの？

865:Socket774
09/11/18 01:57:06 XDTRgLlM
ID:1G6YN+hdはIntelを叩けばAMDが優位になるとでも思ってるのかね？

866:,,・´∀｀・,,）っ-○○○
09/11/18 02:01:08 r93Gw0lQ
「キャッシュ半分のPhenom II X4はSandy Bridgeの性能2倍！」（ｷﾘｯ

867:Socket774
09/11/18 02:08:37 mEMiSYaO
キャッシュってなんであんなにダイサイズ取るんだろホント
Power7のeDRAM技術ぱくれんもんかねAMD

868:Socket774
09/11/18 02:25:17 anBjiZBy
ゲフォの選択肢がなくなる来年以降のインテルはラデオンの重要な御得意様。
時にノートはAVXなんか直ぐに対応しないからDX11ラデは性能やマーケティング上重宝される。

869:,,・´∀｀・,,）っ-○○○
09/11/18 02:32:48 r93Gw0lQ
GMAドライバのソフトウェアVertex Shaderが最も身近な最初のAVXアプリケーションになりそうだけどな

870:Socket774
09/11/18 02:34:49 hX6uIMcb
LlanoのPropusからの性能向上の要因は
・L2倍増
・ステッピング変更による最適化
・32nm化によるクロックアップ
・GPGPU
ぐらいかな?
CPUは正直「Sandy Bridgeから絶望的な差はつけられない」レベルだと思う

GPUは逆に「Sandy Bridgeにかなりの差をつけられる」レベル

要するに今とあんまり変わらずこのセグメントでシェアが急伸することもない、ってのが現実的だと思う

871:Socket774
09/11/18 02:34:56 anBjiZBy
ちなみにソフトのAVXやDXCSはどちらが進むだろうか。
ハイエンドのみ対応のAVX、オンボすら対応するDXCSで、シェア的にはDXCSが優位ぽいけど。

872:Socket774
09/11/18 02:38:15 3CQ0Cfor
APUったってノートとかローエンドPCにしかうまみがないから
あんまり興味ないんだよな。

873:Socket774
09/11/18 02:38:25 mEMiSYaO
レジスタを256bitに拡張するより、従来の128bitのSIMD演算を1/2サイクルとか
1/4サイクルとかで実行してスループットだせないもんなの？
Pen4のALUみたいなの

874:,,・´∀｀・,,）っ-○○○
09/11/18 02:42:30 r93Gw0lQ
というかDX11はGMAですら対応しますが・・・
（というよりCPU処理の比重を上げる気がする）

ヒント：オンボ程度の性能でいいならCompute ShaderはCPU処理でも十分
AVXは透過的に使われる

Pentium 4からCore 2にしてからGMAの性能が上がったと思ったら
それがソフトウェアVertex Shaderです

875:,,・´∀｀・,,）っ-○○○
09/11/18 02:45:52 r93Gw0lQ
>>873
ATIの人にも同じこと言ってくれませんか？
並列度高すぎて使いづらいです＞＜

876:Socket774
09/11/18 02:51:00 LCGPlF91
オンボ程度の性能でいいならとか言われても
そのオンボGPUの性能が今までより飛躍的に上がるんだから。

877:,,・´∀｀・,,）っ-○○○
09/11/18 02:55:53 r93Gw0lQ
キャッシュ半分に削られたPhenom IIとDDR3メモリメモリの帯域取り合うことでの性能向上を「飛躍」というのなら
それは私は論理の飛躍と解釈する

878:Socket774
09/11/18 03:03:48 anBjiZBy
つまり、リャノのDX11ネイティブ対応のCSと、サンディのAVXによるソフトDXCSの比較になるのかな。
まあ価格帯がかなり違うから直接比較出来ないけど。
仮に価格が3万円や消費電力95Wで統一したらどうなるだろうか。リャノは3G+HD4650、サンディは2.6G+G45の倍位になるかな。

879:Socket774
09/11/18 03:06:28 y3vlc7Za
キャッシュが倍になったAthlonIIと考えるんだ！

880:Socket774
09/11/18 03:09:14 N3Q+WVks
Sandyはもっと高クロックで出ると思うよ

881:Socket774
09/11/18 03:11:24 anBjiZBy
GPUに直結で64bitGDDR5で128MのLFBを付けるとか出来たら最高なんだがな。

882:Socket774
09/11/18 03:15:52 y3vlc7Za
定格2.8Gから3.4G、ターボモードで3.8から4Ghz
URLﾘﾝｸ(en.hardspell.com)

883:Socket774
09/11/18 03:21:07 QgViuhXw
Sandyのコア比較を見てる限りでは、面積ではWestmereとそんなに変わらないんだよなあ
だから性能向上は考えにくい

アンコア部での性能向上がどこまでなのかわからないけどね

884:,,・´∀｀・,,）っ-○○○
09/11/18 03:37:30 r93Gw0lQ
>>881
敢えて逆に考えてほしい。
もし性能良かったら上位製品（Bulldozer）なんて売れないでしょ。
お互いに帯域取り合って性能殺しあうくらいが丁度いい、というか
へんにボトルネック解消しようとしたらコスト高くなりすぎるのでは？
ノート向けで性能引き出すにはDDR3 SO-DIMMの1600MHz 2枚が必要って時点で価格的には不確定要素だし。

>>883
GPU側はそんなに弄ること無いのでは？
AVX世代では浮動小数演算能力は4コアでもCellに匹敵するんだから
CellよろしくソフトウェアVertex Shaderの使い甲斐はあると思うけどね。
CPUのL3キャッシュ経由でデータやり取りできるようにするんだから使わない手は無い。

そういえば面白い情報。
Intel C++ CompilerではCVT16相当、、すなわちhalf floatの変換を行う組み込み関数が
ソフト的に提供されている。
これ一般的にはグラフィック向けだよね。
このへんはGMAを使うミドルウェアの開発者向けかなと思ったが。

なんかこのへんはLarrabeeとは別のGPUプランが見え隠れする。
（LarrabeeはGPUに見せかけてスパコンプロセッサだし）

885:Socket774
09/11/18 03:41:46 1G6YN+hd
>>865
１年後６万ｐｃで３ｄゲームできるＡＭＤと３ｄゲームできないｉｎｔｅｌならＡＭＤが優位になると思うぞ

露骨な違法商売も遣り辛くなるだろうし

886:,,・´∀｀・,,）っ-○○○
09/11/18 03:43:51 r93Gw0lQ
ゲーム（笑）
企業ユーザーならAESアクセラレータで快適にソフトVPNできるほうを選ぶかも

887:Socket774
09/11/18 03:46:04 /vI1oujJ
どうせゲーミングノートならＧＰＵ別に積むんだからＩｎｔｅｌ CPUにﾓﾊﾞﾗﾃﾞ積んだの買えば良いじゃねーかめんどくせぇ

888:Socket774
09/11/18 03:49:08 1G6YN+hd
>>887
６万では無理だろｗ

東南アジアはじめ世界での売れ筋はそんなもんだろ

889:,,・´∀｀・,,）っ-○○○
09/11/18 03:55:19 r93Gw0lQ
東南アジア（笑）

AVXのプログラミングマニュアルに
プロセッサによってはAVXをサポートしてるがAESをサポートしない場合があるので両方見てね
的なこと書いてあるが、それどう見てもBulldozerのことだよな

BitLockerなんかのAESアクセラレーションは少なくとも今後3年はAMDプラットフォームでは使えない・・かもね

890:Socket774
09/11/18 04:13:41 1G6YN+hd
ＢＲＩＣＳ全体で日本の１０倍のｃｐｕがはけそうだ

891:,,・´∀｀・,,）っ-○○○
09/11/18 04:28:01 r93Gw0lQ
Netbookがな。

892:Socket774
09/11/18 04:37:54 mEMiSYaO
Atomなんであんな異常に安く作れるの？ｗ
後工程どうやってコスト下げてんだろ

893:Socket774
09/11/18 04:45:08 zKA5mvDa
以前設計した回路の再利用。
（インテルにとって）いらない部分を取り除く事によるサイズの縮小。
小さい回路なので、1ウェハ辺りに大量のチップの元ができる。

薄利多売

894:Socket774
09/11/18 04:58:43 mEMiSYaO
いや、多売だけど薄利ではなかったはずでしょ
それに一定以下のダイサイズならダイ単価よりパッケージングが相対的に高くつくのではないかと

895:Socket774
09/11/18 06:33:45 dIWBsy2h
23レスきもすぎ

896:Socket774
09/11/18 08:16:16 M/J3XNMq
団子が言いたかったことは、カジュアルゲーこそLlanoが適してるね
adobeがAMDに最適化したし
ワンチップによるGPGPU性能にも期待がもてるね
ってことだな