Intelの次世代CPUについて語ろう 40at JISAKU
Intelの次世代CPUについて語ろう 40 - 暇つぶし2ch807:Socket774
09/09/29 17:34:11 f9Lkw2dn
32nmであのダイサイズでさすがに9400M以下はないと思うけどな
いくらドライバが糞で性能を引き出せなかったとしても
倍ぐらいは性能あるんじゃね

808:Socket774
09/09/29 17:42:52 My84Wiei
>>807
>倍ぐらいは性能あるんじゃね

Intel内蔵なめんなw

809:Socket774
09/09/29 17:45:37 AebGL6eU
>>802,803
これデスクトップ買ってゲームもやりたいってパンピーに意味あるの?
オンボのGPUよりマシって位なのかな。

ワンチップにする意味が見えない。

810:Socket774
09/09/29 18:02:03 z/pCKLhb
GMAを統合するのは過渡期なんじゃないかな。
最終目標はLarrabeeのようなGPU向きのx86コアを統合して、
全部CPUで処理するだろうし。

811:Socket774
09/09/29 18:10:59 PTFQUMu2
コアも全然増えないし、なんかインパクトなくなったから行き詰って統合してるだけのような感じもしなくはない・・・


812:Socket774
09/09/29 18:34:32 jA50OkhA
いまさら4コア以上にコア数増やしたって一般ユーザーには別に利点がないし、
統合することでトータルの製造コストや故障率や不良率が下げられるんならそれに越したことはないね。

813:Socket774
09/09/29 19:34:22 s8Ml4gJa
結局AMDの主張(Fusion)は正しかったのか

814:Socket774
09/09/29 19:48:03 QvCbmQqF
>>809
メインストリーム=ゲームかよw
頭悪そう…
GPU何か気にしない層が大多数だからGPUシェアの半数以上がインテルなんだろ。
何か頭が湧いちゃってる奴がいるな。

メインストリームの意味分かってないやつやゲーム脳が何でこんなとこいるんだよw

815:Socket774
09/09/29 21:13:44 k390jpKr
俺はGMAの素性は悪くないと思っている
古い製造プロセスで作って安く売ることを重視していたから性能が犠牲になっていただけで

816:Socket774
09/09/29 21:43:55 RZI6SYmK
違う意味で言ってるんだろうけど「ゲーム脳」って表現はマヌケに見えるから避けた方が

817:,,・´∀`・,,)っ-○○○
09/09/29 22:49:38 M4SuqDTa
L3キャッシュがCPU-GPUで共用で使えるストリームバッファとして使えるなら
うまくタイルレンダしてやって性能が劇的に改善してウマーなんてこともありうる。
かもしれない

818:Socket774
09/09/29 22:54:55 d3rq0So5
そういうのはAMDに任せときゃーいいの

819:,,・´∀`・,,)っ-○○○
09/09/29 23:14:26 M4SuqDTa
机上計算だが、22nmになると8コアのLarrabeeが150mm²程度に収まる。
2GHzなら500GFLOPS程度にはなる。
Haswellは256bit FMA×2とすると3GHzのデュアルコアで200GFLOPSは出せるようになる。

x86ワンチップで0.7~1TFLOPSとか出るようになったら・・・と思うと面白すぎて仕方がない。

820:Socket774
09/09/29 23:16:27 na80JXkt
Intelはどうせドライバが追い付かないんじゃないの?

821:,,・´∀`・,,)っ-○○○
09/09/29 23:19:24 M4SuqDTa
ドライバなんていらないから全部触らせろよ

822:Socket774
09/09/29 23:33:28 z/pCKLhb
アーキの違うGPUを統合するんじゃなくて、GPU向けのx86コアなら、
3D描画の処理が特にないときは、CPUとして使えるし、
GPUとして性能足りないときは、従来型の大型コアをいくつかを3D描画に使える
なんてことがうまく行けば出来るんじゃないの?

823:Socket774
09/09/29 23:47:37 SmLLs3Ga
お、日本のトップガンの登場か?

824:,,・´∀`・,,)っ-○○○
09/09/29 23:54:10 M4SuqDTa
まあLarrabeeに関してはソフト屋だけで3000人もいてドライバが書けないなんてこたないだろ
タイミング制御が難しいVLIWならともかく、Intelにとって長らく使い慣れたx86命令を叩くだけだ。
ちょっとSIMDがワイドになっただけでソフトの組み方が変わるわけじゃない。

他のGPUネイティブの機械語いじりは地獄だけどな

825:Socket774
09/09/30 00:03:20 8Yj1TMcZ
IntelのEden氏に聞くSandy Bridgeの姿
URLリンク(pc.watch.impress.co.jp)

826:,,・´∀`・,,)っ-○○○
09/09/30 00:15:18 pBmLhIEK
>>825
くそでけぇwwwwwwwww
対Nehalemでシュリンク率70%程度としても300mm²はあるぞ
逆にGMA?の部分がそんなに大きくないような。。。

827:Socket774
09/09/30 00:35:11 QaBDVUNJ
日本語でおk

828:,,・´∀`・,,)っ-○○○
09/09/30 01:23:27 pBmLhIEK
誤答のJPEG見た

Dual Core Westmereが <79mm²か
Intelの高密度設計技術は化け物か!

って、よく考えたらPenryn-6MBで既に100mm²切ってたんだよね

なんだったんだろNehalemの巨大ダイは

829:Socket774
09/09/30 01:26:16 K3I1eXm1
>>828
スレリンク(notepc板:806番)

830:Socket774
09/09/30 01:58:18 QaBDVUNJ
メモコンが無いからだろ…

831:,,・´∀`・,,)っ-○○○
09/09/30 02:00:14 pBmLhIEK
Coreシリーズ:   GMA X4500系→Larrabee
Atom Nシリーズ: GMA 950系→?
Atom Zシリーズ: GMA X500系(PowerVR)→次世代GMA

832:Socket774
09/09/30 07:08:42 RVk8ipEx
NehalemのダイサイズがLynnfieldより小さいのに高く売れてるって...

833:Socket774
09/09/30 07:28:24 KuTCJzNY
Lynnfieldがパフォーマンス~メインストリーム向けだから仕方なく安く売ってる
安く売ってる分はチップセットに上乗せされてる

だからLynnfieldはBloomfieldより安めの設定になってるし
チップセットは1チップになったのにマザーはそこまで安くなってない

834:Socket774
09/09/30 13:03:20 dqIIBmWt
|イスラエルのハアハアで産まれたSandy Bridge

に見えた。

835:Socket774
09/09/30 14:45:45 bsAZvk1B
あれ、ダイサイズがほとんど変わりないとすると
Nehalem同様にCoreMAベースの小規模改良に留まって
パイプラインにはあんまり手が入ることもなさそうか
シングルスレッド処理も変わらず伸び悩むなら残念だ

836:Socket774
09/09/30 14:47:59 bsAZvk1B
失礼、ダイサイズじゃなくて1コアあたりのトランジスタ数

837:Socket774
09/09/30 15:20:56 BKj2YFGM
もうそこは理論限界みたいなものだからどうにかなるのを期待しても無駄
フリーランチは終わった
これからは日替わり定食

838:Socket774
09/09/30 15:29:28 z/A4D3mm
今後はチクタクチクタクじゃなくチクタクタクタク…なのか。

839:Socket774
09/09/30 15:33:01 yQcub0H1
Sandybridgeはチクに値していいと思うけどなぁ
AVXをSSE系と同等に考えてしまうのはどうも違う気が

840:Socket774
09/09/30 15:43:21 iLjE/QKy
来年そうそうにi3i5とgulftownくるんだっけ、
それで、再来年にはsandy-bridgeだと思うんだけど、
その間、つまり来年後半の予定はどんなもの? なにも無し?

841:Socket774
09/09/30 15:46:54 gQNHFXZD
>>840
来年後半にSandyだよ

842:Socket774
09/09/30 15:50:06 iLjE/QKy
>>841
マジで?!アレ?勘違いしてたかorz

843:Socket774
09/09/30 17:05:31 5Fby6vaD
その後もアイビーブリッジが予定されてる
今の所22nmまでの技術は出来ていて量産態勢までは順調らしいから
サンディが遅れることはないかと。来年秋には出るかもね、最初は32nmだから(再来年は22nmになるが)。

844:Socket774
09/09/30 17:19:38 iLjE/QKy
>>843
来年秋に出てきたとして、コア4つのから始まるのかな?
8つとかもでてくるんだっけ?

845:Socket774
09/09/30 17:32:20 Vi4URfP1
クラウド創世記
第3回:クラウドOS Azureの登場
URLリンク(thinkit.jp)

846:Socket774
09/09/30 18:13:13 bsAZvk1B
>>838>>839
次にアーキテクチャがガラッと変わるのは
オレゴン製作のHaswellって話があった覚えが

マルチコアやAVX対応でしか速くならないってのは
なんだか進化の袋小路に迷いこんだみたいで寂しいな

847:Socket774
09/09/30 18:23:13 raG6GtdE
最近PARROTを聞かなくなったがどうなったんだろうね

848:Socket774
09/09/30 18:34:48 tgFk22vj
>>846
エンコとかを早くしたいのなら、マルチコアでいいわけで。
CPUが単純に高速になる必然はもうほとんどない。
最後の牙城ゲームもいずれマルチコア対応するとすれば、
コアを増やす&効率化=進化、で問題ない。


849:Socket774
09/09/30 18:47:50 AWlqI+xz
>>848
URLリンク(www.ne.jp)

>処理はいくらでもスレッドを生成できる部分と、分割処理できない逐次処理部分の組み合わせでできている。
>マルチスレッド可能な部分では、無尽蔵にスレッドが生成できると仮定する。
>逐次処理部分ではスレッドは一つしかないと仮定する。
>両者の比率を「マルチスレッド化率」と定義する事にする。

>URLリンク(www.ne.jp)

>一部でもマルチスレッド化できない部分がある場合、
>マルチコアの性能向上が見かけ倒しになることがよくわかる。

850:Socket774
09/09/30 18:49:21 Zl7kaCQX
>>848
> CPUが単純に高速になる必然はもうほとんどない。
このスレにいるのが恥ずかしくなるような、なんたる勘違い野郎だ!
なぜターボブーストが実在しているのか、10年間考慮しつつスレをROMってろ。

851:Socket774
09/09/30 19:09:17 yeH/1/Ha
       冫─'  ~  ̄´^-、
     /          丶
    /             ノ、
   /  /ヽ丿彡彡彡彡彡ヽヽ
   |  丿           ミ
   | 彡 ____  ____  ミ/
   ゝ_//|    |⌒|    |ヽゞ
   |tゝ  \__/_  \__/ | |    __________
   ヽノ    /\_/\   |ノ  /
    ゝ   /ヽ──‐ヽ /  / 将来的にも
     /|ヽ   ヽ─'   / <  パソコンのメモリは640キロバイトもあれば十分だろう
    / |  \    ̄  /   \
   / ヽ    ‐-            ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

    (ビル・ゲイツ、1981年)

852:Socket774
09/09/30 19:40:03 bsAZvk1B
アムダールの法則で単純な並列化には限界があるんだっけ
長期的に見ると今後はスカラかベクタかという話になるのかな

853:Socket774
09/09/30 20:42:06 i2QQOulK
OCの常用耐性が伸びてくれのなら別にそれでいいよ。
GulftownでLN2耐性だけでも600MHz以上上がってるし。

854:Socket774
09/09/30 21:44:16 RXWdDV19
SpMTとか動的最適化とかが活用されるくらいになるなら、メニーコアでも性能は
伸び続けるのかもしれないけど、正直微妙な感は拭えないなぁ
というか、そういうSpMTの類は、逐次実行向けのスレッドを一本から二本にする
だけで十分だろうし

855:,,・´∀`・,,)っ-○○○
09/09/30 21:46:43 pBmLhIEK
Sandy BridgeってひょっとしてStore Address + Store DataのμOPs Fusion効かなくなった?




て言ったら、どのレベルまで最適化進めてるかわかるよな?

856:Socket774
09/09/30 22:37:37 ihLzxNb8
言語的には既に
明示的に並列実行するparallel(..;..;..) と
明示的に逐次実行するsequence(..;..;..) と 互換性のためのforループが組み込まれてもいい気がする

857:,,・´∀`・,,)っ-○○○
09/09/30 22:55:47 pBmLhIEK
それっぽいことやるのがCt


858:Socket774
09/09/30 23:00:39 OtiUe65q
GPUって構造的に細かい制御が苦手だからCPUとはすみ分けるね。
多量のデータを同一アルゴリズムで一括して処理するような用途なら
GPGPUが向いている。

859:,,・´∀`・,,)っ-○○○
09/09/30 23:11:36 pBmLhIEK
CPUでソフト的にGPUをやったらどう?

860:Socket774
09/09/30 23:20:05 OtiUe65q
>>859
性能・効率どちらもGPUとは比較にならない。
そもそも根本的に向き不向きが違う。

861:Socket774
09/09/30 23:22:51 ZKJXfjvl
GPU信者ウゼエwww

862:Socket774
09/09/30 23:26:37 OtiUe65q
誰が信者だよw
GPUはデータプロセッサでCPUはコントロールプロセッサ。
そもそも性格がまったく違う。

どっちがいい悪いって話じゃないんだよ。

863:,,・´∀`・,,)っ-○○○
09/09/30 23:34:51 pBmLhIEK
向き不向きで語れるほど今のGPUもGPUの仕事を効率的にやってるわけじゃないからね。
消費電力の大半はメモリ間のデータ転送って言われてるくらいだし。
外部バス帯域の引き上げは消費電力を上げるのでキャッシュメモリを増強して
ローカルメモリを増やしてタイルレンダするのがモバイル向けでは良く使われてるけど
ハイエンドにも通用するナウい手法。
そのうち、スカラCPUとのデータやり取りもネックになって、コア内にスカラユニット搭載とか
やるようになる。

CPUはCPUでSIMD命令の拡張とマルチコア化を進めてるので構造的には近づいてる。

864:Socket774
09/09/30 23:51:01 1W7EpwFu
>>862
ムショ帰り乙!

865:,,・´∀`・,,)っ-○○○
09/10/01 00:15:08 A2R0Imfa
LarrabeeがGPUをやるとスカラとベクトルが備わり最強に見える。
逆にGeForceがやると頭がおかしくなって死ぬ。

866:Socket774
09/10/01 00:41:46 345IjcTy
わろっしゅw

867:,,・´∀`・,,)っ-○○○
09/10/01 01:02:06 A2R0Imfa
冗談抜きにCUDAのプログラミングモデルの似非「スカラ」は狂ってる。



868:Socket774
09/10/01 01:23:16 2VPKMbWV
そりゃータダでTFLOPSが手に入ったらCPU屋さんは商売上がったりだ

869:Socket774
09/10/01 07:11:10 18czcCNs
>>867
評価用に環境を提供してもらってるんだっけ?

870:Socket774
09/10/01 09:06:04 s2YMtGaN
Sandy BridgeせめてBIO5を余裕で遊べるぐらいのGPU統合してくれよ・・・

871:Socket774
09/10/01 09:20:27 olMh8hfL
むしろどうせゲフォラデ積むんだから、イラネ。のほうが正しい気がする

872:Socket774
09/10/01 10:03:58 LH551D2J
>>870
インテルはハードをドライバが足引っ張っているから永遠に無理。

873:Socket774
09/10/01 11:40:39 uFEZi0hA
>>870
GPU統合型はメモリの帯域がネックになるから
パフォーマンスは期待出来ないだよ
X-BOXみたいに専用メモリでも乗せないと

874:Socket774
09/10/01 11:41:47 2VPKMbWV
熱容量をCPUと分け合うから、あんまり豪勢なGPU載せるのも
寂しい思いをすることになる。

875:Socket774
09/10/01 16:35:31 Q2f6H7At
>>874
それならデカいヒートシンクを載せられるようにパッケージ自体のサイズを大き(ry

用途によってメモリのサイズを変えたり、CPUのグレードを変えたりとかの自由度を捨てて
いっそう、メモリ・GPU・CPUをすべて統合してもいいんじゃないかと思ったこともある

そうなると、その統合プロセッサを生かし切れるマザボも限られてくるから、適切なマザボに直結
SSDとかもマザボに直づけしてだな…

モバイル用途にはARMプロ(ry

876:Socket774
09/10/01 19:12:37 RNLCKmrl
>>875
つまり75W~300Wまで乗るPCIeのボードに
メモリ・GPU・CPU・SSDを統合して
どのマザーにも刺さるようにしてだな(ry

877:Socket774
09/10/01 19:34:22 5xS5TNXo
単なるCPUボードだろう、それは

878:Socket774
09/10/01 20:24:45 X4NFQLE6
その「ボード」の付け替えって、新しいPC買うのと同義じゃねえか

879:Socket774
09/10/01 21:44:06 BGiDqj7b
URLリンク(www.4gamer.net)

各CUDA Coreには,1基の32bit浮動>小数点(FP32)スカラ演算器,32bit整数(Int32)スカラ演算器が内包される。
各SP内のFP32スカラ演算器は,Int>32スカラ演算器と並列に動作できる。


880:Socket774
09/10/01 22:35:10 2VPKMbWV
ISAに縛られずにアーキテクチャを一新できるのはGPUの長所だな

881:,,・´∀`・,,)っ-○○○
09/10/01 23:11:47 A2R0Imfa
ネイティブVLIWを公開してるRadeonは実質縛られてるのかな

882:Socket774
09/10/01 23:30:12 HKOvfhCa
団子的にfermiはどうなの?
頭おかしくなって死ぬの?

883:Socket774
09/10/01 23:45:41 +VlnUsUD
個人的にはノート用にDRAM混載GPUを作ってほしいのだが。

884:Socket774
09/10/02 00:14:09 +ZvHm9E/
バCUDA島

885:,,・´∀`・,,)っ-○○○
09/10/02 00:20:53 gcK5RVtI
>>882
倍精度=単精度/2にしたのは評価したい。
やっぱHPCの需要を求めるならその辺は最低限必要だよね。

問題はCellだ。
Cellは32コア@4GHzで512GFLOPS程度にしかならないんだが、IBMは続投するのかね?
LINPACKでトップ500の最上位を奪われるわけにはいかないからな。
IBMがCellから乗り換えるようなことがあれば、Teslaは長生きしそう。

886:Socket774
09/10/02 00:45:48 OL1dvGKL
唐突にあさっての方向からCell持ち出してくるあたり
相当に動揺してるのが見てとれる。
依然としてGPUは所詮GPUだと思うが、成熟期に達してあまり打つ手がないCPUに比べると
GPUはアーキテクチャ改善の余地がまだまだいくらでもあるのが面白い。

887:,,・´∀`・,,)っ-○○○
09/10/02 00:59:41 gcK5RVtI
俺は別にNVIDIAに敵対する必要ねーし
払うものさえ払って貰えるならビジネスパートナーだよ

888:,,・´∀`・,,)っ-○○○
09/10/02 01:10:50 gcK5RVtI
>依然としてGPUは所詮GPUだと思うが、成熟期に達してあまり打つ手がないCPUに比べると
>GPUはアーキテクチャ改善の余地がまだまだいくらでもあるのが面白い。

典型的な馬鹿だなー

やってることはGPUの「CPU化」だろ。
迂回経路が違うだけで、性能を追求すれば汎用性とスループットの両方をバランスよく兼ね揃えたプロセッサに行き着く


↑汎用性

    →→→Larrabee
CPU↑     ↑
   ↑     ↑
   ↑     ↑   
     →→→     スループット
       GPU     →


って、これはIntelのプレゼンの図そのまんまだな

889:Socket774
09/10/02 01:26:11 N6rzYjfK
団子はGPUのCPU化も
CPUのGPU化も否定的だと思ったが

890:,,・´∀`・,,)っ-○○○
09/10/02 01:36:31 gcK5RVtI
Cellの話題を持ち出した意味も頭が悪すぎて理解できてないようだが
あんな腐れアーキをゴリ押しでロスアラモスに大量導入させたIBMの政治力はなんだかんだで凄いってことだよ。
もっとも、あの時点でIBMにとって一番コスト当たりの倍精度演算性能が優れてたプロセッサってのは事実だからな

ちなみにLarrabeeの場合はx86/x64命令セットとIntel謹製の開発ツールという
TOP500においても最大シェアのエコシステムが既にあるので、Cellの後釜を狙う必要など最初からない。
IBMと競業関係にあるHPCベンダーだけでも十分な数は売れる。
仮にIBMがLarrabeeを採用する時にはどのみちIBMはCellを見捨てることになるだろうし

891:Socket774
09/10/02 01:37:49 3n1WK2/L
Cellって倍精度強化したバージョンはどうなった?

892:Socket774
09/10/02 01:48:18 5/nAxaQv
>>849 単一コア4スレッドHyper-Threadingが、いいてことだな。
以前デュアルコアOpteronよりシングルコアOpteronのぜんぜんいいということを聞いたことがある。

893:,,・´∀`・,,)っ-○○○
09/10/02 01:49:00 gcK5RVtI
>>889
だってさ、Teslaが1.6GHzで動いたとして、スカラ性能は400MHz相当だろ。
ミッドレンジのARM以下だべ?
ベクトルコンピュータのスカラ性能の残念っぷりってスパコンで現役だった時代からそんなもんだったらしいけどさ

まあスカラで使っても「2GHz動作のPentium」になるLarrabeeは
本物のスカラユニットを持たないGPUに対して一定のアドバンテージとなりうるかもしれないね

スカラプロセッサの中でx86の性能上の強みは生き残ったCPUアーキテクチャの実装で現状最強といっても
良いAGUを用いたメモリアクセスを様々な演算に対して畳み込むことができることだ。
無論、LarrabeeのSIMD命令についてもそのルールは適用される。
ああいうフォーマットは固定長命令のRISCじゃ絶対不可能だからな。

894:Socket774
09/10/02 01:56:32 dRjZdQnb
>>885
プロセッサあたりの性能なんてTOP500とはおよそ関係のない話なんだが。
具体的な構成が出ている話では11年11月期予定のSequoiaが最大だと思うが、
これに使われるのはたった16core200GFLOPSのプロセッサだ。

895:,,・´∀`・,,)っ-○○○
09/10/02 02:12:08 gcK5RVtI
GPUとCPUの曖昧化が進むと同時に、モバイルではGPUは旧来通りのGPU機能への回帰が進む
だいぶ前に指摘してるけど、IntelはLarrabeeとは別のGMAを新たに開発中だ。
Atom用だろうけどね。
リッチなプログラマブルシェーダ搭載のGPUなんてウルトラモバイルには無用の長物だし。
それも1つの流れ。

プログラマブルシェーダなんて全部x86でやってもいいと思ってる。
シェーダがプログラマビリティを追求すれば究極的にLarrabeeのような「シェーダ機能を持つCPU」になる。
Larrabeeと似たような柔軟な構成のプロセッサになるとしてx86でないことにメリットがあるか?ないよ。

だからこそGPGPUは下らない。

896:,,・´∀`・,,)っ-○○○
09/10/02 02:14:05 gcK5RVtI
>>894
電力効率は大事だよ。
エネルギー消費大国のアメリカは知らんが。

プロセッサ・ノード間のインターコネクトだってボトルネックあるいはコストになる。

897:Socket774
09/10/02 02:17:22 /mpTaHkC
だからコンフィギュラブル・プロセッサをだな(ry

898:Socket774
09/10/02 02:19:10 /mpTaHkC
あ、ダイナミックリコンフィギュラブルプロセッサか

899:,,・´∀`・,,)っ-○○○
09/10/02 02:21:23 gcK5RVtI
DAPDNAって売れてるのかしら。

IPflex社はDocomoのLTE網用の組み込みチップ作ってたな。
こっちのほうがよっぽど大きな需要だが。


900:,,・´∀`・,,)っ-○○○
09/10/02 02:23:12 gcK5RVtI
父さん、したのか
URLリンク(slashdot.jp)


901:Socket774
09/10/02 02:32:13 /mpTaHkC
2009年7月ってまたタイムリーだなおい。

intelも過去にこんなのあったらしいけどどうなったんだか。
URLリンク(www.atmarkit.co.jp)

リコンフィギュラブルの未来は暗そうか残念

902:,,・´∀`・,,)っ-○○○
09/10/02 02:44:39 gcK5RVtI
FPGAですら使い回しがききやすい単位で専用ユニット化ってのが一つの流れ

903:Socket774
09/10/02 03:36:09 A1cIirm6
機能単位を細粒度化しても大して使い道無い割に
パフォーマンス落ちちゃうからね。

904:Socket774
09/10/02 09:55:05 FQVjlqx+
TOP500の中でFLOPS/Wattでpower系は上位だからな。
あの手のシステムはプロセッサあたりのFLOPSだけ良ければいいってもんじゃない

905:Socket774
09/10/02 13:23:21 OL1dvGKL
>>888
LarrabeeはCPUの汎用性を追求した分だけGPUのスループットを犠牲にしているのを
その図は表現していないな。

906:Socket774
09/10/02 13:26:25 tliYUPvC
Blue Geneなんかは各プロセッサの性能は糞みたいなものだからな、超物量作戦
かわりに並列度が低かったりノード間通信が重い場合は見事なまでに乙るが

907:Socket774
09/10/02 14:30:51 FQVjlqx+
帯域幅ではIA32では勝負にならない帯域モンスターのものがある。
FLOPS/Watt ではIA32よりも優れたプロセッサがある。
IA32はよく言えばどちらも酷くない程度に確保、悪く言えば中途半端

908:Socket774
09/10/02 14:36:01 9P5r0nqh
>>888



↑汎用性

    →→→Fusion
CPU↑     ↑
   ↑     ↑
   ↑     ↑
     →→→     スループット
       GPU     →

909:Socket774
09/10/02 16:11:39 OL1dvGKL
さすがに無い物と同列に扱うのはララに失礼

910:Socket774
09/10/02 16:20:06 LfpprgKe
ハリボテ300のことですね
URLリンク(www.4gamer.net)

911:Socket774
09/10/02 17:30:46 PXLvBrIA
    →→→Larrabee
CPU↑     ↑
   ↑     ↑
   ↑     ↑
     →→→     スループット
   ↓  GPU     →
   ↓
  Fusion<ゴール!!

912:Socket774
09/10/02 19:25:06 fgIwCeOz
SandyBridgeを否定してどうすんだよ

913:Socket774
09/10/02 20:56:51 CuTu9Z4p
IDFのららびーデモ馬鹿にしてたN厨が見事なブーメランだった件について

914:Socket774
09/10/03 00:24:38 AJbG9Ucn
ブーメランとか言ってる余裕ないだろ


現在Intelが言う“Larrabee”は3世代目?
URLリンク(northwood.blog60.fc2.com)
>最初の2世代は大きく熱かった。
>なので、Intelの考えていたものとは合致せず、失敗となった。

製品化予定のLarrabeeは第一世代 by中の人
URLリンク(blog.livedoor.jp)
>IntelのNick Knupfferさんによると、第一世代のLarrabeeを開発中であり、
>その前のバージョンがあるなどといった話は非常にくだらない話だとのこと

デモに使われたLarrabeeはA6シリコン
URLリンク(northwood.blog60.fc2.com)
>IDFでデモに使われたのはバグが多いA6(?)シリコンで、
>バグを直したB0は、IDFには間に合わなかったそうな。


~~~~~~~~~~~~~~~~~~~~~~~~~~~~


URLリンク(northwood.blog60.fc2.com)
>“Fermi”はA1 revisionのチップが2009年第35週―8月後半に作られた。
>通常NVIDIAはA2 revisionのチップを製品版として投入しています。

915:,,・´∀`・,,)っ-○○○
09/10/03 03:09:33 1UBX1Exm
>>905
主要ターゲットたる物理演算・科学技術演算は本来、GPUの仕事ではないぜ?
GPUの効率ってそもそも何だ?
ブレてるぜ。

>>907
その例はどっちも同じ方向なんだが?
一般的にはFLOPS数を高めた分だけメモリ帯域が必要になる。
トランジスタの個数に制限があるなら汎用性が犠牲になる。
x86が優れてるのはスカラ演算の絶対性能だよ。
別にFLOPSは高いわけではない。
でも高くないからこそ、てこ入れの余地がある。

それをやるのがAVXの256ビット、LNIの512ビットSIMDだ
データレベル並列度を要求するGPUのようなハードに
ソフトが付いていくのなら、SSEでたかだか128ビット幅でしかないCPUの
SIMDユニットを増強することも同様に費用対効果が大きいよな。
逆に256~512ビットの程度のSIMDですらパフォーマンスゲインが
得られない演算が、より高い並列度を要求するGPUでの実行に向く理由がない。

916:,,・´∀`・,,)っ-○○○
09/10/03 04:11:24 1UBX1Exm
GPGPUは最終的にはCPUとGPUのデータ交換がネックになる。
GPUに処理させるという苦行に対してやる気を削ぐだけの
CPUのSIMD演算強化をしてやればそれだけでGPGPU市場は廃れる。

なんにせよスカラユニットとベクトルユニット間のデータをオンコア
あるいはオンダイでやり取りできるのはトラフィック削減の
大きな決め手となりうる。
だからこそCPUがGPU(というワイドなSIMD)機能を持つ必要があるわけだ。
ディスクリートカード版のLarrabeeは逆にCPUに処理を依頼することなく
粒度の細かい処理を自分自身でこなせる。


GeForceにはCPUが絶対必要なのに、IntelはGeForceを要らない子にしようとしてる。
そろそろNVIDIAも完全に自律動作できるGPU作らないとだめなんじゃね?
たとえばGPUだけでWindowsが動くくらいの
(どっちかというとLarrabeeが一番それに近い気がするんだが)

917:Socket774
09/10/03 04:29:59 2gklpHBs
N社を要らない子にする目的は
解散後の人的鉱床目当てのような気がする

918:Socket774
09/10/03 04:30:13 dj72eU0k
たかが数十kB程度に収まる要素数しか扱えないのに?オンダイで?うれしいの?へーw

919:Socket774
09/10/03 04:35:17 dj72eU0k
L1に収まりきらない要素はL2とL1のデータ交換がネックになる。
L2に収まりきらない要素はL3とL2のデータ交換がネックになる。
L3に収まりきらない要素はメモリとL3とデータ交換がネックになる。
メモリに収まりきらない要素はディスクとメモリのデータ交換がネックになる。

ターゲットを何処に持ってくるか、どういうデータハンドリングを行うかで
得手不得手が出るだけですね、はい。

920:,,・´∀`・,,)っ-○○○
09/10/03 04:54:01 1UBX1Exm
再利用頻度の高いデータも低いデータも読んでは書き戻しやってるから
帯域が足りなくなるわけで。

チップ間を跨ぐ時点で狭い帯域とレイテンシがネックになる

たとえ小容量でも低レイテンシで広帯域帯域のデータやりとりができるなら
それにあわせてデータ処理に対するの時分割の方法を変えるだけだ。
処理単位を細分化してな。
その程度も頭のないやつなら尚更GPGPUは使いこなせない。

921:,,・´∀`・,,)っ-○○○
09/10/03 05:05:11 1UBX1Exm
ちなみにGT200のスクラッチパッドメモリってさ、NVIDIAの言う
「1スレッド」あたりに換算する1~2KB程度しかないんだぜ。
アクティブワープ数増やしたらそれよりさらに減る。
それに比べたらLarrabeeの4スレッドで64KB、512bit/clk×2GHz程度の
広帯域で読めるL1キャッシュって随分余裕あるぜ。
(ここは故意にアンフェアな比較をさせていただく)

ちなみにいうとLarrbeeの共有分散L2も上り512bit/clkだから
L1に収まらないならL2からノンテンポラルロードしてやればいい。
もちろんレイテンシはL1からより大きくなるけどな。

922:Socket774
09/10/03 06:02:36 itYgxTDP
で、いつになったら出るのよ

923:Socket774
09/10/03 06:39:07 2gklpHBs
おお、TDPとは素晴らしい

924:Socket774
09/10/03 06:52:26 mTCf/04J
fermiの整数には期待している

925:Socket774
09/10/03 10:12:55 Wjkxcjlr
URLリンク(www.nvidia.com)
CUDA bundles 32 threads into a "warp" and executes one instruction from each thread
per clock cycle.

これって、gt200までで、4clock続けて同じ命令実行だったのが、fermiでクロックサイクルごとに変わったてこと?

926:Socket774
09/10/03 10:17:53 7E9dm+Eu
32スレッドを32SPで処理するのだから


927:,,・´∀`・,,)っ-○○○
09/10/03 11:04:46 4dZcMvQL
その分デコーダが等速になった。

GT200まで・・・1SMあたり8SPで4クロック同じ命令を実行, 2つのSIMD命令を半速のデコーダ1基でデコード
fermi・・・1SMあたり32SP(16SP×2クラスタ)で1サイクル毎に実行, 2つのSIMD命令を等速のデコーダ2基でデコード

928:Socket774
09/10/03 12:23:29 Q7/sDLSM
SMごとにload/store unitが16個つくっていうのはどうだろう。
DRAMへのランダムアクセスが速くなったりするだろうか?
Larrabeeのほうがいい?

929:,,・´∀`・,,)っ-○○○
09/10/03 12:33:09 4dZcMvQL
解り易く書くためにああやってるがGT200から変わってない。ただのScatter/GatherをサポートしたSIMD型LSUだよ。

ロード・ストアは512ビットで、必要に応じてPermuteしてるだけ
512ビット境界を跨いだら2回読んでPermuteだな。

ちなみにLarrabeeも似たような構成。
かつ、ロード字に11bit:11bit:10bit形式みたいな圧縮データの展開およびストア時に再圧縮ができる機能が追加されてる。
100GB./s程度しかメモリ帯域必要ないって理由はその辺りにあるらしい。



930:,,・´∀`・,,)っ-○○○
09/10/03 12:40:09 4dZcMvQL
あ、GT200まではハーフワープ毎に処理してたから、動作クロックはGT200の2倍速(シェーダ等速)になってるかも。

931:Socket774
09/10/03 14:24:10 EBt7EmwF
で、結局、32nmのクロック上がった4コアCPUは
sandy bridgeまで出ないのかね?
てか、LGA1156のCPUは来年頭のi3 i5でおしまい?

932:Socket774
09/10/03 15:11:21 7E9dm+Eu
屁呑むといい、ラデオソといい
AMDって本当にものを作れないな

933:Socket774
09/10/03 15:18:07 fqnM9OjG
>>931
無知丸出しのAMD厨レス乙


934:Socket774
09/10/03 15:34:52 EBt7EmwF
>>933
いや、amd厨でもなんでもないけど。
教えてくれよw

935:Socket774
09/10/03 16:01:40 fttMiyLR
少なくともDX11世代ではNVがものを作れていない事実が
表面化しているな。性能にこだわりすぎてでかいチップに
しすぎたせいだろうが、プライドより実利だと思うけどねぇ。

GPGPUに関しては正直まとまった量のデータを高速処理
する必要がなければいらない技術だな。整数弱いし汎用性
がないし、用途としては極めてニッチ。ただ、CPUにできない
ことを比較的簡単にできるという点では今のところ価値はある。

936:Socket774
09/10/03 17:10:56 7E9dm+Eu
それは出来そこないを増量しただけの
A社製品だから

937:Socket774
09/10/03 19:22:43 CtmLyNpH
アムドに買われたのをよく思ってないアチ信者もいるだろうね

938:Socket774
09/10/03 19:29:48 mTCf/04J
AMDは墓場って感じ

939:Socket774
09/10/03 19:37:28 omeSYIQd
>>931
4コアはSandyまでおあずけ確定
ただ、モバイルでもクロックが3Ghzまで上がってミドルハイまでSandyに鳴りそうな気配はしてる

940:Socket774
09/10/03 20:31:27 EBt7EmwF
>>939
ありがとう。そっか~残念。
i5-6xxやi3のスペックみてると32nmはクロック↑と消費電力↓に
期待できそうだから、早く32nmの4コア出てほしいなぁ~

941:Socket774
09/10/03 21:39:17 NQ1jr/Z1
俺は1366-4コア-32nmがほしい
exだけでもいいので倍率自由で出してくれないかな
6コアはいかにも中途半端なんだよな

942:Socket774
09/10/03 22:08:08 YqPaX0at
32nm 4coreはXeonでいいなら高い確率で出るから心配要らん
倍率ロックは掛かるが。

943:Socket774
09/10/03 22:18:59 zEY7Lzta
>>942
確率というか、IDFで32nm 4core Xeon出すって発表してたから出る

944:Socket774
09/10/04 02:19:07 o2oxn6oh
Xeonでいいのか?

945:Socket774
09/10/04 12:24:41 z5kXxv8f
できればトリプルチャンネルのCPUにしてください(><)

946:,,・´∀`・,,)っ-○○○
09/10/04 18:30:39 TL0QkM36
Xeonで4コア専用マスクがあるならCore i7としても出回る可能性高いんじゃね?

947:Socket774
09/10/05 02:34:01 e5iwUBaE
クアッド程度ならデュアルチャネルでも滅多に飽和しないんじゃないの、と言ってみる

948:Socket774
09/10/05 03:22:56 W9Z639+2
↓そうなんじゃないの?

949:Socket774
09/10/05 05:52:21 dQPiMJ9d
8コア出るの遅れそうだな

950:Socket774
09/10/05 23:01:41 s9zM9MTL
なんで?

951:Socket774
09/10/06 01:11:41 0jqRPoVD
Xeonで3.8G程度のを出してくれるんだったらOCなんかしないんだがな
はやく1366-4core-32nmでないかな

952:Socket774
09/10/07 20:03:57 Vte7QM0Y
はやいところメインストリームのソケットを決めてくれんと・・・

953:Socket774
09/10/07 20:47:00 3Nthrq7N
メモリーモジュールの世代交代よりも短期間でソケットを変えるのはやめて欲しいな

954:Socket774
09/10/07 23:39:56 wXSwJT2h
ソケットころころの悪いくせがなぁ。
これさえなければまだインテル選んでもいいんだけど。

955:Socket774
09/10/08 01:03:36 4YLna2yT
はあ?延々775だったじゃないか

956:Socket774
09/10/08 01:06:06 AK6R+kQM
775はCPU出るたびに過去マザー切捨てだったじゃないか

957:Socket774
09/10/08 01:09:36 IhK2U2dj
ソケットなんて意味無いってことだな

958:Socket774
09/10/08 01:09:48 fbyVHvbd
865G(2003年に出たチップセット)のLGA775っつー変態ママンのCPUサポートリスト
URLリンク(www.gigabyte.co.jp)

959:Socket774
09/10/08 01:13:22 AK6R+kQM
>>958
旧チップセットはサポートしたけど旧マザーは切り捨てだったんだ。
つまり結局CPU乗せ換えアップグレードは出来ずに
マザーごと買い換えるしかなかった。

960:Socket774
09/10/08 01:15:43 SABQf9WN
このアホ何勘違いしてんの
母板屋さんに言うべきことなのに

961:Socket774
09/10/08 01:16:18 IhK2U2dj
で?

962:Socket774
09/10/08 01:20:47 T2g9GU+H
とりあえずID:AK6R+kQMは
・ママンメーカー、銘柄を目利きできない
・マイクロコード改造技術がない
ということだけわかった

963:Socket774
09/10/08 01:23:22 AK6R+kQM
アホ突っ込み乙。
Intel側が電源要求なんかの仕様を変更してるのが原因でマザー側の問題ではない。

964:Socket774
09/10/08 01:29:36 jbYWNn0K
LGA775登場以降のTDPが下がっていく時代の(微細化するからアンペアは減り難いが)
VRD・VRM要求基準変更はクリティカルな理由にならんよ。

965:Socket774
09/10/08 01:31:57 AK6R+kQM
それがクリティカルな理由だったんだがw
アンペア増えたしな

966:Socket774
09/10/08 01:39:35 IhK2U2dj
で?

967:Socket774
09/10/08 01:41:27 s+jotPtL
>>959
とりあえず挿せや。
起動時ワーニングメッセージ出たり、異なるクロックで動作したりするかもしれないけど
普通に動くから。

968:Socket774
09/10/08 02:25:01 OKJkgn49
正常動作しないかもしれない。だとしても正式対応しているわけではないのでそれが何か? ってもんで。

しかし>>958へのツッコミとしては>>959は不適切な気がする。
>>958は旧ソケット切り捨ててもチップセットを対応させた例だろ。

969:Socket774
09/10/08 03:10:13 JkOefiX3
良く分からんけど、corebootインストールしたら動くようにならんの? >マザボ
URLリンク(www.coreboot.org)

970:Socket774
09/10/08 22:50:53 XTIDpxsQ
特に今後はSSATA3.0やUSB3など、帯域食いまくりの高性能IFがぞくぞくでてくるから
今のExpress Gen2 x4なDMIでは耐え切れないでしょう

どっちにしても新IFかQPIを使う羽目になるんじゃないの?
なんかLynnfieldもSandy BridgeもなんだかんだでQPIはダイについてるわけだし

971:Socket774
09/10/08 22:52:15 XTIDpxsQ
あと、LGA1156って、QPI用の電気接点がすでに予約してあるという噂を聞くんだけどなあ
1155で有効化して、チップセット接続に使われても驚かない

972:Socket774
09/10/08 23:10:15 FaMiMUS1
それはJasper Forestでプロセッサ間インターコネクトで使われる

973:Socket774
09/10/09 12:54:57 vkz64899
「Windows 8」「Windows 9」は128ビット版も登場
URLリンク(www.itmedia.co.jp)

974:Socket774
09/10/09 18:19:14 LunjpR15
つまり
Windows8が出るのは


15年後か

975:Socket774
09/10/09 19:54:00 rdXzYJ33
>>973
イタタニウム系列か。

976:Socket774
09/10/09 19:54:14 H2Nl87rZ
128ビット化させた時の旨味ってコンシューマーにあるの?

977:Socket774
09/10/09 20:30:30 LunjpR15
こういうメモリが実用化されれば128bit OSの出番かもなってレベルの話
URLリンク(eetimes.jp)

978:Socket774
09/10/09 20:33:20 DtjX4WTy
ないよ
URLリンク(journal.mycom.co.jp)

979:Socket774
09/10/09 21:04:32 IE14B8BD
>>978
このライターは「漢字は2byteコードだから16bit CPUじゃないと」という
言い草がどれだけバカにされたか知らんのか

980:Socket774
09/10/09 21:09:26 tIOXOA08
結局問題になるのはメインメモリ量の壁だけだな

981:Socket774
09/10/09 21:13:35 pztqRgvf
128bit演算を多く使うような謎システムには効果あるはず

982:Socket774
09/10/09 21:17:38 0dRcvGDd
大原の連載のはずなのに…高梨遊って誰だよ

983:Socket774
09/10/09 21:42:17 7+sTiWXA
詳しい理由書いてないけど、当初はペンネームで書いていたのが、
途中で本名で書けるようになったらしい。

984:Socket774
09/10/09 21:51:15 H2Nl87rZ
>>977-981
サンクス
やっぱり一般人にはあまりウケなさそうだね

985:Socket774
09/10/09 21:59:43 uf0iuMNS
>>981
PS2のエミュレーションですねわかります

986:Socket774
09/10/09 22:08:04 60Uj9uTs
仕事上ではインメモリDBのような、お高いソリューションを提案する立場だけど
会社のクライントPCはXP 32bitだし、自宅PCも32bit×3台。

987:Socket774
09/10/09 22:21:35 pztqRgvf
ビット数増えると多倍長演算・大きなビット配列・固定長memcpyあたりが早くなるのか?
マルチコア以前の知識だけど。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch