10/11/03 08:56:48 NtTeKFkQ
RWT掲示板から拾ってきたネタですが、GCC Sumit 2010 で IBM がスーパーコンピュータ用の新アーキテクチャのコンセプトついて語ったのこと。
URLリンク(gcc.gnu.org)
新アーキテクチャの概要は下記の通り。
- 64-bit GPR x 256
- FPR や VR 等、専用レジスタは持たない
- 上記汎用レジスタを4分割し、それぞれに専用 ALU を割り付ける
- 浮動小数点やベクトルは、上記 FPR と ALU の組を束ねて使う。例えば 256-bit SIMD はスカラレジスタを4本まとめて使用。
- レジスタウィンドウ
- 命令長 40-bit 固定
- 各コアにローカルメモリ (LS を持つ)
- ただし、異なるコアの LS は異なるアドレスを割り付ける
- 全体としては NUMA
CELL/B.E. から LS, ユニファイド・レジスタ, 多数のアーキテクチャレジスタ, といったアイデアを拝借した新世代 Blue Gene 用プロセッサというところでしょうか?
その他、汎用レジスタを FPU や SIMD に流用するのは、Motorola の計画した Book-E SPE (CELL の SPE とは異なる組込用ISA拡張)、複数レジスタをまとめて使うのは Blue Gene の Double Hammer FPU, レジスタウィンドウは日立の SR8000 などの影響が見られます。
542:Socket774
10/11/03 11:59:57 Cg+Y/RgW
URLリンク(twitter.com)
これからはこういう形態が一般化するんじゃないかな
543:Socket774
10/11/03 12:38:00 8ijhqeoG
結局ipadをターミナルとして使う場合でも、無線キーボードほぼ必須だから、
最初からふつうのキーボードつきのPCのほうがいい
PCだと、使い勝手のいい使い慣れたターミナルソフト使えるしね
544:Socket774
10/11/03 15:21:41 Ry8/x6qC
なんでiPadスレになってるの。
545:Socket774
10/11/03 16:01:09 5F4SBNYk
知らん
そもそもCPUな何でもよくね? あれ。
省電力でさえあれば
546:Socket774
10/11/03 16:43:38 Cg+Y/RgW
そう。そこそこバッテリがもつなら中華パッドでいい。
547:Socket774
10/11/03 16:49:53 5F4SBNYk
いやいや、そもそもハードで現状の中華パッドは出来が悪いらしいが(改造バカさんの動画ソース)
iPadのいい点とされてるところはタッチ最適化されたOSとAppleのオンラインショップなんで
中華パッドでは今のところ代替できないと思う
というかCPUアーキテクチャ関係ねえw
548:Socket774
10/11/03 16:57:37 gscqnwYO
A4ってARMとPowerVRじゃないか
ゲーム機みたいにハード決めうちで最適化できるのが大きいと思う
549:Socket774
10/11/04 13:57:49 QK+ledZk
>>541
LSあるならSPE型かね
ここの住人に聞いてみたいけど、
ベクタ演算能力を伸ばすのに
LS持ったSPEタイプ
Larrabeeで失敗したけどメニーコアにSIMD載っけたタイプ
AMDがやろうとしてるGPU統合型
どれが最終的に生き残ると思う?共存?
550:Socket774
10/11/04 14:08:33 ++XYEmCH
>>549
それぞれ用途が違うから全部残る。
ただ期待で言うならAMDがGPU統合を順調に進めて、
x64命令セットみたいにIntelに先駆けてGPUを使役する命令セットを規格化してしまえば、
GPGPUどころじゃなく使いやすくなるんじゃないかと期待。
命令セットのベースはIntel AVXでひとつよろしく。
551:Socket774
10/11/04 14:43:55 0gYNaztG
コヒーレントキャッシュはダメだろう
552:Socket774
10/11/04 17:28:04 d83qjfyQ
そろそろIBM製のGP GPUとか見てみたいものだ
553:Socket774
10/11/05 00:25:40 GKyhDZsl
変化の激しいGPUに命令セット縛って何の得があるの?
554:Socket774
10/11/05 05:47:04 J5u7bZZK
最近のGPUなんて主要機能はソフトウェア実装だよ
GPUのデバイスドライバ読み込むときに、デバイスドライバに含まれた、GPUチップ上で動くコードをGPUに転送してる
で、ドライバのアップデートを行うと、GPUチップ上で動くコードがアップデートされ、
バグ修正やパフォーマンスアップされる
555:MACオタ
10/11/05 08:10:42 H5QYrNmO
POWER/PowerPC に関する話題を二つ。
まず、IBMのHPC部門の marketing manager, Herb Schultz 氏が HPCWire に『HPC 分野で POWER 採用製品と Blue Gene は5年以内に統合される見通しである』と語ったとのこと。
URLリンク(www.hpcwire.com)
---------------------------
Schultz thinks the Power and Blue Gene lines may
converge in 5 years or so, but for now they're keeping
those products distinct.
---------------------------
二つ目は、Freescale は AltiVec 搭載の QorIQ 製品を数ヶ月以内にリリースする見込みという情報を Military & Aerospace Electronics 紙が伝えています。
---------------------------
Freescale will announce specific QorIQ microprocessor
products with AltiVec technology within the next few
months, and product announcements from the single-
board computing industry should come at about the
same time, Beck (Glenn Beck, segment marketing
manager for aerospace and defense and single-board
computing at Freescale Semiconductor) says.
---------------------------
556:MACオタ@補足
10/11/05 08:12:28 H5QYrNmO
>>555の後半の話題のリンクです。
URLリンク(www.militaryaerospace.com)
557:Socket774
10/11/05 09:21:44 oiWG4S1v
業務サーバ→従来コア・SMP
個人PC→ヘテロコア、SIMDコアはGPU用途に利用
HPCサーバ→ヘテロコア、SMIDコアはベクトル系演算に利用
ってなる方向だな
こうすれば、個人用PCとHPCサーバで、同じアーキテクチャを使いまわせる
558:Socket774
10/11/05 09:42:45 EJ55UID/
PowerとPowerPCの関係が脳裡をよぎった俺。
559:Socket774
10/11/05 10:17:49 jVggzaVh
Intel,IBM,AMDのCPU統合組みに対して外部GPUのNvidiaの生き残る可能性は0
560:Socket774
10/11/05 16:17:53 en7glX3A
そこでVIAでつよ。
561:Socket774
10/11/06 00:10:21 SJGA4eco
こんなこと言われているが本当なのかな?
URLリンク(cloud.watch.impress.co.jp)
>HPC分野でNVIDIAが成功するであろうというのは、もはや業界の一致した見方になっている。
PCが行き詰まったらHPCも立ち行かなくなると言われていたと思うのだが。
>>550
それが簡単に出来たら他社も同じアプローチを取るんじゃないかなぁ、と思ってみたり…
562:Socket774
10/11/06 00:21:33 7sJx79uH
PCとHPCは全然違うのになんで立ちいかなくなると思ったの?
563:Socket774
10/11/06 00:36:05 pZIAMSud
PC市場で数が出なくなると実質HPC専用のチップとなってしまい
現在のように比較的安価に提供できなくなるため
価格競争力がなくなるという理屈だったかと
564:Socket774
10/11/06 00:46:17 6wYIogic
>>561
笠原一輝か…正直微妙
565:Socket774
10/11/06 10:38:05 yZiwF52L
>>561
このスレのリンクでも読めば解ると思うが
成功するのは直接の競合が出てくるまでのここ2,3年限定
それ以降は生き残れないってのは大半の見方でしょう。
566:Socket774
10/11/06 10:43:19 fc7v/r6g
マイクロソフトは2000年くらいにHPC分野はGPGPUになるって予想してたぞ
567:Socket774
10/11/06 10:54:41 fc7v/r6g
ソースはこれね
URLリンク(pc.watch.impress.co.jp)
568:Socket774
10/11/06 11:12:48 cr5KZY/u
>>566
疑ってすまんかった…。
GPGPUなんて眉唾と思ってた俺が間違ってた。
569:Socket774
10/11/06 11:16:26 pZIAMSud
その記事ではMicrosoftの人はGPUをPCの中で汎用プロセッサとして使うという話をしてるだけで
HPCの話をしているのはATIの人じゃないか
570:Socket774
10/11/06 11:41:40 fc7v/r6g
突っ込み所はそこかよw
571:Socket774
10/11/06 22:06:35 cr5KZY/u
インド Notion Ink ハイスペック10インチタブレット「Adam」
URLリンク(gpad.tv)
これからは中華パッドだけじゃなくてインドパッドもあるのか…
572:Socket774
10/11/06 22:28:24 E+mAGeno
>>570
ソースになってないと思うのだが
573:,,・´∀`・,,) ・・・→ -○○○
10/11/07 01:58:40 Jw/kKYNC
> ところが、NVIDIAはそうしたデータやホワイトペーパーなどを提供していない。
> 実際、Teslaのピーク時消費電力は240W近くにも達するので、クアッドコアCPU(130W)の1.85倍となる。
> つまり、性能が1.85倍であったとしても、消費電力あたりの性能はイーブンということになる(しかも
> Teslaは単体では演算に利用できず、必ずCPUが必要になる)。あるOEMメーカーの関係者によれば、
> 現時点では消費電力あたりの性能という意味では、x86プロセッサベースのシステムでも、x86プロセッサ
> +GPUのシステムでもさほど大きな違いはないという結果がでているという。このあたりは、今後Tesla
> ベースのシステムが普及するにつれて、検証されていくことになるだろう。
ここ面白いよね。
x86はAVXやFMAなどで急速にGPUとの性能差を詰めることができる。
メモリ帯域の問題も大容量・広帯域のキャッシュメモリによってある程度のアプリケーションでは緩和できる。
一方でGPUはキャッシュメモリにトランジスタを割けないのでVRAMの帯域の伸び悩みがそのまま足かせになる。
牧野氏がGPGPUに将来性がないと指摘するのはこのへん。
具体的にはSGEMMのFermi(C2050)のパフォーマンスは400GFLOPS程度でLarrabee(Knights Ferry)の
評価ボードの半分程度しか出てない。初代のTeslaと比べても伸び率は低い。
GPUとして最適な構成は必ずしもHPCアプリケーションに最適とは限らないということ。
このギャップを埋めるには、GPUとしてはトランジスタをSRAMに大幅に割くことができるだけのパラダイムシフトが
求められるわけで(タイルレンダなど)、Intelが(GPUとして)Larrabee投入を狙ってるのはこのタイミング。
574:Socket774
10/11/07 02:25:29 corJ5hTD
GPGPUはコンピューティングの制約が大きいよね。
安価に性能出すんならいい選択肢だと思うんだけどね。
ただなんとなく箱庭感を感じてしまう…。
帯域問題は何かブレイクスルーがあって、一発で解決しちゃうかもよ。
SRAM化もだけど、GPGPU間インターコネクトとかで進歩があるかも。
Larrabeeはどうなんのかね…。
捨ててええ気がするんだけど…。
次出てくる時は名前は同じでも全然違うものになってる気がする。
命令もそう感じるんだけどさー、なんかさー、レジスタの使い方ってのが、
x86じゃ駄目な気がするんだ…。
もしやるとしたら、386,x64に続いて新しい基盤作らなきゃ駄目だと思うのよね。
もっと豊富なレジスタがあった方がいいと思うよ。
というかもう完全に一新しましょうよ…Intelさん…。
IA64newとか作りましょうよ…。
で、よさげなブログめっけた。ここメジャー?
スパコン漫遊日記 (II) by 能澤 徹
URLリンク(blog.livedoor.jp)
経済的な話が多く乗ってるのが良いと感じた。
575:Socket774
10/11/07 02:49:21 n2GlWq/3
>というかもう完全に一新しましょうよ…Intelさん…。
>IA64newとか作りましょうよ…。
Intel「もうAVXでいいだろ。まったくどこぞの無能がプレフィックスにプレフィックスを継ぎ増しするからこんな訳わかんねー事に…」
576:Socket774
10/11/07 02:52:39 9suA46Mu
GPGPUとx86のパフォーマンスの関係は、このへんが分かりやすい。
超並列プロセサ - GeForceアーキテクチャとCUDAプログラミング
URLリンク(journal.mycom.co.jp)
577:Socket774
10/11/07 03:09:04 lJP5matH
>>574
ニワカおつ
578:Socket774
10/11/07 04:46:20 KQaWwIT6
>>574
GPGPU vs x86 etc のほかに GPGPU vs Blue Gene てのがあるよ
Should I Buy GPGPUs or Blue Gene?
URLリンク(www.hpcwire.com)
スパコン漫遊記は最初の頃のから読み直してみてもかなり正しい事をいってるね。
京速は失敗するとか地球シミュレータは失敗作だとか日本のスパコンは高すぎるとか、
みんな当ってるよ。
これって結局経済的なことがしっかりしているってことかもね。
579:,,・´∀`・,,) ・・・→ -○○○
10/11/07 05:09:54 Jw/kKYNC
消費電力の割合を見ればデータ転送コスト>演算コストってのはNVIDIAも認めてるわけでして。
もはや物理的な限界がみえてるのでGDDR*の規格刷新に依存した革新は殆ど期待できない。
EDRAM混載とタイルレンダへの移行は業界共通の進むべき道。
Dally教授はx86のフォーマットだのデコーダの効率がどうこうみたいなミクロな点でのみLarrabeeを批判していたが
逆に言えばNVIDIAもいきつくところはLarrabeeと同じということ。
(まあ、このへんはデコードコストがかかってもL1Iキャッシュの格納効率を高めたほうが結果性能を高められるという
x86側の利点もあるわけで)
580:Socket774
10/11/07 05:28:35 mw35GxTf
>>575
AMD
「まったく、どっかの無能がプリフィックスも
まともに処理できないCPU出したおかげで
64bitレジスタがまともに使われやしねー」
581:,,・´∀`・,,) ・・・→ -○○○
10/11/07 05:33:34 Jw/kKYNC
2~3年前前、俺の管理サイトでamd.comドメインからの足跡解析したことがあるけど
普通に32ビットXP使ってたぞ。
Windows 7以降、コンシューマ向けも64ビットが普通に載るようになって各社が重い腰をあげだした
感はあるが、64ビットなんてその程度ってことだよ。
バッファローとかIODATAとか尻叩かれなきゃ64ビット対応ドライバまともに出さないからな。
582:Socket774
10/11/07 05:37:01 mw35GxTf
誰のなにに対して書いてるんだ?
583:,,・´∀`・,,) ・・・→ -○○○
10/11/07 05:41:25 Jw/kKYNC
AMDは自社規格啓蒙のために無理してでも64ビットOSの64ビットブラウザ使えよと思うじゃん
俺ですらVista x64使ってたし(安かったから)
584:Socket774
10/11/07 07:59:10 jkFCjWm7
7が出るの分かってるのにVistaなんてすぐ終わるOSに入れ替えるわけないだろ
585:,,・´∀`・,,) ・・・→ -○○○
10/11/07 08:04:49 Jw/kKYNC
Vista→7は再インストール不要でそのまま移行できるぞ。
所詮はVista R2
あとXP x64ってのもありました。
586:Socket774
10/11/07 10:42:49 XACFUe77
アレブログを持ち上げるやつがまだいるとは
587:Socket774
10/11/07 11:01:06 R7kNqDm/
GP GPUに先がない?
POWER7みたくコスト度外視の巨大ダイで作ればOK
負債はいずれIBMが被ってくれるだろうし
588:Socket774
10/11/07 11:02:55 1Bs0KdY0
vistaなんてでたばっかで互換性皆無だからな
win7やっとソフト対応してたし
無理してゴミ使う必要もないだろ
589:名無し募集中。。。
10/11/07 11:03:02 rMADFOCr
いまだに「GP」GPUとか書いているやつはアホ
590:Socket774
10/11/07 11:07:25 NiYb1U23
ん?ではお利口なお前はGPGPUをどう書くんですか?
591:Socket774
10/11/07 11:37:05 dVqOhuH2
俺も気になる
592:Socket774
10/11/07 11:44:59 corJ5hTD
>>579
大規模問題に対してはインターコネクトの大幅な改善が必要だよね…。
でも光の速度に律速される、と。
ReRAMやmemristorが成功すればまた性能は向上するだろうけど、
GPUローカルメモリが数十GBとかになりそうで…。
一般との乖離が進むなぁ。
>(まあ、このへんはデコードコストがかかってもL1Iキャッシュの格納効率を高めたほうが結果性能を高められるという
>x86側の利点もあるわけで)
コード密度が高いのは分かるけど、一度整理して欲しい欲望を禁じ得ない。
おらぁやっぱりISAは重要だと思うよ。
「クラウドとHPCは統合される」という予測をしてる人がちらほらいるけど、
求められる計算の質が違うから、分かれたままじゃないのかなぁ、と思うのよね。
サービスとしては連続したものになると思うけど、
それはクラウド内にHPCクラスタが存在するような形態になるんじゃないのかな。
クラウドはARM鯖に、HPCはx86鯖に、って感じで住み分けされていくと思う。
593:,,・´∀`・,,) ・・・→ -○○○
10/11/07 15:03:34 Jw/kKYNC
> コード密度が高いのは分かるけど、一度整理して欲しい欲望を禁じ得ない。
> おらぁやっぱりISAは重要だと思うよ。
互換性を切り捨てて命令フォーマットを変える68kとかPPCなんて嫌いだけどなぁ。
x86は可変長フォーマットなので互換性を損なわずに命令を追加できる。
AVXの命令追加はSSEの整理を兼ねている。
レガシー命令は邪魔になったら切り捨てるのではなくマイクロコードでデコードするようにして
デコーダの構造をシンプルにしていくことができる。数年計画だけど。
x86は確かに1命令あたりのデコードコストは高い。
でも1命令あたりの平均オペレーション数が多いので、オペレーションあたりのコストと考えると
実はRISCと逆転する。
今のCPU業界の現状はなんだ?
クロックは上がらない、最大IPCも4がいいところ、次はオペレーション密度を高めるしかない。
ぶっちゃけオペレーション密度に関しては(古典的な)RISCって全滅だよ。
32ビットの即値をレジスタにロードするのすら2命令かかるだろ?64ビットだと4~5命令かかるよ。
そんな中でARMの強みってなに?4バイト命令のほぼ全てにプレディケート機能持つじゃん。
2ndレジスタオペランドのバレルシフトとかもできるよな。
RISCとしてみてリッチなところってせいぜいそのくらいだよ。
てかバレルシフタってメモリアドレス算出のとき以外に利用頻度高くないし。
> クラウドはARM鯖に
ARMに期待するのはやめとけよ。A15でようやく1コアあたりの性能でAtomと肩を並べられるレベルだ。
IntelがそのうちSCCを実用化してくるし、いまだに64ビット化の計画もないARMに蔵独活(笑)なんて
寝言は寝て言えというレベル。
594:Socket774
10/11/07 16:39:34 lYUXHUQW
ゲハコテ2号は名無しを止めたんだね
595:Socket774
10/11/07 17:32:17 OjobMChw
>>579
タイルレンダに将来性なんてねーだろ・・・
あれのせいでパイプライン途切れてメモリアクセス必須になるんだから
596:Socket774
10/11/07 17:47:53 ioOS7IEJ
現物出る前のCell厨がお花畑だったように、Larrabee(Knights Ferry)も現物出すまでが華。
というか永遠に出す出す詐欺状態で引っ張ってくれたほうが、お花畑妄想を続けられるのでありがたい。
597:,,・´∀`・,,) ・・・→ -○○○
10/11/07 17:49:23 Jw/kKYNC
>>595
メモリアクセスの「軽減」が目的でVRAMのメモリアクセスを無くすことは目指してない。
中間データまでいちいちVRAMに書き戻しながら処理をインターリーブしようとするからメモリ帯域が枯渇する。
598:Socket774
10/11/07 17:50:20 /QPPvxDN
雑音の知恵遅れ理論でましたw
599:Socket774
10/11/07 18:03:54 OjobMChw
>>597
タイルレンダの仕組みわかってねーんだな。
インタリーブというレベルじゃないんだわ。
考えてもみろよ。
理想は頂点がどのタイルに属するか全て決定してからレンダリングを行うわけだが
もちろん現実的にはそれはできない。
で何が行われるか知ってるか?
PowerVRでパフォーマンスあげるTipsでも調べてみるといい。
そういう情報あるかどうか知らないけど。
600:,,・´∀`・,,) ・・・→ -○○○
10/11/07 18:08:43 Jw/kKYNC
実際問題Fermiは雀の涙ほどながらもライトバックキャッシュを採用してメモリ帯域のセーブをはかってるわけで。
NVIDIAも(タイルレンダのような)キャッシュローカリティを生かしたGPUアーキテクチャへのシフトは
何度か言及している。
URLリンク(journal.mycom.co.jp)
> --それでも多数のFP演算器は必要だが、10倍のエネルギー効率は達成可能か?
>
> Dally:演算器の消費エネルギーはそれほど大きくはなく、データを移動するためのエネルギーの方が大きい。(中略)
> --そのとき、GPUのアーキテクチャは現在のFermiとは変わるのか?
>
> Dally:多くの点でアーキテクチャの詳細は変わることになると思うが、ハイレベルのアーキテクチャは同じで、
> 多数のコアを持ち、高度のスレッド並列、GPU内部のメモリ階層はプログラマに見せるというようなビューは
> 変わらないと考えている。
少なくとも階層型メモリからVRAMオンリーの垂れ流しアーキテクチャに戻ることはなさそうだな
601:,,・´∀`・,,) ・・・→ -○○○
10/11/07 18:19:52 Jw/kKYNC
>>599
わかってないね。
別にGDDR5を辞めてシングルチャネルDDRにでもやりましょうってレベルの話はやってないから。
つか、いったいどこのGPUメーカーが将来にわたってタイルレンダ否定してるんだ?
Next-Gen Tile-Based GPUs
URLリンク(developer.amd.com)
602:Socket774
10/11/07 18:24:59 OjobMChw
>>601
ローポリゴンだから適しているって書いてあるなw
603:,,・´∀`・,,) ・・・→ -○○○
10/11/07 18:50:54 Jw/kKYNC
タイル分割してからテッセレーションすればいい。
だからDirectXの固定パイプラインは邪魔臭いのだ。
愚者は経験に学ぶというけど、ITの知識ってのは日進月歩ですぐ使い物にならなくなる。
自分のパラダイムに合わないと思ったら引退を考えたほうがいい。
それともあれか?今のRadeonやGeForceのアーキテクチャがそのまんまスケールしていくとでも思ってるのか?
PCIeの消費電力枠を500Wとか600Wとかに拡張でもするか?
604:Socket774
10/11/07 19:11:11 kSg5Kuvl
>>596
Cellならともかく、Itaniumになりそうな悪寒
605:,,・´∀`・,,) ・・・→ -○○○
10/11/07 19:20:14 Jw/kKYNC
Itaniumなら特定顧客がついていまだに大黒字出してる事業じゃん。
ソニーがCell関連で出した赤字なんて・・・
GMAを置き換える計画はともかく、HPC向け特化のアクセラレータとしてちゃんと事業として成立するのか?
高利益率のXeonMPプラットフォームを売るためのエサとして考えるなら悪くもないが
TeslaにQPIでもライセンスしておいてもいいはなしだよな。
606:Socket774
10/11/07 19:23:33 corJ5hTD
Itaniumのアプローチは好きよ
IPC高いし
ああVLIWよもう一度…
>>593
>x86は可変長フォーマットなので互換性を損なわずに命令を追加できる。
結局CISCの方が現実の変化に対してロバストだっていういい見本になりましたね、x86。
>今のCPU業界の現状はなんだ?
>クロックは上がらない、最大IPCも4がいいところ、次はオペレーション密度を高めるしかない。
そこでもう一度Itaniumをだな…
>ARMに期待するのはやめとけよ。A15でようやく1コアあたりの性能でAtomと肩を並べられるレベルだ。
だけど、安いぞ。IntelがAtom系の価格を大幅に下げるんなら話は別だけど、
そうでないなら携帯端末だけでなく特定用途鯖もARMが奪いうると思う。
>IntelがそのうちSCCを実用化してくるし、いまだに64ビット化の計画もないARMに蔵独活(笑)なんて
まぁ64bit化の予定があるとしても、それまでは繋ぎのアドレス拡張で我慢するしか無いね。
逆にそこにIntelは携帯端末での勝機と、Web・DB鯖等での地盤強化を図る余地を見出すだろうけど、
携帯端末でARMに勝つのは難しいと思うっすよ。
現状まだ64bit化の恩恵を受け辛い規模の製品しかないし。
今やってるSoCが成功するなら大丈夫と思うけど、駄目だったらイメージ悪化も合わせてタハーな事になる。
SCCは…そのオプションはARMも取れる事をお忘れ無く。
607:Socket774
10/11/07 19:25:31 gt3n7jzC
まだ使いたい顧客がいるとは言え・・・これは酷い
URLリンク(itpro.nikkeibp.co.jp)
>新機種の特徴は、従来の「A200」シリーズ(4年前)よりも最大で20%処理性能が向上した点だ。
>プロセッサにはインテル製のデュアルコアプロセッサ「Itanium 9140N」を採用した。
>Itaniumシリーズの最新モデルはクアッドコアの「Itanium 9300」シリーズで、
>Itanium 9140Nは一世代前のプロセッサになる。
>最新のプロセッサを採用しない理由について「クアッドコアでは一つのプロセッサが
>停止すると、一気に4つのプロセスが止まってしまう。可用性を重視した機種なので、
>あえてデュアルコアのプロセッサを選択した」(NEC)と説明する。
>標準レンタル料金は最小構成となる「A312」で月額1170万円。
608:Socket774
10/11/07 20:07:26 cVhPjrIO
4年前より20%の向上って少なくないか?
値下げして価格性能比10倍とかかな?
609:Socket774
10/11/07 20:43:12 EZdOE41G
それがNの仕様です
610:MACオタ>608 さん
10/11/07 21:15:16 8S6xMSwl
>>608
なぜか Tukwila を採用しなかったのが原因ですが、ちょうど Unix 板の Sun スレッドで色々語られていますね。
スレリンク(unix板:204-207番)
611:Socket774
10/11/07 21:23:59 /BqENHBm
Fermiのメモリ帯域削減策はキャッシュもそうだけど、それよりもシェアードメモリ(ローカルストア)だと思う
Fermi以前から対応・読み書き可・レイテンシ2クロック
実際FermiのデフォルトではシェアードメモリがG92の3倍に設定されているし
キャッシュはどちらかというとSMを跨ぐやり取りや、シェアードメモリなんか使うのマンドクセな人でも性能出すためでしょう
Fermiが3や4になってもシェアードメモリを重視するかどうかは分からんけども
612:Socket774
10/11/07 22:55:54 Coe2pjSs
コンピュータの発展の歴史はキャッシュやメモリ、ストレージの階層化
なんだからGPUのメモリが階層化することに何の不思議も無い
613:Socket774
10/11/07 23:05:16 cBYEMzs0
量子技術へ行き着くのは何年後になるやら
614:Socket774
10/11/08 01:28:23 HKtqWWos
その前にスピントロニクスが来るだろうね
615:Socket774
10/11/08 01:59:40 kfjzbCLR
階層化を避けて袋小路にはまってるのが現状
616:Socket774
10/11/08 04:42:07 +C1P+YMF
避けてはないだろ避けては
617:Socket774
10/11/08 04:55:21 supgJuYn
>>607
今だにpc98使ってるのと同じ理由で使ってるんだろうな。 ソフト資産のため仕方なく
618:Socket774
10/11/08 05:30:04 mwHJRwC0
高額に見えるが、もしかしたらけっこう値下がりしてるのかもしれない
619:Socket774
10/11/08 09:59:00 AsgF7+7k
エラー検出・訂正機構が強化されてる新しい世代の方がいいと思うんだけどなー>いたにうむ
620:Socket774
10/11/08 12:13:36 kR/rccCY
>>603
> タイル分割してからテッセレーションすればいい。
> だからDirectXの固定パイプラインは邪魔臭いのだ。
タイルレンダのダメダメさとテッセレーションの有無は直接関係ないだろ
それにテッセレートしてみた結果となりのタイルにはみ出すケースどうすんの?w
> 愚者は経験に学ぶというけど、ITの知識ってのは日進月歩ですぐ使い物にならなくなる。
> 自分のパラダイムに合わないと思ったら引退を考えたほうがいい。
お前さん自身の自戒の言葉と理解しておくよ。
今後とも3Dレンダリングの勉強がんばってくれ。
手を動かしてみないと身につかないよ。
> それともあれか?今のRadeonやGeForceのアーキテクチャがそのまんまスケールしていくとでも思ってるのか?
> PCIeの消費電力枠を500Wとか600Wとかに拡張でもするか?
寒い詭弁
それがタイルレンダがスケールする理由にはならない。
621:,,・´∀`・,,) ・・・→ -○○○
10/11/08 13:26:35 3FffnnCD
タイルレンダが駄目じゃなくて要するにPowerVRなんだろ?
いまどきドリカスプログラマなんてお呼びじゃないんだけどな。
てかさ、キャッシュ容量分の解像度までしかレンダリングできないとかアホなこといってた人でしょ。
ストリーム処理って発想がないのに笑ったけど。
その程度PS3(Cell SPE)のレンダラでも当たり前にやってるはずなんだけどな。
PVRとの違いを説明するなら、キャッシュ(ローカルストレージ)はあくまでストリームバッファであって
データは外部メモリに配置する。
256k全部を使って処理するんじゃなくて、たとえば64kごとのデータブロックをストリーム処理する。
キャッシュ上に無いテクスチャなどのデータが必要になったら次のブロックに処理を回してメモリロードを隠蔽する。
SPEはコンテクストスイッチの仕組みを用意していないので泥臭いことをやらないといけないが、
Larrabeeならthread, CUDA coreでいうところのwarpを切り替えて実行する機構があるので
キャッシュミスが発生してもコアに空きを作らないで済む。
いいことを教えようか。この論文の人はいまNVIDIAの社員だよ。
URLリンク(graphics.stanford.edu)
↓あとこれはどうでもいい。会話が成立してないし。
> > それともあれか?今のRadeonやGeForceのアーキテクチャがそのまんまスケールしていくとでも思ってるのか?
> > PCIeの消費電力枠を500Wとか600Wとかに拡張でもするか?
>
> 寒い詭弁
> それがタイルレンダがスケールする理由にはならない。
質問をしてるのであって理由を説明したつもりはありません。
日本語できます?脳味噌沸いてる?
まあどうでもいういけど
622:,,・´∀`・,,) ・・・→ -○○○
10/11/08 13:37:52 3FffnnCD
> それにテッセレートしてみた結果となりのタイルにはみ出すケースどうすんの?w
近傍のデータを隣のコアで処理するように組めばいい。そのための高速バスなのだし。
しょせんPowerVRの経験だけじゃ理解できないだろう?
623:,,・´∀`・,,) ・・・→ -○○○
10/11/08 20:46:01 3FffnnCD
わからん人は我らがパルオ様が2002年に書いた記事でも読めばいい
URLリンク(www.atmarkit.co.jp)
んで今後NVIDIAがやることはこう。
来年登場するKeplerや更に先のMaxwellは、Fermiよりもはるかに大容量のキャッシュメモリを
搭載することになる。丁度Larrabeeか、それ以上かもわからんね。
キャッシュメモリを増量することでFLOPSあたりのVRAM帯域依存率を減らしていけば原理的に
ムーアの法則以上の速さでFLOPS/Wを引き上げることができるというのがあの性能向上予想の根拠。
Larrabeeのx86命令セットは貶しても方法論そのものは否定してない。
実際同じ方向に向かってるのだから。後藤も指摘してるが。
AMDは知らんがな。
624:Socket774
10/11/08 22:33:55 L9lSvpB6
なんだ散々ダメさを指摘されて実際Intelも手を引いたのに
未だ自分の愚かしさが理解できない馬鹿が連投してるのか
625:,,・´∀`・,,) ・・・→ -○○○
10/11/08 23:24:24 3FffnnCD
愚かなのはお前だ
Intelは手を退いてないし実際NVIDIAはLarrabeeと同じ路線だ。
来年になればわかる。
626:Socket774
10/11/09 00:12:51 OxQEd/Z6
帯域爆発どんと来い! by Rambus
URLリンク(pc.watch.impress.co.jp)
627:Socket774
10/11/09 00:15:14 kqVPAj7b
Don't 来い
628:,,・´∀`・,,) ・・・→ -○○○
10/11/09 00:30:35 5t6+3pTh
XDR2ってまだペーパー規格なんだな。
暗にPS4の計画が具体的に動いてないことがわかった。
629:Socket774
10/11/09 00:45:15 rpT2EqTd
パタヘネの ARM 版みたいな教科書はないの?
「改訂 ARMプロセッサ」は見つけたけど、2001 年出版じゃ古すぎる気がする。
630:Socket774
10/11/09 00:56:34 hGOz6H48
> 来年になればわかる。
前もどこかで似たような事言ってたな。
いったい来年とやらはいつになったら来るのやらw
631:Socket774
10/11/09 01:09:55 BH8hnmDQ
>>621
PowerVRときいてドリカスっていつの時代だよ、おっさん。
お前iOSのプログラミングしたことないってことだな。
時代についていけてないねー。
>PVRとの違いを説明するなら、キャッシュ(ローカルストレージ)はあくまでストリームバッファであって
>データは外部メモリに配置する。
>256k全部を使って処理するんじゃなくて、たとえば64kごとのデータブロックをストリーム処理する。
だ・か・ら
タイルレンダに入る前にストリーミングを途切れさせるから、
そこに高速なキャッシュがあろうが意味が無い。
> 質問をしてるのであって理由を説明したつもりはありません。
じゃあ関係ない質問だな
> 近傍のデータを隣のコアで処理するように組めばいい。そのための高速バスなのだし。
この反論書いてるときおっさん顔真っ赤だったろ?
隣のコアって何だよ?
隣のタイルのことだとするとそのタイルはもうレンダリング終わってるかもしれないんだろ?
でテッセレータ関係なく実際その状況は起こるんだよ。
そうするとパフォーマンスががた落ちする.。
まぁお前は気長にLRB待って無駄に年食ってな
632:,,・´∀`・,,) ・・・→ -○○○
10/11/09 02:34:43 5t6+3pTh
iOS(笑) ごめん、Apple製品嫌いなんだ。
そもそもうちはゲーム系じゃないのよ。
常日頃から言ってるだろ、CUDAもAVXもやってるって。OSはLinuxだよ。
あ、SH-4+PowerVR+WindowsCEな環境向けの開発なら実は俺も数年前に一時開発に借り出されてたことあるんだわ。
具体的にはSH7770ってSoCだけどな。
あとCell SPEのソフトGPUはPS3上のLinuxでも試せるよ。
完全に思い通りにレンダラ組めるので、どうやったら高速に描画できるか、
ちょっとした罰ゲーム気分でお試しあれ。
本音ゲームなんてどうでもいい。科学技術計算で数字が出せるプロセッサ希望。
変われないならGPGPUなど滅んでしまえばいい(←ものすごい本音)
633:,,・´∀`・,,) ・・・→ -○○○
10/11/09 02:53:45 5t6+3pTh
> タイルレンダに入る前にストリーミングを途切れさせるから、
> そこに高速なキャッシュがあろうが意味が無い。
お前さんやっぱ無能だな。ストリーミングの意味が解ってない。
PS3のゲーム開発とかやらせてもらえなかった落ちこぼれだろ。
たとえばSPEはMFCにコマンド送っておけば勝手にSPEにデータとってきてくれる。
その間にLSに載ってるデータだけで別の処理をしておく。
x86でいうprefetch*命令でも同じ。メインメモリのレイテンシを想定して必要になる前のタイミングで命令を発行していく。
Larrabeeの場合はprefetch*を発行してからファイバー(あるいはハードウェアスレッド)を切り替えてしまえばいい。
ポイントは必要なデータはキャッシュ(ストリームバッファ)に常に存在する状態を保つことだ。
キャッシュにないのがわかった時点で別のスレッドに回せばいい。
256kのキャッシュしかないなら1スレッド64k程度しかつかわないというのはそういうこと。
> 隣のタイルのことだとするとそのタイルはもうレンダリング終わってるかもしれないんだろ?
> でテッセレータ関係なく実際その状況は起こるんだよ。
> そうするとパフォーマンスががた落ちする.。
頂点補完に必要なデータが隣のタイルに振り分けた頂点座標なのか、ピクセルマップなのか
それすらもわかってない素人ですな。
634:Socket774
10/11/09 03:51:51 W66uFCPC
PowerVRはいつの間にか世間で一大勢力になってるぞ。
タイルに問題があるにしてもプログラムの側で対応というケースも出てくるかもしれない。