CPUアーキテクチャについて語れ Part.13at JISAKU
CPUアーキテクチャについて語れ Part.13 - 暇つぶし2ch294:MACオタ
08/10/21 05:40:21 CIoXnd95
中文版EngadgetがIDF Taipeiで仕入れたLarrabee情報を掲載しているす。
URLリンク(cn.engadget.com)
 ・コア数: 最大32
 ・動作クロック: 最大2GHz
 ・製造プロセス: 45nm~32nm
 ・今年11月にプロトタイプ登場?

コア数と動作クロックに関してわ、
コア数と動作クロックより最大ピーク性能わ、
 倍精度: 2 [GHz] x 8 [並列] x 2 [積和] x 32 [コア] = 1 [TFlops]
 単精度: 2 [GHz] x 16 [並列] x 2 [積和] x 32 [コア] = 2 [TFlops]
基本的な性能上のターゲットわ、"TFlops on Chip"ということの様す。

295:レトリック君
08/10/21 20:47:23 FLpnRXeu
>>293
> >OpenMP compierは 2種類のbinaryを含むececutable内で
> >この2階層の同期を取り扱えるような codeを生成する
> OpenMPで自動並列化するときにCPUの演算資源とLarrabeeの演算資源を同時に活用できるってこと?
> クレイジーだね!
OpenMPは演算性能やlatencyに大きな非対称性のあるthreadが混在すると
基本的にloadをbalanceさせ易くないし、PCI経由の同期はそれなりに遅く密接な
同期の間に挟まない方が性能的に有利なので、並列regionに突入するチームを
host CPUとLarabee内のthreadで混成するところまでは、さすがにやらないのでは
ないかと想像して□。
しかし、特定のH/W threadやcoreを固定的に割り付けるaffinity APIをpthreadに拡張し、
OpenMP APIはその上に乗っかるわけだし、host<->Larrabee間のmessage/data passing
protocolは非同期APIもサポートするからCUDAのようにGPUがご多忙中の裏でhost CPU
も一仕事させられる上で必用な仕組みは備わっている。
それがOpenMPのチームを編成するthreadの割付指定拡張の様な??ものなのか、
あるいはCtのみのサポートなのかは今のところ想像の域を出ない。
Ctは非常にダイナミックなのできっと何か仕掛けてくると思う。LLVMの様な仮想命令と
optimizationまで取り入れられる。○○とは役者が違う、もう参ったよって感じ。
しかし、モレは何を2chでマジレスしているのやら…

296:287
08/10/21 22:40:09 mj+qHKTV
>しかし、モレは何を2chでマジレスしているのやら…
いやいや勉強になるわ。

>CUDAのようにGPUがご多忙中の裏でhost CPU も一仕事させられる上で必用な仕組みは備わっている。
うーん、これはこれでCELLみたいにスーパーハカー的なプログラミング作法を要求しそうでやだなぁ。
あっても良いけど、いつの間にか○○しながら××することが性能出す上で当然みたいなことにならないといいね。


>Ctは非常にダイナミックなのできっと何か仕掛けてくると思う。
>LLVMの様な仮想命令とoptimizationまで取り入れられる。
Ctでコーディングしたら、コードの自己書き換えを伴った実行時最適化が掛かるってことでおk?

>>294
サンクスコ。
各x86コアが2GHz動作するってことかな?

297:Socket774
08/10/21 22:41:04 n0ZU/45N
>>289
CPU<-->GPU間が遅くて連携は難しいとか言われてたが
Chrome400程度のローエンドでこれほどなら
AMDのFusionとかの構想も結構期待できるのか?

それともChrome400が特殊なのかね?
Exponential?

298:レトリック君
08/10/21 23:55:47 xkV0DQUZ
>>296
> >LLVMの様な仮想命令とoptimizationまで取り入れられる。
> Ctでコーディングしたら、コードの自己書き換えを伴った実行時最適化が掛かるってことでおk?

印刷物は会社に置いてきちまったけれども、それでOKだと思う。
抽象IA命令だったっけな、これをruntimeに最適化しながら
具体的なIA-32、IA-64、Larrabeeなどの最適化Nativeが生成されて行くと
いうような事が確か文献に。
最近モレの周りではこういう研究もプチ流行の気配なんだ。ニヤリ

299:,,・´∀`・,,)っ
08/10/22 01:01:34 yn2f9k6s
自己書き換えっていうか動的生成のほうが正しい
文字通りの自己書き換えは(既存コードシーケンスの上書き)は、
ページ属性操作が煩雑かつトロくさくて最近はあまり流行らない
XDビットの兼ね合いもあるし。

バイトコードを動的に並べてExecutable属性つけてそこに飛ばすほうが速い


300:Socket774
08/10/22 02:52:45 72ds95ht
「粘着力はヤモリの足の10倍」、はんだ代替に使える導電性接着剤を米大学が開発
URLリンク(eetimes.jp)

なかなか興味深いですね。
アーキテクチャ関係ないけど。

301:Socket774
08/10/22 17:13:40 QGUEJiks
【1Peta-FLOPS】GPGPUについて語ろう【実用間近】
スレリンク(avi板)

302:Socket774
08/10/22 23:54:49 /t9vpjfq
消費電力は電圧の2乗・周波数に比例するって言うけど
性能も周波数に比例するから、アイドル時に電圧下がるなら
速く処理が終わる高クロックのがワットパフォーマンスは良くなんじゃない?

だとしたらPentium4は何が悪かったの?
周波数を上げても消費電力も性能も同じだけ上がるだけだけど
その周波数を上げるのに電圧を上げなくちゃいけなかったってだけ?

303:Socket774
08/10/23 00:21:58 zxkBdXPG
>>302
見通しではリーク電流を順調に減らせるはずだったけどそうはいかなかった。
それでもTDPと共にクロックを上げ続けたおかげで冷却が物理的に間に合わなくなった。

304:Socket774
08/10/23 00:35:49 svKUApOq
>>295
> Ctは非常にダイナミックなのできっと何か仕掛けてくると思う。LLVMの様な仮想命令と
> optimizationまで取り入れられる。○○とは役者が違う、もう参ったよって感じ。

おれの知ってるCtはOpenMPなC++コードを吐くコンパイラだったのだが、
いつのまにそんな高機能になったの?
ソースプリーズ

305:レトリック君
08/10/23 01:16:27 cidyWJKe
>>304
GhuloumのTechnology Jurnal 2007やWhitepaper。
forward scalingの章辺り以降VIP、VCGの記述の辺り。
今では英語のwikiからもintelのCtのサイトからリンクがたどれる。という以前に、
URLリンク(www.google.co.jp)
など…

306:レトリック君
08/10/23 01:26:41 cidyWJKe
ググるんだったらこっちの方がええんかな…
URLリンク(www.google.co.jp)
すぐに実用的製品に至るかはワカランが、appleの件もあるので

307:287
08/10/23 02:27:45 Ig/uBMS+
>>298
>具体的なIA-32、IA-64、Larrabeeなどの最適化Nativeが生成されて行くというような事が確か文献に。
ふむふむ。
インタプリタでは間接分岐を工夫しないと性能に影響が出るって論文で読んだけど、
インオーダーのLarrabeeなら、それほど影響は出ないかもね。
URLリンク(citeseerx.ist.psu.edu)


>最近モレの周りではこういう研究もプチ流行の気配なんだ。ニヤリ
kwsk!!

>>299
>自己書き換えっていうか動的生成のほうが正しい
なるほど。
しかし、これだけだとLLVMって言うよりJVMのJITっぽいよね。


308:,,・´∀`・,,)っ-○◎●
08/10/23 02:50:46 le5WL46E
やることはJVMのJITそのものだよ。
単純な演算の繰り返しなんで、コンパイル時間より実行時間のほうが多いからJITでも十分。
分岐パターンが一意に決まらない複雑な演算もやらされるJavaよりもある意味では有利。

たとえば、このアプローチが有効なのは
URLリンク(homepage1.nifty.com)
にもあるような量子化の定数を実行時に決めるやつ

GPUでやるような並列コンピューティングの場合、条件分岐の評価を最初の1回目だけあとは
同じパターンを延々繰り返しなんてのが多いからこういう最適化はかなり役に立つ。

JavaScriptエンジンも最近の実装ではJITを使った高速なものがある。
YARV(Rubyの別実装)でもXbyakを使ってx86ネイティブコードを動的生成することが試みられている。

309:287
08/10/23 03:38:21 Ig/uBMS+
Xbyak面白れぇ!使ってみよw

>単純な演算の繰り返しなんで、コンパイル時間より実行時間のほうが多いからJITでも十分。
逆に汎用言語の処理系ではLLVMみたく最適化の結果をファイルに書き戻す処理は流行りそうに思うけど。どうかな?

>JavaScriptエンジンも最近の実装ではJITを使った高速なものがある。
キモ過ぎるな、おいw
ブラウザの上でJITとか走った日にゃ、超高速ブラクラとか遭遇しそうでry)

>YARV(Rubyの別実装)でもXbyakを使ってx86ネイティブコードを動的生成することが試みられている。
ほぅ。さすがssdさんはそんなことまでやってたのか。
VM型インタプリタだから中間言語の仮想命令を一つずつネイティブ命令に置き換える実装?
それとも各仮想命令間をまたぐスーパー命令を動的に定義してくれんのかな?

YARVって確かネイティブスレッド対応だし、YARVのソースをLarrabeeコンパイラに掛けたらそのまま並列化出来そうだよね。


310:Socket774
08/10/23 19:18:18 LbWZWVyh
>>302
ロード時の電力が半端じゃないだろ。
少なくとも初期のPentium 4はアイドル時はPenII以降のデスクトップでは最も消費電力が低い部類です。

311:Socket774
08/10/23 19:48:27 wWDSOmen
>>308
> JavaScriptエンジンも最近の実装ではJITを使った高速なものがある。

唐沢俊一のトリビアなみだなwww

Lars Bakで調べると吉

312:Socket774
08/10/23 20:12:48 wWDSOmen
>>308
> やることはJVMのJITそのものだよ。

ちゃんと調べてから書けば、幼稚なことは書かずにすむ

URLリンク(portal.acm.org)

313:,,・´∀`・,,)っ
08/10/23 20:45:10 5SLKKRne
>>311-312
Googleのv8エンジンも知らないなんて幸せですね

314:,,・´∀`・,,)っ
08/10/23 20:59:14 5SLKKRne
ヒント
SoftWire

単に自分自身がネイティブコードを生成するかVMがやるかの違いでしかない

BrainFuckのJITのサンプルがあるからちょうどいいだろ

BFソースプログラムからすればXbyakで書かれたサンプルアプリはJIT型のVMとみなせる

315:Socket774
08/10/23 21:06:13 svKUApOq
「JVMの」ってのがバカにされてるところじゃない?
よくわからんけど。
JVMってスタックマシンだよな。

316:Socket774
08/10/23 21:08:39 O1XSmp3q
JIT手を見る。

317:Socket774
08/10/23 21:16:00 wWDSOmen
MACオタですら馬鹿にされたらムキになって調べてくるのに
団子って自分の知識が世界の全てだから、ずいぶん幸せそうだなww

318:Socket774
08/10/23 21:17:37 svKUApOq
あと最適化が手動のJITと同列にするのってどうなの?

319:Socket774
08/10/23 21:29:48 wWDSOmen
Lars Bakという人名すら知らない団子は本当に幸せそうだ

320:Socket774
08/10/23 21:38:53 O1XSmp3q
へえ
URLリンク(d.hatena.ne.jp)
>Self VM から Animorphic VM、Java HotSpot VM、OOVM、そしてこのほどの V8 には、“VM の魔法使い”と呼ばれるラース・バック(Lars Bak)が共通してかかわっているという話のようです。


321:,,・´∀`・,,)っ
08/10/23 21:46:44 5SLKKRne
また頭のいかれたフェンス君かな?

>>315
見方の違いでしかない。
たとえばWindows上のJVMはjava.exeはバイトコードを読んでx86ネイティブコードシーケンスを動的生成するWin32アプリとも見なせる。
あとは動的生成対象のコードシーケンスが外部ファイルかアプリに組み込まれてるか
あるいは外部ファイルがテキストかたとえばJavaバイトコードか、
の違い。

ちなみに最近はRubyも単体EXE作れるんだな

322:Socket774
08/10/23 21:51:42 wWDSOmen
>>321
> ちなみに最近はRubyも単体EXE作れるんだな

小学生の豆ちしきを披露する前に、ちゃんと調べよう

323:,,・´∀`・,,)っ
08/10/23 21:55:02 5SLKKRne
JVMやV8のネイティブコード生成ルーチンとSoftWireやXbyakのそれは技術的には同じだよ


324:レトリック君
08/10/23 21:58:46 uLYL10Hy
Perlなども単体.exe作れるが…あれはLLVM等とは別扱いすべきだな。
途中で生成されるCのソースコードはひたすらVMの機能関数呼び出しの羅列で
Perl本体の.oとリンクするわけだし…
Rubyはシラネ

325:Socket774
08/10/23 22:03:59 svKUApOq
もとのCtの話にもどると肝はJITそのものでなくその時点での最適化でしょ?
SoftWireもXbyakもそこは手動なんだから同列に語れないでしょ
むしろJVMのHotSpotなら話は近いと思うけど

326:,,・´∀`・,,)っ
08/10/23 22:11:26 5SLKKRne
v8のソースちゃんと読んだ?

ぶっちゃけ実行時最適化もVM開発者が労力かぶってるだけの話でしかないんだが。

SoftWireは元々シェーダスクリプトをx86で実行するためのVMの土台のライブラリだから
立場的にはなにも変わらない。

327:Socket774
08/10/23 22:19:49 qrrIV8EU
URLリンク(v8.googlecode.com)

Xbyakのやってることそのものだな

328:Socket774
08/10/23 22:33:24 svKUApOq
JVMのソースなら数年前に読んだよ。
V8は別にあんまり興味ない。
最適化に興味があるのでそのあたりおもしろいところがあれば紹介して欲しい。

329:Socket774
08/10/23 22:44:44 wWDSOmen
>>328
> 最適化に興味があるのでそのあたりおもしろいところがあれば紹介して欲しい。

dynamic optimizationでciteseerを検索する
いろいろ出てくるので興味のあるものをたどってゆく
citeseerに本体がなくても、著者のページにあることがあるので、タイトルでぐぐると吉

330:レトリック君
08/10/23 22:46:45 iaMxptJD
どのレベルでの最適化をご所望かワカランけど
最適化関連で多少注目していてココに書いて差し障りのないものとしては
COIN、某大学の広域、LLVMの最適化・生成、あと海外の大学の数件くらいなどしかシラン。
役に立てずスマソな。Compiler Infrastructureでググッテ見ては?
さて、一杯飲んで寝るとするか…

331:,,・´∀`・,,)っ
08/10/23 22:55:58 5SLKKRne
COINSのMLは学生時代から登録やってるが、たまに質問が投げられても中身がないな

332:Socket774
08/10/23 22:56:45 wWDSOmen
>>330
svKUApQqが静的最適化に興味があるんだったら、最近の分厚い成書をまず読むべき
Muchnickのがおすすめ

333:レトリック君
08/10/23 22:58:18 9GEasw9b
そんなことモレに言われてもシランガナw
文句ならメール書いたヤシに言えば>

334:レトリック君
08/10/23 23:00:31 9GEasw9b
>>333>>331宛ね、念のため。



335:,,・´∀`・,,)っ
08/10/23 23:03:00 5SLKKRne
おもっきり実装レベルの話をすれば、生成したネイティブコードシーケンスの両端に
RDTSCみたいなクロックカウンタしこんでかかったクロック数を計測するだけだよ
あとは経験則で最適なコードシーケンスを選んでいくだけ。

Larrabeeの場合フィードバック最適化はあまり必要ないんじゃないかと
だってコンパイル時にCPUわかっちゃうだろ?

336:レトリック君
08/10/23 23:05:08 9GEasw9b
>>335
いや、だからさ、単体レベルでもの考えすぎだって…
くどくく言いたくないけれど

337:,,・´∀`・,,)っ
08/10/23 23:46:53 5SLKKRne
逆に泥臭いことが嫌いならさ、言ってるじゃん

i社「最適化ノウハウは我々にあるから君らバカ共はCtの取得だけに勤しんでくれ」


いずれにしても肝心なことは教えないから自ら茨の道を歩む人は
計測しつつトライアンドエラーしかない

338:Socket774
08/10/23 23:47:28 svKUApOq
皆様どうもありがとう。
興味あるのはLLVMのようなリンク時、実行時の最適化です。

>>335
プロファイルをフィードバックする最適化はgccでもできるけど
それなりの効果はあるよ。

339:レトリック君
08/10/23 23:55:09 yKlJgebI
if then elseのどっちの説をストレートに通してpipeline stoleを減らすかを
profileベースで決めるだけでもそれなりに効果はああったな。
いや、15年前の技術でスマンけれども。オッチャンで悪かったな…

340:,,・´∀`・,,)っ
08/10/24 00:09:23 KkYgEOUG
静的な最適化といえば必須テクはテンプレートメタプログラミングとかの類だな
再帰とかめちゃくちゃ速くなるぜ



あ、実行時にfprintfでCのソースを動的生成してコンパイラを走らすアホなフレームワークとか知ってるが
あれはソース読んで腹筋を激しく鍛える以外の意味は無いと思う

341:レトリック君
08/10/24 00:12:33 gseqQVPN
なんかあほらしくなってきた…
寝よっと

342:Socket774
08/10/24 01:15:56 WGYTUVJN
団子ちゃんの根底にあるものをわかってれば
そんなに疲れないんだけどねー


343:287
08/10/24 01:43:43 OoG1Pbto
....何か荒れてるな。ひょっとしてオレのせい?...orz
COINSのくだりなんか政治的な匂いがするな。

>>340
>実行時にfprintfでCのソースを動的生成してコンパイラを走らすアホなフレームワークとか知ってるが
>あれはソース読んで腹筋を激しく鍛える以外の意味は無いと思う

最適化とは関係ないけど、javassitでアスペクト云々とかの事例もあるし、そこまで悪いとは思わないけどなぁ。

>>339
>if then elseのどっちの説をストレートに通してpipeline stoleを減らすかを
>profileベースで決めるだけでもそれなりに効果はああったな。

間接分岐予測の精度向上って昔からあるんだな。
VLIWが主流になるからこうゆう研究は下火になるって考えられた事は無かったのか?


344:Socket774
08/10/24 04:02:49 TKCXfGgg
>>343
> ....何か荒れてるな。ひょっとしてオレのせい?...orz
> COINSのくだりなんか政治的な匂いがするな。

いつものように、団子が自分の知っている単語(だけ)を振り回す、小学生のようなマネをしているだけです。

> 間接分岐予測の精度向上って昔からあるんだな。
> VLIWが主流になるからこうゆう研究は下火になるって考えられた事は無かったのか?

プロファイリングで分岐の最適化する話は、まさにVLIWと共に進歩したよ。

345:,,・´∀`・,,)っ-○◎●
08/10/24 04:20:02 JJ0keCsa
だまれフェンス

346:,,・´∀`・,,)っ-○◎●
08/10/24 04:24:15 JJ0keCsa
今日もJITのコンパイラソースも読めない恥ずかしいフェンス君がいたいね

347:,,・´∀`・,,)っ-○◎●
08/10/24 04:28:39 JJ0keCsa
>>343
いちいち文字列化してファイルに書き出し、更にそれと1字1字読んで解析することほど
コンピュータにとって無駄な作業はないよ。
実際問題効果は得にくい。

それならまだコンパイラのバックエンド組み込んじゃったほうがエレガント。
GCCなんてオープンソースなんだし。まあGPLだが。


348:,,・´∀`・,,)っ-○◎●
08/10/24 04:47:31 JJ0keCsa
それとね、インタプリタは字句解析→関数コールの繰り返しだから
たとえばCより速いとかさえ考えなきゃ、単純にマシンネイティブコードの
シーケンスに置き換わるだけでも十分な効果は得られるわけだよ。

普通のプログラム使ってる分には自己書き換えや動的生成といった技術では大した効果は得にくい。

まあ、Perl何かでよく多用する正規表現の評価なんかはどのみち正規表現ライブラリでやることになる。
文字列処理ばかりは、どうしてもそんなに速くならない。
まあ、Nehalemで正規表現の文字クラスを一括判定出来そうな命令も加わってることだし
SIMDに置き換え甲斐はあるんだけどね

あ、知ってると思うけどXbyakの更新ログ見てみな。度々コミットしてる「団子厨」って俺だよ。
宣伝乙だろ?

349:Socket774
08/10/24 05:15:32 OzDh+l4t
熱くなって書く前に、レスをまとめろ。

350:Socket774
08/10/24 05:29:27 RPdK9r5W
焼き団子旨そう。

351:Socket774
08/10/24 10:26:57 VSMFhSl7
XbyakってJITって言ってもJITコンパイラでなくJITアセンブラだよね
興味持つ人は少ないと思われる

352:,,・´∀`・,,)っ[2代目のたんぺ]
08/10/24 12:17:40 KkYgEOUG
もちろんアセンブラ部分の上の部分さえ作りこめばコンパイラになる。
YARVのサブプロジェクトとして使われてるyajitがXbyakベースのコンパイラ第一号だ

Xbyakの動向はRuby教祖まつもと氏も関心をお持ちのようだよ。

353:Socket774
08/10/24 12:53:08 nPsOzf0O
gccのasm()の方が好みだな。rtl式使えるしcompilerは当然既にあるし
つかスレチ

354:,,・´∀`・,,)っ
08/10/24 12:55:43 KkYgEOUG
それただのインラインアセンブラ
JITは実行時生成だ

355:Socket774
08/10/24 13:00:44 /SfLy6s3
遊びとしては面白いだろうけど使う気が起きないわ。

356:Socket774
08/10/24 21:53:28 AnZEaAc/
>302
Pen4は内部で早いうちにx86命令をRISC命令に分解して
トレースキャッスに予測がヒットするのを前提として
楽観的に予測実行をせざるを得ないアーキテクチャだと
聞いたことがあります。リプレイシステムなんてのも実装されていました。
もちろんトレースキャシュにヒットする場合は速いのですが、そうも行かない
場合も多く、ヒットしない場合はリプレイシステムで再実行がかかります。
また、RISC命令に早期に分解しているため、実行命令数も増えます。
実行命令数が増えたのと、再実行が多いため、リソースを食いまくり、
限界に達したのかもしれません。
Core2系では、x86命令を早期に分解せず、むしろ合体をして実行命令数を減らします。
最後の最後ではRISC命令に分解するみたいですが。
全部受け売りです。もし間違った理解をしていたらごめんなさい。

357:,,・´∀`・,,)っ
08/10/24 23:45:47 KkYgEOUG
>>356
うーん
微妙な理解だなぁ

命令長が不規則で複雑怪奇を極めたx86命令の命令の切りだし&デコードはそれだけでも大がかりな作業なんだよね。
特に3-4命令同時にやろうと思えば。
Core2だって決して万能ではない。

NetBurstにとってはフロントエンドの負荷軽減のための省電力技術としての側面もあった。

Nehalemではものすごく限定的だがμOPsをキャッシュする機構を復活させている。
もちろん、ごく短いループでしか効果はないが。

358:Socket774
08/10/24 23:48:35 0trr2tDp
つーか、それ以前に>>302の認識が間違えているから、
レスつけても仕方がない。

359:Socket774
08/10/25 00:59:14 8sTdYtfU
>>348
すごいな団子さん
尊敬する(嫌味じゃないよ)

360:Socket774
08/10/25 01:35:55 L+S6Bhz8
そのうち程度がばれて
へるみからそっぽ向かれるに10,000ベリカ

361:,,・´∀`・,,)っ-○◎●
08/10/25 01:40:52 ixbtkhbG
ベリカってどこの単位だよ


とりあえずAVXのYMMレジスタ対応まで好きなように拡張していいって許可ならもらった

362:Socket774
08/10/25 01:41:11 Qy6a875T
トランスメタのコードモーフィングでジャバを半ネイティブ実行する仕組みがあれば、
ネットブック用CPUとして未だ生き残ってたかもなあ。

363:Socket774
08/10/25 01:42:53 L+S6Bhz8
まあ、ネットで目立つ人材を叩いてまわるだけで10年近いのに、
自分では何も発信できないどっかのコテよりは数倍マシですね。

364:,,・´∀`・,,)っ-○◎●
08/10/25 01:50:52 ixbtkhbG
FUCKヲタの悪口はそこまでだ

365:,,・´∀`・,,)っ-○◎●
08/10/25 02:01:38 ixbtkhbG
URLリンク(www.epitech.eu)

epitechってどのくらいのレベルの大学なのよ?
これをさらに高速化出来る手法編み出したんだが。
つーか、ソース読んで1時間でわかった。


366:,,・´∀`・,,)っ-○◎●
08/10/25 02:12:50 ixbtkhbG
正確にはグランゼコールか。フランスの高等教育制度はよくわからん。


367:,,・´∀`・,,)っ-○◎●
08/10/25 02:16:21 ixbtkhbG
>>362
無理無理、ネイティブ自体が大した効率良くない。

368:Socket774
08/10/25 02:19:23 uOTfz0/u
これってどれ?

369:Socket774
08/10/25 02:43:28 TSYF4R+f
>>363
団子も大嘘ついては訂正しないことではMACオタに引けを取らんけどな

370:Socket774
08/10/25 03:31:32 Qy6a875T
>>367
webページってテンポラリデータでHDDにキャッシュするから、そのキャッシュに
JSをx86ネイティブにコンパイルしたコードもキャッシュする、ってのはどう?

もうやってるかもしれんが。

371:Socket774
08/10/25 03:46:25 wPAPYS2d
こんなのあったけど、ポストカードが貰えるらしい。
URLリンク(zigsow.jp)

372:Socket774
08/10/25 08:13:34 ELNg1SOp
>>370
JavaScriptとJavaの違いを学んだ方がいい 実行の方式が全く違う
Scriptなのでネイティブ変換はできません HTMLの解析結果との連携なんかもあるし

373:レトリック君
08/10/25 10:17:14 nhfwknIq
オートマトンてSIMD処理に適しているのか?
状態の扱いは思いっきり依存ありげでvectorには不向きな気がするが
フト疑問に思っただけだが

374:レトリック君
08/10/25 10:27:55 nhfwknIq
URLリンク(www.google.co.jp)
チラ見してみたが、芳しい検索結果はみつかりまへんな…

375:,,・´∀`・,,)っ-●◎○
08/10/25 11:01:10 ixbtkhbG
>>372
だから、v8はネイティブ変換やってるってば

>>373
普通は適してないよ。

というか馬鹿まじめにオートマトンなんてやってないよ。
正規表現エンジンでよく使われる後方参照なんて、
DFAじゃ実現そのものが不可能だし。(NFAといっても良いかも疑問)

PCREも鬼車はBoyer-Moore法で固定文字列として扱える部分を大雑把に判定することで
高速化してる。これはNFAでやるとものすごく遅いから。

手法にとらわれない本質って大事だよ。
正規表現を使って文字列検索をすることの本質は、ステートマシンを使うという
手段ではなく、あくまで文字列検索という目的。

で、文字列サーチ部分はSSEの支援を受けようと思えばできる。

状態変数そのものも高速化できる。

たとえば、SSE4.2の文字列比較命令を使うと、
XMMレジスタにロードされた最大16個の文字が
[1234567890ABCDEF]のいずれかにマッチするかを
1命令で判定するなんてこともできる

これ、動的生成でこそ効果発揮すると思うけどどうよ?
まあxmmレジスタに読む値は即値化できないがな

376:,,・´∀`・,,)っ-●◎○
08/10/25 11:04:05 ixbtkhbG
- PCMPESTRI (SSE4.2) Packed Compare Explicit Length Strings, Return Index
- PCMPESTRM (SSE4.2) Packed Compare Explicit Length Strings, Return Mask
- PCMPISTRI (SSE4.2) Packed Compare Implicit Length Strings, Return Index
- PCMPISTRM (SSE4.2) Packed Compare Implicit Length String, Return Mask

力技だが、BM法でやってた文字列サーチを代用することもできるし
文字クラスのマッチングのように使うこともできる。

377:レトリック君
08/10/25 11:17:38 D32E8APC
文字列処理と正規表現をごっちゃにしている

378:,,・´∀`・,,)っ-●◎○
08/10/25 11:33:41 ixbtkhbG
馬鹿だね。「正規表現」は必ず全部有言オートマトンとして文字列比較しないといけないとでもお思いですか?
C++ TR1にもほぼそのまま採用されたBoost Regexですら固定文字列として扱えるパターンを抽出してr
boyer-moore法を使ってる


379:,,・´∀`・,,)っ-●◎○
08/10/25 11:35:10 ixbtkhbG
しかし、ぶっちゃけ今普及してるPerlコンパチのあれは「正規」でもなんでもないんだがな。



380:,,・´∀`・,,)っ-●◎○
08/10/25 11:43:05 ixbtkhbG

GNU GREPも複雑な正規表現で無い限りBM法やtrieを使ってる

ソースコードも読まずに古い知識を広げるのはやめていただきたい。



381:,,・´∀`・,,)っ[がいしゅつ]
08/10/25 11:59:32 o0eDstJh
いい?
abc(def|g[hij]?)*k+

なんてパターンを与えられたら
まず必ず評価する "abc" にマッチする部分をBM法ないしその他の高速な固定文字列検索法で検索し、マッチしたところに対してNFAで評価するのがモダンな実装。

382:レトリック君
08/10/25 12:20:05 l1Ioy72A
文字列処理はどうでもいいの
finite automatonはどうかという書き出しだが

383:レトリック君
08/10/25 12:28:22 l1Ioy72A
おまえさんは文字列処理で扱える範囲の単純なパターンマッチングだけ
考えているんだろうけど、オレが着目しているのは例えは
URLリンク(search.cpan.org)
なの。

384:,,・´∀`・,,)っ
08/10/25 13:03:44 o0eDstJh
バカだな
俺はFAそのものを高速化できるなんて一言も言ってないぜ
NFAの最大のネックはバックトラックだし。

FAを使わない方が絶対的に速いんだから、いかに問題を切り出すかが課題。
モダンな正規表現エンジン高速化のテーマなの。

固定文字列なりtrieなりシンプルなパターンに落としこみ、JITで命令を使ったシーケンスに変換すればいい。
あ、おまえはSSE*はSIMDだと認めてないんだったかなw

もちろん梟本は持ってるよ俺は
おまいは持ってすらなさそうだが

385:レトリック君
08/10/25 13:11:01 aymmFkOp
>>384
> あ、おまえはSSE*はSIMDだと認めてないんだったかなw

誰と勘違いしてんだ

386:レトリック君
08/10/25 13:17:04 aymmFkOp
NFAの話に対し、NFAに頼らずにすむ高速化しやすい問題を扱えばいいと…

387:,,・´∀`・,,)っ
08/10/25 13:31:59 o0eDstJh
あ、
ベクトル演算=ベクトルマシン
だったかな

固定文字列部分が4文字以上あるならmpsadbw+pminposuwを使う方法もある。
実際BMより速い。

ていうかレトロ君の脳内の正規表現パーザは後方参照(\1-\9)通りますか?

388:Socket774
08/10/25 13:33:22 Rb6i6i1G
>>362
月アスのインタビュー等でDitzelが「やってる」って答えてたよ
後藤さんの海外ニュースにも掲載されてる
URLリンク(pc.watch.impress.co.jp)
> Crusoeは、命令セットをハードウェアではなくソフトウェアでインプリメントしている。
> (中略) そのため、x86ではなく、異なる命令セットをインプリメントしたCMSを作ることもできる。
> 実際にTransmetaはJavaでそうした実験をやっている。昨年9月にディツェル氏は「CMSにJavaを
> インプリメントして、直接Javaのバイトコードを扱えるようにする実験はやった。Crusoeは、
> 世界最速のJavaプロセッサになりうる。しかし、Javaプロセッサの市場は大きくないので、
> 現在は提供していない」と語っている。

まぁ、「実験してる」発言であってデモしたわけじゃないので、性能は「?」だけど

389:,,・´∀`・,,)っ
08/10/25 13:33:57 o0eDstJh
いったい誰がNFAを高速化するなんて言ったんだ
思考回路が短絡してるな

390:レトリック君
08/10/25 13:35:56 gt5hlvzQ
文字列処理の話を勝手に始めたのは誰?

391:レトリック君
08/10/25 13:38:18 gt5hlvzQ
>>389
だったら最初から黙っていればいいのに…

392:,,・´∀`・,,)っ
08/10/25 13:43:54 o0eDstJh
正規表現は必ずFAで処理するものだと思いこんでるのはお前だけだよ

393:レトリック君
08/10/25 13:46:44 gt5hlvzQ
だから高速化しやすいケースの話ではなくFAの話だと
文字列はどうでもいいと。何度も書かせるな。

394:,,・´∀`・,,)っ
08/10/25 13:47:49 o0eDstJh
>>391
自己分析としてならその発言は正しいな
無知の君は最初からは黙ってれば良かったんだ

395:レトリック君
08/10/25 13:48:54 gt5hlvzQ
だめだコリャ…

396:,,・´∀`・,,)っ
08/10/25 13:49:34 o0eDstJh
俺はFAの高速化の話題なんて振ってないし
一人相撲はいい加減にしないと

397:レトリック君
08/10/25 13:52:44 gt5hlvzQ
オレはFAの話しをしてたんだよ。
それを聞きたくもないのに文字列処理の話しに勝手にそらしてレスつけたのはお前だぜ。
訳わかんねぇぞ

398:,,・´∀`・,,)っ
08/10/25 13:53:25 o0eDstJh
まさかレトロ王国(国民1名)には
正規表現によるマッチングにFAを使わないといけないなんて法律でもあるのか?

399:レトリック君
08/10/25 13:55:45 gt5hlvzQ
じゃFAなしで頑張ればいい。どうぞご自由に。

400:,,・´∀`・,,)っ
08/10/25 13:57:38 o0eDstJh
FAを処理なんて誰が言い出したんだ?
正規表現による文字列検索にはSSE4が応用できるとは言ったが。
正規表現をまずFAに展開するなんて誰も言ってない。

401:レトリック君
08/10/25 13:58:45 gt5hlvzQ
だからお前に聞いていないと

402:レトリック君
08/10/25 13:59:46 gt5hlvzQ
オレも言っていないがそれが何か…

403:,,・´∀`・,,)っ
08/10/25 14:00:02 o0eDstJh
純粋にFAだけで処理する実装の方が珍しい

404:Socket774
08/10/25 14:01:46 ly2TAH+6
団子はなんで誰に対しても攻撃的なんだろうな

405:レトリック君
08/10/25 14:02:06 gt5hlvzQ
それこそ誰が言ったのかと…
まいいや、時間の無駄だった

406:,,・´∀`・,,)っ
08/10/25 14:05:44 o0eDstJh
>>373のレスは誰に向けてなのかな?
独り言なら失礼した。
LLでよくある正規表現による文字列検索のことは言ってなかったんだな

407:,,・´∀`・,,)っ
08/10/25 14:08:46 o0eDstJh
>>373>>374には繋がりは無かった(ということにしたい)んだな

408:レトリック君
08/10/25 14:18:23 iSfdTgiD
あのな、忙しいんでほどほどにしたいんだけれども
正規表現をによるパターンマッチングの内、文字列処理もある。
文字列処理にのみ着目すると色々高速化の方法がある。
方法があるとわかっている問題は解けているも同然だから
研究課題としてどうでもいいの。
状態の更新の様な依存がある問題をどう並列化するかのモデルとして
ややこしいパイプライン化等が有効かとか、まぁ場合によるので一概に言えないが、
SIMDに関しては一括処理する単位が小さいので、
まぁいくらなんでも無理ジャマイカと、休日部屋掃除をしながら
つらつらと考えていた訳よ。
あばよ、勉強にならなかったぜよノシ

409:,,・´∀`・,,)っ-●◎○
08/10/25 14:24:13 ixbtkhbG
お帰り俺

で、>>374は結局何を検索しようとしてたの?

 finite automaton regular expression SIMD

こんなん見つかるわけ無いよ

っていうか
英語表記は Finite Automata   だし
                  ~~
日本語だけじゃなくて英語もだめなんだね。


根本的に全てFAに変換する必要自体ない。
後方参照をサポートするとすでにFAとは呼べなくなるし。

410:レトリック君
08/10/25 14:26:25 4A5jsRDR
それ複数形だが…
だからもういいって。

411:Socket774
08/10/25 15:07:38 TSYF4R+f
>>410
団子は抽象的なものの考え方ができないし、
自分の知識にないものは世の中に存在しないのと同じなんだよ

412:,,・´∀`・,,)っ-●◎○
08/10/25 15:10:24 ixbtkhbG
正規表現=FAで処理するものだなんて考えてるレトロ君ほど
凝り固まった考え方の人間もいないけどな




413:Socket774
08/10/25 15:24:43 TSYF4R+f
そうそう、団子は論理もおかしいんだった

>>408
リストベクトルを使って幅優先探索することくらいじゃまいか

414:,,・´∀`・,,)っ-●◎○
08/10/25 15:51:29 ixbtkhbG
リストベクトルって固定観念の象徴たるフェンス君が好きな用語だな

415:,,・´∀`・,,)っ-●◎○
08/10/25 15:53:44 ixbtkhbG
DFA


JIT

416:,,・´∀`・,,)っ-●◎○
08/10/25 15:59:59 ixbtkhbG
ちょっと誤爆した

SIMDはともかくとして
DFAをJITでネイティブコード化するのは悪くないアプローチだよ

正規表現エンジンでDFAを使った実装が不人気なのは、後方参照とかのサポートの問題
だけじゃなくて、特にUNICODEだと遷移テーブルが膨大になってかえってキャッシュミスでおそくなる
ケースが多いから。

JITだとテーブルを使わなくていい部分は使わない、使っても小さくてすむ場合は小さくする
っていう最適化ができるからその点の弱点は克服できる。

もちろん後方参照はDFAでは表現不可能なので(というかNFAですらない)
別の方法を考える必要があるけどね

417:Socket774
08/10/25 16:09:56 gzPxDYkX
>>360
団子ちゃんがへるみたんからソッポ向かれるのはいいけど
Xbyakに俺ライセンス的なものを主張しはじめないかとか
すごくしんぱい
今までの言動、行動を見てるとねー


418:,,・´∀`・,,)っ-●◎○
08/10/25 16:15:01 ixbtkhbG
URLリンク(www.dodgson.org)

ま、この辺でも読んでみてくれ
まあ確かに状態遷移にSIMDは不向きだと思うよ。
ただ、テーブル参照を高速化するアプローチには部分的には使える。

コード読んでもらえばわかるんだが鬼車やPCREの「VM」ってのも所詮はインタプリタなので
ネイティブコード化して高速化する余地はいくらでもある。

で、○成氏はどうもつまらんところで苦戦してたらしーが
NFAすら使わない方法のほうがうまくいったらしい

419:Socket774
08/10/25 16:26:20 TSYF4R+f
> それに加えて,1TBの共有メモリを有する32CPUのスカラSMPのAシステムと,
> 3ノード96CPUのベクトルコンピュータのVシステムが付いています。

稲垣足穂かよw

420:,,・´∀`・,,)っ-●◎○
08/10/25 16:33:14 ixbtkhbG
>>417
ほんとの所
2.06にコミット依頼したとき部分的に提案突き返されたので
ああ、この人はこういう人なんだなと思いました。

コンパイル時引数チェックが甘いのと32ビットと64ビットをマクロで切り替えてるのが
不満だから、テンプレートベースで基本クラスを再設計してコーディングインターフェイス
互換なやつを作ってるのが本音。

というかSourceForgeに修正BSDライセンスで利用登録しちゃってるわけだが。
コードまだ1行もあげてないけどね。

421:,,・´∀`・,,)っ-●◎○
08/10/25 16:38:17 ixbtkhbG
>>419
っていうかレトロはエンタープライズ級のハードで解決しようって考え方がジジくさいなぁ
そこまでの問題でもないのに

422:,,・´∀`・,,)っ-●◎○
08/10/25 17:06:37 ixbtkhbG
ひげぽんスレでもxbyakの話題出てたけどへるみ氏はおもっきし過去の人扱いされてた。
まあ、俺も午後時代で終わった人と思ってるが


423:Socket774
08/10/25 17:44:26 L+S6Bhz8
xbyakつくれてる時点でひげぽんより圧倒的に上だろ。
OSなんて多少の知識があれば体力勝負。

424:Socket774
08/10/25 21:43:58 GxCuJdr8
詳しそうな人が多いのでここで聞いてみる
プロセッサのメモリ関連でCRFって何?

425:レトリック君
08/10/25 21:45:24 xE6DXe+8
>>418
> URLリンク(www.dodgson.org)

このblogはそこそこ面白ぇな、特にgrepが圧倒的に早くて愕然とする下り。
grepが早いのは前から有名で昔から雑誌の雑文やネットに書かれたし、
perlもpythonもreは実行時にcompileしている。
オレはそのreを高速化するつもりなど毛頭ないし、そんなテーマで飯は食えない。
ましてやエンタープライズ級のハード、って何だかわからんがw持ち出す気などさらさら無い。
なんでそう妄想で話をスリップさせて因縁つけてバトルしたがるかね。
状態遷移問題の並列性について考えていた際、
FAに関しては並列化はともかくとして、SIMDは性能向上に貢献ないだろという話だったのにさ。

426:Socket774
08/10/25 22:02:30 uOTfz0/u
>>423
Xbyakの何が凄いんだ?
デザインが簡潔
それだけじゃね?

427:,,・´∀`・,,)っ-●◎○
08/10/25 22:12:44 ixbtkhbG
>>423
アホの俺にいじれてる時点で技術的にはたいしたもんじゃないよ
まんまSoftWireのパクリだし

ほかにもこんなんがあるよ。こっちはC
URLリンク(luajit.org)

428:,,・´∀`・,,)っ-●◎○
08/10/25 22:33:39 ixbtkhbG
>>425
ABC(DEF|GHIJ)
こういうパターンならABCDEFとABCGHIまでは同時に探索できるよな?SIMDで。
バックトラック回数の削減にもなるぞ。
状態マシンの概念破壊してるじゃんって言われたらそれまでだけどさ


あー、SSE4.2のマニュアル読んでみるといいよ。
Intelが言うにはアレはXMLパーザを組む為に作ったそうだが
XMLに限らずいろんな字句解析に使えるよ。

429:レトリック君
08/10/25 22:36:49 FO7gKhrT
>>428
parse関連でserialの性能にコマったら4.2はいずれ読んでみるよ。㌧クスコ

430:Socket774
08/10/26 05:41:04 G2GmaOgr
>>424
commit reconcile & fences
詳しく走らん
読め
URLリンク(csg.csail.mit.edu)

431:Socket774
08/10/29 13:06:52 kNyEllLf
ARM Forum 2008レポート【マイコン編】
16bit/8bitマイコンの置き換えを狙うCortex-M3マイコン
URLリンク(pc.watch.impress.co.jp)

講演では低コスト化の手法を、主に以下の4種類に分類した。

1)半導体の製造コストを下げる(回路面積を小さく抑える)、
2)メモリ・コストを下げる(必要なメモリ容量を少なくする)、
3)電力コストを下げる(消費電力を低く抑える)、
4)開発コストを下げる(安価なツールで短期間にプログラミングできる)、

である。

1)の「半導体の製造コストを下げる(回路面積を小さく抑える)」では、
組み込みマイコンに特化したアーキテクチャ「Cortex-M3」を開発する
とともに、ARMの特徴だった豊富なバンク・レジスタを大幅に削減して
回路面積を縮小した。

2)の「メモリ・コストを下げる(必要なメモリ容量を少なくする)」では、
命令セット・アーキテクチャを16bit/32bit混在の命令セット「Thumb-2」
だけにしてプログラムの容量を抑えるとともに、アンアラインド・データ
・アクセスとビット操作機能を導入してデータを効率的にメモリに収納
できるようにした。

3)の「電力コストを下げる(消費電力を低く抑える)」では、演算効率を
高めて処理に必要なクロック数を少なくするとともに、省電力モードを
設けた。演算効率の向上では、命令バスとデータ・バスを独立に装備
するハーバード・アーキテクチャを採用するとともに、1クロック・サイ
クルの乗算命令を装備し、ベクトル割り込みに対応した。省電力モード
では、スリープ・モードとディープスリープ・モードの2種類のモードを
設けた。

4)の開発コストを下げる(安価なツールで短期間にプログラミングできる)
では、32bitアドレスによる4GBの広大なメモリ空間、命令セットの一本化
によるプログラミングの簡素化、C言語での割り込み記述、デバッグ機能の
拡充などを紹介していた。32bitアドレスとは既存の16bitマイコンによる
アドレス空間の制約を意識したもの。命令セットの一本化とは既存のARM
コア(Thumb命令セットとARM命令セットの両方を装備)との違いを説明した
ものである。

432:Socket774
08/10/29 18:46:13 /D3z94P5
まあソフト次第だが、AMDやnVidiaのGPU用ソフトとの競争は、果たして何処が有利なのやら。

リードテック、東芝「SpursEngine」搭載カードの発売日が決定
URLリンク(pc.watch.impress.co.jp)

433:Socket774
08/10/30 23:48:23 lsPMzbOZ
団子のメッキがボロボロ剥げてるな

434:,,・´∀`・,,)っ-●◎○
08/10/31 01:24:55 4XY8bTKQ
メッキwwww


NVIDIAの平柳って人知ってる?
先日メールでいろいろ話があってだね。

でね、俺も賺さずいろいろ情報聞いちゃったわけよ。
メディアに未公開の情報も掴んじゃってます。

とりあえずLarrabee出るまではCUDA厨やらせていただこうかなと。

435:,,・´∀`・,,)っ-●◎○
08/10/31 01:27:08 4XY8bTKQ
俺のあっちのサイトでの活動を評価してくださったのよ。ぶっちゃけ。

おまいらときたら、机上の空論を並べるばかり。
天と地の差とはこのことだよ。

436:,,・´∀`・,,)っ-●◎○
08/10/31 01:30:48 4XY8bTKQ
GTX2xx無償提供してくれるってさ

437:Socket774
08/10/31 02:59:54 uvaoJ3ur
はいはい、すごいでちゅねー

438:Socket774
08/10/31 07:28:48 evEq7qRq
馬鹿だなぁS3しかないだろGPGPUは


682 :Socket774 [↓] :2008/10/31(金) 00:16:25 ID:YC2/oQgy
URLリンク(xs432.xs.to)

例のAMD製Shaderの命令発行数を測るプログラムで
9800GTX+,4870,4670,2600Pro,440GTXを比較

VSで2600が4670を上回るのが面白い
現在のATIのドライバーではVSは1アレイに制限されているので
共に8 shaderとなる2600,4670では似かよった結果になるのだが
クロック差を考慮すると、shaderあたりの命令発行は
2600の方が効率がよいということになるな

9800と440が似た傾向にあるのはshaderが同じくスカラであるためだろう

こうした差をものともせず、例の動画のような
(4670に迫る)shaderパフォーマンスを発揮する440は異常といえるだろう


683 :Socket774 [↓] :2008/10/31(金) 00:31:10 ID:pSuOrXQl
>>682
ものすごい低性能ってグラフにしか見えないんだが、俺ってグラフの見方分ってないのかな・・・


684 :Socket774 [↓] :2008/10/31(金) 00:37:32 ID:YC2/oQgy
上のはあくまで命令を発行できる数の比較でしかない

実際のshaderを走らせた場合はこのようになる

S3 Chrome 440 GTX VS ATI Radeon HD 4670 Shader Performance
URLリンク(jp.youtube.com)

439:,,・´∀`・,,)っ-●◎○
08/10/31 07:45:45 4XY8bTKQ
CUDAらねー

440:,,・´∀`・,,)っ-●◎○
08/10/31 07:53:23 4XY8bTKQ
S3ってチートで一躍有名になったTridentを吸収したメーカーだよね
URLリンク(pc.watch.impress.co.jp)

さぞすばらしいトリックがあるんだろうな

441:Socket774
08/10/31 08:27:23 5OfT4oui
固定機能で手抜きってなんらともかく
shaderでそんな事が出来るのかよ
ドライバーのdownloadサイズ12MBそこそこので
100MB近いnvの方が余程あやしいわい

S3はExponential関連のライセンスもってたなそういや

442:,,・´∀`・,,)っ-●◎○
08/10/31 08:41:46 4XY8bTKQ
CUDAランタイムとかも入ってるんじゃなかったっけ

443:Socket774
08/10/31 10:16:45 5OfT4oui
CUDAあわせてもそんなに大きくなるかね?
ATIが全部込みで役40MB程度ですし

444:Socket774
08/10/31 10:32:26 5OfT4oui
中身見たらPhysXで50MB近く使ってるわ

445:Socket774
08/10/31 12:20:56 5OfT4oui
VS2008でCUDAが使えるようになるらしい?

446:,,・´∀`・,,)
08/10/31 13:20:45 s94Xq44X
それ機密情報なのに何で知ってんだよ

俺はリリース時期まで聞いた

447:Socket774
08/10/31 13:46:20 myJZpXG5
だからあのスレに団子が来たのか・・・。

448:Socket774
08/10/31 13:58:01 s4dWBUTT
2008サポートは2.0Beta出した頃から言ってたじゃん
いつになるかを明言してなかっただけ

449:,,・´∀`・,,)っ
08/10/31 14:05:11 s94Xq44X
いつになるか聞いちゃいました

俺が持ち上げたしたってことは、まあつまりそういうことなんで
そこは察してね

450:Socket774
08/10/31 15:10:21 5OfT4oui
年末
クリスマスあたりですかね

451:Socket774
08/10/31 15:18:47 LCLCvTNB
フロントエンドにVSが使えてもどうってことないんだが・・
CUDA以外でもそういうのは他にもいろいろあるし
問題はデバッガとプロファイラだな

452:Socket774
08/10/31 15:38:56 wIzZPI7o
なんか団子が暴れてNVIDIAのイメージ悪くなりそうだなw


453:,,・´∀`・,,)っ
08/10/31 15:48:39 s94Xq44X
CUDA2.1知ってるよね?ていうか公開情報だよね。

まぁおもしろい機能いろいろだね。


ま、おまいらが関心があるとしてそのVS2008をサポートするバージョンが
2.1になるか2.0のマイナーアップデートになるかってことだけど
まぁ楽しみにしててくれ。

とりあえず俺的にはOffice2007 Ribbonスタイル(=Win7標準スタイル)のUIを持つ
CUDAアプリケーションが簡単に作れるのはそれなりに意味はあるかなと思ってるが

454:Socket774
08/10/31 16:53:51 NS7cE79c
ある小学生の身内にゲーム作ってる奴がいるような、そんな錯覚。

455:Socket774
08/10/31 17:01:45 B3wviq+I
商用アプリについてもAMDのGPGPU戦略がわからない。
TMPGEncやアドビには働きかけてるんだろうか。

456:,,・´∀`・,,)っ
08/10/31 17:06:44 s94Xq44X
うまい喩えだな
ただ別に身内でもないし敢えて言うなら実力でコネを作ったっていうか。

その小学生がたとえばロックマンの新作の敵キャラ募集で当選したと仮定してみなよ

457:Socket774
08/10/31 17:28:48 5OfT4oui
私は素直に期待してるよ
アプリが増えるのはGPGPUの底上げにもなるし
是非にがんばって欲しい

まぁ、無理をしない程度に

458:,,・´∀`・,,)っ-○◎●
08/10/31 23:25:50 4XY8bTKQ
ブロンズメッキが剥がれた下からは何が見えた?

459:Socket774
08/10/31 23:29:55 R/tjyq+c
nvのグダグダ加減
みたいな?

152 :Socket774 [↓] :2008/10/31(金) 22:57:00 ID:QmA5a6BH
また出棺追加?
Nvidia forced to dissable chipset PCI prefetch
URLリンク(www.fudzilla.com)

特許侵害で機能を使えなくしないといけないらしい。>チップセット

460:,,・´∀`・,,)っ-○◎●
08/10/31 23:48:22 4XY8bTKQ
ま、俺に絡んじゃったのが最大の死亡フラグだな
CUDAやるのもIntelの中の人に開発ツール提供してもらうための踏み台にはなるかもな。


461:レトリック君
08/11/01 00:36:29 U3KlK9XI
Streaming言語の方言wによる囲い込み大作戦でどのベンダーも必死乙状態だが
無料で使えるくらいにしないと普及しないってば…
特にCt。
いや、GCC4.3,4.4にLarabeeのOpenMP対応 .mdをcontrinしてLinuxや(BSDでも←個人的嗜好)
Larabeeを活用できるようにするくらいの懐の深さがあればもはや最強、
もう君臨状態だろうな…

462:Socket774
08/11/01 06:34:45 6TR6R6aV
URLリンク(www.intel.co.jp)

IntelはCtを普及させる気がないのか・・・

463:Socket774
08/11/01 06:56:42 WnvDrRVI
ないある

larrabeeもDX11まかせ

464:,,・´∀`・,,)っ-●◎○
08/11/01 08:06:19 sHed6bxe
Native C/C++/Asm任せに決まってるだろ

465:Socket774
08/11/06 18:54:48 Lf5PDE2z
GPUアーキテクチャについて語るスレは無いのか…

466:Socket774
08/11/06 19:23:10 leuTujNQ
厨vsスレがあるだろ

467:MACオタ
08/11/10 23:18:10 tiJfK2Pl
中国のIT誌、www.ciw.com.cnのFrank Soltisインタビューす。
URLリンク(epaper.cio360.net)
興味のあるヒトわ、google translateの中国語->英語変換でもつかえば良いす。
目ぼしい内容わ、次の通り。
 - POWER7わ既報通り8-core
 - POWER6と比較した場合の動作クロックを尋ねた記者の質問に対して、「コアあたりの性能
  は従来以上」と回答している。

468:,,・´∀`・,,)っ-●◎○
08/11/11 23:47:25 QXpmwhjN
フィックスターズ、「Yellow Dog Linux」の米Terra Softを買収--Cellビジネスの拡大目指す
URLリンク(japan.zdnet.com)

469:Socket774
08/11/14 00:02:12 fmVVAWW5
MIPSマネージメント・セミナー2008レポート
~1GHz超の高速MIPSコアとマルチスレッドのクアッドMIPSコア
URLリンク(pc.watch.impress.co.jp)

470:Socket774
08/11/14 20:59:38 G7FkAxgL
これってnVidiaのCUDAよりも使い易いっぽいかな。

AMD、12月のCatalystで「ATI Stream」を実装
~RadeonでGPUコンピューティングが可能に
URLリンク(pc.watch.impress.co.jp)

471:Socket774
08/11/14 21:36:05 N6R2JAKQ
これってMicrosoftのDirectXよりも使い易いっぽいかなって言いながらPreyを紹介するようなもんだが

472:Socket774
08/11/14 22:30:23 Z7zjfxMQ
普通にCで書いたコードを最適化してくれればそれで良いんだけどな

473:Socket774
08/11/14 23:31:23 CEbeYL1E
>>470
Cyberlinkは今年の夏の終わりくらいに何か出すって言ってたよね

474:,,・´∀`・,,)っ-●◎○
08/11/15 00:01:17 dkxKaXUE
さて、Larrabee持ち上げるか

俺飽きるの早かったCUDA

475:Socket774
08/11/15 12:47:07 vp9zWwD5
nVidiaの話はどうなったんだよ


476:,,・´∀`・,,)っ-●◎○
08/11/15 13:21:41 0EXHNI7+
あーだめ
Intelなら各命令のレイテンシ-スループットとか事細かに公開するじゃん。
企業秘密のため答えられませんとかどんだけ。

まあ大体傾向調べて判っちゃったけどね。

Larrabeeのほうがまだ高性能。の可能性高い。

477:MACオタ
08/11/15 14:27:16 5OpFeaxx
今週わSOIプロセスにからむ重要な報道が多かったので、まとめておくす。
まず、IBM一党の45-nm SOIプロセス受注開始の報道。
URLリンク(www.eetimes.com)
  ---------------------
  IBM claims 45-nm SOI can offer up to a 30 percent performance improvement or 40 percent
  power reduction, when compared to bulk silicon.
  ---------------------
バルクとの比較と言っても、Intelの最先端HKMGプロセスと比較している訳じゃ無いというのわ、注意
すべきす。IBMとシンガポールのCharteredで、このサービスを提供するし、AMDの"The Foundary
Company"も、セカンドソースとして加わることになる筈す。
記事の方わ、この発表と合わせてSOIプロセスがニッチに留まっている現状について次のように述べて
いるす。
 - コストが相変わらず高い
 - SOIに対応したIPライブラリが少なすぎる
 - 過去にIBM自体がASIC製品での提供を重視していた
 - しかしNvidiaがSOIコンソシアムに加入するなど、性能目当ての顧客の参入も出てきた模様
SOIがニッチに留まっている現状を反映して、SOIウェハの製造企業の経営も苦しくなっているとのことす。
 - Ibisわ経営危機で見売り先を探している状態
 - Soitecの今年第3四半期の売上わ、前年より28.1%低下。世界経済の下降により今後の見通し
  も苦しい。

478:MACオタ@続き
08/11/15 14:38:56 5OpFeaxx
上の記事でも売上低迷が取り上げられたフランスSoitec社すけど、先日シンガポールの新工場
落成の報道があったす。
URLリンク(www.eetimes.com)
フル稼働で1M wafers/yrの規模とのことす。
SOIプロセスのファンダリ企業としてわ、IBM, Charteredに加えて"The Foundary Company"が加わって
市場が拡がることを当て込んでいると思われるす。

SOI市場拡販のためにわ、盟主IBMも手を売っており、>>477の記事で取り上げられた"IPが無い"という
問題解決のためにARMと話をつけた模様す。
URLリンク(www.arm.com)
URLリンク(techon.nikkeibp.co.jp)
  -----------------
  英ARM Ltd.は,米IBM Corp.の45nm SOIのシリコン・ファウンドリ・サービス向けに,回路ライブラリ
  を提供することになったと発表した
  -----------------

479:MACオタ@続き
08/11/15 14:48:23 5OpFeaxx
AMDの製造子会社"The Foundary Company"の方針わ、先日のAnalyst Meetingでも説明が
行われたすけど、Fab36, Fab38, 新設のFab4xの三工場体制で32-nm SOIプロセスを提供し、
22-nm世代も予定していることを表明したす。
URLリンク(www.amd.com)

ココまでの流れわ良い話が多かったすけど、SOI市場のニッチ具合と世界経済の危機的状況わ
甘くないす。IBMのSOI連合わ、IBM, Chartered, The Foundary Companyの3社体制での製造を行う
というの予定すけど、早速一角が崩れて、Charteredの身売りの噂が出てきたす。
URLリンク(www.eetimes.com)
オリジナルのソースわ、台湾Digitimesのこちらす。
URLリンク(www.digitimes.com)
CharteredのCEOが身売り交渉のために、台湾を訪問するとか。TSMCかUMCが買収することになる
という話す。

480:MACオタ
08/11/15 15:09:30 5OpFeaxx
ARMベースのノートPCをubuntuでサポートするというニュースす。
URLリンク(news.zdnet.com)
  ----------------
  ARM-based processors have traditionally been used in small devices such as mobile
  phones, but it emerged in October that ARM's technology would soon be used in netbooks,
  the new breed of small, low-cost notebook PCs.
  ----------------
MS vs Linuxとか、Intel Atom vs ARMとか色々な視点で興味深いニュースすけど、上で書いた
IBMのSOIプロセス連合の報道とある意味でリンクしていると言えるす。


481:MACオタ
08/11/16 18:07:49 pou63Jfp
来週の国際会議SC2008で今年下期のTop500が発表されるす。で、下馬評を扱ったこのニュース。
URLリンク(www.computerworld.com)
 - ORNL Jaguar (Cray XT5アップグレード), LANL Roadrunnerアップグレード, Blue Gene/Pが有力
 - Jaguar: 45-nm Opteron 搭載ラックを200台増強 (192 chips/rack)。ピーク性能 1.64 PFlops。
       消費電力 7MW
 - Roadrunner: 軍用のためアップグレードの状況わ謎。消費電力わ3,9MW -> 2.5MWに改善とか。
 - Blue Gene/P: 世界各地の計算機センターが導入中

482:MACオタ
08/11/17 21:22:14 1jCx7QC9
Top500の結果す。
URLリンク(www.top500.org)
 1. LANL Roadrunner (PowerXCell 8i/3.2GHz) 1,105 TFlops (ピーク比 75.9%), 2,483 kW
 2. ORNL Jaguar (QC Opteron/2.3GHz) 1,059 TFlops (ピーク比 76.7%), 6,951 kW
 3. NASA Pleiades (QC Xeon/3.0GHz & 2.66GHz) 487 TFlops (ピーク比 80.0%) 2,090 kW
 4. LLNL Blue Gene/L (PPC440/700MHz) 478 TFlops (ピーク比 80.2%) 2,330 kW
 5. ANL Blue Gene/P (PPC450/850MHz) 450 TFLops (ピーク比 80.8%) 1,260 kW

483:MACオタ
08/11/17 23:13:22 1jCx7QC9
TSMCが40-nmプロセスでの量産を開始するとのことす。
URLリンク(www.eetimes.com)
  --------------------
   At 40-nm, TSMC offers several derivatives, including general purpose (40G) and
  low-power (40LP) versions.
  The 40G process targets performance-driven applications, including processors, graphics
  chips, networking devices, field programmable gate arrays (FPGA), storage ICs and others.
  The 40LP process targets low-power applications, including cellular baseband, application
  processors, portable consumer and wireless connectivity devices.
  --------------------
SunもTSMCの40-nmを利用する予定なんて話も書いてあるすけど、経営危機のSunが果たして
SPARCの開発を継続できるかどうか。。。

484:MACオタ
08/11/18 17:09:27 +48X3kSh
正式発表に合わせてCore i7のSPEC2006が公開されたす。
代表的なハイエンドプロセッサの成績と比較しておくす。OS等わバラバラなので参考程度に
しておいて欲しいす。
■SPECint2006
 Nehalem/3.2GHz: 30.2 (base) / 33.6 (peak)
 URLリンク(www.spec.org)
 Penryn/3.2GHz: 27.0 / 29.7
 URLリンク(www.spec.org)
 POWER6/4.7GHz: 17.8 / 21.7
 URLリンク(www.spec.org)
 Montecito/1.66GHz: 15.7 / 17.0
 URLリンク(www.spec.org)
 Barcelona/2.5GHz: 14.4 / 16.2
 URLリンク(www.spec.org)
 POWER5+/2.2GHz: 10.5 / 13.2
 URLリンク(www.spec.org)
 SPARC64 VII/2.5GHz: 11.5 / 12.6
 URLリンク(www.spec.org)
 Pentium4/3.8GHz: 11.6 / 12.3
 URLリンク(www.spec.org)

485:MACオタ@続き
08/11/18 17:23:48 +48X3kSh
■SPECfp2006
 Nehalem/3.2GHz: 31.7 (base) / 33.6 (peak)
 URLリンク(www.spec.org)
 SPARC64 VII/2.5GHz: 25.0 / 28.8
 URLリンク(www.spec.org)
 Penryn/3.2GHz: 24.5 / 25.3
 URLリンク(www.spec.org)
 POWER6/5.0GHz: 20.1 / 24.9
 URLリンク(www.spec.org)
 Montecito/1.66GHz: 19.9 / 20.4
 URLリンク(www.spec.org)
 Barcelona/2.5GHz: 18.5 / 19.7
 URLリンク(www.spec.org)
 POWER5+/2.2GHz: 12.9 / 14.9
 URLリンク(www.spec.org)
 Pentium4/3.8GHz: 11.9 / 12.1
 URLリンク(www.spec.org)
 

486:MACオタ@続き
08/11/18 17:57:01 +48X3kSh
■SPECint_rate2006 (8-threads)
 Dual Penryn/3.2GHz: 145 (base) / 156 (peak)
 URLリンク(www.spec.org)
 Dual Shanghai/2.7GHz: 113 / 136
 URLリンク(www.spec.org)
 Single Nehalem/3.2GHz: 117 / 124
 URLリンク(www.spec.org)
 Dual POWER6/4.7GHz: 108 / 122
 URLリンク(www.spec.org)
 Quad Windsor/3.2GHz: 102 / 119
 URLリンク(www.spec.org)
 Dual Barcelona/2.5GHz: 92.7 / 108
 URLリンク(www.spec.org)
 Quad Montecito/1.6Ghz: 94.7 / 102
 URLリンク(www.spec.org)
 Dual POWER5+/2.1GHz: 47.9 / 53.3
 URLリンク(www.spec.org)
 Single SPARC64 VII/2.52GHz: 36.9 / 40.8
 URLリンク(www.spec.org)
 

487:MACオタ@続き
08/11/18 18:11:56 +48X3kSh
■SPECfp_rate2006 (8-threads)
 Dual Shanghai/2.7GHz: 105 (base) / 118 (peak)
 URLリンク(www.spec.org)
 Dual POWER6/4.7GHz: 102 / 115
 URLリンク(www.spec.orgcpu2006)
 Quad Windsor/3.2Ghz: 95.3 / 103
 URLリンク(www.spec.org)
 Dual Penryn/3.4GHz: 87.2 / 95.6
 URLリンク(www.spec.org)
 Dual Barcelona/2.5GHz: 86.3 / 94.7
 URLリンク(www.spec.org)
 Quad Montecito/1.6GHz: 87.4 / 90.8
 URLリンク(www.spec.org)
 Single Nehalem/3.2GHz: 82.9 / 86.1
 URLリンク(www.spec.org)
 Dual POWER5+/2.1GHz: 57.2 / 62.5
 URLリンク(www.spec.org)
 Single SPARC64 VII/2.52GHz: 33.6 / 35.2
 URLリンク(www.spec.org)

488:MACオタ@ここまで
08/11/18 18:15:09 +48X3kSh
>>484-485のシングルタスクのSPECint/SPECfpにshanghaiの登録が無いのわ残念
すけど、Nehalemのスゴさわ揺るがないす。

なお、int, fp共にrateの成績に関してわSMTをサポートしているプロセッサわ若干不利である
ことを割り引いて見て欲しいす。Nehalem, POWER6, POWER5+, SPARC64 VIIが該当するす。

489:レトリック君
08/11/18 21:00:17 gh72A97A
ふ~ん。たかがベンチ、されどベンチ、なんだか時代の切り替わりを感じるな…
こーれでcore当たりのLinpackも速かったら、top500はCPUの総数と網だけが勝負のでk(ry

490:MACオタ>レトリック さん
08/11/18 21:53:45 WfyMrGQ0
>>489
  -----------------
  たかがベンチ、されどベンチ、
  -----------------
『たかが』すか?一般にプロセッサアーキテクチャの研究でわ、典型的命令ミックスとして
SPEC CPUを使う筈すけど。。。

491:Socket774
08/11/18 22:06:07 dYKQiGgk
>>490
それは「されど」のほうだな

492:Socket774
08/11/19 01:05:07 5j5hQRMW
>>490
「たかが」のほうでは、
研究者はみんな「こんなのあてにならんよな」と思いながら、他に代わるものもないのでしぶしぶ使っている

493:MACオタ>492 さん
08/11/19 01:13:53 3Hv7OFZy
>>492
  ------------------
  研究者はみんな「こんなのあてにならんよな」と思いながら、
  ------------------
早速、知ったかさんが現れた様す(笑)
URLリンク(www.spec.org)
  ==================
  The benchmark programs are developed from actual end-user applications, as opposed to being
  synthetic benchmarks.
  ==================
反面、CELL/B.E.やGPGPUのようなプログラミング手法そのものの変革が必要なシステムわ
テストできないということになるす。

494:Socket774
08/11/19 01:26:36 5j5hQRMW
>>493
はあ、それは理想ではあるけどな…
部外者は気楽なこって

495:レトリック君
08/11/19 01:33:38 YSszBjB7
変革だとさw
CELL/B.E.やGPGPUでintのgccとか計ってみなってw
万が一うごいたら…の話だが。

496:Socket774
08/11/19 01:35:11 s26reCql
>>495
多分すげー遅いだろうな、0.1とかw

497:Socket774
08/11/19 07:25:04 of4tviNn
>>>493って自己紹介上手いな

498:MACオタ
08/11/19 18:52:04 5QkxaR/H
>>482で紹介した今年下半期のTop500すけど、今回からシステムの消費電力も一部公表されて
いるす。そこで、アーキテクチャごとの電力効率をまとめてみたす。
なお、クラスタシステムわインタコネクトの違いで電力効率が大きく変わるので、ケチってギガイ
ーサを使っているシステムわ除いたす。明らかにおかしいと思われるデータも除いたす。

■スーパーコンピュータの電力効率
  プロセッサ / 電力効率 [MFlops/W]
  IBM PowerXCell 8i / 498.4 (最高536.2, 最低444.9)
  IBM Blue Gene/P (PPC450) / 367.8 (最高371.7, 最低357.1)
  IBM Blue Gene/L (PPC440) / 206.6 (最高208.3, 最低203.8)
  Intel QC Harpertown / 203.5 (最高265.8, 最低 124.9)
  Intel QC Clovertown / 170.8 (最高207.0, 最低 130.5)
  AMD QC K8L / 154.9 (最高 231.6, 最低 113.8)
  IBM POWER6 / 87.4 (最高95.6, 最低 69.9)
  Intel DC Woodcrest / 84.5 (最高 102.9, 最低 57.4)
  AMD DC K8 / 43.9 (最高 81.5, 最低 27.1)
  Intel DC Itanium2 / 57.1
  IBM POWER5+ / 40.0
  IBM POWER5 / 39.0
  NEC 地球シミュレータ (SX-6) / 11.2

マルチコア化とプロセスの縮小が、電力効率向上の大きな要因になっていることが判るす。
Intelの45nmプロセス世代の汎用プロセッサがBlue Gene/L (130-nmプロセスのPPC440コア
SoC)に電力効率で追いついているのわ、たいしたモノだと思うす。
POWER6わ巨大コアのデュアルコアチップとしてわ意外に頑張っているのと、POWER5の電力
効率の悪さがちと目立つす。

499:MACオタ
08/11/19 20:07:20 5QkxaR/H
>>484-487のBloomfieldのSPEC CPU2006すけど、AcesHardware掲示板の投稿によると
シングルプロセスの結果も"rate"も両方ともにターボモードの恩恵を受けているとの話す。
URLリンク(aceshardware.freeforums.org)
  --------------------------
  The all architecture help on SPEC, it is not that simple to find a reason for the boost.
  Memory help, The cores are improved. With regular cooling, in 99% of the case, turbo
  will kick in, you rarely get to the max power ...
  when you run spec , you ll get your 2 bin turbo boost, then you run SPEC_FP_RATE, you'll
  get 1 bin turbo boost. I just checked with my Buddy Rahul, the Spec Gurus.
  --------------------------


500:Socket774
08/11/19 20:54:26 Qm2CbA2d
どこに行っても馬鹿にされてるんだね

501:MACオタ
08/11/19 21:37:29 5QkxaR/H
IBMがバイナリトランスレーションの専門企業Transitiveを買収したす。
URLリンク(www.theregister.co.uk)
記事にもあるようにTransitiveのQuickTransit技術わ、AppleのRosetta、IBMのPowerVM Lx86,
HPのSolaris実行環境等に採用されているす。
古くわ、こういうニュースもあったすね。。。
URLリンク(www.watch.impress.co.jp)

前述のようにIBMわPOWERサーバーにおけるx86版Linuxアプリの実行環境としてPowerVM Lx86
を提供しているすけど、経営危機のSunの顧客を狙ってSolarisでも同様の戦略を取ると思われる
す。加えてTransitive社自体を手に入れることにより、他のプラットフォームへのSunの顧客の
流出を邪魔することを狙っているのかもしれないす。

502:Socket774
08/11/19 21:49:48 htNw1R0N
普通の日本語書けばいいのに。

503:MACオタ
08/11/19 22:16:28 5QkxaR/H
Top500ランキングに関してわ、JAXAのSPARC64 VIIシステムで222位にランクされた富士通が、
微妙なリリースを出しているす。
URLリンク(pr.fujitsu.com)
  ------------------------
  当社のハイエンドテクニカルコンピューティングサーバ「FX1」を中核としたこのシステムは、
  世界トップレベルとなる89%以上の実行効率(注1)を実現し、このたびのTOP500リストに
  掲載されている日本のシステムでは最も高い実行効率となります。
  ------------------------
理論ピーク性能とLinpackの結果の比である実行効率に関してわ、従来からItaniumベースのSGI
のシステムが優れており、今回のランキングでもJAXAのクラスタより大規模なシステムで90%以上
を達成しているモノもあるす。
 44位 URLリンク(www.top500.org)



504:Socket774
08/11/19 22:28:19 C+Mzyu9E
ふーん

505:MACオタ
08/11/19 22:36:15 5QkxaR/H
CrayがXeon搭載のデスクサイド・スーパーコンピュータ CX1を発表したす。
URLリンク(www.cray.com)
中身わ、ただのブレードサーバー筐体なんすけど、Xeonと共にNvidiaのTesla C1060を搭載
したGPGPUノードなんてのも詰め込めるところが新しい目す。
URLリンク(investors.cray.com)
LinuxベースのクラスタOSとしてわ、割と有名なRocksとセットでも売る模様す。
URLリンク(investors.cray.com)

今のところ搭載CPUわHarpertown Xeonすけど、Nehalem-EPが発表されれば搭載すると
思われるす。

506:レトリック君
08/11/19 22:41:47 TFsmRcG1
top500等、だれもがアクセスできるところにある公知情報を延々コピペは控えめがよろしいかと

507:MACオタ>レトリック さん
08/11/19 22:48:41 5QkxaR/H
>>506
私の投稿で引用で囲った文章だけがコピペす。
どれをコピペと思い込んでるすかね(笑)

508:レトリック君
08/11/19 22:54:05 TFsmRcG1
言うと思ったw
リンク張るにしても宣伝臭い情報などは見抜いてもう少し有用なネタか吟味して精選したら?

509:Socket774
08/11/19 23:01:22 C+Mzyu9E
クスクスクス

510:Socket774
08/11/19 23:03:42 Qm2CbA2d
コピペのみに徹していれば
馬鹿にされることも無いだろうに

511:Socket774
08/11/20 19:39:33 rRN0eQB1
反応してるやつはみんなオタの仲間

512:Socket774
08/11/20 21:14:47 5o0+HOhA
MACヲタに嫉妬するのはみっともないですよw
自分の無能さに気づきなさいw

513:Socket774
08/11/20 22:24:45 uGazwTHV
はーい

514:Socket774
08/11/21 22:46:01 O2oDhAtj
ちょっと面白い記事だが、ブロック毎に休止させる手段との整合性が気になった。

単一電力で動作するレベル・シフター、システム構成の簡素化に役立つ(2008/11/21公開)
URLリンク(eetimes.jp)

515:MACオタ
08/11/21 23:07:37 KjSGo7TB
SGIがx86版Blue Geneとも言うべき製品"Molecule machine"をSC08でデモしたらしいす。
URLリンク(www.theregister.co.uk)
 - Dual-core Atom N330/1.6GHz
 - プロセッサ、2GBメモリ(4 x 512KB DDR2 DIMM)、インタコネクトチップをボード上に配置
 - "Kelvin"と呼ぶセラミックカートリッジに上記のボードを2枚収納
 - Kelvinを電源、ネットワーク、冷却機構を内蔵したバックプレートに接続
 - 90個のKelvinを3Uラックに収納。 2 x 2 x 90 = 360 cores in 3U-rack
こういう言い回しをしているところを見ると、ノード間ネットワークの設計わ、まだ固まっていない模様す。
 ----------------------
 The important thing to realize, explained Brown, is that if the interconnect was architected
 correctly, the entire memory inside the chassis could be searched in one second.
 ----------------------

516:MACオタ@補足
08/11/21 23:17:39 KjSGo7TB
上の話、写真つきの日本語の記事が出ていたす。
URLリンク(techon.nikkeibp.co.jp)
写真を見ると、上でリンクしたThe Registerの記事わ若干誤解が含まれている様す。
  -------------------
  ブロックは,寸法が5cm角ほどの基板2枚を空冷用の孔をはさんで張り合わせ,樹脂で
  固めたものから成る。各基板にはマイクロプロセサとデータの経路制御用LSI,および
  メモリ用チップを基板の裏表で計8個搭載している。マイクロプロセサには,デュアルコア
  のAtomを用いる。このAtom は,1.3GHz動作で「x86-64」の命令セットが動作する。メモリ
  の容量は1基板で2Gバイトである。
  -------------------

517:MACオタ
08/11/21 23:38:59 KjSGo7TB
Top500に続いて、電力効率のコンテストGreen500とHPC Challengeの結果も発表されたす。
Green500: URLリンク(www.green500.org)
HPC Challenge: URLリンク(www.gcn.com)
なぜかHPC Challengeわ、公式サイトURLリンク(www.hpcchallenge.org)が未だにアップデートされて
いないす。上記の記事によると、結果わ以下の通り。
 ■ G-RandamAccess
  1. Blue Gene/P (ANL): 103 GUPS
  2. Blue Gene/L (LLNL): 35 GUPS
  3. RedStorm, Cray XT3 (SNL): 34 GUPS
 ■ G-FFT
  1. Blue Gene/P (ANL): 5,080 GFlops
  2. RedStorm, Cray XT3 (SNL): 2,870 GFlops
  3. Jaguar, Cray XT5 (ORNL): 2,773 GFlops
 ■ G-HPL
  1. Jaguar, Cray XT5 (ORNL): 902 TFlops
  2. Blue Gene/L (LLNL): 259 TFlops
  3. Blue Gene/P (ANL): 191 TFlops
■ EP-STREAM-Triad
 1. Jaguar, Cray XT5(ORNL): 330 TB/s
 2. Blue Gene/L (LLNL): 160 TB/s
 3. Blue Gene/P (ANL): 140 TB/s

518:Socket774
08/11/22 00:00:20 JG6FapJf
>>514
容量素子のサイズがでかくなってあまりメリットないような・・・

519:Socket774
08/11/22 01:23:41 Z/ATNrSE
MIMならともかくMOSキャパなら大した事無いだろ

520:MACオタ
08/11/22 01:47:37 TaEFwxau
Green500が発表されたので、>>498をアップデートす。
今回わ、Green500ルールで測定が行われているデータの上位3つの平均を求めてみたす。
なお、前回IBM p575 (POWER5+)のシステムで効率が異常に良いデータを除いたすけど、
Green500の審査に通っているので、今回は計算に入れたす。
■プロセッサごとのスーパーコンピュータの電力効率比較 [MFlops/W]
 1. IBM PowerXCell 8i (65nm): 532.3
 2. IBM Blue Gene/P, QC PPC450 (90nm): 371.7
 3. Intel Harpertown, QC Core2 (45nm): 241.7
 4. IBM Blue Gene/L, DC PPC440 (130nm): 208.3
 5. Intel Clovertown, QC Core2 (65nm): 188.7
 6. AMD Barcelona, QC K8L (65nm): 146.9
 7. Intel Woodcrest, DC Core2 (65nm): 109.1
 8. IBM DC POWER6 (65nm): 95.6
 9. IBM DC PPC970MP (90nm): 91.7
 10. IBM DC POWER5+ (90nm): 71.0
 11. Intel DC Itanium2 (65nm): 69.3
 12. AMD DC Opteron, DC K8 (90nm): 46.9
 13. IBM DC POWER5 (130nm): 36.3

集計法が異なるので、若干>>498と順位も変動しているす。

521:MACオタ
08/11/22 02:43:57 TaEFwxau
>>479で書いたChartered Semi.の身売り話すけど、Digitimesより続報す。
台湾訪問中のChartered CEO, Song-Hwee Chiaわ、合併交渉を否定したとのことす。
URLリンク(www.digitimes.com)
  -----------------------
  In response to rumors about Chartered seeking mergers with Taiwan's foundries,
  Chia said it is too "risky" to talk about such issues at present. He declined to make
  further comments concerning possible mergers.
  -----------------------

522:Socket774
08/11/22 14:58:54 r3oHDlr8
MACオタって何してる人?
相当知識はありそうなんだから別にこんなとこに居なくともよさそうだが。

523:Socket774
08/11/22 17:11:29 rrG5Wzuy
見ての通りだろ

524:Socket774
08/11/22 19:00:25 mOknA/hF
四六時中ネット徘徊してる人?

525:Socket774
08/11/23 00:52:49 5WyXRhsf
ちょっと煽るとすぐ火がつくMACオタ()笑

526:Socket774
08/11/23 02:41:13 meLltuXC
こんなとこ、に集まる人々

527:レトリック君
08/11/23 03:17:16 z0fjO5wh
i7は単体core当たりの対C2D比実効性能をなぜ上げられることができたんだろうか
例のMNIのコピヘネタを除くとw、C2Dはかなり完成度が高くて
これ以上単体実効性能を上げるのは相当難しそうな気がしていたんだが
あいつらすげえ執念だな。

あるいは、今後更に単体実効性能を上げる余地があるとすればそれはどのようにしてなのだろう。

もはや単体性能にこだわる時代でも無いのかもしれないし、
単純なベンチでの性能比較の無意味さは食傷ぎみだが。

こういう話の方がtop500よりも面白いと思うのは個人的な趣味なのかな

528:レトリック君
08/11/23 03:21:14 z0fjO5wh
つか、まぁGFLOPSだの性能云々そのものが指標として陳腐化してきて
世の中流や産業ともはや連動していないんだよな…orz

529:MACオタ>レトリック さん
08/11/23 03:54:01 JlOdK57G
>>527
  ------------------
  i7は単体core当たりの対C2D比実効性能をなぜ上げられることができたんだろうか
  ------------------
これだけNahelemアーキテクチャ解説の情報が溢れているというのに。。。言うに事欠いてそれすか(笑)


530:Socket774
08/11/23 04:23:38 /OqeOGVN
top500なんて昔から、国の、プロセッサ屋の、システムベンダの、宣伝用だからね

531:Socket774
08/11/23 13:51:49 BLpVXshs
>>527
基本的に「メモリ直結」と「キャッシュ増量」のお陰だろ。

あとは「HT」や「コア数ウプ」も有るが、いずれにしても大きな改良点に
珍しい手法は見当たらない。

532:Socket774
08/11/23 14:14:35 BLpVXshs
>>531
あと「メモリチャネル数が3つ」になったのも大きい。

533:,,・´∀`・,,)っ-●◎○
08/11/23 14:31:06 lCVu0jgM
キャッシュの総容量は実は12MBから8MBに減ってるけどな

Intelの技術者が言うにはL2を小容量低レイテンシにしたことが効いてるらしいけど
512KBだと性能が落ちたとか。


534:Socket774
08/11/23 14:53:04 2UI6soHP
馬鹿来た

535:レトリック君
08/11/23 16:15:15 G1s1Uj4U
レイテンシ幾つから幾つに変わったの?教えて君モート、横着゙w
中身の変化は寄与無いの?
で、そういった改良を総括するとあの実効性能の差は合理的に説明つくのだろうか、、、

536:Socket774
08/11/23 16:22:21 mf3CnZk0
> Intelの技術者が言うにはL2を小容量低レイテンシにしたことが効いてる
intelって前からそれ好きだよな…
AMDやCentaurがL1を128KBにする中で、レイテンシを優先してPentiumPro以来ずっと容量は32KB程度のままだったり
あと、L2も、Pentium4とAthlonXPで同じ256KBだった時代でも幅が256bit対64bitだったり…


537:Socket774
08/11/23 18:08:21 ElPwAhu/
MACオタのアク禁まだ~?

538:Socket774
08/11/23 18:28:47 YkTGliDB
CoppermineのL2はレイテンシ0とか無茶な数字が書いてあった気がする

539:,,・´∀`・,,)っ-●◎○
08/11/23 23:00:00 lCVu0jgM
もともとFSB経由だったのが内部バス化されたからそういう意味でのレイテンシ0だろ
L2そのもののレイテンシが無いわけではない

540:MACオタ
08/11/24 17:04:08 Q1VJWnjX
TheINQのCharlie "Groo" Demerjianによると、Microsoftが自社ブランドの携帯電話
を開発するとの事す。プロセッサわ何とNvidia Tegra (ARMコアSoC)とのことす。
URLリンク(www.theinquirer.net)
Tegra製品についてわ、こちら。
URLリンク(www.nvidia.co.jp)
iPhone, Gphoneに続き、MSまでARM系採用を決めたことで、Intelの組込分野への
野望わ、展望が苦しくなってきたす。

541:,,・´∀`・,,)っ-●◎○
08/11/24 17:11:27 9qM3upWO
ARMのSIMD拡張としては本家の64bit/128bit拡張よりメジャーな
WirelessMMXを普及させた張本人じゃないかIntelは

542:MACオタ>団子 さん
08/11/24 17:16:52 Q1VJWnjX
>>541
事業としてのXScaleわMarvellに売却されてしまったす。
URLリンク(www.intel.co.jp)

543:,,・´∀`・,,)っ-●◎○
08/11/24 17:31:39 9qM3upWO
そうだよ。黒字出してたのにAtomを普及させるためにわざと、ね。

ARMは各ベンダーのDSPコントローラのコントロールコアとしては広く普及したけど
独自のSIMD拡張命令を普及させることに関してはうまくいかなかった。
それこそDSPベンダーの思惑があって。
WirelessMMXがMSやGNUのコンパイラで本家のSIMD拡張であるNEONをさしおいて
サポートされてる。これが現実。

で、WMMXをそこまで成功させたIntelが今度はx86命令セットそのものをサポートする
モバイルチップを投入する。
各ベンダーはともかく、開発者は画一的なアーキテクチャを望むわけよ。
アクセラレータ部分の命令セットも共通化したいわけだ。

MSが自社ブランド携帯電話でARM採用したからってどうなるもんでもないよ。
どうせハード作るのは東芝かサムスンあたりだろ。
Intelは保険としてモバイル向けLinuxの開発やってるが
あれこそMSとの交渉材料だと思ってるが。


大体に、Intelはもともと携帯電話そのものをいきなり狙う方針ではなかった。
ぶっちゃけシャープとWillcomのあれは先走りすぎた。
もともとAtomは現行世代で携帯電話で勝負する気はない。
消費電力がまだ大きすぎる。
x86コード資産を生かして製品は携帯電話とモバイルPCの中間のレンジから浸透を図る予定だったはず。

ARMに共通のソフト資産なんてあってないようなもんだからx86市場が脅かされることも無いわけだ。
(コントロールコア部分が共通化できるくらいでアクセラレータ向けのコードには互換性がない)

>野望わ、展望が苦しくなってきたす。

こんな間抜けな個人見解は書かなきゃ良かったな。
君はコピペだけやってればいいよ
自分の頭で考えることだけはやめたほうがいい。

544:Socket774
08/11/24 17:38:45 FhG9cFU8
目糞と鼻糞の競演

545:MACオタ>団子 さん
08/11/24 17:42:00 Q1VJWnjX
>>543
火病っているところ申し訳無いすけど、MSがNvidiaと組むということわ、
  -------------------
  WirelessMMXがMSやGNUのコンパイラで本家のSIMD拡張であるNEONをさしおいて
  サポートされて
  -------------------
この部分にNvidiaのGPU/GPGPUを採用するということす。
「ARM」という部分だけに目が行って、本題を見過ごしているとわ思わないすか?

546:MACオタ
08/11/24 19:22:13 Q1VJWnjX
>>501
ITJungleのMorgan記者のIBMによるTransitive買収の分析記事す。
特に新味わ無いすけど、歴史的な経緯やIBMの戦略予想が良くまとめられているので貼っておくす。
URLリンク(www.itjungle.com)

547:,,・´∀`・,,)っ-●◎○
08/11/24 21:14:52 9qM3upWO
>>545
無理だね。Tegraに採用されるコアはシェーダモデルとしては相当古い。
CUDAがサポートされてるプラットフォームくらい調べたほうがいいよ。

GeForce8からだ。それ以前は切り捨て。
もちろんTegraでもCUDAはサポートされない。アーキが別物だもの。

頭悪いんだから喋るな。わかったな?

548:MACオタ>団子 さん
08/11/24 21:26:48 Q1VJWnjX
>>547
  -------------------
  CUDAがサポートされてるプラットフォームくらい調べたほうがいいよ。
  -------------------
携帯電話で科学技術計算でもすると思い込んでいるすか(笑)

携帯機器におけるマルチメディア命令の用途わ、過去のPCと同様にCPUがGPU役をやっている状況す。
専用GPUにオフロードするだけで御の字かと。

549:MACオタ@補足
08/11/24 21:32:55 Q1VJWnjX
Intelの主張するWireless MMXの用途わ、こちらす。
URLリンク(www.intel.com)
  ----------------
  - Video compression
  - 2D and 3D graphics
  - Image processing
  ----------------
Nvidia Tegraの主要な機能わ、こちら。
URLリンク(www.nvidia.co.jp)
  ----------------
  - 最高1080p HDの映像再生
  - 分かりやすくスムーズな3Dユーザインターフェースのための超省電力GeForce GPU
  - 100時間を超える音声、および10時間を超えるビデオ再生のための統合メディアプロセッサ
  - 進化したDSCおよびHDビデオカメラ処理による画像処理
  ----------------

550:Socket774
08/11/24 21:33:34 lRSdK/cM
少なくとも"GP"GPUじゃァないなあ・・・それは。

551:Socket774
08/11/24 21:40:18 WtfN7KSR
画像処理にしたってOpenGL ESで実装するのは確実だしね。
NVIDIAのGPGPUを採用とは言えないわな。

552:MACオタ>550 さん
08/11/24 21:40:19 Q1VJWnjX
>>550
  --------------
  少なくとも"GP"GPUじゃァないなあ・・・それは。
  --------------
確かに>>545でGPGPUと書いたのわ、言い過ぎだったす。

553:,,・´∀`・,,)っ-●◎○
08/11/24 21:50:40 9qM3upWO
DX11のCompute ShaderもOpenCLもSM4.0以降が前提になってます。
はっきり言ってTegraの優位性は怪しい。

仮想敵はIntelじゃなくてAMDだろうに。
ATiのほうが組み込み向けのGPUではノウハウあるからね

NVIDIAも必死だからな。
日本法人の営業さんからして必死だもん。(あんまり言うと怒られるけど)

Tegraのデモがアレだからな。Atomの"N"270+945GS搭載のネットブックと比較して
こっちのほうが電力効率いいですよとか

組み込み向けに作ってるのはZシリーズのほうだっつーに。
あと、SoC製品は年が明けてからだしな。45nmプロセスで周辺モジュールを統合する
という点で、ある意味NehalemのX58チップセット(65nm)より先進的なプラットフォームといえる。
#先進的なだけで絶対性能が高いわけではないというフォローもしておく。


iPhoneをパクってWindows MobileをOSとして載せてアプリケーションのプラットフォームとして
使おうって言うならやめといたほうがいいと思うよ。
1プロセス32MBの制限に家電屋は今日も泣かされるのであった(CE6ベースだと無いんだけど)

554:MACオタ>団子 さん
08/11/24 22:44:35 Q1VJWnjX
>>553
  ---------------
  仮想敵はIntelじゃなくてAMDだろうに。
  ATiのほうが組み込み向けのGPUではノウハウあるからね
  ---------------
もはや存在しないような。。。
URLリンク(www.amd.com)
  ================
  先に発表された非中核事業の見直しの一環として、AMDはハンドヘルドおよびデジタルTV製品
  事業の売却を決定しており、これらは会計報告では非継続事業※1として分類されています。
  ================

555:,,・´∀`・,,)っ-●◎○
08/11/24 23:39:01 9qM3upWO
ARMは基本命令セットと基本マイクロアーキテクチャ部分はARM社に使用料を払うことで
各ベンダーで共有することができるが、拡張部分については各社の思惑で動いてて
統一の機運が見られない。
OSでいうならPOSIX以前のUNIX派生OS乱立見たいな感じだと思えばいい。

そんな中でXScaleがARMの中で優位を誇ってた時代もあったよ。
シャープのLinux Zaurusとか東芝あたりのPDAはみんなXScale使ってた。
あとはサムスン製のARM系CPUがちらほら。
ちなみにIntelはXScale製造権を手放したわけでもないしIntel謹製のネットワーク機器向けに
いまだに使われていたりもします。WMMXの商標権もいまだに保持してます。

当のNVIDIAはAtom用のIGPを作らせてくださいとか言ってる立場だったり。
URLリンク(www.digitimes.com)
ま、現状PowerVR使ってるくらいだし、ないこともないだろうな。
X58見る限りNVIDIAとの関係が悪いわけでもないようだし。

556:Socket774
08/11/25 00:43:59 kr3PDdwP
ついこないだTegraにCUDA持って来るってのは言ってたよ(第一世代にはない)

Nvidia to offer parallel tech for mobile devices
URLリンク(www.networkworld.com)

OpenCLも組み込み視野に入れてるし、事実上競合いないからどっちが採用されても大して変わらないとは思うけど

557:MACオタ>556 さん
08/11/25 00:53:09 vLMI/UCK
>>556
>>540のTheINQの記事によるとMicrosoft Phoneわ来年2月に発表になるという話すから、
第一世代のチップが使用されていると思われるす。
  -------------------
  The phone is slated to be announced at 3GSM this coming February, so if you plan on
  attending, please look surprised when MS unveils it.
  -------------------
GAMA Mobile World Congress (旧名3GSM)わこちら。
URLリンク(www.mobileworldcongress.com)

558:Socket774
08/11/25 01:03:09 kr3PDdwP
>>557
あら、Tegra自体は2009Q2だって言ってるんだけどな・・・

Nvidia to Ship Tegra Chip by Mid-2009, CEO Says
URLリンク(www.pcworld.com)

559:,,・´∀`・,,)っ-●◎○
08/11/25 10:27:44 P8ZTmbPf
>>556
それならAtomにAVXが載るのが先だと思うよ。
むしろ「LarrabeeはメインストリームCPUに統合される」って話を今するくらい無意味な話題。
どっちかというと動画再生を兼ねるプロセッサとしてはLarrabeeをカットダウンしたほうが良さそうなんだが。

どうせGeForce8400GSくらい相当のコアがMIDのTDPに収まるくらいに微細化が進んだ頃の話だろ。
Compute Capability 1.0以下を設ける気はなさそうだし。8000/900/200シリーズとそれ以前じゃ全然別物。


560:Socket774
08/11/25 10:44:13 clhYEM3T
馬鹿満載

561:Socket774
08/11/25 10:58:59 TKMd4Nc7
妄想はもう食傷気味 ><
ソース付きのネタを持ってきてよ

562:Socket774
08/11/25 20:42:43 nM63fo55
ちょっと面白いな。汎用プロセッサとFPGAの中間みたいなものか。

【ET 2008】NECエレ、構成を変更可能なストリーム処理用ASSPを開発、FPGAよりも高性能で低消費電力
URLリンク(eetimes.jp)

563:Socket774
08/11/25 20:51:37 CkVJodrX
>Pentiumデュアルコアと比較すると、単位時間当たりの処理速度が15倍に向上し、

この手の売り文句は↓を思い起こさせる
URLリンク(monoist.atmarkit.co.jp)
URLリンク(biblio.yamanaka.ics.keio.ac.jp)

564:,,・´∀`・,,)っ○×△□
08/11/25 20:52:20 xmukXtyv
N社の日本法人の某氏をして
「(ローエンド製品でのCUDAの意義は)そんなに速くならなくともCPUに処理時間の余裕ができるだけは意味があるんじゃないでしょうか」
とか自信なさげにいう代物だぜ。
ソースは俺。間違いない。

事実として8-32SP程度のローエンドGPUでCUDAやっても速くもなんともない。
処理によってはフル稼働してもCPUより遅かったりする
そんなもんをカットダウンしてモバイル向けに落とし込んでも脅威じゃねーよ。
それなら現時点であのTDPにして128bit-SSE命令を最大2つ同時実行可能(同クロックのPentiumMやK8を凌ぐ)なAtomのほうがまだ現実的で芽はあるよ。

GPGPUなんてのは本当は使いづらいけど性能がでるならということで仕方なく使うもんであって
誰も「GPUでコンピューティングしたい」訳じゃないんだぜ。変態研究者を除いて。

まぁMACオタあたりの御花畑な思考では理想のアーキテクチャに見えるかもしれないが。
本質的にはCellよりメモリの制限がきつく、用途を選ぶ。
罰ゲームでなくて何だよ。

すくなくともそのままではモバイル・組み込みには不向きだな。
SPを減らすのもありだろうけどますますマンチキンの願望とかけ離れた代物になるわな。



565:Socket774
08/11/25 21:15:53 C/1SV2Ri
使える用途で使えばいいんだよ

何にでも使おうって方が間違い

566:Socket774
08/11/25 21:23:36 DKoX2Du1
お願いですからハイエンドCPUローエンドGPUの素エンコ勝負だけにしてください(心の叫び)

567:,,・´∀`・,,)っ-●◎○
08/11/25 21:30:46 P8ZTmbPf
モバイル機器でマルチコアは流行らん。歴史が証明してる。
今までどれだけの組み込み向けプロセッサのマルチコア版がペーパーリリースで終わったよ

MACヲタは組み込みの連中の素性を知らんのだろうが
「現場の長年のノウハウ」とか言ってC++によるOoOプログラミングすら嫌ってる奴も多くない。
いまだにサブ関数を順番に呼んでいくタスクシステムの延長でプログラム書いてる。
そんな連中がマルチコアなんてまともに使いこなせるわけが無い。
CUDA?なにそれおいしいの?

最先端プロセスにものを言わせた高クロックのシングルコアのほうが圧倒的に扱いやすいだろ。

568:Socket774
08/11/25 21:36:01 C/1SV2Ri
専用機能特化機構を積んだ方がよいのでは?
用途も特定しやすいだろうし

569:Socket774
08/11/25 21:55:56 CkVJodrX
うん。
だから組み込みではASIC・システムLSIが使われてきたし、これからも使われ続ける。
それなりの汎用処理性能が求められる携帯電話向けでは、アプリケーションプロセッサが使われる。

570:,,・´∀`・,,)っ-●◎○
08/11/25 21:59:11 P8ZTmbPf
最近名前よく聞くフィックスターズとかサイボウズラボみたいな
灯台鏡台博士を大量に雇ってる企業だけじゃないんだよソフト屋は。

日本のソフト業界を支えてるのは三流私立・高専・専門学校卒だったりする。
(従業員の平均年齢30歳未満の世界・・・あなおそろしや)


571:Socket774
08/11/25 22:10:46 clhYEM3T
馬鹿はそれにも引っかからないから可哀想だな

572:,,・´∀`・,,)っ-●◎○
08/11/25 22:17:21 P8ZTmbPf
>>571 そう自身を哀れむなYO

ただ、大学卒業できただけで神の子だっていう人もいるし
レベル低いよなこのスレ

573:,,・´∀`・,,)っ-●◎○
08/11/25 22:19:20 P8ZTmbPf
ここ直しとく

×「現場の長年のノウハウ」とか言ってC++によるOoOプログラミングすら嫌ってる奴も多くない。
○「現場の長年のノウハウ」とか言ってC++によるOoOプログラミングすら嫌ってる奴も【少なく】ない。


574:,,・´∀`・,,)っ-●◎○
08/11/25 22:21:04 P8ZTmbPf
Object-OrientedだからOoOじゃなくてOOか
しまったwwww

575:Socket774
08/11/25 22:40:01 4HwNPSkc
いつのながら団子さんの独壇場
おみごとです

576:レトリック君
08/11/25 23:33:31 aZntt5H1
現実は…時にフィクションよりも奇なり
とだけ書いておくか…

577:Socket774
08/11/26 00:54:04 whKUwQ60
一口に組み込み向けと言ってもPCと変わらん物から8bitマイコン・4bitマイコンまであるわけで、
上位の方にはマルチコアが使われているでしょ。

578:Socket774
08/11/26 06:19:31 YpWkD+4P
車業界のMISRA-Cとか超保守的
ポインタの演算不可だってよ
まあコスト的にもシビアだからx86もありえないけど

579:,,・´∀`・,,)っ-○◎●
08/11/26 15:28:55 GrKYm10I
まあ大量に数出るものについてはAtomの単価はネックになるわな。
大体にオーバースペックだろ。

Atomが狙うのは携帯電話なんかよりももっと性能が必要なレンジ。
ARMでも1GHz超えるようなものは1000円超える。
このレンジでようやく、Atomのx86資産を生かした開発効率と天秤にかけることができるわけだ。
Atomがインターネットデバイスの需要はPCから携帯機器に置き換わるって言われてる。
Intelは別に組込業界を支配しようってんじゃなくて、PCの需要がMIDシフトしていくので
飯食っていくために必然的にやらざるを得ないって話。

携帯電話などを通じて下のほうからリッチな機能を持つ支援ハードを搭載して
インターネットデバイスとしての機能強化を狙っていくのがARMやSHなどの
ハイエンド組込CPUだとすれば、インターネットデバイスとしての機能を満たすには
ほぼ十分な性能を持ったPCをベースに上のほうからコンパクト化・省電力化を
狙っていくのがローエンドx86であるAtomその他諸々。
WindowsやLinuxが動くPCをそのままコンパクトにしていく。
今年爆発的に売れたネットブックの需要も通過点。

で、いまiPhoneなんかがやろうとしてるけど、「アプリケーションの動くプラットフォーム」として
成功するには、フリーソフトも含めたソフトの充実は絶対条件だ。
そのことを踏まえ、AppleはiPodやiPhone向けのSDKを、Leopardユーザーなら無料で使えるようにした。
しかしこれもMac買わないといけないので敷居が低いとは言えない。

Atom+Windowsベースだと、いざとなれば今使ってるPCと同じソフトがそのまま動かせるかもしれない。
これは個人を含めた開発者にもユーザーにもメリットがある。
Win32-x86向け開発ならVCはタダでも使えるし。
MSはWinCE向け開発可能なIDEをVS2008からはPro以上に引き上げちゃった。

しかもMSはCEは廃止にしてNTベースに置き換える計画打ち出してる。

580:,,・´∀`・,,)っ-○◎●
08/11/26 15:38:13 GrKYm10I
>>577
いま需要が伸びてるデジタルフォトフレームなんかだと
ハイエンドクラスに使われてる石はデュアルコアARMとかもあるよ。
たいがい片方をDSPの制御に使ってたりするんだが。
あと日立の携帯はSHの2コアとか使ってるね。

しかし4コア以上はたいがいペーパーリリースで終わってる。

581:Socket774
08/11/26 15:41:47 m7XIjN0m
世界で最も多く出荷されたRISCプロセッサMIPSのサバイバル戦略
URLリンク(techtarget.itmedia.co.jp)

582:Socket774
08/11/26 16:54:49 artGzS0W
ん?
マルチコアから4コア以上に摩り替わってる気がするぞ?

583:,,・´∀`・,,)っ-○◎●
08/11/26 17:13:58 GrKYm10I
ん?デュアルコアも「マルチ」コアに含めちゃって良いのか?
ちなみに2コアのうちDSP制御専用に使われて
ARMとしてプログラム触るのが1コアだけ、
ってパターンでもマルチコアって言っちゃって良い?
1コアがI/O周り専用でもう1コアがメイン処理用みたいなのもあるね。
DSがこのパターン。ARM7+ARM9で。

CPU+コプロセッサっていうありがちな構成の延長として2コアまではいけるんだけど
それ以上はなかなか普及が進まないんだが。
メイン処理の分割はいろいろめんどうなのよ。


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch