07/10/13 01:00:45
SSE2のPMAX/MINのスループットは0.5だが
SSE4.1のPMAX/MINのスループットは1
510:・∀・)っ-○◎●
07/10/13 01:05:39
命令長が長くなるから自重
511:・∀・)っ-○◎●
07/10/13 20:28:33
なにげにAMDのmovntss/dが速いな
512:デフォルトの名無しさん
07/10/13 20:51:30
ダンゴさんが連投すると盛り上がるな
513:デフォルトの名無しさん
07/10/13 20:57:36
盛大に盛り上がってるね。
514:・∀・)っ-○◎●
07/10/13 21:02:27
うるしぁバールのようなものぶつけんぞ
515:デフォルトの名無しさん
07/10/13 21:08:41
すごい盛り上がりだね。
516:デフォルトの名無しさん
07/10/13 21:56:56
じゃあ上げとくか
517:デフォルトの名無しさん
07/10/14 00:25:28
気がついたら 同じ言い訳ばかりしてる
そしていつも純損失を計上
あきらめずにIntelのプロセスに挑戦するけど
すぐ微細化するよ
シェアがあれば らくに研究費確保できるけど
何回やっても 何回やっても
Intelがたおせないよ
あのプラットフォーム何回やっても崩せない
イベント開いて FUDしつづけても
いずれはベンチが晒される
ペーパーローンチも試してみたけど
次世代相手じゃ意味が無い!
だから次は絶対勝つために
僕はファブだけは最後までとっておく
518:デフォルトの名無しさん
07/10/14 00:27:12
気が付いたら 振り子が揺れてる
そしていつも周回遅れ
諦めずにアーキを全面刷新するけど
すぐにメッキはがれる
K8でいけば らくにPrescottたおせるけど
何回やっても 何回やっても
Baniasがたおせないよ
PenM系のトランジスタ効率破れない
アーキの方向まねしてみても
インプリメントで差がつく
高価な製造技術試してみたけど
Intel相手じゃ意味がない!
だから次は絶対勝つために
僕は裁判費用だけは最後までとっておく
519:デフォルトの名無しさん
07/10/14 00:59:45
こういうのって本当におもろいと思って書いてるのかなぁ。
520:デフォルトの名無しさん
07/10/14 16:39:33
酒が入っていれば何でも楽しい
521:デフォルトの名無しさん
07/10/14 21:28:09
酒が入ったときは「うんこ」でも爆笑するやつは居る。
522:デフォルトの名無しさん
07/10/23 21:41:38
Opteron 2360 SE + PGI Compiler + SmartHeap Library
URLリンク(www.spec.org)
[-fast] SSEを含めたさまざまな最適化を行う。
[-Mipa=inline] 関数のインライン化を行い呼び出しのオーバーヘッドを削減する。
[barcelona] K10アーキテクチャをターゲットにしたコード生成を行う。
[-Mipa] プロシージャ間のグローバルな最適化のために解析を行う。
[-Bstatic_pgi] ランタイムライブラリとスタティックにリンクさせる。
[-fb] プロセッサ内部のパフォーマンスカウンタからサンプリングしたデータを基に最適化を行う。
Xeon X5355 + GCC Compiler
URLリンク(www.spec.org)
[-O3] さまざまな最適化を行う。SSEは利用しない。
[-fno-inline-functions] 関数のインライン化を行わない。
*Opteron + GCC CompilerとXeon + PGI Compiler + SmartHeap Libraryの成績は現在提供しておりません。
Sponsorrd by 独占企業逝っtelと戦う正義のAMD
523:デフォルトの名無しさん
07/11/04 11:01:01
( ´ー`) ?
524:デフォルトの名無しさん
07/11/12 17:17:10
Yorkfield買った猛者は現れるかな。
525:デフォルトの名無しさん
07/11/14 17:22:00
IntelのIntelR 64 and IA-32 Architectures Optimization Reference Manual
が、更新されてPenrynも載ってる。
526:デフォルトの名無しさん
07/11/15 14:34:47
徹底研究"Penryn" - Yorkfieldで探る45nm世代Intel Architectureの真実
URLリンク(journal.mycom.co.jp)
シリーズ化してくれるのはうれしいね。
527:1 ◆.MeromIYCE
07/11/15 15:28:04
>>526
ストアの改良だけをえぐり出すベンチは作るのが大変そうだな。
良く言えば完成度が高い、悪く言えば無難。
>>525のレイテンシとスループットの表を見てもそうだ。
Comroeで「遅い」と感じた命令が遅くなくなっている(糞のように速い命令はない)。
それにしてもL2は24wayか。
どこに欲しいデータがあるのか探すのに24回もアドレス比較が必要だからな。
データ位置によってレイテンシが変わったりするんだろうか。
528:デフォルトの名無しさん
07/11/16 07:09:55
tetsuya komuroかと思った
529:デフォルトの名無しさん
07/11/19 02:49:34
>データ位置によってレイテンシが変わったりするんだろうか。
そんな危険なことはしない