10/06/27 19:26:43 Iw7f5ZOt
SSEとは別に新たなデコードスキームに対応するので別にデコーダは更に複雑になるわけで
デコーダのコストが軽くなると言うのは間違い。
ただ、プリフィクスを1バイトずつ延々くわえ続けるよりはマシと言うだけ。
まあ、3~4オペランドの命令に置き換わって2~3命令かかるのが1命令になるなら結局効率は良くなるわな。
つうか、メーカーノートPCが普通にWindows 7の64ビット版採用してるのは良い流れだと思う。
XMMレジスタ8本は窮屈すぎてならん。
856:Socket774
10/06/27 20:11:10 m7cmhQCB
AutoCADだと64にされたら対応できねーな。また新しく買えってか。
857:Socket774
10/06/27 21:11:03 fNZW0Kie
結局AVXはコードの書き直しが必要なのか?
Intel コンパイラだけではどうにもならないもの?
858:,,・´∀`・,,)っ-○○○
10/06/27 21:35:49 Iw7f5ZOt
SSE Intrinsicsで書かれたコードをAVX用オプション付けてコンパイルし直すだけでAVX対応完了
元々従来SSEになかった完全新規の命令や256ビット版は書き直しが必要。
あるいは自動ベクトル化頼みか
859:Socket774
10/06/27 21:40:47 rpJVLhgz
>>854
URLリンク(www.uproda.net)
CPUが38%だから、再生支援は問題なく動作していることが分かる
それなのに4099 dropped
本当に試したの?
860:Socket774
10/06/27 21:47:06 W7lvOk5S
再生支援働いたらCPu負荷って2%以下にならん?
861:Socket774
10/06/27 22:34:50 toTs5kYU
>>858
うーん、
単にAVXフォーマットの、オペランド数の増えた命令を使うだけなら確かにそうだけど、
AVXの目玉、256bitのYMMレジスタを使うには書きなおしが必要。
862:,,・´∀`・,,)っ-○○○
10/06/27 22:39:24 Iw7f5ZOt
ところでMMXはもう要らんよね。
あれはトラブるので使いたくない
863:Socket774
10/06/27 22:43:09 qoaO6NK/
普通にC++でソフトを書いて、VCやらgccのコンパイルオプションで
avx用のオプションつければ、AVXのコードが出来上がりじゃね?
普通のアプリはそうやって対応するのでは?
864:Socket774
10/06/27 23:00:27 toTs5kYU
>>862
インテルやAMDも消せるものなら消したいと思っているはずだが。
でも、MMXやFPUを使ってるコードもまだ残っているはずで、
今まで動いていたソフトが動かなくなるようなCPUは売れないよ。
速度向上の期待は出来ないが動かなくなることはしばらくは心配しなくて良いと思う。
865:,,・´∀`・,,)っ-○○○
10/06/27 23:02:01 Iw7f5ZOt
レジスタ間movapsが無くなるとか、平均命令長が短くなるとか
コードサイズの縮小やオペレーション密度の向上だけでも十分性能向上しうるでしょ
別に全部256ビットにする必要ないよ。
software.intel.comに上がってたRGBA→RGBの変換サンプル、シミュ通してみたら
俺の書いた128ビットSIMD実装の方が数割速かったwwww
無理に256ビットにする必要ないよ。
オペランド数が増えるのはなにげに性能向上効果大きいよ。
新たなSSE命令を追加するより、確実に性能上がる。
しかしそのコードサイズについてだけど、GCCとかVCはまだ命令長の最適化がウンコだね
vadddps xmm0, xmm7, xmm15なんて平気で吐くし。
ソースオペランド入れ替えるだけで1バイト短くなるのくらいやって欲しいんだが。
命令フェッチ帯域狭いんだし。
というか、REXの削減すら実質やってくれないっぽいので期待するだけ無意味かな
866:,,・´∀`・,,)っ-○○○
10/06/27 23:02:53 Iw7f5ZOt
>>864
てか、あれって64ビットOSでレジスタ待避してるのかな
867:Socket774
10/06/27 23:20:46 toTs5kYU
>>865
そりゃ256bitレジスタを使わ無くても速度向上はするだろうけど、
256bitレジスタはAVXの目玉だよ。
うまく最適化出来れば倍近い性能が出る可能性もある。
単に命令長が短くなったり、オペランド数が増えるだけでは、
どうやっても倍の性能は出ない。
>>866
そう言えば、64bitコードでMMXやFPUを使おうと思ったことが無いからわからない。
atan を VS2010でコンパイルしたらFPU命令を使わないみたい。
でも64bitOS上の32bitコードは退避してるはずだよなあ。
Sandy以降だとレジスタ退避命令があるからそれを使うなら退避されるだろうけど。
868:,,・´∀`・,,)っ-○○○
10/06/27 23:23:07 Iw7f5ZOt
64ビットOS上でMMX使ったらおかしくなるの俺だけかな(32ビットOSだと何ともない)
emms漏れてる箇所あるのかもしれんけどチェックするのまんどくせ
869:Socket774
10/06/27 23:31:10 toTs5kYU
↑
Sandyならxgetbvを使えば退避してるかどうかわかるんじゃね?
870:Socket774
10/06/28 00:00:11 ftHH/r/2
ここには保存されてるようなことがかいてあるけど。
URLリンク(labs.cybozu.co.jp)
871:,,・´∀`・,,)っ-○○○
10/06/28 00:03:57 vvW5sVNH
vzeroall/vupperallとemmsのOpcode Map重ねてきたのは何かの因縁か
872:Socket774
10/06/28 00:34:48 ftHH/r/2
単にOpecode空間を狭めずに命令を増やせるって理由だけでしょ。
意味的にもそう遠くないし。
873:Socket774
10/06/28 07:48:19 hg79BlfP
>>860
Flashの再生支援は10%減るとかそういうたぐいのレベル
ほんと使えない
874:Socket774
10/06/28 14:24:47 5IIQEzjc
AVXに期待するなら、Windows8やAdobe CS6など対応アプリがそろうIvy Bridge世代まで
Gulftown使い続けたほうがいいんではないだろうかとはおもう
1コアあたりの性能向上はそんなにないんだよねたしか
875:Socket774
10/06/28 15:18:39 FgPG1+jb
いやこれはcore2からの移行候補なので
876:Socket774
10/06/28 15:26:14 0LZwaSkE
Core2からの移行候補なのか?
俺も買っちゃってええのん?w
E8400からだと何処まで幸せになれるのかガンダムに例えて欲しい。
877:Socket774
10/06/28 15:48:42 7giNxb2U
>>876
1155の4C8Tで上位モデルならグフとガンダムぐらい
B2の上位ならガンダムMk.2とメッサーラくらい
878:Socket774
10/06/28 17:30:03 i9frKuTD
北森せろりん2.7からだとどれぐらい違うか
F1で例えてくれ
879:Socket774
10/06/28 17:41:18 2QNu5+j/
アレジと顎くらい違う
880:Socket774
10/06/28 20:51:39 0LZwaSkE
>>877
Thx!
881:Socket774
10/06/28 21:20:22 mNqAYck/
>878
6輪たいれる と2010年モデル(どれでも)くらい違う
882:Socket774
10/06/28 22:20:50 WCb4KMhN
メッサーラってしぶといよね。
883:Socket774
10/06/28 23:42:22 BfsqW6aR
今のi5 750のCPUの性能で今のAMDのオンボグラくっ付けてくれるだけでいい
884:,,・´∀`・,,)っ-○○○
10/06/29 00:16:39 NEuBiObk
>>882
はぐれメタル狩りを思い出した
885:Socket774
10/06/29 00:24:36 tK5Lc5G9
>>883
インテル用のママン出してくれるだけで嬉しいのに
886:,,・´∀`・,,)っ-○○○
10/06/29 00:38:08 NEuBiObk
Radeon XpressはNECとか富士通の下位機に搭載されてたけど嫌な思い出がある。
USBクソ遅EEEEEとか
887:Socket774
10/06/29 00:58:05 CyhG0wsJ
Intel以外は要らん
特にVIAは糞
最近は大容量HDDで問題が出やすいとか言うし
性能と互換性や安定性も両立してくれないとな
888:Socket774
10/06/29 01:30:49 avMZBgiY
>>879
>>881
さんくす
A・セナとB・セナぐらい違うてことだな
889:Socket774
10/06/29 23:58:06 31jykHM7
わしも939時代、マザー選びで散々苦労したわ
Pen4から乗り換えたがいいが、糞マザーが多くてびびった
i865や845レベルの安定性が当然と思ってたからな
890:Socket774
10/06/30 01:17:15 X00satQ+
チップセットに機能てんこ盛りにせずCPUに統合する流れは正解だと思うわ
不安定なママンなんてゴミに等しい
アムド信者はなんてあんなゴミ使ってられるんだろうか
891:Socket774
10/06/30 05:51:27 qmzYTJO9
そのおかげでPCIe Gen3非互換版がCPUに搭載されるんですね
892:Socket774
10/06/30 06:23:34 hZrhOTFg
>>891
どうなるんだろ 偽3.0⇔真3.0(or 2.0)ブリッジで当面の対応とかな
893:Socket774
10/06/30 07:41:56 PUiO3cTw
力技で0.9仕様のマスクに変えてくる(が、当分は2.0運用)になるに1票