13/01/20 20:31:24.15 VNsWebzC0
う~ん、なかなかうまくいかないなあ…
動的な最適化のためにループをもう一段回深くしたら速度が落ちてしまいました。
多分コンパイラの最適化を邪魔してしまってるんだろうけど、これは困った。
元はといえばGetTickCount()の精度が悪すぎるのが原因といえば原因なんだけど、
これってなんとかならないのかしらん。
21:ののたん ◆KiwamonoL.
13/01/20 20:46:30.35 MWphMQ8K0 BE:1106146087-DIA(289888)
>>20
つ「timeGetTime」
22: ◆MERIKEN4.k
13/01/20 20:55:46.61 VNsWebzC0
>>21
あ、その節は貴重な資料を本当にありがとうございました。
経過時間の測定は次の方法で何とかなりました。
URLリンク(stackoverflow.com)
一応最適化のルーチンは動いているようなので、あとは微調整をしてやるだけです。
23: ◆YSRKENkO6Y
13/01/20 21:38:13.30 6cCMlcR80
>>20-22
まさか時間測定をGetTickCount()でやっていただなんて……
ところで、QueryPerformance系命令ははCPUクロックが動的に変化する場合、
「OSによっては値が信用できなくなる」なんてこともありえますゆえご注意を……
参考:
URLリンク(d.hatena.ne.jp)
URLリンク(d.hatena.ne.jp)
URLリンク(d.hatena.ne.jp)
24:名無しさん@お腹いっぱい。
13/01/20 21:49:35.86 ourgxKXJ0
3,300円につられてWin8にするんじゃなかった・・・HD4000系つかえないのね。
なのでQuadro FX4800 (GTX265級)CUDAでWin8をやってみました。
【GPU】Nvidia Quadro FX4800 x2
【CPU】Xeon E5540 x1
【OS】Windows 8pro
【バージョン】MERIKEN's Tripcode Finder 0.08alpha2
【トリップの種類】12桁
【1SMあたりのブロックの数(CUDA)】auto (16)
【1CUあたりのワークアイテムの数(OpenCL)】
【Display Driver】310.90
【GPUの平均速度】330 tripcodes/s
【CPUの平均速度】50 tripcodes/s
抜ける時に固まってしまうので、GPUのみにした方がいいか・・・。
25: ◆MERIKEN4.k
13/01/20 22:00:31.90 VNsWebzC0
>>23
なるほど、こんなこともあるんですね。いやあ、助かりますw
そのせいかどうかわからないんですけど、動的な最適化は
完全には安定していないようです。やっぱりtimeGetTimeを使ったほうが
いいのかしらん。
26: ◆MERIKEN4.k
13/01/20 22:03:23.56 VNsWebzC0
あと色々コードをいじって気づいたんですが、Phenom IIで遅くなる原因は
どうやら命令のオーダーにあるようです。うまく命令のオーダーを
調節してやれば実行時の最適化は必要なくなるかもしれません。
ちょっとこれから用事があるので、また後で試してみます。
27: ◆YSRKENkO6Y
13/01/20 22:08:28.62 6cCMlcR80
>>24
いや・・・Ver.0.07 alpha 7以降HD4000使えなくなったというのが俺の認識
(過去ログ見れば分かるが対応が難しいからだそう)
その分Ver.0.08 alpha 1以降CPU検索がグッと速くなってるからそっちで補えるけど
28:名無しさん@お腹いっぱい。
13/01/20 22:28:54.48 ourgxKXJ0
>>27
あらら。二重の意味でNGなんですね。AMDもHD2K3K4Kは去年の8月から
切っちゃってて、Win7までしかドライバ出てなかったんです。
Nvidiaがあるからいいや、みたいなのりでWin8にしてしまいましたが
HD4000も過去帳入りですね・・・。
29:名無しさん@お腹いっぱい。
13/01/20 22:34:56.35 /IyUB2p70
【CPU】i7-3970x(OC 5.04GHz)
【OS】 Microsoft Windows 7 64bit
【トリップの種類】12桁
【その他のオプション】全てDL時のまま
【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2
【CPUの平均速度】186.21M tripcodes/s
さっきよりもうちょっと速くなったww
早すぎワロチwww
30: ◆YSRKENkO6Y
13/01/20 23:57:59.33 6cCMlcR80
>>28
>AMDもHD2K3K4K
え、AMDにもIntel HD Graphics 4000みたいなのあるの……?
ひょっとしてRadeonの方言ってる??
>>6でも書いてるけど、自分はCorei5+GeForce環境だから、
CPU検索が遅い際にはMERIKENでゲフォ+HDG4000を使い、
SHArp TripperでCPUを使っていたんだ
でもVer.0.08以降CPU検索が速くなったからSHArp要らない→両方MERIKENでおkになった
決して「MERIKENシリーズではRadeon HD 4000シリーズは使えない」って意味じゃないからね!
31: ◆MERIKEN4.k
13/01/21 01:19:54.68 HDFcfntu0
>>29
これも滅茶苦茶速いですねえ。たしかこれ、Sandy Bridgeですよね。
OCでここまで回せるとは…
32: ◆MERIKEN4.k
13/01/21 01:24:18.89 HDFcfntu0
実行時の最適化はなかなか安定してくれません。
まあ各検索スレッドがてんでバラバラに速度を測定してるので
仕方がないといえばそうなのですが…
とりあえずtimeGetTimeを試してみて、これが駄目だったら
また別の方法を考えて見ることにします。
33:名無しさん@お腹いっぱい。
13/01/21 01:54:18.92 70EXSbRt0
計測用に別の実行ファイルを用意してそちらでテスト
->設定書出
->本体で設定ファイル読み込んで以下略
な感じで回避できないの? >>20
34:名無しさん@お腹いっぱい。
13/01/21 02:12:49.20 iy3ZJANG0
>>31
さすがにXeon2個には勝てないけどなww