【トリップ検索】MERIKEN's Tripcode Finder その2at SOFTWARE
【トリップ検索】MERIKEN's Tripcode Finder その2 - 暇つぶし2ch14:名無しさん@お腹いっぱい。
13/01/20 15:32:20.29 gnybx2bF0
物理32coreは無理ですけど、手持ち環境でそれぞれのバージョンを比較してみました

【CPU】AMD FX-8350 @4.95GHz
【OS】 Microsoft Windows 7 64bit
【トリップの種類】12桁
【CPU検索スレッドの数】自動(8になるのかな?)
【その他のオプション】なし
【その他】CPUのみ。5完1タゲ。

0.07
【CPUの平均速度】53.72M tripcodes/s
0.08 Alpha 1
【CPUの平均速度】114.78M tripcodes/s
0.08 Alpha 2
【CPUの平均速度】106.65M tripcodes/s

こちらの環境では、Alpha1、Alpha2で逆転現象は見られますが、00.7からはおおよそ50%の高速化は成されています
OpenCLの最適化、楽しみにしております

15:名無しさん@お腹いっぱい。
13/01/20 16:15:36.31 gnybx2bF0
んにゃ
2倍の数値になってるから100%か

16: ◆MERIKEN4.k
13/01/20 17:48:55.79 VNsWebzC0
>>11
Intelの石だとちゃんと最適化の成果が出ているようですねえ。

>>10
>>12
それで問題ないです。情報提供、ありがとうございます。

>>13
GPU検索はもうちょっと速くなる予定です。期待してて下さい。

>>9
>>14
Alpha 2で遅くなるのはどうやらPhenom以降らしいですね。
CPUIDの仕様をみてゲンナリしたので、実行時に速度を計測してAlpha 2の最適化を
適用するかどうかを判断させることにします。しかしBulldozerはさすがに
速いですねえ。整数演算だけだったらCore i7-3770Kといい勝負ができてますね。

17: ◆YSRKENkO6Y
13/01/20 18:25:03.16 6cCMlcR80
>>16
>実行時に速度を計測
CPUIDで決めつけるよりは安全だと思いますよ
ただ、場当たり的な対策な気もしますが

GPUがこれ以上速くなったら俺でも100M/s超えるかもワーイ

18: ◆MERIKEN4.k
13/01/20 18:29:42.27 VNsWebzC0
>>17
将来どんなアーキテクチャが出てくるかわからないのでこれでいいんですよ。
手元にないハードウェアのために性能の良いソフトウェアを書くのは難しいのです。

19: ◆MERIKEN4.k
13/01/20 18:45:41.37 VNsWebzC0
とりあえずAlpha 2の最適化を使用するかどうかを実行時に決定できるように
なりました。あとはCUDAのときと同じ要領で実行時に速度を測定して
最適なアルゴリズムを選択できるようにしてやるだけです。

20: ◆MERIKEN4.k
13/01/20 20:31:24.15 VNsWebzC0
う~ん、なかなかうまくいかないなあ…
動的な最適化のためにループをもう一段回深くしたら速度が落ちてしまいました。
多分コンパイラの最適化を邪魔してしまってるんだろうけど、これは困った。

元はといえばGetTickCount()の精度が悪すぎるのが原因といえば原因なんだけど、
これってなんとかならないのかしらん。

21:ののたん ◆KiwamonoL.
13/01/20 20:46:30.35 MWphMQ8K0 BE:1106146087-DIA(289888)
>>20
つ「timeGetTime」

22: ◆MERIKEN4.k
13/01/20 20:55:46.61 VNsWebzC0
>>21
あ、その節は貴重な資料を本当にありがとうございました。
経過時間の測定は次の方法で何とかなりました。
URLリンク(stackoverflow.com)
一応最適化のルーチンは動いているようなので、あとは微調整をしてやるだけです。

23: ◆YSRKENkO6Y
13/01/20 21:38:13.30 6cCMlcR80
>>20-22
まさか時間測定をGetTickCount()でやっていただなんて……
ところで、QueryPerformance系命令ははCPUクロックが動的に変化する場合、
「OSによっては値が信用できなくなる」なんてこともありえますゆえご注意を……
参考:
URLリンク(d.hatena.ne.jp)
URLリンク(d.hatena.ne.jp)
URLリンク(d.hatena.ne.jp)

24:名無しさん@お腹いっぱい。
13/01/20 21:49:35.86 ourgxKXJ0
3,300円につられてWin8にするんじゃなかった・・・HD4000系つかえないのね。
なのでQuadro FX4800 (GTX265級)CUDAでWin8をやってみました。

【GPU】Nvidia Quadro FX4800 x2
【CPU】Xeon E5540 x1
【OS】Windows 8pro
【バージョン】MERIKEN's Tripcode Finder 0.08alpha2
【トリップの種類】12桁
【1SMあたりのブロックの数(CUDA)】auto (16)
【1CUあたりのワークアイテムの数(OpenCL)】
【Display Driver】310.90
【GPUの平均速度】330 tripcodes/s
【CPUの平均速度】50 tripcodes/s

抜ける時に固まってしまうので、GPUのみにした方がいいか・・・。

25: ◆MERIKEN4.k
13/01/20 22:00:31.90 VNsWebzC0
>>23
なるほど、こんなこともあるんですね。いやあ、助かりますw
そのせいかどうかわからないんですけど、動的な最適化は
完全には安定していないようです。やっぱりtimeGetTimeを使ったほうが
いいのかしらん。

26: ◆MERIKEN4.k
13/01/20 22:03:23.56 VNsWebzC0
あと色々コードをいじって気づいたんですが、Phenom IIで遅くなる原因は
どうやら命令のオーダーにあるようです。うまく命令のオーダーを
調節してやれば実行時の最適化は必要なくなるかもしれません。
ちょっとこれから用事があるので、また後で試してみます。

27: ◆YSRKENkO6Y
13/01/20 22:08:28.62 6cCMlcR80
>>24
いや・・・Ver.0.07 alpha 7以降HD4000使えなくなったというのが俺の認識
(過去ログ見れば分かるが対応が難しいからだそう)

その分Ver.0.08 alpha 1以降CPU検索がグッと速くなってるからそっちで補えるけど

28:名無しさん@お腹いっぱい。
13/01/20 22:28:54.48 ourgxKXJ0
>>27
あらら。二重の意味でNGなんですね。AMDもHD2K3K4Kは去年の8月から
切っちゃってて、Win7までしかドライバ出てなかったんです。

Nvidiaがあるからいいや、みたいなのりでWin8にしてしまいましたが
HD4000も過去帳入りですね・・・。

29:名無しさん@お腹いっぱい。
13/01/20 22:34:56.35 /IyUB2p70
【CPU】i7-3970x(OC 5.04GHz)
【OS】 Microsoft Windows 7 64bit
【トリップの種類】12桁
【その他のオプション】全てDL時のまま
【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2
【CPUの平均速度】186.21M tripcodes/s


さっきよりもうちょっと速くなったww
早すぎワロチwww

30: ◆YSRKENkO6Y
13/01/20 23:57:59.33 6cCMlcR80
>>28
>AMDもHD2K3K4K
え、AMDにもIntel HD Graphics 4000みたいなのあるの……?
ひょっとしてRadeonの方言ってる??
>>6でも書いてるけど、自分はCorei5+GeForce環境だから、
CPU検索が遅い際にはMERIKENでゲフォ+HDG4000を使い、
SHArp TripperでCPUを使っていたんだ
でもVer.0.08以降CPU検索が速くなったからSHArp要らない→両方MERIKENでおkになった
決して「MERIKENシリーズではRadeon HD 4000シリーズは使えない」って意味じゃないからね!

31: ◆MERIKEN4.k
13/01/21 01:19:54.68 HDFcfntu0
>>29
これも滅茶苦茶速いですねえ。たしかこれ、Sandy Bridgeですよね。
OCでここまで回せるとは…

32: ◆MERIKEN4.k
13/01/21 01:24:18.89 HDFcfntu0
実行時の最適化はなかなか安定してくれません。
まあ各検索スレッドがてんでバラバラに速度を測定してるので
仕方がないといえばそうなのですが…
とりあえずtimeGetTimeを試してみて、これが駄目だったら
また別の方法を考えて見ることにします。

33:名無しさん@お腹いっぱい。
13/01/21 01:54:18.92 70EXSbRt0
計測用に別の実行ファイルを用意してそちらでテスト
 ->設定書出
 ->本体で設定ファイル読み込んで以下略

な感じで回避できないの? >>20

34:名無しさん@お腹いっぱい。
13/01/21 02:12:49.20 iy3ZJANG0
>>31
さすがにXeon2個には勝てないけどなww


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch