【トリップ検索】MERIKEN's Tripcode Finder その2at SOFTWARE
【トリップ検索】MERIKEN's Tripcode Finder その2 - 暇つぶし2ch2: ◆MERIKEN4.k
13/01/20 09:12:54.75 VNsWebzC0
■過去スレ

初代 スレリンク(software板)
無印 スレリンク(software板)

3: ◆MERIKEN4.k
13/01/20 09:13:28.40 VNsWebzC0
■動作報告用のテンプレ

【GPU】
【CPU】
【OS】
【バージョン】MERIKEN's Tripcode Finder x.xx
【トリップの種類】12桁・10桁
【1SMあたりのブロックの数(CUDA)】
【1CUあたりのワークアイテムの数(OpenCL)】
【1WGあたりのワークアイテムの数(OpenCL)】
【1GPUあたりの検索プロセスの数(OpenCL)】
【1検索プロセスあたりの検索スレッドの数(OpenCL)】
【CPU検索スレッドの数】
【その他のオプション】
【Display Driver】
【10分間の平均速度】tripcodes/s
【GPUの平均速度】tripcodes/s
【CPUの平均速度】tripcodes/s
【GPUの使用率】%
【GPUの温度】℃
【その他】

4: ◆MERIKEN4.k
13/01/20 09:14:35.80 VNsWebzC0
■最高速の記録

以下は2013年1月現在における検索速度の最高記録です。

> 810 : ◆MERIKEN4.k :sage :2012/12/09(日) 18:29:54.81 ID:D9EB7VO00
    :
> 【GPU0】DIAMOND 6990PE54G Radeon HD 6990 4GB @ 900MHz (OC)
> 【GPU1】Gigabyte GV-R7970C-3GD Radeon HD 7970 @ 1120MHz (OC)
> 【GPU2】DIAMOND 6990PE54G Radeon HD 6990 4GB @ 900MHz (OC)
> 【CPU】AMD Phenom II X6 1100T (定格)
> 【OS】 Microsoft Windows 7 64bit SP1
> 【バージョン】MERIKEN's Tripcode Finder 0.07 Beta 1
> 【トリップの種類】12桁
> 【1SMあたりのブロックの数(CUDA)】N/A
> 【1CUあたりのワークアイテムの数(OpenCL)】自動
> 【1WGあたりのワークアイテムの数(OpenCL)】自動
> 【1GPUあたりの検索プロセスの数(OpenCL)】1
> 【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
> 【その他のオプション】-g
> 【Display Driver】Catalyst 12.11 Beta8
> 【10分間の平均速度】7428.97 tripcodes/s
> 【GPUの平均速度】7428.97 tripcodes/s
> 【CPUの平均速度】N/A
> 【GPUの使用率】97~99%
> 【GPUの温度】83~93℃
> 【その他】GPUのみ。
スレリンク(software板:810番)n

5: ◆MERIKEN4.k
13/01/20 09:15:10.50 VNsWebzC0
テンプレは以上です。またよろしくお願いします。

6:名無しさん@お腹いっぱい。
13/01/20 10:53:43.96 6cCMlcR80
【GPU】GeForce 610M
【CPU】Intel Core i5-3210M @ 2.5GHz
【OS】Windows 7 Ultimate SP1 64bit
【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2
【トリップの種類】12桁
【1SMあたりのブロックの数(CUDA)】256
【その他のオプション】なし
【10分間の平均速度】 79.20Mtripcodes/s
【GPUの平均速度】 48.81Mtripcodes/s
【CPUの平均速度】 30.40Mtripcodes/s
【その他】5完1タゲ

>>928に比べて4%ほどの速度上昇(CPUは8%)、か

7: ◆MERIKEN4.k
13/01/20 11:16:14.20 VNsWebzC0
Core 2 DuoでもAlpha 2の速度を測定してみました。
同じ条件でSHArp Tripper 1.1は13.57M TPSだったので、
まあ32bit OSでもAlpha 2の高速化の分だけMTFのほうが速くなったと
差し支えないと思います。

【CPU】Intel Core 2 Duo T9550 @ 2.66GHz (定格)
【OS】 Microsoft Windows 7 XP 32bit SP3
【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2
【トリップの種類】12桁
【CPU検索スレッドの数】自動(2)
【その他のオプション】なし
【10分間の平均速度】16.19M tripcodes/s
【GPUの平均速度】N/A
【CPUの平均速度】16.19M tripcodes/s
【その他】CPUのみ。5完1タゲ。

8: ◆MERIKEN4.k
13/01/20 11:18:50.90 VNsWebzC0
>>6
まあ落ち着いてw しかし今回のバージョンアップの効果はCPUによって
まちまちみたいですねえ。流石にIntelの石ではPhenom II X6みたいに
遅くなったりはしないでしょうけど…

9: ◆YSRKENkO6Y
13/01/20 11:26:27.45 6cCMlcR80
>>8
ところがぎっちょん、AMDでも速くなった事例が発生しました……(但し結構古いCPU)

【CPU】Athlon X2 QL-64 @ 2.1GHz
【OS】Windows 7 Ultimate SP1 32bit
【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 1→2
【トリップの種類】12桁
【10分間の平均速度】 3.40→4.65Mtripcodes/s
【その他】5完1タゲ

10:名無しさん@お腹いっぱい。
13/01/20 11:53:50.21 pbfqvEMqP
新スレで初めてツール知って落としてみたけど、何となく扱いやすそう。
情報集めてるなら、alpha1と2で、10分ずつ稼働させて比較してみればいいのかしらん。グラボ載ってないからCPU稼働だけど…

11: ◆JouJaku.HzIz
13/01/20 12:29:38.58 tVRIm6510
【CPU】Intel Core Duo T2500 @ 2.0GHz
【OS】WinXP Pro SP3 32bit
【バージョン】0.08 Alpha 2 CUI
【トリップの種類】12桁
【10分間の平均速度】7.86 Mtripcodes/s
【その他】5完1タゲ

なんと2割以上の速度上昇 ヽ(´Д`)ノ

12:名無しさん@お腹いっぱい。
13/01/20 12:54:37.30 pbfqvEMqP
【CPU】AMD Athlon 64 X2 5050e(定格稼働)
【OS】Windows XP Professional 32-bit SP3
【バージョン】MERIKEN's Tripcode Finder GUI 0.08 Alpha 1→2
【トリップの種類】12桁
【10分間の平均速度】 6.41→7.77Mtripcodes/s

2割ほど強化されたらしい。…これで良いのかしら

13:速度変化の歩み ◆YSRKENkO6Y
13/01/20 14:27:36.50 6cCMlcR80
なんとなく作ってみた。
Ver速度
0.0147.21M
0.0246.84M //正規表現に対応
0.03b156.53M //ここからCPUも利用するように
0.0458.74M //CMDオプションの説明でReadmeが長くなる
0.0558.80M
0.06a159.53M //64bit版が登場
0.06b159.58M
0.0659.58M
0.07a158.21M //OpenCLへの暫定的対応
0.07a258.04M(G48.69M/C 9.34M) //GPU・CPU毎の平均も表示
0.07a358.13M(G48.80M/C 9.33M)
0.07a462.94M(G53.64M/C 9.30M) //Intel HD Graphicsに対応
0.07a562.68M(G53.43M/C 9.25M)
0.07a662.68M(G53.42M/C 9.25M)
0.07a759.62M(G48.87M/C10.75M) //CPU高速化、IntelHDGを排除
0.07b159.64M(G48.81M/C10.83M)
0.0759.71M(G48.88M/C10.83M)
0.08a173.35M(G48.79M/C24.56M) //CPUの大幅な高速化
0.08a278.95M(G48.79M/C30.16M) //CPUの高速化

・全て12桁検索、平均値
・実行時間はいずれも5分程度(0.084 hour)
・「すっきり!!デフラグ」というソフトですっきり実行している
(つまり常駐ソフトは排除済み)
・CMDオプションは「-g -x 256 -c」で固定

14:名無しさん@お腹いっぱい。
13/01/20 15:32:20.29 gnybx2bF0
物理32coreは無理ですけど、手持ち環境でそれぞれのバージョンを比較してみました

【CPU】AMD FX-8350 @4.95GHz
【OS】 Microsoft Windows 7 64bit
【トリップの種類】12桁
【CPU検索スレッドの数】自動(8になるのかな?)
【その他のオプション】なし
【その他】CPUのみ。5完1タゲ。

0.07
【CPUの平均速度】53.72M tripcodes/s
0.08 Alpha 1
【CPUの平均速度】114.78M tripcodes/s
0.08 Alpha 2
【CPUの平均速度】106.65M tripcodes/s

こちらの環境では、Alpha1、Alpha2で逆転現象は見られますが、00.7からはおおよそ50%の高速化は成されています
OpenCLの最適化、楽しみにしております

15:名無しさん@お腹いっぱい。
13/01/20 16:15:36.31 gnybx2bF0
んにゃ
2倍の数値になってるから100%か

16: ◆MERIKEN4.k
13/01/20 17:48:55.79 VNsWebzC0
>>11
Intelの石だとちゃんと最適化の成果が出ているようですねえ。

>>10
>>12
それで問題ないです。情報提供、ありがとうございます。

>>13
GPU検索はもうちょっと速くなる予定です。期待してて下さい。

>>9
>>14
Alpha 2で遅くなるのはどうやらPhenom以降らしいですね。
CPUIDの仕様をみてゲンナリしたので、実行時に速度を計測してAlpha 2の最適化を
適用するかどうかを判断させることにします。しかしBulldozerはさすがに
速いですねえ。整数演算だけだったらCore i7-3770Kといい勝負ができてますね。

17: ◆YSRKENkO6Y
13/01/20 18:25:03.16 6cCMlcR80
>>16
>実行時に速度を計測
CPUIDで決めつけるよりは安全だと思いますよ
ただ、場当たり的な対策な気もしますが

GPUがこれ以上速くなったら俺でも100M/s超えるかもワーイ

18: ◆MERIKEN4.k
13/01/20 18:29:42.27 VNsWebzC0
>>17
将来どんなアーキテクチャが出てくるかわからないのでこれでいいんですよ。
手元にないハードウェアのために性能の良いソフトウェアを書くのは難しいのです。

19: ◆MERIKEN4.k
13/01/20 18:45:41.37 VNsWebzC0
とりあえずAlpha 2の最適化を使用するかどうかを実行時に決定できるように
なりました。あとはCUDAのときと同じ要領で実行時に速度を測定して
最適なアルゴリズムを選択できるようにしてやるだけです。

20: ◆MERIKEN4.k
13/01/20 20:31:24.15 VNsWebzC0
う~ん、なかなかうまくいかないなあ…
動的な最適化のためにループをもう一段回深くしたら速度が落ちてしまいました。
多分コンパイラの最適化を邪魔してしまってるんだろうけど、これは困った。

元はといえばGetTickCount()の精度が悪すぎるのが原因といえば原因なんだけど、
これってなんとかならないのかしらん。

21:ののたん ◆KiwamonoL.
13/01/20 20:46:30.35 MWphMQ8K0 BE:1106146087-DIA(289888)
>>20
つ「timeGetTime」

22: ◆MERIKEN4.k
13/01/20 20:55:46.61 VNsWebzC0
>>21
あ、その節は貴重な資料を本当にありがとうございました。
経過時間の測定は次の方法で何とかなりました。
URLリンク(stackoverflow.com)
一応最適化のルーチンは動いているようなので、あとは微調整をしてやるだけです。

23: ◆YSRKENkO6Y
13/01/20 21:38:13.30 6cCMlcR80
>>20-22
まさか時間測定をGetTickCount()でやっていただなんて……
ところで、QueryPerformance系命令ははCPUクロックが動的に変化する場合、
「OSによっては値が信用できなくなる」なんてこともありえますゆえご注意を……
参考:
URLリンク(d.hatena.ne.jp)
URLリンク(d.hatena.ne.jp)
URLリンク(d.hatena.ne.jp)

24:名無しさん@お腹いっぱい。
13/01/20 21:49:35.86 ourgxKXJ0
3,300円につられてWin8にするんじゃなかった・・・HD4000系つかえないのね。
なのでQuadro FX4800 (GTX265級)CUDAでWin8をやってみました。

【GPU】Nvidia Quadro FX4800 x2
【CPU】Xeon E5540 x1
【OS】Windows 8pro
【バージョン】MERIKEN's Tripcode Finder 0.08alpha2
【トリップの種類】12桁
【1SMあたりのブロックの数(CUDA)】auto (16)
【1CUあたりのワークアイテムの数(OpenCL)】
【Display Driver】310.90
【GPUの平均速度】330 tripcodes/s
【CPUの平均速度】50 tripcodes/s

抜ける時に固まってしまうので、GPUのみにした方がいいか・・・。

25: ◆MERIKEN4.k
13/01/20 22:00:31.90 VNsWebzC0
>>23
なるほど、こんなこともあるんですね。いやあ、助かりますw
そのせいかどうかわからないんですけど、動的な最適化は
完全には安定していないようです。やっぱりtimeGetTimeを使ったほうが
いいのかしらん。

26: ◆MERIKEN4.k
13/01/20 22:03:23.56 VNsWebzC0
あと色々コードをいじって気づいたんですが、Phenom IIで遅くなる原因は
どうやら命令のオーダーにあるようです。うまく命令のオーダーを
調節してやれば実行時の最適化は必要なくなるかもしれません。
ちょっとこれから用事があるので、また後で試してみます。

27: ◆YSRKENkO6Y
13/01/20 22:08:28.62 6cCMlcR80
>>24
いや・・・Ver.0.07 alpha 7以降HD4000使えなくなったというのが俺の認識
(過去ログ見れば分かるが対応が難しいからだそう)

その分Ver.0.08 alpha 1以降CPU検索がグッと速くなってるからそっちで補えるけど

28:名無しさん@お腹いっぱい。
13/01/20 22:28:54.48 ourgxKXJ0
>>27
あらら。二重の意味でNGなんですね。AMDもHD2K3K4Kは去年の8月から
切っちゃってて、Win7までしかドライバ出てなかったんです。

Nvidiaがあるからいいや、みたいなのりでWin8にしてしまいましたが
HD4000も過去帳入りですね・・・。

29:名無しさん@お腹いっぱい。
13/01/20 22:34:56.35 /IyUB2p70
【CPU】i7-3970x(OC 5.04GHz)
【OS】 Microsoft Windows 7 64bit
【トリップの種類】12桁
【その他のオプション】全てDL時のまま
【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2
【CPUの平均速度】186.21M tripcodes/s


さっきよりもうちょっと速くなったww
早すぎワロチwww

30: ◆YSRKENkO6Y
13/01/20 23:57:59.33 6cCMlcR80
>>28
>AMDもHD2K3K4K
え、AMDにもIntel HD Graphics 4000みたいなのあるの……?
ひょっとしてRadeonの方言ってる??
>>6でも書いてるけど、自分はCorei5+GeForce環境だから、
CPU検索が遅い際にはMERIKENでゲフォ+HDG4000を使い、
SHArp TripperでCPUを使っていたんだ
でもVer.0.08以降CPU検索が速くなったからSHArp要らない→両方MERIKENでおkになった
決して「MERIKENシリーズではRadeon HD 4000シリーズは使えない」って意味じゃないからね!

31: ◆MERIKEN4.k
13/01/21 01:19:54.68 HDFcfntu0
>>29
これも滅茶苦茶速いですねえ。たしかこれ、Sandy Bridgeですよね。
OCでここまで回せるとは…

32: ◆MERIKEN4.k
13/01/21 01:24:18.89 HDFcfntu0
実行時の最適化はなかなか安定してくれません。
まあ各検索スレッドがてんでバラバラに速度を測定してるので
仕方がないといえばそうなのですが…
とりあえずtimeGetTimeを試してみて、これが駄目だったら
また別の方法を考えて見ることにします。

33:名無しさん@お腹いっぱい。
13/01/21 01:54:18.92 70EXSbRt0
計測用に別の実行ファイルを用意してそちらでテスト
 ->設定書出
 ->本体で設定ファイル読み込んで以下略

な感じで回避できないの? >>20

34:名無しさん@お腹いっぱい。
13/01/21 02:12:49.20 iy3ZJANG0
>>31
さすがにXeon2個には勝てないけどなww


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch