【トリップ検索】MERIKEN's Tripcode Finderat SOFTWARE
【トリップ検索】MERIKEN's Tripcode Finder - 暇つぶし2ch290:名無しさん@お腹いっぱい。
12/10/29 14:04:33.31 yyXkW2IU0
つまりオンボだけどCore iしりーずな人でもGPUパワーが使えるのか……胸熱

291:名無しさん@お腹いっぱい。
12/10/29 14:36:56.78 5Sl8Z/AoP
自分はOpenCLでSHA256ハッシュを探索して
ハッシュの先頭に0のビットが多く並ぶキーを探すプログラムを書いているんですが
Windows7で265MHash/s出ていたのが80MHash/sしか出なくなって
原因調査中です

292:名無しさん@お腹いっぱい。
12/10/29 19:19:37.57 mTINnVu80
>>290
前に別のところで聞いた話だとすずめの涙みたいな計算速度だった覚えが

293:名無しさん@お腹いっぱい。
12/10/29 21:24:08.35 myu28mTs0
8800GT メモリ2GBのPCですが、検索停止ボタンを押すと完全に固まります
フリーズ中はGPUのファンは静かになっていて、HDDが規則的なリズムでガリガリと鳴りつづけていました

さきほど1分ほど動かして検索停止ボタンを押した時は15分経っても復帰しませんでした。多分、そのまま動かし続けてもフリーズするのは時間の問題だと感じました
再起動した後、とりあえず10秒(検索速度などの表示が出るまで)で止めてみたのですが、停止ボタンを押した後に一瞬画面が真っ黒になって「ディスプレイドライバの応答停止と回復」のポップアップが表示されました
この調子ですぐ止めればセーフか?と思い、続いてブロック数を自動から1に変更して開始したところ、同じように10秒で止めても完全にフリーズしてしまいました
メモリの容量か何かが関係しているのかとも思いましたが、それにしては検索中もメモリの利用率は別に増えてなかったのが不思議です。

使っていて変な汗が出たソフトナンバーワンなのは間違いないです

294: ◆MERIKEN4.k
12/10/29 21:30:51.78 nQV6S3Gh0
>>293
多分問題は電源かGPUの温度でしょう。メモリは殆ど使わない作りになっているので
まず関係ないです。SpeedFanとかAfterburnerで温度をチェックすると
いいかもしれません。

295: ◆MERIKEN4.k
12/10/29 21:32:28.03 nQV6S3Gh0
>>290
>>292
実際に検索させてみないことにはわからないですけど、
性能はあんまり期待できないでしょうね~ まあおまけみたいなもんです。

296: ◆MERIKEN4.k
12/10/29 21:34:25.08 nQV6S3Gh0
>>291
なかなか不思議なプログラムですねえ。手直しすると突然速度が落ちるという
ことはよくあります。バージョン管理は必須ですね。

297:名無しさん@お腹いっぱい。
12/10/29 21:44:29.50 myu28mTs0
>>294
電源ですか!なるほどなるほど・・・なんだか靄が晴れた気分です

298:名無しさん@お腹いっぱい。
12/10/29 23:27:29.31 5Sl8Z/AoP
>>296
すいません291はWindows8にしたらって書くのを忘れてました

299:名無しさん@お腹いっぱい。
12/10/30 00:35:03.80 DNUGLhjc0
>>295
AMD APUの場合は
URLリンク(www.amd.com)
A10-5800Kで理論値はCPU部分が約120GFLOPS、GPU部分が約600GFLOPSと5倍程度差があるらしいので
うまく利用できるとそこそこ期待できそうですが、問題はVLIWへの最適化でしょうかね?


300: ◆MERIKEN4.k
12/10/30 03:13:30.53 6+f0bjdv0
いい機会なのでコードの整理をして、パターン処理の関数を1つのファイルに
まとめました。正規表現のパーサが含まれているので結構な大きさです。
これでコードもすっきりしたのでOpenCLデバイスの処理を追加しやすくなりました。
コード全体を眺めるのは久しぶりなんですけど、継ぎ足しに継ぎ足して
随分たくさん書いたもんです。

301: ◆MERIKEN4.k
12/10/30 03:17:19.66 6+f0bjdv0
>>299
トリップ検索では浮動小数点演算は使わないのでFLOPSはあんまりあてにならない
んですけど、AMDのAPUならそこそこ性能は出るでしょう。最適化については
今のところ全く分かりませんw とりあえず動くOpenCLのコードができてから
考えることにします。

302: ◆MERIKEN4.k
12/10/30 08:03:47.74 6+f0bjdv0
OpenCLデバイスの初期化の処理も実装し終わりました。
あとはスレッド周りを修正すれば、実際の検索ルーチンに取り掛かれます。

----

Using GPU(s) as a search device.

OPENCL DEVICE
=============
OpenCL Device Count: 2

Vendor: Advanced Micro Devices, Inc.
Name: Juniper
Clock Frequency: 850MHz
Global Memory Size: 1024M bytes
Version: OpenCL 1.2 AMD-APP (1016.4)
Driver Version: 1016.4 (VM)

Vendor: Intel(R) Corporation
Name: Intel(R) HD Graphics 4000
Clock Frequency: 350MHz
Global Memory Size: 1624M bytes
Version: OpenCL 1.1
Driver Version: 8.15.10.2761

303: ◆GTX680Mcys3u
12/10/31 02:24:34.52 h5Ao5/fb0
お久しぶりです。
ノート用でGTX680M発売決定らしいです。
URLリンク(www.geforce.com)

GK104コアでCUDAコア数はGTX680同等、クロックはGTX680Mと同等
メモリクロックはGTX680M比で40%増し。
ノートも段々デスクトップと変わらなくなってきましたね。

性能次第じゃGTX680Mの時と同じでeBayからMXMカード取り寄せるかも…。

304: ◆GTX680Mcys3u
12/10/31 20:45:23.81 h5Ao5/fb0
>>303まちがい
新しいGTX680相当のSMX数で出るのは680MXです

305: ◆MERIKEN4.k
12/11/01 08:07:20.98 pqoHlXrk0 BE:1197018836-2BP(12)
>>303-304
なるほど、こういうのでアップグレードするんですね。
URLリンク(www.ebay.com)
ちょっと割高な気もするけど、これだけコンパクトにまとまっているのは凄いですねえ。

306: ◆MERIKEN4.k
12/11/01 08:11:48.87 pqoHlXrk0
OpenCL検索のスレッド周りの処理も一応仕上がりました。
これでいよいよ検索ルーチンの実装を始められます。

307: ◆MERIKEN4.k
12/11/01 18:28:16.36 pqoHlXrk0
検索ルーチンを作り始めたんですけど、Intelの実装とAMDのとで微妙に挙動が違って
きますね、これ。AMDのではエラーがでなくてもIntelのでエラーが出たりしてます。
思ったよりデバッグに時間がかかるかもしれません。
とりあえず両方のプラットフォームでトリップの変換ができていることは確認できました。
やっぱりIntelのほうが大分遅いですねえ。

308: ◆MERIKEN4.k
12/11/01 19:11:17.86 pqoHlXrk0
そうそう、検索君1号(仮)ですが、一番下のPCI-EスロットにGTX 590を移したら
温度の問題は全て解決しましたw いい具合に2番目と3番めのカードのあいだに
1スロット分の隙間が出来ました。590とマザボのピンが干渉するので
ケースの電源ボタン等は使えなくなったけど、別のがマザボについているので今のところ
困っていません。普段使っている検索パターンで安定して2.7G TPSでています。
1年前に800M TPS出して大喜びしていたのが遠い昔のようですw

もうさすがに買わないですけど、電源の容量から計算すると590 3枚でも
十分動作しそうです。3072コアで同時にトリップ検索なんて考えただけで
胸が熱くなりますw

309: ◆GTX680Mcys3u
12/11/01 20:24:07.51 d/NjzRgi0
>>305
それです。
その一番大きなMXM3.0bという規格でもデスクトップ用の半分以下のサイズだと思いますよ。

ちょっと安いところのが撤退してますねぇ。
今出てる一番安いのはAlienware用のVRAM2GB版だけど
自分が買った時はVRAM4GB版でも799ドルだったのに。
さすがに999ドルなら自分も買ってなかったでしょうけども。

日本ってこういうパーツ全く出回らないんですよね。ニッチだけど需要はありそうなのに。

310: ◆MERIKEN4.k
12/11/02 02:08:46.32 pOqRQijG0
>>309
部品が手に入りづらいとストレス溜まりますよね。
アメリカの人達はわりと大型のノートPCを好むというのもあるかもしれません。

311: ◆MERIKEN4.k
12/11/02 02:21:27.01 pOqRQijG0
OpenCL検索のGPU側のコードを書き終えました。
とは言っても次の資料を見てCUDAのコードを書き換えただけですが…

Porting CUDA Applications to OpenCL
URLリンク(developer.amd.com)

あとはCPU側のコードを用意してやればOpenCL検索ができるようになるはずです。
OpenCLのコードは問題なくビルドできているので、あと残っているので
めんどくさそうなのはメモリ周りの処理ぐらいです。まあなんとかなるでしょう。

312: ◆MERIKEN4.k
12/11/02 05:21:44.88 pOqRQijG0
CPU側のコードを用意ができたのでOpenCL検索を試してみたのですが、
Radeonだとwork-groupの数が不正だと怒られて動かせませんでした。
で、Intelのほうを試してみたら、奇跡的にトリップは生成されました。
が、めちゃくちゃ遅い! 遅すぎる! 仕方がないのでとりあえず
Radeonで動くようにしてからコードの見直しをすることにします。

313: ◆MERIKEN4.k
12/11/02 05:34:17.58 pOqRQijG0
ちょっと手直ししたら今度はclEnqueueNDRangeKernelで
CL_OUT_OF_RESOURCESが出てしまいました。
仕様書を見たらレジスタやカーネルへの引数の数が多すぎるとこのエラーが出るらしいです。
いろいろ面倒くさいなあ…

314: ◆MERIKEN4.k
12/11/02 05:39:42.98 pOqRQijG0
どうやらwork-groupのサイズはclGetKernelWorkGroupInfoで取り出さないと
いけない模様。これでうまくいくといいけど…

315: ◆MERIKEN4.k
12/11/02 07:27:52.40 pOqRQijG0
あの後色々調べてみたけど原因はわかりませんでした。
う~ん、CUDAの検索ルーチンをそのまま移植するんじゃなくて、
少しづつ動くのを確認しながら作り込んでいったほうがよかったのかなあ。
完全に煮詰まってしまったので食事をしてきます。

316: ◆MERIKEN4.k
12/11/02 10:39:28.35 pOqRQijG0
AMDのOpenCLの実装で動かなかった理由がようやくわかりました。
16M bytesあるキービットマップの配列へのポインタをカーネルの引数で渡していたのが
原因でした。CUDAで実装したときも我ながら無茶な実装だと思ったものですが、
今の今まですっかり忘れていましたw 取りあえずなくても動くので
OpenCLではキービットマップを使わないことにしておきます。
多ターゲットの検索だとキービットマップがかなり有効なのはわかっているので、
あとで小さめのも作ることにします。

317: ◆MERIKEN4.k
12/11/02 12:03:11.26 pOqRQijG0
というわけでOpenCLの12桁検索の試験実装がめでたくRadeon HD 5770で
動くようになりました。GPU使用率65%で190M TPS出ているので、CUDAの実装の
ベタ移植にしては上出来でしょう。ヒット率も綺麗に予想値に収束しています。
いや~これでようやく安心できました。

あ、あとIntel HD 4000では同じコードで3M TPSしかでていませんw
こりゃほんとにおまけですねえ。

318: ◆MERIKEN4.k
12/11/02 12:29:52.07 pOqRQijG0
GPU使用率を上げようといろいろ頑張ってみたのですが、
ちっとも上がってくれません。global_work_sizeとlocal_work_sizeを
いじっても駄目でした。mtyのときも似たようなことがあったし、
ドライバの仕様なのかなあ。

319: ◆MERIKEN4.k
12/11/02 13:03:48.65 pOqRQijG0
ちっともGPU使用率が上がらないので、思いつきで1つの5770に対して
2つの検索スレッドを走らせたら、見事にGPU使用率が96%まで上がって
301M TPS出るようになりましたw 冗談みたいな話ですが
ヒット率は予測通りなのでちゃんとうごいているようです。
なんか釈然としないけど、きちんと動作しているのでこのままにしておきます。

320: ◆MERIKEN4.k
12/11/02 13:23:20.71 pOqRQijG0
しかしRadeonは思った以上に性能が出ますねえ。
5770でこれなら7970だったら1枚で1G TPSを超えるかもしれません。
10進検索のほうも楽しみです。OpenCL検索の実装が順調に進んで、
GTX 780が噂通り680の改良版なら、次に買うのは8970になるかもしれません。

321:ののたん ◆KiwamonoL.
12/11/02 13:54:01.66 ayT59sJq0
>>318
それを知ってるのに秘孔は知らないのか?
URLリンク(sourceforge.jp)

効果があるかどうかはしらん。w

322: ◆MERIKEN4.k
12/11/02 14:53:44.04 pOqRQijG0
>>321
その処理をTripcode Finderに組み込もうとしたらAPIが古過ぎてコンパイル
できませんでした(´・ω・`)

323:ののたん ◆KiwamonoL.
12/11/02 17:13:31.39 ayT59sJq0
>>322
効果があるか試すだけなら、バイナリもあるぜ。
URLリンク(trip2ch.net)

やってることは単純だから、今のAPIで同じことをやればいいんだろうけど。

324:名無しさん@お腹いっぱい。
12/11/02 19:08:34.63 druh0GIy0
URLリンク(yy43.60.kg)


325:名無しさん@お腹いっぱい。
12/11/02 20:45:07.84 RumtBqwhP
目指せ純12連発見

326:前スレ927
12/11/03 01:40:23.60 nhwVplaB0
HTがトラウマになったので、影響を調べてみました。

CPU: Xeon X5680@3.33GHz x 2
GPU: Quadro FX 3800
Prg: 0.06a1
Len: 12
Targ: "TEST/"
Opt: -c -g -x 16
Drv: 306.79

この条件でOSとHTを買えて計測しました。


327:前スレ927
12/11/03 01:45:43.54 nhwVplaB0
先ずはXPから。
Case 1-1
CPU: HT off (12 thread)
OS: WinXP SP2 64bit
1hrAv: 240.76M TPS
Others:
243.23M TPS (curr)
171.13M TPS (GPU)
72.11M TPS (CPU)

Case 1-2
CPU: HT on (24 thread)
OS: WinXP SP2 64bit
30minAv: 247.84M TPS
Others:
247.50M TPS (curr)
171.13M TPS (GPU)
76.72M TPS (CPU)


328:名無しさん@お腹いっぱい。
12/11/03 01:50:13.99 nhwVplaB0
次は7です。
Case 2-1
CPU: HT off (12 thread)
OS: Win7 SP1 64bit
30minAv: 241.77M TPS
Others:
241.44M TPS (curr)
169.01M TPS (GPU)
72.43M TPS (CPU)

Case 2-2
CPU: HT on (24 thread)
OS: Win7 SP1 64bit
30minAv: 246.28M TPS
Others:
246.97M TPS (curr)
170.87M TPS (GPU)
76.10M TPS (CPU)

329:前スレ927
12/11/03 02:01:41.49 nhwVplaB0
連投済みません。
XPから7にしても性能変わらんねぇ。(´・ω・`)
HT on/offでも大して変わらんねぇ。(´・ω・`)

GTX590を追加しようとしたのですが、電源容量が足りないことが判明。
GPU用に8ピンx2を用意する上手い方法は無いでしょうか?
ATX電源だと確かスイッチ入れないと出力されなかったような気が・・・

330:ののたん ◆KiwamonoL.
12/11/03 02:51:49.87 ZeqW5mDD0
>>329
つ「URLリンク(www.freedom-pc.com)
一台目の電源ユニットに連動するやつも見たことあるけど。

だがしかし、おすすめはしない。いろんな意味で【危険】だから。
素直に電源ユニットをいいやつに交換したほうが。

331: ◆MERIKEN4.k
12/11/03 02:53:51.82 0Ur2Ic2+0
>>329
HTを有効にしても速度が上がらないのはかなり意外ですねえ。
Core i7-3770KではHTはかなり有効だったので…
電源は入れ替えたほうが早いような気もしますけど、
一応別に用意することもできます。
URLリンク(www.google.com)

332: ◆MERIKEN4.k
12/11/03 03:10:23.14 0Ur2Ic2+0
>>323
hikou.exeは多少効果がありましたけど、それでもGPU使用率は70%ほどでした。
GPU検索スレッドを増やす方向で行きたいと思います。

333:名無しさん@お腹いっぱい。
12/11/03 03:50:36.64 BiGdIpnm0
一瞬、複数の電源系統を使って、1台での最速を目指すのかと思ってしまいましたw

>>311
こういった情報はありがたいですね。


334:名無しさん@お腹いっぱい。
12/11/03 03:55:42.16 BiGdIpnm0
>>317 >>319
Intelの方はグラフィック特化で、とりあえずOpenCLに対応はさせたということなのでしょうかね。
AMD APUの方は上位だと3桁行きそうな感じですね。

335:名無しさん@お腹いっぱい。
12/11/03 07:52:02.05 CKknzRPb0
>>329
今から追加するならラデのほうが速くて良くね?
openCL版もそろそろ公開されそうだし
今更性能の悪いCUDAカード追加するのはクレバーとは言えないよ
暖房に使うならありかもしれないけどねwww

336: ◆MERIKEN4.k
12/11/03 09:17:27.77 0Ur2Ic2+0
>>335
ん? OpenCL版は公開するなって? そうかそうかw

…という冗談は置いといて、正直GCNアーキテクチャのRadeonで
どれぐらいの性能が出るかは全くの未知数です。あとTripcode Finderの
Radeon対応版の公開はもうちょっと先になるでしょう。10桁検索の
実装はこれからだし、この先実生活のほうでかなり忙しくなるので
ひょっとしたら1月中旬までずれ込むかもしれません。まあ気長に
待ってて下さい。

337: ◆MERIKEN4.k
12/11/03 09:19:54.73 0Ur2Ic2+0
>>334
IntelのはなぜハイエンドのCPUに統合したのか理解に苦しむレベルです。
AMDのAPUだったら3桁は余裕でしょう。

338: ◆MERIKEN4.k
12/11/03 09:26:59.16 0Ur2Ic2+0
>>333
この資料のお陰で他の資料を読まずに済みましたw
あとで一応AMDの最適化のマニュアルには目を通しておきますけど…

339:名無しさん@お腹いっぱい。
12/11/03 16:58:25.33 JFLtV7Ft0
コマンドライン上から1枚目のカードを検索の動作から外すのはどう指定すればいいのでしょうか。

340: ◆MERIKEN4.k
12/11/03 17:08:51.68 0Ur2Ic2+0
>>339
今のところカードは1枚指定するか全部指定するかどちらかしか出来ないので、
CUI版を複数同時に起動する必要があります。
任意の複数のGPUを指定する機能は今後の課題として検討させて頂きます。

341: ◆MERIKEN4.k
12/11/03 21:47:33.80 0Ur2Ic2+0
あれからOpenCL検索の最適化をすすめて、HD 5770で390M TPS出るようになりました。
とはいってもglobal_item_sizeとlocal_item_sizeの値をいろいろと
変えてみただけですが… これらの値の自動設定は無理そうなので、
GPUの種類を判別してあらかじめ決められた値を使うようにしておきました。
あとIntelのもちょこっと上がって3.7M TPSになりましたw

342:名無しさん@お腹いっぱい。
12/11/03 21:54:41.47 nALhqe3q0
ゲフォを捨てる日も近いな

343:名無しさん@お腹いっぱい。
12/11/04 00:42:16.84 UfxuJC360
Amazon Cluster GPU Instances($2.6/h)でやってみた
URLリンク(img11.imageshack.us)

344:名無しさん@お腹いっぱい。
12/11/04 00:49:29.80 kuWvI2yC0
>>341
>GPUの種類を判別してあらかじめ決められた値を
性能別にざっくり分ける感じですか?

345: ◆MERIKEN4.k
12/11/04 01:17:42.41 00/F8mIE0
>>343
FermiベースのTesla C2075が2枚刺さってますね。
Amazon Web ServicesでCUDAが使えるとは知りませんでした。
2週間回し続けたらGTX 590が買えるお値段になっちゃうけど、
なかなか面白いですねえ。ネットワーク分散処理に対応したら
これで記録を立ててみようかなw

346: ◆MERIKEN4.k
12/11/04 01:29:24.24 00/F8mIE0
>>344
global_item_sizeとlocal_item_sizeはオプションで指定できるように
するつもりです。最初はGPUのアーキテクチャ毎にデフォルトの値を
設定しておいて、データが集まったらカード毎に値を変えるようにする予定です。

347:名無しさん@お腹いっぱい。
12/11/04 01:57:32.32 kuWvI2yC0
>>346
なるほど……

348: ◆MERIKEN4.k
12/11/04 03:30:45.58 00/F8mIE0
AMDのOpenCLのマニュアルをちょこっと読んだんですけど、
ベクターレジスタがこれでもかというぐらいあって思わず笑ってしまいましたw

AMD Accelerated Parallel Processing OpenCL Programming Guide
URLリンク(developer.amd.com)

これによると5970は5770の3.41倍の速度が出るそうで、単純計算だと
391M TPS * 3.41 = 1333M TPS出ることになりますけど、本当なんでしょうか…

349: ◆MERIKEN4.k
12/11/04 03:53:31.57 00/F8mIE0
あ、5970はdual-GPUなんですね。あ~びっくりしたw
しかしお値段を考えるとかなりお得で夢が広がります。
年末に日本に帰省してるあいだは開発はできなくなるので、
なんとかそれまでにRadeon対応版を仕上げたいです。

350:前スレ927
12/11/04 08:23:26.67 wspvDmvD0
いろいろ情報ありがとうございます。
訳有って電源を変えることもCUDAを捨てることもできないのです。
電源を変えたいのは山々なんですが。

>>330 >>331
複数電源やってる人多いんですね。確かにいろいろな意味で危険だ。
でもこれしか今のところ手が無いので、この方法で行ってみます。

NehalemからSandy BridgeになったところでCPUコアに大幅に手が入っているから、HTの効果がより大きくなったのではないでしょうか? 詳しいことは全然知りませんが。

余った電源を探しに押入れを漁ったのですが見つからず。代わりに大昔のGTX480が出てきました。
見なかったことにするか・・・。

351: ◆MERIKEN4.k
12/11/04 09:47:14.72 00/F8mIE0
>>350
> 代わりに大昔のGTX480が出てきました。

いらないのでしたらテスト用に欲しいのでぜひ譲って下さいw

352: ◆MERIKEN4.k
12/11/04 09:56:21.45 00/F8mIE0
>>313>>316のエラーですが、結局巨大なキービットマップが__constantの
メモリ空間に収まらなかったということみたいです。まあ当然ですよねw
で、代わりにかなり小さめのキービットマップを用意してやったら、
なんと407M TPSまで速度が上がりましたw これ、CUDAのでも使えるんじゃない
かしらん。

353:名無しさん@お腹いっぱい。
12/11/04 10:00:03.60 3mBasjXYP
SHA256ハッシュだとこんな感じの速度になるらしい

URLリンク(en.bitcoin.it)

354: ◆MERIKEN4.k
12/11/04 10:28:15.44 00/F8mIE0
やっぱりSHA-1よりは大分数字が落ちますねえ。
ここらへんの数字はなかなか面白いです。

> 5970 $421 Limited 704
> 6990 $622.99 Limited 772
> 7970 $420 Easy 685

トリップ検索が目的なら安い5970を中古で買ったほうが
いいのかもしれません。

355: ◆MERIKEN4.k
12/11/04 10:49:10.65 00/F8mIE0
小さめのキービットマップを追加するついでにコードを大分整理しました。
もう十分速度は出ているので、最適化は適当に切り上げて
OpenCLの12桁検索だけ先に仕上げてしまうことにします。

356: ◆MERIKEN4.k
12/11/05 06:52:49.50 fpizldxB0
前方一致以外の正規表現の検索への対応も終わって、
CUI版のOpenCLでの12桁検索対応の作業はほぼ終了しました。
あとはglobal_work_sizeとlocal_work_sizeをオプションで
出来るようにして、GUI版を修正するだけです。
本当は10桁検索にも対応させてから公開する予定だったけど、
こっちは難物で最適化に時間がかかりそうなので後回しにします。

あ、あとIntelのコンパイラは新しいOpenCLのカーネルをコンパイル
できませんでしたw clGetProgramBuildInfoであっち側に行ったきり
帰って来ません。まあカーネルがマクロ使いまくりでちょっと
複雑なのは事実なんですが、どうせIntelのドライバのバグだろうし
HD 4000ちゃんは全く性能の出ないアホの子だということが
わかってしまったので、このままにしておきます。

357:名無しさん@お腹いっぱい。
12/11/05 07:03:38.38 U1XO/30v0
>>356
峠は越えましたね乙です
公開を楽しみにしております

358: ◆MERIKEN4.k
12/11/05 12:19:08.63 fpizldxB0
>>357
どもども。あとちょっとなので頑張ります。CUI版の作業は一応全部終わりました。
あとはGUI版だけです。

359: ◆MERIKEN4.k
12/11/05 12:20:14.73 fpizldxB0
その前にバージョン0.06の正式版をうpしなきゃ… すっかり忘れてた。

360: ◆MERIKEN4.k
12/11/05 13:29:17.33 fpizldxB0
バージョン0.06の安定版です。

MERIKEN's Tripcode Finder 0.06
URLリンク(www.meriken2ch.com)

機能的にはBeta 1と変わりません。バージョン0.05の安定版からの変更点は
以下になります。

・64bit版の追加。
・CPU検索の速度向上。

361:名無しさん@お腹いっぱい。
12/11/05 16:10:33.81 XSg5TiK+0
>>360
早速テストしてみましたよー(検索ワードは「^TEST/」)

環境:ASUS K55VD(Corei5-3210M+GeForce610M,64bitWin7)
10桁結果:
     GPUのみ   GPUとCPU       CPUのみ
6.0β   2.92     7.00(3.0/4.0)    5.26
6.0    3.07     7.00(3.1/4.0)    5.25
12桁結果:
     GPUのみ GPUとCPU    CPUのみ
6.0β   43.02    53.54(42.8/10.8) 14.47
6.0    43.02    55.72(44.9/10.8) 14.50
(単位はM tripcode/s)

ところで、「検索の最適化中...」ってどんなことをしているんですか?
このテストの際も、その表示が消えるのを待ってやった方が良かったのか迷いました……

362: ◆MERIKEN4.k
12/11/05 16:46:55.43 fpizldxB0
>>361
詳しい報告、ありがとうございます。検索の最適化では「詳細設定」の
「1SMあたりのブロック数」の自動設定をしています。この報告でもCPU検索の
正確な速度とGPU検索のおよその速度は分かりますが、GPU検索の正確な速度を
測定したい場合は手動でブロック数を設定する必要があります。
この場合CUI版を使えば最適なブロック数の目安を知ることができます。

363: ◆MERIKEN4.k
12/11/05 16:47:10.20 fpizldxB0
安定版をビルドしたついでに一気にGUI版の作業も終わらせました。
これでちゃんとOpenCLでの12桁検索ができるようになりました。
機能的にもCUDA版に遜色ないはずです。というか全く普通に検索できているので
シュールに感じるぐらいですw しばらく手元で色々試してから、問題なければ
2、3日中に次の開発版として公開する予定です。

364:名無しさん@お腹いっぱい。
12/11/05 17:01:06.40 wg8KNqxN0
みんながゲフォを捨てる日も近いな

365: ◆999984973989
12/11/05 19:14:24.79 Igv9XM2P0
>>360
お疲れ様です。

CUDA DEVICE
===========
CUDA Device Count: 1
Device No.: 0
Device Name: GeForce GTX 460
Multiprocessor Count: 7
Clock Rate: 1400MHz
Compute Capability: 2.1
CPU
===
Number of Processors: 8
Number of Search Threads: 7
TARGET(S)
=========
0: "trip/"
Performing a forward-matching search for 1 pattern (1 chunk)
with 5 characters on CPU and GPU(s):
CUDA0: 278.7M TPS, 96 blocks/SM

0.150T tripcodes were generated in 0d 0h 9m 08s at:
302.83M tripcodes/s (current)
GPU: 281.89M tripcodes/s
CPU: 20.94M tripcodes/s
272.94M tripcodes/s (average)
On average, it takes 2.7 seconds to find one match at this speed.

123 matches found at 807.78 matches/h and 1.22G tripcodes/match.
The actual matching probability is 3% lower than expected.
9% of matching tripcodes were invalid.

366:名無しさん@お腹いっぱい。
12/11/06 00:44:34.13 5vgBlR+s0
アホの子(笑)Intel HD4000 の計算する姿が見れると聞き、3770 マザーボードを
設定変更して HD4000 Graphics を有効にし、これまで Radeon HD5770 につないで
いた2台のディスプレイのうちサブのほうを 3770 マザーボードのオンボードグラ
フィックに接続して使っています。 2~3日後の開発版の公開が楽しみです。

HD5770 について、これまで非シバキ時の GPU CLOCK が 400MHz を下回るのを見た
ことがなかったのですが、今回デュアル接続をやめたら 157MHz まで下がるように
なり、非シバキ時の GPU 温度も10℃近く下がりました。これはうれしい。


367:名無しさん@お腹いっぱい。
12/11/06 01:17:04.58 TazUQgso0
>>354
プロセスルール的に消費電力が気になりましたが、HD 5970は300W弱で8ピン+6ピンだったのですね。
VLIWや制御ユニットの集中などのアーキテクチャの違いでピーク時のワットパフォーマンスは良いのでしょうかね。

そろそろグラボの補助電源で6ピンx2はやめて8ピンx1にならないのでしょうかね・・・
6+2ピンの電源ユニットも増えていますし、6ピンx2を8ピンx1に変換するケーブルとかもありますし。

>>360 >>363
乙です。OpenCL版が楽しみです。

368: ◆MERIKEN4.k
12/11/06 02:02:47.13 MxK7yrlF0
>>366
残念ながらIntelのドライバのバグが直るまでHD 4000では動きませんです。
エラーでプログラム自体が落ちるのでもとに戻しておいたほうが良いかもしれません。
5770だけでも十分に幸せになれますしね。昨日OCして速度を測ってみたら
7完1タゲで452M TPS出てました。

369: ◆MERIKEN4.k
12/11/06 02:18:41.18 MxK7yrlF0
>>367
ワッパ的には5970はかなり美味しいでしょうね。5770もOCさせても
せいぜい60℃ぐらいまでしか上がらないのでやっぱりアーキテクチャの違いなんでしょう。
Fermiとはエラい違いですw 補助電源のコードの取り回しも普通のケースだと
結構面倒くさいですよね。うちの検索君1号(仮)の電源からはPCI-Eの補助電源用の
ケーブルが6本にょきにょきと伸びていますw

370: ◆MERIKEN4.k
12/11/06 05:17:20.34 MxK7yrlF0
8970の出荷が思ったより遅くなりそうなので、さきほど7970を注文してしまいました。

AMDの新「Venus」コアは2013年3月のRadeon HD 8970から?
URLリンク(ascii.jp)

OpenCLの10桁検索の作業を進めるにあたって、GCNアーキテクチャでの性能を
確認しておきたいというのが大きいですが、いくらなんでも散財し過ぎなので、
これで当分の間グラボを買うことはないでしょう。

371: ◆MERIKEN4.k
12/11/06 09:14:36.69 MxK7yrlF0
意味不明なエラーが出て終了するのも何なので、Intel HD Graphicsシリーズは
最初に弾くようにしておきました。将来のドライバ更新に期待といったところです。
もう修正したいところは全部修正したので、これから配布パッケージを用意して
開発版を公開することにします。

372: ◆MERIKEN4.k
12/11/06 10:02:36.31 MxK7yrlF0
というわけでRadeonに対応した開発版です。

MERIKEN's Tripcode Finder 0.07 Alpha 1
URLリンク(www.meriken2ch.com)

変更点は以下になります。

・AMD Radeonシリーズ等のOpenCL対応デバイスでの12桁トリップ検索への対応。

相変わらず出来立てほやほやの人柱専用です。

373: ◆MERIKEN4.k
12/11/06 10:09:06.68 MxK7yrlF0
動作報告をしていただける方にはこちらのテンプレを使っていただけると
大変助かります。

【GPU】
【CPU】
【OS】
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1
【トリップの種類】12桁
【1CUあたりのワークグループの数】
【1WGあたりのワークアイテムの数】
【その他のオプション】
【Display Driver】
【10分間の平均速度】
【その他】

374: ◆MERIKEN4.k
12/11/06 10:37:40.94 MxK7yrlF0
自分の環境ではこんな感じで動いています。
オプションが紛らわしいので「検索デバイス」と「CPUの命令セット」の
項目を追加しておきました。

【GPU】Sapphire Radeon HD 5770 (OC: 960MHz)
【CPU】Intel Core i7-3770K (OC: 4300MHz)
【OS】Microsoft Windows 7 64bit SP1
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1
【トリップの種類】12桁
【検索デバイス】GPUとCPU
【1CUあたりのワークグループの数】5120
【1WGあたりのワークアイテムの数】64
【CPUの命令セット】x64 + SSE2
【その他のオプション】
【Display Driver】Catalyst 12.9
【10分間の平均速度】488.51M tripcodes/s
【その他】7完1タゲ。CPU検索の速度は約39.4M tripcodes/s。

375: ◆MERIKEN4.k
12/11/06 12:12:14.01 MxK7yrlF0
普段使っている正規表現の検索パターンをRadeonで回してみましたが
ちゃんと動いているようです。しばらくこれで放っておいて、きちんと
動作するかどうか確認することにします。

これで12桁トリップ検索を常時3G TPSで回せる環境が整ったわけですが、
自分の部屋の電力使用量が常に1500W前後と、とんでもないことに
なっています。7970をもう1枚追加したら本当にギリギリです。

しかし2台で同時に検索しているとやはりネットワーク機能が欲しく
なりますねえ。まあこれは当分先の話ですね。

376: ◆MERIKEN4.k
12/11/06 13:47:22.39 MxK7yrlF0
しかしこれ、CPU検索とGPU検索の平均が別々にわからないのは
結構大きな欠陥ですねえ。なんで今まで気づかなかったんだろう…

377: ◆MERIKEN4.k
12/11/06 13:50:33.66 MxK7yrlF0
間違えた。これ、明日直しておこうっと。

☓平均が別々にわからないのは
○平均速度が別々にわからないのは

378:名無しさん@お腹いっぱい。
12/11/06 14:11:46.66 ZJO9ySv90
【GPU】Radeon HD 6970(880MHz)
【CPU】Intel Core i7-2600(3.40GHz)
【OS】Windows 8 64bit
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1
【トリップの種類】12桁
【1CUあたりのワークグループの数】5120
【1WGあたりのワークアイテムの数】64
【その他のオプション】
【Display Driver】Catalyst 12.10
【6分間の平均速度】 832M tripcodes/s
【その他】12完1タゲ。最初Catalystをインストールしてないことに気づかず回していたら 250M tripcodes/sくらいでした

非常に早くて驚きました。これは素晴らしいです

379:ののたん ◆KiwamonoL.
12/11/06 14:23:33.61 I3Z78Ya30 BE:355547063-DIA(289888)
【GPU】N/A
【CPU】i7-2600
【OS】WIndows 7 64bit
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1
【トリップの種類】12桁
【1CUあたりのワークグループの数】N/A
【1WGあたりのワークアイテムの数】N/A
【その他のオプション】なし
【Display Driver】N/A
【10分間の平均速度】19M
【その他】タゲは TEST// のみで 10 分ではヒット無し

同条件で hip2 だと 52M ぐらいで 2 個ヒット。
てか、CPU が 100% にはりつきっぱなのをみると、使い切ってるというよりも競合とかで無駄が出てるのでは?
hip2 だとだいたい 95% 前後をふらつく。

380: ◆MERIKEN4.k
12/11/06 14:57:58.35 MxK7yrlF0
>>378
いきなり凄いのが来ましたねえ! GPUだけで800M TPS前後出ている計算になりますね。
全く素晴らしいとしか言いようが無い数字です。

381:名無しさん@お腹いっぱい。
12/11/06 15:07:24.85 xNUnDM0r0
【GPU】 Radeon HD 7970 (925MHz)
【CPU】 Intel Xeon E5645 (2.4GHz)
【OS】 Windows 7 x64 SP1
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1
【トリップの種類】12桁
【1CUあたりのワークグループの数】 512
【1WGあたりのワークアイテムの数】 64
【その他のオプション】
【Display Driver】 Catalyst 12.10
【10分間の平均速度】 1175.36M tripcodes/s
【その他】GPUのみ

382: ◆MERIKEN4.k
12/11/06 15:07:42.96 MxK7yrlF0
>>379
う~ん、うちのi7-3770Kでは1タゲで43M TPS出ているのでi7-2600で
その数字は低すぎですねえ。Intelの開発者が書いたコードを使っておいたほうが
無難だったかな… CPU検索の高速化にはまた後で挑戦し直す予定です。
あ、あとよかったらぜひhip2を公開して下さいw

383: ◆MERIKEN4.k
12/11/06 15:14:09.49 MxK7yrlF0
>>381
( д) ゚ ゚

384: ◆MERIKEN4.k
12/11/06 15:30:44.15 MxK7yrlF0
あ~、びっくりしたw しかし気になっていたNorthern Islandsと
Southern Islandsでちゃんと性能が出ているようで安心しました。
>>378さんと>>381さん、どうもありがとうございました。

385:名無しさん@お腹いっぱい。
12/11/06 15:33:25.72 xNUnDM0r0
>>383

GPUが少し暇そうにしている(使用率80%弱ぐらいで推移)のですが、
これ使用率上げられたらもう少し早くなるんですかねえ。

386: ◆MERIKEN4.k
12/11/06 15:39:25.06 MxK7yrlF0
>>385
あ、それは間違い無く速くなります。
次の開発版では検索スレッドをもう一つ増やしておきます。
テンプレにも「GPU使用率」の項目を追加しておいたほうがいいのかな。
しかし物凄い性能ですねえ。

387:名無しさん@お腹いっぱい。
12/11/06 15:55:22.84 Ppsoxtpd0
さようならゲフォ

388:名無しさん@お腹いっぱい。
12/11/06 16:25:42.06 gwnx7VAP0
【GPU】Radeon HD 5870(850MHz)
【CPU】Corei7 2600K(4.6GHz)
【OS】Windows 8 64bit
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1
【トリップの種類】12桁
【1CUあたりのワークグループの数】5120
【1WGあたりのワークアイテムの数】64
【その他のオプション】GPUのみ
【Display Driver】Catalyst 12.11beta
【10分間の平均速度】436.79M tripcodes/s
【その他】タゲはTEST/

ほとんどの場面でGPU使用率が50%まで行かないです。
42~49%あたりをふらふらしてる感じたまーに50%超えてるときは
現在の速度が500M tripcodes/s前後まで行ってます

389:ののたん ◆KiwamonoL.
12/11/06 17:36:01.43 I3Z78Ya30
>>382
盛ってると思うよな、やっぱり。
自分でもそう思うぜ。www

URLリンク(ra8.s31.xrea.com)
に仮置きしてみた。てーすとってのがそうだ。

i7 用ってか SSE4.2 仕様の 64bit 版。
CPU 以外では動かないようにいろいろ細工してある。

全数字は勝手に探す仕様だ。
実際に表示の速度が出てるか確認用に入れてた。
-N2 オプションあたりが最速じゃないかな、多分。

なんかの参考にでも。って、ソース非公開だが。www
まあ開発途中で投げたやつなのでいろいろアレだが気にスンナ。www

390: ◆999984973989
12/11/06 17:58:07.86 osy8A/YB0
【GPU】N/A
【CPU】i7-860 2,8GHz
【OS】WIndows 7 32bit
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1
【トリップの種類】12桁
【1CUあたりのワークグループの数】N/A
【1WGあたりのワークアイテムの数】N/A
【その他のオプション】なし
【Display Driver】N/A
【10分間の平均速度】23.8M
【その他】タゲは TEST// のみで 10 分ではヒット無し
CPU
===
Number of Logical Cores: 8
Number of Search Threads: 8
TARGET(S)
=========
0: "TEST//"
TRIPCODES
=========

STATUS
======
Performing a forward-matching search for 1 pattern (1 chunk)
with 6 characters on CPU.

0.015T tripcodes were generated in 0d 0h 10m 10s at:
23.78M tripcodes/s (current)
23.77M tripcodes/s (average)
On average, it takes 33.0 minutes to find one match at this speed.

No matches were found yet.

391:名無しさん@お腹いっぱい。
12/11/06 19:55:11.07 +lFrJltU0
GPU】HD7970 CFX 2GPUs @1150MHz
【CPU】FX8350 @5GHz
【OS】Win7 64bit
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1
【トリップの種類】12桁
【1CUあたりのワークグループの数】default
【1WGあたりのワークアイテムの数】default
【その他のオプション】-g -c -t8
【Display Driver】Catalyst 12.10
【8分間の平均速度】1015.07M
【その他】12完1タゲ

待て屋。爆速版でもしばしば起きていましたがGPUが全力出してないみたいです

URLリンク(www.rupan.net)

392:名無しさん@お腹いっぱい。
12/11/06 19:56:50.52 +lFrJltU0
あ、平均間違った

393:名無しさん@お腹いっぱい。
12/11/06 23:56:31.04 cZ1d8VQd0
こういうのってどうなんでしょうね
URLリンク(techon.nikkeibp.co.jp)

394:名無しさん@お腹いっぱい。
12/11/07 00:17:27.55 TO2+iqd80
メリケンさんに聞きたいのですが、
「1SMあたりのブロック数」をいろいろ弄って最速の設定はどれかを試していたら、
「上げれば上げるほど速い」という謎の結論に達しました……(ちなみにノーパソのGeForce)
目一杯上げてもハードに悪影響を与えたりしませんよね?

395:名無しさん@お腹いっぱい。
12/11/07 00:20:11.33 DRUtyFmt0
ラデ+HD4000環境で起動するとMERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel.って言われちゃうんだが……
とりあえずドライバ更新とOpenCL再インスコしたが駄目だった

396:395
12/11/07 00:35:24.34 DRUtyFmt0
.NETの修復をしてWindowsUpdateして再起動したらなんか悪化した
OPENCL FUNCTION FALL FAILED: CL_DEVICE_NOT_FOUND (file 'Source Files\MTF_CUI_Main.cpp', line 676)

397:名無しさん@お腹いっぱい。
12/11/07 00:36:16.17 LUmvVcmd0
URLリンク(i.imgur.com)
ドライバ更新しないで起動したら量子コンピュータもびっくりでワロタ

398:名無しさん@お腹いっぱい。
12/11/07 00:51:49.53 TO2+iqd80
>>397
averageで9完が2.4分で終わるレベルwwww

399:ののたん ◆KiwamonoL.
12/11/07 01:02:29.81 XRqsjajg0
>>395
この段階なら、絶対パスで起動すれば動いただろうな。

400: ◆MERIKEN4.k
12/11/07 03:49:42.41 +2zE6v+s0
>>396
ドライバ入れ直したほうがいいですね。>>395のはOpenCLのソースコードが
実行時に見つからないときに表示されるエラーですが…

401: ◆MERIKEN4.k
12/11/07 03:51:58.38 +2zE6v+s0
>>394
気になるのでしたらSpeedFanとかMSI AfterburnerとかでGPUの温度を
確認するのがいいと思います。

402: ◆MERIKEN4.k
12/11/07 03:53:40.49 +2zE6v+s0
>>393
こりゃおもしろそうですね。やることなくなったらハードウェアハックにも手を
出してみようかなw

403: ◆MERIKEN4.k
12/11/07 03:58:19.17 +2zE6v+s0
>>390
>>391
やっぱり検索スレッドの数を増やしたほうがいいんでしょうねえ。
たくさん盛るのは簡単なんですけど、オーバーヘッドが心配なので
いま調べているところです。

404: ◆MERIKEN4.k
12/11/07 04:01:13.80 +2zE6v+s0
>>390
ありがとうございます。CPUだけのデータもまとめておいたほうがいいのかな…

405: ◆MERIKEN4.k
12/11/07 04:04:03.93 +2zE6v+s0
>>389
盛っているというか、Tripcode Finderの数字が低すぎなのが気になります。
hip2は次にCPU検索の最適化の作業をするときに参考にさせて頂きます。
他に比較対象がないので助かります。

406: ◆MERIKEN4.k
12/11/07 04:54:08.65 +2zE6v+s0
あ、間違えてる。>>403>>388さんと>>391さん宛でした。

407: ◆MERIKEN4.k
12/11/07 05:38:47.96 +2zE6v+s0
開発版を修正しました。

MERIKEN's Tripcode Finder 0.07 Alpha 2
URLリンク(www.meriken2ch.com)

Alpha 1からの変更点は以下になります。

・AMDのGPUでGPU使用率が低くなる問題を修正。
・GPUとCPUの平均速度の表示。

とりあえず1つのAMDのGPUあたりの検索スレッドの数は4に決め打ちに
しておきました。

408: ◆MERIKEN4.k
12/11/07 05:42:48.47 +2zE6v+s0
こちらは新しい報告用のテンプレです。ぜひよろしくお願いします。

【GPU】
【CPU】
【OS】
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2
【トリップの種類】12桁
【1CUあたりのワークグループの数】
【1WGあたりのワークアイテムの数】
【その他のオプション】
【Display Driver】
【10分間の平均速度】tripcodes/s
【GPUの平均速度】tripcodes/s
【CPUの平均速度】tripcodes/s
【その他】

409: ◆MERIKEN4.k
12/11/07 05:59:21.00 +2zE6v+s0
「GPU使用率」を付け足すのを忘れてたorz
動作報告はこちらのテンプレでお願いします。

【GPU】
【CPU】
【OS】
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2
【トリップの種類】12桁
【1CUあたりのワークグループの数】
【1WGあたりのワークアイテムの数】
【その他のオプション】
【Display Driver】
【10分間の平均速度】tripcodes/s
【GPUの平均速度】tripcodes/s
【CPUの平均速度】tripcodes/s
【GPU使用率】
【その他】

410: ◆MERIKEN4.k
12/11/07 06:02:57.05 +2zE6v+s0
>>391
よくみたら、これGPU使用率が35%しかないですねえ。
検索スレッドが1GPUあたり4個だとたりないかもしれません。
足りないようだったら次の開発版でオプションで検索スレッドの数を
変えられるようにしておきます。

411: ◆supernova.rT
12/11/07 06:57:03.71 4Ex6pXTl0
【GPU】GeForce GTX 570 / Radeon HD 5870
【CPU】Core i7-2600K
【OS】Windows 7 64bit SP1
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2 (CUI64)
【トリップの種類】12桁
【1CUあたりのワークグループの数】5120
【1WGあたりのワークアイテムの数】64
【その他のオプション】
【Display Driver】Catalyst 12.11 beta
【10分間の平均速度】1216.38M tripcodes/s
【GPU使用率】GeForce 96%, Radeon 未計測
【その他】8完1タゲ、GPU検索のみ


CUDA DEVICE
===========
Device No.: 0
Device Name: GeForce GTX 570
Multiprocessor Count: 15
Clock Rate: 1464MHz
Compute Capability: 2.0

OPENCL DEVICE
=============
Vendor: Advanced Micro Devices, Inc.
Name: Cypress
Number of Compute Units: 20
Clock Frequency: 875MHz
Global Memory Size: 1024M bytes
Max. Work Group Size: 256
Version: OpenCL 1.2 AMD-APP (1084.2)
Driver Version: 1084.2 (VM)

412: ◆supernova.rT
12/11/07 06:57:43.67 4Ex6pXTl0
STATUS
======
Performing a forward-matching search for 1 pattern (1 chunk)
with 8 characters on GPU(s):
CUDA0: 565.0M TPS, 192 blocks/SM
OpenCL0-0: 139.0M TPS, 5120 work-groups/CU, 64 work-items/WG
OpenCL0-1: 176.8M TPS, 5120 work-groups/CU, 64 work-items/WG
OpenCL0-2: 175.5M TPS, 5120 work-groups/CU, 64 work-items/WG
OpenCL0-3: 175.6M TPS, 5120 work-groups/CU, 64 work-items/WG

0.740T tripcodes were generated in 0d 0h 10m 08s at:
1219.88M tripcodes/s (current)
1216.38M tripcodes/s (average)


連投失礼しました。
変則構成のせいかもしれませんが、どうにも挙動が怪しい気がします。
これらは実行ファイルのダブルクリックによる直接起動の結果です。
コマンドラインからオプション無しで起動した場合は、以下のエラーが発生しCUDA検索のみ有効となります。

TRIPCODES
=========
MERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel.
MERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel.
MERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel.
MERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel.

413: ◆MERIKEN4.k
12/11/07 07:34:53.53 +2zE6v+s0
>>411
5870だったらもうちょっと速度が出てもいいはずですね。
GPU使用率が100% 近いなら、-yオプションでワークグループの数を調整したほうが
いいのかもしれません。
コマンドラインでエラーが出るのはOpenCLのソースが読み込めていないだけなので、
GTX 570とは関係ないはずです。ちょっと調べてみます。

414: ◆MERIKEN4.k
12/11/07 07:40:07.03 +2zE6v+s0
コマンドラインから起動してエラーが出たのはOpenCLのソースへのパスが
きちんと取得できていないだけでした。なんという凡ミス…
argv[0]でフルパスが取得できないとなるとどのAPIを使えばいいんだろう。

415: ◆MERIKEN4.k
12/11/07 07:47:40.66 +2zE6v+s0
>>412
_fullpath()を使ったらエラーは出なくなりました。
次の開発版ではちゃんとコマンドラインから起動できるようになるはずです。

416: ◆supernova.rT
12/11/07 07:58:44.95 4Ex6pXTl0
>>415
どうもです。次の開発版で-yオプションを試したいと思います。
ついでに補足ですが、GeForceのドライバは310.33 BETAでした。

417:394
12/11/07 08:11:24.58 TO2+iqd80
>>401
調べてみたのですがこんな感じです。
URLリンク(uploda.cc)
よく分かりませんが、負荷が掛かり過ぎると自動検知して時々休んだりするんですかね?
(なお速度は50M弱で安定している模様)

ついでに一つ。自動設定で走らせた場合に、
検索停止後にそのパラメータを「詳細設定」タブに反映して欲しい……
毎回検索の最適化されるのは辛いですので

418: ◆MERIKEN4.k
12/11/07 08:25:54.89 +2zE6v+s0
>>417
最適なパラメータは検索の条件によって変わってくるので
「詳細設定」タブに反映させるのは難しいのです。
あらかじめ値がわかっているならその値を指定しておけば
最適化は行われません。

419: ◆MERIKEN4.k
12/11/07 08:27:48.12 +2zE6v+s0
>>417
あ、あとこの温度だったら全然問題無いです。

420: ◆MERIKEN4.k
12/11/07 08:29:58.28 +2zE6v+s0
>>416
次の開発版では検索スレッドの数も変えられるようになっているので、
そちらのほうも是非試してみて下さい。

421: ◆supernova.rT
12/11/07 08:53:06.82 4Ex6pXTl0
>>420
-yと-zですね。5870に最適の数値が見つかりましたら報告致します。

422:ののたん ◆KiwamonoL.
12/11/07 12:07:48.18 XRqsjajg0
【GPU】N/A
【CPU】i7-2600
【OS】WIndows 7 64bit
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2
【トリップの種類】12桁
【1CUあたりのワークグループの数】N/A
【1WGあたりのワークアイテムの数】N/A
【その他のオプション】なし
【Display Driver】N/A
【5分間の平均速度】26M
【その他】タゲは TEST// のみで 5 分ではヒット無し

同条件で hip2 だと 74M ぐらいで同じくヒット無し。

>>379 と CPU とかは同じだが、別個体なので SDK のバージョンとかが違うかも。
なんかしらんが、>>379 の個体は遅いな。w

あとものすごくどうでもいい情報だが、Radeon HD 4000 番台では動かんな。

423:381
12/11/07 13:21:31.88 H54C/50b0
うーん。Alpha 2 だとパフォーマンスあまり出ないなあ。むしろ下がっている。
代わりに、OCしてAlpha 1で計測したものを。

【GPU】 Radeon HD 7970 (OC:1125MHz)
【CPU】 Intel Xeon E5645 (2.4GHz)
【OS】 Windows 7 x64 SP1
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1
【トリップの種類】12桁
【1CUあたりのワークグループの数】 512
【1WGあたりのワークアイテムの数】 64
【その他のオプション】
【Display Driver】 Catalyst 12.10
【10分間の平均速度】 1230.65M tripcodes/s
【その他】GPUのみ

424: ◆MERIKEN4.k
12/11/07 15:39:45.37 +2zE6v+s0
>>423
結構OC耐性がありますねえ。あと検索スレッドの数を無闇に増やせばいいという
ものでもないみたいですね。自分の環境ではワークグループの数を半分に
したらGPU使用率が98~99%で安定するようになりました。次の開発版では
デフォルトの値を調整しておきます。

【GPU】Sapphire Radeon HD 5770 (OC: 960MHz)
【CPU】Intel Core i7-3770K (OC: 4300MHz)
【OS】Microsoft Windows 7 64bit SP1
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2
【トリップの種類】12桁
【1CUあたりのワークグループの数】2560
【1WGあたりのワークアイテムの数】64
【その他のオプション】
【Display Driver】Catalyst 12.9
【10分間の平均速度】486.23 tripcodes/s
【GPUの平均速度】454.71 tripcodes/s
【CPUの平均速度】31.52 tripcodes/s
【GPU使用率】98~99%
【その他】7完1タゲ。

425: ◆MERIKEN4.k
12/11/07 15:43:12.49 +2zE6v+s0
>>422
う~ん、それは全く謎ですね。>>389のリンクは切れていてダウンロード
できませんでした。

426: ◆MERIKEN4.k
12/11/07 15:55:32.36 +2zE6v+s0
あしたあたりに7970が届くはずなので、それでいろいろ実験して
デフォルトのパラメータを調整してから次の開発版をうpします。

427:395
12/11/07 16:00:26.76 DRUtyFmt0
若干スレチですが・・・
12-10をアンインストールしてから再インストールしても駄目でした。
12-8、12-6、12-4も試しましたが駄目でした。

AMD APP SDKで改善することはありえますか?

428:395
12/11/07 16:17:06.99 DRUtyFmt0
ちなみにBOINCのGPGPU(WCGのHCC)や待て屋GPU版はこの状態でも動作します。

429: ◆MERIKEN4.k
12/11/07 16:28:57.68 +2zE6v+s0
>>427
GUI版は起動できますか? コマンドラインから起動できないバグかもしれません。

430:395
12/11/07 16:31:45.44 DRUtyFmt0
>>429
GUI版では使用出来るGPUが見つかりませんでしたと出ます。

431: ◆MERIKEN4.k
12/11/07 16:36:59.52 +2zE6v+s0
それは謎ですねえ。AMD APP SDKで改善するかもしれませんけど…

432:ののたん ◆KiwamonoL.
12/11/07 16:48:29.13 XRqsjajg0
>>425
>>405 の時点で落としたものと思って消したわ。w
復活させたが、あんなもんをずっと置いとく気は無いので落としたら言ってくれ。

>>430
今コレを書いてるPCでも同じことになったんだが、CCC 12-6 入れて SDK v2.7 入れたら直ったぜ。
どっかの WindowsUpdate でなんかやられたのかもしれん。
12-6 なのは、4000 番台だからだ。このバージョンがいいとかいうわけではない。

433: ◆MERIKEN4.k
12/11/07 16:56:10.78 +2zE6v+s0
>>432
あ、そうですか。今落としたのでもう消していただいて大丈夫です。
それにしても、うちのi7-3770Kで95M TPS出てますけど、これは一体どういう
仕組みなんでしょうか…

434: ◆MERIKEN4.k
12/11/07 17:16:21.42 +2zE6v+s0
>>422
書き忘れてたけど、多分パラメータを替えれば4000番台でも動くと思いますよ。
CUI版ではどんなエラーが出ていますか?

435:ののたん ◆KiwamonoL.
12/11/07 17:26:15.21 XRqsjajg0
>>433
実際に速度分ヒットしてるか確認したほうがいいな。w
速度表示のバグとかかもしれんぞ。うひ。
なにせ途中で飽きてほうりだしたものだしな。

>>434
いや、処理そのものを書き換えないと動かないな。
理由はこれだ。

The 4XXX series does not have the requisite hardware to support byte addressable store, so it will never be supported.

436:ののたん ◆KiwamonoL.
12/11/07 17:37:35.12 XRqsjajg0
つーかさ、これも多分そのぐらいの速度なんじゃないかな。
URLリンク(trip2ch.net)

MERIKEN's Tripcode Finder はまだまだチューニングの余地があるというか、
まだやりはじめたばっかりなんだろ。
そのうち hip2 なんざ超えるんじゃね?

437: ◆MERIKEN4.k
12/11/07 17:45:31.86 +2zE6v+s0
>>435
ヒット率をチェックするルーチンを最初から組み込んでおくといろいろ安心ですよ。
Tripcode Finderの開発ではそれで随分助かりました。
4XXXシリーズの制限はちょっと厳しすぎですねえ。残念…

438: ◆MERIKEN4.k
12/11/07 18:33:41.58 +2zE6v+s0
>>436
MERIKEN's Tripcode Finderは他のプログラムに比べてキーの探索空間が広いので
単純に比較できないんですけど、ちょっと気になったのでCPU検索の速度を
調べてみました。CPUはCore i7-3770K 4300MHz、ターゲットは前方一致の
"TEST/"のみで、検索時間は5分です。

SHArp Tripper 1.1
報告された速度: 74.6M TPS
ヒットしたトリップの数: 19個

hip264.exe
報告された速度: 102.6M TPS
ヒットしたトリップの数: 0

MERIKEN's Tripcode Finder 0.07 Alpha 2
報告された速度: 42.8M TPS
ヒットしたトリップの数: 11

hip2は5完のターゲットだとちゃんと動いていないようです。

439:ののたん ◆KiwamonoL.
12/11/07 18:45:49.58 XRqsjajg0
>>438
hip2 は6完以上しか探せない仕様だ。w

5完しかタゲにないと
0 ターゲット読み込みました。
ってなるはず。はず。はずなんだよなぁ・・・・・。

ちなみに hip2 の検索空間というかキーの組み合わせ数は、
81189040166334863750412839195508736 個
だ。
MERIKEN's Tripcode Finder はこれの何倍だ?
つか、トリップの総数を考えるとこの辺にすると思うんだが。

440:ののたん ◆KiwamonoL.
12/11/07 18:51:17.50 XRqsjajg0
>>439
oi.
おい。
オイィィィ。

この辺、じゃねぇな。w
これでもかなり多すぎるな。

なんでこんなに広げたんだよ。>昔の俺

64^12=4722366482869645213696
だもんなぁ。

441:395
12/11/07 18:52:20.25 DRUtyFmt0
>>431-432
AMD APP SDKにはGPU向けのドライバは入ってなさそうでした。
アンインストールしてから12-6、SDKの順に入れても駄目でした。


他のOpenCL対応ソフトなんかの挙動を確認してみたんですが、
PhotoShopCS6ではRadeonを認識していて、「OpenCLを使用」のチェックも入れられました。
OpenCLを使用するというぼかしフィルターも使えています。

442:395
12/11/07 18:55:51.64 DRUtyFmt0
連レスすみません
大きい画像でぼかしフィルターを試すとぼかし処理の開始と同時にGPU Loadが増えるので、まず間違いなくPSでは動いていると思います。

443: ◆MERIKEN4.k
12/11/07 18:56:42.88 +2zE6v+s0
>>439
なるほど、そういうことだったんですね。Tripcode FinderはShift-JISのキーを
全てカバーするようになっているのでその数字より大分大きいはずです。
トリップの変換は全単射ではないのでキーの組み合わせの数と
トリップの総数(64^12)は必ずしも一致しません。

444: ◆MERIKEN4.k
12/11/07 19:03:19.07 +2zE6v+s0
hip2は全数字のターゲットは自動的に拾うようになっているようなので
そっちのほうでも比較してみました。検索時間は10分です。

hip264.exe
報告された速度: 102.6M TPS
ヒットしたトリップの数: 13

MERIKEN's Tripcode Finder 0.07 Alpha 2
報告された速度: 37.6M TPS
ヒットしたトリップの数: 7

hip2のほうが大分速度が出ているようですが、実際の速度が報告通りかどうかは
微妙なところです。

445:ののたん ◆KiwamonoL.
12/11/07 19:08:29.22 XRqsjajg0
>>443
またそんなてきとーなことを。www
hip2 の検索空間のほうが「かなり」広いぞ。
ちょっとは考えようよ。

つーかさ、全単射じゃないかもしれないからこうしてるんだし。

4722366482869645213696 = 64^12
81189040166334863750412839195508736 = hip2 の検索空間

俺のことどんだけバカだと思ってるんだよ。www

446:ののたん ◆KiwamonoL.
12/11/07 19:15:01.56 XRqsjajg0
>>444
自分でつくっといてなんだが、
>実際の速度が報告通りかどうかは微妙なところ
には同意だ。てへ。

まあ、10分じゃ運の要素が強いが・・・・・。

Ivy 買ったらまたやろうかとか考えてたけど、もうあの頃の情熱はない。うわぁ。

そもそも鳥屋がぐてやを投げるから悪いんだ。
ぐてやは試作段階でhip2よりも速かったんだぜ?
チクショウ
あの野郎やるやる詐欺でほったらかしだしな!!!!

447: ◆MERIKEN4.k
12/11/07 19:16:27.33 +2zE6v+s0
>>445
見た感じでは1バイト文字のキーしか探索していないようでしたけど、違うんでしょうか。
Shift-JISのキーを網羅的に探索するTripcode Finderのほうがキーの探索空間が広いのは
自明だと思うのですが…

448:名無しさん@お腹いっぱい。
12/11/07 19:22:00.88 lVCLYKZJ0
キー探索空間は
64 ^ 12
= 2 ^ 72
= 4722366482869645213696

だけで十分ではないのですか?
↓の資料を読む限りでは。

> 与えられたハッシュ値に対応する入力を求めるために必要な計算量は、
> ハッシュ値が n ビットであるとき、ハッシュ関数の計算を 2^n 回行うための計算量を超えない。
URLリンク(www.jnsa.org)

449:ののたん ◆KiwamonoL.
12/11/07 19:25:30.34 XRqsjajg0
>>447
なんだかなぁ。
なんで確認しないの?
なんでTripcode Finderのキー空間計算してみないの?

私、怒っちゃったから答えは教えてあげないよ~だ。

>>448
簡単に言うと、
違うキーで同じトリップになることがあるかもしれない
ってことだよ。だから、総トリップ数よりも多くしておくべきなんだよね。

450: ◆MERIKEN4.k
12/11/07 19:27:35.72 +2zE6v+s0
>>448
実用的な観点からはトリップのキーはわかりにくければわかりにくいほど良いので
自分としては妥協したくないところです。

451: ◆MERIKEN4.k
12/11/07 19:29:51.83 +2zE6v+s0
>>446
> あの野郎やるやる詐欺でほったらかしだしな!!!!
ご愁傷様です… しかし実にもったいないですね。海外にいるとのことでしたけど
元気にされているんでしょうか。

Tripcode FinderのCPU検索はSHA-1のルーチン以外はサボりまくりなので
改善の余地はまだ大分あるんでしょうねえ。次に最適化に挑戦するのは
もうちょっと勉強してからにします。

452:名無しさん@お腹いっぱい。
12/11/07 19:30:50.57 lVCLYKZJ0
>>449
ハッシュ値の衝突はわかります。
それも踏まえた上で
> ハッシュ値が n ビットであるとき、ハッシュ関数の計算を 2^n 回行うための計算量を超えない。
ということではないのですか?

453: ◆MERIKEN4.k
12/11/07 19:36:59.82 +2zE6v+s0
>>449
私には

(1) 1バイト文字のみのキーの総数



(2) 1バイト文字とShift-JIS文字を含んだキーの総数

を比較したら後者のほうが大きいのは当然に見えるのですが違うんでしょうかねえ。
計算は面倒くさいのでしませんw

454: ◆MERIKEN4.k
12/11/07 20:14:53.11 +2zE6v+s0
私がトリップ検索に興味を持ったのは、私のトリップを騙る荒らしが現れたのが
そもそもの原因なので、Tripcode Finderを作るときには実用性が全てにおいて
優先しています。いままで考えてもみなかったですけど、純粋な知的好奇心以外の
明白な動機があるというのが自分の作ったプログラムにも反映されているのかも
しれません。

455:名無しさん@お腹いっぱい。
12/11/07 20:24:17.18 TO2+iqd80
あれ?
CPU側にhip2、GPU側にMERIKEN使えば最強なんじゃね?

456:ののたん ◆KiwamonoL.
12/11/07 21:33:59.97 XRqsjajg0 BE:632084148-DIA(289888)
>>455
hip2はホントにアルファレベルのでき。
タゲの制限も実用的なものじゃないし。
速度の検証しようとしたところで投げたから、マジで表示速度は怪しい。
もちろん、わざと盛るなんてことはやってないけど。w


『ホンキで最速を目指すんなら、キーを○×△□にしろよ。』
と鳥屋に言われた。一部伏せ字。w
最初意味がわからなかったけど、よく考えたらわかった。

ヤツは私の理解の外にいる。
待て屋のソース見るとよくわかる。
もったいないよなぁ・・・・。

457:名無しさん@お腹いっぱい。
12/11/07 21:57:24.06 c5GjquhW0
部外者の俺が答え言っちゃっていいのかは知らんが、
MERIKEN氏は12桁トリップのキーが12バイト以上を取りうるということを失念しているのだと思う

10桁トリップと違って12桁トリップはキーを長くするだけで簡単にキー探索空間が広がる
hip2が手元にないので確認できんが、>>439の数=152^16からhip2はキー16バイトで探索しているのだと推測される
このことを考えれば現状のキー探索空間は圧倒的にhip2の方が大きいというのはすぐに分かる

ここからは俺の偏見的見解だが、両者の違いは
hip2はわざわざShift_JIS空間を探索するより、単にキーを長くして簡潔・高速に探索することが目的
一方MERIKEN氏の方は>>450>>454からわかるように、「わかりにくいキー」を探索することを優先している
ということなんじゃないかと思う

458: ◆MERIKEN4.k
12/11/07 22:13:09.84 +2zE6v+s0
>>457
おっしゃる通り完全に失念していました。
ののたんさん、失礼しましたm(__)m

459:名無しさん@お腹いっぱい。
12/11/07 22:14:31.57 M5h2NzTI0
ののたんもわかりやすく伝えてあげればいいのに

460: ◆MERIKEN4.k
12/11/07 22:25:03.99 +2zE6v+s0
>>459
まあこの件は私の勘違いが原因なので…
いろんなアプローチの仕方があることがわかってちょっと新鮮でしたw

461:ののたん ◆KiwamonoL.
12/11/07 22:25:31.31 XRqsjajg0 BE:1422187889-DIA(289888)
>>457
あの桁の数字を152^16に分解できるとはやるね。w
まあそゆ計算するコマンドもあるけど。

漢字を使わないのは単にそこまで使用文字を増やす必要がないから。
漢字使っても速度ってそんなに変わらないよ。
キーのバリエーションはうにでも魔改造でもさんざんやってるから、ノウハウはいっぱい。w

ちなにみ16バイトってのはなんとなくとかじゃなくて、ちゃんと理詰めして出てきたものだよ。

462:名無しさん@お腹いっぱい。
12/11/07 22:31:53.94 bKBXePfH0
技術力はあっても性格がアレな人は見てて不快だからNGに突っ込んだ

463:名無しさん@お腹いっぱい。
12/11/07 22:36:08.15 dfbAPwW4P
技術力があれば性格なんてどうでもいいんだよ

464:名無しさん@お腹いっぱい。
12/11/07 22:36:32.37 Hb5lLL9GP
>>462
技術者同士のやり取りならこれが普通だろ
それにちゃんと答えにたどり着けるヒントは与えてくれてるし、
素直に自分の調べが甘かったなで終わりだよ

465:381
12/11/07 22:51:55.41 Zus3h7Yg0
Intel/AMD/NVIDIAがOpenCL 1.1以上に対応している今、
cl_khr_byte_addressable_storeなんざもはや過去の遺物か…

466: ◆MERIKEN4.k
12/11/07 23:31:12.78 +2zE6v+s0
>>465
正直こんなものがあった事自体が驚きです。

467:名無しさん@お腹いっぱい。
12/11/08 00:30:39.29 DT0SYqW30
エラーコード14って何?

468: ◆MERIKEN4.k
12/11/08 00:44:46.94 Dia+3Q0c0
assertでエラーが出てますね。
CUI版ではどのように表示されますか?

469:名無しさん@お腹いっぱい。
12/11/08 00:48:19.86 DT0SYqW30
URLリンク(www.dotup.org)
こんなん。1GPUだといけた

470: ◆MERIKEN4.k
12/11/08 00:50:25.42 Dia+3Q0c0
>>469
今ちょうどそこを直していたところですw
追って詳しく報告します。

471:名無しさん@お腹いっぱい。
12/11/08 00:55:39.10 DT0SYqW30
がんばれー

472: ◆MERIKEN4.k
12/11/08 00:57:49.64 Dia+3Q0c0
>>469
Alpha 2でスレッド周りにバグが紛れ込んでました。修正が終わったので
次の開発版では直っているはずです。

473:名無しさん@お腹いっぱい。
12/11/08 01:07:20.05 c99Xuep80
GUI版の設定ファイルって
%LOCALAPPDATA%\MERIKENsTripcodeFinderGUIフォルダ以下にある
user.configだけが使われてて
それ以外のレジストリとかは使われてないということでいいんでしょうか?

474:名無しさん@お腹いっぱい。
12/11/08 01:20:42.89 JfJybgRB0
なるほど、1GPUでは問題なく検索出来ますね
ただ、問題は1GPUでも900M程出てしまうこと
複数GPUを有効に働かせてませんね

それと、GPUを複数稼働させるとCPUの検索速度が落ちる
カードをドライブするのに相当リソースを持って行かれていると言うことですな
RdeonのアークテクちゃではCPU負荷が大きいのでこれは仕方がない

URLリンク(www.rupan.net)

475:名無しさん@お腹いっぱい。
12/11/08 01:22:07.09 JfJybgRB0
貼り方間違えた

URLリンク(www.rupan.net)

476: ◆MERIKEN4.k
12/11/08 05:45:25.11 Dia+3Q0c0
とうとう7970が届きました。ぐへへへへ…
午後のミーティングが終わったら早速インストールしようっと。

477: ◆MERIKEN4.k
12/11/08 05:46:20.48 Dia+3Q0c0
>>473
その理解でいいはずです。

478: ◆MERIKEN4.k
12/11/08 05:50:38.36 Dia+3Q0c0
>>474
これは7970ですか? もうちょっと速度が出そうな感じですね。
CPU検索スレッドはGPUの数だけわざと減らすようにしています。
「詳細設定」の「CPU検索スレッドの数」をいじると面白いかもしれません。

479:名無しさん@お腹いっぱい。
12/11/08 07:53:45.35 8rusYKpL0
>>476
>ぐへへへへ…
あかん……あかんでぇ

480: ◆MERIKEN4.k
12/11/08 08:12:55.00 Dia+3Q0c0
7970をさして起動したところです。わくわく…

481: ◆MERIKEN4.k
12/11/08 08:27:48.33 Dia+3Q0c0
手元のAlpha 3でいきなりGPUだけで1270M TPSでてます。なんだこの化物は…
しかしGPU使用率が結構バラつきます。75~97%を行ったり来たりといった
ところです。

482:名無しさん@お腹いっぱい。
12/11/08 08:34:28.95 DT0SYqW30
【GPU】H797F3G2M
【CPU】Xeon E5504
【OS】Windows 7 64bit SP1
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2
【トリップの種類】12桁
【1CUあたりのワークグループの数】2560
【1WGあたりのワークアイテムの数】64
【その他のオプション】GPUのみ
【Display Driver】9.01.8-121022a-147510E-ATI
【10分間の平均速度】1124Mtripcodes/s
【GPUの平均速度】tripcodes/s
【CPUの平均速度】tripcodes/s
【GPU使用率】65~80
【その他】GPUは1GHz CPUは3GHz

483: ◆MERIKEN4.k
12/11/08 08:45:22.52 Dia+3Q0c0
>>482
どうも7970の場合はワークグループの数を1280にするといいみたいですよ。

484: ◆BlackListRy1
12/11/08 09:43:16.73 3J/ptX+70
MERIKEN様、お疲れ様です
その節は御世話になりました

これからも頑張って下さい
スレ違い申し訳ありません<(_ _)>

失礼しますm(_ _)m

485:名無しさん@お腹いっぱい。
12/11/08 09:48:05.37 DT0SYqW30
>>483
使用率若干上がりました

X58マザーだしこのくらいいけばいいかな

486: ◆MERIKEN4.k
12/11/08 10:26:09.50 Dia+3Q0c0
>>484
こちらとしても使っていただけると嬉しいです。
またいつでもどうぞ。

487: ◆MERIKEN4.k
12/11/08 10:30:14.20 Dia+3Q0c0
ワークグループの数を変化させて10分間のGPUの速度の平均をとってみました。
とりあえず5770で有効だった320の倍数にしておきました。
960で使用率が綺麗に97%で安定しました。色々ためしてみるもんですねえ。
Alpha 3では1GPUあたりの検索スレッドの数を指定できるようになっていますが、
デフォルトの2のままにしてあります。

320 -> 910M TPS
640 -> 1250M TPS
960 -> *1370M TPS
1280 -> 1357M TPS
1600 -> 1240M TPS
1920 -> 1311M TPS
2240 -> 1331M TPS
2560 -> 1270M TPS

488: ◆MERIKEN4.k
12/11/08 11:05:08.48 Dia+3Q0c0
OCして速度を測定してみました。やっぱり化物ですね、これは。

【GPU】Gigabyte GV-R7970C-3GD Radeon HD 7970 (OC: 1130MHz)
【CPU】Intel Core i7-3770K (OC: 4300MHz)
【OS】Microsoft Windows 7 64bit SP1
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 3
【トリップの種類】12桁
【1CUあたりのワークグループの数】960
【1WGあたりのワークアイテムの数】64
【その他のオプション】
【Display Driver】Catalyst 12.9 Beta
【10分間の平均速度】1517.35 tripcodes/s
【GPUの平均速度】1481.07 tripcodes/s
【CPUの平均速度】36.28 tripcodes/s
【GPU使用率】94%
【GPUの温度】80℃
【その他】7完1タゲ。

489:名無しさん@お腹いっぱい。
12/11/08 14:25:41.24 JfJybgRB0
>>478
7970です
Alfa2では2GPUでの検索が出来ないので1GPUの結果です
1GPUでも速度駄変わらないという

490: ◆MERIKEN4.k
12/11/08 15:54:35.28 Dia+3Q0c0
新しい開発版です。

MERIKEN's Tripcode Finder 0.07 Alpha 3
URLリンク(www.meriken2ch.com)

Alpha 2からの変更点は以下になります。

・デフォルトのワークグループの数の調整。
・複数のOpenCL対応デバイスで検索できないバクの修正。
・デフォルトの検索スレッドの数の調整。
・検索スレッドの数を設定できるように修正。
・コマンドラインで起動できないバクの修正。

491:名無しさん@お腹いっぱい。
12/11/08 16:32:22.60 DT0SYqW30
アルファ3パネェな 1300Mは軽く超えるわ

492:名無しさん@お腹いっぱい。
12/11/08 17:06:30.31 DT0SYqW30
メインマシンの8 64bitはGPUは全部使ってるみたいだけどこんな状態だった
解凍したまんまで実行
URLリンク(www.dotup.org)

493: ◆GTX680Mcys3u
12/11/08 17:10:25.44 ECWSGXkx0
こちらは今までと変わらない速度です。
ただ、デフォの状態で起動しようとしたら「HD4000には対応してません」とかいうエラーが出て終了
GTX680Mを指定してあげないとダメだった
Optimusがあるからでしょうけども

494:名無しさん@お腹いっぱい。
12/11/08 17:11:54.96 cebxTMIE0
>>493
もうゲフォの報告は要らないです

495: ◆MERIKEN4.k
12/11/08 17:14:48.01 Dia+3Q0c0
>>492
ありゃりゃりゃ… AfterburnerのGPU使用率は0%になってるけど、
これは一体どういうことだろう。CUI版ではどのように表示されていますか?

496: ◆GTX680Mcys3u
12/11/08 17:18:51.36 ECWSGXkx0
不具合報告したのに何で煽られなきゃいかんのよ

497: ◆MERIKEN4.k
12/11/08 17:19:19.09 Dia+3Q0c0
>>493
報告たすかります。そのメッセージはちょっと紛らわしいですねえ。
ちょっと無理してでも動くようにしたほうがいいのかしらん。

498: ◆MERIKEN4.k
12/11/08 17:20:04.91 Dia+3Q0c0
>>496
荒らしなので放っておきましょう。

499: ◆MERIKEN4.k
12/11/08 17:24:11.64 Dia+3Q0c0
>>492
ちょっと考えてみたけどこれは本当におかしいですね。
詳細設定の検索スレッドの数を1にしたら直るかもしれません。
Radeonが複数あっても大丈夫なはずだけどなあ…
あとでこちらでも試してみます。

500: ◆GTX680Mcys3u
12/11/08 17:24:59.33 ECWSGXkx0
>>497
Intelグラフィックスは無視するようにはできないですかねえ
さすがにデフォ状態でエラー出るのは一般ユーザは使いにくいかも

501:名無しさん@お腹いっぱい。
12/11/08 17:26:19.08 DT0SYqW30
URLリンク(www.dotup.org)
64bitの方です
CPUロードは33%前後の状態です

502:名無しさん@お腹いっぱい。
12/11/08 17:30:54.14 wrgEgbJR0
Windows8 64bit Radeon HD 7660Dで初期設定のままで実行
Alpha 2ではエラーが出て実行出来なかったGPUとCPUを使用が利用可能に
URLリンク(www.dotup.org)

503: ◆MERIKEN4.k
12/11/08 17:36:46.31 Dia+3Q0c0
>>501
これは助かります。OpenCL検索スレッドはちゃんと走ってるみたいですね。
6970ではちゃんと動作するという報告が>>378であったので、
なんだかドライバのバグの臭いがしてきたぞ…
GUI版の「使用するGPU」で6990を1つだけえらんだ場合は
どれぐらい速度が出ますか?

504: ◆MERIKEN4.k
12/11/08 17:41:15.65 Dia+3Q0c0
>>500
無理に動かせない場合はHD 4000は無視したほうがいいですね。
アホの子からアッカリーンに格下げとは、なんて不憫な子…

505:名無しさん@お腹いっぱい。
12/11/08 17:43:38.64 DT0SYqW30
>>503
1つだと70%くらいの使用率で700M前後ですね

506: ◆MERIKEN4.k
12/11/08 17:48:32.02 Dia+3Q0c0
>>505
やっぱりそっちは普通ですね。「使用するGPU」を「すべて」にして
「検索スレッドの数」を1にした場合はどうですか?

507:名無しさん@お腹いっぱい。
12/11/08 17:50:30.24 DT0SYqW30
>>506
変わらず合計で200M程度 CPUが80Mで全てで300M前後です

508:名無しさん@お腹いっぱい。
12/11/08 17:57:01.81 DT0SYqW30
キャプでも分かりますがcatalyst12.11βです
あとは12.10もリリースされていますがどうなんでしょう

509: ◆MERIKEN4.k
12/11/08 18:11:29.25 Dia+3Q0c0
>>507-508
6990を一枚だけ差した状態できちんとスピードが出るなら、
間違いなくドライバのバグでしょう。>>487のように
ワークグループの数をいろいろ変えてみたら治るかもしれませんけど…
うちでは未だに12.9 Betaです。12.10は試してみないとわかりませんねえ。

510: ◆MERIKEN4.k
12/11/08 18:21:12.89 Dia+3Q0c0
>>502
これはAPUですか。結構速度が出ていますねえ。うちのHD 4000ちゃんとは
エラい違いです(;_;)

511:名無しさん@お腹いっぱい。
12/11/08 19:05:16.08 G/kjMuiS0
>>502
APUで200Mt/s超えですか、凄い時代になりましたね・・・

512:名無しさん@お腹いっぱい。
12/11/08 19:39:22.91 8rusYKpL0
>>502
A10カッケーな

513:名無しさん@お腹いっぱい。
12/11/08 21:24:27.82 c99Xuep80
>>477
ありがとうございます
もしよければREADME.txtにuser.configのことも書いておいてもらえるとうれしいです

514:名無しさん@お腹いっぱい。
12/11/08 21:34:27.71 CzgE7YFV0
>502さんに合わせてAlpha 3でA10-5700でやってみた。
Windows8 64bit Radeon HD 7660Dで初期設定のままで実行
#Alpha 2ではCPU+GPUで同じくエラー

順に、CPU、GPU、CPU+GPU(ファイルは400KBあるので注意)
URLリンク(www.dotup.org)
URLリンク(www.dotup.org)
URLリンク(www.dotup.org)

5800Kを下回る筈の速度がなぜか上回った。
ドライバとかメモリ(DDR3-1888)に差があるのかどうか。
#メモリはGPUでも影響しないのでしたっけ?

なお、Alpha 1よりCPU+GPUのGPU部分がざっくり4割速度向上しました。

515:名無しさん@お腹いっぱい。
12/11/08 21:47:01.79 CzgE7YFV0
テンプレに合わせて報告いたします。

【GPU】AMD Radeon HD 7660D (A10-5700内蔵)
【CPU】AMD A10-5700
【OS】Microsoft Windows 8 Pro 64bit
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 3
【トリップの種類】12桁
【1CUあたりのワークグループの数】960
【1WGあたりのワークアイテムの数】64
【その他のオプション】
【Display Driver】Catalyst 12.11 beta4
【10分間の平均速度】254.87M tripcodes/s
【GPUの平均速度】244.63M tripcodes/s
【CPUの平均速度】10.24M tripcodes/s
【GPU使用率】97~98%
【その他】CPU+GPU

消費電力は110~113W程度。GPUのみだと70W未満・・・GPUの効率スゴイっす。

関係ありませんが、「7完1タゲ」とかってどういう意味なんでせう。

516:名無しさん@お腹いっぱい。
12/11/08 22:03:42.35 uKh70Nek0
任意の七文字 タゲを1つだけ記した状態

517:名無しさん@お腹いっぱい。
12/11/08 22:23:18.59 CzgE7YFV0
>>516
ありがとうございます。もやもやが晴れました。

518:名無しさん@お腹いっぱい。
12/11/08 22:39:21.56 8rusYKpL0
>>515
>7完1タゲ
七文字のワード(YUKI.N/とか)を正規表現無しで1つだけ指定ってことじゃね

519:名無しさん@お腹いっぱい。
12/11/08 22:55:26.18 cebxTMIE0
七文字完全一致1ターゲット

520: ◆MERIKEN4.k
12/11/09 04:23:43.15 bKYl/cdH0
>>514
結構速度出てますねえ。次にマザボを変える機会があったらAMDのAPUに
しようかな…

521: ◆MERIKEN4.k
12/11/09 04:29:32.75 bKYl/cdH0
アホの子HD 4000ちゃんがあまりにも不憫なのでカーネルをいじって
Intelのドライバでも動くようにしておきました。性能はあいかわらずですが…

522:名無しさん@お腹いっぱい。
12/11/09 04:38:28.96 rgF3r/Bc0
【GPU】HD7970 CFX 2GPUs @1200MHz
【CPU】FX-8350 @5GHz
【OS】Windows7 64bit
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 3
【トリップの種類】12桁
【1CUあたりのワークグループの数】1280
【1WGあたりのワークアイテムの数】24
【その他のオプション】-c -g -t 7 -y 1280 -z 24
【Display Driver】Catalyst 12.10
【10分間の平均速度】1705.24tripcodes/s
【GPUの平均速度】1654.95tripcodes/s
【CPUの平均速度】48.30tripcodes/s
【GPU使用率】92%
【その他】7完1タゲ

どうにか本気を出させることが出来ました
WG数が効いたようです。値を小さくすれば使用率は上がりますが数値が伴わないのでこの辺りがいいところ
7970の2枚挿しの割に低いですがCPUがネックなのでしょうw

523:名無しさん@お腹いっぱい。
12/11/09 04:39:37.32 rgF3r/Bc0
画像貼り忘れ

URLリンク(www.rupan.net)

524: ◆MERIKEN4.k
12/11/09 05:31:55.25 bKYl/cdH0
>>522
う~ん、その構成だと性能的には3000M TPSでてもおかしくないはずなんですけどねえ。
>>492さんの報告( >>501 ) でもそうだったけど、どうもAMDのGPUが
複数あるとちゃんと速度が出ないみたいです。READMEには書かなかったけど、
"-a"というオプションで検索スレッドの数を指定できるので、それを増やして
みるのも手かもしれません。デフォルトは2です。
こういう場合CUDAだと綺麗にスケールしてくれるのですが
AMD APPはなかなかクセがありそうな感じです。

525:名無しさん@お腹いっぱい。
12/11/09 08:13:48.08 nBLHjNmZ0
>>521
アホの子かわいいよアホの子

元よりAMDほどガチGPU目指してないからな気もするが>HD 4000

526: ◆MERIKEN4.k
12/11/09 08:34:48.19 bKYl/cdH0
>>492
>>522
AMDのGPUが複数あると速度が極端に落ちる問題ですが、5770と7970の組み合わせで
こちらでも再現できました。で、調べてみたところ、速度をきちんと出すためには
GPU毎にTripcode Finderを立ち上げる必要があることが分かりました\(^o^)/

AMDのドライバを書いた人が何を考えているのかさっぱりわからないほどの
糞仕様ですが、このままではあまりにダサくて見るに耐えないので、
CUI版をハックしてなんとかすることにします。あんまり綺麗とはいえないですが、
CUI版からOpenCL対応デバイスの数だけ子プロセスを立ち上げればとりあえず
大丈夫でしょう。

527: ◆MERIKEN4.k
12/11/09 08:38:44.85 bKYl/cdH0
>>525
ほんとに必要最低限ですよね。もうちょっと頑張って欲しかったなあ。

528: ◆MERIKEN4.k
12/11/09 15:23:52.89 bKYl/cdH0
CUI版でそれぞれのAMDのGPUのために1つづつ子プロセスを
起動するところまではできました。あとは次のページを参考にして
子プロセスの出力を親プロセスにリダイレクトしてやるだけです。

How to spawn console processes with redirected standard handles
URLリンク(support.microsoft.com)

非常にめんどくさいけど、あともうちょっとです。

529: ◆MERIKEN4.k
12/11/09 19:16:16.16 bKYl/cdH0
うんざりするような書き換え作業が終わって、ちゃんと子プロセスの
標準出力が親プロセスで受け取れるようになりました。あとはこれを
親プロセスで処理してやるだけです。

530:名無しさん@お腹いっぱい。
12/11/09 19:42:43.60 HSgvVNfi0
団子もびっくりだな。

本職さんですねメリケンさん。

531: ◆MERIKEN4.k
12/11/10 05:10:08.05 751Yphs90
>>530
それが本業はプログラミングと全く関係ないんです。

532: ◆MERIKEN4.k
12/11/10 06:09:10.04 751Yphs90
修正もほぼおわり、生成されたトリップと速度などの情報が
CUI版できちんと表示されるようになりました。
定格の5770と7970の組み合わせで1700M TPS以上出ているので
性能的には申し分ありません。あと数箇所修正する箇所が
残ってますけど、まず問題ないでしょう。やれやれです。

533:名無しさん@お腹いっぱい。
12/11/10 10:56:29.80 NYhfme2W0
……ところで、
>5文字未満、もしくは12文字以上のターゲットも無視されます
と書いてあるのは、
「ターゲットは5~11文字まででお願いします」
ということですか(12完は含みませんか)?

534: ◆MERIKEN4.k
12/11/10 11:05:13.54 751Yphs90
>>533
ありゃりゃ、説明が間違ってますね。12完でも大丈夫です。

535:名無しさん@お腹いっぱい。
12/11/10 11:25:15.16 NYhfme2W0
>>534
ですよね。でもありがとうございます

536: ◆MERIKEN4.k
12/11/10 12:01:23.68 751Yphs90
新しい開発版です。

MERIKEN's Tripcode Finder 0.07 Alpha 4
URLリンク(www.meriken2ch.com)

Alpha 3からの変更点は以下になります。

・複数のAMDのGPUで検索すると速度が低下する不具合の修正。
・Intel Processor Graphicsシリーズへの対応。

今度こそ6990や7970 CFXで性能通りの速度が出るはずです。
アホの子HD 4000ちゃんには期待しないでくださいw

537:名無しさん@お腹いっぱい。
12/11/10 12:09:03.87 lftviXDBP
しかしこういうの見ちゃうと、AMDのAPUも十分Intelと戦えるんだよなぁ

GPU部分を活用するのが難しいからなかなか陽の目見ないけど、
メモリ統合とかHSAとかすすんでGPUの演算力をもっと容易に使えるようになったら面白いな

538:名無しさん@お腹いっぱい。
12/11/10 13:02:23.08 NYhfme2W0
>>536
DL→アホの子だけ指定してGPU検索(ゲス顔)→

ト リ ッ プ が 生 成 さ れ な い ?

539: ◆MERIKEN4.k
12/11/10 13:16:56.65 751Yphs90
>>538
たしかになかなか出てこないですねえ。
この間はちゃんと検索できてたのにおかしいな。

540: ◆MERIKEN4.k
12/11/10 13:19:40.72 751Yphs90
あ、出てきた。まあアホの子はとんでもなく遅いので気長に待ってくださいw

541:名無しさん@お腹いっぱい。
12/11/10 13:25:37.29 ZBbfmQXZT
低速のテスト用に4文字検索もOKにすればいいのに

542:名無しさん@お腹いっぱい。
12/11/10 13:30:40.11 tCg9kOr10
>>536
CUI版でオプションスイッチが効かないような
設定してもデフォルトでの検索になります

543: ◆MERIKEN4.k
12/11/10 13:43:05.04 751Yphs90
>>541
ハッシュ値の計算の関係で5文字以上にしないと検索が遅くなるんです。
正規表現で"^TEST."のように指定してやれば4文字で検索できなくも無いです。

544: ◆MERIKEN4.k
12/11/10 13:47:26.30 751Yphs90
>>542
報告ありがとうございます。たしかにOpenCL対応のGPUが複数あると
オプションが効かないですね。直しておきます。

545: ◆supernova.rT
12/11/10 14:26:44.02 AK5IPrBn0
5870でAlpha 4を試しましたので、ちょい簡単に報告します
>>487を参考に数値を変えましたところ、-y 5120 -z 64 の設定で平均900M強出ました
どうやら先日の報告はGPU使用率が低かったようです

546: ◆MERIKEN4.k
12/11/10 14:37:28.94 751Yphs90
>>542で報告していただいたバグを修正した開発版をうpしました。
複数のGPUを使わない方はダウンロードする必要はありません。

MERIKEN's Tripcode Finder 0.07 Alpha 5
URLリンク(www.meriken2ch.com)

547: ◆MERIKEN4.k
12/11/10 14:48:46.91 751Yphs90
>>545
CUの数が5770の倍なのでちょうどそれぐらいの速度ですよね。
5870のデフォルトの値だけ変えられないか検討してみます。

548: ◆MERIKEN4.k
12/11/10 15:39:17.37 751Yphs90
>>545
CL_DEVICE_NAMEとCL_DEVICE_MAX_COMPUTE_UNITの組み合わせで
型番が特定できることがわかったので、5870のデフォルトの値だけを変えて
おきました。次の開発版で反映されます。

549:ののたん ◆KiwamonoL.
12/11/10 16:48:50.75 Osc/R8BS0 BE:197526252-DIA(289888)
【GPU】Radeon HD 6990
【CPU】i7-2600
【OS】Windows 7 64bit
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 4
【トリップの種類】12桁
【1CUあたりのワークグループの数】2560
【1WGあたりのワークアイテムの数】64
【その他のオプション】なし
【Display Driver】CCC 12.10
【5分間の平均速度】1955.59Mtripcodes/s
【GPUの平均速度】1955.59Mtripcodes/s
【CPUの平均速度】N/A
【GPU使用率】97%前後
【その他】
GPUのみで検索
電力を20%盛って950MHzで計測

Performing a forward-matching search for 1 pattern (1 chunk)
with 7 characters on GPU(s):
OpenCL0: 1034.7M TPS, 2560 work-groups/CU, 64 work-items/WG
OpenCL1: 920.9M TPS, 2560 work-groups/CU, 64 work-items/WG

0.577T tripcodes were generated in 0d 0h 5m 00s at:
1991.28M tripcodes/s (current)
1955.59M tripcodes/s (average)
On average, it takes 25.6 minutes to find one match at this speed.

550: ◆MERIKEN4.k
12/11/10 17:06:17.35 751Yphs90
>>549
あ、ありがとうございます! ちゃんと性能通りの速度が出ているみたいですね。
よかったよかった。

> 【5分間の平均速度】1955.59Mtripcodes/s

しかしこれは1枚のグラボの数字には見えないですねw 素晴らしいです。

551:名無しさん@お腹いっぱい。
12/11/10 17:37:48.81 NYhfme2W0
>>549
>【5分間の平均速度】1955.59Mtripcodes/s
2枚にすればMERIKEN超えだよ!やったね!

552:名無しさん@お腹いっぱい。
12/11/10 18:34:33.46 asBmjW5V0
こんばんわ alpha5 解凍したまんまです
URLリンク(www.dotup.org)
OSとそのドライバの影響でしょうか?うちの環境で40~50%です

553:ののたん ◆KiwamonoL.
12/11/10 19:06:49.70 Osc/R8BS0 BE:355546692-DIA(289888)
>>552
6990 なら、電力を盛らないとホンキださないぜ。
6990 使いなら常識だぜ。w

【重要:盛って壊れても俺は責任持たないからな。】

554:名無しさん@お腹いっぱい。
12/11/10 19:07:57.03 asBmjW5V0
>>553
盛っても変わらなかったからデフォでやったw

555:名無しさん@お腹いっぱい。
12/11/10 19:16:08.42 pOMmt27e0
壊れてナンボがデフォ。

556: ◆MERIKEN4.k
12/11/10 19:17:25.07 751Yphs90
>>552
これは実にもったいない… ぶっちゃけAMDのOpenCLの実装がちゃんと
複数のGPUを生かしきれてないのが問題なんですけどねえ。
同じ設定でTripcode Finderを2つ同時に動かしたらどうなるか、
試してみていただけませんか?

557:名無しさん@お腹いっぱい。
12/11/10 19:33:15.40 asBmjW5V0
GPUのみの並列実行しても使用率に変化はありません
CPU&GPU GPUの並列実行も同じです

558: ◆MERIKEN4.k
12/11/10 19:40:37.23 751Yphs90
>>557
あとはワークグループの数を5120とか10240にしてみるぐらいしか
思いつかないですねえ。スレッドの数を変えてみるといいのかもしれないんですけど、
このオプション、Alpha 5ではちゃんと動いてませんでした… 次の開発版で
直しておきます。

559:名無しさん@お腹いっぱい。
12/11/10 19:49:37.93 NYhfme2W0
>>552のように、ラデ使いのSSに写ってるカッコイイ画面>>432
ってグラボ標準のユーティリティなん?
高いGPUなんて買ったことないからよく分かんない……
使用率見るのにGPU-Zより分かりやすいのはいいけど

ところでこの壁紙って誰のですか?

560:名無しさん@お腹いっぱい。
12/11/10 19:50:17.66 NYhfme2W0
なんで>>432って付いてるの↑……
無視してください

561:名無しさん@お腹いっぱい。
12/11/10 20:09:58.65 asBmjW5V0
URLリンク(www.dotup.org)
いろいろやった結果 CU=2560 WG=32 のみ固定し行けました
6990はクーラントブッカケしたものなんでたまにマザーが見失ったりするんでそのせいかもしれません

ツールはMSIのサイトから落とせますよ
壁紙は台湾MSから 日本MSのちっぱいには興味ありません

562:名無しさん@お腹いっぱい。
12/11/10 20:59:00.78 NYhfme2W0
>>561
ウチMSIには縁がないもので……
↓壁紙はいただきました。冷静に考えるとM$キャラでちっぱいは少ないような……
URLリンク(www.microsoft.com)

563:名無しさん@お腹いっぱい。
12/11/10 21:47:13.33 asBmjW5V0
>>562
無料ツールだろw
MSI行って落とせよ

564:名無しさん@お腹いっぱい。
12/11/10 21:51:37.91 EjblPgPX0
^0123456789$のように$で終わらせた検索条件を含む
10桁トリップと12桁トリップの複合検索は
トリップの種類12桁
でもできますか?

565:名無しさん@お腹いっぱい。
12/11/10 22:48:53.43 tCg9kOr10
>>562
どこのメーカーのものでも使えますよ

URLリンク(event.msi.com)

566: ◆MERIKEN4.k
12/11/11 02:08:24.80 jethYJ0v0
>>564
おっしゃっていることがさっぱりわからないんですが…
Tripcode Finderで10桁トリップと12桁トリップを同時に
検索することはできません。

567:名無しさん@お腹いっぱい。
12/11/11 02:30:34.47 shOUqygm0
>>565
thx!インストールしてみる→

---------------------------
MSI Afterburner
---------------------------
一部の MSI アフターバーナーのコンポーネントが期限切れ、紛失、または壊れています。
---------------------------
OK
---------------------------
起動しないよorz
ノートじゃ駄目か……

568: ◆MERIKEN4.k
12/11/11 03:27:58.86 jethYJ0v0
>>561
う~ん、まだまだ力を出し切れていない感じですねえ。
自分でも試してみたいけど、さすがにこれ以上はグラボは買えません。無念なり…

569:名無しさん@お腹いっぱい。
12/11/11 10:55:22.93 VopdUwvA0
【GPU】SAPPHIRE VAPOR-X HD5770 1G (OC: GPU 960MHz MEM 1265MHz)
【CPU】Intel Core i7-3770(無印)
【OS】Microsoft Windows 7 64bit SP1
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 5
【トリップの種類】12桁
【1CUあたりのワークグループの数】3200
【1WGあたりのワークアイテムの数】64
【その他のオプション】
【Display Driver】Catalyst 12.10
【10分間の平均速度】498.00M tripcodes/s
【GPUの平均速度】463.44M tripcodes/s
【CPUの平均速度】34.56M tripcodes/s
【GPU使用率】99%
【GPUの温度】64℃ (室温20℃)
【その他】テスト時間10分33秒、7完1タゲ

Intel HD4000 にセカンドディスプレイを接続して使用していますが、Intel
社の OpenCL ドライバはインストールしていないので HD5770 だけでのテスト
となりました。

570: ◆MERIKEN4.k
12/11/11 12:58:41.29 jethYJ0v0
>>561
あの後ちょっと調べてみたんですけど、ひょっとしてCrossFireXが有効になってませんか?
Catalyst Control CenterでCFXを切れば、デフォルトの設定でうまくいくかもしれません。

571:名無しさん@お腹いっぱい。
12/11/11 13:02:30.40 6A5ebb7J0
>>570
切ってみます

572: ◆MERIKEN4.k
12/11/11 13:07:04.34 jethYJ0v0
>>569
詳しい報告、ありがとうございます。ワークグループの数は2560より3200のほうが
いいのかな。うちの5770でもうちょっと詳しく調べてみます。

573:名無しさん@お腹いっぱい。
12/11/11 13:10:54.23 6A5ebb7J0
切れてた… 2560/64は2560/32より遅かった模様

574: ◆MERIKEN4.k
12/11/11 13:21:12.44 jethYJ0v0
>>573
う~ん、何で6990 CFXだけなかなか速度が出ないんでしょうねえ。
ほかのOpenCLアプリケーションでは6990 CFXでもちゃんと性能が出るという報告が
あったので、なにかしら方法はあると思うんですが… もうちょっと調べてみます。

Bitcoin Mining GPU Performance Comparison
URLリンク(www.hardocp.com)

575:名無しさん@お腹いっぱい。
12/11/11 13:41:23.09 shOUqygm0
>>569
>Intel社の OpenCL ドライバ
そんなのがあったのか……と思ってググってみたが、SDKのことか?
→インストールしたら、アホの子でOpenCL検索使えた!
(ただし4M/sぐらいだけど)
サンクス!


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch