【トリップ検索】Meriken's Tripcode Finder@sc 2at SOFTWARE
【トリップ検索】Meriken's Tripcode Finder@sc 2 - 暇つぶし2ch400:3D梨 ◆n...N.....
15/06/20 00:19:24.41 X2wlkcHEZ
サブPC死亡のため検索を中断しております
すみません

401:3D梨 ◆n...N.....
15/06/20 00:20:20.26 X2wlkcHEZ
テスト期間中のため、返信は不可能です

402:◆Meriken.Z.
15/06/20 03:07:33.66 QY2BMSzV1
>>384
まあそうするのが一番無難なんでしょうけどね。
以前の2chなら「過去ログ嫁」で済んでた話なのに
なんだかなあという感じです。

403:◆Meriken.Z.
15/06/20 03:13:16.53 QY2BMSzV1
>>385
鳥屋さん、滅茶苦茶頭の良い人ですよ。
次の純10連は私がもらってもいいかなw

404:◆Meriken.Z.
15/06/20 03:14:30.09 QY2BMSzV1
>>388
ご愁傷様です。出来るときに無理せずに検索してくださいね。

405:◆Meriken.Z.
2015/06/


406:20(土) 03:18:03.74 ID:QY2BMSzV1



407:◆gZZZZZZZZg
15/06/20 07:43:00.91 eKBJwFF6x
>>391
>>393
当然もらっちゃってしまってもいいでしょうw
鳥屋ブログ?でしたっけ、当時見てましたけど、凄いなぁと思ってました。

このトリップはMeriken's Tripcode Finderで出ましたよ。

408:名無しさん@お腹いっぱい。
15/06/20 10:21:15.95 OFFrSSjlL
絶対に非を認めない頑固な性格っ

409:名無しさん@お腹いっぱい。
15/06/20 10:32:47.02 MYjcgHm0X
了解もなく裏でこっそり検索して
データをかすめ取るソフト

410:◆Meriken.Z.
15/06/20 10:43:27.74 Wa9PbKb3x
>>394
ああそうか、正規表現を使ったんですね。なるほどなるほど。

411:◆Meriken.Z.
15/06/20 10:46:36.49 Wa9PbKb3x
個人的には10桁純10連は全部みてみたいので
なんとかMTFを生キーに対応させたいんですけどね~

412:名無しさん@お腹いっぱい。
15/06/20 14:15:51.49 Udul8gqbi
>了解もなく裏でこっそり検索して
ここまでくると、もう日本語を理解してないとしか言い様が無いですね(笑

413:名無しさん@お腹いっぱい。
15/06/20 14:17:34.65 6raMmwVf2
広大すぎで12桁はあきらめたのか

414:名無しさん@お腹いっぱい。
15/06/20 17:26:03.60 l2SwIOqH9
書いてない日本語を理解するのは
信者じゃないから難しいな

415:◆MOYASHI/Go
15/06/20 20:37:37.46 B77g5pg9F
>>381
消費電力を考えると風呂のお湯等も沸かせそうな感じなんだけど、
へたな事をすると排熱の妨げになるというもどかしさ。
CPU等の熱で料理(主に目玉焼き)を作るってネタは結構昔から有りますねw

>>391
個人的にはおkだと思います。
というか、普通にオークションをやったとしてもMerikenさんが競り勝てそうな気がw

416:◆MOYASHI/Go
15/06/20 20:45:56.96 B77g5pg9F
>>393
鏡いいですよね~。少し前に、ふと12桁トリップの鏡を見付けたいと思って
12桁トリップを検索したんですが、中々難易度高めな様で短時間では
見付からなかった記憶が…って書いてたら、また12桁の鏡探したくなって来たw

417:名無しさん@お腹いっぱい。
15/06/20 21:35:25.87 kFblaPPml
鏡は現状CPU検索のみ対応だし
二構ほどではないにしても鏡をターゲットに指定すると検索速度が下がっちゃうので
12桁の鏡はそんなに簡単には出ないと思う

418:◆MOYASHI/Go
15/06/20 23:45:56.94 B77g5pg9F
やはり難易度高めですよね。

鏡は、パッと見で美しかったり面白かったりする上に、そこそこなレアさ加減も有って
魅入られてしまう要素たっぷりに見えるw

419:名無しさん@お腹いっぱい。
15/06/21 00:40:19.72 ymMPqtkJA
>>405
よろしければどうぞ
URLリンク(tripcode.net)

420:◆oO8WowwoW8Oo
15/06/21 17:12:28.62 rFO1rB9Xi
12桁の鏡は、確かに殆ど出ませんよね・・・
私もこの程度しか見つけてないです。

421:◆qYvMTdbTMvYp
15/06/21 18:13:20.83 GELzRaSCN
>>406
頂きました。
貴重なトリップを二つもありがとうございます。

422:◆8VMIxxxxIMV8
15/06/21 18:22:50.13 GELzRaSCN
>>407
やっぱり鏡の世界はいいものですね。
ただ、10桁だと結構簡単に見付かるけど、12桁だとかなり難しいみたいですね。

423:混沌 ◆YvAqloolpAvY
15/06/22 01:00:04.22 fi79oSQ+t
ゆっくり検索を続けながら、少しずつ増やしてはいますが
鏡が出るの自体稀で、綺麗な鏡となるとめったに出ないんですよね

424:◆u2u2u2u2u2
15/06/22 17:12:17.74 p2We50FO5
確かに、10 桁鏡はウヂ�


425:ャEヂャ出ますね。駄菓子かし、私は二構も結構好きです。



426:名無しさん@お腹いっぱい。
15/06/22 20:09:38.36 JkaIvF3L5
12桁の二構は無理ゲー

427:◆MOYASHI/Go
15/06/24 00:37:49.58 8wEf3vzHF
二構は、その美しさと共に処理の重さに驚いたw

>>410
やはり地道に検索して、のんびりと果報を待つのが良さそうですね。

428:◆gZZZZZZZZg
15/06/24 22:54:16.22 k3X1KmRvN
>>393
これはMeriken's Tripcode Finderで出ましたよ。
特殊パターンの設定にそのままチェック入れただけで拾ってくれてました。

429:名無しさん@お腹いっぱい。
15/06/25 01:38:21.17 +gxE7yu3t
そう言われると、自分は 12 桁の二構ってまだ一個も持ってない・・・

430:◇0000000001
15/06/26 10:50:08.92 4EauiCIjC
糞トリップの品評会じゃん

431:◆Meriken.Z.
15/06/27 00:17:51.50 R97b0FI3D
昨日ようやく検索君1号をばらして新しいアパートに運びました。
思ってたよりずっとデカイです。とりあえず居間に置くことにしましたが、
絶対に奥さんから文句が出るだろうな、これ…

432:名無しさん@お腹いっぱい。
15/06/27 00:43:40.20 ttRLasu3Q
ユグ計画の頓挫の可能性
まあ趣味的にやってただけだししゃーないね

433:◆Meriken.Z.
15/06/27 00:55:51.32 R97b0FI3D
>>418
置き場所はWifiにしてやればどうとでもなるので大丈夫です。
問題なのは電気代なんですけど、今後はワットパフォーマンス重視で
運用していく予定です。

434:名無しさん@お腹いっぱい。
15/06/27 01:08:11.83 8Je55B/+/
これはもうR9 Nanoが出たら総入れ替えするしかありませんねw

435:◆Meriken.Z.
15/06/27 01:08:45.53 R97b0FI3D
とりあえず電気バカ食いの7990をFury Xに
置き換えたいんだけどどうかな~
1枚買って開発君に入れてみようかな。

436:◆Meriken.Z.
15/06/27 01:13:55.71 R97b0FI3D
>>420
Nanoも気になりますね~ でも2枚以上使うなら
Fury Xのほうがいいような…
1枚だけで使うなら効率はかなりいいでしょうね。
誰か試してみないかな~

437:累計 ◆wop.8OO8.qow
15/06/27 11:52:37.00 WIQ7ZemyT
検索君をダンボール製の暖炉の中に入れたらインテリアになります。
URLリンク(i.imgur.com)

438:名無しさん@お腹いっぱい。
15/06/27 17:56:58.36 Bdq03C8AS
あめりかの電気代っどんな感じなんだろ

439:名無しさん@お腹いっぱい。
15/06/27 18:06:30.45 QNs/O2hxc
日本の半分以下なので
今の状態だと月3千円以下と思われる

440:◆Meriken.Z.
15/06/27 18:34:27.05 R97b0FI3D
1100Wでつけっぱなしにして月に95ドルだそうなので
意外にこれはなんとかなるかも…

441:◆Meriken.Z.
15/06/27 18:40:48.99 R97b0FI3D
あ、カリフォルニアはもうちょっと高いのか。
でも1100Wで月$120なので普通に続けられるような…

442:名無しさん@お腹いっぱい。
15/06/27 19:00:18.56 pBBJko+RN
思うに金額のことより無駄かどうか
きっと嫁思ってるのはソッチ

443:◆MOYASHI/Go
15/06/27 23:02:11.36 kMkHKRhx0
趣味・嗜好性の高い物を理解して貰うのって、かなり大変そうだ。

>>417
本格水冷PC一式が居間に有る状態ってなんか凄そうw

444:名無しさん@お腹いっぱい。
15/06/27 23:04:09.66 higzV8A/v
24H稼働で留守中に火災発生
なんてこあるかも

445:名無しさん@お腹いっぱい。
15/06/27 23:17:46.92 AJ8i2yhM3
家計に負担かけるってことなら、ビットコイン掘ってたほうがいいんじゃね

446:名無しさん@お腹いっぱい。
15/06/28 01:47:26.65 0no+L1mYz
お小遣いが月$120 減らされそう・・・

447:名無しさん@お腹いっぱい。
15/06/28 07:41:00.45 qOaEKyMyp
単体19GTPSオーバーとかJohnDoe ◆G


448:PGPU////xORさんマジパネェっすhttp://i.imgur.com/zylfMPK.png名前にNVIDIAって書いてあるからTitanX*4とか?



449:名無しさん@お腹いっぱい。
15/06/28 08:30:20.18 qOaEKyMyp
単体20GTPSオーバーキタ━━(゚∀゚)━━ッ!!
URLリンク(i.imgur.com)

450:名無しさん@お腹いっぱい。
15/06/28 08:51:07.86 JWP1dKbsW
ここ見てる人なのかなー

451:名無しさん@お腹いっぱい。
15/06/28 11:12:10.53 GOj9AhyPH
凄い
何十万ぐらいかな

452:名無しさん@お腹いっぱい。
15/06/28 11:26:41.58 JWP1dKbsW
いま気付いたがフリーエディションで20Gオーバーなのか
金も相当かかってんだろうなぁ

453:名無しさん@お腹いっぱい。
15/06/28 11:35:16.63 qOaEKyMyp
もう12桁のレベルが5→6に上がってるwwwww
URLリンク(i.imgur.com)

454:◆MOYASHI/Go
15/06/28 16:30:06.48 PhJjaV71Z
画像一枚毎に一ずつレベルが上がってるw

455:◆Meriken.Z.
15/06/28 18:43:05.97 sU1hz290t
JohnDoeさん、素晴らしい!! Titan X 4枚差しかな?
私もFury Xを4枚差してみたいもんです…

456:名無しさん@お腹いっぱい。
15/06/28 18:45:11.72 Ud2f9P0AN
10桁もやってほしい

457:名無しさん@お腹いっぱい。
15/06/28 18:47:10.13 18ArWdhXa
たいたんXを4枚だと最低でも60万ぐらいか
恐ろしす

458:◆Meriken.Z.
15/06/28 19:51:57.60 sU1hz290t
>>441
共有メモリのサイズの制限があるので、10桁だと多分
1枚で50M TPSぐらいしか出ないと思われます。
しかし12桁は綺麗にスケールしてますね~

459:◆Meriken.Z.
15/06/28 19:59:21.97 sU1hz290t
検索君の引っ越しは無事に終わったみたいです。
先ほど再稼働させて、元気に動いています。
心配していた移動時の破損もありませんでした。
よかったよかった。

460:◆Meriken.Z.
15/06/28 20:18:48.76 sU1hz290t
あ、JohnDoeさんが10桁のテストしてるw
結構速度が出てますね~
今のところ1枚あたり90M TPSぐらいかな?
テスト用にTitan Xが欲しくなってきた…

461:名無しさん@お腹いっぱい。
15/06/28 21:14:18.87 T1xz40X8B
100万ぐらい?

462:名無しさん@お腹いっぱい。
15/06/29 15:59:20.22 4lM9/94+Z
Fury速いのかな

463:名無しさん@お腹いっぱい。
15/06/29 19:52:44.90 gaUlQtJeT
1SPあたりの効率はこれまでのGCNと変わってなさそうだし
HBMの広帯域はMTFには効果ないと思うんで
4096SPのFuryX一枚でHD7970や280Xの倍クラス、デュアルGPUのHD7990と同レベルと思う
12桁で5GTPS前後、10桁で250MTPS前後ってとこ?

464:◆Meriken.Z.
15/06/30 01:48:56.21 UjzEgQ9Gy
あ、そうか。Titan XはBoost Clockが1241 MHzなのか。
道理で10桁トリップ検索もそれなりに速くなるわけだ。
開発に使った580のCore Clockが772 MHzだから
クロック周波数だけでも1.6倍だもんな~
でもMTFがBitslice DESで使う共有メモリの量は変わらないから
そこまで速くならないんだよな。

465:◆Meriken.Z.
15/06/30 01:54:15.04 UjzEgQ9Gy
>>448
ワットパフォーマンスが気になりますけど、製造プロセスも
7990と同じ28nmみたいだし、それほど変わらないかも
しれないですね。

466:◆Meriken.Z.
15/06/30 01:59:17.93 UjzEgQ9Gy
>>448
HBMの広帯域を活かせるように実装を変更するのもありだと
思います。レジスタに簡単に乗っかるSHA-1はともかく、
Bitslice DESはレジスタ数の縛りがかなり厳しいですからね。

467:◆Meriken.Z.
15/06/30 02:42:51.40 UjzEgQ9Gy
ストレステストで平均348Wか~ 7990が569Wだから
だいぶ効率がいいですね。

AMD Radeon R9 Fury X 4GB Review
URLリンク(www.tomshardware.com)

Radeon HD 7990 And GeForce GTX 690: Bring Out T


468:he Big Gunshttp://www.tomshardware.com/reviews/radeon-hd-7990-devil13-7970-x2,3329-12.html



469:名無しさん@お腹いっぱい。
15/06/30 12:26:52.46 wYhA2tDeW
JohnDoeさん10桁でも669Mとかスゲー

470:名無しさん@お腹いっぱい。
15/07/02 12:40:56.32 jzroofJWX
今日は"NVIDIA power saving mode (800W)"で12GTPSオーバーっすか
100Wあたり約1.6GTPS!

・・・なんかJohnDoeさんのオチスレみたいにしちゃっててゴメンw

471:◆Meriken.Z.
15/07/03 10:31:39.19 yywpP8DpE
まったく問題ないですw
10桁でもかなり速度がでてるのは意外ですね。
もうちょっとMTFを改良したいところですね?

472:◆Meriken.Z.
15/07/03 10:39:06.40 yywpP8DpE
今Asm4GCNでいろいろ実験中です。
C#とリンクできるのでわりとすんなりと
MTFに取り込めそうです。大分高速化
できそうだけどどうなるかな?

473:名無しさん@お腹いっぱい。
15/07/03 20:02:14.25 3YjEVOGs4
ほうほう
いろいろやってますな

474:◆Meriken.Z.
15/07/04 07:03:47.72 XaSO4VdQo
ははあ、JohnDoeさんは検索エンジンを自分でいじってるのか。
道理で速度が出てるわけだ。

475:◆Meriken.Z.
15/07/04 07:11:16.84 XaSO4VdQo
しかしすごい速度だなあ。GCN版MTFを頑張ろうっと。

476:◆Meriken.Z.
15/07/04 14:37:32.73 XaSO4VdQo
なるほどなるほど… これ580でもはやくなるのかしら。 

URLリンク(github.com)

477:名無しさん@お腹いっぱい。
15/07/04 15:36:12.13 upfy49pWf
JohnDoeさんついに10桁800MTPSオーバーまで逝って検索君とタメ張ってるしwww
自前でMTEを修正して使うとか凄杉wwwww

478:名無しさん@お腹いっぱい。
15/07/04 18:47:17.24 8V4leVuvn
もしかしたらハッカーレベルの人とか

479:◆Meriken.Z.
15/07/05 11:17:38.58 afpxztKuS
なんせ今までMTEのコードの改造の報告は1回しか
なかったですからね。あのコードは普通の人は
いじれませんw AVX2でS-Boxを書きなおしてくれた人も
凄かったけど、JoneDoeさんも相当詳しそうですね。

480:◆Meriken.Z.
15/07/05 11:35:07.85 afpxztKuS
GCNアセンブラで10桁トリップ検索のルーチンを書き直すために、
まず普通のCで書かれた10桁トリップ作成のルーチンを用意しました。
これをGCNアセンブラで少しずつ書きなおしていくことにします。
JohnDoeさんが色々面白いことをやってたのでぜひ取り込んでみたいですね。

481:名無しさん@お腹いっぱい。
15/07/05 14:52:44.23 2o6f+ZITS
10桁1167Mって・・・ ( Д )  ゚  ゚

482:名無しさん@お腹いっぱい。
15/07/05 14:57:05.91 2o6f+ZITS
1241M (。∀ ゚)

483:◆Meriken.Z.
15/07/05 15:04:25.52 afpxztKuS
う~ん、これは凄いことになってきたw
是非自分でテストしてみたいんだけど、Titan X高いからなあ…

484:名無しさん@お腹いっぱい。
15/07/05 15:21:05.12 2o6f+ZITS
何となくこれを思い出した
URLリンク(livedoor.blogimg.jp)

485:◆QZaw55cn4c
15/07/05 16:53:56.45 Go8vMJEMr
10桁で一時復活しました‥

486:◆Meriken.Z.
15/07/05 17:01:12.25 afpxztKuS
>>469
お久しぶりで~す。実に懐かしいw

487:◆Meriken.Z.
15/07/05 17:02:12.48 afpxztKuS
JohnDoeさんの削除したコード、どこで紛れ込んだんだろう…
直して頂いて助かりました。これひょっとしたら580でも
100M TPS出るかもしれないですね~
ソースコード公開から2年経ってこんなことが起きるとはw

488:◆Meriken.Z.
15/07/05 17:21:20.12 afpxztKuS
あ、そうか、ソースコードは最初から付けてたから3年前ぐらいかな。
しかし酷いバグが残ってるもんだなあ。
発見記念にTitan Xを買


489:おうかしらんw



490:名無しさん@お腹いっぱい。
15/07/05 17:45:17.68 ru1Knc9ks
これはすごいねぇ
名無しの権兵衛さんはプロかな?

491:名無しさん@お腹いっぱい。
15/07/05 18:45:00.90 anhNTM8C6
>>472
嫁さんに怒られるでw

492:名無しさん@お腹いっぱい。
15/07/05 20:50:43.22 6Xozwm0Bb
    嫁
<●><●>

493:名無しさん@お腹いっぱい。
15/07/06 00:36:52.01 +Jwp37B3X
Yggdrasilにログインして"各種情報 > 検索中のPCの一覧"からJohnDoeさんのPCの情報を表示すると

GPU0: Gigabyte GeForce GTX Titan X
GPU1: Gigabyte GeForce GTX 980 Ti
GPU2: Gigabyte GeForce GTX 980 Ti
GPU3: Gigabyte GeForce GTX 980 Ti
CPU: Intel Core i7-5930K @ 4.10 GHz
OS: Microsoft Windows 8.1 Pro
ディスプレイドライバ: GeForce 353.38
その他: Deep learning machine with 64GiB DDR4 RAM

とコメントを書かれていらっしゃるみたいですね

494:◆Meriken.Z.
15/07/06 01:26:21.10 XoFAbZwdk
Titan Xのコア数が3072個なのに対して980 Tiは2816個なので
トリップ検索的にはほとんど変わらないようですね。
Titan Xが高いのはVRAMが倍だからだけど、
私は最近はPCでゲームはしてないので関係ないし…
980 Tiはかなりお買い得だなあ。

495:◆Meriken.Z.
15/07/06 02:42:15.00 XoFAbZwdk
Asm4GCNは引数の設定でつまづいているところです。
ダミーのカーネルをコンパイラにかけて出力をみたほうが早いかな。

496:◆gZZZZZZZZg
15/07/06 06:25:17.71 jxayJbfCY
このスレに降臨して欲しいですね。

497:◆Meriken.Z.
15/07/06 16:14:15.90 XoFAbZwdk
試してみて気がついたんですけど、OpenCLコンパイラが
出力したディスアセンブリ(*.isa)を直接Asm4GCNで
アセンブルできるみたいですね。素晴らしい。

これが出来るなら直接MTFのOpenCLカーネルの
ディスアセンブリを直接いじったほうがずっと楽だよなあ。
思ってたよりずっと楽かもしれないぞ。

498:◆Meriken.Z.
15/07/06 16:34:29.38 XoFAbZwdk
> NumVgprs = 227;
> NumSgprs = 46;

相変わらずひどい数字だなあ。occupancyが上がらないわけだ。
これ上手くやれば速度を倍以上できるかも。

499:◆Meriken.Z.
15/07/06 16:36:33.84 XoFAbZwdk
カーネルをキャッシュに乗っけてレジスタの数を削るだけで
ぜんぜん違うだろうな、これ。

500:◆Meriken.Z.
15/07/07 08:26:23.68 KvHu1PNjU
うーん、やっぱり難しい! 一番のボトルネックになっているのは
keySchedule[]の参照で、これまではループを展開して
この問題を解決してたけど、この方法だとコードが
キャッシュに乗らないんだよなあ。keySchedule[]の動的生成は
コストがかかり過ぎて上手くいかなかったし、どうしたものか…

501:◆Meriken.Z.
15/07/07 13:21:19.15 KvHu1PNjU
JtRのKS生成のルーチンはこんな感じだけど、
何とかもっと単純に出来ないものか…

s = 0;
for (round = 0; round < 16; round++) {
s += DES_ROT[round];
for (index = 0; index < 48; index++) {
p = DES_PC2[index];
q = p < 28 ? 0 : 28;
p += s;
while (p >= 28) p -= 28;
bit = DES_PC1[p + q];
bit ^= 070;
bit -= bit >> 3;
bit = 55 - bit;
if (LM) bit = DES_LM_KP[bit];
*k++ = &DES_bs_all.K[bit] START;
}
}

502:◆YSRKEN.ceVZZ
15/07/07 20:37:26.26 U/JTsIy7s
素人考えで申し訳ありませんが、このsとかpとかqとかってSIMD化できない感じなんですか?
後、「if (LM)~」はループ外に弾きだして、qの初�


503:匀サは別の配列にして(DES_PC3みたいな配列を事前作成)、whileループで回る回数を減らせるなら減らして……言葉じゃ伝わりづらいのでソースで後で書きます!(「*k++~」の行の意味がよく分からないのが悔しい……)s = 0;for (round = 0; round < 16; round++) {  s += DES_ROT[round];  for (index = 0; index < 48; index++) {    p = DES_PC2[index];    q = p < 28 ? 0 : 28;    p += s;    while (p >= 28) p -= 28;    bit = DES_PC1[p + q];    bit ^= 070;    bit -= bit >> 3;    bit = 55 - bit;    if (LM) bit = DES_LM_KP[bit];    *k++ = &DES_bs_all.K[bit] START;  }}



504:◆Meriken.Z.
15/07/07 22:23:41.31 KvHu1PNjU
>>485
お、元気にしてましたか? これはGPGPUの話で、
__constantメモリ空間にあるkeySchedule[]にアクセスすると
遅くなるので、なんとかレジスタだけを使って
on the flyでkeySchedule[]の値を生成できないかという
ことなんです。だから単純に並列化は出来ないんです。

505:◆Meriken.Z.
15/07/07 22:26:10.29 KvHu1PNjU
まあくわしくはMTEとJtRのソースコードを見てください。

506:◆YSRKEN.ceVZZ
15/07/07 22:41:11.16 U/JTsIy7s
>>487
掲載箇所ってOpenCL10.clの方ですか?
OpenCL10.clにはkeySchedule[0x300]が__constantにベタ書きされていますが
それをあえて毎回生成したいってことですよね?

507:◆Meriken.Z.
15/07/07 22:48:43.41 KvHu1PNjU
>>488
S-Boxを呼び出すときに必要に応じて必要な値だけを生成したいわけです。
まあでもコストが掛かりすぎるから無理でしょうね~

508:◆Meriken.Z.
15/07/07 22:56:02.99 KvHu1PNjU
あと残ってる高速化の方法はカーネルのGCNアセンブラでの
書きなおしぐらいだけど、ループを展開しないといけないとなると
作るのがかなりしんどそうだな~

性能を考えたら980 Tiを買ってCUDAに戻るべきなんだろうけど、
JohnDoeさんが超いい仕事をしたのでやることが何も
残ってないというw

509:◆Meriken.Z.
15/07/07 23:08:22.25 KvHu1PNjU
まあでもAMDのOpenCLコンパイラはS-Boxを
全部展開しちゃうので、これを展開せずに
命令キャッシュに残るようにすればだいぶ速くなるかも
しれないな。16KBもあればなんとかなるでしょ。

510:名無しさん@お腹いっぱい。
15/07/07 23:24:55.53 ENxYwcD6M
JohnDoeのお仕事でみんなの検索速度も上がるん?

511:名無しさん@お腹いっぱい。
15/07/08 06:37:52.53 sQXUDNABu
バージョンアップ期待

512:◆Meriken.Z.
15/07/09 09:16:16.44 UBRoWJu7Y
Radeon用のOpenCL版も大分高速化できそうなので
いっしょにまとめてバージョンアップします。

513:◆Meriken.Z.
15/07/09 09:41:44.05 UBRoWJu7Y
実は昨日keySchedule[]の問題を解決する
うまい方法を思いついたんですよね。
帰ったら仕上げちゃおうっと。

514:◆Meriken.Z.
15/07/10 06:14:43.05 y0akbXN7/
コンスタントメモリへのアクセスを圧縮して
ループを展開しないでもだいぶ速くなったけど、
測ってみたらループ展開したルーチンよりちょこっと速いぐらいでした。
次はカーネルをなるべく単純化してレジスタを削ってみようっと。

515:名無しさん@お腹いっぱい。
15/07/10 09:08:03.55 K5az3Igjo
がんば

516:名無しさん@お腹いっぱい。
15/07/11 15:34:34.75 6nZpWaCTK
10桁で単体2GTPSオーバーキタ━━(゚∀゚)━━ッ!!
JohnDoeさんインフレ杉wwwww

517:名無しさん@お腹いっぱい。
15/07/11 15:42:29.36 ud/WTN8yX
すげぇなぁ
ソフトのカスタム化の効果なの?

518:名無しさん@お腹いっぱい。
15/07/11 16:53:13.20 6nZpWaCTK
"Pure Register version"なるものを作っちゃったらしいwwwww
URLリンク(github.com)

519:◆Meriken.Z.
15/07/11 17:11:35.04 d+8czqBW0
うーん、素晴らしい…

GTX580だと共有メモリを使わないでレジスタだけだと
全然スピードが出なかったんですよね。
Titan X/980 Tiは完全に別物なんでしょうね~
検証用に980 Tiを買うしかないか!

520:◆Meriken.Z.
15/07/11 17:34:45.34 d+8czqBW0
OpenCL版も関数が強制inlineじゃなきゃもっと速くできるのになあ。
やっぱGCNアセンブラかな。

521:累計 ◆wop.8OO8.qow
15/07/11 21:43:50.42 rClxP6a1l
このまま野放しにして横取りされる悪寒


522:



523:◆Meriken.Z.
15/07/11 23:21:48.08 d+8czqBW0
まあもともとオープンソースというのはそういうものですしね。
JohnDoeさんの成果を私が取り込むのも自由なので
私としては願ったりかなったりです。

524:◆gZZZZZZZZg
15/07/11 23:47:32.54 q8WJdzm0I
ヴァージョンアップ期待っすね~

525:◆Meriken.Z.
15/07/12 02:14:19.82 lasbuJgKn
新しいOpenCL版、古いドライバだと速度が出ませんでしたorz
ここらへんはバイナリを普通に添付できるCUDAのほうが
筋がいいですね。Catalyst 14.12では速くなってるので
良いことにしておきます。

526:名無しさん@お腹いっぱい。
15/07/13 20:08:00.06 VGL2KM4Bh
新生検索君1号X2が速度アップしたのが新OpenCL版の威力ですかね
乙乙

527:◆Meriken.Z.
15/07/14 00:45:58.09 HbOauf6bd
検索君1号もようやく1G超えです。結局キーの配列の半分を動的に
生成して残りを共有メモリに押しこむことで、レジスタ数を大幅に
削ってoccupancyを上げることが出来ました。OpenCLではここらへんが
限界でしょう。後はGCNアセンブラで頑張るしかないですね。

528:◆gZZZZZZZZg
15/07/14 13:39:38.41 IkpKA8ADS
メリケンさんのHP死んでますか?私だけ?繋がらない・・・・

529:名無しさん@お腹いっぱい。
15/07/14 14:37:15.80 fXdFpFgoW
meriken.ygch.netにはつながるけどtripcode.netにはつながらない?

530:名無しさん@お腹いっぱい。
15/07/14 14:40:24.59 Taca5ozSH
tripcode.netは繋がらないですね

531:◆Meriken.Z.
15/07/14 15:02:32.09 HbOauf6bd
もうしばらくしたら復旧するはずなのでしばらくお待ちください。

532:◆Meriken.Z.
15/07/14 15:12:47.82 HbOauf6bd
>>508
> OpenCLではここらへんが限界でしょう。

これを書いてから、ループ展開してからキーの配列を
レジスタから追い出す方法を試していないことに気づきました。
ひょっとしたらひょっとするかもしれないな~

533:名無しさん@お腹いっぱい。
15/07/14 15:28:37.78 Taca5ozSH
なお、500位までにランクインしている日本のスパコン台数は2014年11月の32台から39台へと増加している。

  今回のTOP500全システムの合計性能は363PFLOPSとなり、2014年11月の309PFLOPSから向上している。2014年6月は274PFLOPSだった。しかし、TOP500ではこれまでの傾向からすると性能の上がり幅が鈍化していると言う。

  アクセラレータやコプロセッサを利用したシステムの数は88台で、2014年11月では合計75台だった。その内の52台がNVIDIAのシステムを採用、AMDシステムの採用数は3台、Intel Xeon Phi採用スパコンは33台となっている。

534:名無しさん@お腹いっぱい。
15/07/14 16:47:47.08 fXdFpFgoW
ようやくなおったのかな

URLリンク(tripcode.net)
のグラフで見ると
13:00ちょっと前くらいから16:40くらいまで止まってた感じ?

535:名無しさん@お腹いっぱい。
15/07/14 16:51:04.36 MLvKQRzBN
俺のPCトリップ検索とかツール系向いてなさそう
検索速度遅すぎてイライラする0(:3 )~ _('、3」 ∠ )_

536:名無しさん@お腹いっぱい。
15/07/14 20:19:27.77 rLO87sGjs
>>516
> 検索速度遅すぎてイライラする0(:3 )~ _('、3」 ∠ )_
ちなみにどの位?俺よりは速いと思う。w

537:◆gZZZZZZZZg
15/07/14 22:11:03.90 F/IGATYkz
私も他力本願で申し訳ないですけど・・・・正直自分検索はあまり期待せず。。。

538:名無しさん@お腹いっぱい。
15/07/15 13:25:36.30 LJalR6mSk
>>517
12桁が16.21~6.91M tripcode/s
10桁が10.40~2.32M tripcode/s
0(:3 )~ _('、3」 ∠ )_

539:名無しさん@お腹いっぱい。
15/07/15 14:17:51.38 L4heEM3En
さっき10桁2407Mって
URLリンク(fast-uploader.com)

540:◆I.O./.m.w.
15/07/15 15:52:17.24 LJalR6mSk
0(:3 )~ _('、3」 ∠ )_
検索速度遅すぎてもうイライラしてくる

541:◆Meriken.Z.
15/07/16 00:28:11.10 43buePVb9
OpenCL版もさらに速くなりそうです。
今日は帰ったら仕上げちゃおうっと。

542:◆Meriken.Z.
15/07/16 13:47:13.32 43buePVb9
やった~ 7970 1枚で294M TPS出たぞ!
やっぱりループ展開の効果は抜群だなあ。

543:◆Meriken.Z.
15/07/16 13:52:22.22 43buePVb9
コードは余裕でキャッシュに収まってるけど
レジスタ数はギリギリだなあ。

> codeLenInByte = 31624 bytes;
> NumVgprs = 114;

544:◆Meriken.Z.
15/07/16 17:04:48.29 43buePVb9
検索君1号で新しいルーチンを試したら
1938M TPS出たけど、消費電力は1574Wでしたorz
電源の容量が1200Wなので全然間に合っていません。
クロックを落とさないと24時間稼働は無理だこれ…

545:名無しさん@お腹いっぱい。
15/07/16 19:58:21.42 fen4UUjRy
また燃えそうな

546:◆gZZZZZZZZg
15/07/16 23:58:18.90 OoKydxFcg
JohnDoe氏・・・・一人で2百億ですけど。。。

547:◆Meriken.Z.
15/07/17 00:20:48.00 x6FZAwJju
電圧とクロックを抑えたら1200Wで1800M TPS出ました。
これならまあ何とか許容範囲内かな。

548:◆Meriken.Z.
15/07/17 00:24:05.57 x6FZAwJju
>>527
前にも時々12桁トリップ検索に参加してましたよ。
速いですよね~

549:◆Meriken.Z.
15/07/17 00:29:08.43 x6FZAwJju
AMDのドライバは検索プロセスを複数走らせないと
カーネルによってはGPU使用率が極端に下がっちゃう
みたいです。検索プロセスを複数動かすルーチンは
削除しちゃったので元に戻さないと…

550:◆Meriken.Z.
15/07/17 00:36:46.88 x6FZAwJju
GitHubには残ってないけどどこにやったかな…

551:名無しさん@お腹いっぱい。
15/07/17 00:43:23.21 a9IkgCcaQ
JohnDoeさんとMerikenさんの超強力ツートップの活躍に期待!

552:◆Meriken.Z.
15/07/17 03:33:49.81 x6FZAwJju
古いプロセス関連のコードを引っ張りだして移植してみましたが、
問題なく動いているようです。ゆぐちゃんに接続して
1700M TPS出ているので上出来でしょう。
ようやくGCNの本来の性能を引き出せてあの待て屋を
追い抜いた感があります。長い道のりだった…

553:名無しさん@お腹いっぱい。
15/07/17 04:23:49.72 q/OWslh08
とうとう鳥屋先輩をこえたか

554:◆Meriken.Z.
15/07/17 06:33:36.87 x6FZAwJju
>>534
GCNでもっと速度が出るのはわかってたので
実にスッキリしましたw Bitslice DESは実に難物だったけど、
ようやく最適化のポイントがつかめた気がします。

555:◆I.O./.m.w.
15/07/18 02:30:17.08 0M1MGtocG
違うPCで試したらサクサクだがノートPC死にそう

556:◆Meriken.Z.
15/07/18 07:33:04.31 DxX6uZTEg
>>536
温度には気をつけてくださいね~
MSI Afterburnerとかで管理するのがいいです。

557:◆Meriken.Z.
15/07/18 07:36:32.88 DxX6uZTEg
JohnDoeさん、また速度が上がってるな~
やっぱ980 Tiを買っておこうっと。

558:◆Meriken.Z.
15/07/18 09:24:06.49 DxX6uZTEg
検索君がなかなか安定しないので、検索エンジンを改良しつつ
ビデオカードの設定を現在調整中。効率良くなりすぎるのも
考えものですね。

559:◆I.O./.m.w.
15/07/18 12:09:35.59 0M1MGtocG
部屋暑くてやばいw

560:3D梨 ◆T.H.U.J.I.
15/07/19 09:49:39.45 t5DmjdKsh
>>313
ご結婚おめでとうございます

前トリップが流失したのでこれからはこちらを使います

561:◆Meriken.Z.
15/07/20 05:14:24.96 hRnEvtQfC
>>541
了解しました~ これからもよろしく。

562:◆Meriken.Z.
15/07/20 08:11:39.36 hRnEvtQfC
OpenCLのモジュールで例外が頻発したので
ドライバをCatalyst 14.12から15.7へ入れ替えたら
それだけで速度が100M TPSほど上がりました。
後はこれで安定して動いてくれたらいうことないんだけどなあ。

563:名無しさん@お腹いっぱい。
15/07/20 14:30:46.38 oxrP6CD5k
12桁も速くなりますか?

564:名無しさん@お腹いっぱい。
15/07/20 14:44:14.59 Je0h56Vln
JohnDoeさん10桁単体2900MTPS突破して3GTPS目前とかもはや人間業じゃねーwwwww

でよく見たらバイナリも公開してくれてるのね
URLリンク(github.com)

MerikensTripcodeEngine64.7z
Size: 18,262,386 bytes SHA-1: e3723ad9e6ba1807df173f5014ae85979c726133

MerikensTripcodeEngine64.exe
Size: 546,571,776 bytes SHA-1: 7123b3137f16086087f99ffa8d2a8e8d0630bddf

"WARNING_LARGE_FILE_WHEN_EXTRACTED"の通り解凍したらめちゃでかいwwwww

Prerequisites.txt
> Nvidia Maxwell cards (sm_50 and above)
> Newest GeForce Driver

これはcudart32_75.dllとcudart64_75.dllをMerikensTripcodeFinder.exeと同じ場所に置いて
上のMerikensTripcodeEngine64.exeでMTF付属のMERIKENsTripcodeEngine64.exeを上書きして使えば
x64Win+Maxwell世代のGeForce+最新ドライバ(353.30以降?)でMTFの10桁GPU検索が大幅スピードアップ!ってことでいいんすかね?

Maxwell世代のGeForce所有者の方々の人柱レポに期待wwwww

565:◆Meriken.Z.
15/07/20 15:29:46.83 hRnEvtQfC
JohnDoeさん、Bitslice DESのS-Boxをいじってるぐらいだから
相当詳しいんでしょうね~

URLリンク(github.com)

lop3.b32は相当おいしい命令みたいですね…

URLリンク(devtalk.nvidia.com)
URLリンク(devtalk.nvidia.com)

566:名無しさん@お腹いっぱい。
15/07/20 15:43:49.72 VWWCo3SHZ
でもこんがり焼けそうwww

567:名無しさん@お腹いっぱい。
15/07/20 18:19:45.49 nmy4Z9sLy
>>545
うちのSTRIX GTX980で試してみた。TiやXじゃなくて申し訳。

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1.2 Free Edition
【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間のGPU検索の平均速度】 465.43M tripcode/s

GPU温度は室温31度で75弱で安定、FANが1600rpm前後。
Power Targetは85%強って所だった。

で、普通どの位かなと、試そうと思ったら、
不正なトリップでエラー、実行出来なかった(苦笑
無印980ですらこれだから、TiやXは言わずもがな。。。

568:名無しさん@お腹いっぱい。
15/07/20 19:18:32.62 Je0h56Vln
>>548
レポ乙乙
すんげー速度出てるしwwwww

569:◆エリーチカニホレタ。ー゙゚リ!
15/07/20 19:22:20.15 fCk6Vg4T1
750Tiでも試そうとしたら、ディスプレイドライバがリセットするばかりで上手くいかない……うごごごご

570:名無しさん@お腹いっぱい。
15/07/20 19:50:28.89 Je0h56Vln
GM200に最適化しすぎてGM107だと実行できなくなってたりしてw

一応CUDA7.5に対応したドライバは352.86から?みたいなんで
353.30しか試してなければ352.86と353.06も試してみては
URLリンク(www.4gamer.net)
URLリンク(www.4gamer.net)

あとはツールでコアクロック下げたりしてみるとか

571:名無しさん@お腹いっぱい。
15/07/20 19:52:27.83 78QWVNS9a
しかしここまで早くなるとはなー

572:名無しさん@お腹いっぱい。
15/07/20 21:46:05.42 Je0h56Vln
さすがJohnDoeさんwwwww
MerikensTripcodeEngine64_sm50.7zとMerikensTripcodeEngine64_sm52.7zに分けてくれてるッwwwww
そこにシビれるwwwww
あこがれるゥwwwww

573:◆エリーチカニホレタ。ー゙゚リ!
15/07/20 22:28:20.64 fCk6Vg4T1
>>551
えっと、一応定格利用で、ドライバは353.30ですね……
>>553
分けてあるのか……あとで試してみよう

574:名無しさん@お腹いっぱい。
15/07/20 22:54:26.65 nmy4Z9sLy
クロック 標準OC+100MHz上げて1429MHzで30分ほど、検索回してみた。
10桁検索 平均で500M tripcode/s越えてワロタw

此でもMAX 76度ですんでるんだから、すげぇ。
7970 リファだと、ドライヤーブン回ってたってた状態なのに。

575:◆Meriken.Z.
15/07/21 00:50:58.32 HmEEJFC8x
しかしMaxwellにここまでの潜在能力があるとは驚きましたね~
手元の290Xで今450M TPSほど出てるので、
295X2が4枚で3600M TPS出せる計算だけど
ワッパを考えたらあんまり現実的じゃないし…
いずれにせよちょっと前までは考えられない数字ですね。

576:◆Meriken.Z.
15/07/21 02:59:01.93 HmEEJFC8x
MaxwellのLOP3.LUT命令はやっぱり効果抜群ですね。
上がJohnDoeさんのS-Box、下がJohn the Ripperのだけど、
ゲートカウントが全然違うもんなあ。

// Bitslice DES S-boxes with LOP3.LUT instructions
// For NVIDIA Maxwell architecture and CUDA 7.5 RC
// by DeepLearningJohnDoe, version 0.1.6, 2015/07/19
//
// Gate counts: 25 24 25 18 25 24 24 23
// Average: 23.5

* Bitslice DES S-boxes making use of a vector conditional select operation
* (e.g., vsel on PowerPC with AltiVec).
*
* Gate counts: 36 33 33 26 35 34 34 32
* Average: 32.875

577:◆Meriken.Z.
15/07/21 03:21:57.09 HmEEJFC8x
JohnDoeさんのネタの元はひょっとしてこれかな?
しかしひどいプレゼンだなあ。"I Suck"って…

Bitslice DES with LOP3.LUT - Steve Thomas
URLリンク(www.irongeek.com)

578:◆Meriken.Z.
15/07/21 03:29:46.53 HmEEJFC8x
ベンチマークの結果が来てますね。
3G TPS超え、おめでとうございます!

URLリンク(github.com)

579:◆Meriken.Z.
15/07/21 04:08:05.83 HmEEJFC8x
相変わらずAMDのOpenCLドライバは不安定ですけど、
MTFはなんとかちゃんと動かすことが出来そうです。
検索中にカーネルを動的にリコンパイルするときに
OpenCLモジュールから戻ってこないのには参りました。

580:◆Meriken.Z.
15/07/21 04:12:37.76 HmEEJFC8x
というわけでOpenCL版を2倍以上高速化した新しいバージョンを
準備中です。名前は"Meriken's Tripcode Generator 2.0.0"にする
つもりです。JohnDoeさんの成果も近いうちに取り込む予定です。
お楽しみに。

581:名無しさん@お腹いっぱい。
15/07/21 06:05:09.59 BAKb6jIaL
2倍・・・!?

582:名無しさん@お腹いっぱい。
15/07/21 06:52:41.61 O4Ne3MYKW
赤い彗星?

583:◆Meriken.Z.
15/07/21 07:06:16.67 HmEEJFC8x
>>562
あ、2倍なのは10桁トリップ検索だけです。念のため。
冷却がしっかりしてればこれぐらい出ます。

7970 300M TPS
290X 450M TPS
7990 600M TPS
Fury X 650M TP (予想)
295X2 900M TPS (予想)

584:◆Meriken.Z.
15/07/21 07:31:06.14 HmEEJFC8x
bitselectを使わないS-Boxのほうが速いってほんまかいな。
ちょっと試してみようっと。

URLリンク(www.openwall.com)

585:◆Meriken.Z.
15/07/21 07:45:01.38 HmEEJFC8x
やっぱりそんなことはなかったorz Alexanderさん…

586:◆I.O./.m.w.
15/07/21 09:24:02.93 ipEw/jNnH
検索速度が遅いから準9連いつ出るのかわからん(´・_・`)

587:◆Meriken.Z.
15/07/21 15:26:47.94 HmEEJFC8x
更に超アグレッシブに最適化して7970で380M TPS、
290Xで530M TPS出るようになりました。
NumVgprsが最悪のケースで127なので本当にギリギリです。
定格の85%でゆぐちゃんに接続して2100M TPSほど出ているので
後は電源さえ何とかすれば2500M TPS出る計算ですけど、
さすがに無理がありますねw

588:◆I.O./.m.w.
15/07/21 22:34:11.77 ipEw/jNnH
検索速度あげる方法とかあればいいんだが・・・(・ω・`)金かかりそう・・・

589:名無しさん@お腹いっぱい。
15/07/21 22:41:19.80 O4Ne3MYKW
まあデスクトップPCに金かけるしかないもんな
後はユグドラシルで検索してもらうぐらいしかないかと

590:名無しさん@お腹いっぱい。
15/07/21 22:53:48.82 2v0SC5Lxj
他力検索最強

591:◆mMmmMmMMM.
15/07/21 23:10:50.37 0iAJnQFgN
純8連+最後の1個も同じ文字だったっていう惜しいのがありました。
秒速4.6Mの私でも10文字トリップの準9連は何個か出てました。
その中でも結構綺麗なものを1つ。

592:◆mMmmMmMMM.
15/07/21 23:13:08.41 0iAJnQFgN
どこで喋っても信じてもらえないし、リアルタイムのときも一人でネタだって言われたけど、
2chやってて一番驚いたのは同じスレでIDが他人と被ったこと。

593:名無しさん@お腹いっぱい。
15/07/21 23:18:42.53 O4Ne3MYKW
>>573
ID被りはたまーにあるよ
モバイル通信だと、さらに被る確率がアップするらしいけど

594:◆mMmmMmMMM.
15/07/21 23:30:34.33 0iAJnQFgN
>>574
あっ、そうなんですか。
モバイルではなかったんですけど、同じ地区の同じプロバイダーとかだったのかな??

595:◆Meriken.Z.
15/07/22 11:01:50.41 j28sd3jVu
>>569
まあお金をかけるといっても最初は1万円ぐらいの
安いビデオカードで十分ですよ。

596:名無しさん@お腹いっぱい。
15/07/22 12:53:01.81 LZBKefAGI
>>575
スレ違いだけど 2chのIDは たしか同じ日だと65536通りしか存在しないらしい
その数以上のIPから書き込まれたらIPが違っても必ずID被ってる二人が板のどっかにいる

597:名無しさん@お腹いっぱい。
15/07/22 13:07:54.82 LZBKefAGI
LOP3ってFPGAのLUTみたいなことができる命令ってのはわかったけど
命令の仕様がCUDAのリファレンスにも書いてなかった

598:◆mMmmMmMMM.
15/07/22 13:08:54.71 RWd52VG80
2^16分しかIDなかったとは知りませんでした。。。
1日100レス程度の自作板で被ったと思ったんだけど、そんな確立でもないんですね。

599:名無しさん@お腹いっぱい。
15/07/22 13:22:34.73 LZBKefAGI
例のJohnDoeさんのコードに真理値表のビット列を2つ指定してる行があるのが謎
あとマクロの引数で出力する変数を指定してると思ったら同じ位置の引数で真理値表を指定してるところもある

まあ自分がCUDAのマクロの仕様知らないからわからないだけかもだけど

600:名無しさん@お腹いっぱい。
15/07/22 13:33:42.20 LZBKefAGI
LOP3.LUT dest, src1, src2, src3, TruthTableByte

なるほど
てかよく考えたら真理値表を真理値表に入力するのは普通に意味あることか

601:◆Meriken.Z.
15/07/22 13:48:53.81 j28sd3jVu
TruthTableByteは"WolframAlpha truth table"に対応しているそうで。

602:◆Meriken.Z.
15/07/22 13:52:45.73 j28sd3jVu
例:
"a ^ ((c ^ a) & b)" -> 10111000 -> 0xB8
"(b & a) ^ ((~b) & c)" -> 11100010 -> 0xE2
"a & ((c ^ a) & b)" -> 01000000 -> 0x40

603:◆Meriken.Z.
15/07/22 14:01:


604:00.40 ID:j28sd3jVu



605:名無しさん@お腹いっぱい。
15/07/22 14:10:51.89 /UoV6M0P3
>>584
ありがとうございます

最初長い16進のデータが真理値表でビット位置ごとに別の真理値表が
使えるのかと思っちゃいました

最後の2桁の16進数が真理値表なんですね

606:◆Meriken.Z.
15/07/22 14:17:48.40 j28sd3jVu
"xA55AA55AF0F5F0F5"とかそういうには全部一時変数のはずです。
長い間触ってないのでPTXの仕様はほとんど忘れちゃいましたけど、
GNU Assembler準拠だったはずです。

607:名無しさん@お腹いっぱい。
15/07/22 14:28:43.88 /UoV6M0P3
>>586
たしかに命令の機械語に64ビット定数を2個も含めるのは無理ですよね
コードに書かなくても前の方に定数セットしてくれる命令が勝手に入るってことですね

608:◆Meriken.Z.
15/07/22 14:35:31.36 j28sd3jVu
定数じゃなくてレジスタにリネームされているはずです。
自動生成されたS-Boxの一時変数はこんな感じの名前がついています。

609:名無しさん@お腹いっぱい。
15/07/22 14:51:27.94 /UoV6M0P3
>>588
よく見たら0xで始まる定数じやないことに今気がつきました

別のところで宣言されてる普通の変数ですね
すいませんでした

610:◆YU8WTTW8UY
15/07/22 18:22:08.32 1QJTB87Lj
>>576
1万円かぁ(・ω・`)意外と高い

611:◆エリーチカニホレタ。ー゙゚リ!
15/07/22 18:53:37.46 FNRdLAXgb
>>590
コスパいいだけマシやん(遠い目)

612:名無しさん@お腹いっぱい。
15/07/22 19:03:15.56 Kbr/UgMBO
まあ学生とかだと高いよね

613:◆エリーチカニホレタ。ー゙゚リ!
15/07/22 19:07:39.49 FNRdLAXgb
JohnDoe版(sm50)は動いたので報告。ヤヴァいなこれ……

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1.2 Free Edition→JohnDoe版(sm50)
【OS】Microsoft Windows 8.1 Pro
【ディスプレイドライバ】353.30

【検索デバイス】GPUのみ
【使用するGPU】すべて使用
【GPU】GALAXY GF PGTX750TI-OC/2GD5
【CPU】Intel Core i7-4790K

【1SMあたりのブロック数(CUDA)】256
【検索プロセスの優先度】アイドル
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【 3分間のGPU検索の平均速度】 30.39M→138.81M tripcode/s

614:名無しさん@お腹いっぱい。
15/07/22 19:28:18.41 znNeHD48r
検索速度上がり杉ワロタ

そういえば前スレで出てた
10桁の二構のGPU検索の速度が出ないとかいうのは
JohnDoeさん版でも同じ?
スレリンク(software板:777番)-782

615:◆C.S.S.C./.
15/07/22 20:26:44.00 1QJTB87Lj
>>591コスパ良くなるのはいいが高いんだよなぁ(???)

>>592中学生だから高く思える(???)

616:◆C.S.S.C./.
15/07/22 20:27:08.08 1QJTB87Lj
(・ω・`)顔文字の文字化け

617:名無しさん@お腹いっぱい。
15/07/22 20:58:11.12 b99epkGOO
>>594
>>548の環境で、二構をONにして、検索かけてみたけど、
普通に400M Over出る。

618:◆Meriken.Z.
15/07/23 00:45:44.65 Mhk7cpYpQ
>>594
それは実はMTEのバグで、JohnDoeさんが直してくれたのです。
ありがたや~

619:◆Meriken.Z.
15/07/23 11:00:43.82 QLY5jkTr4
キーの配列をようやく全部レジスタに押しこむことに成功して、
7970で400M TPS、290Xで560M TPS出るようになりました。



620:これでテストさえ済めばようやく新しいバージョンの完成です。もうちょっと速くできそうだけど、まあここまで速度が出れば十分でしょう。



621:◆YYYYyyYYYY
15/07/23 11:03:31.84 Mhk7cpYpQ
これなんか割と綺麗かも。

622:名無しさん@お腹いっぱい。
15/07/23 12:04:45.43 VYNF18f/L
日立のメインフレームで使われたSHA-1実装の論理図面が公開される
URLリンク(developers.srad.jp)
URLリンク(www.canal.mokuren.ne.jp)

スラッシュドットでこんな記事出てました

623:◆a.o.u.u.u.
15/07/23 13:44:14.28 AZvU3Ijrq
なんか惜しいってトリップ見つけた(・ω・`)

624:◆YYYYyyYYYY
15/07/24 01:41:35.76 XwdH0klFT
>>601
これはこれは… 実に興味深いですね。ただ12桁トリップ検索も
ぜひ改良したいところですけど、10桁トリップ検索ほど改良の余地が
ないんですよね。JohnDoeさんが20G TPSを超えたのは
コンパイラがLOP3.LUTを使っているのが大きいと思われます。
f1~f3が各1命令で実行できるのは素晴らしいです。

#define f1 ( ( B & C ) ^ ( ( ~ B ) & D ) )
#define f2 ( B ^ C ^ D )
#define f3 ( ( B & C ) ^ ( B & D ) ^ ( C & D ) )

#define f1 bitselect(D, C, B)
#define f2 ( B ^ C ^ D )
#define f3 (bitselect(B, C, D) ^ bitselect(B, 0U, C))

625:累計 ◆zzzZzzZzz.
15/07/24 11:01:58.95 Ox1YlhcN0
低速で準連、これが限界ですzzz

626:◆YYYYyyYYYY
15/07/24 12:50:20.36 XwdH0klFT
そういうのもいいですね~ なかなかポイントが高いです。

627:◆mMmmMmMMM.
15/07/24 13:10:33.47 N4IfLS5m3
JohnDoeさんここにきてお話してくれればもっと活性化するのでは?と思ったり。
私はまったくプログラミングの知識ないのであれですが・・・。

628:◆Meriken.Z.
15/07/24 13:15:08.35 XwdH0klFT
JohnDoeさんはコードで語る男、もしくは女なので問題無いですw

629:◆Meriken.Z.
15/07/24 13:18:18.17 XwdH0klFT
検索君、12時間平均で2171M TPS出てますね。
う~ん、夢のような数字です。

630:◆a.o.u.u.u.
15/07/24 13:32:36.92 QcxKqdUdr
準10連って俺のPCだと何ヶ月かかるんだろう()

631:名無しさん@お腹いっぱい。
15/07/24 14:30:29.81 81UceuMvs
純10連はまあ運なので、PC速度は気にせんでもいいんじゃ

632:◆/Meriken/.
15/07/24 15:11:29.18 XwdH0klFT
わくわく

633:◆/Meriken/.
15/07/24 15:13:42.29 XwdH0klFT
でたでたw やっぱりスッキリしてていいなあ。

634:◆a.o.u.u.u.
15/07/24 22:17:50.45 QcxKqdUdr
準10連は運だとしても速度上がったほうがすこしは出やすいと思った

635:◆/Meriken/.
15/07/24 22:30:57.00 XwdH0klFT
そりゃそうですw

636:◆/Meriken/.
15/07/25 03:46:41.85 G7R8+09sq
OpenCLのカーネルのバイナリを保存して再利用するように
実装を変えてみましたが、バイナリがseedの数(4096個)だけあるので
全部出来るのにかなり時間がかかります。この機能は
デフォルトでは切っておいたほうがいいかな。

637:◆Meriken.Z.
15/07/25 08:07:18.95 jaLS6EKMi
バイナリの中身を見てみたらカーネルの関数が
全部含まれていました。道理でビルドに時間がかかって
バイナリがでかくなるわけだ。家に戻ったら
必要のない関数を省かれるようにしようっと。

638:◆Meriken.Z.
15/07/25 08:13:08.43 jaLS6EKMi
あとseedの選び方がかなり偏っていることがわかったので
まんべんなく分布するように直しておきました。
2chのへんてこな仕様のお陰でseedにピリオド('.')が
選ばれることがかなり多いことが分かりました。
いずれにせよこれで純10連も出やすくなるはずです。

639:名無しさん@お腹いっぱい。
15/07/25 13:49:34.72 9ES25Wv8P
NVIDIAのPascal 心がぴょんぴょんしてくる

640:◆/Meriken/.
15/07/25 14:50:39.16 G7R8+09sq
14nmですか。今980 Ti


641:買うかPascalまで待つか迷いますね…



642:◆/Meriken/.
15/07/25 14:54:06.43 G7R8+09sq
2228M TPS (23時間平均)出ました。

次はOpenCLプログラムの動的生成を効率化した
バージョンを試してみます。

643:名無しさん@お腹いっぱい。
15/07/25 15:12:00.72 4/NmfIGpP
でもお高いんでしょ?

644:◆/Meriken/.
15/07/25 15:20:55.13 G7R8+09sq
新しいバージョンは非常にいい感じです。
2.3G TPS出るか出ないかといったところです。
1.1.2だと800M TPS前後だったので本当に3倍いきそうです。
残る手は禁断の実行バイナリ書き換えだけか…

645:◆/Meriken/.
15/07/25 15:36:56.74 G7R8+09sq
clCreateProgramWithBinaryによるオーバーヘッドはほとんど
ないみたいなので、CPUでやってたことをGCNでやればいいだけ
なんだよな。なんだか簡単な気がしてきた…

646:◆a.o.u.u.u.
15/07/25 16:04:04.33 cs+QB9GyY
HARDOFFで安くて性能のいいのでも漁ってくるか・・・

647:名無しさん@お腹いっぱい。
15/07/25 18:32:20.80 Lizdya71g
金を使い出すときりないぞw
まだちうがくせいなら無理せんでもいいんじゃ

648:◆a.o.u.u.u.
15/07/25 19:45:36.29 cs+QB9GyY
それもそうだな

649:名無しさん@お腹いっぱい。
15/07/25 21:12:16.47 gZb5miQ9A
若いならプログラムとか覚えたほうが面白いんじゃない

650:◆a.o.u.u.u.
15/07/26 01:31:33.99 qg4b8dkP/
どう覚えるのかわからない(´・ω・`)

651:◆/Meriken/.
15/07/26 02:19:34.67 w+RVJQNdt
レジスタ数をさらに減らしてみる実験を開始。
volatileキーワードを使って最適化を抑制して、
88まで削れました。84までもうちょいです。
あとはS-Boxを差し替えてやればいいんだけど、
面倒くさいんだよな、これ…

> 16..64 numVGprs -> excellent V and S paralellism (in my thoughts this is when only 4 waves are in the CU)
> 65..84 numVGprs -> this starts to hate when it gets many S instruction dwords (I think 3 waves can sit in a CU)
> 85..128 numVGprs -> 2 small S for 4 V is ok, bug starts to get slow (2 waves)
> 129..255 numVGprs -> try to avoid ALL S instructions if posibble, or else there will be terrible stalls (1 waves)
URLリンク(community.amd.com)

652:◆/Meriken/.
15/07/26 03:43:24.68 w+RVJQNdt
wavefrontを一応3個のっけることはできたんですが、
速度が今までとほとんど変わりませんでしたorz
なかなか難しい…

653:◆/Meriken/.
15/07/26 03:48:09.29 w+RVJQNdt
2295M TPS (12時間平均)

少しずつ速くなってるけどそろそろ限界かな~

654:◆/Meriken/.
15/07/26 15:05:52.99 w+RVJQNdt
実行時のバイナリの書き換えはいまいち使いどころが
なかったので、最適化はとりあえずここまでにして
次のバージョンを用意することにします。

7970 408M TPS
290X 550M TPS
7990 794M TPS
Fury X 800M TPS (予想)
295X2 1100M TPS (予想)

しかし改めて見ると滅茶苦茶速くなったな~
JohnDoeさんと張り合うだけの資金力がないのが
残念ですけど、まあでも上出来でしょう。

655:名無しさん@お腹いっぱい。
15/07/26 22:15:26.55 vHonvJo0/
RAGE FURY PROからATI派です
AMDを応援しています

656:名無しさん@お腹いっぱい。
15/07/26 23:50:07.12 N4nwUqIIw
Mach64から(ry

657:◆/Meriken/.
15/07/27 00:42:23.87 ixMpl4uOX
私もAMDが大好きですw
お願いだからLOP3.LUTを実装して…

658:◆/Meriken/.
15/07/27 00:47:11.63 ixMpl4uOX
気になったのでstackoverflowに丸投げしてみました。
返事来るかな~

Looking for GPU S-Boxes for Bitslice DES with Fewer Number of Registers (<= 14)
URLリンク(stackoverflow.com)

659:◆/Meriken/.
15/07/27 02:00:55.14 ixMpl4uOX
2310M TPS (22時間平均)

ようやく2.3Gを超えました。よしよし。

660:◆/Meriken/.
15/07/27 02:08:02.79 ixMpl4uOX
stackoverflowのは返事が来そうにないな~
まあいいや。時間があるときに自分で探そうっと。

661:◆/Meriken/.
15/07/27 02:14:10.18 ixMpl4uOX
これを見つければいいんだよな。

S1
vsel(x0, x94D83B6C, x6B68D433, a6);
vsel(x1, xD6E19C32, x5CA9E295, a6);
vsel(x2, xB96C2D16, x6993B874, a6);
vsel(x3, x37994A96, x529E962D, a6);

S2
vsel(x0, x996C66D2, xB44BC32D, a2);
vsel(x1, xA55A699A, x668DA556, a2);
vsel(x2, xB66CB43B, x09976748, a2);
vsel(x3, x87A5F09C, xD2994E33, a2);

S3
vsel(x0, x9E49915E, xE13C1EE1, a1);
vsel(x1, x265E97A4, x99A56C53, a1);
vsel(x2, xB32C6396, x47B135C6, a1);
vsel(x3, x5A66A599, xD2699876, a1);

S4
vsel(x0, x56E9861E, x9586CA37, a6);
vsel(x1, x9586CA37, xA91679E1, a6);
vsel(x2, xD2946D9A, x4CA36B59, a6);
vsel(x3, xB35C94A6, xD2946D9A, a6);

662:◆/Meriken/.
15/07/27 02:14:45.38 ixMpl4uOX
S5
vsel(x0, x369CC1D6, x1A676AB4, a4);
vsel(x1, x5BA4B81D, x963969C6, a4);
vsel(x2, x9D49D39C, x2E69A463, a4);
vsel(x3, x1A35669A, x6CF2295D, a4);

S6
vsel(x0, xCAC5659A, x942D9A67, a6);
vsel(x1, x925E63E1, x69A49C79, a6);
vsel(x2, x16E94A97, xB946D2B4, a6);
vsel(x3, x5963A3C6, x1C3EE619, a6);

S7
vsel(x0, x26DAC936, x694E5A8D, a1);
vsel(x1, xB14EE41D, x26DA9867, a1);
vsel(x2, x699C585B, x4E639396, a1);
vsel(x3, x74878E78, x8B7869C6, a1);

S8
vsel(x0, xA59E6C31, x38D696A5, a6);
vsel(x1, xCB471CB2, x34E9B34C, a6);
vsel(x2, x693CD926, x59698E63, a6);
vsel(x3, xC729695A, x919AE965, a6);

663:◆/Meriken/.
15/07/27 05:42:06.38 ixMpl4uOX
0x55555555, 0x33333333, 0x0F0F0F0F, 0x00FF00FF, 0x0000FFFFから
論理演算だけで>>639-640の16進数(x~)を導き出せばいいんだけど、
ゲート数の他にレジスタ数を考慮すると超絶に面倒くさそう…

Optimizing bitslice DES S-box expressions
URLリンク(openwall.info)

664:◆/Meriken/.
15/07/27 05:44:12.23 ixMpl4uOX
でもSSEとかレジスタ8個しかなかったよな。
一体どうなってるんだろ…

665:◆/Meriken/.
15/07/27 06:23:47.80 ixMpl4uOX
そういやSSEではメモリに追い出してたんだっけ。
S-Boxを新しく作るのはちょっと面倒すぎるな。
やっぱアセンブラで頑張るしかないんだろうけど、
考えていた最適化はほとんどOpenCLでできちゃったし、
微妙だな~ たせたとしても50~100M TPSぐらいだろうし…

666:◆/Meriken/.
15/07/27 06:46:46.51 ixMpl4uOX
まてよ。ループ展開が大幅に効率化出来るからもっといけるかな。
まあいいや。またあとでやろうっと。

667:◆/Meriken/.
15/07/27 10:08:06.03 ixMpl4uOX
あれからちょっと調べてみたんですけど、GCNアセンブラで
うまくやれば3個のwavefrontを乗っけて綺麗にこれまでの
1.5倍の速度が出せそうです。次のバージョンを用意してから
取り掛かろうっと。

668:名無しさん@お腹いっぱい。
15/07/27 10:19:01.93 xj/ut6orZ
頑張ってますなぁ

669:◆/Meriken/.
15/07/27 11:09:30.67 ixMpl4uOX
時々ストレスが溜まると憑かれたようにプログラミングが
したくなるんですw でも程々にしておいたほうがいいですね。

670:◆I222222222
15/07/27 11:13:00.38 ixMpl4uOX
どれどれ。

671:◆I222222222
15/07/27 11:13:47.45 ixMpl4uOX
こっちはどうかな。

672:◆/Meriken/.
15/07/27 11:19:45.40 ixMpl4uOX
キーのかぶっていない本物のコリジョンを発見しました。

◆I222222222 #e・モ賓クtツv' (65 A5 D3 95 6F B8 74 C2 76 27)
◆I222222222 #wェ゚。「.゚j藝 (77 AA DF A1 A2 2E DF 6A E5 59)

速度が出てくるとなかなか面白いですねえ。

673:名無しさん@お腹いっぱい。
15/07/27 11:48:16.88 zzZlkO/wp
嫁さんのストレスが心配・・・

674:◆/Meriken/.
15/07/27 13:05:25.57 ixMpl4uOX
嫁さんがアメリカに来るのは1ヶ月後です。まだ大丈夫!

675:名無しさん@お腹いっぱい。
15/07/27 13:49:13.96 FM81lyOIZ
嫁の居ぬ間に検索

676:◆/Meriken/.
15/07/27 13:59:07.50 ixMpl4uOX
wwwww

677:◆mMmmMmMMM.
15/07/27 15:17:47.07 LSf4BWCwi
verうp楽しみにしてます。って、CPU検索も速度上がりますか??

678:◆エリーチカニホレタ。ー゙゚リ!
15/07/27 19:27:45.98 EcaOlJ4kV
↓この辺に鬼女スレのAA

679:名無しさん@お腹いっぱい。
15/07/27 19:33:00.16 ehjkE9145
              ,. ‐'' ̄ "' -、   ,. ‐'' ̄ "'' -、
             /        ヽ/          ヽ
                l          l             l
            l         l          l
         ,. ‐'' ̄ "'' 、    ,,. --‐┴─-- 、     / ̄ "'' -、
       /      ,.-‐''"´           \ _/        ヽ
      l       /                   ヽ          l
       l     /  ●                l          l
      ヽ    l       (_人__ノ         ● ヽ         /  そんな事言われても
       ,,>-‐|   ´´     |   /       , , ,. ‐'' ̄ "' -、/      ウチ ポン・デ・ライオンやし
      /    l        ヽ_/           /          ゙ヽ
     l     ` 、               l            l
      l       ,. ‐'' ̄ "' -、   ,. ‐'' ̄ "'' -、            l
       l,     /         ヽ /        ヽ,         /
       ヽ、,,  l            l          l,,,___,,,/
         "'''l            l             l
              ヽ          /ヽ        /
             ヽ,___,,,/  ヽ,,___,,,/
                   /     |
                /       |

680:◆/Meriken/.
15/07/27 20:30:01.90 ixMpl4uOX
>>655
今回の主な変更点はRadeonでの10桁トリップ検索の速度向上と
ゆぐちゃんの新鯖への対応なので、CPU検索はいじってませ~ん。

681:◆mMmmMmMMM.
15/07/27 21:37:08.90 ykCnihiOD
>>658
あら・・・残念です。
自作から遠のいてmmoもしてないのでCPUのみの検索だったのですが。
中学生がGPU買おうとか言ってるし、私も買おうかな。
ってかケースに入るGPUあんのかな。。。

682:◆wuuwuuwwuw
15/07/27 22:32:09.60 o5N/LrDsS
うーん、ちょっと惜しい・・・

683:◆a.o.u.u.u.
15/07/27 23:00:37.78 aRIaaI2As
ポンデライオン(´・ω・`)

684:◆a.o.u.u.u.
15/07/27 23:01:40.51 aRIaaI2As
(´・ω・`)12桁なら検索速度は速いが10桁だと検索速度1桁になるな

685:◆/Meriken/.
15/07/28 04:28:23.28 qwMsQzXO+
>>659
今度出るFury Nanoとかいかがですか。

686:◆Meriken.Z.
15/07/28 13:53:54.53 Mdbe7Wq4P
久しぶりにGTX580をさしてCUDA版のテスト。
ちゃんと動いてるけど遅い!

687:名無しさん@お腹いっぱい。
15/07/28 18:07:19.91 h5dgySb86
(´・ω・`)デスクトップのVistaに合うビデオカードってなんだろう

688:名無しさん@お腹いっぱい。
15/07/28 20:11:09.22 smsbgNEwR
今からトリップ検索用に買うならGTX750TiかGTX750無印あたりでいいんじゃね
いつまでVistaを使うつもりか知らないけどドライバのサポートはこれまでの実績で言えばNVIDIAの方が長かったし
URLリンク(kakaku.com)
URLリンク(kakaku.com)

RadeonでGTX750TiやGTX750相当の検索速度にしようとするとR7 250XやR7 250XEあたり?
ただしR7 250Xは補助電源あり
URLリンク(kakaku.com)
URLリンク(kakaku.com)

検索速度はJohnDoeさんやMerikenさんの新バージョンを使う前提で
フリー版でゆぐちゃんにつないでGPUだけ使って検索すると大雑把にはこんな感じになると予想
GTX750Ti 10桁130M 12桁900M
GTX750無印 10桁100M 12桁700M
R7 250X 10桁130M 12桁700M
R7 250XE 10桁100M 12桁600M

検索中にビデオカードが使う消費電力は 100W > R7 250X > GTX750Ti ≧ R7 250XE > GTX750無印 > 50W くらい?

689:名無しさん@お腹いっぱい。
15/07/29 00:42:43.41 ck6gUcYEU
Vistaはサポート終了まで使う予定(´・ω・`)
まあ買って使ってみないとわからないか(´・ω・`)

690:名無しさん@お腹いっぱい。
15/07/29 00:59:30.97 6SLu6PuUJ
Vista起動中にWin10のセットアップを実行すると表示されるありがたいメッセージ
URLリンク(i.imgur.com)

XPの場合はメッセージ以前の問題
URLリンク(i.imgur.com)

691:名無しさん@お腹いっぱい。
15/07/29 06:06:32.97 ck6gUcYEU
XPwwwww

692:◆エリーチカニホレタ。ー゙゚リ!
15/07/29 07:51:04.11 umqjk6jZw
一応サポート期間なのにVistaのMSからの冷遇具合は異常
開発ツールにも制限あるし……

693:◆Iqo8OO8opI
15/07/29 20:50:09.21 ck6gUcYEU
テストスレってどこだ(´・ω・`)
Vistaでツール使いながらYouTube見てたら重たい・・

694:累計 ◆wop.8OO8.qow
15/07/29 21:25:29.68 7HUGETOcm
>>671
酉見て一瞬「書いたっけ?」と思いましたw

▲練習▼テスト▲test▼《初心者向解説付》Part622
スレリンク(qa板)

695:◆Iqo8OO8opI
15/07/29 23:00:54.85 ck6gUcYEU
>>672 酉似てるww

696:◆/Meriken/.
15/07/30 09:34:22.21 TBRza38Zs
GTX580での検索が速くならないかいろいろ実験中。
ループ展開のおかげで使用する共有メモリの量を
半分にすることに成功しました。後はレジスタ数を24まで減らせば
速度が倍近くになる計算です。久しぶりにコードを見てみたら
いろいろ新しい発見があってなかなか面白いです。

697:名無しさん@お腹いっぱい。
15/07/30 20:17:41.99 EAI9RfaTX
スキルアップして前にできなかったことができるようになると楽しいよね

698:名無しさん@お腹いっぱい。
15/07/30 21:01:23.86 yJ5y76Kyw
何か、欲しいトリップを見つける事よりも、検索速度を上げる事の方が遥かに重要に・・・

699:◆/Meriken/.
15/08/01 06:12:06.11 oMKWjeE6c
7月の電気代がエラいことになってましたw
2ヶ月分でハイエンドのビデオカードが買えてしまいます。
1ヶ月で282kWhを超えたら超過した分の電気代が
倍になるみたいです。
とりあえず7990と7970は停止しておこうっと。

700:◆/Meriken/.
15/08/01 06:25:41.07 oMKWjeE6c
悪くない数字だけどもう一声ほしいな。

7790+290X 1,160M TPS 625W 880MHz -70mV

701:◆/Meriken/.
15/08/01 06:48:00.90 oMKWjeE6c
4枚有効にして電圧を下げたら効率がちょっと良くなりました。

7790x2+290Xx2 1,331M TPS 655W 500MHz 900mV/-100mV

1.86M TPS/W -> 2.03M TPS/W

702:◆/Meriken/.
15/08/01 14:21:24.60 oMKWjeE6c
GTX580で超頑張って70M TPS出せるめどがたちました。
7970と違ってoccupancyを上げても綺麗にスケールしないですねえ。

703:名無しさん@お腹いっぱい。
15/08/01 17:37:56.30 dhV1DF8yD
まあ検索効率も良くなったから
節電でグラボ1枚だけでもいいんじゃない?

704:名無しさん@お腹いっぱい。
15/08/01 18:41:47.16 bX5oee09E
電気代1万超えてた(´・ω・`)想像するだけで涙出てくる(´;ω;`)

705:名無しさん@お腹いっぱい。
15/08/01 19:07:47.24 LAQRNyixp
勇者Merikenさんもついに魔物の前に屈する日がきたのか…

706:◆MOYASHI/Go
15/08/01 23:45:22.50 Fx8v9zxSS
おお!Merikenさんが7790を戦力として投入しとるw

>>677
アメリカでも、電力使用量に応じて段階的に電気料金が上がる仕組みなんですね。
しかも、一月で282kWhを超えた分が倍額って、凄い急激な設定w

707:◆/Meriken/.
15/08/02 00:18:18.76 eVnovhPgp
電気自動車用に使用料じゃなくて時間帯で料金が決まる
プランが有るみたいだけど、これって私でも加入できるのかしらん。

URLリンク(www.pge.com)
URLリンク(www.pge.com)

708:◆/Meriken/.
15/08/02 02:32:21.34 eVnovhPgp
JohnDoeさん、また速くなってるな~
私も真似をしてseedにあわせてCUDAで4096個のカーネルを
作ってみたけど、ビルドがいつ終わるか全くわからないw

709:◆Meriken.Z.
15/08/02 03:43:36.17 xaiU1fWAe
>>683
いや、ちょっとレベルが足りなかっただけですw
もうちょっと稼がないとな~

710:累計 ◆wop.8OO8.qow
15/08/02 08:07:49.33 eb0VgtAxe
JohnDoeさん、10桁 3634M
凄すぎ!!

711:名無しさん@お腹いっぱい。
15/08/02 08:26:37.65 qLX5SLgYT
くそ暑いのにがんばり杉だろwwwww

712:累計 ◆wop.8OO8.qow
15/08/02 08:58:48.43 eb0VgtAxe
3780M 8:37am
3639M 8:40am
3638M 8:43am
3638M 8:46am
3640M 8:49am
3636M 8:52am
3632M 8:55am

JohnDoeさんは3分で再起動かな?

713:名無しさん@お腹いっぱい。
15/08/02 09:09:19.21 YY6qR33bT
すげえ頑張ってるなー
しかし、なぜトリップツールに興味持ったんだろ

714:◆Meriken.Z.
15/08/02 09:55:29.55 xaiU1fWAe
JohnDoeさんのコードを詳しく調べてみましたけど、
ループ展開の方法がかなり独特ですね。
この転換、どうやって見つけたんだろう。

715:◆Meriken.Z.
15/08/02 10:07:15.16 xaiU1fWAe
この人の書いたコード、JohnDoeさんのにそっくりだけど本人だったりしてw
数日前にBitslice DESのMaxwellでの最適化についての質問してるし…
コメントの英語が妙にこなれてたので不思議だったんですよね。

URLリンク(devtalk.nvidia.com)

716:名無しさん@お腹いっぱい。
15/08/02 10:13:10.50 YY6qR33bT
海外の人だからこのスレに現れないってことかね?

717:◆Meriken.Z.
15/08/02 10:23:49.31 xaiU1fWAe
やっぱり本人だったw 日本人にしては英語がうますぎると思ったんだよな~

----

All codes are now open-sourced here as part of my personal fork of Meriken's Tripcode Engine, a third-party tripcode finder for 10 character (DES crypt(3)) and 12 character (SHA-1) tripcodes.
URLリンク(devtalk.nvidia.com)

718:◆Meriken.Z.
15/08/02 11:25:30.96 xaiU1fWAe
>>694
一応挨拶してきました。来てくれないかな~

719:名無しさん@お腹いっぱい。
15/08/02 13:46:23.98 OYyZciZ78
FRBのイエレン議長がトリップ検索に興味持ったのか

検索専用ASICとそれを作る専用工場が建設される日も近いな

720:◆/Meriken/.
15/08/02 17:03:23.11 eVnovhPgp
このハンドル名のセンスは謎ですねw 面白い人だなあ。

CUDA版はカーネルを256個までビルドすることに成功しました。
期待通りの速度が出ています。しかし時間がかかりすぎ!

721:名無しさん@お腹いっぱい。
15/08/02 17:55:14.54 bycRMbikI
日本だと名無しのごんべえって意味だしな
JohnDoe

722:◆エリーチカニホレタ。ー゙゚リ!
15/08/02 19:54:43.09 lvIA54/vr
ジョン・ドゥと言えばMGSの方を思い出す……
ジョン・スミスと同じような意味なのか

723:混沌 ◆YvAqloolpAvY
15/08/02 21:02:41.77 lMwU9e4ZB
恥ずかしながら、某所でJohnDoeさんの勇姿を拝見しました :-)

URLリンク(i.imgur.com)

724:◆/Meriken/.
15/08/03 00:42:13.44 9GeMtFh4U
ようやくカーネルを全部ビルドする


725:準備が出来ました。一体何時間かかるんだろう…JohnDoeさんのコードを取り込んでループ展開を効率よくしないと配布は無理っぽいなあ。



726:◆エリーチカニホレタ。ー゙゚リ!
15/08/03 01:35:36.35 J+6NTbpL2
>>702
冷静に考えると、「トリップを検索する」だけのソフトなのにビルドに数時間掛かるというのは常識はずれな感ありますな……
まあMTFの開発自体相当長期に渡ってますし、最適化に最適化を重ねてるから仕方ない面もありますが

727:◆/Meriken/.
15/08/03 02:03:02.33 9GeMtFh4U
やるからには徹底してやらないと面白く無いですよw
CUDA版でカーネルを4096個作るのはかなり昔に試したことが
あったんですけど、あまりにビルドに時間がかかるので
没にしたんですよね。もうちょっと色々実験してみれば
よかったな。

728:◆/Meriken/.
15/08/03 02:24:44.21 9GeMtFh4U
いずれにせよ10桁トリップ検索は相当奥が深いです。
性能を出すのがほんとうに難しいんですよね~
JohnDoeさんはS-Boxの最適化を4万円かけて
Amazonのクラウドサービスでやったそうです。さすがです。

729:( ´_ゝ`) ◆Iqo8OO8opI
15/08/03 05:39:21.15 chNZAClKA
ゲームやりながらトリップ検索するとゲーム重いからできないっていう・・・

730:◆/Meriken/.
15/08/03 10:34:22.62 9GeMtFh4U
結局カーネルを4096個作るのはリンカがこけて失敗におわりましたorz
その代わりに別のルーチンをいじったら72M TPSでてしまいましたw やった~

731:◆/Meriken/.
15/08/03 11:23:17.61 9GeMtFh4U
OCしたら89M TPS出ましたw これでようやく満足しました。
長い戦いだった…

732:◆/Meriken/.
15/08/03 13:50:54.45 9GeMtFh4U
>>706
検索はPCを使ってないときにやるものです。
MTFはスクリーンセーバーと連動できますよ。

733:◆mMmmMmMMM.
15/08/03 19:57:07.26 yRqUUxvnh
私はCPU検索で、通常のネット中に半分くらいのコア数を使って検索してても不自由は感じないですけど、
GPUをモロにつかうゲームやりながらのGPU検索は厳しそうですねw

734:◆mMmmMmMMM.
15/08/03 20:21:47.51 yRqUUxvnh
あんまり沢山見つけたわけじゃないので偉そうなこといえませんが、
人の見つけたときにどんなトリップなのか知れたら嬉しいなと思ったり。
人の見て「おぉー!超綺麗!!!」とか一人で興奮したいw

735:◆/Meriken/.
15/08/03 23:39:30.65 9GeMtFh4U
>>711
見られたくない人もいるのでちょっと微妙ですね。
それにお礼が来れば見れますよ。

736:◆/Meriken/.
15/08/03 23:42:38.26 9GeMtFh4U
あれから更にいじってOCしたGTX580でとうとう100M TPSでました。
これでHoro氏も満足してくださるでしょう。

737:◆/Meriken/.
15/08/03 23:48:05.88 9GeMtFh4U
次のバージョンでは新しNVIDIAのビデオカードでも
それなりに10桁トリップ検索が速くなっているはずです。
本格的な最適化は980Tiを手に入れてからになりますが、
それまでのつなぎということで。

738:◆/Meriken/.
15/08/04 02:24:57.92 XUcLulrQU
JohnDoeさんの見つけてくれたバグ、別のところに残ってたorz
危ない危ない…

739:( ´_ゝ`) ◆Iqo8OO8opI
15/08/04 04:33:17.13 yJQAmcnJU
トリップ検索してる時暇だからゲームしてる、それかYoutube.重たいけど
PC熱くなってる

740:名無しさん@お腹いっぱい。
15/08/04 04:43:15.23 tdpIio/k5
(`・ω・´)つ扇風機

741:( ´_ゝ`) ◆Iqo8OO8opI
15/08/04 17:18:41.96 yJQAmcnJU
扇風機涼しいぃぃぃぃ
HARDOFFでビデオカード買った、どこにやるのかわからないまま箱の中・・・

742:名無しさん@お腹いっぱい。
15/08/04 17:25:55.86 H/kn7RWuu
指す場所がわからんってことか?

743:◆IIIYIIYIII
15/08/04 18:53:08.08 gjfSg5J6v
割と綺麗なのが出たかも。

744:名無しさん@お腹いっぱい。
15/08/04 20:18:58.21 JcpGex752
二構・回文・鏡で跳満くらい?

745:◆/Meriken/.
15/08/04 23:06:38.72 XUcLulrQU
新しい開発版をうpしました。

Meriken's Tripcode Generator 2.0.0 Free Edition
URLリンク(meriken.ygch.net)

バージョン1.1.2FEからの主な変更点は以下の通りです。

・名前を"Meriken's Tripcode Generator"に変更。
・ビデオカードでの10桁トリップ検索の大幅な高速化。
・「Meriken's Tripcode Yggdrasil」の新サーバーへの対応。
・その他バグフィックス多数。

746:名無しさん@お腹いっぱい。
15/08/04 23:33:06.18 C6LcWtzIY
>>545
なんかJohnDoeさんの更新されてたので試してみた。
環境は>>548
プログラムサイズが100MB程増えてるけど、
速度も100M程速くなって、580M程出る・・・
Clock 1.4Gで回すと、980単体で630M位まで
これ1枚で新生検索君1号の半分弱の速度・・・

化けもんだwww

747:◆/Meriken/.
15/08/05 03:35:51.95 g868rxPWR
お、早速田中ゆかりさんが438M TPS出してるw
どのビデオカードを使ってるか気になるな~

748:◆/Meriken/.
15/08/05 03:39:37.76 g868rxPWR
>>723
ここに来て検索速度も一気に上がりましたね~
JohnDoeさんの成果を取り込んだらRadeonの新しいバージョンに
取り掛からないと…

749:名無しさん@お腹いっぱい。
15/08/05 08:05:19.31 S3CCFDKPL
>>722
おつかれさまです

まだ診断は試してないですが、
Radeon R9 270X ( MSI R9 270X GAMING 4G 、 1080MHz ) で Yggdrasil でGPUだけで 194M 出てます
倍になってます!

750:名無しさん@お腹いっぱい。
15/08/05 08:17:04.16 S3CCFDKPL
検索開始時にサーバと通信失敗のエラーが出ることがあるみたいです

初回起動時に2回連続で出て、そのあと成功して
今検索プロセス再起動のときにまた通信エラー出てました

751:◆/Meriken/.
15/08/05 10:05:56.23 g868rxPWR
>>726-727
報告有り難うございます。場所によってサーバーへの
つながりやすさが違うんでしょうかね。
タイムアウトの時間を長めにしておきます。

あと速度が予測より遅めなのが気になります。Catalystの
バージョンはいくつですか? 14.12と15.7がおすすめです。
CPU検索を切るかもうちょっとスレッド数を減らしてみても
いいかもしれません。GPU検索のみでの診断の結果を
教えていただけると助かります。

752:◆/Meriken/.
15/08/05 11:33:04.35 g868rxPWR
>>727
どうもさくらインターネットの問題だったみたいです。
また発生したら教えて下さい。

753:名無しさん@お腹いっぱい。
15/08/05 14:20:48.31 S3CCFDKPL
>>728
Catalystを上げようと思ったら Windows 8.1 にしないと 14.4 までしか使えないみたいだったので
Windows 8をWindows 8.1にアップデートしていました

Catalyst 15.7 にしたらGPUの速度が 260M まで上がりました

あとで診断もやってみます

754:名無しさん@お腹いっぱい。
15/08/05 16:09:47.53 S3CCFDKPL
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.0 Free Edition
【OS】Microsoft Windows 8.1 64bit
【ディスプレイドライバ】Catalyst 15.7.1

【検索デバイス】GPUのみ
【使用するGPU】すべて使用

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間のGPU検索の平均速度】 269.55M tripcode/s

GPU MSI R9 270X Gaming 4G ( 1080 MHz )

755:名無しさん@お腹いっぱい。
15/08/05 16:38:48.33 S3CCFDKPL
温度も見てみた

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.0 Free Edition
【OS】Microsoft Windows 8.1 64bit
【ディスプレイドライバ】Catalyst 15.7.1

【検索デバイス】GPUのみ
【使用するGPU】すべて使用

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間のGPU検索の平均速度】 267.78M tripcode/s

【GPUの使用率】99%
【GPUの温度】70~71℃
【その他】

室温 冷房で22度
GPU MSI R9 270X Gaming 4G ( 1080 MHz )

1.1.2 FEだと60度前後だったけど やっぱ速度出てるだけあって温度も上がってました

756:( ´_ゝ`) ◆Iqo8OO8opI
15/08/05 19:53:38.57 ibjq3rq2Z
安いの買ったからゴミだな、1万円まで金貯めてAmazonで5000円のビデオカードでも買うか・・・

757:名無しさん@お腹いっぱい。
15/08/05 20:19:29.78 9j57lRCpr
うちのGT520よりマシじゃねw
たしか10桁も12桁もCPUに負けてたwww

758:◆/Meriken/.
15/08/05 20:41:34.97 g868rxPWR
>>733
お、順当なところですね。報告乙です。

>>733
ちょっと失礼すぎるでしょう。270Xは2万5000円ぐらいしますよ。

759:名無しさん@お腹いっぱい。
15/08/05 20:56:35.61 8ZOUHXjFs
>>735
たぶん、>>718で書いてる自分が買ったビデオカードがダメだったって話じゃないかね?

760:◆/Meriken/.
15/08/05 21:01:47.64 g868rxPWR
そうだといいんですけど…

761:◆/Meriken/.
15/08/05 21:09:47.57 g868rxPWR
ビデオカードが欲しいなら余ってるGTX580差し上げてもいいくらい
ですけど、電気代のことを考えるとちと無理がありますね。
ようやく定格で94M TPS出るようになったけど、
もうちょっとなんとかならんかな。

762:名無しさん@お腹いっぱい。
15/08/05 21:52:25.65 xbbQF/G3w
早速新しいやつにしたけど、前のより速くなったんだろうか?
もう以前の数値を覚えてないので分からん。w

763:◆MOYASHI/Go
15/08/05 21:56:13.39 3QhZHO7Vn
>>722
お疲れ様です。

設定ファイルは、以前のMTFの物をMTGの”MerikensTripcodeGenerator.settings”
へとリネームして使い回しても問題無いでしょうか?

764:名無しさん@お腹いっぱい。
15/08/05 22:01:47.54 xbbQF/G3w
>>740
あ、リネームしてないけど、前のをそのまま普通に読み込んだみたい。

765:◆MOYASHI/Go
15/08/05 22:54:12.85 3QhZHO7Vn
>>741
おお、Thx!
多分大丈夫だろうと思ったけど、チキンハートなものでw

766:名無しさん@お腹いっぱい。
15/08/05 23:16:29.64 xbbQF/G3w
前の名前のファイルがあったらそれを読み込み、MerikensTripcodeGenerator.settings
というファイル名で、同じ内容を新たに書き込む、ってなってる予感。
で、次からは MerikensTripcodeGenerator.settings があるから、それを読む、と。

767:◆MOYASHI/Go
15/08/05 23:20:52.44 3QhZHO7Vn
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.0 Free Edition
【OS】Win7 Pro 64bit SP1
【CPU】Core i5 3570
【GPU】RADEON HD 7790(1030MHz動作)
【ディスプレイドライバ】Catalyst 15.7.1
【検索デバイス】GPUのみ

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間のGPU検索の平均速度】 176.68M tripcode/s


速度アップ凄過ぎ!

768:◆MOYASHI/Go
15/08/05 23:48:54.60 3QhZHO7Vn
>>732
俺が使ってるビデオカードだとGPUクーラーがショボイせいで
室温28℃でGPUが90℃を超えてしまうw

>>743
そのまま放り込めばおkだったのね。

769:( ´_ゝ`) ◆Iqo8OO8opI
15/08/06 02:44:34.38 ls68N8PMi
>>735 意外と高いですなぁ

770:◆/Meriken/.
15/08/06 09:53:07.95 y6xQ6Odww
とうとう980Tiを注文してしまいました。
これでようやくJohnDoeさんのコードをいじれるぞ。楽しみだな?

771:名無しさん@お腹いっぱい。
15/08/06 18:01:47.75 SR6qeYHAi
そして4枚構成へ…
1枚で900Mもでるんですね

772:( ´_ゝ`) ◆QQQQQQQQ.Q
15/08/06 20:04:43.45 ls68N8PMi
わくわく

773:名無しさん@お腹いっぱい。
15/08/06 20:18:16.32 NCpDAnwdT
>>749
Qが9個か面白いな

774:( ´_ゝ`) ◆QQQQQQQQ.Q
15/08/06 20:43:26.68 ls68N8PMi
>>750 ダジャレみたいだな、あまり使わないからいらないけどw

775:◆/Meriken/.
15/08/07 00:35:17.54 b4ZP1d2+0
新バージョン、誰かNVIDIAのカードでも試してみてくれないかな~

776:3D梨 ◆T.H.U.J.I.
15/08/07 01:42:29.65 Muq3m9mBO
>>752
サブPCで試してみます

777:3D梨 ◆T.H.U.J.I.
15/08/07 01:43:51.87 Muq3m9mBO
>>752
何故かGPUを認識出来ませんね
何でだろう

サブPC
CPU i5-4200M
GPU NVIDIA Geforce 710M

778:◆/Meriken/.
15/08/07 02:02:47.59 b4ZP1d2+0
>>754
ドライバのバージョンはいくつですか?
更新する必要があるかもしれません。

779:名無しさん@お腹いっぱい。
15/08/07 02:07:41.07 9IR4jiWMM
GeForce 710MってKeplerと思ってたら96CUDAコアのFermiなのね

URLリンク(www.nvidia.co.jp)
から最新ドライバ(353.62)をダウンロードしてインストールしてみれば


780:?



781:3D梨 ◆T.H.U.J.I.
15/08/07 03:08:29.13 Muq3m9mBO
>>755
350.12でした
アップデートして来ます

782:3D梨 ◆T.H.U.J.I.
15/08/07 03:09:12.72 Muq3m9mBO
>>756
そうそうこれだけ仲間外れって言う可哀想な子

783:◆/Meriken/.
15/08/07 03:15:13.46 b4ZP1d2+0
わくわく

784:( ´_ゝ`) ◆Iqo8OO8opI
15/08/07 03:37:18.15 gAc76JGK+
◆QQQQQQQQ.Q #dAgs0<@M棡
あまりレア的なもの使わないで鏡とか見つかったら使用しよう、鏡たくさん集めよ、 その前に鏡って何日くらいだっけ?

785:( ´_ゝ`) ◆Iqo8OO8opI
15/08/07 03:37:51.27 gAc76JGK+
したらばで10桁のやると違うの出るからちょっと悲しい

786:3D梨 ◆T.H.U.J.I.
15/08/07 03:45:10.73 Muq3m9mBO
まず前バージョンを投下

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1.2 Free Edition

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】  10文字完全前方一致1個

【10分間の平均速度】  185.85M tripcode/s
【GPU検索の平均速度】 133.54M tripcode/s
【CPU検索の平均速度】  52.31M tripcode/s

【GPUの使用率】%
【GPUの温度】℃
【その他】

787:3D梨 ◆T.H.U.J.I.
15/08/07 03:46:39.77 Muq3m9mBO
新バージョンですが文字化けしてたので前バージョンから一部拝借

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.0 Free Edition

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】  10文字完全前方一致1個

【10分間の平均速度】   96.72M tripcode/s
【GPU検索の平均速度】  84.36M tripcode/s
【CPU検索の平均速度】  20.81M tripcode/s

【GPUの使用率】%
【GPUの温度】℃
【その他】

788:3D梨 ◆T.H.U.J.I.
15/08/07 03:47:14.77 Muq3m9mBO
>>763
どうしてこうなった
としか言い様が無いですね...

789:3D梨 ◆T.H.U.J.I.
15/08/07 03:49:57.13 Muq3m9mBO
>>763
さっき10分程
検索してましたが前バージョンより数字的には遅いですが
新バージョンの方が早く出る様な気がします

790:3D梨 ◆T.H.U.J.I.
15/08/07 03:58:32.43 Muq3m9mBO
そういえばGeneratorはWindows10で動くのかな

791:名無しさん@お腹いっぱい。
15/08/07 03:59:34.07 9IR4jiWMM
MTGは10桁のGPU検索の強化がメインだから
10桁でやらないとあんま意味ないんじゃね?

792:3D梨 ◆T.H.U.J.I.
15/08/07 04:00:30.37 Muq3m9mBO
JohnDoeさんのプラグインだがどれをダウンロードすればいいんだ?w

793:3D梨 ◆T.H.U.J.I.
15/08/07 04:00:59.48 Muq3m9mBO
>>767
おk
やってくる

794:3D梨 ◆T.H.U.J.I.
15/08/07 04:03:46.12 Muq3m9mBO
10桁の診断してたら止まるなあ
CPU検索だけなら動くんだが...

795:名無しさん@お腹いっぱい。
15/08/07 04:05:31.02 9IR4jiWMM
詳細設定でGPUのみにしてから診断してもダメ?

796:3D梨 ◆T.H.U.J.I.
15/08/07 04:07:55.28 Muq3m9mBO
>>771
無理だわ

797:◆/Meriken/.
15/08/07 04:10:42.15 b4ZP1d2+0
12桁はいじってないはずなので謎ですね…
10桁トリップ検索でとまるのはなんでだろう。
GPUの温度は大丈夫ですよね?

798:名無しさん@お腹いっぱい。
15/08/07 04:11:40.65 9IR4jiWMM
それは残念
JohnDoeさんのはMaxwell専用じゃなかったっけ

799:3D梨 ◆T.H.U.J.I.
15/08/07 04:12:50.40 Muq3m9mBO
>>773
12桁の時は70℃前半でした
前バージョンと変わりません

800:3D梨 ◆T.H.U.J.I.
15/08/07 04:13:45.91 Muq3m9mBO
>>774
ウガーw
使えないw
今度メインPCで使ってみます

801:◆/Meriken/.
15/08/07 04:14:07.87 b4ZP1d2+0
ははあ、710MはCompute Capabilityが2.1なのか。
そういやバイナリを入れてなかったな。後で追加しておきます。

802:3D梨 ◆T.H.U.J.I.
15/08/07 04:20:09.20 Muq3m9mBO
>>777
今度メインPCでやろうと思うんですが
GTX860MってCCが5.0ですが5.0も対応してますか?

803:◆/Meriken/.
15/08/07 04:21:51.15 b4ZP1d2+0
2.0用のは入ってるから大丈夫かと思ったけど、ダメなんですねえ。

>>778
5.0のは入ってます。

804:3D梨 ◆T.H.U.J.I.
15/08/07 04:22:57.64 Muq3m9mBO
>>778
了解です

805:3D梨 ◆T.H.U.J.I.
15/08/07 04:23:39.00 Muq3m9mBO
>>780
誤爆
>>778 ×
>>779 ○

806:◆/Meriken/.
15/08/07 04:23:51.54 b4ZP1d2+0
助かります~

807:3D梨 ◆T.H.U.J.I.
15/08/07 04:24:51.28 Muq3m9mBO
>>782
まあメインPC使えるの9月からですがねw

808:◆/Meriken/.
15/08/07 04:27:11.41 b4ZP1d2+0
ええ~w まあそれまでには超速くなった新バージョンが
できていることでせう。

809:3D梨 ◆T.H.U.J.I.
15/08/07 04:29:49.08 Muq3m9mBO
>>784
了解ですw

というかMerikenさんって帰国したとか行ってましたけど
今どこの国に居るんですか?w
ちょっとNGな質問かもしれないですけど、教えられる範囲で教えてください

810:◆/Meriken/.
15/08/07 04:31:44.35 b4ZP1d2+0
まだアメリカですよ。

811:3D梨 ◆T.H.U.J.I.
15/08/07 04:38:01.34 Muq3m9mBO
>>786
了解です

私は多分学校の関係で日本かどっかに居ます(うん、多分)

812:◆/Meriken/.
15/08/07 04:41:04.01 b4ZP1d2+0
結婚のために一時帰国してたんです。
いや~しかし助かりました。ありがとうございます。

813:◆/Meriken/.
15/08/07 05:09:56.53 b4ZP1d2+0
12桁トリップ検索の設定をいじったら検索君で16G TPSでました。
常時稼働はむりですけど、まだまだ結構いけますね~

814:3D梨 ◆T.H.U.J.I.
15/08/07 05:31:25.13 Muq3m9mBO
>>788
いえいえとんでもないです
もう22時なんで寝ますわ
では

815:混沌 ◆YvAqloolpAvY
15/08/07 06:15:37.71 qTkSO+FEQ
GTX660  12桁

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.0 Free Edition

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 646.22M tripcode/s
【GPU検索の平均速度】 541.21M tripcode/s
【CPU検索の平均速度】 105.01M tripcode/s

【GPUの使用率】%
【GPUの温度】℃
【その他】

816:混沌 ◆YvAqloolpAvY
15/08/07 06:16:20.65 qTkSO+FEQ
GTX660 10桁

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.0 Free Edition

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 71.83M tripcode/s
【GPU検索の平均速度】 49.83M tripcode/s
【CPU検索の平均速度】 22.00M tripcode/s

【GPUの使用率】%
【GPUの温度】℃
【その他】

817:◆/Meriken/.
15/08/07 14:10:53.82 b4ZP1d2+0
>>791-792
あ、こっちはちゃんと動いているみたいですね。
助かります。

818:◆Meriken.Z.
15/08/07 16:22:39.38 BBBJ///AN
780Tiが届いたのでさっそくJohnDoeさんのを試してみました。
定格で783M TPS出ているので確かに相当速いんですが、
これならRadeonでも十分に対抗出来るかなという印象です。

いずれにせよ共有メモリを使ったMTGでは半分ぐらいの
速度しか出ていないのでとりあえずこれを色々いじってみようっと。

819:3D梨 ◆T.H.U.J.I.
15/08/07 16:46:08.60 O7GApyQbJ
>>794
!?
amazon早いw 次バージョンのリリースが間近なんですねw
そして謎のIDwww

820:混沌 ◆YvAqloolpAvY
15/08/07 21:56:48.22 qTkSO+FEQ
>>793
一応w
3D梨さん同様にGPUを認識しなかったので確認してみると327.23だったので
>>756のリンクから新しいのを入れました

821:名無しさん@お腹いっぱい。
15/08/07 23:08:38.73 +yh0jiR+i
さっき一瞬JohnDoeさんが10桁で4G超えてた(4006M)
今は3934M

822:名無しさん@お腹いっぱい。
15/08/07 23:21:51.94 51MejotnJ
Final verとありますね
一気に4G台のせてきましたか

823:名無しさん@お腹いっぱい。
15/08/07 23:22:37.30 Xhkz6DWqw
12桁も高速化チャレンジしてほしいな

824:◆/Meriken/.
15/08/07 23:36:29.74 b4ZP1d2+0
さすがですね。4Gが今後の目標になるわけだな。頑張るぞ~

825:◆/Meriken/.
15/08/07 23:54:28.77 b4ZP1d2+0
>>799
もうすでにいじってましたよ。
12桁トリップ検索はアルゴリズムそのものに手を入れないと
これ以上の高速化は難しいんじゃないでしょうか。

826:◆エリーチカニホレタ。ー゙゚リ!
15/08/08 00:29:32.67 8PNO3z/Tu
話題のWin10、私も入れてみました。まだMTF(MTG)は走らせていませんが……
と言うか、まさか「自動判定されるドライバがWin7/8/8.1用で、Win10用はサイトからDLしないとダメ」
という罠があったとは……アプデ後に「対応しているWindowsのVerではありません」的なエラーが出て面食らったw

827:累計 ◆wop.8OO8.qow
15/08/08 00:37:28.30 FvP96WvRN
JohnDoeさん検索しているはずなんですけどね
URLリンク(i.imgur.com)

828:◆/Meriken/.
15/08/08 00:55:31.46 T37r4V/3W
>>803
多分再起動の間隔が長いんじゃないですかね。
ひょっとして設定してなかったりして。

829:累計 ◆wop.8OO8.qow
15/08/08 03:33:33.81 FvP96WvRN
その後、10桁6完をJohnDoeさんが検索してくれましたが、検索時間0秒が9回もあるのには驚きました。
URLリンク(i.imgur.com)

830:◆/Meriken/.
15/08/08 13:50:36.99 T37r4V/3W
現在JohnDoeさんの成果を取り込み中。
実験用のコードで860M TPSほど出ています。
一番難しいところは超えたのであとはすんなりいくはずです。

831:名無しさん@お腹いっぱい。
15/08/08 15:33:11.29 u6WiEyuWO
JohnDoeさんを吸収して完全体になるMerikenさん

832:3D梨 ◆T.H.U.J.I.
15/08/08 17:2


833:8:37.27 ID:0wq2DoA8w



834:混沌 ◆YvAqloolpAvY
15/08/08 19:43:35.02 YmD7Vi7+z
その変身をあと2回も俺は残している・・・ その意味がわかるな?

835:◆/Meriken/.
15/08/08 20:48:33.84 T37r4V/3W
> 検索中のPC: 19台
> 検索速度(12桁): 2091M tripcode/s
> 検索速度(10桁): 6387M tripcode/s

wwwww

836:名無しさん@お腹いっぱい。
15/08/08 21:04:42.47 dtPf+oWDQ
くっそー、去年入院してなければ、新PC買えてたのに・・・

837:◆/Meriken/.
15/08/08 22:57:54.17 T37r4V/3W
それは残念… 体をお大事にしてください。

838:◆/Meriken/.
15/08/08 23:25:03.71 T37r4V/3W
現在新しいCUDA用の10桁トリップ検索のコードの整理中。
MaxwellでなくてもCompute Capabilityが3.2以上だったら
相当速くなりますね、これ。

839:名無しさん@お腹いっぱい。
15/08/09 00:13:39.77 nCpNACzqB
昨日1日でJohnDoeさんが獲得した10桁経験値:約2600

840:◆/Meriken/.
15/08/09 02:10:01.39 uSLu2Mmwt
コードをいじってたら1G TPS超えましたw すごいなこれ。

841:◆/Meriken/.
15/08/10 08:27:10.16 hTRYDfLll
CUDAの10桁トリップ検索の新しいバージョンですが
とりあえずカーネルが1個のものが出来ました。
速度は980Ti (+300MHz)で870M TPSと遅め(?)ですが、
実行ファイルの大きさは普通ですw

とりあえずこれを仕上げて次のバージョンにして、
カーネルが4096個のものは次の次のバージョンに
取り込むことにします。

842:◆/Meriken/.
15/08/10 09:49:34.63 hTRYDfLll
速度をきちんと測ったら826M TPSだったorz
やっぱりこれはカーネルを4096個作るしかないのか…

843:名無しさん@お腹いっぱい。
15/08/10 10:17:52.68 Xicq8uXte
がんば!

844:◆twitter/881w
15/08/10 15:18:10.46 sssNqN/h+
頑張れ!

845:( ´_ゝ`) ◆POTETO//92
15/08/10 15:19:13.12 6+dd/K+8+
ビデオカード以外に検索速度早くなる方法とかないんかな

846:混沌 ◆YvAqloolpAvY
15/08/10 16:02:19.57 xc9s5eMaD
できるだけ沢山のパターンを用意することで パターンあたりの検索速度は高速化していくはず

時間あたりのトリップ計算回数が変わらないなら マッチングするパターンを増やせばいいっつーw

847:混沌 ◆YvAqloolpAvY
15/08/10 21:27:39.78 xc9s5eMaD
そういえば、ふと思ったのだけども
現在はCPUとGPUを両方使って検索する場合、それぞれでトリップの計算をぶん回しながら、それぞれでパターンマッチをしている?
検索パターンはどちらも共通なのだし、CPU側とGPU側で チェックできる特殊パターンの違いもあるから
使用するデバイスにCPUがある場合 CPU側で算出したトリップも、GPU側で算出したトリップも、パターンマッチはCPU側でするっていうのはどうなんだろうか

848:◆/Meriken/.
15/08/11 08:16:45.16 xGw6+VaWk
>>822
GPUでかなり絞りこまないとデータの転送量が大きくなりすぎて
使いものにならないんですよね。現在のMTGでは
1パターンの場合1/1073741824まで絞り込んでいますが、
これでも足りないぐらいです。
絞り込まなかったら5完を1個見つけるのに数Gバイト転送しなくてはいけません。

849:◆/Meriken/.
15/08/11 09:35:34.45 xGw6+VaWk
実験用のコードがJohnDoeさんのFinal Ver.よりびみょ~に
速くなったみたいです。本当に微妙なので現在厳密に測定中。
うちに戻る頃には結果が出てるはずです。楽しみだな~

850:混沌 ◆YvAqloolpAvY
15/08/11 10:13:23.35 bEI6lin3S
>>823
そっか 昔も今もサブシステムを使うと 転送がネックに・・・w

851:◆/Meriken/.
15/08/11 14:54:31.02 xGw6+VaWk
結局実験用のコードはJohnDoeさんのFinal Ver.より
7M TPSほど速くなりました。ほとんど最適化の余地が
残っていなかったので、まあ上出来でしょう。
あとはビルドと配布の方法を考えないと…

852:◆/Meriken/.
2015/08/1


853:2(水) 09:58:39.31 ID:DhyNCmSCf



854:名無しさん@お腹いっぱい。
15/08/12 10:09:21.09 IL3vUbF2p
おつかれー

855:( ´_ゝ`) ◆KKkKKkKKYw
15/08/13 04:33:32.12 VooQL7EDe
トリップキー違うので◆ZZZZZZZZTI 2つある

856:3D梨 ◆pPPPPpppPPCB
15/08/13 12:23:01.03 9Lu3kuqC4
手違いで12桁の準10桁を出してしまったので欲しい人は言ってくれ

857:名無しさん@お腹いっぱい。
15/08/14 00:58:50.76 WOhjckKKL
稼働率が0.0%からあがらないのだがこれでいいのか?
トリップは受け取ったけど

858:3D梨 ◆pPPPPpppPPCB
15/08/14 01:05:43.02 wOfp7Pobq
>>831
どうやら稼働率と検索時間は比例しないらしい
おかげで私は稼働率が低い

859:名無しさん@お腹いっぱい。
15/08/14 01:25:09.56 WOhjckKKL
>>832
へぇ、今日始めたばかりなんだ
だから検索時間も稼働率も0だぜ
発見してもらったトリップは4個ぐらいあるけど

860:◆/Meriken/.
15/08/14 01:35:57.57 Q2m6EUXXE
自分でMTGを動かして検索しないと稼働率は上がりませんよ。

861:名無しさん@お腹いっぱい。
15/08/14 01:39:55.90 WOhjckKKL
>>834
MTGがよくわかりません先生

862:3D梨 ◆pPPPPpppPPCB
15/08/14 01:54:57.73 wOfp7Pobq
>>833
>>834
ああそういう事ですかw

>>833
MerikenTripcodeGeneratorって持ってますか?
取り敢えず10桁か12桁で検索染みてください
検索して貰ってもレベルは上がらないですよ


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch