【トリップ検索】Meriken's Tripcode Finder@sc 2at SOFTWARE
【トリップ検索】Meriken's Tripcode Finder@sc 2 - 暇つぶし2ch500:◆Meriken.Z.
15/07/07 08:26:23.68 KvHu1PNjU
うーん、やっぱり難しい! 一番のボトルネックになっているのは
keySchedule[]の参照で、これまではループを展開して
この問題を解決してたけど、この方法だとコードが
キャッシュに乗らないんだよなあ。keySchedule[]の動的生成は
コストがかかり過ぎて上手くいかなかったし、どうしたものか…

501:◆Meriken.Z.
15/07/07 13:21:19.15 KvHu1PNjU
JtRのKS生成のルーチンはこんな感じだけど、
何とかもっと単純に出来ないものか…

s = 0;
for (round = 0; round < 16; round++) {
s += DES_ROT[round];
for (index = 0; index < 48; index++) {
p = DES_PC2[index];
q = p < 28 ? 0 : 28;
p += s;
while (p >= 28) p -= 28;
bit = DES_PC1[p + q];
bit ^= 070;
bit -= bit >> 3;
bit = 55 - bit;
if (LM) bit = DES_LM_KP[bit];
*k++ = &DES_bs_all.K[bit] START;
}
}

502:◆YSRKEN.ceVZZ
15/07/07 20:37:26.26 U/JTsIy7s
素人考えで申し訳ありませんが、このsとかpとかqとかってSIMD化できない感じなんですか?
後、「if (LM)~」はループ外に弾きだして、qの初�


503:匀サは別の配列にして(DES_PC3みたいな配列を事前作成)、whileループで回る回数を減らせるなら減らして……言葉じゃ伝わりづらいのでソースで後で書きます!(「*k++~」の行の意味がよく分からないのが悔しい……)s = 0;for (round = 0; round < 16; round++) {  s += DES_ROT[round];  for (index = 0; index < 48; index++) {    p = DES_PC2[index];    q = p < 28 ? 0 : 28;    p += s;    while (p >= 28) p -= 28;    bit = DES_PC1[p + q];    bit ^= 070;    bit -= bit >> 3;    bit = 55 - bit;    if (LM) bit = DES_LM_KP[bit];    *k++ = &DES_bs_all.K[bit] START;  }}



504:◆Meriken.Z.
15/07/07 22:23:41.31 KvHu1PNjU
>>485
お、元気にしてましたか? これはGPGPUの話で、
__constantメモリ空間にあるkeySchedule[]にアクセスすると
遅くなるので、なんとかレジスタだけを使って
on the flyでkeySchedule[]の値を生成できないかという
ことなんです。だから単純に並列化は出来ないんです。

505:◆Meriken.Z.
15/07/07 22:26:10.29 KvHu1PNjU
まあくわしくはMTEとJtRのソースコードを見てください。

506:◆YSRKEN.ceVZZ
15/07/07 22:41:11.16 U/JTsIy7s
>>487
掲載箇所ってOpenCL10.clの方ですか?
OpenCL10.clにはkeySchedule[0x300]が__constantにベタ書きされていますが
それをあえて毎回生成したいってことですよね?

507:◆Meriken.Z.
15/07/07 22:48:43.41 KvHu1PNjU
>>488
S-Boxを呼び出すときに必要に応じて必要な値だけを生成したいわけです。
まあでもコストが掛かりすぎるから無理でしょうね~

508:◆Meriken.Z.
15/07/07 22:56:02.99 KvHu1PNjU
あと残ってる高速化の方法はカーネルのGCNアセンブラでの
書きなおしぐらいだけど、ループを展開しないといけないとなると
作るのがかなりしんどそうだな~

性能を考えたら980 Tiを買ってCUDAに戻るべきなんだろうけど、
JohnDoeさんが超いい仕事をしたのでやることが何も
残ってないというw

509:◆Meriken.Z.
15/07/07 23:08:22.25 KvHu1PNjU
まあでもAMDのOpenCLコンパイラはS-Boxを
全部展開しちゃうので、これを展開せずに
命令キャッシュに残るようにすればだいぶ速くなるかも
しれないな。16KBもあればなんとかなるでしょ。

510:名無しさん@お腹いっぱい。
15/07/07 23:24:55.53 ENxYwcD6M
JohnDoeのお仕事でみんなの検索速度も上がるん?

511:名無しさん@お腹いっぱい。
15/07/08 06:37:52.53 sQXUDNABu
バージョンアップ期待

512:◆Meriken.Z.
15/07/09 09:16:16.44 UBRoWJu7Y
Radeon用のOpenCL版も大分高速化できそうなので
いっしょにまとめてバージョンアップします。

513:◆Meriken.Z.
15/07/09 09:41:44.05 UBRoWJu7Y
実は昨日keySchedule[]の問題を解決する
うまい方法を思いついたんですよね。
帰ったら仕上げちゃおうっと。

514:◆Meriken.Z.
15/07/10 06:14:43.05 y0akbXN7/
コンスタントメモリへのアクセスを圧縮して
ループを展開しないでもだいぶ速くなったけど、
測ってみたらループ展開したルーチンよりちょこっと速いぐらいでした。
次はカーネルをなるべく単純化してレジスタを削ってみようっと。

515:名無しさん@お腹いっぱい。
15/07/10 09:08:03.55 K5az3Igjo
がんば

516:名無しさん@お腹いっぱい。
15/07/11 15:34:34.75 6nZpWaCTK
10桁で単体2GTPSオーバーキタ━━(゚∀゚)━━ッ!!
JohnDoeさんインフレ杉wwwww

517:名無しさん@お腹いっぱい。
15/07/11 15:42:29.36 ud/WTN8yX
すげぇなぁ
ソフトのカスタム化の効果なの?

518:名無しさん@お腹いっぱい。
15/07/11 16:53:13.20 6nZpWaCTK
"Pure Register version"なるものを作っちゃったらしいwwwww
URLリンク(github.com)

519:◆Meriken.Z.
15/07/11 17:11:35.04 d+8czqBW0
うーん、素晴らしい…

GTX580だと共有メモリを使わないでレジスタだけだと
全然スピードが出なかったんですよね。
Titan X/980 Tiは完全に別物なんでしょうね~
検証用に980 Tiを買うしかないか!

520:◆Meriken.Z.
15/07/11 17:34:45.34 d+8czqBW0
OpenCL版も関数が強制inlineじゃなきゃもっと速くできるのになあ。
やっぱGCNアセンブラかな。

521:累計 ◆wop.8OO8.qow
15/07/11 21:43:50.42 rClxP6a1l
このまま野放しにして横取りされる悪寒


522:



523:◆Meriken.Z.
15/07/11 23:21:48.08 d+8czqBW0
まあもともとオープンソースというのはそういうものですしね。
JohnDoeさんの成果を私が取り込むのも自由なので
私としては願ったりかなったりです。

524:◆gZZZZZZZZg
15/07/11 23:47:32.54 q8WJdzm0I
ヴァージョンアップ期待っすね~

525:◆Meriken.Z.
15/07/12 02:14:19.82 lasbuJgKn
新しいOpenCL版、古いドライバだと速度が出ませんでしたorz
ここらへんはバイナリを普通に添付できるCUDAのほうが
筋がいいですね。Catalyst 14.12では速くなってるので
良いことにしておきます。

526:名無しさん@お腹いっぱい。
15/07/13 20:08:00.06 VGL2KM4Bh
新生検索君1号X2が速度アップしたのが新OpenCL版の威力ですかね
乙乙

527:◆Meriken.Z.
15/07/14 00:45:58.09 HbOauf6bd
検索君1号もようやく1G超えです。結局キーの配列の半分を動的に
生成して残りを共有メモリに押しこむことで、レジスタ数を大幅に
削ってoccupancyを上げることが出来ました。OpenCLではここらへんが
限界でしょう。後はGCNアセンブラで頑張るしかないですね。

528:◆gZZZZZZZZg
15/07/14 13:39:38.41 IkpKA8ADS
メリケンさんのHP死んでますか?私だけ?繋がらない・・・・

529:名無しさん@お腹いっぱい。
15/07/14 14:37:15.80 fXdFpFgoW
meriken.ygch.netにはつながるけどtripcode.netにはつながらない?

530:名無しさん@お腹いっぱい。
15/07/14 14:40:24.59 Taca5ozSH
tripcode.netは繋がらないですね

531:◆Meriken.Z.
15/07/14 15:02:32.09 HbOauf6bd
もうしばらくしたら復旧するはずなのでしばらくお待ちください。

532:◆Meriken.Z.
15/07/14 15:12:47.82 HbOauf6bd
>>508
> OpenCLではここらへんが限界でしょう。

これを書いてから、ループ展開してからキーの配列を
レジスタから追い出す方法を試していないことに気づきました。
ひょっとしたらひょっとするかもしれないな~

533:名無しさん@お腹いっぱい。
15/07/14 15:28:37.78 Taca5ozSH
なお、500位までにランクインしている日本のスパコン台数は2014年11月の32台から39台へと増加している。

  今回のTOP500全システムの合計性能は363PFLOPSとなり、2014年11月の309PFLOPSから向上している。2014年6月は274PFLOPSだった。しかし、TOP500ではこれまでの傾向からすると性能の上がり幅が鈍化していると言う。

  アクセラレータやコプロセッサを利用したシステムの数は88台で、2014年11月では合計75台だった。その内の52台がNVIDIAのシステムを採用、AMDシステムの採用数は3台、Intel Xeon Phi採用スパコンは33台となっている。

534:名無しさん@お腹いっぱい。
15/07/14 16:47:47.08 fXdFpFgoW
ようやくなおったのかな

URLリンク(tripcode.net)
のグラフで見ると
13:00ちょっと前くらいから16:40くらいまで止まってた感じ?

535:名無しさん@お腹いっぱい。
15/07/14 16:51:04.36 MLvKQRzBN
俺のPCトリップ検索とかツール系向いてなさそう
検索速度遅すぎてイライラする0(:3 )~ _('、3」 ∠ )_

536:名無しさん@お腹いっぱい。
15/07/14 20:19:27.77 rLO87sGjs
>>516
> 検索速度遅すぎてイライラする0(:3 )~ _('、3」 ∠ )_
ちなみにどの位?俺よりは速いと思う。w

537:◆gZZZZZZZZg
15/07/14 22:11:03.90 F/IGATYkz
私も他力本願で申し訳ないですけど・・・・正直自分検索はあまり期待せず。。。

538:名無しさん@お腹いっぱい。
15/07/15 13:25:36.30 LJalR6mSk
>>517
12桁が16.21~6.91M tripcode/s
10桁が10.40~2.32M tripcode/s
0(:3 )~ _('、3」 ∠ )_

539:名無しさん@お腹いっぱい。
15/07/15 14:17:51.38 L4heEM3En
さっき10桁2407Mって
URLリンク(fast-uploader.com)

540:◆I.O./.m.w.
15/07/15 15:52:17.24 LJalR6mSk
0(:3 )~ _('、3」 ∠ )_
検索速度遅すぎてもうイライラしてくる

541:◆Meriken.Z.
15/07/16 00:28:11.10 43buePVb9
OpenCL版もさらに速くなりそうです。
今日は帰ったら仕上げちゃおうっと。

542:◆Meriken.Z.
15/07/16 13:47:13.32 43buePVb9
やった~ 7970 1枚で294M TPS出たぞ!
やっぱりループ展開の効果は抜群だなあ。

543:◆Meriken.Z.
15/07/16 13:52:22.22 43buePVb9
コードは余裕でキャッシュに収まってるけど
レジスタ数はギリギリだなあ。

> codeLenInByte = 31624 bytes;
> NumVgprs = 114;

544:◆Meriken.Z.
15/07/16 17:04:48.29 43buePVb9
検索君1号で新しいルーチンを試したら
1938M TPS出たけど、消費電力は1574Wでしたorz
電源の容量が1200Wなので全然間に合っていません。
クロックを落とさないと24時間稼働は無理だこれ…

545:名無しさん@お腹いっぱい。
15/07/16 19:58:21.42 fen4UUjRy
また燃えそうな

546:◆gZZZZZZZZg
15/07/16 23:58:18.90 OoKydxFcg
JohnDoe氏・・・・一人で2百億ですけど。。。

547:◆Meriken.Z.
15/07/17 00:20:48.00 x6FZAwJju
電圧とクロックを抑えたら1200Wで1800M TPS出ました。
これならまあ何とか許容範囲内かな。

548:◆Meriken.Z.
15/07/17 00:24:05.57 x6FZAwJju
>>527
前にも時々12桁トリップ検索に参加してましたよ。
速いですよね~

549:◆Meriken.Z.
15/07/17 00:29:08.43 x6FZAwJju
AMDのドライバは検索プロセスを複数走らせないと
カーネルによってはGPU使用率が極端に下がっちゃう
みたいです。検索プロセスを複数動かすルーチンは
削除しちゃったので元に戻さないと…

550:◆Meriken.Z.
15/07/17 00:36:46.88 x6FZAwJju
GitHubには残ってないけどどこにやったかな…

551:名無しさん@お腹いっぱい。
15/07/17 00:43:23.21 a9IkgCcaQ
JohnDoeさんとMerikenさんの超強力ツートップの活躍に期待!

552:◆Meriken.Z.
15/07/17 03:33:49.81 x6FZAwJju
古いプロセス関連のコードを引っ張りだして移植してみましたが、
問題なく動いているようです。ゆぐちゃんに接続して
1700M TPS出ているので上出来でしょう。
ようやくGCNの本来の性能を引き出せてあの待て屋を
追い抜いた感があります。長い道のりだった…

553:名無しさん@お腹いっぱい。
15/07/17 04:23:49.72 q/OWslh08
とうとう鳥屋先輩をこえたか

554:◆Meriken.Z.
15/07/17 06:33:36.87 x6FZAwJju
>>534
GCNでもっと速度が出るのはわかってたので
実にスッキリしましたw Bitslice DESは実に難物だったけど、
ようやく最適化のポイントがつかめた気がします。

555:◆I.O./.m.w.
15/07/18 02:30:17.08 0M1MGtocG
違うPCで試したらサクサクだがノートPC死にそう

556:◆Meriken.Z.
15/07/18 07:33:04.31 DxX6uZTEg
>>536
温度には気をつけてくださいね~
MSI Afterburnerとかで管理するのがいいです。

557:◆Meriken.Z.
15/07/18 07:36:32.88 DxX6uZTEg
JohnDoeさん、また速度が上がってるな~
やっぱ980 Tiを買っておこうっと。

558:◆Meriken.Z.
15/07/18 09:24:06.49 DxX6uZTEg
検索君がなかなか安定しないので、検索エンジンを改良しつつ
ビデオカードの設定を現在調整中。効率良くなりすぎるのも
考えものですね。

559:◆I.O./.m.w.
15/07/18 12:09:35.59 0M1MGtocG
部屋暑くてやばいw

560:3D梨 ◆T.H.U.J.I.
15/07/19 09:49:39.45 t5DmjdKsh
>>313
ご結婚おめでとうございます

前トリップが流失したのでこれからはこちらを使います

561:◆Meriken.Z.
15/07/20 05:14:24.96 hRnEvtQfC
>>541
了解しました~ これからもよろしく。

562:◆Meriken.Z.
15/07/20 08:11:39.36 hRnEvtQfC
OpenCLのモジュールで例外が頻発したので
ドライバをCatalyst 14.12から15.7へ入れ替えたら
それだけで速度が100M TPSほど上がりました。
後はこれで安定して動いてくれたらいうことないんだけどなあ。

563:名無しさん@お腹いっぱい。
15/07/20 14:30:46.38 oxrP6CD5k
12桁も速くなりますか?

564:名無しさん@お腹いっぱい。
15/07/20 14:44:14.59 Je0h56Vln
JohnDoeさん10桁単体2900MTPS突破して3GTPS目前とかもはや人間業じゃねーwwwww

でよく見たらバイナリも公開してくれてるのね
URLリンク(github.com)

MerikensTripcodeEngine64.7z
Size: 18,262,386 bytes SHA-1: e3723ad9e6ba1807df173f5014ae85979c726133

MerikensTripcodeEngine64.exe
Size: 546,571,776 bytes SHA-1: 7123b3137f16086087f99ffa8d2a8e8d0630bddf

"WARNING_LARGE_FILE_WHEN_EXTRACTED"の通り解凍したらめちゃでかいwwwww

Prerequisites.txt
> Nvidia Maxwell cards (sm_50 and above)
> Newest GeForce Driver

これはcudart32_75.dllとcudart64_75.dllをMerikensTripcodeFinder.exeと同じ場所に置いて
上のMerikensTripcodeEngine64.exeでMTF付属のMERIKENsTripcodeEngine64.exeを上書きして使えば
x64Win+Maxwell世代のGeForce+最新ドライバ(353.30以降?)でMTFの10桁GPU検索が大幅スピードアップ!ってことでいいんすかね?

Maxwell世代のGeForce所有者の方々の人柱レポに期待wwwww

565:◆Meriken.Z.
15/07/20 15:29:46.83 hRnEvtQfC
JohnDoeさん、Bitslice DESのS-Boxをいじってるぐらいだから
相当詳しいんでしょうね~

URLリンク(github.com)

lop3.b32は相当おいしい命令みたいですね…

URLリンク(devtalk.nvidia.com)
URLリンク(devtalk.nvidia.com)

566:名無しさん@お腹いっぱい。
15/07/20 15:43:49.72 VWWCo3SHZ
でもこんがり焼けそうwww

567:名無しさん@お腹いっぱい。
15/07/20 18:19:45.49 nmy4Z9sLy
>>545
うちのSTRIX GTX980で試してみた。TiやXじゃなくて申し訳。

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1.2 Free Edition
【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間のGPU検索の平均速度】 465.43M tripcode/s

GPU温度は室温31度で75弱で安定、FANが1600rpm前後。
Power Targetは85%強って所だった。

で、普通どの位かなと、試そうと思ったら、
不正なトリップでエラー、実行出来なかった(苦笑
無印980ですらこれだから、TiやXは言わずもがな。。。

568:名無しさん@お腹いっぱい。
15/07/20 19:18:32.62 Je0h56Vln
>>548
レポ乙乙
すんげー速度出てるしwwwww

569:◆エリーチカニホレタ。ー゙゚リ!
15/07/20 19:22:20.15 fCk6Vg4T1
750Tiでも試そうとしたら、ディスプレイドライバがリセットするばかりで上手くいかない……うごごごご

570:名無しさん@お腹いっぱい。
15/07/20 19:50:28.89 Je0h56Vln
GM200に最適化しすぎてGM107だと実行できなくなってたりしてw

一応CUDA7.5に対応したドライバは352.86から?みたいなんで
353.30しか試してなければ352.86と353.06も試してみては
URLリンク(www.4gamer.net)
URLリンク(www.4gamer.net)

あとはツールでコアクロック下げたりしてみるとか

571:名無しさん@お腹いっぱい。
15/07/20 19:52:27.83 78QWVNS9a
しかしここまで早くなるとはなー

572:名無しさん@お腹いっぱい。
15/07/20 21:46:05.42 Je0h56Vln
さすがJohnDoeさんwwwww
MerikensTripcodeEngine64_sm50.7zとMerikensTripcodeEngine64_sm52.7zに分けてくれてるッwwwww
そこにシビれるwwwww
あこがれるゥwwwww

573:◆エリーチカニホレタ。ー゙゚リ!
15/07/20 22:28:20.64 fCk6Vg4T1
>>551
えっと、一応定格利用で、ドライバは353.30ですね……
>>553
分けてあるのか……あとで試してみよう

574:名無しさん@お腹いっぱい。
15/07/20 22:54:26.65 nmy4Z9sLy
クロック 標準OC+100MHz上げて1429MHzで30分ほど、検索回してみた。
10桁検索 平均で500M tripcode/s越えてワロタw

此でもMAX 76度ですんでるんだから、すげぇ。
7970 リファだと、ドライヤーブン回ってたってた状態なのに。

575:◆Meriken.Z.
15/07/21 00:50:58.32 HmEEJFC8x
しかしMaxwellにここまでの潜在能力があるとは驚きましたね~
手元の290Xで今450M TPSほど出てるので、
295X2が4枚で3600M TPS出せる計算だけど
ワッパを考えたらあんまり現実的じゃないし…
いずれにせよちょっと前までは考えられない数字ですね。

576:◆Meriken.Z.
15/07/21 02:59:01.93 HmEEJFC8x
MaxwellのLOP3.LUT命令はやっぱり効果抜群ですね。
上がJohnDoeさんのS-Box、下がJohn the Ripperのだけど、
ゲートカウントが全然違うもんなあ。

// Bitslice DES S-boxes with LOP3.LUT instructions
// For NVIDIA Maxwell architecture and CUDA 7.5 RC
// by DeepLearningJohnDoe, version 0.1.6, 2015/07/19
//
// Gate counts: 25 24 25 18 25 24 24 23
// Average: 23.5

* Bitslice DES S-boxes making use of a vector conditional select operation
* (e.g., vsel on PowerPC with AltiVec).
*
* Gate counts: 36 33 33 26 35 34 34 32
* Average: 32.875

577:◆Meriken.Z.
15/07/21 03:21:57.09 HmEEJFC8x
JohnDoeさんのネタの元はひょっとしてこれかな?
しかしひどいプレゼンだなあ。"I Suck"って…

Bitslice DES with LOP3.LUT - Steve Thomas
URLリンク(www.irongeek.com)

578:◆Meriken.Z.
15/07/21 03:29:46.53 HmEEJFC8x
ベンチマークの結果が来てますね。
3G TPS超え、おめでとうございます!

URLリンク(github.com)

579:◆Meriken.Z.
15/07/21 04:08:05.83 HmEEJFC8x
相変わらずAMDのOpenCLドライバは不安定ですけど、
MTFはなんとかちゃんと動かすことが出来そうです。
検索中にカーネルを動的にリコンパイルするときに
OpenCLモジュールから戻ってこないのには参りました。

580:◆Meriken.Z.
15/07/21 04:12:37.76 HmEEJFC8x
というわけでOpenCL版を2倍以上高速化した新しいバージョンを
準備中です。名前は"Meriken's Tripcode Generator 2.0.0"にする
つもりです。JohnDoeさんの成果も近いうちに取り込む予定です。
お楽しみに。

581:名無しさん@お腹いっぱい。
15/07/21 06:05:09.59 BAKb6jIaL
2倍・・・!?

582:名無しさん@お腹いっぱい。
15/07/21 06:52:41.61 O4Ne3MYKW
赤い彗星?

583:◆Meriken.Z.
15/07/21 07:06:16.67 HmEEJFC8x
>>562
あ、2倍なのは10桁トリップ検索だけです。念のため。
冷却がしっかりしてればこれぐらい出ます。

7970 300M TPS
290X 450M TPS
7990 600M TPS
Fury X 650M TP (予想)
295X2 900M TPS (予想)

584:◆Meriken.Z.
15/07/21 07:31:06.14 HmEEJFC8x
bitselectを使わないS-Boxのほうが速いってほんまかいな。
ちょっと試してみようっと。

URLリンク(www.openwall.com)

585:◆Meriken.Z.
15/07/21 07:45:01.38 HmEEJFC8x
やっぱりそんなことはなかったorz Alexanderさん…

586:◆I.O./.m.w.
15/07/21 09:24:02.93 ipEw/jNnH
検索速度が遅いから準9連いつ出るのかわからん(´・_・`)

587:◆Meriken.Z.
15/07/21 15:26:47.94 HmEEJFC8x
更に超アグレッシブに最適化して7970で380M TPS、
290Xで530M TPS出るようになりました。
NumVgprsが最悪のケースで127なので本当にギリギリです。
定格の85%でゆぐちゃんに接続して2100M TPSほど出ているので
後は電源さえ何とかすれば2500M TPS出る計算ですけど、
さすがに無理がありますねw

588:◆I.O./.m.w.
15/07/21 22:34:11.77 ipEw/jNnH
検索速度あげる方法とかあればいいんだが・・・(・ω・`)金かかりそう・・・

589:名無しさん@お腹いっぱい。
15/07/21 22:41:19.80 O4Ne3MYKW
まあデスクトップPCに金かけるしかないもんな
後はユグドラシルで検索してもらうぐらいしかないかと

590:名無しさん@お腹いっぱい。
15/07/21 22:53:48.82 2v0SC5Lxj
他力検索最強

591:◆mMmmMmMMM.
15/07/21 23:10:50.37 0iAJnQFgN
純8連+最後の1個も同じ文字だったっていう惜しいのがありました。
秒速4.6Mの私でも10文字トリップの準9連は何個か出てました。
その中でも結構綺麗なものを1つ。

592:◆mMmmMmMMM.
15/07/21 23:13:08.41 0iAJnQFgN
どこで喋っても信じてもらえないし、リアルタイムのときも一人でネタだって言われたけど、
2chやってて一番驚いたのは同じスレでIDが他人と被ったこと。

593:名無しさん@お腹いっぱい。
15/07/21 23:18:42.53 O4Ne3MYKW
>>573
ID被りはたまーにあるよ
モバイル通信だと、さらに被る確率がアップするらしいけど

594:◆mMmmMmMMM.
15/07/21 23:30:34.33 0iAJnQFgN
>>574
あっ、そうなんですか。
モバイルではなかったんですけど、同じ地区の同じプロバイダーとかだったのかな??

595:◆Meriken.Z.
15/07/22 11:01:50.41 j28sd3jVu
>>569
まあお金をかけるといっても最初は1万円ぐらいの
安いビデオカードで十分ですよ。

596:名無しさん@お腹いっぱい。
15/07/22 12:53:01.81 LZBKefAGI
>>575
スレ違いだけど 2chのIDは たしか同じ日だと65536通りしか存在しないらしい
その数以上のIPから書き込まれたらIPが違っても必ずID被ってる二人が板のどっかにいる

597:名無しさん@お腹いっぱい。
15/07/22 13:07:54.82 LZBKefAGI
LOP3ってFPGAのLUTみたいなことができる命令ってのはわかったけど
命令の仕様がCUDAのリファレンスにも書いてなかった

598:◆mMmmMmMMM.
15/07/22 13:08:54.71 RWd52VG80
2^16分しかIDなかったとは知りませんでした。。。
1日100レス程度の自作板で被ったと思ったんだけど、そんな確立でもないんですね。

599:名無しさん@お腹いっぱい。
15/07/22 13:22:34.73 LZBKefAGI
例のJohnDoeさんのコードに真理値表のビット列を2つ指定してる行があるのが謎
あとマクロの引数で出力する変数を指定してると思ったら同じ位置の引数で真理値表を指定してるところもある

まあ自分がCUDAのマクロの仕様知らないからわからないだけかもだけど

600:名無しさん@お腹いっぱい。
15/07/22 13:33:42.20 LZBKefAGI
LOP3.LUT dest, src1, src2, src3, TruthTableByte

なるほど
てかよく考えたら真理値表を真理値表に入力するのは普通に意味あることか

601:◆Meriken.Z.
15/07/22 13:48:53.81 j28sd3jVu
TruthTableByteは"WolframAlpha truth table"に対応しているそうで。

602:◆Meriken.Z.
15/07/22 13:52:45.73 j28sd3jVu
例:
"a ^ ((c ^ a) & b)" -> 10111000 -> 0xB8
"(b & a) ^ ((~b) & c)" -> 11100010 -> 0xE2
"a & ((c ^ a) & b)" -> 01000000 -> 0x40

603:◆Meriken.Z.
15/07/22 14:01:


604:00.40 ID:j28sd3jVu



605:名無しさん@お腹いっぱい。
15/07/22 14:10:51.89 /UoV6M0P3
>>584
ありがとうございます

最初長い16進のデータが真理値表でビット位置ごとに別の真理値表が
使えるのかと思っちゃいました

最後の2桁の16進数が真理値表なんですね

606:◆Meriken.Z.
15/07/22 14:17:48.40 j28sd3jVu
"xA55AA55AF0F5F0F5"とかそういうには全部一時変数のはずです。
長い間触ってないのでPTXの仕様はほとんど忘れちゃいましたけど、
GNU Assembler準拠だったはずです。

607:名無しさん@お腹いっぱい。
15/07/22 14:28:43.88 /UoV6M0P3
>>586
たしかに命令の機械語に64ビット定数を2個も含めるのは無理ですよね
コードに書かなくても前の方に定数セットしてくれる命令が勝手に入るってことですね

608:◆Meriken.Z.
15/07/22 14:35:31.36 j28sd3jVu
定数じゃなくてレジスタにリネームされているはずです。
自動生成されたS-Boxの一時変数はこんな感じの名前がついています。

609:名無しさん@お腹いっぱい。
15/07/22 14:51:27.94 /UoV6M0P3
>>588
よく見たら0xで始まる定数じやないことに今気がつきました

別のところで宣言されてる普通の変数ですね
すいませんでした

610:◆YU8WTTW8UY
15/07/22 18:22:08.32 1QJTB87Lj
>>576
1万円かぁ(・ω・`)意外と高い

611:◆エリーチカニホレタ。ー゙゚リ!
15/07/22 18:53:37.46 FNRdLAXgb
>>590
コスパいいだけマシやん(遠い目)

612:名無しさん@お腹いっぱい。
15/07/22 19:03:15.56 Kbr/UgMBO
まあ学生とかだと高いよね

613:◆エリーチカニホレタ。ー゙゚リ!
15/07/22 19:07:39.49 FNRdLAXgb
JohnDoe版(sm50)は動いたので報告。ヤヴァいなこれ……

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1.2 Free Edition→JohnDoe版(sm50)
【OS】Microsoft Windows 8.1 Pro
【ディスプレイドライバ】353.30

【検索デバイス】GPUのみ
【使用するGPU】すべて使用
【GPU】GALAXY GF PGTX750TI-OC/2GD5
【CPU】Intel Core i7-4790K

【1SMあたりのブロック数(CUDA)】256
【検索プロセスの優先度】アイドル
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【 3分間のGPU検索の平均速度】 30.39M→138.81M tripcode/s

614:名無しさん@お腹いっぱい。
15/07/22 19:28:18.41 znNeHD48r
検索速度上がり杉ワロタ

そういえば前スレで出てた
10桁の二構のGPU検索の速度が出ないとかいうのは
JohnDoeさん版でも同じ?
スレリンク(software板:777番)-782

615:◆C.S.S.C./.
15/07/22 20:26:44.00 1QJTB87Lj
>>591コスパ良くなるのはいいが高いんだよなぁ(???)

>>592中学生だから高く思える(???)

616:◆C.S.S.C./.
15/07/22 20:27:08.08 1QJTB87Lj
(・ω・`)顔文字の文字化け

617:名無しさん@お腹いっぱい。
15/07/22 20:58:11.12 b99epkGOO
>>594
>>548の環境で、二構をONにして、検索かけてみたけど、
普通に400M Over出る。

618:◆Meriken.Z.
15/07/23 00:45:44.65 Mhk7cpYpQ
>>594
それは実はMTEのバグで、JohnDoeさんが直してくれたのです。
ありがたや~

619:◆Meriken.Z.
15/07/23 11:00:43.82 QLY5jkTr4
キーの配列をようやく全部レジスタに押しこむことに成功して、
7970で400M TPS、290Xで560M TPS出るようになりました。



620:これでテストさえ済めばようやく新しいバージョンの完成です。もうちょっと速くできそうだけど、まあここまで速度が出れば十分でしょう。



621:◆YYYYyyYYYY
15/07/23 11:03:31.84 Mhk7cpYpQ
これなんか割と綺麗かも。

622:名無しさん@お腹いっぱい。
15/07/23 12:04:45.43 VYNF18f/L
日立のメインフレームで使われたSHA-1実装の論理図面が公開される
URLリンク(developers.srad.jp)
URLリンク(www.canal.mokuren.ne.jp)

スラッシュドットでこんな記事出てました

623:◆a.o.u.u.u.
15/07/23 13:44:14.28 AZvU3Ijrq
なんか惜しいってトリップ見つけた(・ω・`)

624:◆YYYYyyYYYY
15/07/24 01:41:35.76 XwdH0klFT
>>601
これはこれは… 実に興味深いですね。ただ12桁トリップ検索も
ぜひ改良したいところですけど、10桁トリップ検索ほど改良の余地が
ないんですよね。JohnDoeさんが20G TPSを超えたのは
コンパイラがLOP3.LUTを使っているのが大きいと思われます。
f1~f3が各1命令で実行できるのは素晴らしいです。

#define f1 ( ( B & C ) ^ ( ( ~ B ) & D ) )
#define f2 ( B ^ C ^ D )
#define f3 ( ( B & C ) ^ ( B & D ) ^ ( C & D ) )

#define f1 bitselect(D, C, B)
#define f2 ( B ^ C ^ D )
#define f3 (bitselect(B, C, D) ^ bitselect(B, 0U, C))

625:累計 ◆zzzZzzZzz.
15/07/24 11:01:58.95 Ox1YlhcN0
低速で準連、これが限界ですzzz

626:◆YYYYyyYYYY
15/07/24 12:50:20.36 XwdH0klFT
そういうのもいいですね~ なかなかポイントが高いです。

627:◆mMmmMmMMM.
15/07/24 13:10:33.47 N4IfLS5m3
JohnDoeさんここにきてお話してくれればもっと活性化するのでは?と思ったり。
私はまったくプログラミングの知識ないのであれですが・・・。

628:◆Meriken.Z.
15/07/24 13:15:08.35 XwdH0klFT
JohnDoeさんはコードで語る男、もしくは女なので問題無いですw

629:◆Meriken.Z.
15/07/24 13:18:18.17 XwdH0klFT
検索君、12時間平均で2171M TPS出てますね。
う~ん、夢のような数字です。

630:◆a.o.u.u.u.
15/07/24 13:32:36.92 QcxKqdUdr
準10連って俺のPCだと何ヶ月かかるんだろう()

631:名無しさん@お腹いっぱい。
15/07/24 14:30:29.81 81UceuMvs
純10連はまあ運なので、PC速度は気にせんでもいいんじゃ

632:◆/Meriken/.
15/07/24 15:11:29.18 XwdH0klFT
わくわく

633:◆/Meriken/.
15/07/24 15:13:42.29 XwdH0klFT
でたでたw やっぱりスッキリしてていいなあ。

634:◆a.o.u.u.u.
15/07/24 22:17:50.45 QcxKqdUdr
準10連は運だとしても速度上がったほうがすこしは出やすいと思った

635:◆/Meriken/.
15/07/24 22:30:57.00 XwdH0klFT
そりゃそうですw

636:◆/Meriken/.
15/07/25 03:46:41.85 G7R8+09sq
OpenCLのカーネルのバイナリを保存して再利用するように
実装を変えてみましたが、バイナリがseedの数(4096個)だけあるので
全部出来るのにかなり時間がかかります。この機能は
デフォルトでは切っておいたほうがいいかな。

637:◆Meriken.Z.
15/07/25 08:07:18.95 jaLS6EKMi
バイナリの中身を見てみたらカーネルの関数が
全部含まれていました。道理でビルドに時間がかかって
バイナリがでかくなるわけだ。家に戻ったら
必要のない関数を省かれるようにしようっと。

638:◆Meriken.Z.
15/07/25 08:13:08.43 jaLS6EKMi
あとseedの選び方がかなり偏っていることがわかったので
まんべんなく分布するように直しておきました。
2chのへんてこな仕様のお陰でseedにピリオド('.')が
選ばれることがかなり多いことが分かりました。
いずれにせよこれで純10連も出やすくなるはずです。

639:名無しさん@お腹いっぱい。
15/07/25 13:49:34.72 9ES25Wv8P
NVIDIAのPascal 心がぴょんぴょんしてくる

640:◆/Meriken/.
15/07/25 14:50:39.16 G7R8+09sq
14nmですか。今980 Ti


641:買うかPascalまで待つか迷いますね…



642:◆/Meriken/.
15/07/25 14:54:06.43 G7R8+09sq
2228M TPS (23時間平均)出ました。

次はOpenCLプログラムの動的生成を効率化した
バージョンを試してみます。

643:名無しさん@お腹いっぱい。
15/07/25 15:12:00.72 4/NmfIGpP
でもお高いんでしょ?

644:◆/Meriken/.
15/07/25 15:20:55.13 G7R8+09sq
新しいバージョンは非常にいい感じです。
2.3G TPS出るか出ないかといったところです。
1.1.2だと800M TPS前後だったので本当に3倍いきそうです。
残る手は禁断の実行バイナリ書き換えだけか…

645:◆/Meriken/.
15/07/25 15:36:56.74 G7R8+09sq
clCreateProgramWithBinaryによるオーバーヘッドはほとんど
ないみたいなので、CPUでやってたことをGCNでやればいいだけ
なんだよな。なんだか簡単な気がしてきた…

646:◆a.o.u.u.u.
15/07/25 16:04:04.33 cs+QB9GyY
HARDOFFで安くて性能のいいのでも漁ってくるか・・・

647:名無しさん@お腹いっぱい。
15/07/25 18:32:20.80 Lizdya71g
金を使い出すときりないぞw
まだちうがくせいなら無理せんでもいいんじゃ

648:◆a.o.u.u.u.
15/07/25 19:45:36.29 cs+QB9GyY
それもそうだな

649:名無しさん@お腹いっぱい。
15/07/25 21:12:16.47 gZb5miQ9A
若いならプログラムとか覚えたほうが面白いんじゃない

650:◆a.o.u.u.u.
15/07/26 01:31:33.99 qg4b8dkP/
どう覚えるのかわからない(´・ω・`)

651:◆/Meriken/.
15/07/26 02:19:34.67 w+RVJQNdt
レジスタ数をさらに減らしてみる実験を開始。
volatileキーワードを使って最適化を抑制して、
88まで削れました。84までもうちょいです。
あとはS-Boxを差し替えてやればいいんだけど、
面倒くさいんだよな、これ…

> 16..64 numVGprs -> excellent V and S paralellism (in my thoughts this is when only 4 waves are in the CU)
> 65..84 numVGprs -> this starts to hate when it gets many S instruction dwords (I think 3 waves can sit in a CU)
> 85..128 numVGprs -> 2 small S for 4 V is ok, bug starts to get slow (2 waves)
> 129..255 numVGprs -> try to avoid ALL S instructions if posibble, or else there will be terrible stalls (1 waves)
URLリンク(community.amd.com)

652:◆/Meriken/.
15/07/26 03:43:24.68 w+RVJQNdt
wavefrontを一応3個のっけることはできたんですが、
速度が今までとほとんど変わりませんでしたorz
なかなか難しい…

653:◆/Meriken/.
15/07/26 03:48:09.29 w+RVJQNdt
2295M TPS (12時間平均)

少しずつ速くなってるけどそろそろ限界かな~

654:◆/Meriken/.
15/07/26 15:05:52.99 w+RVJQNdt
実行時のバイナリの書き換えはいまいち使いどころが
なかったので、最適化はとりあえずここまでにして
次のバージョンを用意することにします。

7970 408M TPS
290X 550M TPS
7990 794M TPS
Fury X 800M TPS (予想)
295X2 1100M TPS (予想)

しかし改めて見ると滅茶苦茶速くなったな~
JohnDoeさんと張り合うだけの資金力がないのが
残念ですけど、まあでも上出来でしょう。

655:名無しさん@お腹いっぱい。
15/07/26 22:15:26.55 vHonvJo0/
RAGE FURY PROからATI派です
AMDを応援しています

656:名無しさん@お腹いっぱい。
15/07/26 23:50:07.12 N4nwUqIIw
Mach64から(ry

657:◆/Meriken/.
15/07/27 00:42:23.87 ixMpl4uOX
私もAMDが大好きですw
お願いだからLOP3.LUTを実装して…

658:◆/Meriken/.
15/07/27 00:47:11.63 ixMpl4uOX
気になったのでstackoverflowに丸投げしてみました。
返事来るかな~

Looking for GPU S-Boxes for Bitslice DES with Fewer Number of Registers (<= 14)
URLリンク(stackoverflow.com)

659:◆/Meriken/.
15/07/27 02:00:55.14 ixMpl4uOX
2310M TPS (22時間平均)

ようやく2.3Gを超えました。よしよし。

660:◆/Meriken/.
15/07/27 02:08:02.79 ixMpl4uOX
stackoverflowのは返事が来そうにないな~
まあいいや。時間があるときに自分で探そうっと。

661:◆/Meriken/.
15/07/27 02:14:10.18 ixMpl4uOX
これを見つければいいんだよな。

S1
vsel(x0, x94D83B6C, x6B68D433, a6);
vsel(x1, xD6E19C32, x5CA9E295, a6);
vsel(x2, xB96C2D16, x6993B874, a6);
vsel(x3, x37994A96, x529E962D, a6);

S2
vsel(x0, x996C66D2, xB44BC32D, a2);
vsel(x1, xA55A699A, x668DA556, a2);
vsel(x2, xB66CB43B, x09976748, a2);
vsel(x3, x87A5F09C, xD2994E33, a2);

S3
vsel(x0, x9E49915E, xE13C1EE1, a1);
vsel(x1, x265E97A4, x99A56C53, a1);
vsel(x2, xB32C6396, x47B135C6, a1);
vsel(x3, x5A66A599, xD2699876, a1);

S4
vsel(x0, x56E9861E, x9586CA37, a6);
vsel(x1, x9586CA37, xA91679E1, a6);
vsel(x2, xD2946D9A, x4CA36B59, a6);
vsel(x3, xB35C94A6, xD2946D9A, a6);

662:◆/Meriken/.
15/07/27 02:14:45.38 ixMpl4uOX
S5
vsel(x0, x369CC1D6, x1A676AB4, a4);
vsel(x1, x5BA4B81D, x963969C6, a4);
vsel(x2, x9D49D39C, x2E69A463, a4);
vsel(x3, x1A35669A, x6CF2295D, a4);

S6
vsel(x0, xCAC5659A, x942D9A67, a6);
vsel(x1, x925E63E1, x69A49C79, a6);
vsel(x2, x16E94A97, xB946D2B4, a6);
vsel(x3, x5963A3C6, x1C3EE619, a6);

S7
vsel(x0, x26DAC936, x694E5A8D, a1);
vsel(x1, xB14EE41D, x26DA9867, a1);
vsel(x2, x699C585B, x4E639396, a1);
vsel(x3, x74878E78, x8B7869C6, a1);

S8
vsel(x0, xA59E6C31, x38D696A5, a6);
vsel(x1, xCB471CB2, x34E9B34C, a6);
vsel(x2, x693CD926, x59698E63, a6);
vsel(x3, xC729695A, x919AE965, a6);

663:◆/Meriken/.
15/07/27 05:42:06.38 ixMpl4uOX
0x55555555, 0x33333333, 0x0F0F0F0F, 0x00FF00FF, 0x0000FFFFから
論理演算だけで>>639-640の16進数(x~)を導き出せばいいんだけど、
ゲート数の他にレジスタ数を考慮すると超絶に面倒くさそう…

Optimizing bitslice DES S-box expressions
URLリンク(openwall.info)

664:◆/Meriken/.
15/07/27 05:44:12.23 ixMpl4uOX
でもSSEとかレジスタ8個しかなかったよな。
一体どうなってるんだろ…

665:◆/Meriken/.
15/07/27 06:23:47.80 ixMpl4uOX
そういやSSEではメモリに追い出してたんだっけ。
S-Boxを新しく作るのはちょっと面倒すぎるな。
やっぱアセンブラで頑張るしかないんだろうけど、
考えていた最適化はほとんどOpenCLでできちゃったし、
微妙だな~ たせたとしても50~100M TPSぐらいだろうし…

666:◆/Meriken/.
15/07/27 06:46:46.51 ixMpl4uOX
まてよ。ループ展開が大幅に効率化出来るからもっといけるかな。
まあいいや。またあとでやろうっと。

667:◆/Meriken/.
15/07/27 10:08:06.03 ixMpl4uOX
あれからちょっと調べてみたんですけど、GCNアセンブラで
うまくやれば3個のwavefrontを乗っけて綺麗にこれまでの
1.5倍の速度が出せそうです。次のバージョンを用意してから
取り掛かろうっと。

668:名無しさん@お腹いっぱい。
15/07/27 10:19:01.93 xj/ut6orZ
頑張ってますなぁ

669:◆/Meriken/.
15/07/27 11:09:30.67 ixMpl4uOX
時々ストレスが溜まると憑かれたようにプログラミングが
したくなるんですw でも程々にしておいたほうがいいですね。

670:◆I222222222
15/07/27 11:13:00.38 ixMpl4uOX
どれどれ。

671:◆I222222222
15/07/27 11:13:47.45 ixMpl4uOX
こっちはどうかな。

672:◆/Meriken/.
15/07/27 11:19:45.40 ixMpl4uOX
キーのかぶっていない本物のコリジョンを発見しました。

◆I222222222 #e・モ賓クtツv' (65 A5 D3 95 6F B8 74 C2 76 27)
◆I222222222 #wェ゚。「.゚j藝 (77 AA DF A1 A2 2E DF 6A E5 59)

速度が出てくるとなかなか面白いですねえ。

673:名無しさん@お腹いっぱい。
15/07/27 11:48:16.88 zzZlkO/wp
嫁さんのストレスが心配・・・

674:◆/Meriken/.
15/07/27 13:05:25.57 ixMpl4uOX
嫁さんがアメリカに来るのは1ヶ月後です。まだ大丈夫!

675:名無しさん@お腹いっぱい。
15/07/27 13:49:13.96 FM81lyOIZ
嫁の居ぬ間に検索

676:◆/Meriken/.
15/07/27 13:59:07.50 ixMpl4uOX
wwwww

677:◆mMmmMmMMM.
15/07/27 15:17:47.07 LSf4BWCwi
verうp楽しみにしてます。って、CPU検索も速度上がりますか??

678:◆エリーチカニホレタ。ー゙゚リ!
15/07/27 19:27:45.98 EcaOlJ4kV
↓この辺に鬼女スレのAA

679:名無しさん@お腹いっぱい。
15/07/27 19:33:00.16 ehjkE9145
              ,. ‐'' ̄ "' -、   ,. ‐'' ̄ "'' -、
             /        ヽ/          ヽ
                l          l             l
            l         l          l
         ,. ‐'' ̄ "'' 、    ,,. --‐┴─-- 、     / ̄ "'' -、
       /      ,.-‐''"´           \ _/        ヽ
      l       /                   ヽ          l
       l     /  ●                l          l
      ヽ    l       (_人__ノ         ● ヽ         /  そんな事言われても
       ,,>-‐|   ´´     |   /       , , ,. ‐'' ̄ "' -、/      ウチ ポン・デ・ライオンやし
      /    l        ヽ_/           /          ゙ヽ
     l     ` 、               l            l
      l       ,. ‐'' ̄ "' -、   ,. ‐'' ̄ "'' -、            l
       l,     /         ヽ /        ヽ,         /
       ヽ、,,  l            l          l,,,___,,,/
         "'''l            l             l
              ヽ          /ヽ        /
             ヽ,___,,,/  ヽ,,___,,,/
                   /     |
                /       |

680:◆/Meriken/.
15/07/27 20:30:01.90 ixMpl4uOX
>>655
今回の主な変更点はRadeonでの10桁トリップ検索の速度向上と
ゆぐちゃんの新鯖への対応なので、CPU検索はいじってませ~ん。

681:◆mMmmMmMMM.
15/07/27 21:37:08.90 ykCnihiOD
>>658
あら・・・残念です。
自作から遠のいてmmoもしてないのでCPUのみの検索だったのですが。
中学生がGPU買おうとか言ってるし、私も買おうかな。
ってかケースに入るGPUあんのかな。。。

682:◆wuuwuuwwuw
15/07/27 22:32:09.60 o5N/LrDsS
うーん、ちょっと惜しい・・・

683:◆a.o.u.u.u.
15/07/27 23:00:37.78 aRIaaI2As
ポンデライオン(´・ω・`)

684:◆a.o.u.u.u.
15/07/27 23:01:40.51 aRIaaI2As
(´・ω・`)12桁なら検索速度は速いが10桁だと検索速度1桁になるな

685:◆/Meriken/.
15/07/28 04:28:23.28 qwMsQzXO+
>>659
今度出るFury Nanoとかいかがですか。

686:◆Meriken.Z.
15/07/28 13:53:54.53 Mdbe7Wq4P
久しぶりにGTX580をさしてCUDA版のテスト。
ちゃんと動いてるけど遅い!

687:名無しさん@お腹いっぱい。
15/07/28 18:07:19.91 h5dgySb86
(´・ω・`)デスクトップのVistaに合うビデオカードってなんだろう

688:名無しさん@お腹いっぱい。
15/07/28 20:11:09.22 smsbgNEwR
今からトリップ検索用に買うならGTX750TiかGTX750無印あたりでいいんじゃね
いつまでVistaを使うつもりか知らないけどドライバのサポートはこれまでの実績で言えばNVIDIAの方が長かったし
URLリンク(kakaku.com)
URLリンク(kakaku.com)

RadeonでGTX750TiやGTX750相当の検索速度にしようとするとR7 250XやR7 250XEあたり?
ただしR7 250Xは補助電源あり
URLリンク(kakaku.com)
URLリンク(kakaku.com)

検索速度はJohnDoeさんやMerikenさんの新バージョンを使う前提で
フリー版でゆぐちゃんにつないでGPUだけ使って検索すると大雑把にはこんな感じになると予想
GTX750Ti 10桁130M 12桁900M
GTX750無印 10桁100M 12桁700M
R7 250X 10桁130M 12桁700M
R7 250XE 10桁100M 12桁600M

検索中にビデオカードが使う消費電力は 100W > R7 250X > GTX750Ti ≧ R7 250XE > GTX750無印 > 50W くらい?

689:名無しさん@お腹いっぱい。
15/07/29 00:42:43.41 ck6gUcYEU
Vistaはサポート終了まで使う予定(´・ω・`)
まあ買って使ってみないとわからないか(´・ω・`)

690:名無しさん@お腹いっぱい。
15/07/29 00:59:30.97 6SLu6PuUJ
Vista起動中にWin10のセットアップを実行すると表示されるありがたいメッセージ
URLリンク(i.imgur.com)

XPの場合はメッセージ以前の問題
URLリンク(i.imgur.com)

691:名無しさん@お腹いっぱい。
15/07/29 06:06:32.97 ck6gUcYEU
XPwwwww

692:◆エリーチカニホレタ。ー゙゚リ!
15/07/29 07:51:04.11 umqjk6jZw
一応サポート期間なのにVistaのMSからの冷遇具合は異常
開発ツールにも制限あるし……

693:◆Iqo8OO8opI
15/07/29 20:50:09.21 ck6gUcYEU
テストスレってどこだ(´・ω・`)
Vistaでツール使いながらYouTube見てたら重たい・・

694:累計 ◆wop.8OO8.qow
15/07/29 21:25:29.68 7HUGETOcm
>>671
酉見て一瞬「書いたっけ?」と思いましたw

▲練習▼テスト▲test▼《初心者向解説付》Part622
スレリンク(qa板)

695:◆Iqo8OO8opI
15/07/29 23:00:54.85 ck6gUcYEU
>>672 酉似てるww

696:◆/Meriken/.
15/07/30 09:34:22.21 TBRza38Zs
GTX580での検索が速くならないかいろいろ実験中。
ループ展開のおかげで使用する共有メモリの量を
半分にすることに成功しました。後はレジスタ数を24まで減らせば
速度が倍近くになる計算です。久しぶりにコードを見てみたら
いろいろ新しい発見があってなかなか面白いです。

697:名無しさん@お腹いっぱい。
15/07/30 20:17:41.99 EAI9RfaTX
スキルアップして前にできなかったことができるようになると楽しいよね

698:名無しさん@お腹いっぱい。
15/07/30 21:01:23.86 yJ5y76Kyw
何か、欲しいトリップを見つける事よりも、検索速度を上げる事の方が遥かに重要に・・・

699:◆/Meriken/.
15/08/01 06:12:06.11 oMKWjeE6c
7月の電気代がエラいことになってましたw
2ヶ月分でハイエンドのビデオカードが買えてしまいます。
1ヶ月で282kWhを超えたら超過した分の電気代が
倍になるみたいです。
とりあえず7990と7970は停止しておこうっと。

700:◆/Meriken/.
15/08/01 06:25:41.07 oMKWjeE6c
悪くない数字だけどもう一声ほしいな。

7790+290X 1,160M TPS 625W 880MHz -70mV

701:◆/Meriken/.
15/08/01 06:48:00.90 oMKWjeE6c
4枚有効にして電圧を下げたら効率がちょっと良くなりました。

7790x2+290Xx2 1,331M TPS 655W 500MHz 900mV/-100mV

1.86M TPS/W -> 2.03M TPS/W

702:◆/Meriken/.
15/08/01 14:21:24.60 oMKWjeE6c
GTX580で超頑張って70M TPS出せるめどがたちました。
7970と違ってoccupancyを上げても綺麗にスケールしないですねえ。

703:名無しさん@お腹いっぱい。
15/08/01 17:37:56.30 dhV1DF8yD
まあ検索効率も良くなったから
節電でグラボ1枚だけでもいいんじゃない?

704:名無しさん@お腹いっぱい。
15/08/01 18:41:47.16 bX5oee09E
電気代1万超えてた(´・ω・`)想像するだけで涙出てくる(´;ω;`)

705:名無しさん@お腹いっぱい。
15/08/01 19:07:47.24 LAQRNyixp
勇者Merikenさんもついに魔物の前に屈する日がきたのか…

706:◆MOYASHI/Go
15/08/01 23:45:22.50 Fx8v9zxSS
おお!Merikenさんが7790を戦力として投入しとるw

>>677
アメリカでも、電力使用量に応じて段階的に電気料金が上がる仕組みなんですね。
しかも、一月で282kWhを超えた分が倍額って、凄い急激な設定w

707:◆/Meriken/.
15/08/02 00:18:18.76 eVnovhPgp
電気自動車用に使用料じゃなくて時間帯で料金が決まる
プランが有るみたいだけど、これって私でも加入できるのかしらん。

URLリンク(www.pge.com)
URLリンク(www.pge.com)

708:◆/Meriken/.
15/08/02 02:32:21.34 eVnovhPgp
JohnDoeさん、また速くなってるな~
私も真似をしてseedにあわせてCUDAで4096個のカーネルを
作ってみたけど、ビルドがいつ終わるか全くわからないw

709:◆Meriken.Z.
15/08/02 03:43:36.17 xaiU1fWAe
>>683
いや、ちょっとレベルが足りなかっただけですw
もうちょっと稼がないとな~

710:累計 ◆wop.8OO8.qow
15/08/02 08:07:49.33 eb0VgtAxe
JohnDoeさん、10桁 3634M
凄すぎ!!

711:名無しさん@お腹いっぱい。
15/08/02 08:26:37.65 qLX5SLgYT
くそ暑いのにがんばり杉だろwwwww

712:累計 ◆wop.8OO8.qow
15/08/02 08:58:48.43 eb0VgtAxe
3780M 8:37am
3639M 8:40am
3638M 8:43am
3638M 8:46am
3640M 8:49am
3636M 8:52am
3632M 8:55am

JohnDoeさんは3分で再起動かな?

713:名無しさん@お腹いっぱい。
15/08/02 09:09:19.21 YY6qR33bT
すげえ頑張ってるなー
しかし、なぜトリップツールに興味持ったんだろ

714:◆Meriken.Z.
15/08/02 09:55:29.55 xaiU1fWAe
JohnDoeさんのコードを詳しく調べてみましたけど、
ループ展開の方法がかなり独特ですね。
この転換、どうやって見つけたんだろう。

715:◆Meriken.Z.
15/08/02 10:07:15.16 xaiU1fWAe
この人の書いたコード、JohnDoeさんのにそっくりだけど本人だったりしてw
数日前にBitslice DESのMaxwellでの最適化についての質問してるし…
コメントの英語が妙にこなれてたので不思議だったんですよね。

URLリンク(devtalk.nvidia.com)

716:名無しさん@お腹いっぱい。
15/08/02 10:13:10.50 YY6qR33bT
海外の人だからこのスレに現れないってことかね?

717:◆Meriken.Z.
15/08/02 10:23:49.31 xaiU1fWAe
やっぱり本人だったw 日本人にしては英語がうますぎると思ったんだよな~

----

All codes are now open-sourced here as part of my personal fork of Meriken's Tripcode Engine, a third-party tripcode finder for 10 character (DES crypt(3)) and 12 character (SHA-1) tripcodes.
URLリンク(devtalk.nvidia.com)

718:◆Meriken.Z.
15/08/02 11:25:30.96 xaiU1fWAe
>>694
一応挨拶してきました。来てくれないかな~

719:名無しさん@お腹いっぱい。
15/08/02 13:46:23.98 OYyZciZ78
FRBのイエレン議長がトリップ検索に興味持ったのか

検索専用ASICとそれを作る専用工場が建設される日も近いな

720:◆/Meriken/.
15/08/02 17:03:23.11 eVnovhPgp
このハンドル名のセンスは謎ですねw 面白い人だなあ。

CUDA版はカーネルを256個までビルドすることに成功しました。
期待通りの速度が出ています。しかし時間がかかりすぎ!

721:名無しさん@お腹いっぱい。
15/08/02 17:55:14.54 bycRMbikI
日本だと名無しのごんべえって意味だしな
JohnDoe

722:◆エリーチカニホレタ。ー゙゚リ!
15/08/02 19:54:43.09 lvIA54/vr
ジョン・ドゥと言えばMGSの方を思い出す……
ジョン・スミスと同じような意味なのか

723:混沌 ◆YvAqloolpAvY
15/08/02 21:02:41.77 lMwU9e4ZB
恥ずかしながら、某所でJohnDoeさんの勇姿を拝見しました :-)

URLリンク(i.imgur.com)

724:◆/Meriken/.
15/08/03 00:42:13.44 9GeMtFh4U
ようやくカーネルを全部ビルドする


725:準備が出来ました。一体何時間かかるんだろう…JohnDoeさんのコードを取り込んでループ展開を効率よくしないと配布は無理っぽいなあ。



726:◆エリーチカニホレタ。ー゙゚リ!
15/08/03 01:35:36.35 J+6NTbpL2
>>702
冷静に考えると、「トリップを検索する」だけのソフトなのにビルドに数時間掛かるというのは常識はずれな感ありますな……
まあMTFの開発自体相当長期に渡ってますし、最適化に最適化を重ねてるから仕方ない面もありますが

727:◆/Meriken/.
15/08/03 02:03:02.33 9GeMtFh4U
やるからには徹底してやらないと面白く無いですよw
CUDA版でカーネルを4096個作るのはかなり昔に試したことが
あったんですけど、あまりにビルドに時間がかかるので
没にしたんですよね。もうちょっと色々実験してみれば
よかったな。

728:◆/Meriken/.
15/08/03 02:24:44.21 9GeMtFh4U
いずれにせよ10桁トリップ検索は相当奥が深いです。
性能を出すのがほんとうに難しいんですよね~
JohnDoeさんはS-Boxの最適化を4万円かけて
Amazonのクラウドサービスでやったそうです。さすがです。

729:( ´_ゝ`) ◆Iqo8OO8opI
15/08/03 05:39:21.15 chNZAClKA
ゲームやりながらトリップ検索するとゲーム重いからできないっていう・・・

730:◆/Meriken/.
15/08/03 10:34:22.62 9GeMtFh4U
結局カーネルを4096個作るのはリンカがこけて失敗におわりましたorz
その代わりに別のルーチンをいじったら72M TPSでてしまいましたw やった~

731:◆/Meriken/.
15/08/03 11:23:17.61 9GeMtFh4U
OCしたら89M TPS出ましたw これでようやく満足しました。
長い戦いだった…

732:◆/Meriken/.
15/08/03 13:50:54.45 9GeMtFh4U
>>706
検索はPCを使ってないときにやるものです。
MTFはスクリーンセーバーと連動できますよ。

733:◆mMmmMmMMM.
15/08/03 19:57:07.26 yRqUUxvnh
私はCPU検索で、通常のネット中に半分くらいのコア数を使って検索してても不自由は感じないですけど、
GPUをモロにつかうゲームやりながらのGPU検索は厳しそうですねw

734:◆mMmmMmMMM.
15/08/03 20:21:47.51 yRqUUxvnh
あんまり沢山見つけたわけじゃないので偉そうなこといえませんが、
人の見つけたときにどんなトリップなのか知れたら嬉しいなと思ったり。
人の見て「おぉー!超綺麗!!!」とか一人で興奮したいw

735:◆/Meriken/.
15/08/03 23:39:30.65 9GeMtFh4U
>>711
見られたくない人もいるのでちょっと微妙ですね。
それにお礼が来れば見れますよ。

736:◆/Meriken/.
15/08/03 23:42:38.26 9GeMtFh4U
あれから更にいじってOCしたGTX580でとうとう100M TPSでました。
これでHoro氏も満足してくださるでしょう。

737:◆/Meriken/.
15/08/03 23:48:05.88 9GeMtFh4U
次のバージョンでは新しNVIDIAのビデオカードでも
それなりに10桁トリップ検索が速くなっているはずです。
本格的な最適化は980Tiを手に入れてからになりますが、
それまでのつなぎということで。

738:◆/Meriken/.
15/08/04 02:24:57.92 XUcLulrQU
JohnDoeさんの見つけてくれたバグ、別のところに残ってたorz
危ない危ない…

739:( ´_ゝ`) ◆Iqo8OO8opI
15/08/04 04:33:17.13 yJQAmcnJU
トリップ検索してる時暇だからゲームしてる、それかYoutube.重たいけど
PC熱くなってる

740:名無しさん@お腹いっぱい。
15/08/04 04:43:15.23 tdpIio/k5
(`・ω・´)つ扇風機

741:( ´_ゝ`) ◆Iqo8OO8opI
15/08/04 17:18:41.96 yJQAmcnJU
扇風機涼しいぃぃぃぃ
HARDOFFでビデオカード買った、どこにやるのかわからないまま箱の中・・・

742:名無しさん@お腹いっぱい。
15/08/04 17:25:55.86 H/kn7RWuu
指す場所がわからんってことか?

743:◆IIIYIIYIII
15/08/04 18:53:08.08 gjfSg5J6v
割と綺麗なのが出たかも。

744:名無しさん@お腹いっぱい。
15/08/04 20:18:58.21 JcpGex752
二構・回文・鏡で跳満くらい?

745:◆/Meriken/.
15/08/04 23:06:38.72 XUcLulrQU
新しい開発版をうpしました。

Meriken's Tripcode Generator 2.0.0 Free Edition
URLリンク(meriken.ygch.net)

バージョン1.1.2FEからの主な変更点は以下の通りです。

・名前を"Meriken's Tripcode Generator"に変更。
・ビデオカードでの10桁トリップ検索の大幅な高速化。
・「Meriken's Tripcode Yggdrasil」の新サーバーへの対応。
・その他バグフィックス多数。

746:名無しさん@お腹いっぱい。
15/08/04 23:33:06.18 C6LcWtzIY
>>545
なんかJohnDoeさんの更新されてたので試してみた。
環境は>>548
プログラムサイズが100MB程増えてるけど、
速度も100M程速くなって、580M程出る・・・
Clock 1.4Gで回すと、980単体で630M位まで
これ1枚で新生検索君1号の半分弱の速度・・・

化けもんだwww

747:◆/Meriken/.
15/08/05 03:35:51.95 g868rxPWR
お、早速田中ゆかりさんが438M TPS出してるw
どのビデオカードを使ってるか気になるな~

748:◆/Meriken/.
15/08/05 03:39:37.76 g868rxPWR
>>723
ここに来て検索速度も一気に上がりましたね~
JohnDoeさんの成果を取り込んだらRadeonの新しいバージョンに
取り掛からないと…

749:名無しさん@お腹いっぱい。
15/08/05 08:05:19.31 S3CCFDKPL
>>722
おつかれさまです

まだ診断は試してないですが、
Radeon R9 270X ( MSI R9 270X GAMING 4G 、 1080MHz ) で Yggdrasil でGPUだけで 194M 出てます
倍になってます!

750:名無しさん@お腹いっぱい。
15/08/05 08:17:04.16 S3CCFDKPL
検索開始時にサーバと通信失敗のエラーが出ることがあるみたいです

初回起動時に2回連続で出て、そのあと成功して
今検索プロセス再起動のときにまた通信エラー出てました

751:◆/Meriken/.
15/08/05 10:05:56.23 g868rxPWR
>>726-727
報告有り難うございます。場所によってサーバーへの
つながりやすさが違うんでしょうかね。
タイムアウトの時間を長めにしておきます。

あと速度が予測より遅めなのが気になります。Catalystの
バージョンはいくつですか? 14.12と15.7がおすすめです。
CPU検索を切るかもうちょっとスレッド数を減らしてみても
いいかもしれません。GPU検索のみでの診断の結果を
教えていただけると助かります。

752:◆/Meriken/.
15/08/05 11:33:04.35 g868rxPWR
>>727
どうもさくらインターネットの問題だったみたいです。
また発生したら教えて下さい。

753:名無しさん@お腹いっぱい。
15/08/05 14:20:48.31 S3CCFDKPL
>>728
Catalystを上げようと思ったら Windows 8.1 にしないと 14.4 までしか使えないみたいだったので
Windows 8をWindows 8.1にアップデートしていました

Catalyst 15.7 にしたらGPUの速度が 260M まで上がりました

あとで診断もやってみます

754:名無しさん@お腹いっぱい。
15/08/05 16:09:47.53 S3CCFDKPL
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.0 Free Edition
【OS】Microsoft Windows 8.1 64bit
【ディスプレイドライバ】Catalyst 15.7.1

【検索デバイス】GPUのみ
【使用するGPU】すべて使用

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間のGPU検索の平均速度】 269.55M tripcode/s

GPU MSI R9 270X Gaming 4G ( 1080 MHz )

755:名無しさん@お腹いっぱい。
15/08/05 16:38:48.33 S3CCFDKPL
温度も見てみた

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.0 Free Edition
【OS】Microsoft Windows 8.1 64bit
【ディスプレイドライバ】Catalyst 15.7.1

【検索デバイス】GPUのみ
【使用するGPU】すべて使用

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間のGPU検索の平均速度】 267.78M tripcode/s

【GPUの使用率】99%
【GPUの温度】70~71℃
【その他】

室温 冷房で22度
GPU MSI R9 270X Gaming 4G ( 1080 MHz )

1.1.2 FEだと60度前後だったけど やっぱ速度出てるだけあって温度も上がってました

756:( ´_ゝ`) ◆Iqo8OO8opI
15/08/05 19:53:38.57 ibjq3rq2Z
安いの買ったからゴミだな、1万円まで金貯めてAmazonで5000円のビデオカードでも買うか・・・

757:名無しさん@お腹いっぱい。
15/08/05 20:19:29.78 9j57lRCpr
うちのGT520よりマシじゃねw
たしか10桁も12桁もCPUに負けてたwww

758:◆/Meriken/.
15/08/05 20:41:34.97 g868rxPWR
>>733
お、順当なところですね。報告乙です。

>>733
ちょっと失礼すぎるでしょう。270Xは2万5000円ぐらいしますよ。

759:名無しさん@お腹いっぱい。
15/08/05 20:56:35.61 8ZOUHXjFs
>>735
たぶん、>>718で書いてる自分が買ったビデオカードがダメだったって話じゃないかね?

760:◆/Meriken/.
15/08/05 21:01:47.64 g868rxPWR
そうだといいんですけど…

761:◆/Meriken/.
15/08/05 21:09:47.57 g868rxPWR
ビデオカードが欲しいなら余ってるGTX580差し上げてもいいくらい
ですけど、電気代のことを考えるとちと無理がありますね。
ようやく定格で94M TPS出るようになったけど、
もうちょっとなんとかならんかな。

762:名無しさん@お腹いっぱい。
15/08/05 21:52:25.65 xbbQF/G3w
早速新しいやつにしたけど、前のより速くなったんだろうか?
もう以前の数値を覚えてないので分からん。w

763:◆MOYASHI/Go
15/08/05 21:56:13.39 3QhZHO7Vn
>>722
お疲れ様です。

設定ファイルは、以前のMTFの物をMTGの”MerikensTripcodeGenerator.settings”
へとリネームして使い回しても問題無いでしょうか?

764:名無しさん@お腹いっぱい。
15/08/05 22:01:47.54 xbbQF/G3w
>>740
あ、リネームしてないけど、前のをそのまま普通に読み込んだみたい。

765:◆MOYASHI/Go
15/08/05 22:54:12.85 3QhZHO7Vn
>>741
おお、Thx!
多分大丈夫だろうと思ったけど、チキンハートなものでw

766:名無しさん@お腹いっぱい。
15/08/05 23:16:29.64 xbbQF/G3w
前の名前のファイルがあったらそれを読み込み、MerikensTripcodeGenerator.settings
というファイル名で、同じ内容を新たに書き込む、ってなってる予感。
で、次からは MerikensTripcodeGenerator.settings があるから、それを読む、と。

767:◆MOYASHI/Go
15/08/05 23:20:52.44 3QhZHO7Vn
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.0 Free Edition
【OS】Win7 Pro 64bit SP1
【CPU】Core i5 3570
【GPU】RADEON HD 7790(1030MHz動作)
【ディスプレイドライバ】Catalyst 15.7.1
【検索デバイス】GPUのみ

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間のGPU検索の平均速度】 176.68M tripcode/s


速度アップ凄過ぎ!

768:◆MOYASHI/Go
15/08/05 23:48:54.60 3QhZHO7Vn
>>732
俺が使ってるビデオカードだとGPUクーラーがショボイせいで
室温28℃でGPUが90℃を超えてしまうw

>>743
そのまま放り込めばおkだったのね。

769:( ´_ゝ`) ◆Iqo8OO8opI
15/08/06 02:44:34.38 ls68N8PMi
>>735 意外と高いですなぁ

770:◆/Meriken/.
15/08/06 09:53:07.95 y6xQ6Odww
とうとう980Tiを注文してしまいました。
これでようやくJohnDoeさんのコードをいじれるぞ。楽しみだな?

771:名無しさん@お腹いっぱい。
15/08/06 18:01:47.75 SR6qeYHAi
そして4枚構成へ…
1枚で900Mもでるんですね

772:( ´_ゝ`) ◆QQQQQQQQ.Q
15/08/06 20:04:43.45 ls68N8PMi
わくわく

773:名無しさん@お腹いっぱい。
15/08/06 20:18:16.32 NCpDAnwdT
>>749
Qが9個か面白いな

774:( ´_ゝ`) ◆QQQQQQQQ.Q
15/08/06 20:43:26.68 ls68N8PMi
>>750 ダジャレみたいだな、あまり使わないからいらないけどw

775:◆/Meriken/.
15/08/07 00:35:17.54 b4ZP1d2+0
新バージョン、誰かNVIDIAのカードでも試してみてくれないかな~

776:3D梨 ◆T.H.U.J.I.
15/08/07 01:42:29.65 Muq3m9mBO
>>752
サブPCで試してみます

777:3D梨 ◆T.H.U.J.I.
15/08/07 01:43:51.87 Muq3m9mBO
>>752
何故かGPUを認識出来ませんね
何でだろう

サブPC
CPU i5-4200M
GPU NVIDIA Geforce 710M

778:◆/Meriken/.
15/08/07 02:02:47.59 b4ZP1d2+0
>>754
ドライバのバージョンはいくつですか?
更新する必要があるかもしれません。

779:名無しさん@お腹いっぱい。
15/08/07 02:07:41.07 9IR4jiWMM
GeForce 710MってKeplerと思ってたら96CUDAコアのFermiなのね

URLリンク(www.nvidia.co.jp)
から最新ドライバ(353.62)をダウンロードしてインストールしてみれば


780:?



781:3D梨 ◆T.H.U.J.I.
15/08/07 03:08:29.13 Muq3m9mBO
>>755
350.12でした
アップデートして来ます

782:3D梨 ◆T.H.U.J.I.
15/08/07 03:09:12.72 Muq3m9mBO
>>756
そうそうこれだけ仲間外れって言う可哀想な子

783:◆/Meriken/.
15/08/07 03:15:13.46 b4ZP1d2+0
わくわく

784:( ´_ゝ`) ◆Iqo8OO8opI
15/08/07 03:37:18.15 gAc76JGK+
◆QQQQQQQQ.Q #dAgs0<@M棡
あまりレア的なもの使わないで鏡とか見つかったら使用しよう、鏡たくさん集めよ、 その前に鏡って何日くらいだっけ?

785:( ´_ゝ`) ◆Iqo8OO8opI
15/08/07 03:37:51.27 gAc76JGK+
したらばで10桁のやると違うの出るからちょっと悲しい

786:3D梨 ◆T.H.U.J.I.
15/08/07 03:45:10.73 Muq3m9mBO
まず前バージョンを投下

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1.2 Free Edition

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】  10文字完全前方一致1個

【10分間の平均速度】  185.85M tripcode/s
【GPU検索の平均速度】 133.54M tripcode/s
【CPU検索の平均速度】  52.31M tripcode/s

【GPUの使用率】%
【GPUの温度】℃
【その他】

787:3D梨 ◆T.H.U.J.I.
15/08/07 03:46:39.77 Muq3m9mBO
新バージョンですが文字化けしてたので前バージョンから一部拝借

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.0 Free Edition

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】  10文字完全前方一致1個

【10分間の平均速度】   96.72M tripcode/s
【GPU検索の平均速度】  84.36M tripcode/s
【CPU検索の平均速度】  20.81M tripcode/s

【GPUの使用率】%
【GPUの温度】℃
【その他】

788:3D梨 ◆T.H.U.J.I.
15/08/07 03:47:14.77 Muq3m9mBO
>>763
どうしてこうなった
としか言い様が無いですね...

789:3D梨 ◆T.H.U.J.I.
15/08/07 03:49:57.13 Muq3m9mBO
>>763
さっき10分程
検索してましたが前バージョンより数字的には遅いですが
新バージョンの方が早く出る様な気がします

790:3D梨 ◆T.H.U.J.I.
15/08/07 03:58:32.43 Muq3m9mBO
そういえばGeneratorはWindows10で動くのかな

791:名無しさん@お腹いっぱい。
15/08/07 03:59:34.07 9IR4jiWMM
MTGは10桁のGPU検索の強化がメインだから
10桁でやらないとあんま意味ないんじゃね?

792:3D梨 ◆T.H.U.J.I.
15/08/07 04:00:30.37 Muq3m9mBO
JohnDoeさんのプラグインだがどれをダウンロードすればいいんだ?w

793:3D梨 ◆T.H.U.J.I.
15/08/07 04:00:59.48 Muq3m9mBO
>>767
おk
やってくる

794:3D梨 ◆T.H.U.J.I.
15/08/07 04:03:46.12 Muq3m9mBO
10桁の診断してたら止まるなあ
CPU検索だけなら動くんだが...

795:名無しさん@お腹いっぱい。
15/08/07 04:05:31.02 9IR4jiWMM
詳細設定でGPUのみにしてから診断してもダメ?

796:3D梨 ◆T.H.U.J.I.
15/08/07 04:07:55.28 Muq3m9mBO
>>771
無理だわ

797:◆/Meriken/.
15/08/07 04:10:42.15 b4ZP1d2+0
12桁はいじってないはずなので謎ですね…
10桁トリップ検索でとまるのはなんでだろう。
GPUの温度は大丈夫ですよね?

798:名無しさん@お腹いっぱい。
15/08/07 04:11:40.65 9IR4jiWMM
それは残念
JohnDoeさんのはMaxwell専用じゃなかったっけ

799:3D梨 ◆T.H.U.J.I.
15/08/07 04:12:50.40 Muq3m9mBO
>>773
12桁の時は70℃前半でした
前バージョンと変わりません

800:3D梨 ◆T.H.U.J.I.
15/08/07 04:13:45.91 Muq3m9mBO
>>774
ウガーw
使えないw
今度メインPCで使ってみます

801:◆/Meriken/.
15/08/07 04:14:07.87 b4ZP1d2+0
ははあ、710MはCompute Capabilityが2.1なのか。
そういやバイナリを入れてなかったな。後で追加しておきます。

802:3D梨 ◆T.H.U.J.I.
15/08/07 04:20:09.20 Muq3m9mBO
>>777
今度メインPCでやろうと思うんですが
GTX860MってCCが5.0ですが5.0も対応してますか?

803:◆/Meriken/.
15/08/07 04:21:51.15 b4ZP1d2+0
2.0用のは入ってるから大丈夫かと思ったけど、ダメなんですねえ。

>>778
5.0のは入ってます。

804:3D梨 ◆T.H.U.J.I.
15/08/07 04:22:57.64 Muq3m9mBO
>>778
了解です

805:3D梨 ◆T.H.U.J.I.
15/08/07 04:23:39.00 Muq3m9mBO
>>780
誤爆
>>778 ×
>>779 ○

806:◆/Meriken/.
15/08/07 04:23:51.54 b4ZP1d2+0
助かります~

807:3D梨 ◆T.H.U.J.I.
15/08/07 04:24:51.28 Muq3m9mBO
>>782
まあメインPC使えるの9月からですがねw

808:◆/Meriken/.
15/08/07 04:27:11.41 b4ZP1d2+0
ええ~w まあそれまでには超速くなった新バージョンが
できていることでせう。

809:3D梨 ◆T.H.U.J.I.
15/08/07 04:29:49.08 Muq3m9mBO
>>784
了解ですw

というかMerikenさんって帰国したとか行ってましたけど
今どこの国に居るんですか?w
ちょっとNGな質問かもしれないですけど、教えられる範囲で教えてください

810:◆/Meriken/.
15/08/07 04:31:44.35 b4ZP1d2+0
まだアメリカですよ。

811:3D梨 ◆T.H.U.J.I.
15/08/07 04:38:01.34 Muq3m9mBO
>>786
了解です

私は多分学校の関係で日本かどっかに居ます(うん、多分)

812:◆/Meriken/.
15/08/07 04:41:04.01 b4ZP1d2+0
結婚のために一時帰国してたんです。
いや~しかし助かりました。ありがとうございます。

813:◆/Meriken/.
15/08/07 05:09:56.53 b4ZP1d2+0
12桁トリップ検索の設定をいじったら検索君で16G TPSでました。
常時稼働はむりですけど、まだまだ結構いけますね~

814:3D梨 ◆T.H.U.J.I.
15/08/07 05:31:25.13 Muq3m9mBO
>>788
いえいえとんでもないです
もう22時なんで寝ますわ
では

815:混沌 ◆YvAqloolpAvY
15/08/07 06:15:37.71 qTkSO+FEQ
GTX660  12桁

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.0 Free Edition

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 646.22M tripcode/s
【GPU検索の平均速度】 541.21M tripcode/s
【CPU検索の平均速度】 105.01M tripcode/s

【GPUの使用率】%
【GPUの温度】℃
【その他】

816:混沌 ◆YvAqloolpAvY
15/08/07 06:16:20.65 qTkSO+FEQ
GTX660 10桁

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.0 Free Edition

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 71.83M tripcode/s
【GPU検索の平均速度】 49.83M tripcode/s
【CPU検索の平均速度】 22.00M tripcode/s

【GPUの使用率】%
【GPUの温度】℃
【その他】

817:◆/Meriken/.
15/08/07 14:10:53.82 b4ZP1d2+0
>>791-792
あ、こっちはちゃんと動いているみたいですね。
助かります。

818:◆Meriken.Z.
15/08/07 16:22:39.38 BBBJ///AN
780Tiが届いたのでさっそくJohnDoeさんのを試してみました。
定格で783M TPS出ているので確かに相当速いんですが、
これならRadeonでも十分に対抗出来るかなという印象です。

いずれにせよ共有メモリを使ったMTGでは半分ぐらいの
速度しか出ていないのでとりあえずこれを色々いじってみようっと。

819:3D梨 ◆T.H.U.J.I.
15/08/07 16:46:08.60 O7GApyQbJ
>>794
!?
amazon早いw 次バージョンのリリースが間近なんですねw
そして謎のIDwww

820:混沌 ◆YvAqloolpAvY
15/08/07 21:56:48.22 qTkSO+FEQ
>>793
一応w
3D梨さん同様にGPUを認識しなかったので確認してみると327.23だったので
>>756のリンクから新しいのを入れました

821:名無しさん@お腹いっぱい。
15/08/07 23:08:38.73 +yh0jiR+i
さっき一瞬JohnDoeさんが10桁で4G超えてた(4006M)
今は3934M

822:名無しさん@お腹いっぱい。
15/08/07 23:21:51.94 51MejotnJ
Final verとありますね
一気に4G台のせてきましたか

823:名無しさん@お腹いっぱい。
15/08/07 23:22:37.30 Xhkz6DWqw
12桁も高速化チャレンジしてほしいな

824:◆/Meriken/.
15/08/07 23:36:29.74 b4ZP1d2+0
さすがですね。4Gが今後の目標になるわけだな。頑張るぞ~

825:◆/Meriken/.
15/08/07 23:54:28.77 b4ZP1d2+0
>>799
もうすでにいじってましたよ。
12桁トリップ検索はアルゴリズムそのものに手を入れないと
これ以上の高速化は難しいんじゃないでしょうか。

826:◆エリーチカニホレタ。ー゙゚リ!
15/08/08 00:29:32.67 8PNO3z/Tu
話題のWin10、私も入れてみました。まだMTF(MTG)は走らせていませんが……
と言うか、まさか「自動判定されるドライバがWin7/8/8.1用で、Win10用はサイトからDLしないとダメ」
という罠があったとは……アプデ後に「対応しているWindowsのVerではありません」的なエラーが出て面食らったw

827:累計 ◆wop.8OO8.qow
15/08/08 00:37:28.30 FvP96WvRN
JohnDoeさん検索しているはずなんですけどね
URLリンク(i.imgur.com)

828:◆/Meriken/.
15/08/08 00:55:31.46 T37r4V/3W
>>803
多分再起動の間隔が長いんじゃないですかね。
ひょっとして設定してなかったりして。

829:累計 ◆wop.8OO8.qow
15/08/08 03:33:33.81 FvP96WvRN
その後、10桁6完をJohnDoeさんが検索してくれましたが、検索時間0秒が9回もあるのには驚きました。
URLリンク(i.imgur.com)

830:◆/Meriken/.
15/08/08 13:50:36.99 T37r4V/3W
現在JohnDoeさんの成果を取り込み中。
実験用のコードで860M TPSほど出ています。
一番難しいところは超えたのであとはすんなりいくはずです。

831:名無しさん@お腹いっぱい。
15/08/08 15:33:11.29 u6WiEyuWO
JohnDoeさんを吸収して完全体になるMerikenさん

832:3D梨 ◆T.H.U.J.I.
15/08/08 17:2


833:8:37.27 ID:0wq2DoA8w



834:混沌 ◆YvAqloolpAvY
15/08/08 19:43:35.02 YmD7Vi7+z
その変身をあと2回も俺は残している・・・ その意味がわかるな?

835:◆/Meriken/.
15/08/08 20:48:33.84 T37r4V/3W
> 検索中のPC: 19台
> 検索速度(12桁): 2091M tripcode/s
> 検索速度(10桁): 6387M tripcode/s

wwwww

836:名無しさん@お腹いっぱい。
15/08/08 21:04:42.47 dtPf+oWDQ
くっそー、去年入院してなければ、新PC買えてたのに・・・

837:◆/Meriken/.
15/08/08 22:57:54.17 T37r4V/3W
それは残念… 体をお大事にしてください。

838:◆/Meriken/.
15/08/08 23:25:03.71 T37r4V/3W
現在新しいCUDA用の10桁トリップ検索のコードの整理中。
MaxwellでなくてもCompute Capabilityが3.2以上だったら
相当速くなりますね、これ。

839:名無しさん@お腹いっぱい。
15/08/09 00:13:39.77 nCpNACzqB
昨日1日でJohnDoeさんが獲得した10桁経験値:約2600

840:◆/Meriken/.
15/08/09 02:10:01.39 uSLu2Mmwt
コードをいじってたら1G TPS超えましたw すごいなこれ。

841:◆/Meriken/.
15/08/10 08:27:10.16 hTRYDfLll
CUDAの10桁トリップ検索の新しいバージョンですが
とりあえずカーネルが1個のものが出来ました。
速度は980Ti (+300MHz)で870M TPSと遅め(?)ですが、
実行ファイルの大きさは普通ですw

とりあえずこれを仕上げて次のバージョンにして、
カーネルが4096個のものは次の次のバージョンに
取り込むことにします。

842:◆/Meriken/.
15/08/10 09:49:34.63 hTRYDfLll
速度をきちんと測ったら826M TPSだったorz
やっぱりこれはカーネルを4096個作るしかないのか…

843:名無しさん@お腹いっぱい。
15/08/10 10:17:52.68 Xicq8uXte
がんば!

844:◆twitter/881w
15/08/10 15:18:10.46 sssNqN/h+
頑張れ!

845:( ´_ゝ`) ◆POTETO//92
15/08/10 15:19:13.12 6+dd/K+8+
ビデオカード以外に検索速度早くなる方法とかないんかな

846:混沌 ◆YvAqloolpAvY
15/08/10 16:02:19.57 xc9s5eMaD
できるだけ沢山のパターンを用意することで パターンあたりの検索速度は高速化していくはず

時間あたりのトリップ計算回数が変わらないなら マッチングするパターンを増やせばいいっつーw

847:混沌 ◆YvAqloolpAvY
15/08/10 21:27:39.78 xc9s5eMaD
そういえば、ふと思ったのだけども
現在はCPUとGPUを両方使って検索する場合、それぞれでトリップの計算をぶん回しながら、それぞれでパターンマッチをしている?
検索パターンはどちらも共通なのだし、CPU側とGPU側で チェックできる特殊パターンの違いもあるから
使用するデバイスにCPUがある場合 CPU側で算出したトリップも、GPU側で算出したトリップも、パターンマッチはCPU側でするっていうのはどうなんだろうか

848:◆/Meriken/.
15/08/11 08:16:45.16 xGw6+VaWk
>>822
GPUでかなり絞りこまないとデータの転送量が大きくなりすぎて
使いものにならないんですよね。現在のMTGでは
1パターンの場合1/1073741824まで絞り込んでいますが、
これでも足りないぐらいです。
絞り込まなかったら5完を1個見つけるのに数Gバイト転送しなくてはいけません。

849:◆/Meriken/.
15/08/11 09:35:34.45 xGw6+VaWk
実験用のコードがJohnDoeさんのFinal Ver.よりびみょ~に
速くなったみたいです。本当に微妙なので現在厳密に測定中。
うちに戻る頃には結果が出てるはずです。楽しみだな~

850:混沌 ◆YvAqloolpAvY
15/08/11 10:13:23.35 bEI6lin3S
>>823
そっか 昔も今もサブシステムを使うと 転送がネックに・・・w

851:◆/Meriken/.
15/08/11 14:54:31.02 xGw6+VaWk
結局実験用のコードはJohnDoeさんのFinal Ver.より
7M TPSほど速くなりました。ほとんど最適化の余地が
残っていなかったので、まあ上出来でしょう。
あとはビルドと配布の方法を考えないと…

852:◆/Meriken/.
2015/08/1


853:2(水) 09:58:39.31 ID:DhyNCmSCf



854:名無しさん@お腹いっぱい。
15/08/12 10:09:21.09 IL3vUbF2p
おつかれー

855:( ´_ゝ`) ◆KKkKKkKKYw
15/08/13 04:33:32.12 VooQL7EDe
トリップキー違うので◆ZZZZZZZZTI 2つある

856:3D梨 ◆pPPPPpppPPCB
15/08/13 12:23:01.03 9Lu3kuqC4
手違いで12桁の準10桁を出してしまったので欲しい人は言ってくれ

857:名無しさん@お腹いっぱい。
15/08/14 00:58:50.76 WOhjckKKL
稼働率が0.0%からあがらないのだがこれでいいのか?
トリップは受け取ったけど

858:3D梨 ◆pPPPPpppPPCB
15/08/14 01:05:43.02 wOfp7Pobq
>>831
どうやら稼働率と検索時間は比例しないらしい
おかげで私は稼働率が低い

859:名無しさん@お腹いっぱい。
15/08/14 01:25:09.56 WOhjckKKL
>>832
へぇ、今日始めたばかりなんだ
だから検索時間も稼働率も0だぜ
発見してもらったトリップは4個ぐらいあるけど

860:◆/Meriken/.
15/08/14 01:35:57.57 Q2m6EUXXE
自分でMTGを動かして検索しないと稼働率は上がりませんよ。

861:名無しさん@お腹いっぱい。
15/08/14 01:39:55.90 WOhjckKKL
>>834
MTGがよくわかりません先生

862:3D梨 ◆pPPPPpppPPCB
15/08/14 01:54:57.73 wOfp7Pobq
>>833
>>834
ああそういう事ですかw

>>833
MerikenTripcodeGeneratorって持ってますか?
取り敢えず10桁か12桁で検索染みてください
検索して貰ってもレベルは上がらないですよ

863:◆ILoveU4le2
15/08/14 01:56:40.95 WOhjckKKL
>>836
持ってません(・ω・`)

864:◆ILoveU4le2
15/08/14 07:25:42.14 WOhjckKKL
どこかでダウンローできるのかな

865:名無しさん@お腹いっぱい。
15/08/14 08:48:56.85 hg88LxCw9
>>838
ここからだね
>>722
722 ◆/Meriken/. sage 2015/08/04(火) 23:06:38.72 ID:XUcLulrQU
新しい開発版をうpしました。

Meriken's Tripcode Generator 2.0.0 Free Edition
URLリンク(meriken.ygch.net)

バージョン1.1.2FEからの主な変更点は以下の通りです。

・名前を"Meriken's Tripcode Generator"に変更。
・ビデオカードでの10桁トリップ検索の大幅な高速化。
・「Meriken's Tripcode Yggdrasil」の新サーバーへの対応。
・その他バグフィックス多数。

866:◆ILoveU4le2
15/08/14 10:06:22.12 WOhjckKKL
>>839
ダウロできたありがとう

867:名無しさん@お腹いっぱい。
15/08/14 21:16:04.08 kPzGL5OIb
Meriken's Tripcode Yggdrasil
は登録メールアドレスを変更できないのですか?
このたびプロバイダーを乗り換えるのですが、
新メアドで新規登録しなおしですか?

868:◆/Meriken/.
15/08/14 22:18:49.49 Q2m6EUXXE
>>841
個別に対応するのでメールを送ってください。

869:◆ILoveU4le2
15/08/14 22:29:39.21 WOhjckKKL
・・受け取った鳥を使ったら検索パターンと違ったのですがどういったことが原因んあのでしょうか

870:◆Nenohi.aUw
15/08/14 22:31:32.38 WOhjckKKL
テス

871:◆Nenohi.aUw
15/08/14 22:31:58.20 WOhjckKKL
あれれ、ここではちゃんと出来てる(・ω・`)

872:( ´_ゝ`)
15/08/14 23:49:10.58 SPlv3KS3Z
トリップキーメモってるメモのデータふっ飛んだからトリップが付けれぬ、悲しい

873:名無しさん@お腹いっぱい。
15/08/14 23:56:40.98 3M+tuJnJu
Yggdrasilの表示名に使ってるトリップならログインすればキーを確認できたと思うけど

874:名無しさん@お腹いっぱい。
15/08/15 00:58:50.09 K7eHRmx+W
>>843
おーぷんやしたらばなど仕様が違うところでつかったとか?

875:◆/Meriken/.
15/08/15 06:15:14.12 lx3sAUIxN
カーネルが4096個のバージョンがようやく出来て
現在絶賛ビルド中。sm52だけで4時間ぐらいかかりそうな悪寒。
sm30、sm35、sm37、sm50、sm52、sm53のバイナリを全部入れたら
丸一日普通にかかりそう… 実行ファイルも4GB近くになりそうだし、
どうするの、これ。

876:名無しさん@お腹いっぱい。
15/08/15 06:43:25.62 zwK8yQxm9
4gワロス

877:◆/Meriken/.
15/08/15 06:47:03.65 lx3sAUIxN
sm30じゃなくてsm32だった。「通常版」と「NVIDIA高速版」に
分けるしかないか… JohnDoeさんも本当に無茶するよなあ。

878:◆/Meriken/.
15/08/15 06:49:33.46 lx3sAUIxN
あ、あとJohnDoeさんのは本人が書いている通り
CUDAの10桁トリップ検索以外は色々ぶっ壊れてるので
使うときには気をつけてください。

879:◆Meriken.Z.
15/08/15 09:14:47.84 HaOzklRJO
あれからメモリ不足でPCが落ちたので、メモリ食いのMySQLサーバーを停止させて
再ビルド中。コンパイラだけでメモリを20GB使っているとか正気の沙汰じゃない…

880:名無しさん@お腹いっぱい。
15/08/15 09:39:34.07 PIgpGOF6+
あまり一般的ではないですなぁ

881:累計 ◆wop.8OO8.qow
15/08/15 09:45:39.92 z9bOa+LEn
> 名前:新生検索君1号X2 (戸愚呂50%)

幽遊白書のアニメを毎週観てましたが、口が達者な赤ん坊がいたのは覚えていますw

882:名無しさん@お腹いっぱい。
15/08/15 10:03:29.58 PIgpGOF6+
>>855
コエンマやな
霊力がつまったおしゃぶりを咥えてる

883:累計 ◆wop.8OO8.qow
15/08/15 10:10:29.79 z9bOa+LEn
>>856
それは初耳です、ありがとう!!

884:◆Nenohi.aUw
15/08/15 11:04:32.93 /FJUil76d
>>848
ああ、おーぷんで使いました
仕様が微妙に異なるのですね、なるほど

885:◆Meriken.Z.
15/08/15 11:15:09.76 HaOzklRJO
コンパイラがメモリ不足で落ちた!
"c1060 compiler is out of heap space" だって。
オプションを変えて再実行したけど、
本当にこれビルドできるんかいな。

886:名無しさん@お腹いっぱい。
15/08/15 13:34:17.53 0XvYx8lxJ
質問があります
Yggdrasilで複数のユーザーが同じ文字列を検索依頼していた場合、見つかったトリップキーは先に登録した方から渡されるのでしょうか?
「abcdef」と「abcdefg」のようにより長い文字列を他人が指定していた場合に、長いほうを満たすトリが見つかった場合も気になります

887:◆Meriken.Z.
15/08/15 14:34:04.65 HaOzklRJO
先に登録したほうが優先されます。

888:( ´_ゝ`)
15/08/15 15:20:42.40 hKruPPTiN
メモ帳復元できたアーメン

889:名無しさん@お腹いっぱい。
15/08/15 17:13:21.19 i5l+IA06a
>>861 先生ありがとうございますm(__)m

890:名無しさん@お腹いっぱい。
15/08/15 23:12:10.76 enbOa48Le
>>856
少し違う
常に霊力をおしゃぶりに蓄え続けている

891:◆/Meriken/.
15/08/16 23:21:16.77 e9g4Juqz4
確かそうでしたねw 懐かしい…

892:◆/Meriken/.
15/08/16 23:26:12.98 e9g4Juqz4
カーネルが1024個のバージョンがちゃんと動いて
期待通りの速度が出ています。後はひたすら
モジュールを足していくだけです。あともうちょい!

893:◆gGggggggqg
15/08/17 00:05:34.72 Yyq0zhiEj
ゴキブリだらけの酉(?)

894:◆/Meriken/.
15/08/17 00:44:21.62 UVyA+aVj7
その発想はなかったw

895:◆/Meriken/.
15/08/17 01:34:27.14 UVyA+aVj7
旧聞だけどAVX-512はSkylake Xeonだけか~
CannonlakeのSHA拡張も気になります。

Skylake processors for the PC will not support the AVX-512
URLリンク(www.hardware-boom.com)

Intel? Architecture Instruction Set Extensions Programming Reference
URLリンク(software.intel.com)

896:◆Meriken.Z.
15/08/17 07:28:55.69 hIpVOL756
sm52専用のカーネルが4096個のバージョンがビルドできました。
一応ちゃんと動いているようです。

で、今度はsm32、sm35、sm37、sm50、sm52、sm53のバイナリを全部入れた
バージョンを作成しようとしたら見事失敗orz どうしたものか…

897:◆Meriken.Z.
15/08/17 09:57:41.50 hIpVOL756
現在sm50、sm52、sm53のバイナリを入れたバージョンを作成中。
とりあえず出来るのを確認してから考えようっと。

898:◆Meriken.Z.
15/08/18 05:20:59.11 DwuFZXhSv
大きなバグが有ったので修正してビルドしなおし。
大ハマリしましたが、無事に直すことが出来ました。
やれやれ。

899:名無しさん@お腹いっぱい。
15/08/18 07:21:03.41 ShTE8dI+K
おつかれ

900:◆Meriken.Z.
15/08/18 09:59:42.07 DwuFZXhSv
JohnDoeさんみたいにメモリが64GBあるPCならもうちょっと
らくなんですけどね~ 彼女のPCは人工知能の研究のため
のものらしいです。私のは24GBですけど全然足りないです。

901:名無しさん@お腹いっぱい。
15/08/18 14:12:51.06 ShTE8dI+K
64GBかー
仕事で動画とか音楽とかやってる人ぐらいじゃないとなかなか載せんだろうなー

902:◆エリーチカニホレタ。ー゙゚リ!
15/08/18 16:04:32.38 3rPYXVU1W
メモリって積む人は積むもんなんですね……(8GB並感)

903:名無しさん@お腹いっぱい。
15/08/18 18:09:04.03 ZCvH8L0b2
12桁過疎

904:混沌 ◆YvAqloolpAvY
15/08/18 19:05:55.22 euqcnVoei
8bitパソコン(マイコン)時代のメインメモリ64KB  1980年台
MS-DOS3  32MBの壁 パーテーション   1984年~
MS-DOS3.3 128MBの壁 パーテーション
8086のメインメモリ 640KB
NT系4GBの壁 パーテーション (BIOSでも似たような壁があった)

なんというかまぁ、隔世の感

905:3D梨 ◆pPPPPpppPPCB
15/08/18 22:43:28.69 z9Qtgb/F3
>>874
JohnDoeさん女だったのか...

906:◆ooooooOoAo
15/08/18 23:19:09.32 ss4Ge8SbP
12桁どうしたの…

907:◆Meriken.Z.
15/08/19 01:30:58.82 hKgvmBJMQ
12桁は長い間ほとんど◆Kkkkkkkkkkさんが一人で
がんばってくれてましたからねえ。ありがたや~
今はCPUGPUさんがカバーしてくれているみたいです。

908:CPUGPUさん
15/08/19 03:15:52.04 xFwyL6urB
突然ですがCellプロセッサのソフトが作れる環境が欲しいです
アップデートしていないPS3を手に入れるしかないのかな

cell の128個SPEが乗ってるバージョンも欲しいです


トリップ検索はBOINCのWCGとどっちを優先しようか悩みながらやってます

909:名無しさん@お腹いっぱい。
15/08/19 17:56:09.98 xFwyL6urB
昨日まで2.0.0にしてからしばらく12桁を回してなかったんだけど
今日ひさしぶりに12桁を回したらディスプレイドライバが落ちて画面が一回消えて検索が止まる現象起きてます

もしかしたら部屋のPC周りが微妙に変わったから熱のせいかもしれないけど

環境は >>731 です (Windows 8.1)

エラーログはどこかに作られてるのかな?

910:名無しさん@お腹いっぱい。
15/08/19 18:04:46.21 xFwyL6urB
これってOpenCLのカーネルが動いてる時間が長すぎると起きるやつかな

とりあえず 1CU あたりのワークアイテム数 を下げてみた

911:◆Meriken.Z.
15/08/19 23:16:29.69 hKgvmBJMQ
>>883
おかしいですね。Windows 8.1だからかな。
デフォルトの値を下げておきます。

912:名無しさん@お腹いっぱい。
15/08/19 23:33:00.33 xFwyL6urB
>>885
PC再起動+ワークアイテム896でドライバ落ちなくなりました

(サーバとの通信失敗はまだたまに出ます)

913:◆mMmmMmMMM.
15/08/20 00:34:55.23 JfchMfxI2
私も今日初めてサーバーとの通信失敗出ました。

914:名無しさん@お腹いっぱい。
15/08/20 01:38:19.24 xOeO10sWg
私は人生に失敗しました・・・

915:◆Meriken.Z.
15/08/20 06:24:07.64 6Dm6uhoGc
>>882
PCIeの拡張ボードもあったはずですけど
どうなったんでしょうねえ。
12桁トリップ検索は人が少ないので
ぜひお願いします。

916:◆Meriken.Z.
15/08/20 13:17:13.15 6Dm6uhoGc
>>888
そう思っていても意外に道はひらけるものです。
諦めちゃいけません。

917:◆Meriken.Z.
15/08/20 13:34:25.79 6Dm6uhoGc
sm32、sm35、sm37、sm50、sm52、sm53のバイナリを全部入れた
バージョンの作成に再挑戦。出勤前にビルドを仕掛けて夜9時に
帰宅しても終わってなかったのには笑っちゃいましたw
後もうちょいで終わりそうなので出来たらちょっとうpしてみます。

918:名無しさん@お腹いっぱい。
15/08/20 15:34:26.24 MSUowpqZl
分散カーネルコンパイルネットワーク

Yggdrasilにログインしてる人で分担してカーネルをビルドして共有する

919:◆Nenohi.aUw
15/08/20 20:22:31.52 f9oESLSax
検索に参加したとたんCPUが100%行ってビビって切ったおもひで

920:名無しさん@お腹いっぱい。
15/08/20 21:17:04.54 Ujkng+CrL
アイドリングぽく検索できたらいいのにってことかね?

921:◆/Meriken/.
15/08/20 21:26:07.53 WsIIzTByP
ビルドは最後のリンカでコケてしまいましたorz
Windowsの実行ファイルのサイズの制限に引っかかった
みたいです。需要のなさそうなsm32、sm37、sm53を削除して
再ビルド。今度こそ大丈夫なはず…

922:名無しさん@お腹いっぱい。
15/08/20 21:45:03.82 xOeO10sWg
CPU コアを幾つ使うか指定出来るじゃん。

923:◆Meriken.Z.
15/08/22 08:04:16.87 qdR1jJ05P
64bit版のビルドが終わって32bit版をビルド中。
2つ合わせて2.5GBあるけど圧縮したら200MB以下になりそうです。
最終テストが無事に終われば週末には新しいバージョンをうpできそうです。

924:◆エリーチカニホレタ。ー゙゚リ!
15/08/22 09:00:17.22 1uznB3k1C
>2.5GB
えらく膨れ上がりましたね……

925:◆Meriken.Z.
15/08/22 09:08:46.80 qdR1jJ05P
CUDA用のバイナリが山のように入ってますからねえ。
まあ「NVIDIA高速版」の他に通常版も入っているので
大丈夫でしょう。「NVIDIA高速版」は使わないなら圧縮したままに
しておくか削除すればいいだけですからね。

926:累計 ◆wop.8OO8.qow
15/08/22 14:19:21.63 SD13Sv40I
JohnDoeさん、酉変更したみたいですね
URLリンク(i.imgur.com)

役満みたいですw

927:名無しさん@お腹いっぱい。
15/08/22 15:36:22.54 4KMhoANxv
準10連・回文・鏡で数え役満?

928:◆Meriken.Z.
15/08/22 20:44:31.58 qdR1jJ05P
なかなかセンスありますね~
今気づいたけどJohnDoeさんって初期からのユーザーなんですね。
どうやってYggdrasilを見つけたんだろう…

929:◆Meriken.Z.
15/08/22 20:48:31.90 qdR1jJ05P
ビルドはようやく終わって、後はもう1回980 Tiに差し替えて
テストするだけです。部屋の片付けが一段落したらやろうっと。
奥さんが木曜日に引っ越してくるのに全然準備ができていない…

930:名無しさん@お腹いっぱい。
15/08/22 21:26:10.61 iXivwaj4w
トリ検索に燃えるのもいいが、自分の生活が一番だからなー
ほどほどにね

931:◆/Meriken/.
15/08/24 06:41:05.88 1erNhuQ6S
ですよね~ 結局x86でビルドした「NVIDIA高速版」は
CUDAのエラーで動かなかったので、「NVIDIA高速版」は
64bit OS専用にすることにしました。これから新しい
バージョンをうpします。

932:◆/Meriken/.
15/08/24 10:03:17.88 1erNhuQ6S
新しい開発版をうpしました。

Meriken's Tripcode Generator 2.0.1 Free Edition
URLリンク(meriken.ygch.net)

バージョン2.0.0FEからの主な変更点は以下の通りです。

・「NVIDIA高速版」によるNVIDIAのビデオカードでの10桁トリップ検索の
 大幅な高速化。
・CUDA用の検索ルーチンのマルチスレッド化。
・CUDA用の最適化機能の削除。
・その他バグフィックス多数。

「NVIDIA高速版」の使い方は説明書を見てください。
NVIDIAのビデオカードでの動作報告をいただけると有り難いです。

933:名無しさん@お腹いっぱい。
15/08/24 10:06:38.63 dB5v4476O
おつりんこ

934:◆エリーチカニホレタ。ー゙゚リ!
15/08/24 11:15:33.61 /BVQB8uPr
>>906
乙です。試してみました。……軽く目を疑ったんですがソレは
(NVIDIA高速版って、Readmeにあるようにコピーするだけじゃなくて、
MerikensTripcodeEngine64_NVIDIA.exeをMerikensTripcodeEngine64.exeと
書き換えないと上手く動作しない気がする)

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Generatorのバージョン】2.0.1 Free Edition→NVIDIA高速版
【OS】Microsoft Windows 10 Pro 64bit
【ディスプレイドライバ】355.60

【検索デバイス】GPUのみ
【使用するGPU】すべて使用
【GPU】GALAXY GF PGTX750TI-OC/2GD5
【CPU】Intel Core i7-4790K

【1SMあたりのブロック数(CUDA)】256
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【 3分間のGPU検索の平均速度】 981.80M tripcode/s→1006.03M tripcode/s

935:◆/Meriken/.
15/08/24 11:28:03.32 1erNhuQ6S
>>908
おおどもども。10桁トリップ検索もぜひお願いします。

> MerikensTripcodeEngine64_NVIDIA.exeを
> MerikensTripcodeEngine64.exeと
> 書き換えないと上手く動作しない気がする)

「通常版」と「NVIDIA高速版」の12桁トリップ検索は全く同じで~す。

936:◆エリーチカニホレタ。ー゙゚リ!
15/08/24 11:42:31.72 /BVQB8uPr
10桁もやっておきました。
2.0.1 Free Edition→NVIDIA高速版で113.15M→134.10Mでした。

937:名無しさん@お腹いっぱい。
15/08/24 12:00:22.39 CgB34fyZW
windows8.1
i7-4790
GTX 980 Ti 1枚
10桁ですが

400~1300M/sと、あくまで表示上(現在速度)ですが
ブレが今までのものより大きいですね

CPUGPU 1000Mほどまで上がり→700M+α平均

GPUのみ 1300Mほどまで上がり→700M平均

GPUのみ(OpenCLチェック外し) ブレ少なく650M安定

それと起動時に

ディスプレイ ドライバーの応答停止と回復
ディスプレイ ドライバー NVIDIA Windows Kernel Mode
Driver,Version 355.60 が応答を停止しましたが、正常に
回復しました。

と出て以後1~2分毎にこれが出ます

938:◆Meriken.Z.
15/08/24 12:24:47.90 vqA9cBgRf
>>911
> ディスプレイ ドライバーの応答停止と回復

これさっきうちでも出ました。OCしていたのが原因だったようですが、
そちらのほうはどうですか。

939:◆Meriken.Z.
15/08/24 12:25:49.52 vqA9cBgRf
>>910
いい数字ですね~ あるがとう!

940:◆Meriken.Z.
15/08/24 12:26:41.04 vqA9cBgRf
あるがとうってなんだよorz

941:名無しさん@お腹いっぱい。
15/08/24 12:33:34.40 CgB34fyZW
知識がないものでOCしておりませんw

今しがた電源が落ちました・・・

942:◆Meriken.Z.
15/08/24 12:47:38.39 vqA9cBgRf
>>915
電源かマザボが負荷に耐え切れていないみたいですね。
とりあえず「詳細設定」->「検索デバイス」->「CUDA」->
「1SMあたりのブロック数」をデフォルト値の128より小さくして
みてください。64か32あたりがいいでしょう。

943:名無しさん@お腹いっぱい。
15/08/24 13:14:57.03 CgB34fyZW
10分ほど応答不能になり焦りましたが
復帰したので今回の最後のチャレンジしてみます

デフォルト値が128の物が見当たらなかったので
「1SMあたりのブロック数」をデフォルト値の
8から2へ変えて試してみています
GPU+CPUで800M/sで安定しています
と思ったらOpenCLを使用していませんでした・・・

また後程

944:◆Meriken.Z.
15/08/24 13:26:24.96 vqA9cBgRf
>>917
なんかおかしいなと思ってたんですけど、
「CUDA対応デバイスでもOpenCLを使用する」は
使わなくていいです。というかこれで動くこと自体が不思議だ…


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch