【トリップ検索】MERIKEN's Tripcode Finder その5at SOFTWARE
【トリップ検索】MERIKEN's Tripcode Finder その5 - 暇つぶし2ch350: ◆Meriken//XXX
13/10/11 17:35:32.84 oMuOOsM+P
とりあえずAVX2を検知するルーチンを追加しました。
まあ時間はたっぷりあるのでのんびりやることにします。

351:名無しさん@お腹いっぱい。
13/10/11 17:52:36.25 zZdEZh+x0
冷蔵庫inで、検索。

352:SilentPC ◆SilentPCIePC
13/10/11 17:59:12.22 vXaPX/w40
もういっそ、豪快にアメリカらしくガレージに検索君を置いて、水冷モーターは排水ポンプ用のを使って、ラジエーターは自宅のプールに沈めるのが良いのかもね…
日本なら逆にエコを意識して、発熱で発電をしてその電気で冷却をする装置を開発し、電気代を節約とか。
普通のPCの発熱程度じゃ無理でも、それぐらいの消費電力になれば流石にいくらか還元は出来ないものか?
何か良い発電装置のアイデア無いですか?

353:混沌 ◆Chaos/geeeIV
13/10/11 18:37:11.10 7L8VTn8Q0
冷蔵庫in、検索してみたら想像してたのと全然違ったw


冷蔵庫搭載PC
URLリンク(weekly.ascii.jp)
URLリンク(weekly.ascii.jp)

とか
冷蔵庫の中にマザー入れちゃって冷やすやつとか

そーいうのを想像してたのに、最近流行りのアレだったのね・・・w

354:名無しさん@お腹いっぱい。
13/10/11 19:00:32.74 fckT3S+N0
新生検索君1号大勝利!!!!!

355:名無しさん@お腹いっぱい。
13/10/11 23:27:37.53 r5Pqdip00
>>347
とりあえず最終的な廃熱を室内空気じゃなくて外気に捨てるところからですね。
>>352
温度差で発電すると発電機が熱抵抗になっちゃいますからねぇ…
温度差発電による稼動効率補助つきDCの噂は聞いたことありますが、
発電電力による冷媒循環での効率上昇が発電の熱抵抗を上回れるかどうか。
>>353
冷蔵庫/冷凍庫は温度差が稼げるだけで熱交換速度が遅いから、
断熱性のお陰で逆に蒸し風呂になるってアレですねww

356:名無しさん@お腹いっぱい。
13/10/12 05:04:23.90 BCrjFCBd0
664 :名無しさん? [↓] :2013/10/11(金) 23:58:53.30 ID:???
AMD Catalyst 13.11 Beta Driver for Windows
URLリンク(support.amd.com)

357: ◆Meriken//XXX
13/10/12 10:00:12.64 Oyi47z8vP
>>356
15日に発表のR9 290Xは対応カードの一覧には入っていませんね。
発表の日が楽しみです。

358: ◆Meriken//XXX
13/10/12 10:17:44.74 Oyi47z8vP
とりあえずAVX2で12桁トリップ検索を動かしてみました。
CPU(i7-4770)だけで209M TPS出てます。

URLリンク(www.meriken2ch.com)

ただ、リテールクーラーでは冷却が追いつかないようで、
しばらくしたらCPUがスロットルダウンして速度が下がってしまいました。

URLリンク(www.meriken2ch.com)

まあでも実際に倍近い速度が出せたのでまずまずの成果と言っていいでしょう。

359: ◆YSRKEN.ceVZZ
13/10/12 10:29:55.29 RMpLDz7l0
>>358
CUI画面がすごく懐かしく感じる……あれ、
無料版でもCUI実行で検索できましたっけ?

360: ◆Meriken//XXX
13/10/12 10:32:37.37 Oyi47z8vP
>>359
出来ませんよ。開発用に有効にしてるだけです。

361: ◆Meriken//XXX
13/10/12 10:52:01.12 Oyi47z8vP
32bit AVX2版も作ってみたのですが、こっちでは検索開始直後に
230M TPS出ています。かなり謎です。キャッシュの使い方とか、
OoO向けの最適化とか、工夫の余地はまだ大分ありそうです。

362: ◆QZschizo.ptH
13/10/12 12:27:39.22 zonN9MYx0
5970x2ですがやっぱりデバイス判定に時々失敗します.
再現性をみるのにどこから手をつけたらいいですか?

363: ◆Meriken//XXX
13/10/12 12:34:44.55 Oyi47z8vP
CPUのクロック周波数を3.5GHzまで落としたらようやく熱ダレを起こさなくなりました。
速度はこんなかんじです。

64bit版: 186.84M TPS
32bit版: 209.06M TPS

同じ条件でのDayトリッパーの速度は次になります。

DayTripper2101: 154M TPS

MTFはかなりの速度を出しているのですが、
64bit版のほうが32bit版より遅いことの説明がつきません。
やっぱりCで書いたルーチンを見なおした方がいいのかな…

364: ◆Meriken//XXX
13/10/12 12:41:52.14 Oyi47z8vP
>>362
それはおかしいですね。とりあえず開発版のMerikensTripcodeEngine.exeを
動かして、デバイス判定の失敗したときに"OPENCL DEVICE"の"Name"の部分に
何が表示されているか調べてみて下さい。ドライバのバグの可能性が高いので、
ドライバを変えてみるのもいいと思います。

365: ◆Meriken//XXX
13/10/12 13:50:51.64 Oyi47z8vP
64bit版が遅くなっていた理由がわかりました。
yasmのビルトインマクロであるsave_xmm128が
vmovdqaではなくmovdqaを使っていました。
まったく、油断も隙もあったものではありませんw
これで速度差は妥当なものになりました。やれやれです。

64bit版: 211.96M TPS
32bit版: 209.06M TPS

366: ◆Meriken//XXX
13/10/12 15:02:59.99 Oyi47z8vP
キャッシュに乗りやすいようにテーブルの一部を関数ローカルにコピーしてやったら、
それだけで2~4M TPSほど速度が上がりました。結構まだ工夫の余地がありますねえ。

64bit版: 216.11M TPS
32bit版: 210.78M TPS

367:名無しさん@お腹いっぱい。
13/10/12 15:12:32.49 UKFSL8z80
>>353
VAX Barで通った道なのに今更感が強いですね、これ

368: ◆Meriken//XXX
13/10/12 15:42:11.41 Oyi47z8vP
>>352
一軒家に住んでたら間違いなく検索君1号はガレージ行きですねw
自室に置いているのは、我ながら正気の沙汰ではありません。
冬に暖房が全く必要ないのは助かりますが…

369: ◆JouJaku.IYSv
13/10/12 15:59:07.38 SgElHHWv0
>>366
お疲れ様です。
同じCPUで定格(3.7GHz)だと約120MTPSなので、ほぼ倍のスピードが出ていますね。
水冷だとサーマルスロットリングは起きないだろうから、楽しみです。

370:混沌 ◆Chaos/geeeIV
13/10/12 17:28:36.27 +NNdeoDL0
>>367
VAXを知らない畑にいたわけじゃないけど
直接端末に触れた事はほとんどない・・・
ただ、あいつがあるコンピュータルームってのは肌寒くてねぇ・・・w

触れたこともほとんどないから、VAX Barなるものもはじめて聞いたんだけどググってみたよw
感想は、メリケン野郎の考えることはクレイジーだぜw って感じw

メリケンさんに引っ掛けたけど、別に罵倒でも卑称でもないのであしからずですw
っていうか、メリケンさんの名前 ハンドルはその意味から取ってて、今住んでるのもソッチのほうなんだろうけど日本人ですよね?

371:名無しさん@お腹いっぱい。
13/10/12 19:44:19.02 XeWEbd3E0
VAX って、VAX/VMS の事??
それなら懐かしいな・・・

372:混沌 ◆Chaos/geeeIV
13/10/12 20:41:37.86 +NNdeoDL0
>>371
ですですw

373:名無しさん@お腹いっぱい。
13/10/13 01:11:31.43 KYI8bH6i0
今更なことですが、検索文字列がヒットしたら、該当する依頼を無効にする
(ゆぐちゃんではなくローカルでの話)機能って付けられますかね?

374:名無しさん@お腹いっぱい。
13/10/13 01:34:02.23 xoBD38890
グラボごとの速度をまとめたWikiとかってどっかにありますか?

375:混沌 ◆Chaos/geeeIV
13/10/13 04:58:52.86 fqcxyF9L0
ローマ字っぽい4文字を適当に作ってみる正規表現の超適当版
^[KSTNHMRGZDBP][aiueo]([kstnhmrgbp][aiueo]){3}/
こんな感じで検索回してみたものの・・・


確かにローマ字なんだけど、まともな単語が出来る確率の低さにがっかりw

376:磯の良い石 ◆ISONOIIISI
13/10/13 05:20:16.81 KYI8bH6i0
>>375
昔、ローマ字のみで意味が通るトリップを生成するための正規表現を自作したことがある
1文字の類(母音)、2文字の類(母音以外の1文字カナ)、3文字の類(拗音を含む類)を
長さが12桁(or10桁)になるように並べたデータをプログラム組んで用意して、
patterns.txtに書き込んで回したもんだ……展開が物凄いことになったがな!

で、上に出ている酉がその成果の一つだったり……

377:名無しさん@お腹いっぱい。
13/10/13 05:35:30.40 KYI8bH6i0
>>374
データの蓄積自体は相当量ありますが、なにせアップグレードでガンガン速度向上しますもので……
このスレだけ見ると、
「HD6990+HD7970+HD7990≒11.1GTPS」(>>3、Ver.0.10)
「HD6850≒805MTPS」(>>19,Ver.1.1FEα2)
「HD 5570/5670≒340MTPS」(>>94,Ver.1.1FEα5)
「GTX660≒536MTPS」(>>98,Ver1.1FEα4)
「GTX650≒207MTPS」(>>101,Ver1.1FEα5)
「GeForce610M≒64.3MTPS」(>>114,Ver1.1FEα5)←参考記録
「GTX650≒9.24MTPS」(>>154,Ver1.1FEα7)←!?
といった感じですかね。他は前スレを当たることをお勧めします

378:名無しさん@お腹いっぱい。
13/10/13 05:44:41.91 JeVY24vu0
>>377
> 「GTX650≒9.24MTPS」(>>154,Ver1.1FEα7)←!?
これは10桁ですよ

379:名無しさん@お腹いっぱい。
13/10/13 05:46:37.71 KYI8bH6i0
>>378
あ、本当だテヘッ

380:名無しさん@お腹いっぱい。
13/10/13 05:54:58.91 +cbnuJwL0
>>377
グラボ、ドライバ、バージョン、設定値・・・手集計はミスが怖いし、
ゆぐちゃんでグラボと速度の情報とって公開してくれたら面白そう

381: ◆Meriken//XXX
13/10/13 09:04:25.37 EU+GIsqgP
>>370
日本人ですよ~

382: ◆Meriken//XXX
13/10/13 11:34:03.90 EU+GIsqgP
10桁トリップ検索のAVX2への対応がなかなかうまく行きません。
ぐぬぬぬぬ…

383: ◆Meriken//XXX
13/10/13 13:53:21.35 EU+GIsqgP
一応AVX2対応の10桁トリップ検索のルーチンは動くようになったのですが、
なかなか思ったような速度が出てくれません。

AVX(8スレッド): 23.95M TPS
AVX2(8スレッド): 37.98M TPS
AVX2(4スレッド): 35.09M TPS

まあそれなりに速くはなっているのですが、L1Dキャッシュが潰れているみたいで、
倍の速度にはなりませんでした。ちなみに8スレッドから4スレッドにても
あまり速度は落ちていません。やはりキャッシュの使い方を工夫するしかないですねえ。

384:混沌 ◆Chaos/geeeIV
13/10/13 14:31:17.44 fqcxyF9L0
>>376
10桁の方はまだマシなんですが、12桁だと特に
ちょっと無茶なパターンを作ると、すぐに展開サイズがシャレにならない事になって
MTFで検索開始しても、パターンを展開中・・・ まではまだ何とか動いても
そのあとのパターンを処理中で帰ってこなくなってw
帰ってきても、なぜかその後のユグと通信に失敗して何分後に再通信しますとなって、その時間になると展開から再開になって繰り返すのよねw
なんかエラーのアラート窓が出た時もあったな・・w 10秒くらいでその窓消えちゃったから内容確認できなかったけど・・w

まぁそんな感じで、パターンは展開後のサイズがあんまりでかくなり過ぎないように気をつけているのと
パターン定義の入力欄、一応長い定義も書き込めるみたいだけど入力窓あんまり大きくないし、どうせ表示も表示窓の横幅までだから
あんまり複雑な定義もなーって思ってたけど
patterns.txtに直接かーw
patterns.txt って、相当長くなってしまってもしっかり読み込んでくれるのかな(使用可能なメモリの上限チェックとかもろもろ、そういう処理コミコミで)
というか、上記のエラーとか不安定だったのはグラボのメモリの制限なのかなって、自分のグラボを今更ながらみてみたら2Gもメモリあるのね・・・w
7990が6Gも積んでて信じられんとおもったけど、2Gでも十分に信じられないレベルだったw

閑話休題

古い人間なもので、「グラフィックシステム」でユーザープログラムを動かす なんていうと
FM-7のグラフィックサブシステムにYAMAUCHIコマンドで数バイトの共有メモリを使ってプログラムを転送して・・・w
なんてイメージが湧いてきちゃうのですよw(「YAMAUTIコマンド」はググると出てくるはずw)

とはいえ、今のグラボにユーザー処理させるってのも、やっぱり転送して走らせるとかするのでしょうね
動かすプログラムは・・・・・・・むむっ・・・w うーん、スレみてるとアセンブラに置き換える話がでてきてるのはわかるんだけど
GPUに対応したコード吐くコンパイラとかあるって事なのか・・


うーん、我ながら話が飛びまくったわけのわからんレスに・・・w

385:名無しさん@お腹いっぱい。
13/10/13 14:58:50.97 KYI8bH6i0
>>384
昔書いた展開用コードを引っ張りだしてみました。
まず、ローマ字でカナを表現すると、
・アルファベット1文字 ([aiueo]|n)
・アルファベット2文字 ([kstnhmyrwgzjdbp][aiueo]|sh[aiuo]|ts[aiuo]|ch[aiuo]|fu|oh)
・アルファベット3文字 ([kstnhmrwgzjdbp]y[aiueo]|kwa|gwa)
となります。流石にこのままだとハズレ率が半端なくなるので、実際には
[aiueon]と([kstnhmr][aiueo]|y[auo])と[kstnhmr]y[auo]に限定していましたが。
後は「3322」「13231」など長さ「のみ」記述したデータをループ回しで全生成し、
数字部分を上記正規表現文字列に置換すれは完成です。
ちなみに今適当に回したら10桁用で1760行ありました……。

まあこれですらハズレまくるのは目に見えている(感覚としては砂金採りに近い)ので、
あらかじめ豚辞書(フリーの単語リスト)データから「文字の組み合わせ」情報を抽出し、
それに当てはまらないような文字列(日本語っぽくならなさそうなもの)を弾くコードを別に書いて篩に掛けました。
最終的には、ヒットした結果の文字列ファイルを用意すると、
ワンクリックでかな変換→篩に掛けて出力までしてくれるようなものまで作った思い出があります。

結論:HSP様々。なんならお手軽検索キットでも送りましょうか?w

386: ◆Meriken//XXX
13/10/13 15:24:46.07 EU+GIsqgP
皆さん私が考えてもみなかったような使い方をされてますね。
かなり新鮮ですw

387: ◆Meriken//XXX
13/10/13 15:27:45.22 EU+GIsqgP
キャッシュを潰さないためにお蔵入りになったルーチンを引っ張り出してきました。
AVXだけだと微妙に遅くなるのですが、このさい文句はいってられません。
これをAVX2で書き直せばそれなりの性能が出るはずです。

388:混沌 ◆Chaos/geeeIV
13/10/13 15:51:14.32 fqcxyF9L0
>>385
ローマ字じゃなく
英文生成もどきみたいなのも、ちょっと考えてみようとしたんですけどねw

(名詞A|名詞B|名詞C)(動詞A|動詞B|動詞C)(名詞D|名詞E|名詞F) とか
適当な構文と品詞の組み合わせで・・・w

そんな風に考えたんだけど、既に検索中の正規表現だけでも
たとえば
^i[il][il][iIl][iIl][iIl][iIl][iIl][iIl][il][il]i$ とか
^[.]*[vwW]+[.]*$  とか
これでもあんまりサイズがでかくなり過ぎないようにセーブしながら作ってはいるんだけど
それでも地味に容量食うパターンが大量にあって気軽にパターンを増やせない状況になってて英作文正規表現はおあずけ中ですw

389: ◆znjnB.IJwZLU
13/10/13 17:43:41.60 J8269aFW0
>>387
Haswell導入おめでとうございます。

DESですが私のほうではあのcryptをそのまま256bit化して素直に倍の50MTPS出てます。
まあもともと256bit化したときにキャッシュに乗り切るようにあんな構造にしたので。

それよりもSHA-1で躓いてます。
アセンブラで書いてみたのはいいんですがハイパースレッディングがある状況ではあまり恩恵がありません。
イントリで書いてコンパイラに投げても同じ速度が出ます。
まあ、HT切るとスレッドあたり3MTPS差が付くんですが、HTがあると実行ポートを埋めきってしまえるみたで
107MTPSあたりで頭打ちになります。

アセンブラのほうは一週間かけてバイトコードと睨めっこしながら手動パイプライン化までしたのに・・・泣。

390:名無しさん@お腹いっぱい。
13/10/13 20:07:00.46 2IRlbwYd0
>>372
> ですですw
あれって、何かバッチファイル的な言語があったよね。
あれで擬似ログアウト画面を作って、色んな人のユーザ名とパスワードを集めまくった思い出が・・・
VAX/VMS 上でのクロス開発はかなりやったので、本当に懐かしいわ。

391:名無しさん@お腹いっぱい。
13/10/13 20:25:28.75 KYI8bH6i0
:::::::::::.: .:. . ∧_∧ . . . .: ::::::::     引っ張りだしたコードを元に、自動生成した
:::::::: :.: . . /彡ミ゛ヽ;)ヽ、. ::: : ::   patterns.txtを食わせてみたらメモリ不足で落ちた……
::::::: :.: . . / :::/:: ヽ、ヽ、i . .:: :.: :::.  URLリンク(up3.viploader.net)
 ̄ ̄ ̄(_,ノ  ̄ ̄ヽ、_ノ ̄.     左のタイマは検索実行と同時な。4GBほどメモリ食ってから
                         落ちたことからして、よほど工夫しないと検索不可能かもorz

参考までにpatterns.txtをば:URLリンク(www1.axfc.net)

392:混沌 ◆Chaos/geeeIV
13/10/13 20:49:06.63 fqcxyF9L0
>>390
フィッシング詐欺の手法のハシリみたいなかんじですなw
今となっては、セキュリティとかパスワードとか、色々そういう考え方が社会的に認知されてきたりしているけど
そもそも一般の人は銀行の暗証番号以外、パスワードで何かを守るなんてこと自体がなかったような時代だし
根本的に考え方が違ってた気がしますねぇw

393:名無しさん@お腹いっぱい。
13/10/13 22:44:36.72 r9Dbzyno0
>>391
いろいろと酷い

394:混沌 ◆Chaos/geeeIV
13/10/13 23:00:40.77 fqcxyF9L0
>>391
展開後のパターンじゃなく、途中まで展開した正規表現群みたいな感じですねw
12桁でこれを全パターンやったら、そりゃキますわw
[AIUEO]{12} これだけでも 約2^28 ですよw
これに加えて、1文字目から12文字目まで母音が入るパターンまで加えたらそりゃ大変なことにw

395:名無しさん@お腹いっぱい。
13/10/13 23:26:46.46 2IRlbwYd0
>>391
壁紙が気になる・・・

396:名無しさん@お腹いっぱい。
13/10/13 23:29:37.53 KYI8bH6i0
>>394
>[AIUEO]{12} これだけでも 約2^28 ですよw
一応、元々のコードでは「母音か拗音組が三連続したら弾く」というルーチンが
含まれていたので、そいつを組み込んだら行数が半分以下に。ただ、それでも
メモリ食い過ぎで検索できないのは変わらず。念のため、

[aiueo][aiueon][kstnhmr][aiueo][aiueon][aiueon][kstnhmr][aiueo][kstnhmr][aiueo]

だけ書き込んで回してみると、展開に4分ほど掛かった末にメモリを720MBほど消費しましたw
そりゃ無理ゲーだわ、と言うか確か最初に作った時(今年の1月始め)は待て屋で回してたような……

397:名無しさん@お腹いっぱい。
13/10/13 23:29:47.39 oUFnliXQ0
「ロリ・義母
ンデレ・孕ま

398:名無しさん@お腹いっぱい。
13/10/13 23:34:55.01 KYI8bH6i0
>>395
URLリンク(www.pixiv.net)
ですね。
>>397
勘違いしないでよね! 全体のフォルダ名は
「ロリ・義母・ツンデレ・孕ませ・寝取られ・・・すべての萌えは源氏物語が産んだ!」
URLリンク(blog.livedoor.jp)
なんだから!!

399:名無しさん@お腹いっぱい。
13/10/13 23:46:02.97 KYI8bH6i0
:::::::::::.: .:. . ∧_∧ . . . .: ::::::::     ちなみに、>>396で書いたパターンを待て屋で回したら
:::::::: :.: . . /彡ミ゛ヽ;)ヽ、. ::: : ::   メモリ消費量僅か5MB……現実は非情である
::::::: :.: . . / :::/:: ヽ、ヽ、i . .:: :.: :::.
 ̄ ̄ ̄(_,ノ  ̄ ̄ヽ、_ノ ̄

400:名無しさん@お腹いっぱい。
13/10/13 23:47:17.62 B/E+227R0
待て屋ってソース公開されてたっけ?
それなら、メモリ消費の少ないその方法を採用してみるとか。

401:混沌 ◆Chaos/geeeIV
13/10/14 00:06:18.79 HNICMWPj0
>>400
自分は ずっと前のトリッパーをちょこちょこ使っていた程度で、待てやとかも使ったことはないんですが
ただ、展開するから高速にマッチ出来るんじゃないかと思うw
このスレの過去ログとかほとんど見てないけど、初期はパターン数制限あったのがある時期に制限がなくなったってのが

たぶんその時に、パターンを展開して(おそらくはマッチする法のトリップも相当数メモリに展開してからまとめて)
アルゴリズム検索(2分検索みたいな?)を取り入れたんじゃないかと予想

メモリ展開して最適化するからこその、大量検索パターンを高速にマッチできてるんだと思いますよw

402:名無しさん@お腹いっぱい。
13/10/14 02:51:29.17 Ehj1Nv8O0
一応、パターン作成+結果からトリップ抽出+ローマ字変換+篩い掛けできるセットを配布しておきます。
ソースコードも添付しますので、参考までにどうぞ。

URLリンク(www1.axfc.net)

403: ◆ISONOIIISI
13/10/14 02:52:29.66 Ehj1Nv8O0
あ、私はID:KYI8bH6i0です。

404:名無しさん@お腹いっぱい。
13/10/14 03:17:32.75 a2gerbx00
>>391
>>> 正規表現の場合、展開数で制限を設ける方式ですか?
>> おおまかに言えばそうですね。
>> 厳密に言えばハッシュ値の数で決まります。
> スレリンク(esite板:100-101番)
なんかもう全部展開しちゃってる感じ?

>>401
先にメモリに展開する場合、展開したテーブルがキャッシュやメモリから溢れると思いっきりロスしそう。
展開数が一定範囲を超えたら正規表現とのマッチ処理をJITするのが最速なのかな・・・

405: ◆Meriken//XXX
13/10/14 04:18:18.49 cHLdpSNUP
MTFではパターンの一部(5文字)からハッシュ値を作成していて、
ハッシュ値の生成に必要な分は最初に全て展開しています。
この方法だと非常に強力な正規表現が使える代わりに
メモリの消費量は大きいです。

正規表現の部分は2年前に作ってからほとんどいじっていないので
改善の余地がかなりあります。待て屋のマッチングのアルゴリズムは
かなり特殊なのですが、これについては鳥屋氏にいろいろ教えて
いただいたので、ぜひMTFに取り込みたいところです。

406: ◆Meriken//XXX
13/10/14 04:22:38.64 cHLdpSNUP
>>369
どもども。10桁トリップ検索のAVX2対応の作業がおわったら新しい開発版を
うpするのでお楽しみに。

407: ◆Meriken//XXX
13/10/14 04:34:56.58 cHLdpSNUP
>>389
> まあもともと256bit化したときにキャッシュに乗り切るようにあんな構造にしたので。

なるほど、そういうことだったんですね。流石です。

> 107MTPSあたりで頭打ちになります。

これはおかしいですねえ。ちょっとMTFがどうなってるか調べてみます。

408: ◆Meriken//XXX
13/10/14 05:17:58.05 cHLdpSNUP
10桁トリップのAVX2対応のルーチンがようやく動きました。

AVX(8スレッド): 23.65M TPS
AVX2(8スレッド): 43.44M TPS
AVX2(4スレッド): 39.04M TPS

>>383よりだいぶましになりました。
CPUを定格に戻せば48.40M TPS出る計算です。
HTの効きは今ひとつなので、まだキャッシュの使い方に
改善の余地がありそうです。
あとは最終転置やキー生成の処理の見直しですね。

409: ◆Meriken//XXX
13/10/14 05:39:05.79 cHLdpSNUP
>>389
12桁トリップ検索はこんな感じです。速度が出ないのはなかなか謎ですねえ。

AVX(8スレッド): 117.31M TPS
AVX2(8スレッド): 215.71M TPS
AVX2(4スレッド): 184.12M TPS

410: ◆Meriken//XXX
13/10/14 08:45:16.44 cHLdpSNUP
キー生成のルーチンを見なおして、10桁トリップ検索の速度が
少し上がりました。

AVX2(8スレッド): 43.44M TPS -> 46.02M TPS

定格で51.28M TPS相当なので、まずまずといったところでしょう。
もうちょっと搾り取れそうな気もしますが、かなり疲れたので
取りあえず休憩することにします。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch