2ちゃんねるスレッド全文検索・・・ThreadSearchat SOFTWARE
2ちゃんねるスレッド全文検索・・・ThreadSearch - 暇つぶし2ch2:名無しさん@お腹いっぱい。
08/02/27 19:27:53 1hEn6hQc0
Styleの作者ならパクってくれると信じてる

3:名無しさん@お腹いっぱい。
08/02/27 19:37:05 vjWd7/tI0
取得してるdatから検索するだけじゃないか
つまりただのgrepソフトじゃないか
そうならそうと書いておけよファック!

4:名無しさん@お腹いっぱい。
08/02/27 19:38:24 1hEn6hQc0
よく見たらどの2chブラウザでもいいっぽいのかこれは

5:名無しさん@お腹いっぱい。
08/02/27 20:35:08 FQ2KAFmK0
cenのソフトか
本人もいることだし、ここでいいでしょ
MonoView Part1
スレリンク(software板)l50

6:名無しさん@お腹いっぱい。
08/02/27 21:39:02 i+WKuLeL0
JaneNidaの検索部分を抜き出したようなソフトだ

7:cen ◆Am9xOgNMYE
08/02/27 21:43:09 XGGqQQsX0
おや、こんなスレが。。
>>3
そうです。
取得済みdatから検索します。

>>4
datファイルのあるフォルダならブラウザは何でもいいです。

8:名無しさん@お腹いっぱい。
08/02/28 10:42:47 uqwne/o50
>>5
あきらかに趣旨が違うから、ここでもいい気が。

9:名無しさん@お腹いっぱい。
08/02/28 12:52:16 uqwne/o50
これ、まとめ屋さんに便利な気がする。
そういや、2chツール系はブラウザとかクライアントばっかでこういうのは少ないね
htmlに吐き出すことができればなおいいと思う。

10:名無しさん@お腹いっぱい。
08/02/28 17:20:43 Gggq9Nyh0
地味に便利な予感

11:名無しさん@お腹いっぱい。
08/02/28 23:44:23 L0/jQ3rB0
>>9
>htmlに吐き出す
できたぞ

12:名無しさん@お腹いっぱい。
08/03/06 16:17:15 HcKfrMgv0
“2ちゃんねる”専用ブラウザで閲覧したスレッドを全文検索できるソフト「スレッド全文検索」v1.00公開
スレリンク(news板)

ボロクソ言われてんぞ

13:cen ◆Am9xOgNMYE
08/03/07 00:33:43 PGe1vwef0
>>12
どうもです
携帯で見てみましたが、.NET重いとか遅いとかありますね。
まあ確かにそうです。

こっちに記事がでてますね。
URLリンク(www.forest.impress.co.jp)

14:名無しさん@お腹いっぱい。
08/03/07 00:48:15 zd9RAkN10
まあ、2chブラウザ自体に検索機能あるしね

15:名無しさん@お腹いっぱい。
08/03/07 17:38:16 87XM4sqy0
誰もマイクロソフトの.netに夢を見ていないから
独自で作ったほうがいいな

16:名無しさん@お腹いっぱい。
08/03/07 18:20:03 87XM4sqy0
言い忘れたけどこのソフト名前変えたほうがいいと思いますよ。
おそらく勘違いされるんじゃないでしょうか。

17:名無しさん@お腹いっぱい。
08/03/08 03:15:59 kKmHjYKD0
専ブラのボードデータ読んで欲しいものだ

18:名無しさん@お腹いっぱい。
08/03/08 11:46:41 762Hpsy80
似たようなソフトが二つあるけど、その違いは?

19:名無しさん@お腹いっぱい。
08/03/08 11:47:04 D+lEa7FU0
>>18
もう一つは?

20:名無しさん@お腹いっぱい。
08/03/08 16:19:56 762Hpsy80
スレッド全文検索
URLリンク(www.geocities.jp)

datファイル全文検索ソフト
URLリンク(www.geocities.jp)

21:名無しさん@お腹いっぱい。
08/03/08 17:24:55 TYy/Hfz20
Googleデスクトップでdatが検索できればいいんだけどなぁ

22:名無しさん@お腹いっぱい。
08/03/08 23:36:26 D+lEa7FU0
>>20
>>1のトップ見ると、スレッド全文検索は
datファイル全文検索ソフトの次のバージョンだって

23:名無しさん@お腹いっぱい。
08/03/12 22:39:18 GO9/GYs2O
age

24:名無しさん@お腹いっぱい。
08/03/18 16:58:40 mxy1kdrV0
板名の項目と正規表現が欲しい。
あと、スレタイ・日時を指定した場合、一致しないdatは検索しないようにして欲しい。

25:名無しさん@お腹いっぱい。
08/03/23 05:48:21 t1CKTA7y0
>>21
使えるかは知らんが

Jane Log Indexer
URLリンク(www.geocities.jp)

26:名無しさん@お腹いっぱい。
08/03/23 12:44:05 hbPh49eZ0
>>25
おおー、これはすばらしい!

ついでに質問したいんだけど・・・
見つかったdatを簡易ブラウズするいい方法ってあるかな?
dat2htmlを内部的にやってくれて、サクっと表示してくれればうれしいんだけど

27:名無しさん@お腹いっぱい。
08/03/23 19:28:22 qVTFsXtE0
バッチ書けばなんとかなりそう。
やってみるべさ。こういうのはあまり得意ではないけど。

思いっきりスレ違いだけど、このスレあまり活動してなさそうだから別にいいか。

28:名無しさん@お腹いっぱい。
08/03/23 19:49:45 qVTFsXtE0
あっ、バッチじゃダメか…(^^;

29:名無しさん@お腹いっぱい。
08/03/23 19:56:23 qVTFsXtE0
レジストリか…さじ投げする。
すまない。NGしてくれい。

30:名無しさん@お腹いっぱい。
08/03/23 22:39:39 Q/s+q/fC0
index作成型じゃないの?
すごくのろい。

31:cen ◆Am9xOgNMYE
08/03/23 23:42:41 Oti8oodi0
>>24
板名で絞込みをどうしようかと思いましたが、ブラウザによって管理方法が
違うので迷いました。
今はどのフォルダでも同じように検索できるようになってます。

日時ではしてないですが、スレタイを指定して一致しない時は検索しない
ようになってます。

32:cen ◆Am9xOgNMYE
08/03/23 23:44:03 Oti8oodi0
>>25
へえ。こういうのあるんですね。

>>30
なるほど。
index作れば速くなりそうですね。
あまり考えないで作ってました。

33:名無しさん@お腹いっぱい。
08/03/24 16:48:56 DoGMgzst0
>32
最初のログ容量次第でindexの作成にバカ時間食いそうだけど、
その後がチマチマ増えたログのindex作成はたいして時間かからないだろうし
快適な気がしますです。

34:名無しさん@お腹いっぱい。
08/03/26 00:32:25 oQdgbeGv0
NamazuとかPerlとかkakasiとか判らないので
マジindex作成型もお願いします。

35:名無しさん@お腹いっぱい。
08/03/26 10:35:29 kUpi6chJ0
そんな数検索するなよって話なんだろうけど
約15000個あるdatから全文検索かけたら凄い時間かかったから消した。

この機能は凄いありがたいんでどうにか高速化して欲しい

36:名無しさん@お腹いっぱい。
08/03/31 04:45:41 ERjlVa+T0
これ結構便利だ

37:名無しさん@お腹いっぱい。
08/04/01 22:43:05 h0Fp9KJ00
cenさんありがとう、これ物凄い便利です

要望ってここで書いちゃっていいのかな?

追加を検討してほしい機能があります
検索後の結果でレスが読めますがやっぱり周辺のレスやら流れが読みたい事があります
そこで検索結果表示のスレタイをクリックしてそのスレ全部表示できたら良いなぁと

最近bbs2chreaderに乗り換えたのですが検索が無い、板フォルダ名がJaneと非互換なので
検索、後で読む、用にJaneにインポートさせるのも面倒だったりします
しかも現在bbs2chreaderは管理が変わり他専用ブラウザからのインポートもできません。。。

御一考頂ければなぁ、と思います

38:cen ◆Am9xOgNMYE
08/04/03 00:51:35 Cv07eAXJ0
>>33-35
インデックス作るのには時間かかるかもしれないですが、
それがあると検索が速くなりそうですね。
考えてみます。

39:cen ◆Am9xOgNMYE
08/04/03 00:53:32 Cv07eAXJ0
>>37
なるほどです。
結果の前後のレスも気になるといえば、なる時もありますね。
そういうのがあれば便利かもしれないですね

40:名無しさん@お腹いっぱい。
08/04/03 02:36:58 EcJnLzvJ0
>>39
レスありがとうございます
需要がありそうでしたら御一考くださいませ

41:名無しさん@お腹いっぱい。
08/04/08 17:41:43 drLz8VQs0
期待age

42:名無しさん@お腹いっぱい。
08/04/11 01:39:36 ECxOlQdf0
index作成型 期待

ついでに各ブラウザから板リスト持ってきて、ドロップダウンリストっていうのかな?
検索する板も指定出来るといいな。
現行だと検索板を指定したくてフォルダ指定しようとすると大量ログがあるせいで
なかなかフォルダが開かないです。

まあindex作成型なら板指定なんかする必要は無いとも思いますが。

43:名無しさん@お腹いっぱい。
08/04/11 09:45:28 5aXvEh9K0
index作成には特別興味ないけど、スレやレスのurlが分からないのは困る。
せっかく結果をファイルで保存できるのもったいない。

44:cen ◆Am9xOgNMYE
08/04/20 23:26:55 qLPJ64JY0
>>42
インデックス方式は方法をぼちぼち考えて、テストのプログラム作っています。
板を選べるのもいいと最初思いましたが、ブラウザによってログの管理方法が
違うので対応をどうしようかと思い、結局はその機能はつけませんでした。

>>43
確かにそうですね。
後で見たときにその方がわかりやすいですね。

45:名無しさん@お腹いっぱい。
08/04/24 14:17:31 3g3UPg6D0
>インデックス方式
楽しみーに待ってるです

46:名無しさん@お腹いっぱい。
08/04/26 17:16:31 nKn/rH3TO
あげ

47:名無しさん@お腹いっぱい。
08/04/27 09:23:11 9Z0yo3eP0
インデックスは独自?
それともnamazuとか使うの?

48:cen ◆Am9xOgNMYE
08/04/27 22:42:01 bblsSfITO
>>47
独自の方法でする予定です。

49:cen ◆Am9xOgNMYE
08/05/04 06:42:57 BcpREFdy0
おはようございます。

スレッド全文検索を更新しました。
Ver 1.50になりました。
URLリンク(www.geocities.jp)

更新点は以下です。
・インデックス方式にしました。
・結果にログファイルのパスを表示しました。

50:cen ◆Am9xOgNMYE
08/05/04 06:49:10 BcpREFdy0
インデックスを使うことで高速に検索できるようになりました。
URLリンク(www.geocities.jp)

HPに載せている結果の場合、約3倍・約34倍 高速になっています。
検索語句によって速度がかなり変わります。
ユニークな言葉だと速く検索できます。

51:cen ◆Am9xOgNMYE
08/05/04 07:01:09 BcpREFdy0
それから、検索結果はVer1.00と同様の結果が出ます。

52:cen ◆Am9xOgNMYE
08/05/04 18:32:08 IdG+Z9YvO
あと、方法は独自と書きましたがほぼngram法です。

53:名無しさん@お腹いっぱい。
08/05/04 19:57:44 qNt4WyLm0
Vista SP1(64bit)で動かしてみたんだけど、
ステータスバーに

「インデックス作成中・・・ファイルリスト作成中」

と表示されたまま、CPU使用率も上がらず、HDDアクセスも無いまま
インデックス作成が終わらない・・・

54:cen ◆Am9xOgNMYE
08/05/04 21:21:24 XlfbduW40
>>53
どうもです。
一度終了して、インデックスを削除しても同じですか?
それと、検索フォルダにログのフォルダを指定して、作成していますか?
それでも出来ないならフォルダのパスを変えてみてください。

一応、動作確認として、Vista SP1(32bit)と、XP SP2(32bit)でしています。
あと、正常にインデックスが出来たら、「index」の名前のフォルダに
以下のファイルができます。
・file_list.txt
・index_0.txt ~ index_xx.txt(xxは数字)
・path.txt

55:cen ◆Am9xOgNMYE
08/05/04 22:35:21 XlfbduW40
>>53
さっき調べてみましたら、dllを作成するコンパイラが64bitに
対応していませんでした。
ですので、すみませんが64bitの環境では動作しません。

56:名無しさん@お腹いっぱい。
08/05/05 02:14:03 a0XSAmtH0
>>50
キタ━━━(゚∀゚)━━━ !!!!
とても乙です!

うちの非力2chノートでのレポ
CeleronM1.3G/Mem1.2G/XPSp2
DATフォルダサイズ 3.09G
DATファイル数 48902
INDEX作成時間 2時間
(↑他のそこそこ重い作業しながら、あんまり目安にもならないw)

検索はかなり速くなりました、ヌルヌルとヒットが出てくる感じ
検索結果からDATへのリンクですぐ該当DATにアクセスできるので相当便利です


57:名無しさん@お腹いっぱい。
08/05/05 13:50:16 ywlZf+w20
>>55
.dat ファイルのパスをダブルクリックで「メモ帳」や>>nn 等の右クリックで 開く場合
「IE 」とキメウチされているようですが任意の(テキスト)ビュアーや
既定のブラウザーを使うか、各自指定できる様になると使いが手がより良いと思います。

58:57
08/05/05 14:37:31 ywlZf+w20
>>56
失礼「メモ帳」は Win の設定によるのでした...失礼しました。
ブラウザーに関しては「規定のブラウザー」を IE 以外にしていても
ヤハリ IE で開いてしまいます。

59:名無しさん@お腹いっぱい。
08/05/05 23:34:43 VS3MMtD80
>>55
あと、ウインドウ・サイズも覚えておいて欲しい。

.NET Framework ソフトとしては軽いので結構期待してる。

60:名無しさん@お腹いっぱい。
08/05/06 00:22:40 bFXI3am60
うほっ
index版 キテタ-
なにやらまだ不完全ぽいですが、さっそく使わせてもらいます。

祭日中にとっても乙

61:名無しさん@お腹いっぱい。
08/05/06 00:25:19 YR0md6ke0
>>60
>不完全ぽい
kwsk

62:名無しさん@お腹いっぱい。
08/05/06 01:24:52 9EHtnBj90
>>50
本文を含まない場合インデックスが利かないので一寸実用に耐えないなあl.

63:名無しさん@お腹いっぱい。
08/05/06 23:28:52 4jhZlQJu0
index作成開始2時間半後で45%
まだまだ先は長いな。

64:cen ◆Am9xOgNMYE
08/05/07 00:23:43 ses9irbr0
使って頂いてありがとうです。

>>58
検索結果の部分はIEコンポーネントなので、そこから開くものはIEになります。
結果を保存したときのHTMLは任意のブラウザで見れます。

>>59
それもいいかもしれないですね。

>>62
本文でしかインデックスは考えてませんでした。
そういえば、本文以外で名前とかメール欄とかは、スレでほとんど
一緒で、それで何かできそうな気もします。

65:名無しさん@お腹いっぱい。
08/05/07 02:01:18 /tgmzZhu0
5万1千程のdatで4時間半かかった。

66:名無しさん@お腹いっぱい。
08/05/07 23:27:54 RBk6c+cP0
初回indexを作ってからちゃんブラでログ取得して又indexを作らせて
みたら、初回と同じ位に時間が掛かっちゃいますね。

indexを作るってのはどのindex型でも、対象の追加があったらindexは
ゼロから作り直しになっちゃうのでしょうか?

67:cen ◆Am9xOgNMYE
08/05/07 23:37:48 ses9irbr0
>>66
他の方法はそこまで詳しく知らないのです。
今のバージョンは、indexの作成と読み込みが出来ることを目指してたので、
更新まで力が及びませんでした。
なので、更新=作成になります。
次は更新も考えて見ます。

68:名無しさん@お腹いっぱい。
08/05/07 23:48:26 kAifuv6Y0
乙です
確かにそれはちょっと欲しい、ぜひご一考を
そうすれば常に専ブラのフォルダダイレクト読める。。。

もっとわがまま書かせて頂くと複数フォルダパス設定をiniに書く形でも良いので欲しいです
一つのthreadseaerchから退避フォルダと現行専ブラフォルダを読めると最高です

69:66
08/05/08 00:23:43 eGa6VFwL0
>67
今でもハングアップしてんじゃないか?ほんとに検索してんのかよ?
って他の検索と比べたらとってもありがたいです。(-人-)

70:58
08/05/08 13:38:01 CHC9JFTU0
>>64
成る程、IE のメニューが出てるんですものね...
IE 側に別のブラウザでリンクを開くコンテクストメニューを追加する事で
>>XX を IE 以外で見れるようになりました。

71:名無しさん@お腹いっぱい。
08/05/08 21:44:59 oX3p46BtO
>>68
設定読み込みで、iniファイルを選べるからそれでしてみたら?

72:cen ◆Am9xOgNMYE
08/05/08 23:26:19 fy9YvlJe0
どうもありがとうです

>>68
iniは任意の名前で保存できて、読み込めますが、そうではなくて、
一度の検索で2つのフォルダを設定したいということですか。

>>70
そういう方法もあるとは

73:cen ◆Am9xOgNMYE
08/05/08 23:32:00 fy9YvlJe0
あと、窓の杜で記事が掲載されました。
URLリンク(www.forest.impress.co.jp)

74:名無しさん@お腹いっぱい。
08/05/09 00:14:47 54C7YKST0
>>71
>>72
ありがとうございます、任意ini読み込みさえ気付いてなかった。。。
とりあえず、それで分けます

>一度の検索で2つのフォルダを設定
です、退避フォルダと現行専ブラのフォルダと記憶が曖昧だったりするときに
使いたいなと思いました、bbs2chreaderはgrepをかけるくらいしか全文検索が無いですんで。。。

>>73
窓の杜も細かく拾いますねw

75:名無しさん@お腹いっぱい。
08/05/09 23:17:30 9tPKF/2D0
俺も3つの2chブラウザ使ってるから、順番に検索してくれたら助かるな

76:名無しさん@お腹いっぱい。
08/05/09 23:39:32 9tPKF/2D0
ああ、よく考えたらログフォルダ作って全部その下に移動させればいいのか

77:名無しさん@お腹いっぱい。
08/05/11 01:14:04 rI+U6KpG0
.NETじゃなくVCじゃ無理なの?
起動時、糞重くてしょうがないんだが

78:名無しさん@お腹いっぱい。
08/05/11 02:16:35 PFNSvUPe0
VCは.NETに比べて手間が10倍くらいに増えるからな。

起動速度だけのためにそんな手間はかけてられないって感じじゃね?

79:名無しさん@お腹いっぱい。
08/05/11 18:51:41 gQon1txW0
8.4ギガ程のログで3ギガ程のindexが出来ますた。

80:名無しさん@お腹いっぱい。
08/05/11 19:14:25 Znmvmy7U0
DesktopHE
URLリンク(freemind.s57.xrea.com)
↑datはサポート外で、datファイルの表示は固まるかと思うほど遅いすが
探してくるのは速いしインデックスの作り方とか参考にならないでしょうか

81:cen ◆Am9xOgNMYE
08/05/18 23:15:54 +yfWcw6T0
>>74>>75
ログフォルダが複数あるときですか。
それは思いつきませんでした。

>>77
大体>>78さんの通り、重いですが作るのが割と楽なので.NETを使っています。

>>80
そういうのもあるんですか。
ちょっと見てみます。

82:名無しさん@お腹いっぱい。
08/05/23 20:17:03 UH4K7XDzO
age

83:名無しさん@お腹いっぱい。
08/06/01 14:35:57 iGifQDnZ0
+   +   ワクワクテカテカ
  ∧_∧  +
 (0゜・∀・)
 (0゜∪ ∪ +   index追加型、急かしてないよ?        
 と__)__) +

84:名無しさん@お腹いっぱい。
08/06/01 23:46:08 63eV6hEF0
急がせてるwwwwwwwwwwww

85:名無しさん@お腹いっぱい。
08/06/02 22:00:16 xloWUVFk0
+   +   ワクワクテカテカ
  ∧_∧  +
 (0゜・∀・)
 (0゜∪ ∪ +   急かしてないよ、ホントだよ?        
 と__)__) +

86:名無しさん@お腹いっぱい。
08/06/03 14:01:04 5GdvKxzv0
Janeログをインデックス化して高速検索する「dat検索」 :教えて君.net
URLリンク(www.oshiete-kun.net)
Datファイル全文検索ソフト DatE
URLリンク(frozenlib.net)

こっちが2.0ならむこうは3.5か…
誰かユーザーの事考えたC++製の全文検索ソフト作れよ


87:名無しさん@お腹いっぱい。
08/06/03 14:31:24 i98vc4zJ0
Jane系に限定するならJaneViewでも使ってりゃいいじゃない
インデックスサーチなら他の100倍は早い

88:名無しさん@お腹いっぱい。
08/06/03 20:13:08 NItC+Ua+0
ずっとJane使ってたら、メモリ使用量が300Mになった…
V2Cくらいメモリ使用量決められたらいいんだけどなぁ

89:名無しさん@お腹いっぱい。
08/06/07 15:31:32 6OP9T2Vu0
週末きたけどそろそろバージョンくる?

90:名無しさん@お腹いっぱい。
08/06/13 22:02:47 +0Vv0YEo0
週末くるけどそろそろバージョンくる?

91:名無しさん@お腹いっぱい。
08/06/13 22:13:22 C4TWwqL/0
「バージョンくる」の意味が分からなかったのでグッてみた

ver・sion

━ n. 翻訳, 訳書; (時にV-) (聖書の)…訳[版]; 解釈; 異説; (個人的な観点からの)説明; 翻案, 編曲.


92:名無しさん@お腹いっぱい。
08/06/17 00:56:18 Xfg2HjBN0
たぶん「そろそろバージョン」っていう新しいバージョンが来るんじゃマイカ?

93:名無しさん@お腹いっぱい。
08/06/21 00:53:55 yQj9zf0a0
>86
バージョンこないから試してみようとしたけど起動しないや・・・

94:名無しさん@お腹いっぱい。
08/06/22 14:26:00 pB/qsvyu0
俺は白鴎院理人(はくおういんりひと)。 御茶ノ水に事務所を構える私立探偵だ。
俺は帝都を騒がす怪人物、蜘蛛男を追っている。 奴が目撃され始めたのは数週間前のこと。
はじめは酔客の間で交わされる噂話に過ぎなかった。 夜の帝都を飛び回る不気味な怪人物がいる。
路地裏で人を喰らっているところを見た。 こうした噂話は、帝都では珍しいものではない。
近代化を成し遂げ、震災から復興しても尚、 人々は夜の闇に怯え、怪しげな噂を作り出す。
だが、蜘蛛男の噂は一時に止まらず増え続けた。 それが低級雑誌で取り上げられるようになり、
最近では大新聞までもが蜘蛛男の記事を載せている。 こうなると警察も黙ってはいない。
多くの人員を割いて捜査に当たっているらしい。 しかし、今のところ蜘蛛男の逮捕には至っていない。
それどころか奴が何者で何の目的があるのかさえも、 未だ判明していないのだ。
奴が何者であったとしても、 帝都を騒がす怪人物を放っておくことはできまい。
そこで私立探偵である俺もまた、蜘蛛男を追っていた。 この俺が蜘蛛男を捕えてみせる。
\_____ _________________________________/
         ∨
           ___                _
       / ____ヽ           /  ̄   ̄ \
       |  | /, -、, -、l           /、          ヽ きみ頭だいじょうぶ?
       | _| -|○ | ○||         |・ |―-、       |
   , ―-、 (6  _ー っ-´、}         q -´ 二 ヽ      |
   | -⊂) \ ヽ_  ̄ ̄ノノ          ノ_ ー  |     |
    | ̄ ̄|/ (_ ∪ ̄ / 、 \        \. ̄`  |      /
    ヽ  ` ,.|     ̄  |  |         O===== |
      `- ´ |       | _|        /          |

【 南極堂...断罪アイアンメイデン 】  URLリンク(www42.atwiki.jp)

95:cen ◆Am9xOgNMYE
08/06/24 19:11:24 E9lO0sbvO
どうもです。

ちょっと忙しくてできていないですが、
今はインデックスの方式を考え直しているところです。

96:名無しさん@お腹いっぱい。
08/06/25 00:16:50 EIbNz7bk0
待ってます

97:名無しさん@お腹いっぱい。
08/06/25 00:18:37 YlNT0tor0
待っています。

98:名無しさん@お腹いっぱい。
08/07/06 13:26:22 eE09r6G00
みみずん検索とかは一瞬に近い状態で検索結果が出るけど
これは意外と時間かかるよね?

これってハードウェア性能の違い?それともindexの方式違い?
どっちが原因として大きいんだろ。

indexをRAMディスクに置いて、DATをRAID0・5・6に置いても
とても一瞬じゃ表示出来なそうだけど。


あ、従来の検索と比べたら遥かに恩の字ですから
ケチ付けてるんじゃなく素朴な疑問です。

99:名無しさん@お腹いっぱい。
08/07/06 19:54:39 y2E+4QJQ0
>>98
何言ってる

100:cen ◆Am9xOgNMYE
08/07/06 23:14:28 q9kMgqrU0
>>98
どうもです。

このソフトでは保存してる全てのログから、検索語を漏らすこと無く
検索するので他のものより遅いのではと思います。
ソフトの性能かもしれないです。
みみずん検索の仕組みがどういうものか知りませんが・・・

101:名無しさん@お腹いっぱい。
08/07/07 00:57:51 5BhNo3f50
>100
あ、そっか。
みみずん検索は検索板を指定しましたね。
長期使ってないから全板検索だと勘違いしてました orz

102:名無しさん@お腹いっぱい。
08/07/08 18:45:38 7pqwNnqn0
>>98
一般的なWebサーチエンジンは単語単位の検索結果をあらかじめ作ってる。
新しく見つけたページに「2ch」「モナー」という単語があったときは、2ch.txtとモナー.txtにそのページのアドレスを追加する。
「2ch モナー」で検索されたときは2ch.txtとモナー.txt両方に載っているアドレス一覧を表示するといった感じ。
ただし、ここでいう「単語」とはあらかじめリスト化されたものと機械的に認識されたものなので
でたらめな文字列で検索した場合は表示されない可能性もある。

103:名無しさん@お腹いっぱい。
08/07/09 00:47:48 cknHTRJD0
>102
なるほど。
そうしちゃうと今より高速化はしてもindexが肥大しそうですね。

今は8.5Gのログに対しindexが3.2Gです。

104:名無しさん@お腹いっぱい。
08/07/13 21:04:23 TYBbxl0u0
>>103
日本語対応の全文検索インデックスはでかいよー。
特に完全検索用のN-Gramインデックスは、たとえば「本日は晴天なり」って書いてあるテキストが
あったとすると
 本日
 日は
 は晴
 晴天
 天な
 なり
というそれぞれの文字列についてインデックスを作成する。
検索時には、たとえば「本日は」で検索されたら「本日」「日は」の両方にのっているファイルを
検索結果に表示する、という方式。
確実なんだけどでかい。

105:名無しさん@お腹いっぱい。
08/07/15 15:00:25 aKLBDNVH0
みみずん氏でこんなもんか。
URLリンク(mimizun.com)

106:名無しさん@お腹いっぱい。
08/07/20 02:22:48 AbTJvetU0
「Windows Vista の検索において、語句が検索されない場合がある」
URLリンク(support.microsoft.com)

「アクセスコントロールリスト」 があるのに "コントロール"を検索できません。
これは仕様です。日本人はfindとかfindstrを使いなされ。
 

107:名無しさん@お腹いっぱい。
08/07/21 01:11:23 ZxbJSK1r0
テキストのフィルタが駄目すぎだなあ
IMEの件といい、ほんとMSは日本語に弱くなったな

108:名無しさん@お腹いっぱい。
08/07/29 11:45:39 LDh0pw/C0
そんなんだからMS社員がATOK使いたいとか言い出すんだ。

109:名無しさん@お腹いっぱい。
08/07/29 18:21:33 DRzfVr9G0
中国優先だからな

110:名無しさん@お腹いっぱい。
08/07/29 19:00:16 CDdAnnOZ0
優先というか、メイドインチャイナ

111:cen ◆Am9xOgNMYE
08/07/31 01:33:49 Au4b/2RR0
こんばんは

>>104
このソフトのインデックス方法もそういう方法使ってますね。


112:名無しさん@お腹いっぱい。
08/08/02 23:36:16 fGnZ88+/0
屑HDにログ移行したんだけど、残り容量少なくてINDEX作りきれなかった orz

113:cen ◆Am9xOgNMYE
08/08/03 23:09:35 kqhImIQB0
今のところ、新しいindexの形式で、index作成と読み込みのテストが
できています。
更新部分を作る前に公開するかもしれません。
何時になるかは不明ですが。

>>112
実験では現在と比べて約40%のindex容量が削減できています。
今よりも多少はディスク容量を使わなくて済む予定です。

114:名無しさん@お腹いっぱい。
08/08/03 23:16:21 BhOIA6SJ0
>>113
乙です
四割もすか、わくわくしながら待っています。

115:名無しさん@お腹いっぱい。
08/08/05 00:44:24 WlBy3GoL0
  ∧_∧ URLリンク(www.geocities.jp)
 ( ・∀・) ドキドキ
 ( ∪ ∪
 と__)__)

116:名無しさん@お腹いっぱい。
08/08/05 07:05:18 YBb9bfzK0
禁断の壷のDATが検索できないようですが未対応ですか?

117:名無しさん@お腹いっぱい。
08/08/05 19:08:19 tQ0LETlx0
    ∧_∧
    ( ・∀・)ワクワク
  oノ∧つ⊂)
  ( ( ・∀・)ドキドキ
  ∪( ∪ ∪
    と__)__)

118:名無しさん@お腹いっぱい。
08/08/08 17:59:32 /1wQ4+P70
    ∧_∧
    ( ・∀・) ドキドキ
  oノ∧つ⊂)
  ( ( ・∀・) ワクワク
  oノ∧つ⊂)
  ( ( ・∀・)
  ∪( ∪ ∪
    と__)__)

119:名無しさん@お腹いっぱい。
08/08/09 06:06:28 oXes19LT0
                        ,、ァ
                        ,、 '";ィ'
________              /::::::/l:l
─- 、::::;;;;;;;;;`゙゙''‐ 、    __,,,,......,,,,_/:::::::::/: !|
  . : : : : : : `゙'ヽ、:::゙ヾ´::::::::::::::::::::::`゙゙゙'''‐'、. l|
、、 . : : : : : : : : r'":::::::::::::::::::::::::,r':ぃ::::ヽ::::::::ヽ!
.ヽ:゙ヽ; : : : : : :ノ::::::::::::::::::::-=・=-、゙:::   -=・=-:'、
. \::゙、: : : :./::::::::::::::;、-''"::::::::::   ,...,:::,::., :::':、
   ヽ:ヽ、 /:::::::::::::::::::::::::     _  `゙''‐''"  __,,',,,,___
     `ヽ、:::::::::;;;、、--‐‐'''''',,iニ-    _|  、-l、,},,   ̄""'''¬-
   _,,,、-‐l'''"´:::::::'  ,、-'" ,.X,_,,、-v'"''゙''yr-ヽ / ゙゙'ヽ、, ゴリゴリゴリ・・・
,、-''"    .l:::::::::::;、-''"  ,.-'  ゙、"|    /  冫、     ヽ、
       l;、-'゙:   ,/      `| /| |   /. \
     ,、‐゙ ヽ:::::..,.r'゙       (( // | |  /    ヽ.  マズッ・・・
   ,、‐'゙     ン;"::::::.        U  .U  / >>118
  '     //:::::::::            {.
        / ./:::::::::::::            ',
.    /  /:::::::::::::::::.            ',.


120:cen ◆Am9xOgNMYE
08/08/10 02:40:10 iURE0WpC0
>>116
どうもです。
検索できるのは、2chのサーバにあるそのままのdatファイル
のみになっています。
こんな感じのファイルです。
URLリンク(pc11.2ch.net)

121:名無しさん@お腹いっぱい。
08/08/10 02:51:18 3MKwS0Q50
壺のdatは少しだけ違うよな。生datではない

122:名無しさん@お腹いっぱい。
08/08/10 05:29:10 WVmYSL3q0
>>120
そうですか・・・
壷はファイルの先端に今取得した時間と前取得した時間とレス数追記して
生DATとは違うファイルになってるから対応するのは面倒そうですね・・・

123:名無しさん@お腹いっぱい。
08/08/10 05:36:29 WVmYSL3q0
壷のDAT見た限り0x88(136バイト)目まで壷DAT用のヘッダー?に上のレスで書いたやつを追記してるみたいですね。

124:名無しさん@お腹いっぱい。
08/08/10 05:56:58 WVmYSL3q0
今手元の壷用DATの先端0x88(136バイト)を削ってDATでThreadSearchを使用して検索できた事を報告しておきます。
使用する時はこれでいきます。
素晴らしいソフトありがとうございます。

125:名無しさん@お腹いっぱい。
08/08/10 22:06:13 yPWwed/n0
へぇ
Jane系だとメタ情報はidxファイルに分けるけどね

>>120
1行目の読み出し時に自動認識できそうな気がしますがいかがでしょうか?

126:cen ◆Am9xOgNMYE
08/08/11 18:37:08 cL7eaFC40
できそうな気もしますが、壷を入れてdatをいろいろ見てみないと
いけないので、ちょっとめんどうかも。
それに今作ってるのやつがあらかた出来上がっているので。

127:名無しさん@お腹いっぱい。
08/08/13 02:41:42 ZgCCI6gx0
乙です
>あらかた出来上がっているので
わくわく

128:cen ◆Am9xOgNMYE
08/08/13 19:08:16 dHKGFOYl0
スレッド全文検索を更新しました。
Ver 1.60になりました。
URLリンク(www.geocities.jp)

更新点は以下です。
 インデックスを改良して高速に作成、検索できるようにしました。
 ウインドウサイズを記憶するようにしました。
 検索結果の下ペインに上ペインのリンクを追加しました。

インデックス化の方法を変えたので、今までのものより
約2~3倍 高速に検索できます。
場合によりそうでない時もありますが。
あと、インデックス作成時間も短くなりました。

詳しくはこちらを
URLリンク(www.geocities.jp)

129:名無しさん@お腹いっぱい。
08/08/13 21:16:58 tyXgUR9P0
キタ━━ヽ(゚∀゚)ノ━( ゚∀)ノ━(  ゚)ノ━ヽ(  )ノ━ヽ(゚  )━ヽ(∀゚ )ノ━ヽ(゚∀゚)ノ━━!!
        へ )   (  ノ  (  )ノ   (  )   へ  )   へ )    へ  )
          >    >    <      <       <      >      >

130:名無しさん@お腹いっぱい。
08/08/13 21:25:48 tyXgUR9P0
えーすまん。
>詳しくは
と、readme.txtを見たけど、INDEXの追加作成は可能になったの?

131:cen ◆Am9xOgNMYE
08/08/13 22:55:06 dHKGFOYl0
>>130
すみません。
書いてなかったです。
今回のバージョンでは追加(更新)の機能は付いていないです。
次回で付ける予定です。

132:名無しさん@お腹いっぱい。
08/08/13 22:56:38 tyXgUR9P0
>131
ありゃ残念。
でも次回更新を楽しみに待ちながらVer1.6使わせていただきます。

133:名無しさん@お腹いっぱい。
08/08/17 17:23:51 6fFreaBo0
age

134:名無しさん@お腹いっぱい。
08/08/28 20:58:59 jxwyolAJO
sage

135:名無しさん@お腹いっぱい。
08/09/01 16:11:16 fWSvEAsU0
アイコンぐらい作って

136:cen ◆Am9xOgNMYE
08/09/02 00:34:17 acTGZjvR0
>>135
そういえば、誤反応スクリプト無効化ソフトはアイコン作ってましたが、
これは作って無かったですね。

とりあえず、ぼちぼち更新部分作ってます。
ちょっとトップの説明変えてみた。
URLリンク(www.geocities.jp)


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch