オープンソースの全文検索ソフトat LINUX
オープンソースの全文検索ソフト - 暇つぶし2ch198:login:Penguin
08/01/08 00:46:08 XSbSibRZ.net
gonzuiみたいなのでVB6検索できるエンジンありませんかね?

VB6病発病したソースコードを手術しないといけないので
頼みます。

199:login:Penguin
08/04/09 00:25:01 X4T3aWgW.net
こんなん出てた。
全文検索エンジンLux
URLリンク(luxse.sourceforge.net)

ToDo のところに
# 削除・更新
# 全角半角かなの同一視
とか書いてあるあたり見ると、まだ全然未完成みたいだけど。

200:login:Penguin
08/04/09 13:25:32 P7VWxNnr.net
apacheのluceneがeclipseのヘルプ?で使われていたことを知った。


201:login:Penguin
08/09/08 17:32:23 NVWE6wto.net
InfoCrawlerとOmniFindってどう?


今研究室の文書管理システムを作らなきゃいけないんだが,ユーザビリティを損なわず文書管理したい.
ファイルドラッグできるフリーなシステムは見つからない.
⇒Sambaフォルダに適当にぶち込んで後から見るときは検索でおk

と言う風に今は考えてるんだが、間違ってないよな?
doc,pdf,ppt辺りを読み込んでくれる素敵なエンジンはない物か…

202:login:Penguin
08/11/20 11:23:32 rg5Oz6Z5.net
保守

203:login:Penguin
08/11/29 10:11:46 lHYI9aEV.net
URLリンク(www.jieks.com)

204:login:Penguin
09/12/23 12:09:55 2EkpDgwW.net
ど素人の質問で申し訳ないんですが、
ひらがな/カタカナのどちらでも検索可能にしたい場合、
「検索時に、両方のキーワードで検索する」案と、
「インデックス自体を、両方作っておく」案の、どちらが検索時間が短くすむのでしょうか?
(検証しろと言われれば、それまでなんですが)

私の事情的には、「大差はない」というのが理想ですが、
どうなんでしょうか?

ちなみに、使ってるのはLucene(2.3.2かな)で、すでに運用開始している状態です。


205:login:Penguin
09/12/23 12:50:29 hw50+bfV.net
常にひらがな/カタカナのどちらでも検索していいなら、
インデックス作るときに、どっちかにまとめてしまうな。
あとは、検索時に指定されたのを同じルールで処理してから検索。

データが小さくなるし、analyzerでこの処理をさせれば、
本文はそのままだから、取り出し可能にもできるし。

206:login:Penguin
09/12/23 13:01:14 hw50+bfV.net
あと、データ量と同時検索数次第な気がするけど、
両方のキーワードで検索した方が速いと思うよ。
インデックスを小さくしておいた方が速いと思う。

ひらがな/カタカナ混じりだったらどうするとか考えると、
統一しちゃう方が簡単だと思うんだよなー。

検索用フィールドをいくつか作るのはありかもね。
平仮名片仮名を無視する検索用はどちらかに統一して、
そうじゃない方はそのまま入れておく。

207:login:Penguin
09/12/24 14:55:08 pQ+PzKun.net
>>206
レスありがとうございます。

やはり「INDEXも検索も統一」というのが良さそうですね。

ただ、すでに運用してるシステムでして、
根本から作り直すことになると、コストやリソースの関係で、
お客様の希望する時期に出せそうになかったもので、
質問のような小手先の対応を考えていました。



208:login:Penguin
11/10/26 09:08:10.23 u1Edo4nm.net
dpkgとzeitgeistがXapianっていう全文検索ソフトを使っているけれどあれは何?
対応言語に日本語は入っていないみたい

209:login:Penguin
11/12/11 16:26:21.87 jX1ksO4u.net
「俺の全文検索」のソースをアップロードした。

URLリンク(www.ne.jp)

うまく全文検索できないときには掲示板に書きこんでくれ。

210:login:Penguin
11/12/11 16:52:48.77 SGJMDI+x.net
postgresql 使ってるのか。
Hyper Estraier でいいと思うけどなあ。ずっと楽だし

211:login:Penguin
12/08/12 05:00:25.96 9d6phxtS.net
>>209
NOT FOUNDだよ

半年も前かぁ・・・(´・ω・`)

212:login:Penguin
12/12/14 05:08:44.92 /WE9Cz8v.net
Fessというソフトなんですけど、
検索されたファイルの名前に、スペースが含まれている場合に、
一覧から開くことができません。
対策ってありますでしょうか。

213:login:Penguin
12/12/14 11:36:00.22 ZBNKtAHu.net
>>212
FessのMLがあるからそっちで聞けば?

214:login:Penguin
13/01/12 01:36:56.87 17wiELXf.net
聞こう聞こうと思っているうちに、
どなたかがメーリングリストで質問してくださっていました。
今、その回答町です。

215:login:Penguin
13/01/27 16:23:24.30 Y1uylGbU.net
全裸変換ソフトって読んでしまった。
寝てくるノシ

216:login:Penguin
13/02/09 12:29:36.38 0CxhohCh.net
専用サーバソフトいらずで
単純なインタプリタcgiのみで動くやつないかね?
まあ要するにフリーのレンサバで動かしたい

217:login:Penguin
13/02/09 12:38:10.29 ihRM0VR4.net
>>216
namazu

218:login:Penguin
14/02/18 01:12:04.63 TuEYQrKl.net
全文検索サーバ: Fess 9.0.0 リリース

URLリンク(sourceforge.jp)

本当に、新機能の搭載待っていました。
ありがとう。ありがとう。

勝手に記念して、専用スレッドを作りました。

スレリンク(linux板)


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch