07/08/04 00:46:36
>>518
MeCabとMySQLなんかを組み合わせると、ちょっと現実的ではないかと思われます。
速度的な面で・・・。
どのタイミングで形態素解析をかけるのかわかりませんが、もしクエリの段階ならば
MeCabも所詮内部では、辞書引きアルゴリズムとして、DoubleArray(Dartsライブラリ使用)とビタビアルゴリズムを使ってるだけなので
検索処理とかなり処理的には被ってるところが多く、無駄です。
前処理という意味でならば、まだ使えますが、登録時に過大な処理コストがかかり、なおかつメモリがシビアになるOpenNapでは
形態素解析の処理をもう少し上手く全文検索の処理に溶け込ませて、無駄を省いた方が良いかと
そもそも、OpenNapに関しては、形態素解析かけて、単語レベルの完全マッチにしなくても
全文検索による部分一致の方がよくないですか?
文と違って、そんなに長いファイル名やクエリが来るとは思えないので…。