Namazu全文検索システムat PHP
Namazu全文検索システム - 暇つぶし2ch285:nobodyさん
05/03/17 23:30:42
>>279
亀レスだけど、
Namazuでは 「/cgi-bin/namazu.cgi?idxname=aaa」 みたいな直接指定はNGだったはず。
きちんとhiddenとかから送らないと。

286:nobodyさん
05/03/22 21:53:42
>>285
それってどこでNGにしてるんでしょ。Namazu本体じゃなくて
pnamazuとかインターフェースのところでやってるんですよね。

287:279
05/03/30 18:10:10
>>284-286 ありがとうございます。
検証が遅くなり申し訳ありませんでした。
サーバIPアドレス/cgi-bin/namazu.cgi?idxname=インデックス名&query=キーワード
で検索したらうまくできました。htmlにhiddenで指定した場合もOKでした。
ご教授ありがとうございました。
しかし検索結果はOKなのですが、aaaインデックスを検索しても結果はOKなのですが
ヘッダーの部分がallのもので表示されてしまいます。
(現在602 の文書がインデックス化され5,499 個のキーワード)
検索結果ページから再検索するとあるはずのページでも検索できません。
(allインデックス及びaaaインデックス両方とも。インデックスネームがうまく指定されない為?)
namazurcのTemplate部分をコメントアウトするとインストール時?の古いインデックスが
表示されてしまいます。
複数インデックスがある時のTemplate指定はどのように行っているのでしょうか?

288:nobodyさん
05/03/31 00:35:45
>>287
Templateが選択される順序は説明書にあるとおり
URLリンク(www.namazu.org)
再検索をする際にWebブラウザで表示ページのソースを調べて
どのNMZ.headが読み込まれているか確かめてはどうですか。

289:nobodyさん
05/11/11 14:19:22 lZiu1JMN
会社で鯰使うらしいので、オフィとか見てみました。
日本語全文検索ってほぼGoogleでカバーできてるのでは?
Winではあまり普及していないらしいし、導入に面倒がありそうだし
今、敢えてNamazuで検索を作るうまみってなんですか?

290:nobodyさん
05/11/11 20:34:38
んーどうだろう

291:nobodyさん
05/11/12 23:40:29
Googleはイントラネット内も検索できるようになってんですかそうですか

292:nobodyさん
05/11/13 06:11:00
>>289
イントラの情報を検索できること
検索結果画面をカスタマイズできること
カテゴリ検索ができること
文書の最終更新日をファイルスタンプから識別できること

293:nobodyさん
05/11/13 08:31:58
今使うならnamazuじゃなくHyper Estraierにするな. 俺なら.

294:nobodyさん
05/11/13 15:52:29
>>293
そのソフト最近人気らしいけど、Namazuに比べてどの辺が優れてるの

295:nobodyさん
05/11/14 10:06:19
>>291-292
なるほど、イントラ内検索がGoogleにはないうまみっぽいですね。
だんだん鯰の位置づけがおぼろげながらわかってきました。
どうもありがとうございます。

296:nobodyさん
05/11/14 12:47:16
Namazuだったら正規表現も使えるんじゃない?
あれは便利だお。

297:nobodyさん
05/11/14 16:16:53
正規表現はすばらしい

298:nobodyさん
05/11/16 14:03:06
(i)←こういうやつ?<性器表現

299:nobodyさん
05/11/17 13:26:17
   〃∩ ∧_∧
   ⊂⌒(  ・ω・)  はいはいわろすわろす
     `ヽ_っ⌒/⌒c
        ⌒ ⌒

300:nobodyさん
05/11/18 11:32:18 ngwfG4IK
namazuのなんかのバージョンで、検索指定した文が
ハイライトされて、(そのページの上のほうからのテキストだけでなく)
検索された部分が表示されるというやるがあるらしいよ

と先輩に言われたのですが、どこにありますか?
あるいはカスタマイズで処理するもんなのですか?
教えてください。

301:nobodyさん
05/11/19 03:18:32
>>300
EmphasisTags じゃなくて?

302:nobodyさん
05/11/21 10:11:48 T4fDN5+G
>>301
ありがとうございます、調べてみます。(`・ω・´)ゝ

303:nobodyさん
05/11/21 10:27:34 T4fDN5+G
やってみましたが、どうも指示されたものと違うようです。

たとえば文中にキーワードがヒットしても、プレビューで表示されるのは
そのページの文頭から指定文字数分ですよね?
それを、キーワードの該当部分前後をプレビューに表示させたい
という話でした。

304:nobodyさん
05/11/25 10:08:55
>>303です。
指示者がEstraierと混同していた可能性大です。
自己解決しました。どうもありがとうございました。

305:nobodyさん
05/12/14 20:47:34 CwjBoKRv
Namazu はPerlだけでしょうか?
できればPHPでサイト内検索ができるスクリプトをご存知でしたら教えてください。


306:nobodyさん
05/12/15 02:53:07
>>305
ネタっすか
っ[google]

307:nobodyさん
05/12/15 05:07:22
>>305
Namazu自体はPerlじゃないし。

308:nobodyさん
05/12/16 05:48:32 +W2Wi6VX
な、なんだとーこのこのー

309:nobodyさん
05/12/16 11:56:00
Namazuと言えばみみずんの2ちゃんねる過去ログ全文検索システムだな。
って思ったら>>30に書いてあった・・・

310:nobodyさん
06/01/16 09:59:58 rhuM8+qJ
現在phpから動的にページを生成して出力しているのですが、
このPHPから出来上がるページをnamazuで検索したいと思っています。
どのような手法がありますでしょうか?

311:nobodyさん
06/01/16 11:43:50
その動的に出力してるやつを静的なHTMLとして書き出す。

312:nobodyさん
06/01/16 13:00:54 rhuM8+qJ
動的なページを静的HTMLとして書き出してインデックス化するような処理をnamazuの方で出来ますか?
それとも、やはりこちら側であらかじめ静的ページを作っておいて、それをインデックス化するしかないでしょうか?
なんとかコマンド一発で出来ませんかね?

313:nobodyさん
06/01/16 17:28:20
wget -> namazu
っていうシェルスクリプト書けば一発でしょ。


314:nobodyさん
06/01/16 20:36:24
Namazuはファイルのインデキシングを行うのみ。
動的なページをインデックスするには
スレリンク(unix板:116番)

315:312
06/01/16 20:44:28
>>311さん
>>313さん
>>314さん

親切にありがとうございます。
よくわかりました。とりあえずwgetの方法を試してみようと思います。

316:nobodyさん
06/01/16 22:22:45
wget!

317:nobodyさん
06/01/30 18:45:25
キタ━━(゚∀゚)━━!!!!

318:nobodyさん
06/01/30 21:42:38
2006-01-29: Namazu 2.0.15 を公開

ISO-8859-* に関する文書の間違いを訂正
RedHat ソフトウェア namazu.spec の不必要なパッチは削除
File::MMagic 1.25 を同梱
MeCab の正式対応
mknmz に -b 及び --use-mecab オプションを追加
mknmz および namazu に --norc オプションを追加
mknmz に --decode-base64 オプションを追加
新しいフィルタ(Gnumeric, Koffice, Mainman/Pipermail, Zip, Visio)を追加
mknmzrc に MECAB, DENY_DDN を追加
ファイル名がDDN である時にスキップ。
日付フィールドによるソート機能の追加
nmzcat, nmzegrep コマンドの追加
フィルタの Windows 対応
(msword.pl, excel.pl, powerpoint.pl, postscript.pl, 等...)
OLE コントロールフィルタ更新
QUERY_STRING の区切りに';' 使用可能
Perl版テストプログラム(pltests) を追加
各種バグフィックス

319:nobodyさん
06/01/31 08:21:04
1年9カ月ぶりなのね

320:nobodyさん
06/04/02 12:56:16 6BlopTUr
URLリンク(www.namazu.org)
は、MacのSafariで見れないのは、なんか理由があるのかな?

321:nobodyさん
06/04/02 13:02:03
>>320
URLリンク(www.namazu.org) ならOK
Content-Locationヘッダをうまく扱えてないみたい。
他所ではちゃんとリダイレクトされるんだけど、namazu.orgではNG。なんでだろう?

322:nobodyさん
06/04/07 19:28:41
Namazuをローカルサーバーに組み込みたいのですが
何のファイルをサーバーに送れば良いのか教えてください。

323:nobodyさん
06/05/16 22:05:32 A+ClptH/
>>322
URLリンク(www.namazu.org)


324:nobodyさん
06/07/04 21:14:27 t84Vuxwj
>305
PHPでnamazu検索???

こんなの??
URLリンク(www.c-boxs.net)

325:nobodyさん
06/09/07 22:19:16 n616cZBc
AN HTTPDとnamazuでLAN内のファイルサーバ全文検索システムを構築しました。
この勢いでローカルにある2ちゃん専ブラのdatファイルもインデックス化したいんですけど
良い文書フィルタはありませんか?

326:nobodyさん
06/09/07 22:22:28
>>325
自分で作ったほうが出来がいいぞ

327:nobodyさん
06/09/08 09:21:57
>>325
っていうか2ちゃんにどっぷりハマってるような
人間のクズは氏んだほうがいいぞ。

専ブラ+dat保存なんて、何をたくらんでいるのやら・・・おー、こわ。

328:nobodyさん
06/09/08 14:34:10
にくちゃんねる2号だろ

329:325
06/09/08 20:52:20
>>327
単なるナレッジ・マネジメント・システムの構築を目指してるだけですよ。
「おーこわ」って・・・なにを勘繰ってんですか

330:nobodyさん
06/09/29 14:11:41 MXN7wOzE
namazuがN-gram対応

331:nobodyさん
06/09/29 21:56:15
>>330
しないよ

332:(^-^) ◆MONSOON/qo
06/10/08 05:28:42 aDf/+h/t
インディックス作成時に読み込む文字種を正規表現で指定できますか?
記号は除外するとかです

333:(^-^) ◆MONSOON/qo
06/10/08 05:39:20 aDf/+h/t
自己解決しました

334:nobodyさん
06/10/10 01:41:58
>>333
スレリンク(unix板:195-197番)

マルチで「自己解決」とは笑わせてくれるな

335:nobodyさん
06/10/13 09:24:55
こいつの検索判定明らかにおかしい。
何でもそうなのだが、部分一致ができない。

ファッキントッシュは、バカの使うOS

を検索するとする

「ファッキン」で検索すると一致なし
「ファッキントッシュ バカ」 で検索しても一致せず
「ファッキントッシュはバカの使うOS」でやらないと一致しない。

まるでMSNの検索エンジンだ
あれとまったく同じ

336:nobodyさん
06/10/13 15:19:49
ファッキン!

337:nobodyさん
06/10/13 20:45:51
>>335
HyperEstraier いれろよ。こっちの方が簡単だよ。
検索漏れもないし。

338:nobodyさん
06/10/14 00:11:41
>>335
「ホントかよ」とおもったんで、試してみたけど、ヒットするよ。
プレーンテキストで「ファッキントッシュは、バカの使うOS」と書いて
最後に改行して保存。

> まるでMSNの検索エンジンだ

というが同エンジンと思われる「Windowsデスクトップサーチ」でも問題なくヒットした。
Hyper Estraierでももちろんヒット。

>>335の環境がおかしいんじゃないのか?

339:nobody
06/10/25 22:26:22 J6B8Hktu
Windows ,PHP5に対応したPHPのNamazuモジュールを使いたいのですが、
どうやってモジュールをインストールするのか良く分かりません。
よろしければ、手順を教えていただけないでしょうか?


340:nobodyさん
06/11/20 17:03:35
>>339 PHPライセンスとGPLライセンスが衝突するので
自分でモジュールをコンパイルするしかないです。

www.mail-archive.com/namazu-users-ja@namazu.org/msg00374.html

341:nobodyさん
07/02/08 12:03:48 Mb2H3yQx
保守

342:nobodyさん
07/03/22 22:02:22
Namazu用のWEBクローラはないの?
あと、インデクサや検索エンジンの分散処理ってどうやるのですか?
どっちもHyperEstraierでは標準で付属してるよね

343:nobodyさん
07/03/22 23:21:03
ない

344:nobodyさん
07/03/22 23:25:45
じゃメタ検索は?
Namazuサーバを複数稼働させといてクライアントで検索結果をマージできるシステムとか
ないの?

345:nobodyさん
07/03/23 00:11:38
検索結果をマージして使っている例もあるようだ
URLリンク(www.hpcss.is.ritsumei.ac.jp)

346:nobodyさん
07/05/11 16:16:19
windows版のnamazuでmknmzでイントラネット内の共有ディスクの
インデックスを作ると、終了できてないと思われるwordやexcelの
プロセスがガンガンできるんですけど解決方法はありますか?

347:nobodyさん
07/05/11 23:54:36
xdoc2txt.exe を使え

348:nobodyさん
07/08/22 06:00:29 XEGA28iC
インデクスの中から登録キーワードの一覧を取得したいのですが
ファイルを開くことすらままなりませぬ(Cの知識皆無・・・
PerlかRubyからアクセスする方法を探してるんだけど
説明のあるページなどご存知の方いませんか?

349:nobodyさん
07/08/22 21:34:30
>>348
www.namazu.org/doc/nmz.html.ja#w
に書いてあるとおり単なるテキストファイルに
1行に1単語で書かれているだけ


350:348
07/08/23 00:04:33
>>349
このページは見ていませんでした。(トップページからリンクされてない?)
片っ端からファイルを見ていって、
開くことができたファイルの内容をチェックしていたんですが見落としてました。
ありがとうございました!

351:nobodyさん
08/02/20 20:07:39 fLDVdokd
100MB強のPDFをインデックス化しようとするとmknmzが動作を停止する。なんでだ。
mknmzrcには200MBまでを検索対象にするよう設定してるんだが。

352:nobodyさん
08/02/21 22:15:05 7VDtsl8S
>>351
メモリじゃん?

353:nobodyさん
08/02/22 01:51:00 CRNkbfG6
メモリか。xpdfは王様プログラミングで作ってあるのか。。


354:nobodyさん
08/03/27 06:31:14

あえてNamazuを使いたいのであれば構わないけど、
良い子は「Hyper Estraier」を使いましょう。

スレリンク(unix板)l50

355:sfOdHWpuZpBZYiqez
08/06/13 21:05:42
v2EQ8I <a href="URLリンク(npiriddqxmjg.com)">npiriddqxmjg</a>, [url=URLリンク(snsxeffarbil.com) [link=URLリンク(pribjbixlijw.com) URLリンク(qczemfzbhofm.com)

356:nobodyさん
08/07/19 19:10:35 Hdkv0asv
検索結果に出てくる数字が1000の区切りでカンマが入るのは止めようがありませんか?
「1000」が「1,000」と表示されないようにしたいのです。

357:nobodyさん
09/07/30 06:41:54
当方、急に鯖管理をする事になった者なのですが、
いきなりよく分からない壁に当たりましたので教えて下さい。
namazu自体よく分かりませんので、手探りでやっています。
色んなサイトを見て見た結果、とりあえずnamazu.cgiを
見てみないと始まらないようなのでftpでダウンロードしてみました。

ところが、namazu.cgiを開いたら文字化けが酷くて読めません。
使ってみたソフトはjeditx あとは、miです。

どうしてこういうことになったのでしょうか。
namazu.cgiが読めないとインデックスの更新もできない
ようなので先に進めない、と思われるのですが、
どなたか読む方法をご教授下さい。


358:nobodyさん
09/07/31 00:09:56
>>357
首を吊るか、辞表を書け。さもなきゃ、人を雇え。


359:357
09/07/31 01:45:58
その「雇っていた人」が降りたので、倅の自分に
無茶振りで回って来ました。なのでショッピングカート
(詳細なcgi部分を除く)とサイトいじりまでくらいしか
分からないです。
namazu.cgi自体はおまけでついて来るものだということは
色んなサイトを見て雰囲気で今日分かりました。

そもそもnamazu自体は、レンタルサーバにインストール
されているべきなのか、自分のpcにインストールされているべきなのか
それも分かりません。とりあえず、コンソ-ルからftpで入って、
フィルタに使うファイルがたくさん有るディレクトリでmknmzをしても
動かなかったので、namazuのインストール自体はサーバではなくて、
本体にすると言うことでしょうか?ネットを調べても
自サーバメインのチュートリアルが多くて困っています。

とりあえずインデックスを更新するだけで良いです。
そもそもいきなり分かる訳が無いので多くは望んでいません。
人名の間違い登録は流石に放置できないので、質問した次第です。

大真面目なので、申し訳ありませんがよろしくお願い致します。



360:nobodyさん
09/08/01 00:19:11
>>359
URLリンク(www.amays.com)

361:nobodyさん
09/08/06 13:05:55
dxfフィルタを導入したかったのですが、ホームページからのリンクが切れてました。
dxf用フィルタはもう配布していないのでしょうか?

362:nobodyさん
10/08/12 12:11:44 XzX6VOe9
1年ぶりに上げてみる

363:nobodyさん
11/12/10 02:14:28.72
さらに1年四ヶ月

364:nobodyさん
11/12/14 21:07:04.55
牛NASにpnamazu入れようとしたけどよくわからん


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch