Namazu全文検索システムat PHP
Namazu全文検索システム - 暇つぶし2ch2:名無しさん@お腹いっぱい
01/06/14 15:26
いか焼きそば

3:名無しさん@お腹いっぱい。
01/06/15 01:24
namazuはカスタマイズがやりにくいのが嫌いだ。
作り直しきぼん。

4:名無しさん@お腹いっぱい。
01/07/05 09:41
URLリンク(64.124.197.202)

namazuってやっぱり負荷かかるのかな。

5:名無しさん@ディストリいっぱい
01/07/05 10:22 wD33sdDI
>>4
index作る時にはCPU使用率100%になります。
項目がいくつもあるとかなりツライです。

↓うちのNamazu
URLリンク(2ch.dyn.to)

6:名無しさん@お腹いっぱい。
01/07/05 17:05
100%?(w
すご・・・

7:でり
01/07/06 02:36
>>5 ん、それは負荷テストに参加してくれというお誘いかな (w

8:名無しさん@お腹いっぱい。
01/07/09 00:57 muVIdrhs
ここ見てユーザーディレクトリにインストしちゃっていいもんでしょうか?

URLリンク(www.amays.com)

当方レンタルサーバー 専用サーバー持つ金ありません。
C言語は使えます。負荷のかからないように、自分のマシンでindex作ればいいかな。
っていうかレンタルサーバー会社に聞かずにやっちゃって、かまわんかしら(汗

9:名無しさん@お腹いっぱい。
01/07/25 04:10 OjwNZy2I
インデックス構築中に検索かけられるとCGI TimeOut出ちゃうことが多々あります・・・

URLリンク(www1.odn.ne.jp)

10:名無しさん@お腹いっぱい。
01/07/25 18:41 smjKvwXM
nice で優先度落とせばいいじゃん。

11:名無しさん@お腹いっぱい。
01/08/01 18:06 ix6uIOfU
windowsだし。

12:ナナ萌え(゚д゚)ウマー
01/08/02 00:34
WIN2Kに入ってるインデックスサービスってどーなん?

13:名無しさん@お腹いっぱい。
01/08/04 01:50 aNwZ.JX.
>>12
穴。まさぐられると逝ってしまうぞ。

14:名無しさん@お腹いっぱい。
01/08/10 14:53 A94SLV6Y
2.0.6 release age

15:初心者
01/08/11 11:52
NAMAZUのインデックスにはたくさんファイルがありますけど、
いらないファイル(テンプレート等)も多いと思います。
結局必ず必要なファイルってどれなんですか?

16:名無しさん@お腹いっぱい。
01/08/12 00:26
>>15
んー俺もそう言えばわからん、
もともと、俺にとって、このNamazu初めの頃難しすぎた。

その前に、うなぎ食いたいんだよね。腹減ってきた・・・

17:NAMANAMA
01/08/12 01:02 TrSLsWVY
namazu2.0.5なんだけど、共有サーバにインストールしたんですよ。
でも、さすがにインデックスの作成は共有サーバでやるのも申し訳ないので、ローカルで作ってあげてます。
そういう場合って、namazu.cgi, .namazurc, Template, Index以外は全部テデリっても問題ないですかね?

それと、やっぱ、インデックスをcrontabで定期的に共有サーバで作ったら迷惑でしょうか?
マジレスお願いします。

18:むぎ茶      
01/08/12 01:08


ばれなければ問題無い。


┐(´ー`)┌


┏━━━━━┓
┃('Д')y ─┛~~ ┃
┃むぎ茶      ┃
┃mugicha@360.cc  ┃
┗━━━━━┛

19:名無しさん@お腹いっぱい。
01/08/12 01:24
>>17
負荷はかからないけど、ローカルは、めんどくせぇ(涙

20:名無しさん@お腹いっぱい。
01/08/12 17:40 KkZ3OuWw
Namazu.pm使ってperlでCGIを作りたいんですが…
Namazu.pmってあまり人気がないんですか?
参考スクリプト(書籍・サイト)がなかなか見つからなくって
何かありませんか?

21:名無しさん@お腹いっぱい。
01/08/15 21:03
>>20
ない、と思う。
まあしかし機能はシンプルなことこのうえないので、
利用にあたってそんなに難しいこともないと思うけど。

Ruby 用のモジュール rbnamazu.rb の方機能は多そうだ。

22:名無しさん@お腹いっぱい。
01/08/28 05:33 aw.N/Mco
どう?namazu使ってつくったやつ。
とりあえず2ちゃんねる全板検索可能です。

URLリンク(mimizun.mine.nu)

23:名無しさん@お腹いっぱい。
01/08/28 21:59 1JnfOa0A
お奨め本おしえte

24:名無しさん@お腹いっぱい。
01/08/29 00:17 TsF5AU7k
>>22
これ、すげぇじゃん。

25:名無しさん@お腹いっぱい。
01/08/29 02:52 1UTTw6kk
>>24
どこが?

26:名無しさん@お腹いっぱい。
01/08/30 12:01 8CpRLBMo
namazaってCGIやSSIで出力する内容も検索するんですか?

27:名無しさん@お腹いっぱい。
01/08/30 12:11 3TFNK/cI
namazaは知りませんが
Namazuで検索できるのは「ファイル」だけのようです。

28:名無しさん@お腹いっぱい。
01/08/30 23:03 YzLgVA/.
はやくpostgresqlのテーブルの中身を検索できるようになっておくれ。

29:名無しさん@お腹いっぱい。
01/09/10 22:31 2EURowzo
>>22
みずずん大丈夫?

30:名無しさん@お腹いっぱい。
01/09/10 22:32
みみずんか(藁

31:名無しさん@お腹いっぱい。
01/09/11 12:11 liJMw8bE
XMLの検索ってどうなの?

32:名無しさん@お腹いっぱい。
01/09/17 18:14
>>31
filter 書いてくれ。

33:名無しさん@お腹いっぱい。
01/09/17 18:18 dMB6uEtM
>>28
Namazuシステムの構築と活用, ソフトバンク
やっぱこれじゃない?

34:名無しさん@お腹いっぱい。
01/09/17 18:21 FURvtMLg
>>28 PostgreSQLスレッドで誰かやってなかったっけ?

35:名無しさん@お腹いっぱい。
01/09/17 23:18
>>34
よく知らないけど、pgnmz はPostgreSQLにNamazuのインデックスを
入れておいて、DBにクエリー投げて検索結果を出すという感じっぽいので、
テーブル内容検索とはちがうっぽい。
URLリンク(search.namazu.org)

36:名無しさん@お腹いっぱい。
01/09/20 17:20 TUOJrHAw
PHPファイルを検索できるようにするにはどうすれば良いんですか?
ソースがまんま出ちゃうんですけど。

37:名無しさん@お腹いっぱい。
01/09/26 22:51 9178Yr9s
>>36
PHP の出力を検索させたいのなら出力した結果をファイルにして
それにインデックスをかけるとかしないと無理。

38:36
01/09/27 00:11 IzjiFxn2
>>37
「出力した結果をファイルにする」ってのは、phpでですか?
なんかそこら辺のこと詳しく書いてあるサイトが無いんで…。
Namazuシステムの構築本に書いてないかなー

39:名無しさん@お腹いっぱい。
01/09/27 01:15
>>38
php のことよく知らないけど
php scriptname.php ってやったら出力されないかな?

ところで俺も質問なんだけど、namazu.cgi って検索後は
ファイルへのリンクを URLリンク(hostname)で出力するけど、
こいつを file://hogehoge にする方法って無い?
windows でローカルファイルの検索に使いたいんだけど WEB で
探しても見つからなかった。

40:名無しさん@お腹いっぱい。
01/09/27 17:20 IzjiFxn2
>>39
php scriptname.phpだとコマンドすら無いって言われてしまう。

指定先は.namazurcってファイルで設定できる↓参照
URLリンク(village.infoweb.ne.jp)

41:名無しさん@お腹いっぱい。
01/09/27 22:04 clsPKe1Y
コマンド版のPHPがないとダメじゃないかねえ。

>>39 はインデックス作成時に
mknmz --replace='s#^#file:///'
とかでもいけそうだけどどうよ。

42:39
01/10/01 05:28 UjeefWpE
2chNo1(と思える)過疎板にて反応があって感動。

>>40
.namazurc で
Replace URLリンク(localhost) file://
と指定してみてたんだけど、どうやら無効の模様。
この部分(URLリンク(hostname))は固定で出力してるのかな?

>>41
やってみたけどだめっぽい。
でも他にそれらしいオプションも見つからないね・・・

こういう変な事やる時は cgi 改造しか無いのか、とほほ。
pnamazu か rbnamazu に挑戦してみよう。

ところで >>40 はうまくいったかな?
アパッチのモジュール lib_php3.so (だっけ?) しか
インストールされてない時は >>41 の 言う通りコマンド
ラインで使えるようにしよう。手動で最初からやってみ
たこと無いので詳しい説明できなくてごめん。

43:40
01/10/04 19:40 4sun3RUk
返事遅れてスマソ。

>> 39
うちは
Replace /C\|/docume~1/admini~1/mydocu~1/mywebs~1/ URLリンク(ark)
みたいな感じになってる。ちなみにこの行と
Lang ja_JP.SJISと書かれた行以外は全てコメントアウト

php検索はコマンドラインで使えるように設定してみます。
というかコマンドラインで使えるようにする方法すら知らないんだけど。
どこか書いてるとこ知りません? 本でも良いんですけど。

44:アナログから光までオッケー
01/10/05 02:03 7kq.xdqk
このサイトはみなさんのインターネット環境の
スピードを計ってくれます。また、遅いと思う
人は設定を少し変えることによって無料で
スピードを早くすることができます。
お金を出す前に一度試してみては
いかがでしょうか。上がりの計測も可能です。

URLリンク(cym10262.omosiro.com)

45:22
01/10/05 02:47 UlE8Ntsc
URLリンク(www.max.hi-ho.ne.jp)

46:名無しさん@お腹いっぱい。
01/12/09 11:02 eU0f+J4K
だめだ~Out of Memory!で止まっちゃうよ~。
一応FAQに書いてあることは試したつもりなんだが・・・。
どうも特定のファイルの時にそうなってるみたい。
なんか落ちやすい文字とか、そういうのあるんかな?

47:名無しさん@お腹いっぱい。
01/12/10 22:24 UuNX8sYB
設定の問題かどうか

48:名無しさん@お腹いっぱい。
01/12/15 22:02
ulimit がらみだと思うけど > Out of Memory
もしくは本当にメモリ(+仮想メモリ)が足りないか。

49:名無しさん@お腹いっぱい。
02/01/04 06:04 HxTTmUTv
use POSIX 'strftime';
print strftime "%Y%m%d\n", localtime;
こう書くと年月日が出るじゃないですか。
この日付けに7を足す事ってできます???

50:名無しさん@お腹いっぱい。
02/01/04 06:04
>49
マルチうざい
資ね!

51:名無しさん@お腹いっぱい。
02/01/04 23:19
>>49
逝って良し。

■解説■
 マルチは下げ進行で微妙に煽りつつシカトします
 上記例のように古典的な煽りは「逝って良し」
 他にアスキーアートを使ったものなど多彩ですが、
 サーバーの不可を考慮してかあまり好まれません。
 やはりシンプルに「氏ね」など短文なものがベストです。

52:名無しさん@お腹いっぱい。
02/01/09 18:03
あげ

53:名無しさん@お腹いっぱい。
02/01/12 04:40
age

54:名無しさん@お腹いっぱい。
02/01/13 16:11
もう、、下げといてやれよ。。

55:名無しさん@お腹いっぱい。
02/01/13 19:32
>>54
再利用というか、もっかい盛り上がることが出来ないスレなんですか?(笑)

56:名無しさん@お腹いっぱい。
02/01/25 06:48 YyTiWZ/9
半年で、50位か。1000までいったら感動するな。あげ

57:名無しさん@お腹いっぱい。
02/02/18 08:00 TWCf5+1d
age

58:1001 Over 1000 Thread
02/02/18 10:21 Qb17d1xd
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。

59:名無しさん@お腹いっぱい。
02/02/19 07:42 DggBq+7H
age

60:名無しさん@お腹いっぱい。
02/02/20 22:28
関連スレ
全文検索エンジンNamazu @ Unix板
スレリンク(unix板)l50

61:nobodyさん
02/03/11 21:08 Jt12j7IU
namazuの検索、なんか使いにくいんだけど。。
変に文節で区切らずに、googleみたいに普通に検索してくれたら
それでいいのに。。

62:nobodyさん
02/03/11 23:50
>>61
うん。

63:nobodyさん
02/03/12 07:59 qMnzd5b/
>>61
これのこと?

>日本語がでたらめにわかち書きされてしまう
>{ [ 最: 1 ] [ 新: 0 ] [ 情: 0 ] [ 報: 0 ] :: 0 } のように、
>でたらめにわかち書きされることがあります。
>これは、そもそも最新情報という言葉が検索対象に含まれないことを意味します。
>検索はあきらめましょう。

それとも、インデックス作るときの分かち書きをしないでほしい、ってこと?
それって実現できるのか?

64:nobodyさん
02/03/18 17:35
googleはユーザーにあまり意識させないだけで、分けて探してるよ

65:nobodyさん
02/03/19 11:29 ulLvfL7+
googleわけてるかな?
日本語は解析していないように見えるけど…。
英語はスペースでわけるだけだから楽だね。
それにしてもgoogleはスペルミスの修正判断も出してくれたりすごい。
つーか20億ページを0.1秒で検索できるのが単純にすごいと思うのだが。
ローカルでほしい、、

66:nobodyさん
02/03/19 12:54 TPtrOTqR
>>65
googleも分かち書きしてるらしい、という実験結果がある。

検索エンジンのしくみ教えます
URLリンク(www.google.com)

なんか 403 forbidden になってるんでgoogleのキャッシュで見てね。

67:nobodyさん
02/03/19 14:31
>>66 さん、ありがとうございます。
ほんとだ。分かち書きしてる、、
うむ、googleはちゃんと各言語ごとにチューンしてるんですね。

68:nobodyさん
02/03/19 15:32 TPtrOTqR
逆に言えば、分かち書きエンジンの精度さえ向上させれば、
google並みのことはできるってことだよね
(もちろん、PageRank とかは抜きにして)。

いつも kakasi だけど、Chasen を使ってみようかなあ・・・。

69:nobodyさん
02/03/19 15:52
個人で使うような件数の多寡が知れているようなシステムだったら、純粋に全件マッチ検索の方が便利だよね。

70:nobodyさん
02/03/19 20:25
>>68
googleの肝は結果の表示順序。(pagerankもそれを支える情報の一つ)
なので、namazuに少し手を入れたぐらいではgoogle並にはならないよ。
ヒット数が少ない場合、関係ないけど。

71:nobodyさん
02/03/19 20:38
>>70
その点は激しく同意。

ただ、分かち書きの精度を上げることで、
>>61 のやりたいことは実現できるんじゃないかな、って思った。

72:nobodyさん
02/04/24 13:48
(´_ゝ`)フーン

73:ato
02/05/09 14:31 8gc3nIf4
Namazu使ったPDFの全文検索でページしていとかできますか?

74:nobodyさん
02/05/10 00:55
Namazu使ったJPGの全文検索でページしていとかできますか?

75:nobodyさん
02/05/10 02:55
>>70
いまさらだが、NamazuへのPageRankの実装は、この論文が有名。
URLリンク(www.kusastro.kyoto-u.ac.jp)

76:nobodyさん
02/05/10 07:02
>>75
まだ、このスレが生きていたとはね
興味深い文章サンクス。
改めて深入りできない、しちゃいけない分野だと再確認したよ

77:nobodyさん
02/05/10 20:41
77ゲットオォォォォ!!
 ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄       (´´
     ∧∧   )      (´⌒(´
  ⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡
        ̄ ̄  (´⌒(´⌒;;
      ズザーーーーーッ


78:nobodyさん
02/05/24 03:19
(・∀・)イイ!

79:nobodyさん
02/05/27 19:51 LrpMVRit
類似スレッド

WWW検索エンジンサイト
スレリンク(esite板)l50

80:nobodyさん
02/06/06 04:44 jW1FwXu2
ひさしぶり!

81:nobodyさん
02/06/09 00:21 MvwsaEnI
コレ、namazuの対抗馬になれるか?
URLリンク(freshmeat.net)

82:山拓変態問題
02/06/20 09:30
mp3用のフィルタって誰か書いてないかしら?

83:nobodyさん
02/06/20 09:39 updula6F
Namazuでmp3用のフィルタ???
わからん、俺がアフォなだけか?

84:nobodyさん
02/06/20 12:41 0pQ6ektu
>>82
ID3タグでも検索するのか?
そういうのは ふつー DB 使うだろ。

85:山拓変態問題
02/06/20 15:09
>>83-84
自分のホームヂレクトリをクロンで毎晩なめてるんだけど、
どうせなら、ID3も見てくれないかなと。
変かなぁ。


86:82=85
02/06/20 15:34
って、WEBプログラミングとは、違いますな。
スレ違いスマソ。


87:nobodyさん
02/06/25 01:01 cgKxt6dS
>>86
なるほど、mp3 の中に埋め込まれたテキストも「文書」として扱い、
検索対象としたい、ってわけね。全然変じゃない。むしろ面白い。
やってることは google のイメージ検索みたいな感じかな。

perl でサクッと書けそうな雰囲気。
ぜひトライしてみて。

あと、Web プログラミングとは関係ないけど、
Namazu に関係あればいいと思うよ。

88:nobodyさん
02/06/25 02:46
いや、それをWebから使えるようにすりゃWebプログラミングと
むちゃくちゃ関係あるじゃん。

> やってることは google のイメージ検索みたいな感じかな。

イメージ検索は外部から関連性を持ってくるのでちと違うような。
内部のID3だけだったらPDF検索くらいに対応するだろう。
ぜんぜんNamazuじゃなくても良さそうだけど、他と串刺し検索するなら
やっぱり便利かも。

89:nobodyさん
02/08/12 22:58
うなぎ食べたいね。

90:nobodyさん
02/09/02 23:28
ナマズマズー

91:nobodyさん
02/09/20 08:19
ウマー

92:nobody
02/09/21 15:05

検索結果で表示されるファイルの先頭部分のサイズを変更できますか?
やりかたを教えて下さい。

93:nobodyさん
02/09/25 08:37 3VOnIdJA
wget
でURLテキスト-iで、ディレクトリ作成-x
しながらページ拾ってくると、
稀にディレクトリ作成(www.aaa.xxx)されなくて
関係ないディレクトリ(www.bbb.xxx)にページを
格納してしまいます。

このままindex作るとURLリンクが関係ないところに。
どうしてだろう。困った。

94:nobodyさん
02/09/27 20:30 7S/gcFrV
Office XPファイルは、インデキシングできないのかなぁ。

95:nobodyさん
02/09/28 02:50 gf1ROtiY
    @ノハ@
 ピュー( ‘ д‘)
  =〔~∪ ̄ ̄〕
  =◎--◎


96:名無しさん@お腹いっぱい。
02/10/07 17:04 ucR8g7pl
   @ハヽ@
  (' д ‘)ピュー
   〔~∪ ̄ ̄〕=
   ◎--◎=

づかれたゾイ

97:名無しさん@お腹いっぱい。
02/10/07 17:05 ucR8g7pl
↑車輪がずれたゾイ

98:nobodyさん
02/11/02 15:20 Jwe6TBuD
ウマー

99:Windows における namazu w/chasen
02/11/03 10:47 rQsphwgx
Chasen を使ったインデックス作成が出来ません
URLリンク(www.namazu.org)
URLリンク(www.namazu.org)
URLリンク(www.namazu.org)

を見ると、2001/05 時点で chasen を使ったインデックス作成は
cygwin 環境で行うことができるようですが、
現在も chasen を使おうとすると cygwin 上で行うのが妥当でしょうか?

100:Windows における namazu w/chasen
02/11/03 11:17
>>99
Chasen 2.0.2 は cygwin 上で問題なくコンパイルできました。

101:Windows における namazu w/chasen
02/11/03 11:33
Namazu 2.0.12 は cygwin 上で問題なくコンパイルできました。
cygwin のデフォルトの perl 関連のパッケージでは File::MMagic はインストールされないので、
CPAN URLリンク(search.cpan.org) からダウンロードしてきて
あらかじめ (configure の前に) インストールしておく必要があります。

102:Windows における namazu w/chasen
02/11/03 14:10 rQsphwgx
namazu + chasen は cygwin で 問題なく動きました。
cygwin のコアDLLのバージョンは 1.3.14-1 です。

103:nobodyさん
02/11/03 23:09 sdt4YScv
>>99
全部cygwinでやる方法以外無いのでは?
そもそもkakasiを使う事が推奨されていて。
茶筅は結構イレギュラーな方法なわけだし。
(運用上結構問題がある)




104:nobodyさん
02/12/03 00:32
ウマー

105:nobodyさん
02/12/26 00:21 DUegdvZH
namazuを2chのdat形式に対応させようとしている人っていますか?
形式自体はレス1つが1行になっているだけなんだけど、<a name="hoge">をつけるのもなんか違う気がするし。
ファイル名と行数だけ教えてくればそれでよいんですが。
Namazuでやっているようなこと、ChaSenで分かち書きしてインデックス作ってcgiで検索っていうのも作りかけたけど、
車輪の再発明になりそうで中断してる。

106:nobodyさん
02/12/26 00:41 M1+zinp+
>>105
dat からそのままインデックスを作りたいってこと?
mknmz 用のフィルタを書けばいいだけだよね。
perl だし結構簡単そうだね。

107:nobodyさん
02/12/26 01:19 DUegdvZH
>>106
そのとおりっす。
各行の先頭に<a name="スレ番号"></a>入れて、理由は不明ですが、先頭行に適当に<html>とか入れてあげて、
mknmz --html-split -a hogohoge.dat
でインデックスは作れたし、検索もできるのは分かるのですが、
mknmzのソースのprocess_file辺りを見ると、コメントに、FIXME: Very complicated.とあるくらいなんで、めんどいなと。
html向けには分割して処理してるみたいですし。
誰か同じようなこと考えていないかなと。

108:nobodyさん
02/12/26 01:48 M1+zinp+
>>107
read.cgi が出力する html をインデックスするよりも、
dat から直にインデックスする方がきっと速い。
いちいち dat から html 作らないから、不要なファイルを作らなくてもよい。
html として出力するのは 2ch ビューアとか、read.cgi に一任できる。
利点はこのあたりかな。みみずんとか喜びそうだよね。

結局、mknmz の仕様に則ったフィルタを作ればいい。
html.pl とか参考にして作ってみたら?
URLリンク(cvs.namazu.org)

もし実現できたら、cvs にある scheme/http.pl と組み合わせて、
2ch.net の dat を直接インデックスできるかな。
あ、今 2ch.net は dat 直読みできないんだっけ? だめか。

109:nobodyさん
02/12/26 02:05 DUegdvZH
>>108
フィルタ自体はHTMLのでも十分なんですよ。
--html-splitなしでは、mknmzってファイル単位でしかインデックス作らないじゃないですか。
datってスレ毎で、全レスが入っているから、スレごとにしか検索できないことになってマズーなのです。
p2 ( スレリンク(mac板) )のdatを2次利用したいなと思っていろいろ試してます。
>>107 に書いたように、mknmzのprocess_fileあたりの--html-split処理部を書き換えてみてます。

110:nobodyさん
03/01/02 18:30 cP1MLYPA
>>109
--html-split的なファイル分割を実現している人がいます。
本家には全く取り込まれていませんが…

Emacsのinfoファイルの分割(X-ml-name: namazu-devel-ja X-mail-count: 02059 )
URLリンク(www.namazu.org)

PDFファイルをページごとに分割(X-ml-name: namazu-devel-ja X-mail-count: 01951)
URLリンク(www.namazu.org)

つーかどちらも実装したのは僕ですが…

実現は単純だと思います。
行ごとにsplitするだけでとりあえずは実装できると思います。
見やすいようにフィールド情報を与えるためにはちょっと工夫がいるかもしれません。
ただフィールド情報が無くても十分有用だと思います。
そのページだけじゃわかりづらいと思うのでわからなかったら質問してください。

navi2chやら他の2ちゃんねるブラウザと連携すれば便利かもしれません。
ある特定のスレだけを検索対象にしてwebに公開しても便利かもしれません。


111:nobodyさん
03/01/03 09:06
管理の都合上、
すべてのページについて、php4とpostgresを使っていて、
URLは URLリンク(domain.com) の形式で作ってるんですが
(fooとbarはいろいろ変わる&postgresでページの階層構造を管理してる)
これにNamazuを導入するには、どうすればいいんでしょうか・・・?



112:nobodyさん
03/01/03 09:29 v/h8n2uJ
 

113:111
03/01/03 18:29 lPX3I1sa
あーれー、レスがない。

114:nobodyさん
03/01/03 18:42
>>113
そういうこと書くと逆効果。大体お正月で人いないし。
そうだなあ、来週の金曜までにレスが無かったら、私がレスするよ。

115:nobodyさん
03/01/03 18:49
>>113
この板でたかだか9時間くらいで何をいってるんだか。
再来週の木曜日までにレスがなかったら俺がレスするよ。

116:111
03/01/04 00:23 U6dtWDEb
とりあえず、それまでに、自学でなんとかできるかできないかなでの段階に、
・・・いきたいな

117:111
03/01/04 19:17 BatkqzbV
検索にひっかからない。。。

「php namazu インデクサ」とじゃ
「php namazu シェルスクリプト」とかで検索してるんだけど、
いまいち該当しない。

検索のヒント、ください。

118:111
03/01/11 17:11 CeP+V+mb
ショボーン

119:nobodyさん
03/01/11 18:22 8y79ZXZ4
namazuかぁ。
ひらがなとかカタカナのもうめちゃくちゃな弱ささえ克服できればなぁ。
kakasiにひらがな単語の辞書登録さえあれば…。

もともと、そーゆープログラムではないから
AQに採用されることないけど。

120:山崎渉
03/01/15 13:33
(^^)

121:nobodyさん
03/01/17 16:56 TsHzDgv8
>>119
茶筅にしる!

122:nobodyさん
03/01/18 02:26
Googleみたいにヒットした単語の周囲の文章をサマリ表示させてほしい。
サマリは直接生成。

123:nobodyさん
03/01/18 07:01 0IdKnMy1
ところで、ウチのプロバイダはCGI使えないんだけど、全文検索(Namazuじゃなくても可)できる方法ないですかね。

124:nobodyさん
03/01/18 15:04
>>123
あらかじめ検索用のインデックスを作っておいて、javascriptで、~~~~

125:124
03/01/18 15:07
よく考えたら、自分の所でCGI使えなくても、
CGIを使えるサーバーを借りたら、解決だった。

126:nobodyさん
03/01/18 16:10
>>122
pnamazuつかえ


127:nobodyさん
03/01/18 22:45 KC3+f7J6
>>122
自分的にもそれは必須の機能だと思うんだけどなぁ。
頭の部分だけ静的に切り出したサマリーでずらずら検索で引っ掛かってきてもあんまサマリーの意味ない。
メーリングリストみたいにタイトルが内容の要約になってる、とかならいいんだけど。

128:nobodyさん
03/01/21 15:04 2m91wCEm
、、、すんません 教えて下さい。
Namazu 2.0.12 for Win32をWin98で使用しています。
mknmzを実行すると、下記のエラーが出てしまいます、、、

Can't locate File/MMagic.pm in @INC (@INC contains: . C:/Perl/lib C:/Perl/site/
lib .) at C:\USR\LOCAL\NAMAZU\BIN/mknmz line 34.
BEGIN failed--compilation aborted at C:namazu\bin/mknmz line 34.

お分かりになる方、いらっしゃっいましたら
ご教授ください。お願いします!

129:nobodyさん
03/01/21 23:04
MMagic が適切なパスにないか、インストールしていない。

130:nobodyさん
03/01/22 00:18
>129さん 早速のレス、ありがとうございます。
MMagicのインストールを行おうとすると、エラーがでるので確かにインストール
されていないようです。
namazuのパッケージに含まれてるppmは、500番台と600番台の2つなのですが
私のActivePerlのビルド番号を確認すると、804となっています、、、。
これが原因なんでしょうか?

131:nobodyさん
03/01/22 22:49 tlaGPNPQ
kabayaki使えYO!

132:nobodyさん
03/01/22 22:55 0SY2SNoc
「パソコンの仕組み」

URLリンク(pc1.moo.jp)

パソコン・インターネットの仕組み、パソコン自作・サーバー構築法について、動画や静止画を豊富に取り入れて、初心者向けに基礎から分かりやすく解説しています。

ガンガン、アクセスしてください!!

133:nobodyさん
03/01/22 23:06 DuSjMjDY
小遣い稼ぎ
URLリンク(banana.fruitmail.net)

134:nobodyさん
03/01/23 09:19 XTkiyicl
chasen使ってる人に質問です。
やっぱりkakasiより検索精度あがりますか?
とくにひらがな単語やカタカナ単語で。




135:nobodyさん
03/01/24 13:46 DnlSMTjH
 おまいら、namazuで検索するファイル数ってどのくらいですか?
1ディレクトリで1000ファイルオーバーとかって、インデックス
作るのに問題ないっぽい?
 なんか、毎日自動でインデックス作ってるんだけど、ちゃんと
インデックス作れてない(検索できない)場合が時々あるのよ。手動で
作ってやるとちゃんと動くところがまた憎らしい。

136:nobodyさん
03/01/24 15:43 9aIuMK5X
wgetの収集でたまにぜんぜん関係ないディレクトリに
index.htmが格納されて困るんだけどなんでだろう。
ブラウザ動かしながらやるとミスするのかなぁ。

win2k

137:nobodyさん
03/01/25 15:38 x6YUG/OM
pnamazuのほうがヒットしやすいのでしょうか?

perl版でインデックス作らないとダメなのでしょうか?

そのままのインデックスでpnamazu.cgiでとりこぼしが減るのでしょうか?

138:nobodyさん
03/02/05 04:47 vQpd3y9f
保守

139:nobodyさん
03/02/05 06:56 CehyN38W
URLリンク(homepage3.nifty.com)
いいね~ これ♪


140:nobodyさん
03/02/05 09:04 LQrwCDVW
アダルトの宣伝↑

ナマズの派生で、カバヤキっていうのでたけど使ってる人いる?


141:nobodyさん
03/02/05 09:11 JiOCwoo3
URLリンク(www.agemasukudasai.com)

142:nobodyさん
03/02/05 10:12
初めて Namazu 使ってみたけど、SI には使いづらい作りだな…

143:nobodyさん
03/02/05 11:27
>>142
どこら辺が?
内容によっては、回避策や運用のテクニック教えてあげられるかも。

144:nobodyさん
03/02/07 03:32 /4XUF2iq
MS-Access + ASP の like による全文検索と Namaz でインデックス
作成した全文検索ってどのくらいパフォーマンスが変わってくるかなー

検索対象レコード:1000、検索対象フィールド:3
各フィールド60,000文字ぐらいで考えてるんだけど、
MS-Access + ASP じゃ無理あるかな・・・
2、3秒で検索結果がでてくればいいのですが・・・
インデックスの作成自体、最近気づいた愚か者ですが、
よろしくお願いいたします  m(_ _)m


145:nobodyさん
03/02/07 06:28 KeFGYCTZ
URLリンク(jsweb.muvc.net)
?????????

146:nobodyさん
03/03/07 18:19 +bpjK8Vp
UNAGI

147:nobodyさん
03/03/08 13:01
Namazuが装備されてるレン鯖なら
URLリンク(www.akira.ne.jp)

148:nobodyさん
03/03/08 16:11 6pWNtujS
あるファイルを処理できるフィルターが複数あるとき、
どちらを使うかはどうやって決まるのでしょうか?


149:山崎渉
03/03/13 17:05
(^^)

150:nobodyさん
03/03/13 20:02
(・∀・)イイ!

151:nobody
03/03/28 00:40
(´-`).。oO(保守……。)

152:山崎渉
03/04/17 12:25
(^^)

153:山崎渉
03/04/20 06:08
   ∧_∧
  (  ^^ )< ぬるぽ(^^)

154:nobodyさん
03/04/23 13:38
うちのノートPC、2chのlog数百個程度mknmzしてると
CPU周り熱々になって九割方落ちる鬱

155:nobodyさん
03/04/28 11:08
レン鯖レン鯖

156:nobodyさん
03/05/14 16:15
(・∀・)

157:nobodyさん
03/05/18 02:04 inHKtSNs
Namazuを使ってます。
ただ、データの量が多くインデックス作成に失敗する事が多々あり、
現在は分割して、インデックスを作成。
ここに追加( --no-delete オプション)しています。
(更新は週に1回でも十分なので、本当は週に1回最初からインデックスを
作り直したいのですが、時間的にも労力的に厳しいです)

質問なのですが、上記の --no-delete オプションで一部のファイルをインデックスに
追加することと逆に、なんらかの方法で「指定したファイル」のインデックスからの
削除は可能でしょうか?


158:nobodyさん
03/05/18 10:06 OMFaVw9A
>>157
>データの量が多くインデックス作成に失敗する事が多々あり

うちではそんなこと無いなあ。まあ10万ファイル程度だけど。
データ量が多いってどのくらい?
インデックス作成失敗って、どんなメッセージが出てどんな状況になるの?

159:nobodyさん
03/05/18 14:25
>>158
共用サーバにてインデックスを作成、Namazuを利用しています。

おおよそ、1MB前後が1回あたりのインデックス作成の限度のようです。
メッセージは「Out of Memory!」です。


160:nobodyさん
03/05/18 17:53
ローカルのマシンでインデックスを作ってアップロードじゃだめなん?

161:nobodyさん
03/05/19 02:54
>>160
それも考えたのですが、インデックスには当然ローカルのファイルのパスが含まれてますよね?

現在はReplaceで、サーバのパス/virtual/ID/→http://~の絶対パスに変更しています。
ローカル(Windowsマシン)C:\~を絶対パスhttp://~に変更させる事ができるのでしょうか?


162:nobodyさん
03/05/19 08:52
>>161
だって自分でやってるって書いてんじゃん。


163:nobodyさん
03/05/19 11:12
なんだ、結局サーバのメモリ使用量制限に引っかかってるだけじゃん。
Namazu と直接関係ないじゃん。

>>161
可能。パスを書き換えて、インデックスを再構築すればいい。rfnmz だっけ?
ml の過去ログで似たような事例を見た気がする。

164:nobodyさん
03/05/19 12:36 R1nWpNfc
NamazuってリレーショナルデータベースのIndex検索できますか?
Javaで書かれたLuceneってのはできますよ。

165:動画直リン
03/05/19 13:08 IEVyzYan
URLリンク(homepage.mac.com)

166:nobodyさん
03/05/19 14:26
>>162
>>163
ありがとうございます。

wget>インデックス作成>検索と3段階で相当な負荷が
サーバにかかっていたので、いつアカウントを止められるのか
心配していました。

wget>インデックス作成まで行えれば、
検索だけをサーバで行うので負荷も和らげられると思います。

167:nobodyさん
03/05/19 15:01 hryn2RRe
(;´Д`)ハァハァ
URLリンク(homepage3.nifty.com)

168:bloom
03/05/19 15:08 IEVyzYan
URLリンク(homepage.mac.com)

169:nobodyさん
03/05/21 10:19
ローカルのWindowsのNamazuと、共用サーバのLinuxのNamazuのインデックスは
互換性があるのでしょうか?


170:nobodyさん
03/05/21 14:38 zDb/UTki
age

171:bloom
03/05/21 15:08 JZ9K0e/X
URLリンク(homepage.mac.com)

172:nobodyさん
03/05/22 00:10
>>169
あるよ。

173:nobodyさん
03/05/22 01:10
>>172
ありがとうございます。

Liunxのインストールからはじめるのは辛いですし、
cgiでインデックスを作ろうとするとすぐに落ちるので
助かりました

174:山崎渉
03/05/22 01:58
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―

175:nobodyさん
03/05/23 00:35
(・∀・)

176:山崎渉
03/05/28 17:21
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎―◎                      山崎渉

177:nobodyさん
03/05/30 16:43
(・∀・)

178:nobodyさん
03/06/18 16:39 DT1VWY3V
そろそろwindowsローカルのPHPマヌアルを検索できない不具合は解決してますか?

179:nobodyさん
03/06/18 22:37 yFwDTAK+
>そろそろwindowsローカルのPHPマヌアルを検索できない不具合は解決してますか?

PHPマヌアルにかぎらずUTF8で書いてあるページは文字化けするツー事
nkfを利用しているからじゃないかな

180:nobodyさん
03/06/19 00:34 r/KT2iM+
nkf使ってないよ、lvでutf8対応している

181:nobodyさん
03/06/25 14:23 77oj5Ix9
Namazuってファイルの検索に使うんですか?
全文検索できないの?
できるんだったら、指定したキーワードを含むファイルだけから全文検索するなんて使い方も可能?

また、インストールしたLinuxとかのディスクに置いてあるファイルでないと検索できないのかな?
Windowsマシン上にあるファイルもさがせたりしないんでしょーか。

いろいろ関連サイト見てみたけどそういったことは書いてなかったYo!って探し方悪いんでしょうか



182:nobodyさん
03/06/25 15:10 vaUG6cj5
☆覗いてみてください☆(閲覧無料)
URLリンク(endou.kir.jp)

183:_
03/06/25 15:12
URLリンク(homepage.mac.com)

184:ミルフィーユ
03/06/25 15:24
カスケードスタイルシートって、
おいしそうですねぇ。

185:nobodyさん
03/06/25 19:36
>>181

no
no
no
no
no

調べ方悪すぎ。namazu.orgにある文章読むだけで全て分かるのに。

186:181
03/06/27 00:27 6z/IvjGb
>>185
noってそれぞれの私の質問に対する回答ですか?
いずれにしてもサンクス子 URLリンク(www.namazu.org) いってきます。。m(。_。)m

187:???
03/06/27 19:27 1V/886pX
インデックスの作成 OK → Webサーバーへのアップ OK
→キーワード入力 OK →検索している 検索結果は出るのですが
全く関係のないページばかりリストアップ。そのページソースを検索キーワード
で探してもありません。

インデックスもエラーなくできて、アップも問題なくでき、検索もできるのですが
その結果が全くあさって・・・どこに問題がありそうでしょうか???。ご意見を
お願いします。

188:nobodyさん
03/06/28 01:23
>>187
Namazuってそんなもんだよ。
といいつつ、おれもインスコしてますが、自分では一切使わない。w


189:187
03/06/30 07:16
>>188
んっ~それにしても結果が全く関係なさ過ぎるんですよ。
インデックスがまともに出来ていないような現象です。
ただ、作業的には問題なく進んでるんですよ・・・トホホ  。・゚(/д\)゚・。

190: ◆MiMIZUNCjA
03/07/07 03:25 sv7ydGsI
なんどもインデックスの構築をしているといつのまにかめちゃくちゃな回答をされるときがあって
そういう場合は最初から作り直しますがなんなんでしょうね。

191:
03/07/07 03:54
>186
たぶん回答じゃなくて、ガイジンさんなんだよ。
...no. no! no!! no!!! nohhh!!!!!! nanimochigaudesholtu!!!
って感じだと思う。

192:山崎 渉
03/08/15 22:47
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン

193:nobodyさん
03/10/02 14:51
no

194:nobodyさん
03/10/06 00:26 MvGVNeyO
なんだか自分は複数indexについてよくわかっていません。
複数indexを作る場合、
namazu.cgiと.namazurcのあるディレクトリの下に新しいディレクトリを作って分けて、.namazurcで制御すればいいんでしょうか?
今はindexファイルをnamazu.cgiと.namazurcのあるファイルと同じ階層に全部詰め込んでいます。
これだと、二つ以上のindexは作れないみたいです。

195:nobodyさん
03/10/06 00:33
複数インデックスは、 インデックスのあるディレクトリ内のサブディレクトリ名が
そのままインデクス名になる。使う場合は、.namzurcではなくて
NMZ.head.jaで idxname="foo" とか指定してやればいい。

196:nobodyさん
03/10/06 06:50 fxmWtj2Y
>>195
わかりやすいレスありがとうございます。
解決しました。

197:nobodyさん
03/11/13 08:37 Tw9dU9HY
相談なんですけど、

「ホスティング依頼している鯖に namazu を入れて、メールの全文検索ができ
ないもんかな?」

という相談をうけますた。

う~ん…………

おいらの使ったのは、RedHatだったんで、namazuはRPMでなんも考えずに
入れて、インデックス作って使ってたことはあるけど、ホス依頼してる鯖だと
root 権限なんか貰えないだろーしなぁ……

なんかいい方法ってないでしょか?

198:nobodyさん
03/11/14 09:37
pnamazu

199:197
03/11/14 14:31 bYphtnKK
>>198

ありがとう!提案してみるよ

って、これ、インデックス作成はローカルの環境でするのかぁ
ま、いいや。相手がなんていうか、言うだけ言ってみよう

ヒントくれてサンクス!

200:nobodyさん
03/12/20 12:12 BT5vMVU9
特定のディレクトリのみ除外する方法は何かありますか?

201:nobodyさん
03/12/20 14:36
>>200
特定のファイル(拡張子だけだったかも)を除外する
という設定項目があった様な記憶があるんで、
もしかしたら、それの応用でディレクトリごと無視するとかできるかも。

#具体的にどんな設定をするかは忘れた
#多分namazuの本家サイト見たらあったよ

202:nobodyさん
04/01/02 23:12
自分のページは全て、「URLリンク(www.example)★」★はページごとに違う
という形式なのですが、
こういった動的なページに対してNamazuを使うというか、インデックスを作成するには、
どうすればいいのでしょうか?

203:202
04/01/02 23:13
もとい、
誤:「URLリンク(www.example)★」
正:「URLリンク(www.example.com)★」

204:202
04/01/04 01:18 LkXOe+SC
あ、すごいタイムラグあいてますね。。。age

205:z33
04/01/04 10:35
>>202
replaceでがんばってどうにかできないかな?

例えば
/home/apache/documentroot/test/1.txt

URLリンク(www.example.com)
って変換だったら
Replace "/home/apache/documentroot" "URLリンク(www.example.com)"
とか

こういうこと?

206:202
04/01/05 22:28
>>205
ありがとうございます。
全部、/?cat=★は「★.inc」としてファイルをおいてあるので、それでなんとかいきそうです。

207:nobodyさん
04/01/19 19:55 daYuprPN
教えてもらいたいことがあるんですが
nmz.field.****
の****を増やしたいのですが、どうしたら良いでしょうか?

具体的にはmknmz時にuriを見て
wwwroot/aaa/a.html
wwwroot/bbb/b.html
nmz.field.locate ってファイルを作ると
その中に
aaa
bbb
って出力されてほしい
で検索結果でyahooのカテゴリのように
<a href="a.html">aのタイトル</a>
カテゴリ TOP>>aaa(${locate}の値)とかやりたい
まぁ検索結果の中でuri見て変換したら良いんだけど、
もうちっとスマートに処理させたいなと・・・

208:z33
04/01/20 22:20
>>207
ちょっとググッて探してみたら、こんなの見つけたけど
URLリンク(www.namazu.org)
参考になる?

209:nobodyさん
04/02/11 00:01
Namazuで検索サイトやろうかな。

210:nobodyさん
04/02/13 03:38 jCzy8g3E
質問です。
2chの過去ログを検索出来るようにしていますけど
ファイル数17万程度でインデックス作成に取り組んでいるのですけど
3日経っても終わりません。。おかしいと思いこちらに来ました。
もっと処理を早くしたいのですが、、

一応何を書けばいいのかわかりませんが、
PCのスペック等を簡単にまず記します。
何か必要な設定項目を書けと言われればすぐ書きますので、、
CPU P3-1G@dual
mem 1G
namazu ver2.0.12
perl 5.6

設定ファイルの中身を弄ればいいのでしょうか。。
一応インデックス書き出しは行われ続けていますけど
遅くて遅くて、、、
何かヒント等くれる方いらっしゃいませんでしょうか、、、?

211:210
04/02/13 03:45 jCzy8g3E
OS windows2000 sp3
KAKASI使用

mknmzrc設定
$ON_MEMORY_MAX = 5000000;
$FILE_SIZE_MAX = 10000000;
$TEXT_SIZE_MAX = 1000000;
$WORD_LENG_MAX = 128;
$INVALID_LENG = 128;
$MAX_FIELD_LENGTH = 200;
$WAKATI = $KAKASI;

とりあえずon memory maxの値が小さいのはわかったのですけど
これが速さに関係するのかは理解出来ませんでした。
また、他に問題点や気づく点等がありましたら教えて欲しいです、、


212:nobodyさん
04/02/13 08:37
処理能力にはディスクI/Oという重要なファクターもある。
一気にmknmzするのではなく、分割してmknmz→マージする。
そうすれば処理時間もだいたい想像できる。

213:210
04/02/13 13:43 wO1Lum8s
>>212 ヒント有難う御座います!
   少しそれについて調べてみます。

214:森の妖精さん
04/02/16 02:31 /mo58UcM
URLリンク(geta.ex.nii.ac.jp)

GETAのPHPインタフェイス作ろうという奇特な御仁は
いらっしゃいませんか?

215:nobodyさん
04/02/20 12:32
検索エンジン作成に関してのスレを
こちらにまとめました。

検索エンジンをつくりたい
スレリンク(php板)l50

216:nobodyさん
04/03/24 21:59
これ誰かお願いします
スレリンク(unix板:576番)
Java の API のリファレンスを Namazu でインデックス化していて
Emacs でプログラミング中にカーソル上のクラス名ですぐ検索したいんです

217:nobodyさん
04/03/31 21:28
Namazuでインデックス化をして検索をしようと思ったら
「現在-3の文書がインデックス化され、・・・」と文書の数がマイナスになっています。
どうしてなのでしょうか。

218:nobodyさん
04/03/31 21:46 5e+SzBpf



219:(´・ω・`)
04/04/01 21:05 98Q5EoMa
どなたかPHPスクリプトで動く
日本語全文検索エンジンソフトウェアを教えてください。

220:nobodyさん
04/04/02 00:02 n5mwBUCQ
4/1にNamazuの新バージョン出るんじゃなかったっけ?

221:nobodyさん
04/04/02 22:28



222:nobodyさん
04/04/20 23:55 hVBcQucn
Namazu 2.0.13-1 を公開age

223:nobodyさん
04/05/01 23:15 HE2QfFBX
kakasiについて質問です。

自分で作った辞書を、追加した。

# mkkanwa kanwadict (追加した辞書ファイル)

自分で追加した辞書の内容は、
上記の場合、(追加した辞書ファイル)を参照すれば分かるけど、
現在の辞書全体にどのような単語が登録されているかを調べるにはどうしたらいいんでしょうか?

kanwadictって、viで開くと文字化けして見れません。
※環境:UNIX

224:nobodyさん
04/05/27 15:51 CEx1TsW7
URLリンク(www.namazu.org)
にアクセス気出ません

225:nobodyさん
04/05/27 16:43 mtXfTMbY
>>224
orz

226:nobodyさん
04/05/27 16:43
今見たら面白いことになってるな

227:nobodyさん
04/05/27 16:57
>>224
何かあったの?
クラックされてたとか?

228:nobodyさん
04/05/27 19:56 WJMdSqlX
namazu.orgサーバに不正侵入、サービス停止

全文検索システム「Namazu」を配布するNamazu Projectは5月27日、
同プロジェクトのサーバが不正侵入を受けたと発表した。

URLリンク(headlines.yahoo.co.jp)

229:nobodyさん
04/05/28 21:23
マジかよ・・・

230:nobodyさん
04/05/28 21:24
マジかよ・・・

231:nobodyさん
04/05/28 21:26
マジかよ・・・

232:nobodyさん
04/05/28 21:28
マジかよ・・・

233:nobodyさん
04/05/28 21:29
マジかよ・・・

234:nobodyさん
04/05/28 22:17
うわっ・・・5重に書き込んじまったよorz

235:nobodyさん
04/05/29 00:22
>>229-233
今回の2ch不調で俺が見た多重で最高だw

236:nobodyさん
04/05/29 19:09
>>235
8連投した神もいたぞ。

237:nobodyさん
04/05/30 20:09 WmFD3m1t
Windowsバイナリは????

238:nobodyさん
04/06/02 02:08
>>229-234
ワロタ

239:nobodyさん
04/06/17 19:14 KtXfrXmS
人がいないので話題をふってみる

検索結果について質問なんですけど
URLリンク(www.kaiho.mlit.go.jp)
↑こんな風に検索語句と該当箇所が赤く強調されるのってどうやるんですか?
URLリンク(www.city.katano.osaka.jp)
自分のは↑こんなふうに参照したページの上部しか表示されません。



240:nobodyさん
04/06/17 21:45
正常に赤強調されるけど?
URLリンク(www.city.katano.osaka.jp)

NMZ.headにデフォルトで strong.keyword { color: Red; } あるから、
「ちゃんとしたキーワード」なら赤くなるハズ。

241:nobodyさん
04/06/18 00:33
>>240
本当だ・・・キーワードの入れ方がまずかったようです。
自分のnamazuでやり直したらちゃんと表示されました。
無知で申し訳ありません。

242:nobodyさん
04/06/28 15:24
Perl版Namazuをレン鯖に置いてみましたが、
全角文字で検索すると検索語が”%a5%d0%a5%”みたいな感じで文字化けします。
検索結果画面はきちんと表示されますが、検索文字列だけが化けています。

もう一回全角で検索すると文字化けが直ります。1回目だけ必ず文字化けします。
何が原因でしょうか?

243:nobodyさん
04/06/28 15:25
↑うわ、UNIX板に書くつもりだったのに間違えた

ごめんなさい、無視してください。

244:nobodyさん
04/07/16 18:31
検索は問題なく出来るのですが、
ヒットしたファイルが日本語のファイル名だと、
ブラウザ上に表示されているファイル名を
クリックしてもファイルをオープンしません。

検索対象ファイルの、
ファイル名が日本語でも対応してますか?
ちなみにWindows版(2.0.12)です。

245:nobodyさん
04/07/19 00:54
URLリンク(suwako.plala.jp)
↑ここ見てnamazuの全文検索システムのソースを入れてみたら
無事に検索は出来るんですが検索された先のリンクがなぜか全てnamazu.phpがある
カレントディレクトリになってしまいます。
これはどうすれば対処することが出来ますかね?

246:nobodyさん
04/07/19 12:51
.namazurc弄ればいんでない

247:245
04/07/22 13:31
namazurcの48行目にあるReplaceを参考サイトを見ながら
いじってみましたがやはり結果は同じです。
一体どこがおかしいんだろう?
例えばnamazu.phpをC:\homeに置いたら
検索結果はちゃんと表示されるんですがリンクが全て
namazu.phpを置いているディレクトリになってしまいます。(この場合はC:\home)
変えるべきところはnamazurcのReplaceのところとは思うんですが
何度変えても同じ結果になってしまいます。
どうすればちゃんとしたリンク先になってくれるかな?

参考にしたサイト↓
URLリンク(ponx.s5.xrea.com)
URLリンク(you-like.to)

248:nobodyさん
04/07/22 14:11
>>247
何でだろうね?ところで自鯖でやってるの?

249:nobodyさん
04/07/31 19:38
Replace A(インデックス作成時のパス) B(Aを置換したい文字列)

だよね。ちゃんとそうなってる?
 

250:nobodyさん
04/07/31 19:44
pnamazu.cgiの検索結果に表示される「著者」の欄がウザイのと、
この欄の ${author} が一体何を表示するのかがわからないので
ソースを追跡してみたのですが自分には具体的に読み解くことができませんでした。

sub field_init {
%FieldAlias = (
'author' => 'from' ,
'title' => 'subject' ,
'url' => 'uri' ,
);
あたりまではなんとなく分かるんですが・・・

Perlのすごい人! だれか教えて!

251:nobodyさん
04/08/02 08:46
著者を消したいだけなら NMZ.result をいじったほうが早いよ。
著者がなにかを知りたいんだったらpnamazuではなく、mknmzのほうを解析するよろし。

252:nobodyさん
04/08/12 09:03
.namazurcで

Replace /index.html /
Replace /C\|/namazu/nurupo/ URLリンク(hoehoe.ne.jp)

と、2つの置換を行いたいのですが、当然できません。
正規表現が使えるみたいなことが書いてありますが

Replace /C\|/namazu/nurupo/(.+)/index.html URLリンク(hoehoe.ne.jp)

では全てが URLリンク(hoehoe.ne.jp) にされてしまいます($1が展開されない)

どうやればこの置換を実現できるのでしょうか?

253:nobodyさん
04/08/12 09:05
む?もしかして$1じゃなくて\1なのか・・・?そうなのか・・・?

254:nobodyさん
04/08/12 09:07
ああ・・・やっぱ\1でも駄目だ・・・いったいどうすれば・・・

255:nobodyさん
04/08/21 22:26


Namazuの検索結果って、
全部ドキュメントの行頭あたりしか表示しないけど
Googleみたいにマッチした前後の文章を表示できんの?


256:nobodyさん
04/08/22 16:46
>>255
できない。
レスポンスを重視した結果、今の仕様になっていると思われる。

257:nobodyさん
04/08/22 19:58
>>255
Googleっぽい動作が希望なら
Estraier使ってみるとか

258:nobodyさん
04/08/23 22:59
Estraier はNamazu ほど敷居は低くないよなぁ・・・
>>255 有りものの中でなら msearch がお勧め

259:nobodyさん
04/08/24 01:13 202RVh+S
そういや微妙に商用はいってる2ちゃん検索もmsearch使ってるっぽいな。
URLリンク(find.2ch.net)

260:nobodyさん
04/08/24 06:48
CGIで複数の基本インデックスの指定は不可?
F:\index
   +aaa
     +001
     +002
     +003
   +bbb
     +001
     +002
     +003
aaaとbbbを指定したいのだが…
ぐぐたら無理ぽいな
URLリンク(search.luky.org)

261:nobodyさん
04/08/24 19:02
001とか002とかもインデックス?

javascriptとかでチェックボックスをコントロールするとかじゃ駄目か。

262:nobodyさん
04/08/24 22:09
多分無理かな。以下のようにcccを指定する
じゃダメ?

F:\index
  +ccc
   +aaa
   +bbb

263:nobodyさん
04/08/25 01:35
>>261-262
数字のフォルダがインデックスで大まかに分けてある。
やはり1つのフォルダ以下にインデックスの入ったフォルダを置くしかないのか。

264:nobodyさん
04/11/11 11:45:47 VoJd1QOh
インデックスと結果表示をutf8でできないでしょうか…

265:nobodyさん
04/11/23 11:20:19
本家のperl版まだー?

266:nobodyさん
04/11/26 13:50:33 cbW9i0f7
お聞きしたいのですが…

wgetで落したHTMLファイルをNamazuで検索しています。
Namazuの検索結果の順番を自分で決めたいんですが、
NMZ.field.uriの順番をいじると全てのページがNOT FOUNDになってしまいます。

どなたかいい方法知りませんか?

267:nobodyさん
04/11/26 14:41:22
インデックスの作成を速くする方法ないですか?
namazuはcなのにmknmzはperlなのはどうして?

268:nobodyさん
04/11/26 14:55:11
>>267
インデックスの作成を早くするには分散して作成してからマージすればよいかも。

namazuがcなのはcの方がリクエストの度にコンパイルがない分、早いから、
mknmzはインデックス作る時しか使わないので文字の操作が楽チンなPerlを・・・。
ちなみにpnamazuっていうPerlで書かれたnamazuもある。
たしか2chもread.cgiはCだけど、bbs.cgiはPerlだったと思う。

質問は一個ずつにしてね。


269:nobodyさん
05/01/02 10:01:19 Oo1G9Jag
とりあえずローカルで動かそうと思ったんですが、どうしてもインストールが
うまくいきません。
インデックスを作ろうとするとNKF.pmが無いといわれます。
PPM-INSTALL.BATを動かしてもうまくいきません。どうすればいいのでしょうか?

270:269
05/01/02 12:42:33
すいません、自己解決しました。

271:nobodyさん
05/01/27 22:35:38 muSCpH63
一日費やして何とかNamazuをサーバーでうごかせれるようになったレベルなんですが、これでñとかóのような外国語をブラウザから検索してみると激しく文字化けしてしまいます。
なんか改善する術ってありますでしょうか? 教えて誰かエロイ人!!

272:nobodyさん
05/02/11 17:47:10 LfkZHaha
namazuのwin32版をインストールしたのですが、mknmzrcの$ALLOW_FILEのところで、
2行目以下のwordなどの設定が対応メディアタイプに反映されません。
2行目以下も#は外しているのですが…。
茶筌のところ#を残しているのですが、それもちょっと変かもです。
うまくいかない原因がわかる方どなたか教えてください。

読み込んだ設定ファイル: D:/namazu/etc/namazu/mknmzrc
システム: MSWin32
Namazu: 2.0.12
Perl: 5.006001
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: chasen -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: sjis
CONFDIR: D:/namazu/etc/namazu
LIBDIR: D:/namazu/share/namazu/pl
FILTERDIR: D:/namazu/share/namazu/filter
TEMPLATEDIR: D:/namazu/share/namazu/template
対応メディアタイプ:
application/x-gzip
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; x-type=rfc
text/x-hdml

273:nobodyさん
05/02/11 19:36:57
>>272
まず最新の2.0.14を使いましょう。
それと
D:/namazu/etc/namazu/mknmzrc の$ALLOW_FILE
のところを全行はりつけてよ。
どこの#を外したのか見てみないとわからんよ。

274:272
05/02/11 19:40:50
>>273
最新って言ってもベータ版らしいので…。
とりあえずこんな感じです。

#
# This pattern specifies file names which will be targeted.
# NOTE: It can be specified by --allow=regex option.
# Do NOT use `$' or `^' anchors.
# Case-insensitive.
#
$ALLOW_FILE =".*\\.(?:$HTML_SUFFIX)|.*\\.txt" . # HTML, plain text
"|.*\\.gz|.*\\.Z|.*\\.bz2" . # Compressed files
"|.*\\.pdf|.*\\.ps" . # PDF, PostScript
"|.*\\.tex|.*\\.dvi" . # TeX, DVI
"|.*\\.rpm|.*\\.deb" . # RPM, DEB
"|.*\\.doc|.*\\.xls|.*\\.ppt" . # Word, Excel, PowerPoint
"|.*\\.j[sabf]w|.*\\.jtd" . # Ichitaro 4, 5, 6, 7, 8
"|\\d+|[-\\w]+\\.[1-9n]"; # Mail/News, man



275:nobodyさん
05/02/11 19:43:44
あれ?連続する半角スペースとタブが消えるのは2ちゃんの仕様でしたよね。

276:nobodyさん
05/02/11 19:49:17
>>274
Windows版はβ版扱いになっていますが、
インストーラがβというだけで本体に問題はないですよ。

たぶんフィルタが必要としているMS-Word等の
アプリケーションが入っていないのでしょう。

こちらのフィルタを使うとよいでしょう
URLリンク(www.geocities.co.jp)


277:nobodyさん
05/02/11 19:53:07
関係ないが消えるのはタブだけ。

278:272,274
05/02/11 20:00:49
そういえば2.0.12は2002年か…。
Office2003だということもあるのかな。
拡張子だけで判断してるのではないんですか。
まずは最新版をインストールしてみます。
用事があって今日これからはできないので、うまくいかなかったらまた後日質問させてもらいます。
回答ありがとうございました。

279:nobodyさん
05/03/10 15:52:52
Redhat9、namazu2.012にて全文検索システムを作成しています。
ページが増えてきたので階層ごとにインデックスを作成し階層ごとに検索ページを
作りたいと考えております。しかしインデックスファイルを作成しnamazuコマンドでは
検索できるのですがブラウザから
http://サーバIPアドレス/cgi-bin/namazu.cgi?idxname=aaaとすると
allインデックスから検索されてしまいaaaインデックスから結果を表示してくれません。
aaaインデックスから結果を表示するにはどのようにするのでしょうか?

ページの階層
/apache/htdocs/aaa
/apache/htdocs/bbb
/apache/htdocs/ccc

インデックスの格納場所
/apache/cgi-bin/namazu/index/all
/apache/cgi-bin/namazu/index/aaa

index/all内のNMZ.head.ja
<input type="hidden" name="idxname" value="all"> ←allに変更
<a href="{cgi}?idxname=all">[検索方法]</a> ←?idxname=allを追加

index/aaa内のNMZ.head.ja
<input type="hidden" name="idxname" value="aaa"> ←aaaに変更
<a href="{cgi}?idxname=aaa">[検索方法]</a> ←?idxname=aaaを追加

cgi-bin内にある.namazurc
Index /apache/cgi-bin/namazu/index
Template /apache/cgi-bin/namazu/index/all
Replace /apache/htdocs/ http://サーバIPアドレス/

280:nobodyさん
05/03/10 22:40:21
>>279
mknmzの内容教えれ

281:279
05/03/11 09:08:13
ご返答ありがとうございます。mknmzの結果は下記の通りです。

mknmz -O /apache/cgi-bin/namazu/index/all /apache/htdocs
合計の文書数 602
合計キーワード 5,499
わかち書き module_kakasi -ieuc -oeuc -w

mknmz -O /apache/cgi-bin/namazu/index/aaa /apache/htdocs/aaa
合計の文書数 9
合計キーワード 441
わかち書き module_kakasi -ieuc -oeuc -w

よろしくお願いします。

282:279
05/03/11 16:15:26 8QvGuHRh
こっちですね。
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: no
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.eucJP
言語: ja_JP.eucJP
文字コード: euc
CONFDIR: /etc/namazu
LIBDIR: /usr/share/namazu/pl
FILTERDIR: /usr/share/namazu/filter
TEMPLATEDIR: /usr/share/namazu/template
対応メディアタイプ:
application/pdf
application/x-bzip2
application/x-compress
application/x-gzip
application/x-rpm
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; xtype=rfc
text/x-hdml
text/x-roff

283:279
05/03/11 16:20:49
すいません。間違えました。
mknmz -C
読み込んだ設定ファイル: /etc/namazu/mknmzrc
システム: linux
Namazu: 2.0.12
Perl: 5.008
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: no
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.eucJP
言語: ja_JP.eucJP
文字コード: euc
CONFDIR: /etc/namazu
LIBDIR: /usr/share/namazu/pl
FILTERDIR: /usr/share/namazu/filter
TEMPLATEDIR: /usr/share/namazu/template
対応メディアタイプ:
application/pdf
application/x-bzip2
application/x-compress
application/x-gzip
application/x-rpm
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; xtype=rfc
text/x-hdml
text/x-roff

284:nobodyさん
05/03/12 00:24:13
>>279
Template /apache/cgi-bin/namazu/index/all
としているから
常に index/all内のNMZ.head.ja
が読み込まれているということでないか
namazurcのTemplateの行をコメントアウトしてみたら

285:nobodyさん
05/03/17 23:30:42
>>279
亀レスだけど、
Namazuでは 「/cgi-bin/namazu.cgi?idxname=aaa」 みたいな直接指定はNGだったはず。
きちんとhiddenとかから送らないと。

286:nobodyさん
05/03/22 21:53:42
>>285
それってどこでNGにしてるんでしょ。Namazu本体じゃなくて
pnamazuとかインターフェースのところでやってるんですよね。

287:279
05/03/30 18:10:10
>>284-286 ありがとうございます。
検証が遅くなり申し訳ありませんでした。
サーバIPアドレス/cgi-bin/namazu.cgi?idxname=インデックス名&query=キーワード
で検索したらうまくできました。htmlにhiddenで指定した場合もOKでした。
ご教授ありがとうございました。
しかし検索結果はOKなのですが、aaaインデックスを検索しても結果はOKなのですが
ヘッダーの部分がallのもので表示されてしまいます。
(現在602 の文書がインデックス化され5,499 個のキーワード)
検索結果ページから再検索するとあるはずのページでも検索できません。
(allインデックス及びaaaインデックス両方とも。インデックスネームがうまく指定されない為?)
namazurcのTemplate部分をコメントアウトするとインストール時?の古いインデックスが
表示されてしまいます。
複数インデックスがある時のTemplate指定はどのように行っているのでしょうか?

288:nobodyさん
05/03/31 00:35:45
>>287
Templateが選択される順序は説明書にあるとおり
URLリンク(www.namazu.org)
再検索をする際にWebブラウザで表示ページのソースを調べて
どのNMZ.headが読み込まれているか確かめてはどうですか。

289:nobodyさん
05/11/11 14:19:22 lZiu1JMN
会社で鯰使うらしいので、オフィとか見てみました。
日本語全文検索ってほぼGoogleでカバーできてるのでは?
Winではあまり普及していないらしいし、導入に面倒がありそうだし
今、敢えてNamazuで検索を作るうまみってなんですか?

290:nobodyさん
05/11/11 20:34:38
んーどうだろう

291:nobodyさん
05/11/12 23:40:29
Googleはイントラネット内も検索できるようになってんですかそうですか

292:nobodyさん
05/11/13 06:11:00
>>289
イントラの情報を検索できること
検索結果画面をカスタマイズできること
カテゴリ検索ができること
文書の最終更新日をファイルスタンプから識別できること

293:nobodyさん
05/11/13 08:31:58
今使うならnamazuじゃなくHyper Estraierにするな. 俺なら.

294:nobodyさん
05/11/13 15:52:29
>>293
そのソフト最近人気らしいけど、Namazuに比べてどの辺が優れてるの

295:nobodyさん
05/11/14 10:06:19
>>291-292
なるほど、イントラ内検索がGoogleにはないうまみっぽいですね。
だんだん鯰の位置づけがおぼろげながらわかってきました。
どうもありがとうございます。

296:nobodyさん
05/11/14 12:47:16
Namazuだったら正規表現も使えるんじゃない?
あれは便利だお。

297:nobodyさん
05/11/14 16:16:53
正規表現はすばらしい

298:nobodyさん
05/11/16 14:03:06
(i)←こういうやつ?<性器表現

299:nobodyさん
05/11/17 13:26:17
   〃∩ ∧_∧
   ⊂⌒(  ・ω・)  はいはいわろすわろす
     `ヽ_っ⌒/⌒c
        ⌒ ⌒

300:nobodyさん
05/11/18 11:32:18 ngwfG4IK
namazuのなんかのバージョンで、検索指定した文が
ハイライトされて、(そのページの上のほうからのテキストだけでなく)
検索された部分が表示されるというやるがあるらしいよ

と先輩に言われたのですが、どこにありますか?
あるいはカスタマイズで処理するもんなのですか?
教えてください。

301:nobodyさん
05/11/19 03:18:32
>>300
EmphasisTags じゃなくて?

302:nobodyさん
05/11/21 10:11:48 T4fDN5+G
>>301
ありがとうございます、調べてみます。(`・ω・´)ゝ

303:nobodyさん
05/11/21 10:27:34 T4fDN5+G
やってみましたが、どうも指示されたものと違うようです。

たとえば文中にキーワードがヒットしても、プレビューで表示されるのは
そのページの文頭から指定文字数分ですよね?
それを、キーワードの該当部分前後をプレビューに表示させたい
という話でした。

304:nobodyさん
05/11/25 10:08:55
>>303です。
指示者がEstraierと混同していた可能性大です。
自己解決しました。どうもありがとうございました。

305:nobodyさん
05/12/14 20:47:34 CwjBoKRv
Namazu はPerlだけでしょうか?
できればPHPでサイト内検索ができるスクリプトをご存知でしたら教えてください。


306:nobodyさん
05/12/15 02:53:07
>>305
ネタっすか
っ[google]

307:nobodyさん
05/12/15 05:07:22
>>305
Namazu自体はPerlじゃないし。

308:nobodyさん
05/12/16 05:48:32 +W2Wi6VX
な、なんだとーこのこのー

309:nobodyさん
05/12/16 11:56:00
Namazuと言えばみみずんの2ちゃんねる過去ログ全文検索システムだな。
って思ったら>>30に書いてあった・・・

310:nobodyさん
06/01/16 09:59:58 rhuM8+qJ
現在phpから動的にページを生成して出力しているのですが、
このPHPから出来上がるページをnamazuで検索したいと思っています。
どのような手法がありますでしょうか?

311:nobodyさん
06/01/16 11:43:50
その動的に出力してるやつを静的なHTMLとして書き出す。

312:nobodyさん
06/01/16 13:00:54 rhuM8+qJ
動的なページを静的HTMLとして書き出してインデックス化するような処理をnamazuの方で出来ますか?
それとも、やはりこちら側であらかじめ静的ページを作っておいて、それをインデックス化するしかないでしょうか?
なんとかコマンド一発で出来ませんかね?

313:nobodyさん
06/01/16 17:28:20
wget -> namazu
っていうシェルスクリプト書けば一発でしょ。


314:nobodyさん
06/01/16 20:36:24
Namazuはファイルのインデキシングを行うのみ。
動的なページをインデックスするには
スレリンク(unix板:116番)

315:312
06/01/16 20:44:28
>>311さん
>>313さん
>>314さん

親切にありがとうございます。
よくわかりました。とりあえずwgetの方法を試してみようと思います。

316:nobodyさん
06/01/16 22:22:45
wget!

317:nobodyさん
06/01/30 18:45:25
キタ━━(゚∀゚)━━!!!!

318:nobodyさん
06/01/30 21:42:38
2006-01-29: Namazu 2.0.15 を公開

ISO-8859-* に関する文書の間違いを訂正
RedHat ソフトウェア namazu.spec の不必要なパッチは削除
File::MMagic 1.25 を同梱
MeCab の正式対応
mknmz に -b 及び --use-mecab オプションを追加
mknmz および namazu に --norc オプションを追加
mknmz に --decode-base64 オプションを追加
新しいフィルタ(Gnumeric, Koffice, Mainman/Pipermail, Zip, Visio)を追加
mknmzrc に MECAB, DENY_DDN を追加
ファイル名がDDN である時にスキップ。
日付フィールドによるソート機能の追加
nmzcat, nmzegrep コマンドの追加
フィルタの Windows 対応
(msword.pl, excel.pl, powerpoint.pl, postscript.pl, 等...)
OLE コントロールフィルタ更新
QUERY_STRING の区切りに';' 使用可能
Perl版テストプログラム(pltests) を追加
各種バグフィックス

319:nobodyさん
06/01/31 08:21:04
1年9カ月ぶりなのね

320:nobodyさん
06/04/02 12:56:16 6BlopTUr
URLリンク(www.namazu.org)
は、MacのSafariで見れないのは、なんか理由があるのかな?

321:nobodyさん
06/04/02 13:02:03
>>320
URLリンク(www.namazu.org) ならOK
Content-Locationヘッダをうまく扱えてないみたい。
他所ではちゃんとリダイレクトされるんだけど、namazu.orgではNG。なんでだろう?

322:nobodyさん
06/04/07 19:28:41
Namazuをローカルサーバーに組み込みたいのですが
何のファイルをサーバーに送れば良いのか教えてください。

323:nobodyさん
06/05/16 22:05:32 A+ClptH/
>>322
URLリンク(www.namazu.org)


324:nobodyさん
06/07/04 21:14:27 t84Vuxwj
>305
PHPでnamazu検索???

こんなの??
URLリンク(www.c-boxs.net)

325:nobodyさん
06/09/07 22:19:16 n616cZBc
AN HTTPDとnamazuでLAN内のファイルサーバ全文検索システムを構築しました。
この勢いでローカルにある2ちゃん専ブラのdatファイルもインデックス化したいんですけど
良い文書フィルタはありませんか?

326:nobodyさん
06/09/07 22:22:28
>>325
自分で作ったほうが出来がいいぞ

327:nobodyさん
06/09/08 09:21:57
>>325
っていうか2ちゃんにどっぷりハマってるような
人間のクズは氏んだほうがいいぞ。

専ブラ+dat保存なんて、何をたくらんでいるのやら・・・おー、こわ。

328:nobodyさん
06/09/08 14:34:10
にくちゃんねる2号だろ

329:325
06/09/08 20:52:20
>>327
単なるナレッジ・マネジメント・システムの構築を目指してるだけですよ。
「おーこわ」って・・・なにを勘繰ってんですか

330:nobodyさん
06/09/29 14:11:41 MXN7wOzE
namazuがN-gram対応

331:nobodyさん
06/09/29 21:56:15
>>330
しないよ

332:(^-^) ◆MONSOON/qo
06/10/08 05:28:42 aDf/+h/t
インディックス作成時に読み込む文字種を正規表現で指定できますか?
記号は除外するとかです

333:(^-^) ◆MONSOON/qo
06/10/08 05:39:20 aDf/+h/t
自己解決しました

334:nobodyさん
06/10/10 01:41:58
>>333
スレリンク(unix板:195-197番)

マルチで「自己解決」とは笑わせてくれるな

335:nobodyさん
06/10/13 09:24:55
こいつの検索判定明らかにおかしい。
何でもそうなのだが、部分一致ができない。

ファッキントッシュは、バカの使うOS

を検索するとする

「ファッキン」で検索すると一致なし
「ファッキントッシュ バカ」 で検索しても一致せず
「ファッキントッシュはバカの使うOS」でやらないと一致しない。

まるでMSNの検索エンジンだ
あれとまったく同じ

336:nobodyさん
06/10/13 15:19:49
ファッキン!

337:nobodyさん
06/10/13 20:45:51
>>335
HyperEstraier いれろよ。こっちの方が簡単だよ。
検索漏れもないし。

338:nobodyさん
06/10/14 00:11:41
>>335
「ホントかよ」とおもったんで、試してみたけど、ヒットするよ。
プレーンテキストで「ファッキントッシュは、バカの使うOS」と書いて
最後に改行して保存。

> まるでMSNの検索エンジンだ

というが同エンジンと思われる「Windowsデスクトップサーチ」でも問題なくヒットした。
Hyper Estraierでももちろんヒット。

>>335の環境がおかしいんじゃないのか?

339:nobody
06/10/25 22:26:22 J6B8Hktu
Windows ,PHP5に対応したPHPのNamazuモジュールを使いたいのですが、
どうやってモジュールをインストールするのか良く分かりません。
よろしければ、手順を教えていただけないでしょうか?


340:nobodyさん
06/11/20 17:03:35
>>339 PHPライセンスとGPLライセンスが衝突するので
自分でモジュールをコンパイルするしかないです。

www.mail-archive.com/namazu-users-ja@namazu.org/msg00374.html

341:nobodyさん
07/02/08 12:03:48 Mb2H3yQx
保守

342:nobodyさん
07/03/22 22:02:22
Namazu用のWEBクローラはないの?
あと、インデクサや検索エンジンの分散処理ってどうやるのですか?
どっちもHyperEstraierでは標準で付属してるよね

343:nobodyさん
07/03/22 23:21:03
ない

344:nobodyさん
07/03/22 23:25:45
じゃメタ検索は?
Namazuサーバを複数稼働させといてクライアントで検索結果をマージできるシステムとか
ないの?

345:nobodyさん
07/03/23 00:11:38
検索結果をマージして使っている例もあるようだ
URLリンク(www.hpcss.is.ritsumei.ac.jp)

346:nobodyさん
07/05/11 16:16:19
windows版のnamazuでmknmzでイントラネット内の共有ディスクの
インデックスを作ると、終了できてないと思われるwordやexcelの
プロセスがガンガンできるんですけど解決方法はありますか?

347:nobodyさん
07/05/11 23:54:36
xdoc2txt.exe を使え

348:nobodyさん
07/08/22 06:00:29 XEGA28iC
インデクスの中から登録キーワードの一覧を取得したいのですが
ファイルを開くことすらままなりませぬ(Cの知識皆無・・・
PerlかRubyからアクセスする方法を探してるんだけど
説明のあるページなどご存知の方いませんか?

349:nobodyさん
07/08/22 21:34:30
>>348
www.namazu.org/doc/nmz.html.ja#w
に書いてあるとおり単なるテキストファイルに
1行に1単語で書かれているだけ


350:348
07/08/23 00:04:33
>>349
このページは見ていませんでした。(トップページからリンクされてない?)
片っ端からファイルを見ていって、
開くことができたファイルの内容をチェックしていたんですが見落としてました。
ありがとうございました!

351:nobodyさん
08/02/20 20:07:39 fLDVdokd
100MB強のPDFをインデックス化しようとするとmknmzが動作を停止する。なんでだ。
mknmzrcには200MBまでを検索対象にするよう設定してるんだが。

352:nobodyさん
08/02/21 22:15:05 7VDtsl8S
>>351
メモリじゃん?

353:nobodyさん
08/02/22 01:51:00 CRNkbfG6
メモリか。xpdfは王様プログラミングで作ってあるのか。。


354:nobodyさん
08/03/27 06:31:14

あえてNamazuを使いたいのであれば構わないけど、
良い子は「Hyper Estraier」を使いましょう。

スレリンク(unix板)l50

355:sfOdHWpuZpBZYiqez
08/06/13 21:05:42
v2EQ8I <a href="URLリンク(npiriddqxmjg.com)">npiriddqxmjg</a>, [url=URLリンク(snsxeffarbil.com) [link=URLリンク(pribjbixlijw.com) URLリンク(qczemfzbhofm.com)

356:nobodyさん
08/07/19 19:10:35 Hdkv0asv
検索結果に出てくる数字が1000の区切りでカンマが入るのは止めようがありませんか?
「1000」が「1,000」と表示されないようにしたいのです。

357:nobodyさん
09/07/30 06:41:54
当方、急に鯖管理をする事になった者なのですが、
いきなりよく分からない壁に当たりましたので教えて下さい。
namazu自体よく分かりませんので、手探りでやっています。
色んなサイトを見て見た結果、とりあえずnamazu.cgiを
見てみないと始まらないようなのでftpでダウンロードしてみました。

ところが、namazu.cgiを開いたら文字化けが酷くて読めません。
使ってみたソフトはjeditx あとは、miです。

どうしてこういうことになったのでしょうか。
namazu.cgiが読めないとインデックスの更新もできない
ようなので先に進めない、と思われるのですが、
どなたか読む方法をご教授下さい。


358:nobodyさん
09/07/31 00:09:56
>>357
首を吊るか、辞表を書け。さもなきゃ、人を雇え。


359:357
09/07/31 01:45:58
その「雇っていた人」が降りたので、倅の自分に
無茶振りで回って来ました。なのでショッピングカート
(詳細なcgi部分を除く)とサイトいじりまでくらいしか
分からないです。
namazu.cgi自体はおまけでついて来るものだということは
色んなサイトを見て雰囲気で今日分かりました。

そもそもnamazu自体は、レンタルサーバにインストール
されているべきなのか、自分のpcにインストールされているべきなのか
それも分かりません。とりあえず、コンソ-ルからftpで入って、
フィルタに使うファイルがたくさん有るディレクトリでmknmzをしても
動かなかったので、namazuのインストール自体はサーバではなくて、
本体にすると言うことでしょうか?ネットを調べても
自サーバメインのチュートリアルが多くて困っています。

とりあえずインデックスを更新するだけで良いです。
そもそもいきなり分かる訳が無いので多くは望んでいません。
人名の間違い登録は流石に放置できないので、質問した次第です。

大真面目なので、申し訳ありませんがよろしくお願い致します。



360:nobodyさん
09/08/01 00:19:11
>>359
URLリンク(www.amays.com)

361:nobodyさん
09/08/06 13:05:55
dxfフィルタを導入したかったのですが、ホームページからのリンクが切れてました。
dxf用フィルタはもう配布していないのでしょうか?

362:nobodyさん
10/08/12 12:11:44 XzX6VOe9
1年ぶりに上げてみる

363:nobodyさん
11/12/10 02:14:28.72
さらに1年四ヶ月

364:nobodyさん
11/12/14 21:07:04.55
牛NASにpnamazu入れようとしたけどよくわからん


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch