namazuでサーバーを立てたいat LINUX
namazuでサーバーを立てたい - 暇つぶし2ch350:名無しさん@Emacs
02/07/26 11:24 QxusWSJk
>>349
日記検索

351:login:Penguin
02/09/04 13:04 +A/E5ACP
感謝age

352:login:Penguin
02/09/04 14:15 RLmpKL5P
>>350
DBですれ。


353:login:Penguin
02/09/22 12:59 nEa4cqUa
つか/settei/がIndex表示になってないな。
shスクリプトとか欲しいのに。

354:login:Penguin
02/09/22 13:13 N4s7ITei
2ch.shだと思ってたが名前変更されてたんだな。俺もちょっと探したけど見つけた。
URLリンク(2ken.net)
これだろう。でもわざわざこれを取得しなくてもこのスレに書かれてるのと同じだと思うが。
但し、今はdatディレクトリが見れないからこれでは動作しないと思う。
あと3行目の set | grep LANG は不要だと思う。ここでgrepしてどうする・・

355:名無しさん@Emacs
02/10/03 02:45 tCrncUsf

/usr/lib/mozilla/searchplugin/Googlejapan.src に
ちょっと変えてこんなんを作ってみた。

# Mozilla/2chSearch plugin
<search
name="2ch search"
description="2ch search"
method="GET"
action="URLリンク(2ch.dyn.to)"
queryEncoding="2561"
queryCharset="Shift_JIS"
>

<input name="key" user>
<input name="whence" value="0">
<input name="lr" value="lang_ja">
<input name="dbname" value="all">
<input name="max" value="20">
<input name="sourceid" value="mozilla-search">

<interpret
charset = "Shift_JIS"
resultEncoding = "2561"
resultListStart="<!--a-->"
resultListEnd="<!--z-->"
resultItemStart="<!--m-->"
resultItemEnd="<!--n-->"
>
</search>



356:login:Penguin
02/11/01 10:53 SkScjhB+
インデックスから日本語を排除したいと思っています。

検索対象は日本語のテキストファイル(含む LaTeX ソース、メール、ニュース)なのですが、
検索後として日本語を指定することがほとんどありません。
そこでインデックスを作る際に日本語は省いてしまいたいと思っています。
mknmzrc はどのように設定するといいのでしょうか?

現在は kakasi, chasen 共に使用できるようになっています。

あと、メールやニュースの Message-ID, In-Reply-To, References: フィールド以下の
文字列に対しては、メッセージ ID そのままの状態でインデックスに含めたいのですが、
可能でしょうか?

つまり、検索文字列としてメッセージIDを指定したいことがあるということです。

357:356
02/11/01 11:31 SkScjhB+
nkf ~/Mail/ML/IETF/1 | chasen -j -F '%?U/%m/ / ' | jless

で望む結果が得られ多っぽいです。
chasen のマニュアルによると

         %?U/STR1/STR2/

っての 『if unknown word, STR1, otherwise, STR2』 ってことなのですが、
UNKNOWN ってのは辞書に無いってことですよね?
てことは chasen の辞書に英単語が載っていたらだめなんだな。

358:356
02/11/01 11:32 SkScjhB+
nkf ってデフォルトで BASE64 のデコードしてくれるんですね。
メールの Subject: の日本語(BASE64エンコードされている) が、
デコードされててちょっと感動した。

359:独自フィルタを作りたい
02/11/02 12:11 0CRm6865
Namazu文書フィルタの作成方法
~ Namazu 2.0 用 ~
URLリンク(www.namazu.org)

ほかに参考になるサイトはありますでしょうか?

360:独自フィルタを作りたい
02/11/02 12:19 0CRm6865
特にフィールド検索に重点をおきたいと思っています。

実験結果のファイルがあって、それには実験の条件が書き込まれているので、
Word や Excel 文書の「文書のプロパティ」みたいな扱いができればと。

使用している OS は Debian GNU/Linux 3.0 (woody) です。

いくつかのフィルタを読んでみたところ、フィルタの側ではとにかく可能な限り、
フィールドの情報を抽出して返しているように思います。
フィールド名などもフィルタのほうで勝手にいくらでも作ることができるみたいです。

どのフィールドをインデックスに採用するかというのは、
フィルタから返された情報を見て mknmz が決定するのでしょうか?

361:独自フィルタを作りたい
02/11/02 12:25 0CRm6865
つまり、"+subject:linux" みたいな検索式の subject の部分に何を使えるかは、
誰がどうやっていつ指定しているか、ってことなんですが。

362:独自フィルタを作りたい
02/11/02 12:35 0CRm6865
REMAIN_HEADER vs SEARCH_FIELD
URLリンク(www.namazu.org)

全文検索 Namazu 講座
URLリンク(www.rfs.jp)

$REMAIN_HEADER
   RFC 822 Header などのうち本文として検索出来るものを指定
$SEARCH_FIELD
   フィールド検索(「+subject: 検索語」のような形式)に使える項目を指定する
$META_TAGS
   検索対象にするMETAタグを指定
%FIELD_ALIASES
   メール見出名の置換ルール

フィールド検索に関係しそうな mknmzrc の変数というと、これくらいでしょうか?
どのフィルタがどの設定項目を見ているのか、これからフィルタを読んでみます。

363:独自フィルタを作りたい
02/11/02 12:45 0CRm6865
フィルタ読んでみました。

$REMAIN_HEADER → mailnews.pl が見ている
$META_TAGS → html.pl が見ている

$SEARCH_FIELD と %FIELD_ALIASES は mknmz 本体だけが見ている?
(まぁ conf.pl でデフォルト値を設定しているのは別として)

うむ~ NMZ.field.* 出力している部分をよんでみまつ・・・

364:独自フィルタを作りたい
02/11/02 15:33 0CRm6865
1)フィルタからフィールドのデータが連想配列で返ってくる。

2)%FIELD_ALIASES を使ってフィールド名を変換
  %FIELD_ALIASES は
  キー = フィルタから返ってくるフィールド名
  値 = インデックスに登録するときのフィールド名

3)フィールド名が SEARCH_FIELD にあるものは NMZ.field.<フィールド名> に出力
  META_TAGS を使うようオプションで指定されていたときは
  SEARCH_FIELD だけでなく META_TAGS にあるものも対象。

ってことか・・・・ちょっと気持ち悪いのは、なぜか mailnews.pl では
メールヘッダの Subject: の内容を 'title' フィールドとして返しておいて、
mknmz 本体でわざわざ 'title' -> 'subject' への別名置き換えをやってるところ。

だったらはじめから mailnews.pl で $fields->{'subject'} = $line とかすればいいのに。

365:独自フィルタを作りたい
02/11/02 15:35 0CRm6865
今朝になって突発的に独自フィルタ作りたくなって、
my とか local ってなに?
perl の名前空間ってどうなってんの?
@ とか % とか \ とか $ とかなに?
ってとこからはじめたんで、ちゃんとソース読めてないかもしれない・・・

366:login:Penguin
02/11/03 02:13 RjWYQ8zV
Windows の Outlook の *.msg ファイルがあるんですが、
これのフォーマット分かる方おられませんか?
フィルタかいてみようかとおもったんですが、
MH 形式とはちょっと違うみたいです。
いらないバイナリデータがあちこちにちりばめられていて。
確かにテキスト部分は一部読めるんですが。

367:login:Penguin
02/11/03 02:26 RjWYQ8zV
これを使えば何とかなりそうな気がしてきました。

Converter for Microsoft Outlook 2000 (TM) .msg files
URLリンク(www.brodo.de)

Matijs van Zuijlen has written a Perl scriptwhich does convert Microsoft Outlook .msg files to mbox format.
He found out that the file format is OLE-compatible.
This script uses many Perl modules to extract the information,
but you should be able to find all Perl Modules either in your favourite Linux distribution, or at CPAN.

You can find his program (License: GPL), as well as documentation,
at URLリンク(www.xs4all.nl) .

368:login:Penguin
02/12/04 15:44 t/qSISBU
まるちゃんage

369:1
02/12/04 16:27 fPwE/y/H
【まさかの】ひろゆきブチキレ【降臨】

とうとうキレさせてしまった過疎板の住人達。
あの一言さえなければこんなことにはならなかったのに。。。
目の前で忽然と消えていくスレ達。
一つのスレに集中(むしろ、おいやられていく)住民達。
ひろゆきVS住民
無論、俺は面白半分w

問題の発言
スレリンク(bobby板:119番)

問題のスレ
スレリンク(bobby板)

370:IP記録実験
03/01/08 22:18 6H9Rg9t/
IP記録実験
スレリンク(accuse板)

1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。

27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?

38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27
鋭いです。

73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。

371:login:Penguin
03/01/09 00:44 kgNvzzS1
>>47
HDDがいままでより早くいっぱいになってひろゆきと夜勤さんが困る

372:login:Penguin
03/01/09 01:02 janFKrXY
>>308
削除屋さんはボランティア(略

373:login:Penguin
03/01/09 01:20 janFKrXY
∋oノハヽo∈
  ( ´ァョ) <のんのん♪

374:login:Penguin
03/01/09 01:30 janFKrXY
犯罪者はIP提出してとっとと警察へ連れて行って欲しいけど
荒らしは減らないような気がするんですが、、
そこんとこどうでしょうか?

>ひろゆきさん

375:IP記録実験
03/01/09 01:49 5oZ7DmI3
IP記録実験
スレリンク(accuse板)

1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。

27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?

38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27
鋭いです。

73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。

376:login:Penguin
03/01/09 01:54 YXdOQOf5
ひろゆきのレイプ予告したらIP晒されちゃうかな?

377:login:Penguin
03/01/09 02:52 P/uNaKwW
>>102
なんで?

378:login:Penguin
03/01/09 03:39 ispmrJFO
>>98
それいいな。

379:山崎渉
03/01/15 11:31 +BGYmUVc
(^^)

380:login:Penguin
03/02/04 04:14 A2vZpuZL
pc2サーバになってからログが取得できませんが

381:login:Penguin
03/02/25 00:22 U9eQXo48
とりあえず、保守age

382:山崎渉
03/04/17 12:22 KRn99/cy
(^^)

383:山崎渉
03/04/20 06:03 X64WTq1+
   ∧_∧
  (  ^^ )< ぬるぽ(^^)

384:login:Penguin
03/06/24 13:30 /blIyPUB
|  | ∧
|_|Д゚) こっそり保守
|文|⊂)
| ̄|∧|

385:login:Penguin
03/06/27 13:30 brxZWl/z
|  | ∧
|_|Д゚) こっそり保守
|文|⊂)
| ̄|∧|

386:クンクン(壱式♂)
03/06/28 00:59 FiVI/bTz
ageないと。。。

ククーン。。。

387:login:Penguin
03/06/28 12:36 RFFFPkS8
|  | ∧
|_|Д゚) ageないと保守できないと思っているなんて・・・。
|文|⊂)
| ̄|∧|


388:クンクン(壱式♂)
03/06/30 01:25 3f5V9M5o
>>387
お腹減らないのかしら・・・?
そうか! ヌイグルミの猫ちゃんなのかしら。。。

クククのクーン。。。

389:山崎 渉
03/07/15 11:24 2JhhXBQM

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄

390:ぼるじょあ ◆yBEncckFOU
03/08/02 05:41 GfRe8vK7
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎―――◎                      山崎渉&ぼるじょあ

391:クンクン(ヲヤジGAL係)
03/08/08 02:04 rRKGqcxq
懐かしいスレだわ。。。

ククーン。。。 ククーン ...

392:山崎 渉
03/08/15 22:59 dil3w4kp
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン

393:login:Penguin
03/09/30 00:00 x7TSgVmK
画面綺麗だし、パフォーマンスもいいし、
なんか無性に感動した。
応援&保守sage



394:login:Penguin
03/10/30 23:25 S/3RcQGM
保守sage

395:login:Penguin
03/10/31 10:56 wXPO98R9
てすと

396:login:Penguin
04/03/17 08:12 YU7c9ND+
ぬるぽ

397:login:Penguin
04/06/04 22:18 kp0vHpoH
【2ch】みみずん検索が資金不足でピンチ! みなさんからの寄付募集中
スレリンク(newsplus板)
【金食い虫】みみずん検索閉鎖か?HDD障害が原因で
スレリンク(news板)


398:login:Penguin
04/08/19 20:42 KTnAw7tQ
なまず

399:login:Penguin
05/05/20 09:19:33 g7agSS6H
まだ書けるのかな?テスト

400:login:Penguin
05/07/11 01:55:02 ehYz0hjB
>>19
おいおい、三流大学とはいえ、医学部は偏差値だけはそれなりだぞ。

401:login:Penguin
05/07/14 05:15:51 TFsXQ32L
 

402:lute.kyoto-pc.ac.jp
05/07/14 10:11:22 8kA6nqIz
てすと

403:login:Penguin
06/10/11 18:29:45 sKmclboc
更新さててるから
アゲ
URLリンク(members.at.infoseek.co.jp)

404:login:Penguin
06/10/11 19:53:37 SErWYtxI
>>403
されてないからさげ

405:login:Penguin
06/10/11 21:49:21 uK3oW7bv
namazuって、昔よく使かってたけど、
今は、どうなったの?

406:login:Penguin
06/10/21 02:29:46 MJXjqX1B
Hyper Estraier にお株を奪われて終了

407:login:Penguin
06/10/21 15:09:46 yEvMSMbh
>>406
Hyper EstraierってPerl動作版とかあるの?
レンタルサーバで使えないんじゃちょっとなぁ。

目玉のP2P並列処理もAPIだけ公開されてるけど
実運用するには敷居が高い。高すぎる。

あとResultページのカスタマイズとかできないし。
エンジン自体はNamazuよりずっといいと思うんだけどなぁ

408:406
06/10/21 17:42:30 MJXjqX1B
確かに Namazu における pnamazu みたいなのはないな。
QDBM とべったりだから、Pure Perl で実装するのは難しそうだね。

>あとResultページのカスタマイズとかできないし。

あー、確かに標準添付の estseek.cgi はいまいちね…
API は提供するから各自でフロントエンド書けってのが作者のスタンスなんだろうな。

409:login:Penguin
07/01/09 23:59:29 CgfAmGyf
Namazu
上げとこう

410:login:Penguin
08/02/06 21:31:47 tz+SPYsr
Namazu
一年に一回位は上げとこう

411:login:Penguin
08/08/24 22:42:04 tRt9Wm+3
今日で、北京オリンピックは終了か、 Beijing 2008.
次は、またロンドンで逢おう。

412:login:Penguin
08/11/27 21:35:45 fRUK7EAQ
なまず テスト OK

413:login:Penguin
09/05/09 08:54:35 csyAdtn/
NAMAZU namazu Test OK

414:login:Penguin
09/09/27 18:15:02 59PL+I+s
なまずがバージョンアップされてるね。

Namazu 2.0.20 リリース
URLリンク(www.namazu.org)


415:名無しさん@ディストリいっぱい
09/12/07 04:12:12 W7AG3aXs
>>1です。おはようございます。
みなさんの協力のおかげで9年経った今でもまだ2検ネットは健在です。
本当に感謝してます。ありがとうございます。

416:login:Penguin
10/04/23 21:18:39 KPkTwpyw
なまず あげ。

417:login:Penguin
11/04/25 23:07:38.53 ukfhULhC
放射 あげ

418:名無しさん@ディストリいっぱい
11/10/26 13:23:28.97 yudhLKNi
10年経った。。。。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch