01/06/08 09:29
ちょっと時間がないのでヒントだけ。
mknmz が更新されたファイルかどうかを判別する材料は、
ファイルサイズと timestamp です。生成した html を dat と同じ
timestamp にするのが良いのではないかと。
251:247
01/06/08 18:33
このスクリプトの処理を終えたファイルは
片っ端から新しく書き出されてしまいます。
>dat と同じtimestamp
ファイル書き出しの時に元のファイルのtimestampを使って・・・。
(シェルは勉強し始めたばかりだった)
252:Anonymous
01/06/09 18:49
かなり遅めな事後報告ですが
「くだらねえ質問はここに書き込め! 1st」はレスの数が1000近くなったので
新しく「くだらねえ質問はここに書き込め! 2nd」を立てた
>>171の通り、>>1の書き込みフォームで使わせていただきました。
>>1名無しさん@ディストリいっぱい殿に感謝じゃ
253:login:ディストリいっぱい
01/06/10 15:27
>>252さん
使っていただきありがとうございます。
使ってもらわないと作った意味がないですからどんどん使っちゃってください。
よろしくお願いします。ぺこぺこ
254:login:ディストリいっぱい
01/06/12 00:46
サイトに名前つけてみました。MOGURA。
もぐらのようにガサガサーとほじってほじって探し出すってことで。
255:247
01/06/15 00:18
>>251
touch -r にて解決。
if~then~fiでの作業合理化。
シェルは便利だ。
256:login:ディストリいっぱい
01/06/15 14:50
みんなにありがとうの気持ちをこめてプレゼントを用意させていただきました。
URLリンク(2ch.dyn.to)
商品を提供してくれたコレガダイレクトショップ様に大感謝です。
しかし・・応募してくれる人はいるのか・・・汗
当選確率が高いかも。笑
257:login:ディストリいっぱい
01/06/15 14:54
あ・・「コレガダイレクトショッピング」でした・・
さっき間違いを指摘されたばっかりなのにまた間違えちゃったや。笑
258:login:ディストリいっぱい
01/06/17 20:27
過去ログの検索結果のところに広告の文字が表示されるのを回避するために過去ログ分の
ファイルは6行目から31行目まで削除する処理を追加。
でも2重3重に行削除を行うのを防止するために毎回kakoディレクトリを削除
することになるのでサーバーの負担倍増。笑
testディレクトリも削除しないとゴミファイルが大量に溜まるようなので毎回削除。
これにより一層サーバーの負担増加。笑
作業不合理化・・・
#!/bin/sh
LANG=ja
export LANG
set | grep LANG
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/httpd/html
export wgetdir=$workdir/wgetlinux
export datdir=$wgetdir/cocoa.2ch.net/linux/dat
export namazudir=/usr/share/namazu/index/linux
export makenmz=$wgetdir/cocoa.2ch.net
rm -rf $wgetdir/cocoa.2ch.net/test
mkdir -p $wgetdir/cocoa.2ch.net/test
cd $wgetdir
wget -m -I linux/dat URLリンク(cocoa.2ch.net)
for i in `ls $datdir | egrep "[0-9]+\.dat"`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html '<>' "" $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
rm -rf $datdir
rm -rf $makenmz/linux/kako
wget -m -I linux/kako URLリンク(cocoa.2ch.net)
for k in `ls cocoa.2ch.net/linux/kako/*/* | egrep [0-9]+\.html`
do n=`echo $k | sed -e 's/\.html//'`
sed '6,31d' $k > $n
mv -f $n $k
done
mkdir -p $namazudir
cd $namazudir
mknmz -a -U $makenmz/test $makenmz/linux/kako
259:247
01/06/17 21:02
>>258
作業不合理化・・・これは...(笑
過去ログhtmlの広告部分を見てみると若干の広告行数の違いはあっても
「center」~「/center」タグで囲んでいるようだから
このタグの間をゴッソリ削除出来ると他の板でもそのまま使えそう。
シェル勉強中の身にてスクリプトが直ぐに出てこない。
ずっと解らない可能性も...(爆
260:login:ディストリいっぱい
01/06/18 13:14
>>259さん
「作業不合理化」のようで本当は合理化されてます。
testディレクトリはたまに削除しないと過去ログ倉庫行きになったファイルも
どんどんたまっていくんで結局は毎回削除して生成したほうがいいみたいです。
dat2htmlの処理自体はすぐに終わるんで。オススメ。
あ、その時にdatファイルのタイムスタンプを引き継げるんだったら引き継いだほうが
いいんでしょうけど。
過去ログのほうも元々タイムスタンプを取得することができてないため毎回更新されて
いるので削除したとしても同じことだし。
広告は過去ログファイルの6行目から31行目に入ります。これは各板共通のようなので
wget -m -I linux/kako URLリンク(cocoa.2ch.net)
のあとに
for k in `ls cocoa.2ch.net/linux/kako/*/* | egrep [0-9]+\.html`
do n=`echo $k | sed -e 's/\.html//'`
sed '6,31d' $k > $n
mv -f $n $k
done
を書き加えればどの板でも対応できそうです。
ただし >>258の rm -rf $datdir は余分な処理のようでした。
これは削除したほうがいいと思います。
これで合理化(どうにか)なるかな?なんちて。←極寒
261:247
01/06/19 00:47
>>260さんの
>testディレクトリはたまに削除しないと・・・
なるほど、この辺りも考えないとダメかぁ。
友人から検索対象にしてくれって言われてるPINK板は
過去ログ広告は、6-16行目までになってました。(検索対象になるかは未定)
egrep -nで広告部分の行数を拾っての処理も考えたけど
誤作動すると変な所を削除してしまうので、
結局、各板の広告行数を予めチェックして>>260さんのスクリプトで
処理するのが良さそうですね。
262:
01/06/20 07:36
263:login:Penguin
01/07/05 23:08
age
264:login:Penguin
01/07/10 03:07
ほげ
265:247
01/07/12 15:33
「MOGURA」検索、大分パワーアップしましたね。
そろそろ、検索サイトを公開しようかと思っていたけど
バッティングしないように収録した板がカブってます・・・。
とりあえずは早めに公開して後から考えるか。
266:login:Penguin
01/07/12 16:38
公開がとても楽しみです。応援しています。
267:247
01/07/13 00:19
>>266 どうもです。
「MOGURA」検索後(result)のレイアウトがいいですね。
この辺り参考にさせて頂きたいです。
後は見やすい配色を考えて..。(寝
268:login:ディストリいっぱい
01/07/13 01:49
>>265さん
ああぁ。すみません。
前に聞かれた時には全然増やす気はなかったんですけどこのあいだ大先生の検索が
使えなくなってたのでそのフォローのつもりで一気に検索対象板を増やしちゃいました。
>>267さん
ということはー。僕のところは見にくい配色だと言うことですね・・・へ・へこーん。
269:このスレ最初っから見てたけど
01/07/13 17:50
ひさしぶりに見たけどすげぇ
改めて使うと便利便利
運営ガンバレよ
270:247
01/07/13 17:54
>僕のところは見にくい配色
いや~ちゃいます...今テストしているページの配色が悪くて見づらいので
どうにかしようと考え中なところなんです。
wgetを使っていて、ファイル数が多い所からのダウンロードをすると
急に動作が遅くなり、通常ならメモリ消費がコンスタントに1MBぐらいのところ
20~30MBも食いバグかな?と思わせる動きをしますね。
バージョン1.6、1.7を試した限りでは同じ症状。
この時1つ1つのファイルサイズが小さくても関係ないので
メモリ回りのバグなのか・・・。
同じ相手サーバー内でもファイル数の少ないディレクトリなら全然問題無いので
通常利用には問題無いのだろうけど。
271:login:Penguin
01/07/16 15:42
age
272:login:Penguin
01/07/21 22:57
namazu ベースの2チャンネル検索サイト
試験的に公開します。
まだ、不都合があるかもしれないので気が付いたら指摘してください。
URLリンク(www12.tok2.com)
273:Anonymous
01/07/21 23:22
ふむ、とくとくか・・・
色分けによりわかりやすいサイトだね。
274:login:Penguin
01/07/21 23:30
心配だった配色が不評じゃなくてよかった...。
ページ構成がまだ、決まってないけどシンプルに
する予定です。
275:login:Penguin
01/07/21 23:34
綺麗でみやすい配色だと思います
276:login:Penguin
01/07/22 00:08
>>275 どうもです。
使いやすいサイト目指してやってみます。
277:login:Penguin
01/07/22 02:48
>>272
むぅ。うちの Netscape だと何も表示されん…
278:login:Penguin
01/07/22 02:54
>>272
俺もリロードすると何も表示されなくなる。。。
279:login:Penguin
01/07/22 02:55
>>272
UNIX?
280:272
01/07/22 08:04
>>279 UNIXです。
文字コードかも。今日夕方に取り組みます。
281:login:Penguin
01/07/22 09:04
文字コードだね。
<!--meta http-equiv="Content-Type" content="text/html; charset=euc"-->
コメントアウトしてちゃあ駄目だろ。。。
282:login:Penguin
01/07/22 11:43
>>272
100点を取る必要はないけど(ほとんど不可能)
htmlの間違い探しに使ってください。
URLリンク(validator.w3.org)
283:272
01/07/22 17:14
フリーのCGIが使える所は、どうも文字コードの問題が出ると何処かで見たので
今朝、x-sjis>euc>コメントアウトしてチェックしてみたけど・・・。
これから色々やってみます。
284:272
01/07/22 17:15
こんな書込みを上げてしまった。
285:272
01/07/22 19:54
ひとまず、使えるようになりました。
テスト公開中検索
URLリンク(www12.tok2.com)
入り口のindex.htmlは、定期的にPerlで書き出しているのと
フリーサーバーの場合はそれを、#includeして広告を入れている?ので
手探りで文字コード指定しました。(笑
フレームタグのサイズ指定が、ブラウザによって解釈が違ったりするので
これもまた、手探り状態で色々設定してどうにかまともになりました。
286:272
01/07/22 23:54
文字化け対策でこんなのもあったけど
URLリンク(www.yahoo.co.jp)
今のところ問題無さそうなのでひとまず現状維持。
287:272
01/07/26 00:16
以前にタイムスタンプ引継ぎの事を書いたので
>>258 にタイムスタンプの引継ぎを入れると・・
wget -m -I linux/dat URLリンク(cocoa.2ch.net)
for i in `ls $datdir | egrep "[0-9]+\.dat"`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html '<>' "" $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
touch -r $datdir/$i $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j #タイムスタンプ引継ぎ
done
ディレクトリごと削除した時に効果あるかわかりませんがタイムスタンプが
以前にインデックスを作成した時と同じならmknmz 時にスキップしてくれるかも
しれません。
288:hanajan:特科連χ
01/07/30 17:59
DNSの故障だったのか。。。
一昨日に検索窓を付けたモノでして。。。
URLリンク(www.hanajan.com)
289:login:ディストリいっぱい
01/07/31 01:56
あははー。検索窓ついてるー。使ってくれてる人がいるとは思わなかったです。ありがとうございます。
しかし URLリンク(www.dyn.to) って結構ポロポロサバ落ちするんだなあ。金取ってるくせして。
こんなんだったら最初から無料の URLリンク(dyndns.org) にすればよかったなあ。
金取ってる分だけ安定してるかと思ったのに。今さら変えるの大変だしなあ。
はあああ。ストレスたまるー。
あまりにもストレスがたまるので他のところに変えてやるーって思って探してたら
最近新しいのできたんですね。→ URLリンク(ddo.jp) ←誰か使ったことある人います?
試しに取ってみたけどどうだろう。1ヶ月全くオチないようだったらこのまま使ってもいいかなあ。
URLリンク(2ch.ddo.jp)
でも年額6000円は高い。。。
290:hanajan:特科連χ
01/07/31 03:46
ウットコ・・・
月額6000円程度でし・・・
URLリンク(www.hanajan.com)
メインのWWWです。
そろそろ、フレーム付けっかな~。。。
291:login:ディストリいっぱい
01/07/31 12:12
うおっ。すごいもの見つけました。
昨日書いた URLリンク(ddo.jp) のサイトをうろうろチェックしてたら
URLリンク(ddo.jp)
↑「Linux@2ch掲示板」にリンクが張ってました!!!笑
そうだったんですね。僕たちの仲間だったんですね。水臭いではないですか。ddo.jpさん。
だったら推奨します。→ URLリンク(ddo.jp) ←素晴らしい
今のところ問題ないし、無料バージョンもあるし、ドメイン覚えやすいし。いいと思います。
Linux板住人価格として6000円を3000円にまけてくれるともっと素晴らしい。←ホメた目的はこれ
話変わりますけどこの板、最近書き込みがすごく減ってないですか? (@@;)
292:Anonymous
01/07/31 13:08
事後報告だが、検索窓を張った
URLリンク(www.geocities.co.jp)
ジャンルは2ちゃんねる@UNIX板/Linux板(藁
293:login:ディストリいっぱい
01/07/31 13:34
あのにまうすさんも使ってくれてるんですね。ありがとうございます。
アップローダーがあったんでエロエロ画像がアップされているのを期待して
見てみたんですが全然違いました。。がっかりです。。。
アップローダ=エロエロ画像 と考える僕が間違ってますかー?(ーー;)
294:login:Penguin
01/08/10 14:53
2.0.6 リリース age
295:login:Penguin
01/08/10 20:54
>>293
心配するな俺もそう思ったよ。
296:login:Penguin
01/08/10 21:43
v2.0.6 早速導入しました。
●毎日更新
URLリンク(203.141.142.84)
297:Anonymous ◆True/7Po
01/08/15 16:11
>>296
事後報告、くだしつスレにリンク張りました
URLリンク(cocoa.2ch.net)
298:296
01/08/15 22:08
リンク有難う御座います。
高レスポンスで返せるようチューニングに励みます。
299:login:Penguin
01/08/23 00:36
300:◆EMrmvKLI
01/08/23 05:31
(・∀・) 300!!
301:login:Penguin
01/08/25 18:10
久しぶりに2ch検索使ってみたらこの板で作ったなんてことは全部すっとんで
広告貼って小遣い稼ぎですか?
302:2ch検索の"管理"人かも
01/08/25 18:26
>>301
1円もお金なんか入ってきませんけど?
広告=管理人にお金が入る
と思ってはいけません。
広告を貼るから値引きをしてくれ、ということで広告が入ってます。
ちなみに前のコレガの時も広告を貼るから懸賞の商品を提供してくれ、
との条件でバナーを貼ってました。僕には何も入ってきてません。
URLリンク(2ch.dyn.to)
↑これね。
これらは、みんなに作ってもらったからみんなに対するお礼のつもりでやってます。
僕が金儲けして喜ぶような人間だと思ったんですかー?
303:余弦者
01/08/25 23:01
>>1と他の検索サイト管理人殿
現在閉鎖中の板は2度と戻ってこないかもしれないので、
現在のログを保存してあとで公開してもらえると非常に助かるのだが
304:2ch検索の管理人かも
01/08/25 23:57
>>303
ああぁ、、、僕はログは捨ててます、、、
でもって「かなりしばらくお待ちください。」のところは
今となってはdatファイルを取ることもできません、、、
ですから僕には何もできません、、、すみません、、、
みみずんさんのところがログをちゃんと保存してるからなんとか
してくれるかもしんないです。
↓ココです。
URLリンク(mimizun.mine.nu)
305:2ch検索の管理人かも
01/08/26 00:02
ちなみに他のところはと申しますと
URLリンク(203.141.142.84)
URLリンク(64.124.197.202)
こういう状態です、、、ああああ。
「壊滅状態」という言葉がぴったりの今日です、、、
306:login:Penguin
01/08/26 00:24
この手の検索システム構築には、マシンパワー&高速回線が必要だと思います。
データ取り込み時に圧迫される回線
インデックス書き出し時に消費されるCPUパワー
データ保存で必要なHDD領域
常時稼動によって掛かる電気代&騒音。
手間も掛かり決して楽なボランティアでは無いと思いますので
がんばってください。>各検索の管?理人
307:hanajan@零号 ◆abdWn..Q
01/08/26 21:05 lwjpwoTg
スレが見つかって、それを表示する場合、
"レス全部読む"ではなく"最新レス100"
のURLが指定できんかのぅ。。。
308:ディストリがいっぱい
01/08/26 21:38 iEaIYVak
>>306
お・応援ありがとうございます。が・頑張ります。
>>307
それ、いいですねえ。
ja.po かなんかをいじればできそうな気もします。
でも僕は ja.po というものがどこにあるのか知りません。ですから永遠に対応はできません。
さ・さようなら。。。ごめんなさい。。。
309:検索エンジン全開 "管理"人
01/08/27 21:30 06X1b0s6
人為的ミスでブレーカーを落としデータがクラッシュ、しばらく停止してましたがやっと復旧。
UPSは管理人の個人的財政難から今後も採用予定無し...
>>307 可能だと思いますが、検索キーワードでHitしたスレッド内を
ブラウザ検索で長い書込みの中から絞込みを想定しています。
現状でどうにか使って頂きたいと思います。
310:login:Penguin
01/09/05 01:36 9/sH.COA
このスレの連中はシェルスクリプトもロクに書けねーのかよ。
export var=valは許すとして、
for i in `ls $datdir|egrep "[0-9]\.dat"`なんて痛すぎ。
ディレクトリ空だったら死ぬだろ。
昔の話題ではあるが。
311:ディストリいっぱい
01/09/29 23:47 gAs/Bj.E
今日発売のあちゃら11月号の91ページに2ちゃんねる検索が掲載されてます。
暇な人は見てみて下さい。
今月の初めにライターさんから「掲載させてもらいます。」という話は聞いていたけど
どういうふうに取り上げるのかは聞いてなかったんで、どんなふうに載ってるんだろ?
と思って立ち読みしようと思って本屋に行ったら結構大きく紹介されてたので
買ってしました。永久保存版。。。
今度の目標は日経Linuxに掲載されることです。頑張ります。
312:login:Penguin
01/09/29 23:49 gAs/Bj.E
おめでとう。
313:login:Penguin
01/09/29 23:50 gAs/Bj.E
名スレの予感
314:ディストリいっぱい
01/09/29 23:51 gAs/Bj.E
ちなみに >>312 >>313 は自分で書き込みました。
誰も反応してくれないとさみしいんで。。。
315:login:Penguin
01/09/30 00:06 s8gsnkrQ
>>311
技術的なことはちんぷんかんぷんですが、
本当におめでとうございます。
316:ディストリいっぱい
01/09/30 00:14 2uU1/ecY
あ、本当に祝ってもらえた。うれしいです。ありがとうございます。
317:検索エンジン全開
01/10/05 00:07 OyHoZWHc
>>311 おめでとうございます。
まだ見てないから見てみよ。
318:うろんぐ
01/11/30 17:52 0UsyWI7S
Web ページで検索できるようにする前に、emacs から検索してみようと思って namazu.el を入れてみた。
でも、M-x namazu で検索文字列を入れてみると
Wrong type argument: stringp, nil
と表示されて検索できなかった。
コマンドラインから namazu で検索するとちゃんと検索できてるのになぁ。
何が悪いのでしょうか? emacs-lisp を勉強していない俺が悪いのでしょうか?
319:みみずん
01/11/30 20:32 8qsrn8Pr
最近、管理がめんどい。。。
過去ログ取得スクリプトにバグはあるしディスク障害もあるわで。
URLリンク(mimizun.mine.nu)
320:うろんぐ
01/12/01 08:49 U6ZUKGfm
>318
自己レス。
~/.namazurc でのデフォルトのインデックス指定が
Index ほげ
だったのが敗因でした。
INDEX ほげ
じゃないとだめなんですね。いや、 namazu はどっちでもいいんですが、 namazu.el で .namazurc を解析するところが INDEX しか見てくれないんですよね。それだけでした。スマソ。
321:login:Penguin
01/12/07 17:50 QGAXIRf/
Namazuはクズ検索エンジン
322:login:Penguin
01/12/07 20:45 +fpiRIvO
>321
何がおすすめ?
合計 20GB 程度の Web サイト内の全文検索をしたい。
323:login:Penguin
01/12/08 11:15 AvJQP9li
Mitake Search なりなんなりの売り物つかうのはどうよ。
>>321 は例の私怨厨か... まだいたんだな。
324:login:Penguin
01/12/13 11:18 ugaubRPB
>323
なるほど、と思っていろいろ商用のものを見てみたんですが、
きづいたこと。
Namazu をつかってて、致命的に困っていることが、無い。
というわけで Namazu を使いつづけることにしました。
Debian 用パッケージも用意されていることだし。
325:あのみみずん@ N72ch-01p57.ppp11.odn.ad.jp
01/12/16 09:46 dwyzpYXY
Namazu いいよね。便利だし、早いし。
まぁ検索精度は低く感じるけど無料だから文句ないし。
つか、index作るのに時間かかるね・・・メモリも食うし。
326:login:Penguin
01/12/18 00:35 xpsT3a/l
申し訳程度にrenice +20…
327:login:Penguin
02/01/26 16:50 7jfLsj9S
kakasi の辞書、mysql とかのデータベースに格納できるとありがたいんだけどなぁ。
328:login:Penguin
02/01/26 21:15 7jfLsj9S
DocuWorks 文書用のフィルタってどなたかしりませんか?
昨年10月ごろの ML で Fuji Xerox の開発部でも UNIX 用のフィルタの必要性は認識しているって言う話がでてたらしいんですが、その後まったく話を聞きません。
329:login:Penguin
02/01/26 21:30 UX7CiKAA
広報にたずねてみては?
個人でも邪険にされることはありませんよ
330:login:Penguin
02/01/26 22:35 cUpXDNAM
>>327
それ、ずーっと昔に試したことがあるけど、かなり遅いよ(汗
postgresでもmysqlでもoracleでもsybaseでも。
データ型のチェックとか格納のためのソートツリーの作成とか、
kakasiを使うにあたって不要な部分がボトルネックになる模様。
331:login:Penguin
02/01/27 00:49 rUkqU65a
>330
それって、kakasi のソースをいじってってことですか?
それとも毎回データベースから単語ファイルを作成して辞書ファイルを作成して…ってことですか?
もしかして前者の場合だったらパッチがあるとか…。
332:login:Penguin
02/01/27 05:51 rUkqU65a
>320
なんか久しぶりにこのスレ読んで、おもだしたので、BTS にあげときました。
333:login:Penguin
02/02/09 12:34 QOH+2g3Z
1からよんで感動した
334:login:Penguin
02/03/08 14:10 OE9ed93x
wvWare v0.5.x.tar.gz どっかに無いかな。
v0.6以降からおいらのスキルじゃWord文章をうまく検索できんようになってしまった。
335:login:Penguin
02/03/08 17:16 2E3LNJfK
>>334
CVS から最新のフィルタだけ持ってきたらどうですかね。
URLリンク(cvs.namazu.org)
336:login:Penguin
02/03/24 00:16 ECEITlSW
age
337:login:Penguin
02/05/01 23:10 vlGgka0t
338:名無しさん@ディストリいっぱい
02/05/04 01:19 sJTSZgK7
なんと早くも1周年。おめでたいです。
よく頑張りました。(自画自賛)
339:login:Penguin
02/05/04 01:28 rn7+GErz
>>338
コテハンはひさしぶりだな。
掲示板すごいことになってるね。
340:名無しさん@ディストリいっぱい
02/05/04 01:39 sJTSZgK7
すごいことになってるっていうから荒らしでも来てるのかと思って見に行っちゃいました、、
あの質問づくしのことですか?もう慣れました。メールでも「削除して下さい。」とか
「書き込みができないんですけどなんでですか?」ってメールがしょっちゅうきます。
わかる範囲で答えてますけど。
1年ってあっという間だなあとしみじみとした気分です。
341:login:Penguin
02/05/04 07:09 vsdupTed
アーリーらっぱ飲みしながら>1から読破。
知らずに使っていた2ch検索にこんな歴史があったなんてね。
342:あれれ?
02/05/04 07:12 vsdupTed
空欄にしたら「名前:login:Penguin」になってしまいました。
詐称ではありませぬ。
343:login:Penguin
02/05/04 08:44 rn7+GErz
>>342
それは「名無し」だ。
URLリンク(freezone.kakiko.com)
344:login:Penguin
02/07/19 22:06 SLbxrvZg
UNIX板から来ました。
"namazu.cgi"を間違って消してしまいました。今から使おうと思ったのに
redhat7.3のrpmから入れたやつです。ちなみにバージョンは
namazu-2.0.10-4
namazu-cgi-2.0.10-4
だれかアップしていただけると助かります。お願いします。
345:hh
02/07/19 23:15 6iM25OVn
URLリンク(freehome.kakiko.com)
346:login:Penguin
02/07/19 23:23 W906XYYp
これ?
URLリンク(2ken.net)
347:login:Penguin
02/07/20 01:05 RZHWY+0C
>>344
いったん rpm 消して入れ直せば?
348:login:Penguin
02/07/20 22:52 JNErfAQQ
大抵はつかえるだろう。
349:login:Penguin
02/07/26 10:44 5MbssHQh
にちゃんねる検索はいいと思うんだけど、
自宅でサーバー立ててる人とかってさー
namazu何に使ってんの?
なんかおもしろい使い方ってある?
350:名無しさん@Emacs
02/07/26 11:24 QxusWSJk
>>349
日記検索
351:login:Penguin
02/09/04 13:04 +A/E5ACP
感謝age
352:login:Penguin
02/09/04 14:15 RLmpKL5P
>>350
DBですれ。
353:login:Penguin
02/09/22 12:59 nEa4cqUa
つか/settei/がIndex表示になってないな。
shスクリプトとか欲しいのに。
354:login:Penguin
02/09/22 13:13 N4s7ITei
2ch.shだと思ってたが名前変更されてたんだな。俺もちょっと探したけど見つけた。
URLリンク(2ken.net)
これだろう。でもわざわざこれを取得しなくてもこのスレに書かれてるのと同じだと思うが。
但し、今はdatディレクトリが見れないからこれでは動作しないと思う。
あと3行目の set | grep LANG は不要だと思う。ここでgrepしてどうする・・
355:名無しさん@Emacs
02/10/03 02:45 tCrncUsf
/usr/lib/mozilla/searchplugin/Googlejapan.src に
ちょっと変えてこんなんを作ってみた。
# Mozilla/2chSearch plugin
<search
name="2ch search"
description="2ch search"
method="GET"
action="URLリンク(2ch.dyn.to)"
queryEncoding="2561"
queryCharset="Shift_JIS"
>
<input name="key" user>
<input name="whence" value="0">
<input name="lr" value="lang_ja">
<input name="dbname" value="all">
<input name="max" value="20">
<input name="sourceid" value="mozilla-search">
<interpret
charset = "Shift_JIS"
resultEncoding = "2561"
resultListStart="<!--a-->"
resultListEnd="<!--z-->"
resultItemStart="<!--m-->"
resultItemEnd="<!--n-->"
>
</search>
356:login:Penguin
02/11/01 10:53 SkScjhB+
インデックスから日本語を排除したいと思っています。
検索対象は日本語のテキストファイル(含む LaTeX ソース、メール、ニュース)なのですが、
検索後として日本語を指定することがほとんどありません。
そこでインデックスを作る際に日本語は省いてしまいたいと思っています。
mknmzrc はどのように設定するといいのでしょうか?
現在は kakasi, chasen 共に使用できるようになっています。
あと、メールやニュースの Message-ID, In-Reply-To, References: フィールド以下の
文字列に対しては、メッセージ ID そのままの状態でインデックスに含めたいのですが、
可能でしょうか?
つまり、検索文字列としてメッセージIDを指定したいことがあるということです。
357:356
02/11/01 11:31 SkScjhB+
nkf ~/Mail/ML/IETF/1 | chasen -j -F '%?U/%m/ / ' | jless
で望む結果が得られ多っぽいです。
chasen のマニュアルによると
%?U/STR1/STR2/
っての 『if unknown word, STR1, otherwise, STR2』 ってことなのですが、
UNKNOWN ってのは辞書に無いってことですよね?
てことは chasen の辞書に英単語が載っていたらだめなんだな。
358:356
02/11/01 11:32 SkScjhB+
nkf ってデフォルトで BASE64 のデコードしてくれるんですね。
メールの Subject: の日本語(BASE64エンコードされている) が、
デコードされててちょっと感動した。
359:独自フィルタを作りたい
02/11/02 12:11 0CRm6865
Namazu文書フィルタの作成方法
~ Namazu 2.0 用 ~
URLリンク(www.namazu.org)
ほかに参考になるサイトはありますでしょうか?
360:独自フィルタを作りたい
02/11/02 12:19 0CRm6865
特にフィールド検索に重点をおきたいと思っています。
実験結果のファイルがあって、それには実験の条件が書き込まれているので、
Word や Excel 文書の「文書のプロパティ」みたいな扱いができればと。
使用している OS は Debian GNU/Linux 3.0 (woody) です。
いくつかのフィルタを読んでみたところ、フィルタの側ではとにかく可能な限り、
フィールドの情報を抽出して返しているように思います。
フィールド名などもフィルタのほうで勝手にいくらでも作ることができるみたいです。
どのフィールドをインデックスに採用するかというのは、
フィルタから返された情報を見て mknmz が決定するのでしょうか?
361:独自フィルタを作りたい
02/11/02 12:25 0CRm6865
つまり、"+subject:linux" みたいな検索式の subject の部分に何を使えるかは、
誰がどうやっていつ指定しているか、ってことなんですが。
362:独自フィルタを作りたい
02/11/02 12:35 0CRm6865
REMAIN_HEADER vs SEARCH_FIELD
URLリンク(www.namazu.org)
全文検索 Namazu 講座
URLリンク(www.rfs.jp)
$REMAIN_HEADER
RFC 822 Header などのうち本文として検索出来るものを指定
$SEARCH_FIELD
フィールド検索(「+subject: 検索語」のような形式)に使える項目を指定する
$META_TAGS
検索対象にするMETAタグを指定
%FIELD_ALIASES
メール見出名の置換ルール
フィールド検索に関係しそうな mknmzrc の変数というと、これくらいでしょうか?
どのフィルタがどの設定項目を見ているのか、これからフィルタを読んでみます。
363:独自フィルタを作りたい
02/11/02 12:45 0CRm6865
フィルタ読んでみました。
$REMAIN_HEADER → mailnews.pl が見ている
$META_TAGS → html.pl が見ている
$SEARCH_FIELD と %FIELD_ALIASES は mknmz 本体だけが見ている?
(まぁ conf.pl でデフォルト値を設定しているのは別として)
うむ~ NMZ.field.* 出力している部分をよんでみまつ・・・
364:独自フィルタを作りたい
02/11/02 15:33 0CRm6865
1)フィルタからフィールドのデータが連想配列で返ってくる。
2)%FIELD_ALIASES を使ってフィールド名を変換
%FIELD_ALIASES は
キー = フィルタから返ってくるフィールド名
値 = インデックスに登録するときのフィールド名
3)フィールド名が SEARCH_FIELD にあるものは NMZ.field.<フィールド名> に出力
META_TAGS を使うようオプションで指定されていたときは
SEARCH_FIELD だけでなく META_TAGS にあるものも対象。
ってことか・・・・ちょっと気持ち悪いのは、なぜか mailnews.pl では
メールヘッダの Subject: の内容を 'title' フィールドとして返しておいて、
mknmz 本体でわざわざ 'title' -> 'subject' への別名置き換えをやってるところ。
だったらはじめから mailnews.pl で $fields->{'subject'} = $line とかすればいいのに。
365:独自フィルタを作りたい
02/11/02 15:35 0CRm6865
今朝になって突発的に独自フィルタ作りたくなって、
my とか local ってなに?
perl の名前空間ってどうなってんの?
@ とか % とか \ とか $ とかなに?
ってとこからはじめたんで、ちゃんとソース読めてないかもしれない・・・
366:login:Penguin
02/11/03 02:13 RjWYQ8zV
Windows の Outlook の *.msg ファイルがあるんですが、
これのフォーマット分かる方おられませんか?
フィルタかいてみようかとおもったんですが、
MH 形式とはちょっと違うみたいです。
いらないバイナリデータがあちこちにちりばめられていて。
確かにテキスト部分は一部読めるんですが。
367:login:Penguin
02/11/03 02:26 RjWYQ8zV
これを使えば何とかなりそうな気がしてきました。
Converter for Microsoft Outlook 2000 (TM) .msg files
URLリンク(www.brodo.de)
Matijs van Zuijlen has written a Perl scriptwhich does convert Microsoft Outlook .msg files to mbox format.
He found out that the file format is OLE-compatible.
This script uses many Perl modules to extract the information,
but you should be able to find all Perl Modules either in your favourite Linux distribution, or at CPAN.
You can find his program (License: GPL), as well as documentation,
at URLリンク(www.xs4all.nl) .
368:login:Penguin
02/12/04 15:44 t/qSISBU
まるちゃんage
369:1
02/12/04 16:27 fPwE/y/H
【まさかの】ひろゆきブチキレ【降臨】
とうとうキレさせてしまった過疎板の住人達。
あの一言さえなければこんなことにはならなかったのに。。。
目の前で忽然と消えていくスレ達。
一つのスレに集中(むしろ、おいやられていく)住民達。
ひろゆきVS住民
無論、俺は面白半分w
問題の発言
スレリンク(bobby板:119番)
問題のスレ
スレリンク(bobby板)
370:IP記録実験
03/01/08 22:18 6H9Rg9t/
IP記録実験
スレリンク(accuse板)
1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。
27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?
38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27
鋭いです。
73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。
371:login:Penguin
03/01/09 00:44 kgNvzzS1
>>47
HDDがいままでより早くいっぱいになってひろゆきと夜勤さんが困る
372:login:Penguin
03/01/09 01:02 janFKrXY
>>308
削除屋さんはボランティア(略
373:login:Penguin
03/01/09 01:20 janFKrXY
∋oノハヽo∈
( ´ァョ) <のんのん♪
374:login:Penguin
03/01/09 01:30 janFKrXY
犯罪者はIP提出してとっとと警察へ連れて行って欲しいけど
荒らしは減らないような気がするんですが、、
そこんとこどうでしょうか?
>ひろゆきさん
375:IP記録実験
03/01/09 01:49 5oZ7DmI3
IP記録実験
スレリンク(accuse板)
1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。
27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?
38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27
鋭いです。
73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。
376:login:Penguin
03/01/09 01:54 YXdOQOf5
ひろゆきのレイプ予告したらIP晒されちゃうかな?
377:login:Penguin
03/01/09 02:52 P/uNaKwW
>>102
なんで?
378:login:Penguin
03/01/09 03:39 ispmrJFO
>>98
それいいな。
379:山崎渉
03/01/15 11:31 +BGYmUVc
(^^)
380:login:Penguin
03/02/04 04:14 A2vZpuZL
pc2サーバになってからログが取得できませんが
381:login:Penguin
03/02/25 00:22 U9eQXo48
とりあえず、保守age
382:山崎渉
03/04/17 12:22 KRn99/cy
(^^)
383:山崎渉
03/04/20 06:03 X64WTq1+
∧_∧
( ^^ )< ぬるぽ(^^)
384:login:Penguin
03/06/24 13:30 /blIyPUB
| | ∧
|_|Д゚) こっそり保守
|文|⊂)
| ̄|∧|
385:login:Penguin
03/06/27 13:30 brxZWl/z
| | ∧
|_|Д゚) こっそり保守
|文|⊂)
| ̄|∧|
386:クンクン(壱式♂)
03/06/28 00:59 FiVI/bTz
ageないと。。。
ククーン。。。
387:login:Penguin
03/06/28 12:36 RFFFPkS8
| | ∧
|_|Д゚) ageないと保守できないと思っているなんて・・・。
|文|⊂)
| ̄|∧|
388:クンクン(壱式♂)
03/06/30 01:25 3f5V9M5o
>>387
お腹減らないのかしら・・・?
そうか! ヌイグルミの猫ちゃんなのかしら。。。
クククのクーン。。。
389:山崎 渉
03/07/15 11:24 2JhhXBQM
__∧_∧_
|( ^^ )| <寝るぽ(^^)
|\⌒⌒⌒\
\ |⌒⌒⌒~| 山崎渉
~ ̄ ̄ ̄ ̄
390:ぼるじょあ ◆yBEncckFOU
03/08/02 05:41 GfRe8vK7
∧_∧ ∧_∧
ピュ.ー ( ・3・) ( ^^ ) <これからも僕たちを応援して下さいね(^^)。
=〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
= ◎―――◎ 山崎渉&ぼるじょあ
391:クンクン(ヲヤジGAL係)
03/08/08 02:04 rRKGqcxq
懐かしいスレだわ。。。
ククーン。。。 ククーン ...
392:山崎 渉
03/08/15 22:59 dil3w4kp
(⌒V⌒)
│ ^ ^ │<これからも僕を応援して下さいね(^^)。
⊂| |つ
(_)(_) 山崎パン
393:login:Penguin
03/09/30 00:00 x7TSgVmK
画面綺麗だし、パフォーマンスもいいし、
なんか無性に感動した。
応援&保守sage
394:login:Penguin
03/10/30 23:25 S/3RcQGM
保守sage
395:login:Penguin
03/10/31 10:56 wXPO98R9
てすと
396:login:Penguin
04/03/17 08:12 YU7c9ND+
ぬるぽ
397:login:Penguin
04/06/04 22:18 kp0vHpoH
【2ch】みみずん検索が資金不足でピンチ! みなさんからの寄付募集中
スレリンク(newsplus板)
【金食い虫】みみずん検索閉鎖か?HDD障害が原因で
スレリンク(news板)
398:login:Penguin
04/08/19 20:42 KTnAw7tQ
なまず
399:login:Penguin
05/05/20 09:19:33 g7agSS6H
まだ書けるのかな?テスト
400:login:Penguin
05/07/11 01:55:02 ehYz0hjB
>>19
おいおい、三流大学とはいえ、医学部は偏差値だけはそれなりだぞ。
401:login:Penguin
05/07/14 05:15:51 TFsXQ32L
402:lute.kyoto-pc.ac.jp
05/07/14 10:11:22 8kA6nqIz
てすと
403:login:Penguin
06/10/11 18:29:45 sKmclboc
更新さててるから
アゲ
URLリンク(members.at.infoseek.co.jp)
404:login:Penguin
06/10/11 19:53:37 SErWYtxI
>>403
されてないからさげ
405:login:Penguin
06/10/11 21:49:21 uK3oW7bv
namazuって、昔よく使かってたけど、
今は、どうなったの?
406:login:Penguin
06/10/21 02:29:46 MJXjqX1B
Hyper Estraier にお株を奪われて終了
407:login:Penguin
06/10/21 15:09:46 yEvMSMbh
>>406
Hyper EstraierってPerl動作版とかあるの?
レンタルサーバで使えないんじゃちょっとなぁ。
目玉のP2P並列処理もAPIだけ公開されてるけど
実運用するには敷居が高い。高すぎる。
あとResultページのカスタマイズとかできないし。
エンジン自体はNamazuよりずっといいと思うんだけどなぁ
408:406
06/10/21 17:42:30 MJXjqX1B
確かに Namazu における pnamazu みたいなのはないな。
QDBM とべったりだから、Pure Perl で実装するのは難しそうだね。
>あとResultページのカスタマイズとかできないし。
あー、確かに標準添付の estseek.cgi はいまいちね…
API は提供するから各自でフロントエンド書けってのが作者のスタンスなんだろうな。
409:login:Penguin
07/01/09 23:59:29 CgfAmGyf
Namazu
上げとこう
410:login:Penguin
08/02/06 21:31:47 tz+SPYsr
Namazu
一年に一回位は上げとこう
411:login:Penguin
08/08/24 22:42:04 tRt9Wm+3
今日で、北京オリンピックは終了か、 Beijing 2008.
次は、またロンドンで逢おう。
412:login:Penguin
08/11/27 21:35:45 fRUK7EAQ
なまず テスト OK
413:login:Penguin
09/05/09 08:54:35 csyAdtn/
NAMAZU namazu Test OK
414:login:Penguin
09/09/27 18:15:02 59PL+I+s
なまずがバージョンアップされてるね。
Namazu 2.0.20 リリース
URLリンク(www.namazu.org)
415:名無しさん@ディストリいっぱい
09/12/07 04:12:12 W7AG3aXs
>>1です。おはようございます。
みなさんの協力のおかげで9年経った今でもまだ2検ネットは健在です。
本当に感謝してます。ありがとうございます。
416:login:Penguin
10/04/23 21:18:39 KPkTwpyw
なまず あげ。
417:login:Penguin
11/04/25 23:07:38.53 ukfhULhC
放射 あげ
418:名無しさん@ディストリいっぱい
11/10/26 13:23:28.97 yudhLKNi
10年経った。。。。