01/05/18 01:54
Linux板のトップにリンク貼ってもらうってことはできないの?
174:名無しさん@お腹いっぱい。
01/05/18 01:58
馬鹿にして見ていたが結構使えるじゃねぇかage
175:名無しさん@お腹いっぱい。
01/05/18 02:03
>>173
自治スレで要望出すみたいだからさ、
そん時に一緒に出せばいいじゃん
っていうか俺が自治スレの1だった、、、鬱
176:login:Penguin
01/05/18 03:12
>>158
>>156 はクンクンではなくてワシ(♂の原始人)だクワー
で、リンクしたいサイトは以下だクワー
皆で訪問してくれだグワー
URLリンク(www.hanajan.com)
177:名無しさん@ディストリいっぱい
01/05/18 11:28
昼に動作確認のために手動で2ch.shを実行するとどうってことが
ないのに深夜に自動的に実行した時には文字化けするのってなんでだろ?
ただの偶然かなあ。まあいいや。
>>176の師匠さん
クンクンさんではなかったのですね・・すみません。僕には違いが
わからなかったです・・
「河内の物体X屋」も「かわちのぶったいエックスや」と
読んでました。無知ですみません・・
至って普通のサイトですね。ぜひリンクしてください。お願いします。
178:名無しさん@ディストリいっぱい
01/05/18 14:50
会社でテスト用として動作させてるのも文字化けしてる・・
手動で実行すると文字化けしないのに・・なんでだろ・・悩みは深いです・・
まあどうせ毎日いじってるから手動でもたいしたことではないけど。笑
179:名無しさん@ディストリいっぱい
01/05/18 14:51
見てるとちゃんとやるけど見てないといいかげんな仕事をするのかなあ。
もしかしてパソコンって持ち主に似る???
180:名無しさん@お腹いっぱい。
01/05/18 18:06
見てないと... っつーことは、見てないときは cron かなんかでやってる?
ありがちなのが、cron では LANG 環境変数が指定されてなくって
非日本語 mode で動いてるようなケースだな。
181:名無しさん@ディストリいっぱい
01/05/18 23:05
>>180さん
ありがとうございます。早速2ch.shのほうに
LANG=ja
export LANG
set | grep LANG
を書き足してやってみます。
これさえ動作してくれればこれも完成だー
URLリンク(2ch.dyn.to)
182:login:Penguin
01/05/19 00:19
>>177
クワー
(訳:文字化けは発生していない・・・クワ)
クワー
(訳:でも、>>181 のような対策は必要だ・・・クワ)
183:login:Penguin
01/05/19 15:01
クワー
(訳:作った人・・・ありがとうだ)
パタパタ
(訳:それだけ。。。)
184:名無しさん@ディストリいっぱい
01/05/19 23:25
>>183の師匠さん
作ったのはこの板のみんなです。「みんな」の中にはもちろん師匠さんも入ってますよ。
こちらこそありがとうございます。
185:login:Penguin
01/05/20 00:17
そう書いてあったが・・・
ワシは「クワー」としか言っとらんじょ。。。
クワー
(ま・・・イイか)
186:login:Penguin
01/05/20 00:21
まぁ、2チャンネルのLinux板はマンセーだ・・・クワ
まぁ、ワシスレが無くなれば尚イイのだが・・・クワワー
187:名無しさん@ディストリいっぱい
01/05/20 00:30
昼頃からずっとルーターの動きが止まりません。アクセスがかなり増えてます。
なんでだ?誰かがどこか変なところにリンク張ったのかなあ?と不思議に思ってたら
テーブルにもメニューにも「2ch検索」という名前で出てました・・いつのまに・・びっくり・・
URLリンク(www.2ch.net)
URLリンク(www.2ch.net)
↑ここ(ツール類のとこに入ってます)
どうやらもう引けないところまできてしまったようです・・
こうなってしまったら責任持ってやらなきゃダメですね・・
Linux板の恥にならないように頑張ります。
188:名無しさん@お腹いっぱい。
01/05/20 07:04
URLリンク(www.digitalfactory.co.jp)
189:Anonymous
01/05/22 13:56
>>1 ガムバッテルナー
検索できる項目が増えたようだね
190:名無しさん@ディストリいっぱい
01/05/22 14:34
>>189さん
応援ありがとうございます!!!頑張ります!!
項目増やしたんですけどすごく時間がかかります。
板によってはindex作るのに12時間ぐらいかかります。
だからほとんど一日中CPUがフル稼働してます。そのうちに壊れるのは間違いないと思います・・
ちなみにlinux板は30分ぐらいで終わります。笑
なんでみんながあまりこういうサイトをやりたがらないかがわかりました。ふぅ。
191:名無しさん@お腹いっぱい。
01/05/22 21:10
ヨタヨタとでもとにかく走り始めるところが如何にもLinux。
良い感じですよ。ありがとう>1
192:名無しさん@お腹いっぱい。
01/05/22 21:12
ヨタヨタは>1だからだろ
linuxで括るな
193:名無しさん@お腹いっぱい。
01/05/23 00:54
>>27です。
この心配が、本当に心配になるところまで来るとは、たいしたものです。
とりあえず、元気に動いているようなので良かった。
194:名無しさん@お腹いっぱい。
01/05/23 09:19
>>192
確かにおまえはヨタヨタとでも走りそうにねぇな(藁
195:名無しさん@お腹いっぱい。
01/05/23 13:12
IBMマンセーってことで、
URLリンク(www.zdnet.co.jp)
にサーバを立ててみては、どうよ?>>1
どのくらい性能がでるかも見てみたいし
196:名無しさん@ディストリいっぱい
01/05/23 14:03
ホメられたりけなされたり、人生って楽しい♪
>>195さん
あ、そこをサブスペースとして確保しておくのもいいかもしんないですね。
使えるのかなあ。後でちょっと見てみます。辞書を片手に。笑
197:名無しさん@お腹いっぱい。
01/05/23 14:10
ん。これは大先生の検索とは何が違うの?
URLリンク(64.124.197.202)
198:名無しさん@ディストリいっぱい
01/05/23 14:44
>>197さん
違いはいっぱいあります。一番大きな違いは「Linux板が検索できるか否か」です。笑
199:名無しさん@ディストリいっぱい
01/05/23 14:53
あと違うところは向こうは「大先生」でこっち「よたよた」だってことです。
「よたよた検索」って名前に変えようかなあ。そっちのほうが目立つし。笑
200:名無しさん@お腹いっぱい。
01/05/23 15:09
なんか遅そうだなあ >よたよた検索
201:名無しさん@お腹いっぱい。
01/05/23 16:14
遅そうというよりなんか間違えて検索しそうだよ。「vine」で検索したら「パイン」とか出そう。
202:名無しさん@ディストリいっぱい
01/05/23 16:25
>>200さん
それは「もたもた」です・・・
>>201さん
そこまでは間違えません。「フェラチオ UNIX」が「フェニックス」にはなる可能性は否定できませんけど。
但し「フェラチオ」と「UNIX」を同時に検索する人はいないと思うので問題はないと思ってます。はい。
203:名無しさん@お腹いっぱい。
01/05/23 16:27
>>201
2ちゃんの検索として考えるなら、その処理であっている思われ
204:presto
01/05/25 06:08
司法試験板住民です。
このスレを少し参考にしました。ありがとう。ペコリ
サーバー立てる程でも無いので普通に過去ログ検索付け完成しました。
URLリンク(2ch.server.ne.jp)
205:名無しさん@お腹いっぱい。
01/05/25 09:48
Linux板が他板の参考にされるとは、世も末だな
誉めてんの!一応
206:名無しさん@ディストリいっぱい
01/05/25 15:41
え?freewebでnamazuを稼動させることできるの???
ていうか23日にスレを立ててもう完成したんですか・・はやー
207:名無しさん@お腹いっぱい。
01/05/25 16:28
>>206
PerlのNamazuだと思われ。
208:名無しさん@お腹いっぱい。
01/05/25 17:15
pNamazu
209:名無しさん@お腹いっぱい。
01/05/27 17:11
ここで、立ち上がったnamazuの検索項目に入ってない板を取り入れ
同じように公開を考えてはいるんですけど
いまいち上手く動いてくれないです。
wget+namazu を cronで動かし問題無く動いてますが、
ここで公開されたスクリプトの設置が上手くいってないようです。
どなたか、動かした人レスお願いします。(メールも返事が無かったので)
210:名無しさん@お腹いっぱい。
01/05/27 17:13
>>209
>メールも返事が無かったので
誰に?
211:名無しさん@お腹いっぱい。
01/05/27 17:17
>>210
URLリンク(2ch.dyn.to)
に出ていた「批判・要望はこちらへ」にです。
ひょっとしてこの検索システム担当者じゃないメールなのかな?
(調べてない)
212:名無しさん@お腹いっぱい。
01/05/27 17:18
批判要望じゃないと思われ
213:名無しさん@お腹いっぱい。
01/05/27 17:18
このスレで聞けよ
>>1も居るし
214:名無しさん@お腹いっぱい。
01/05/27 17:23
>>209
どの板?
>>71が書いているように板によって区切り文字が違うので、それ関係だと思われ
そこんとこ、どんな設定にした?
215:209
01/05/27 17:24
とりあえずもう一度見直してみよ。
216:名無しさん@お腹いっぱい。
01/05/27 17:25
namazuがうまく動かないのはWindowsのせいだろう
217:209
01/05/27 17:27
>>71
ここを読み飛ばしていたかも。
いろいろやってみよ。
218:209
01/05/27 17:28
>>216
OS はLinuxです。
219:名無しさん@お腹いっぱい。
01/05/27 17:34
Apache + mod_ruby は DB との連携に難がありましたが、
Ruby/ODBC・Ruby/DBI 等の出現により、徐々に改善の兆しが。
とはいえ似たようなものが乱立しているので、API の標準化は必須かな。
あと、ruby script も十分に速いんで、速度面で PHP にはそうは
劣らないです。
ちなみに、私は2のデザインとプログラムの一体化により、非常に
めんどくさい目にあっているので、>>11 さんのおっしゃることに同感。
sqwebmail の source みたいに、デザインテンプレートにマクロを埋め込む
形にして、source は別 file っていうのがよさげ。
220:209
01/05/27 18:28
>>11さんのようなスクリプトが出来ましたら
是非公開してください。
221:名無しさん@ディストリいっぱい
01/05/28 00:31
あ、ホントだ。メール来てました。ごめんなさい。>>209さん
全然誰からもメールが来ないから見る習慣がついてなかったです。笑
えっと >>11 さんのようなスクリプトというのが
URLリンク(2ch.dyn.to)
↑ここにある拡張子が sh のファイルです。
各板ごとに作ってるのでいっぱいあります。参考にしてください。
もしよくわからないようだったらどこの板か教えてくれたらその板用のを作ってあげます。
で、datファイルをhtmlに変換してくれるのが
URLリンク(2ch.dyn.to)
↑ここにあるdat2htmlです。
とりあえずこの二種類のファイルだけあれば動作はします。
わからないところがあったらこのスレに書き込んでいただければ誰か教えてくれると
思いますし僕もわかる範囲でお教えしますよ。
222:名無しさん@ディストリいっぱい
01/05/28 00:33
URLリンク(2ch.dyn.to)
↑ここにあるdat2html.plです。
の間違いでした。うー
223:名無しさん@ディストリいっぱい
01/05/28 01:06
今メールボックス見たらMAILER-DAEMONからウイルス付きのメールがいっぱい来てる・・ずずーん。
MAILER-DAEMONめ・・身内のくせして裏切りやがったなー。笑
っていうかMAILER-DAEMONからウイルスメールが来るってことは僕が発信してます???
from defalt * to linux@2ch.dyn.to だから僕が発信しているわけじゃないですよね?
でもなんでMAILER-DAEMONからになるんだろ??外部からpostfixを使われてるのかなあ・・ちょっと心配・・・
>From linux Sun May 27 21:01:43 2001
Return-Path: <>
Delivered-To: linux@2ch.dyn.to
Received: from default (xxxx.xxxxx.ne.jp [xxx.xxx.xxx.xx])
by 2ch.dyn.to (Postfix) with SMTP id D0E7946E9A
for <linux@2ch.dyn.to>; Sun, 27 May 2001 21:01:35 +0900 (JST)
MIME-Version: 1.0
Content-Type: multipart/mixed; boundary="--VEHUBSD6BK9YV41ERG1EN8P6FKLM7"
Message-Id: <20010527120135.D0E7946E9A@2ch.dyn.to>
Date: Sun, 27 May 2001 21:01:35 +0900 (JST)
From: MAILER-DAEMON
To: undisclosed-recipients:;
X-UIDL: R:>"!&Q`"!cU6!!5=_"!
224:名無しさん@お腹いっぱい。
01/05/28 01:14
>>223
"MAILER-DAEMON" は詐称と思われ。
xxxx.xxxxx.ne.jp のマシンが感染してるんでしょ。
ブラウザでメールアドレス見ただけで
ウイルス送りつけるようなのもあるしね。↓
URLリンク(www.ipa.go.jp)
225:名無しさん@ディストリいっぱい
01/05/28 01:21
>>224さん
あーよかったー。ちょっとドキドキしてたんですけど安心して寝れます。ふぅ。
ではおやすみなさい。
226:hanajan_特科連X
01/05/28 03:22
う~
(ペンギソのキグルミは質草にした・・・)
一応・・・デンナ
アチコチで宣伝したってるでぇ~~
そのハイブリスでっけどなぁ・・・_ケーッッ
ウットコもぎょうさんもうてまっせえ。。。
なぁ...ソチラも"hogehoge.ne.jp"でんなぁ。。。
ついでにIPもマルダシや・・・アホ_ナ_ヤッチャ
パンツ_マルミエ_ノ_コGAL_ミタイナ_モン_ヤ_ノウ_...
そんでや・・・
そんなメールやったら・・・
そのまま張り付けてもオッケイ・リョーカイでっせ。。。ナマズ_ノ_オニイチャン
227:名無しさん@お腹いっぱい。
01/05/28 07:48
[namazu-devle-ja]に変なメール届いてるよね?
気になって調べたんだけど、元記事はここみたい。
でもなんでnamazuが宛先になってたんだろ?
しかも、1月の投稿を今更・・・
URLリンク(www.makani.to)
228:名無しさん@ディストリいっぱい
01/05/28 10:36
>>226さん
クワー
(宣伝ありがとうございます)
クワー
(ペンギンの着ぐるみっていくらになったんですか?)
ケケケ
(パンツ丸出しのコギャルはうれしいけどウイルスメールはうれしくないよー)
ケケケ
(送信した人は悪意を持って送ってるわけじゃないだろうから伏せました)
ウニャー
(こんな感じでいいんですか???)
229:hanajan_特科連X
01/05/28 11:14
クワ~(語尾を下げる)
(訳:3000円だクワ)
クワ~
(訳:最初のはウレシかったクワ)
クワ~
(訳:相手が学生なら悪意は乏しいだろキャ)
パタパタ
(訳:よくできました)
ウー_ツウコウニン_ノ_シセン_ガ_イタイ_...
230:age
01/05/28 19:19
hogehoge
231:209
01/05/29 00:19
>>1さん+みなさんのおかげで、namazuテスト成功しました。
まだ、細かな所を詰めないといけないけど
何処の板をnamazu検索に取り入れようかなぁ。
使ってないマシンにLinux系を入れて公開しようと思ってるから
まだ、時間掛かりますが。
232:hanajan_特科連X
01/05/29 02:38
まぁ・・・
何時の間にかカテゴリちゅー・・・
あ,,,ちごた・・・
検索できる板増えてるのはeeこっちゃ。。。
233:hanajan_特科連X
01/05/29 04:04
まぁ・・・これでもageとこ
WIN厨房(恥ずかしいなぁ)にエサくれたる。。。ワ
234:209
01/05/29 07:42
カーネル 2.4.5 にするか、2.2.19 にするか・・・。
namazu検索公開マシンには、使ってないPentiumProデュアルマシンにしようと
思ってるけど 2.4.x系のカーネルの方がパフォーマンス良さそうだけど
頻繁にfixさそうだし大変かぁ。
235:名無しさん@お腹いっぱい。
01/05/29 17:27
>>hanajan_特科連X
頭弱そうだが
何も出来ね~人間のクセに能書きは一人前だ
ま、相手にしてもシャーナイか
236:login:Penguin
01/05/29 22:19
2ch.shの最後に
cd $namazudir
gcnmz $namazudir
rm -rf *.BAK
を追加してゴミ削除
237:hanajan_特科連X
01/05/29 22:34
>>235
まぁ・・・
相手したってもエエんやが・・・
自動的にできひんようになる。。。
しやから・・・
言うてることは全くの無駄やと思う。。。
ほんで・・・
人間と違ごて原始人や。。。
238:hanajan_特科連X
01/05/29 22:44
やっぱり・・・
SQLとか(ヲラクルはちゃうやろ)混ざってるんとちゃうか・・・
まぁ・・・
埋め込み型SQLちゅー手ぇもあるけど・・・なぁ。。。
M$星人にヴォロカス書いたけど・・・
基礎の知識とか,,,うー_ホンデヤナァ
IECとかANSIとかロゼッタネットとかの勉強してや。。。
上の方はやってると思うけど・・・
まぁ、無理すんなや。。。
239:hanajan_特科連X
01/05/29 22:46
まぁ・・・
ウェーブソフトウェアつーのんで・・・
Linuxらーがラッキーになるような絵は描けるでぇ。。。
で、実装するんはプログラマつー職種のやっちゃ。。。
240:login:Penguin
01/05/29 22:54
>>231
>>1と重ならないのを。きぼ~ん
無目的なLinux初心者より2ch検索が絶対に建設的
241:hanajan_特科連X
01/05/29 23:02
まぁ・・・
無目的なんは・・・
無目的でも・・・
後から目的になっていたコトもある。。。
要するに・・・
予定調和説や。。。_<<_ヤパン人は殆どがそーやろと思う
そーか・・・
生きることのみを目的とした社畜に甘んじているか・・・や。。。
たぶん・・・そや・・・と思う。。。_<<_アーア
242:231
01/05/29 23:17
>>240
もちろん、同じ板を検索対象としてもしょうがないので
限られたリソースの範囲で検索対象を広げられればと思ってやす。
外から見ると無目的かもしれないけど
自分的にはスキルアップの為の勉強かな。
今はコンパイラー&コンパイルオプションの実性能比較をやっているところで
後はカーネル2.4.x 2.2.x の比較その他・・・。
PGCC ”-O6 -march=pentiumpro”で2.4.xカーネルが通るか知らんけど
人柱になってやってみる予定。
243:hanajan_特科連X
01/05/31 16:33
まぁ・・・
"作成までの道のり"のリンクやけど・・・
"最新100レス"でエエんとちゃいまっか?
244:名無しさん@ディストリいっぱい
01/05/31 16:37
う・・・なんか難しい話になってる・・・逃
やっぱ全部読むには長すぎる状態になってきたので覚えてたら
あとで変更しておきます。忘れてたらそのままです。ごめんなさい。
245:login:Penguin
01/06/03 23:32
ここで作ってたのか。。。
ごくろうさまです。ありがたく使わせてもらってます。
246:login:ディストリいっぱい
01/06/03 23:39
>>245さん
いらっしゃいませー。他の板の人ですね。
みんなのための検索システムなのでじゃんじゃん使ってください。
久しぶりに上がったなあ・・もう上がることはないとあきらめてたのに。笑
247:231
01/06/06 23:54
ここで出ましたシェルスクリプトの
ファイル名を変換する部分に新規ファイル&更新ファイルのみの変換と言った処理を
追加したいのですが、どなたか助言お願いします。
mknmzで実際には更新されてないファイルまでインデックス書き直しをしてしまうので・・。
for i in `ls $データdir | egrep "[0-9]+\.dat"`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html '<>' "" $データdir/$i > $変換先dir/'xxx.2ch.net/test/read.cgi?bbs=xxxx&key='$j
done
248:名無しさん@ディストリいっぱい
01/06/07 18:25
シェルかぁ
249:login:Penguin
01/06/08 02:53
URLリンク(www.yomogi.sakura.ne.jp)
250:login:Penguin
01/06/08 09:29
ちょっと時間がないのでヒントだけ。
mknmz が更新されたファイルかどうかを判別する材料は、
ファイルサイズと timestamp です。生成した html を dat と同じ
timestamp にするのが良いのではないかと。
251:247
01/06/08 18:33
このスクリプトの処理を終えたファイルは
片っ端から新しく書き出されてしまいます。
>dat と同じtimestamp
ファイル書き出しの時に元のファイルのtimestampを使って・・・。
(シェルは勉強し始めたばかりだった)
252:Anonymous
01/06/09 18:49
かなり遅めな事後報告ですが
「くだらねえ質問はここに書き込め! 1st」はレスの数が1000近くなったので
新しく「くだらねえ質問はここに書き込め! 2nd」を立てた
>>171の通り、>>1の書き込みフォームで使わせていただきました。
>>1名無しさん@ディストリいっぱい殿に感謝じゃ
253:login:ディストリいっぱい
01/06/10 15:27
>>252さん
使っていただきありがとうございます。
使ってもらわないと作った意味がないですからどんどん使っちゃってください。
よろしくお願いします。ぺこぺこ
254:login:ディストリいっぱい
01/06/12 00:46
サイトに名前つけてみました。MOGURA。
もぐらのようにガサガサーとほじってほじって探し出すってことで。
255:247
01/06/15 00:18
>>251
touch -r にて解決。
if~then~fiでの作業合理化。
シェルは便利だ。
256:login:ディストリいっぱい
01/06/15 14:50
みんなにありがとうの気持ちをこめてプレゼントを用意させていただきました。
URLリンク(2ch.dyn.to)
商品を提供してくれたコレガダイレクトショップ様に大感謝です。
しかし・・応募してくれる人はいるのか・・・汗
当選確率が高いかも。笑
257:login:ディストリいっぱい
01/06/15 14:54
あ・・「コレガダイレクトショッピング」でした・・
さっき間違いを指摘されたばっかりなのにまた間違えちゃったや。笑
258:login:ディストリいっぱい
01/06/17 20:27
過去ログの検索結果のところに広告の文字が表示されるのを回避するために過去ログ分の
ファイルは6行目から31行目まで削除する処理を追加。
でも2重3重に行削除を行うのを防止するために毎回kakoディレクトリを削除
することになるのでサーバーの負担倍増。笑
testディレクトリも削除しないとゴミファイルが大量に溜まるようなので毎回削除。
これにより一層サーバーの負担増加。笑
作業不合理化・・・
#!/bin/sh
LANG=ja
export LANG
set | grep LANG
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/httpd/html
export wgetdir=$workdir/wgetlinux
export datdir=$wgetdir/cocoa.2ch.net/linux/dat
export namazudir=/usr/share/namazu/index/linux
export makenmz=$wgetdir/cocoa.2ch.net
rm -rf $wgetdir/cocoa.2ch.net/test
mkdir -p $wgetdir/cocoa.2ch.net/test
cd $wgetdir
wget -m -I linux/dat URLリンク(cocoa.2ch.net)
for i in `ls $datdir | egrep "[0-9]+\.dat"`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html '<>' "" $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
rm -rf $datdir
rm -rf $makenmz/linux/kako
wget -m -I linux/kako URLリンク(cocoa.2ch.net)
for k in `ls cocoa.2ch.net/linux/kako/*/* | egrep [0-9]+\.html`
do n=`echo $k | sed -e 's/\.html//'`
sed '6,31d' $k > $n
mv -f $n $k
done
mkdir -p $namazudir
cd $namazudir
mknmz -a -U $makenmz/test $makenmz/linux/kako
259:247
01/06/17 21:02
>>258
作業不合理化・・・これは...(笑
過去ログhtmlの広告部分を見てみると若干の広告行数の違いはあっても
「center」~「/center」タグで囲んでいるようだから
このタグの間をゴッソリ削除出来ると他の板でもそのまま使えそう。
シェル勉強中の身にてスクリプトが直ぐに出てこない。
ずっと解らない可能性も...(爆
260:login:ディストリいっぱい
01/06/18 13:14
>>259さん
「作業不合理化」のようで本当は合理化されてます。
testディレクトリはたまに削除しないと過去ログ倉庫行きになったファイルも
どんどんたまっていくんで結局は毎回削除して生成したほうがいいみたいです。
dat2htmlの処理自体はすぐに終わるんで。オススメ。
あ、その時にdatファイルのタイムスタンプを引き継げるんだったら引き継いだほうが
いいんでしょうけど。
過去ログのほうも元々タイムスタンプを取得することができてないため毎回更新されて
いるので削除したとしても同じことだし。
広告は過去ログファイルの6行目から31行目に入ります。これは各板共通のようなので
wget -m -I linux/kako URLリンク(cocoa.2ch.net)
のあとに
for k in `ls cocoa.2ch.net/linux/kako/*/* | egrep [0-9]+\.html`
do n=`echo $k | sed -e 's/\.html//'`
sed '6,31d' $k > $n
mv -f $n $k
done
を書き加えればどの板でも対応できそうです。
ただし >>258の rm -rf $datdir は余分な処理のようでした。
これは削除したほうがいいと思います。
これで合理化(どうにか)なるかな?なんちて。←極寒
261:247
01/06/19 00:47
>>260さんの
>testディレクトリはたまに削除しないと・・・
なるほど、この辺りも考えないとダメかぁ。
友人から検索対象にしてくれって言われてるPINK板は
過去ログ広告は、6-16行目までになってました。(検索対象になるかは未定)
egrep -nで広告部分の行数を拾っての処理も考えたけど
誤作動すると変な所を削除してしまうので、
結局、各板の広告行数を予めチェックして>>260さんのスクリプトで
処理するのが良さそうですね。
262:
01/06/20 07:36
263:login:Penguin
01/07/05 23:08
age
264:login:Penguin
01/07/10 03:07
ほげ
265:247
01/07/12 15:33
「MOGURA」検索、大分パワーアップしましたね。
そろそろ、検索サイトを公開しようかと思っていたけど
バッティングしないように収録した板がカブってます・・・。
とりあえずは早めに公開して後から考えるか。
266:login:Penguin
01/07/12 16:38
公開がとても楽しみです。応援しています。
267:247
01/07/13 00:19
>>266 どうもです。
「MOGURA」検索後(result)のレイアウトがいいですね。
この辺り参考にさせて頂きたいです。
後は見やすい配色を考えて..。(寝
268:login:ディストリいっぱい
01/07/13 01:49
>>265さん
ああぁ。すみません。
前に聞かれた時には全然増やす気はなかったんですけどこのあいだ大先生の検索が
使えなくなってたのでそのフォローのつもりで一気に検索対象板を増やしちゃいました。
>>267さん
ということはー。僕のところは見にくい配色だと言うことですね・・・へ・へこーん。
269:このスレ最初っから見てたけど
01/07/13 17:50
ひさしぶりに見たけどすげぇ
改めて使うと便利便利
運営ガンバレよ
270:247
01/07/13 17:54
>僕のところは見にくい配色
いや~ちゃいます...今テストしているページの配色が悪くて見づらいので
どうにかしようと考え中なところなんです。
wgetを使っていて、ファイル数が多い所からのダウンロードをすると
急に動作が遅くなり、通常ならメモリ消費がコンスタントに1MBぐらいのところ
20~30MBも食いバグかな?と思わせる動きをしますね。
バージョン1.6、1.7を試した限りでは同じ症状。
この時1つ1つのファイルサイズが小さくても関係ないので
メモリ回りのバグなのか・・・。
同じ相手サーバー内でもファイル数の少ないディレクトリなら全然問題無いので
通常利用には問題無いのだろうけど。
271:login:Penguin
01/07/16 15:42
age
272:login:Penguin
01/07/21 22:57
namazu ベースの2チャンネル検索サイト
試験的に公開します。
まだ、不都合があるかもしれないので気が付いたら指摘してください。
URLリンク(www12.tok2.com)
273:Anonymous
01/07/21 23:22
ふむ、とくとくか・・・
色分けによりわかりやすいサイトだね。
274:login:Penguin
01/07/21 23:30
心配だった配色が不評じゃなくてよかった...。
ページ構成がまだ、決まってないけどシンプルに
する予定です。
275:login:Penguin
01/07/21 23:34
綺麗でみやすい配色だと思います
276:login:Penguin
01/07/22 00:08
>>275 どうもです。
使いやすいサイト目指してやってみます。
277:login:Penguin
01/07/22 02:48
>>272
むぅ。うちの Netscape だと何も表示されん…
278:login:Penguin
01/07/22 02:54
>>272
俺もリロードすると何も表示されなくなる。。。
279:login:Penguin
01/07/22 02:55
>>272
UNIX?
280:272
01/07/22 08:04
>>279 UNIXです。
文字コードかも。今日夕方に取り組みます。
281:login:Penguin
01/07/22 09:04
文字コードだね。
<!--meta http-equiv="Content-Type" content="text/html; charset=euc"-->
コメントアウトしてちゃあ駄目だろ。。。
282:login:Penguin
01/07/22 11:43
>>272
100点を取る必要はないけど(ほとんど不可能)
htmlの間違い探しに使ってください。
URLリンク(validator.w3.org)
283:272
01/07/22 17:14
フリーのCGIが使える所は、どうも文字コードの問題が出ると何処かで見たので
今朝、x-sjis>euc>コメントアウトしてチェックしてみたけど・・・。
これから色々やってみます。
284:272
01/07/22 17:15
こんな書込みを上げてしまった。
285:272
01/07/22 19:54
ひとまず、使えるようになりました。
テスト公開中検索
URLリンク(www12.tok2.com)
入り口のindex.htmlは、定期的にPerlで書き出しているのと
フリーサーバーの場合はそれを、#includeして広告を入れている?ので
手探りで文字コード指定しました。(笑
フレームタグのサイズ指定が、ブラウザによって解釈が違ったりするので
これもまた、手探り状態で色々設定してどうにかまともになりました。
286:272
01/07/22 23:54
文字化け対策でこんなのもあったけど
URLリンク(www.yahoo.co.jp)
今のところ問題無さそうなのでひとまず現状維持。
287:272
01/07/26 00:16
以前にタイムスタンプ引継ぎの事を書いたので
>>258 にタイムスタンプの引継ぎを入れると・・
wget -m -I linux/dat URLリンク(cocoa.2ch.net)
for i in `ls $datdir | egrep "[0-9]+\.dat"`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html '<>' "" $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
touch -r $datdir/$i $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j #タイムスタンプ引継ぎ
done
ディレクトリごと削除した時に効果あるかわかりませんがタイムスタンプが
以前にインデックスを作成した時と同じならmknmz 時にスキップしてくれるかも
しれません。
288:hanajan:特科連χ
01/07/30 17:59
DNSの故障だったのか。。。
一昨日に検索窓を付けたモノでして。。。
URLリンク(www.hanajan.com)
289:login:ディストリいっぱい
01/07/31 01:56
あははー。検索窓ついてるー。使ってくれてる人がいるとは思わなかったです。ありがとうございます。
しかし URLリンク(www.dyn.to) って結構ポロポロサバ落ちするんだなあ。金取ってるくせして。
こんなんだったら最初から無料の URLリンク(dyndns.org) にすればよかったなあ。
金取ってる分だけ安定してるかと思ったのに。今さら変えるの大変だしなあ。
はあああ。ストレスたまるー。
あまりにもストレスがたまるので他のところに変えてやるーって思って探してたら
最近新しいのできたんですね。→ URLリンク(ddo.jp) ←誰か使ったことある人います?
試しに取ってみたけどどうだろう。1ヶ月全くオチないようだったらこのまま使ってもいいかなあ。
URLリンク(2ch.ddo.jp)
でも年額6000円は高い。。。
290:hanajan:特科連χ
01/07/31 03:46
ウットコ・・・
月額6000円程度でし・・・
URLリンク(www.hanajan.com)
メインのWWWです。
そろそろ、フレーム付けっかな~。。。
291:login:ディストリいっぱい
01/07/31 12:12
うおっ。すごいもの見つけました。
昨日書いた URLリンク(ddo.jp) のサイトをうろうろチェックしてたら
URLリンク(ddo.jp)
↑「Linux@2ch掲示板」にリンクが張ってました!!!笑
そうだったんですね。僕たちの仲間だったんですね。水臭いではないですか。ddo.jpさん。
だったら推奨します。→ URLリンク(ddo.jp) ←素晴らしい
今のところ問題ないし、無料バージョンもあるし、ドメイン覚えやすいし。いいと思います。
Linux板住人価格として6000円を3000円にまけてくれるともっと素晴らしい。←ホメた目的はこれ
話変わりますけどこの板、最近書き込みがすごく減ってないですか? (@@;)
292:Anonymous
01/07/31 13:08
事後報告だが、検索窓を張った
URLリンク(www.geocities.co.jp)
ジャンルは2ちゃんねる@UNIX板/Linux板(藁
293:login:ディストリいっぱい
01/07/31 13:34
あのにまうすさんも使ってくれてるんですね。ありがとうございます。
アップローダーがあったんでエロエロ画像がアップされているのを期待して
見てみたんですが全然違いました。。がっかりです。。。
アップローダ=エロエロ画像 と考える僕が間違ってますかー?(ーー;)
294:login:Penguin
01/08/10 14:53
2.0.6 リリース age
295:login:Penguin
01/08/10 20:54
>>293
心配するな俺もそう思ったよ。
296:login:Penguin
01/08/10 21:43
v2.0.6 早速導入しました。
●毎日更新
URLリンク(203.141.142.84)
297:Anonymous ◆True/7Po
01/08/15 16:11
>>296
事後報告、くだしつスレにリンク張りました
URLリンク(cocoa.2ch.net)
298:296
01/08/15 22:08
リンク有難う御座います。
高レスポンスで返せるようチューニングに励みます。
299:login:Penguin
01/08/23 00:36
300:◆EMrmvKLI
01/08/23 05:31
(・∀・) 300!!
301:login:Penguin
01/08/25 18:10
久しぶりに2ch検索使ってみたらこの板で作ったなんてことは全部すっとんで
広告貼って小遣い稼ぎですか?
302:2ch検索の"管理"人かも
01/08/25 18:26
>>301
1円もお金なんか入ってきませんけど?
広告=管理人にお金が入る
と思ってはいけません。
広告を貼るから値引きをしてくれ、ということで広告が入ってます。
ちなみに前のコレガの時も広告を貼るから懸賞の商品を提供してくれ、
との条件でバナーを貼ってました。僕には何も入ってきてません。
URLリンク(2ch.dyn.to)
↑これね。
これらは、みんなに作ってもらったからみんなに対するお礼のつもりでやってます。
僕が金儲けして喜ぶような人間だと思ったんですかー?
303:余弦者
01/08/25 23:01
>>1と他の検索サイト管理人殿
現在閉鎖中の板は2度と戻ってこないかもしれないので、
現在のログを保存してあとで公開してもらえると非常に助かるのだが
304:2ch検索の管理人かも
01/08/25 23:57
>>303
ああぁ、、、僕はログは捨ててます、、、
でもって「かなりしばらくお待ちください。」のところは
今となってはdatファイルを取ることもできません、、、
ですから僕には何もできません、、、すみません、、、
みみずんさんのところがログをちゃんと保存してるからなんとか
してくれるかもしんないです。
↓ココです。
URLリンク(mimizun.mine.nu)
305:2ch検索の管理人かも
01/08/26 00:02
ちなみに他のところはと申しますと
URLリンク(203.141.142.84)
URLリンク(64.124.197.202)
こういう状態です、、、ああああ。
「壊滅状態」という言葉がぴったりの今日です、、、
306:login:Penguin
01/08/26 00:24
この手の検索システム構築には、マシンパワー&高速回線が必要だと思います。
データ取り込み時に圧迫される回線
インデックス書き出し時に消費されるCPUパワー
データ保存で必要なHDD領域
常時稼動によって掛かる電気代&騒音。
手間も掛かり決して楽なボランティアでは無いと思いますので
がんばってください。>各検索の管?理人
307:hanajan@零号 ◆abdWn..Q
01/08/26 21:05 lwjpwoTg
スレが見つかって、それを表示する場合、
"レス全部読む"ではなく"最新レス100"
のURLが指定できんかのぅ。。。
308:ディストリがいっぱい
01/08/26 21:38 iEaIYVak
>>306
お・応援ありがとうございます。が・頑張ります。
>>307
それ、いいですねえ。
ja.po かなんかをいじればできそうな気もします。
でも僕は ja.po というものがどこにあるのか知りません。ですから永遠に対応はできません。
さ・さようなら。。。ごめんなさい。。。
309:検索エンジン全開 "管理"人
01/08/27 21:30 06X1b0s6
人為的ミスでブレーカーを落としデータがクラッシュ、しばらく停止してましたがやっと復旧。
UPSは管理人の個人的財政難から今後も採用予定無し...
>>307 可能だと思いますが、検索キーワードでHitしたスレッド内を
ブラウザ検索で長い書込みの中から絞込みを想定しています。
現状でどうにか使って頂きたいと思います。
310:login:Penguin
01/09/05 01:36 9/sH.COA
このスレの連中はシェルスクリプトもロクに書けねーのかよ。
export var=valは許すとして、
for i in `ls $datdir|egrep "[0-9]\.dat"`なんて痛すぎ。
ディレクトリ空だったら死ぬだろ。
昔の話題ではあるが。
311:ディストリいっぱい
01/09/29 23:47 gAs/Bj.E
今日発売のあちゃら11月号の91ページに2ちゃんねる検索が掲載されてます。
暇な人は見てみて下さい。
今月の初めにライターさんから「掲載させてもらいます。」という話は聞いていたけど
どういうふうに取り上げるのかは聞いてなかったんで、どんなふうに載ってるんだろ?
と思って立ち読みしようと思って本屋に行ったら結構大きく紹介されてたので
買ってしました。永久保存版。。。
今度の目標は日経Linuxに掲載されることです。頑張ります。
312:login:Penguin
01/09/29 23:49 gAs/Bj.E
おめでとう。
313:login:Penguin
01/09/29 23:50 gAs/Bj.E
名スレの予感
314:ディストリいっぱい
01/09/29 23:51 gAs/Bj.E
ちなみに >>312 >>313 は自分で書き込みました。
誰も反応してくれないとさみしいんで。。。
315:login:Penguin
01/09/30 00:06 s8gsnkrQ
>>311
技術的なことはちんぷんかんぷんですが、
本当におめでとうございます。
316:ディストリいっぱい
01/09/30 00:14 2uU1/ecY
あ、本当に祝ってもらえた。うれしいです。ありがとうございます。
317:検索エンジン全開
01/10/05 00:07 OyHoZWHc
>>311 おめでとうございます。
まだ見てないから見てみよ。
318:うろんぐ
01/11/30 17:52 0UsyWI7S
Web ページで検索できるようにする前に、emacs から検索してみようと思って namazu.el を入れてみた。
でも、M-x namazu で検索文字列を入れてみると
Wrong type argument: stringp, nil
と表示されて検索できなかった。
コマンドラインから namazu で検索するとちゃんと検索できてるのになぁ。
何が悪いのでしょうか? emacs-lisp を勉強していない俺が悪いのでしょうか?
319:みみずん
01/11/30 20:32 8qsrn8Pr
最近、管理がめんどい。。。
過去ログ取得スクリプトにバグはあるしディスク障害もあるわで。
URLリンク(mimizun.mine.nu)
320:うろんぐ
01/12/01 08:49 U6ZUKGfm
>318
自己レス。
~/.namazurc でのデフォルトのインデックス指定が
Index ほげ
だったのが敗因でした。
INDEX ほげ
じゃないとだめなんですね。いや、 namazu はどっちでもいいんですが、 namazu.el で .namazurc を解析するところが INDEX しか見てくれないんですよね。それだけでした。スマソ。
321:login:Penguin
01/12/07 17:50 QGAXIRf/
Namazuはクズ検索エンジン
322:login:Penguin
01/12/07 20:45 +fpiRIvO
>321
何がおすすめ?
合計 20GB 程度の Web サイト内の全文検索をしたい。
323:login:Penguin
01/12/08 11:15 AvJQP9li
Mitake Search なりなんなりの売り物つかうのはどうよ。
>>321 は例の私怨厨か... まだいたんだな。
324:login:Penguin
01/12/13 11:18 ugaubRPB
>323
なるほど、と思っていろいろ商用のものを見てみたんですが、
きづいたこと。
Namazu をつかってて、致命的に困っていることが、無い。
というわけで Namazu を使いつづけることにしました。
Debian 用パッケージも用意されていることだし。
325:あのみみずん@ N72ch-01p57.ppp11.odn.ad.jp
01/12/16 09:46 dwyzpYXY
Namazu いいよね。便利だし、早いし。
まぁ検索精度は低く感じるけど無料だから文句ないし。
つか、index作るのに時間かかるね・・・メモリも食うし。
326:login:Penguin
01/12/18 00:35 xpsT3a/l
申し訳程度にrenice +20…
327:login:Penguin
02/01/26 16:50 7jfLsj9S
kakasi の辞書、mysql とかのデータベースに格納できるとありがたいんだけどなぁ。
328:login:Penguin
02/01/26 21:15 7jfLsj9S
DocuWorks 文書用のフィルタってどなたかしりませんか?
昨年10月ごろの ML で Fuji Xerox の開発部でも UNIX 用のフィルタの必要性は認識しているって言う話がでてたらしいんですが、その後まったく話を聞きません。
329:login:Penguin
02/01/26 21:30 UX7CiKAA
広報にたずねてみては?
個人でも邪険にされることはありませんよ
330:login:Penguin
02/01/26 22:35 cUpXDNAM
>>327
それ、ずーっと昔に試したことがあるけど、かなり遅いよ(汗
postgresでもmysqlでもoracleでもsybaseでも。
データ型のチェックとか格納のためのソートツリーの作成とか、
kakasiを使うにあたって不要な部分がボトルネックになる模様。
331:login:Penguin
02/01/27 00:49 rUkqU65a
>330
それって、kakasi のソースをいじってってことですか?
それとも毎回データベースから単語ファイルを作成して辞書ファイルを作成して…ってことですか?
もしかして前者の場合だったらパッチがあるとか…。
332:login:Penguin
02/01/27 05:51 rUkqU65a
>320
なんか久しぶりにこのスレ読んで、おもだしたので、BTS にあげときました。
333:login:Penguin
02/02/09 12:34 QOH+2g3Z
1からよんで感動した
334:login:Penguin
02/03/08 14:10 OE9ed93x
wvWare v0.5.x.tar.gz どっかに無いかな。
v0.6以降からおいらのスキルじゃWord文章をうまく検索できんようになってしまった。
335:login:Penguin
02/03/08 17:16 2E3LNJfK
>>334
CVS から最新のフィルタだけ持ってきたらどうですかね。
URLリンク(cvs.namazu.org)
336:login:Penguin
02/03/24 00:16 ECEITlSW
age
337:login:Penguin
02/05/01 23:10 vlGgka0t
338:名無しさん@ディストリいっぱい
02/05/04 01:19 sJTSZgK7
なんと早くも1周年。おめでたいです。
よく頑張りました。(自画自賛)
339:login:Penguin
02/05/04 01:28 rn7+GErz
>>338
コテハンはひさしぶりだな。
掲示板すごいことになってるね。
340:名無しさん@ディストリいっぱい
02/05/04 01:39 sJTSZgK7
すごいことになってるっていうから荒らしでも来てるのかと思って見に行っちゃいました、、
あの質問づくしのことですか?もう慣れました。メールでも「削除して下さい。」とか
「書き込みができないんですけどなんでですか?」ってメールがしょっちゅうきます。
わかる範囲で答えてますけど。
1年ってあっという間だなあとしみじみとした気分です。
341:login:Penguin
02/05/04 07:09 vsdupTed
アーリーらっぱ飲みしながら>1から読破。
知らずに使っていた2ch検索にこんな歴史があったなんてね。
342:あれれ?
02/05/04 07:12 vsdupTed
空欄にしたら「名前:login:Penguin」になってしまいました。
詐称ではありませぬ。
343:login:Penguin
02/05/04 08:44 rn7+GErz
>>342
それは「名無し」だ。
URLリンク(freezone.kakiko.com)
344:login:Penguin
02/07/19 22:06 SLbxrvZg
UNIX板から来ました。
"namazu.cgi"を間違って消してしまいました。今から使おうと思ったのに
redhat7.3のrpmから入れたやつです。ちなみにバージョンは
namazu-2.0.10-4
namazu-cgi-2.0.10-4
だれかアップしていただけると助かります。お願いします。
345:hh
02/07/19 23:15 6iM25OVn
URLリンク(freehome.kakiko.com)
346:login:Penguin
02/07/19 23:23 W906XYYp
これ?
URLリンク(2ken.net)
347:login:Penguin
02/07/20 01:05 RZHWY+0C
>>344
いったん rpm 消して入れ直せば?
348:login:Penguin
02/07/20 22:52 JNErfAQQ
大抵はつかえるだろう。
349:login:Penguin
02/07/26 10:44 5MbssHQh
にちゃんねる検索はいいと思うんだけど、
自宅でサーバー立ててる人とかってさー
namazu何に使ってんの?
なんかおもしろい使い方ってある?
350:名無しさん@Emacs
02/07/26 11:24 QxusWSJk
>>349
日記検索
351:login:Penguin
02/09/04 13:04 +A/E5ACP
感謝age
352:login:Penguin
02/09/04 14:15 RLmpKL5P
>>350
DBですれ。
353:login:Penguin
02/09/22 12:59 nEa4cqUa
つか/settei/がIndex表示になってないな。
shスクリプトとか欲しいのに。
354:login:Penguin
02/09/22 13:13 N4s7ITei
2ch.shだと思ってたが名前変更されてたんだな。俺もちょっと探したけど見つけた。
URLリンク(2ken.net)
これだろう。でもわざわざこれを取得しなくてもこのスレに書かれてるのと同じだと思うが。
但し、今はdatディレクトリが見れないからこれでは動作しないと思う。
あと3行目の set | grep LANG は不要だと思う。ここでgrepしてどうする・・
355:名無しさん@Emacs
02/10/03 02:45 tCrncUsf
/usr/lib/mozilla/searchplugin/Googlejapan.src に
ちょっと変えてこんなんを作ってみた。
# Mozilla/2chSearch plugin
<search
name="2ch search"
description="2ch search"
method="GET"
action="URLリンク(2ch.dyn.to)"
queryEncoding="2561"
queryCharset="Shift_JIS"
>
<input name="key" user>
<input name="whence" value="0">
<input name="lr" value="lang_ja">
<input name="dbname" value="all">
<input name="max" value="20">
<input name="sourceid" value="mozilla-search">
<interpret
charset = "Shift_JIS"
resultEncoding = "2561"
resultListStart="<!--a-->"
resultListEnd="<!--z-->"
resultItemStart="<!--m-->"
resultItemEnd="<!--n-->"
>
</search>
356:login:Penguin
02/11/01 10:53 SkScjhB+
インデックスから日本語を排除したいと思っています。
検索対象は日本語のテキストファイル(含む LaTeX ソース、メール、ニュース)なのですが、
検索後として日本語を指定することがほとんどありません。
そこでインデックスを作る際に日本語は省いてしまいたいと思っています。
mknmzrc はどのように設定するといいのでしょうか?
現在は kakasi, chasen 共に使用できるようになっています。
あと、メールやニュースの Message-ID, In-Reply-To, References: フィールド以下の
文字列に対しては、メッセージ ID そのままの状態でインデックスに含めたいのですが、
可能でしょうか?
つまり、検索文字列としてメッセージIDを指定したいことがあるということです。
357:356
02/11/01 11:31 SkScjhB+
nkf ~/Mail/ML/IETF/1 | chasen -j -F '%?U/%m/ / ' | jless
で望む結果が得られ多っぽいです。
chasen のマニュアルによると
%?U/STR1/STR2/
っての 『if unknown word, STR1, otherwise, STR2』 ってことなのですが、
UNKNOWN ってのは辞書に無いってことですよね?
てことは chasen の辞書に英単語が載っていたらだめなんだな。
358:356
02/11/01 11:32 SkScjhB+
nkf ってデフォルトで BASE64 のデコードしてくれるんですね。
メールの Subject: の日本語(BASE64エンコードされている) が、
デコードされててちょっと感動した。
359:独自フィルタを作りたい
02/11/02 12:11 0CRm6865
Namazu文書フィルタの作成方法
~ Namazu 2.0 用 ~
URLリンク(www.namazu.org)
ほかに参考になるサイトはありますでしょうか?
360:独自フィルタを作りたい
02/11/02 12:19 0CRm6865
特にフィールド検索に重点をおきたいと思っています。
実験結果のファイルがあって、それには実験の条件が書き込まれているので、
Word や Excel 文書の「文書のプロパティ」みたいな扱いができればと。
使用している OS は Debian GNU/Linux 3.0 (woody) です。
いくつかのフィルタを読んでみたところ、フィルタの側ではとにかく可能な限り、
フィールドの情報を抽出して返しているように思います。
フィールド名などもフィルタのほうで勝手にいくらでも作ることができるみたいです。
どのフィールドをインデックスに採用するかというのは、
フィルタから返された情報を見て mknmz が決定するのでしょうか?
361:独自フィルタを作りたい
02/11/02 12:25 0CRm6865
つまり、"+subject:linux" みたいな検索式の subject の部分に何を使えるかは、
誰がどうやっていつ指定しているか、ってことなんですが。
362:独自フィルタを作りたい
02/11/02 12:35 0CRm6865
REMAIN_HEADER vs SEARCH_FIELD
URLリンク(www.namazu.org)
全文検索 Namazu 講座
URLリンク(www.rfs.jp)
$REMAIN_HEADER
RFC 822 Header などのうち本文として検索出来るものを指定
$SEARCH_FIELD
フィールド検索(「+subject: 検索語」のような形式)に使える項目を指定する
$META_TAGS
検索対象にするMETAタグを指定
%FIELD_ALIASES
メール見出名の置換ルール
フィールド検索に関係しそうな mknmzrc の変数というと、これくらいでしょうか?
どのフィルタがどの設定項目を見ているのか、これからフィルタを読んでみます。
363:独自フィルタを作りたい
02/11/02 12:45 0CRm6865
フィルタ読んでみました。
$REMAIN_HEADER → mailnews.pl が見ている
$META_TAGS → html.pl が見ている
$SEARCH_FIELD と %FIELD_ALIASES は mknmz 本体だけが見ている?
(まぁ conf.pl でデフォルト値を設定しているのは別として)
うむ~ NMZ.field.* 出力している部分をよんでみまつ・・・
364:独自フィルタを作りたい
02/11/02 15:33 0CRm6865
1)フィルタからフィールドのデータが連想配列で返ってくる。
2)%FIELD_ALIASES を使ってフィールド名を変換
%FIELD_ALIASES は
キー = フィルタから返ってくるフィールド名
値 = インデックスに登録するときのフィールド名
3)フィールド名が SEARCH_FIELD にあるものは NMZ.field.<フィールド名> に出力
META_TAGS を使うようオプションで指定されていたときは
SEARCH_FIELD だけでなく META_TAGS にあるものも対象。
ってことか・・・・ちょっと気持ち悪いのは、なぜか mailnews.pl では
メールヘッダの Subject: の内容を 'title' フィールドとして返しておいて、
mknmz 本体でわざわざ 'title' -> 'subject' への別名置き換えをやってるところ。
だったらはじめから mailnews.pl で $fields->{'subject'} = $line とかすればいいのに。
365:独自フィルタを作りたい
02/11/02 15:35 0CRm6865
今朝になって突発的に独自フィルタ作りたくなって、
my とか local ってなに?
perl の名前空間ってどうなってんの?
@ とか % とか \ とか $ とかなに?
ってとこからはじめたんで、ちゃんとソース読めてないかもしれない・・・
366:login:Penguin
02/11/03 02:13 RjWYQ8zV
Windows の Outlook の *.msg ファイルがあるんですが、
これのフォーマット分かる方おられませんか?
フィルタかいてみようかとおもったんですが、
MH 形式とはちょっと違うみたいです。
いらないバイナリデータがあちこちにちりばめられていて。
確かにテキスト部分は一部読めるんですが。
367:login:Penguin
02/11/03 02:26 RjWYQ8zV
これを使えば何とかなりそうな気がしてきました。
Converter for Microsoft Outlook 2000 (TM) .msg files
URLリンク(www.brodo.de)
Matijs van Zuijlen has written a Perl scriptwhich does convert Microsoft Outlook .msg files to mbox format.
He found out that the file format is OLE-compatible.
This script uses many Perl modules to extract the information,
but you should be able to find all Perl Modules either in your favourite Linux distribution, or at CPAN.
You can find his program (License: GPL), as well as documentation,
at URLリンク(www.xs4all.nl) .
368:login:Penguin
02/12/04 15:44 t/qSISBU
まるちゃんage
369:1
02/12/04 16:27 fPwE/y/H
【まさかの】ひろゆきブチキレ【降臨】
とうとうキレさせてしまった過疎板の住人達。
あの一言さえなければこんなことにはならなかったのに。。。
目の前で忽然と消えていくスレ達。
一つのスレに集中(むしろ、おいやられていく)住民達。
ひろゆきVS住民
無論、俺は面白半分w
問題の発言
スレリンク(bobby板:119番)
問題のスレ
スレリンク(bobby板)
370:IP記録実験
03/01/08 22:18 6H9Rg9t/
IP記録実験
スレリンク(accuse板)
1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。
27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?
38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27
鋭いです。
73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。
371:login:Penguin
03/01/09 00:44 kgNvzzS1
>>47
HDDがいままでより早くいっぱいになってひろゆきと夜勤さんが困る
372:login:Penguin
03/01/09 01:02 janFKrXY
>>308
削除屋さんはボランティア(略
373:login:Penguin
03/01/09 01:20 janFKrXY
∋oノハヽo∈
( ´ァョ) <のんのん♪
374:login:Penguin
03/01/09 01:30 janFKrXY
犯罪者はIP提出してとっとと警察へ連れて行って欲しいけど
荒らしは減らないような気がするんですが、、
そこんとこどうでしょうか?
>ひろゆきさん
375:IP記録実験
03/01/09 01:49 5oZ7DmI3
IP記録実験
スレリンク(accuse板)
1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。
27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?
38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27
鋭いです。
73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。
376:login:Penguin
03/01/09 01:54 YXdOQOf5
ひろゆきのレイプ予告したらIP晒されちゃうかな?
377:login:Penguin
03/01/09 02:52 P/uNaKwW
>>102
なんで?
378:login:Penguin
03/01/09 03:39 ispmrJFO
>>98
それいいな。
379:山崎渉
03/01/15 11:31 +BGYmUVc
(^^)
380:login:Penguin
03/02/04 04:14 A2vZpuZL
pc2サーバになってからログが取得できませんが
381:login:Penguin
03/02/25 00:22 U9eQXo48
とりあえず、保守age
382:山崎渉
03/04/17 12:22 KRn99/cy
(^^)
383:山崎渉
03/04/20 06:03 X64WTq1+
∧_∧
( ^^ )< ぬるぽ(^^)
384:login:Penguin
03/06/24 13:30 /blIyPUB
| | ∧
|_|Д゚) こっそり保守
|文|⊂)
| ̄|∧|
385:login:Penguin
03/06/27 13:30 brxZWl/z
| | ∧
|_|Д゚) こっそり保守
|文|⊂)
| ̄|∧|
386:クンクン(壱式♂)
03/06/28 00:59 FiVI/bTz
ageないと。。。
ククーン。。。
387:login:Penguin
03/06/28 12:36 RFFFPkS8
| | ∧
|_|Д゚) ageないと保守できないと思っているなんて・・・。
|文|⊂)
| ̄|∧|
388:クンクン(壱式♂)
03/06/30 01:25 3f5V9M5o
>>387
お腹減らないのかしら・・・?
そうか! ヌイグルミの猫ちゃんなのかしら。。。
クククのクーン。。。
389:山崎 渉
03/07/15 11:24 2JhhXBQM
__∧_∧_
|( ^^ )| <寝るぽ(^^)
|\⌒⌒⌒\
\ |⌒⌒⌒~| 山崎渉
~ ̄ ̄ ̄ ̄
390:ぼるじょあ ◆yBEncckFOU
03/08/02 05:41 GfRe8vK7
∧_∧ ∧_∧
ピュ.ー ( ・3・) ( ^^ ) <これからも僕たちを応援して下さいね(^^)。
=〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
= ◎―――◎ 山崎渉&ぼるじょあ
391:クンクン(ヲヤジGAL係)
03/08/08 02:04 rRKGqcxq
懐かしいスレだわ。。。
ククーン。。。 ククーン ...
392:山崎 渉
03/08/15 22:59 dil3w4kp
(⌒V⌒)
│ ^ ^ │<これからも僕を応援して下さいね(^^)。
⊂| |つ
(_)(_) 山崎パン
393:login:Penguin
03/09/30 00:00 x7TSgVmK
画面綺麗だし、パフォーマンスもいいし、
なんか無性に感動した。
応援&保守sage
394:login:Penguin
03/10/30 23:25 S/3RcQGM
保守sage
395:login:Penguin
03/10/31 10:56 wXPO98R9
てすと
396:login:Penguin
04/03/17 08:12 YU7c9ND+
ぬるぽ
397:login:Penguin
04/06/04 22:18 kp0vHpoH
【2ch】みみずん検索が資金不足でピンチ! みなさんからの寄付募集中
スレリンク(newsplus板)
【金食い虫】みみずん検索閉鎖か?HDD障害が原因で
スレリンク(news板)
398:login:Penguin
04/08/19 20:42 KTnAw7tQ
なまず
399:login:Penguin
05/05/20 09:19:33 g7agSS6H
まだ書けるのかな?テスト
400:login:Penguin
05/07/11 01:55:02 ehYz0hjB
>>19
おいおい、三流大学とはいえ、医学部は偏差値だけはそれなりだぞ。
401:login:Penguin
05/07/14 05:15:51 TFsXQ32L
402:lute.kyoto-pc.ac.jp
05/07/14 10:11:22 8kA6nqIz
てすと
403:login:Penguin
06/10/11 18:29:45 sKmclboc
更新さててるから
アゲ
URLリンク(members.at.infoseek.co.jp)
404:login:Penguin
06/10/11 19:53:37 SErWYtxI
>>403
されてないからさげ
405:login:Penguin
06/10/11 21:49:21 uK3oW7bv
namazuって、昔よく使かってたけど、
今は、どうなったの?
406:login:Penguin
06/10/21 02:29:46 MJXjqX1B
Hyper Estraier にお株を奪われて終了
407:login:Penguin
06/10/21 15:09:46 yEvMSMbh
>>406
Hyper EstraierってPerl動作版とかあるの?
レンタルサーバで使えないんじゃちょっとなぁ。
目玉のP2P並列処理もAPIだけ公開されてるけど
実運用するには敷居が高い。高すぎる。
あとResultページのカスタマイズとかできないし。
エンジン自体はNamazuよりずっといいと思うんだけどなぁ
408:406
06/10/21 17:42:30 MJXjqX1B
確かに Namazu における pnamazu みたいなのはないな。
QDBM とべったりだから、Pure Perl で実装するのは難しそうだね。
>あとResultページのカスタマイズとかできないし。
あー、確かに標準添付の estseek.cgi はいまいちね…
API は提供するから各自でフロントエンド書けってのが作者のスタンスなんだろうな。
409:login:Penguin
07/01/09 23:59:29 CgfAmGyf
Namazu
上げとこう
410:login:Penguin
08/02/06 21:31:47 tz+SPYsr
Namazu
一年に一回位は上げとこう
411:login:Penguin
08/08/24 22:42:04 tRt9Wm+3
今日で、北京オリンピックは終了か、 Beijing 2008.
次は、またロンドンで逢おう。
412:login:Penguin
08/11/27 21:35:45 fRUK7EAQ
なまず テスト OK
413:login:Penguin
09/05/09 08:54:35 csyAdtn/
NAMAZU namazu Test OK
414:login:Penguin
09/09/27 18:15:02 59PL+I+s
なまずがバージョンアップされてるね。
Namazu 2.0.20 リリース
URLリンク(www.namazu.org)
415:名無しさん@ディストリいっぱい
09/12/07 04:12:12 W7AG3aXs
>>1です。おはようございます。
みなさんの協力のおかげで9年経った今でもまだ2検ネットは健在です。
本当に感謝してます。ありがとうございます。
416:login:Penguin
10/04/23 21:18:39 KPkTwpyw
なまず あげ。
417:login:Penguin
11/04/25 23:07:38.53 ukfhULhC
放射 あげ
418:名無しさん@ディストリいっぱい
11/10/26 13:23:28.97 yudhLKNi
10年経った。。。。