05/08/23 13:55:32 .net
apache.orgの傘下になって、ますます勢いづくスパムメールの暗殺者
SpamAssassin
これでSPAM業者を失業に追い込もう.......
とまでには、まだまだ遠い道のりだよ(w
学習しろ!!学習しろ!!学習しろ!!
sa-learn --spam --mbox /home/hiroyuki/mail/spam
ハムをスパムと間違えないで、一生のお願いだから。
スパム業者の荒らしはスルーってことで。
おまいら、まったりとお願いします。
本家 URLリンク(spamassassin.apache.org)
2005-06-06: SpamAssassin 3.0.4 released!
キーワード
local.cf
user_prefs
spamassassin
ベイズ推定
ベイジアンフィルタ
ホワイトリスト
AWL
bayes_journal
auto-whitelist
2:名無しさん@お腹いっぱい。
05/08/23 13:56:11 .net
ググル SpamAssassin
URLリンク(www.google.com)
関連スレ
URLリンク(www.google.com)
3:名無しさん@お腹いっぱい。
05/08/23 14:17:10 .net
なんでunix板なんだろうという素朴な疑問は却下ですか
4:名無しさん@お腹いっぱい。
05/08/23 14:23:50 .net
↓こっちで十分だろうという素朴な疑問は却下ですか
メールサーバ迷惑メール対策スレ
スレリンク(unix板)
5:名無しさん@お腹いっぱい。
05/08/23 14:26:08 .net
Internet Mail System スレって落ちたんだっけ
6:名無しさん@お腹いっぱい。
05/08/23 14:31:04 .net
みたいだね。立てちゃっていいんじゃないかな。
7:名無しさん@お腹いっぱい。
05/08/23 14:51:41 .net
スレリンク(pc板)l50
8:名無しさん@お腹いっぱい。
05/08/23 15:59:57 .net
SpamAssassinは「メールテキスト(ヘッダと本文)分析、
ベイジアンフィルタ、DNS blocklists、
および共同型フィルタリングネットワーク」
を使用する事でスパムを特定するメールフィルタです。
DNS blocklistsは、spamを発信もしくは
中継するサーバのIPアドレスのブラックリスト、
及び、spamの本文中にある、spammerが誘い込もうとする
web サービスのURI 文字列から、
ドメイン名を抽出したブラックリストを利用します。
共同型フィルタリングネットワーク
(collaborative spam filtering network) は、
メールの本文から「署名」を検出し、これをサーバに登録されている
spamの「署名」と照合し、合致していればspamと判定する、というものです。
(参考)
URLリンク(tlec.linux.or.jp)
9:名無しさん@お腹いっぱい。
05/08/23 16:01:46 .net
>>1をフィルタしたいです。
10:名無しさん@お腹いっぱい。
05/08/23 17:51:29 .net
sperm ass ass in
11:名無しさん@お腹いっぱい。
05/08/23 17:54:26 .net
スパム 朝 死んだ
12:名無しさん@お腹いっぱい。
05/08/23 17:55:52 .net
Mail-SpamAssassin は razor-agents と組み合わせて
使うとかなり強力だよね。
13:名無しさん@お腹いっぱい。
05/08/23 18:18:11 .net
SpamAssassinの設定ファイルは、3種類あります。
以下のディレクトリのパスの記述は、正確には
OSもしくはディストリビューションのmanを参考にして下さい。
- /usr/share/spamassassin/*.cf:
デフォルト設定が記述されています。
バージョンアップにより、書き換えられるので、
変更しない方が良いでしょう。
- /etc/mail/spamassassin/*.cf:
サイト全体の設定を記述します。
$USER_HOME/.spamassassin/user_prefs:
各ユーザー自身の細かい設定が出来ます。
例えばサイト設定でスパム指定されているドメインからのメールでも、
ユーザが希望すれば、受信する事が出来ます。
ただし、サイト設定でuser_prefsの使用が
有効になっている必要があります。
14:名無しさん@お腹いっぱい。
05/08/23 18:46:41 .net
D_BOUNCEとD_REJECTの違いがわかりません
おしえてくださいませ
15:名無しさん@お腹いっぱい。
05/08/23 19:11:58 .net
要は >>1 == >>14 の単発質問スレだったのか。
16:名無しさん@お腹いっぱい。
05/08/23 19:36:38 .net
OSもしくはディストリビューションのman
17:名無しさん@お腹いっぱい。
05/08/23 22:43:22 .net
bsfilterのほうが好きです
18:名無しさん@お腹いっぱい。
05/08/24 00:42:51 .net
導入してすぐに、部署が違う顔なじみのお姉様達に、
迷惑メール減らしてくれてありがと~と誉められました。
なんかうれしかった。
19:名無しさん@お腹いっぱい。
05/08/24 01:02:26 .net
>>14
# Notes:
# D_REJECT and D_BOUNCE are similar, the difference is in who is responsible
# for informing the sender about non-delivery, and how informative
# the notification can be (amavisd-new knows more than MTA);
# With D_REJECT, MTA may reject original SMTP, or send DSN (delivery status
# notification, colloquially called 'bounce') - depending on MTA;
# Best suited for sendmail milter, especially for spam.
# With D_BOUNCE, amavisd-new (not MTA) sends DSN (can better explain the
# reason for mail non-delivery, but unable to reject the original
# SMTP session). Best suited to reporting viruses, and for Postfix
# and other dual-MTA setups, which can't reject original client SMTP
# session, as the mail has already been enqueued.
20:名無しさん@お腹いっぱい。
05/08/24 11:22:12 .net
>>18
雑誌の裏表紙広告のようでワロス
21:名無しさん@お腹いっぱい。
05/08/24 16:03:20 .net
>>19 すみません。違いが良く解りません。エロイ人、解説して。
22:名無しさん@お腹いっぱい。
05/08/25 21:25:38 .net
>>8 ここの設定ファイル、まめにアップしてくれるので
非常に参考になります。
日本語のスパム排除に効果アリアリです。
23:名無しさん@お腹いっぱい。
05/08/26 14:49:37 .net
>>14 >>19
D_REJECT 発信元のsmtpにrejectする。もしくはDSNを送る。
(MTAによってことなる。)
D_BOUNCE DSNを送る。
24:名無しさん@お腹いっぱい。
05/08/29 19:32:07 .net
入れると動作おもくね?
25:名無しさん@お腹いっぱい。
05/08/30 15:51:44 .net
>>24
アルバイトでもしなさい。
26:名無しさん@お腹いっぱい。
05/08/31 17:58:36 .net
>>24 ハム3000通読ませたら、落ちたyo。ちょっとずつ読み込ませろ。
27:名無しさん@お腹いっぱい。
05/09/08 14:33:13 .net
デーモンとしての動作なら大丈夫らしい。
ハムスパムの読み込ませは、パワーいると思う。
28:名無しさん@お腹いっぱい。
05/09/09 05:55:47 .net
>>26
頼まれて作ったサイトの最初の学習用に、取れ立てspamを一気に
一万ファイル読ませたけど、大じょぶだーたよ。
途中で裏にまわしちゃったので、正確にはわからないけれど
一時間以上はかかったと思う。Debian Sarge/i386でRAM512MB、
SAは3.0.3。Maildir形式。
若干オフトピになるかもしれないけれど、参加者が
いるかもしれないので聞いてみる。
RBL.JPのメーリングリストって活発ですか?。流量は?。
一時停止のお知らなどの運用状況『も』流れたりします?。
仕事でも個人でもspammerには頭来てるんで、暇な時は
(RBL.JPとは他所のところに)spam報告してるんだけれど、
RBL.JPにも入ってみようかと思っているんだが、どんな様子なのだか、
聞いてみるテスツ。
29:名無しさん@お腹いっぱい。
05/09/13 00:27:25 .net
qmail/qregexにspamassassin使ってます。
7月終わりからのこの一月半くらいで(51日)、
ブロックしたspamメールは 2238通。
うち、rblでブロックしたもの 664通 (30%)
helo 時点でブロック 162通 ( 7%)
badmailfrom でブロック 1123通 (50%)
SpamAssassinブロック 289通 (13%)
ですた。
一部あんまり煩い .tw/.kr/.cnは丸ごとパケット
捨ててる場合もあり。
30:名無しさん@お腹いっぱい。
05/09/13 12:57:50 .net
>>29
> ブロックしたspamメールは 2238通。
ブロックしたのにどうやって spam だと判定するのですか?
31:名無しさん@お腹いっぱい。
05/09/13 13:21:15 .net
わかんなければ口をつぐんでろヨ馬鹿
32:名無しさん@お腹いっぱい。
05/09/13 14:14:47 .net
>>31
自分がわかってないのを認めるのが嫌だからって、人がわかっていないという
レッテルを張るのはいかがなものか。
33:名無しさん@お腹いっぱい。
05/09/13 18:44:49 .net
キチガイに馬鹿というレッテルを貼ったのは俺の間違いだったヨ。謝るよキチガイ。
34:名無しさん@お腹いっぱい。
05/09/13 18:51:22 .net
>>33
わたしをキチガイ認定するとは浅はかな人ですね.
35:名無しさん@お腹いっぱい。
05/09/13 19:17:12 .net
キチガイキター
36:名無しさん@お腹いっぱい。
05/09/13 19:45:41 .net
>>35
浅はかだですね.
37:29
05/09/13 20:36:48 .net
みなさん喧嘩しないでくらさい。
38:名無しさん@お腹いっぱい。
05/09/18 09:59:27 .net
藻前らSpamAssassin 3.1でつよ。
39:名無しさん@お腹いっぱい。
05/09/20 02:55:15 .net
>>28 凸レポート頼むw
40:名無しさん@お腹いっぱい。
05/09/22 11:57:56 .net
>>38
アップデート対象
ClamAV 0.86.2 to 0.87 ・・・OK
Razor2 2.67 to 2.72 ・・・OK
SpamAssassin 3.0.1 to 3.1 ・・・NG
プラグインエラーが出た
use_razor2 1
ok_languages ja en
プラグイン有効設定(v310.pre ファイル)
Razor2
TextCat
spamd 再起動 ・・・OK
spamメールテスト ・・・OK
41:名無しさん@お腹いっぱい。
05/09/22 12:57:41 .net
SpamAssassin 3.1.0で、spamdではなくspamassassinをprocmailから呼んでます。
RelayCountryを生かしたいのですが、
init.preの
loadplugin Mail::SpamAssassin::Plugin::RelayCountry
を有効にしてもメールに X-Relay-Countries ヘッダがついてくれません。
何かほかに必要なことがあるのでしょうか?
IP::Countryは入っています。
42:名無しさん@お腹いっぱい。
05/09/23 18:53:51 .net
>>41
URLリンク(www.gossamer-threads.com)
43:名無しさん@お腹いっぱい。
05/09/23 19:55:26 .net
ありがとうございます。
> I don't believe the RelayCountry plugin adds anything visible to the
> message.
Ok, I didn't get that from the docs (such as they are). I expected the
"X-Relay-Countries" header to be added to the message.
そのURLの通りspamassassin -tD で実験したらちゃんとチェックしてくれていました。
trusted_networks にプロバイダの(secondaryを含む)メールサーバをちゃんと
書かないとあらゆるメールでJPが入ってしまうので書くべきだけど、
名前じゃなくアドレスで書かないとだめだしプロバイダのネットワーク全体を
許可するのも範囲が広すぎるし、というところがちょっと悩みどころですね。
私の使ってるプロバイダはspammerへの対応をちゃんとしてくれる方らしいので
メールサーバなどのアドレスを含むネットワーク全体をtrustしてしまいましたが。
44:42
05/09/23 20:08:30 .net
>>43 SAてのは、Emailのメッセージコンテンツで
スパムかどうかを判断する、てのがやっぱ恐らく
本筋の使い方、ということなんじゃないすか。
オリジンやリレーで判断するならRBLsあたりで、
45:名無しさん@お腹いっぱい。
05/09/23 22:09:35 .net
ベイジアンフィルタでは結局出現確率しか捉えられないんで、
人間が書いた規則を中心に色んな規則を含めて総合評価できるのがsaじゃないかと。
あとはルールのスコアも自動的に最適値を学習してくれるなら嬉しいんだけど。
マイニングしてルールを自動生成しろとまでは言わないから。
46:名無しさん@お腹いっぱい。
05/09/27 15:25:28 .net
>>45 sa-learn --ham
これで学習できるでしょ?
cronで自動化はだめなの?
47:名無しさん@お腹いっぱい。
05/09/27 19:34:29 .net
>>46
全然わかってないな
48:名無しさん@お腹いっぱい。
05/10/01 11:43:43 .net
各ルールでのスコアを単純に加算するのではなく、それぞれがマッチした
場合の spam 確率を出し、それをまたベイズの定理で組み合わせるとか。
ベイジアンフィルタからの spam 度: 0.8
URIBL: 0.9
SPF SUCCESS: 0.3
となるメールからは
sub mul { $r = 1.0; foreach (@_) { $r *= $_; } $r; }
my @probs = (0.8, 0.9, 0.3);
my $prod = mul(@probs);
$prod / ($prod + mul(map { 1 - $_ } @probs));
=> 0.939...
と計算する。
んで、スコアが閾値以上・以下なら、それぞれのルールにフィードバック。
49:名無しさん@お腹いっぱい。
05/10/04 09:24:19 .net
環境
redhat9
sendmail8.12.8-4
milter0.3.0-1.0
spamassassin3.10
質問させてください。
spamassassinでベイジアンフィルタを利用しています。
このベイジアンフィルタなのですが、サーバ単位でspam、hamメールを学習させていますが、
各ユーザ毎にham、spamの基準が違い(mailinglist等)、サーバ単位でなく、
各ユーザ単位でベイジアンフィルタの学習を行わせたいと考えています。
ユーザ毎にベイジアンフィルタのデータベースをbayes_seen、bayes_toksをもって、
自分の趣向に合わせてベイジアンフィルタに学習させるイメージです。
user_prefsがユーザ毎に設定できますが、これはヘッダや本文の条件、
ルールを設定できるだけででした。
ご存知の方がいらっしゃいましたら教えて下さい。
よろしく御願いします。
50:名無しさん@お腹いっぱい。
05/10/04 17:22:15 .net
各ユーザが.forwardからspamassassinを呼び出せば済む。
RedHatだとsendmailのMDAがprocmailだったりしそうだから、
.procmailrcに
:0fw: spamassassin.lock
* < 256000
|/usr/bin/spamc
と書くとか。
しっかし、procmailrcはわけわかんね~。はよmaildropに移行したい…
51:名無しさん@お腹いっぱい。
05/10/05 13:36:05 .net
>>50
49です。ありがとうございます。
設定してみます。
52:名無しさん@お腹いっぱい。
05/10/26 08:49:34 .net
procmailでspamassassinの設定する方法はあちらこちらにかいてあるけど
qmailでの設定ってほとんど見当たらない。
ユーザごとにいちいち.qmailを編集するのもスマートじゃないし
qmail-scannerあたりを書き直せばいいんだろうけど・・・
と思ってたら、vpopmailでの運用をしてたので、案外簡単にできた。
53:名無しさん@お腹いっぱい。
05/10/26 20:11:30 .net
>>52 書き直すまでもなく、使えると思うが。
URLリンク(qmail-scanner.sourceforge.net)
54:名無しさん@お腹いっぱい。
05/10/28 07:41:11 .net
なるほど!情報ありがとう。
先にSpamAssassinいれといてQmail-Scannerをインストールすれば
良いってことですね。
ところで、Qmail-Scannerにバグがあるみたいです。
添付ファイルを処理する際にカッコがあると、途中でエラーをおこし、
メールが返送されてしまうのです。
一応、修正を行ってみたのですが、旨くいくかどうかは未確認なので
確認してから報告したいのですが、なんかML加入しないとダメみたいですね。
チョットメンドクサイ・・・
55:名無しさん@お腹いっぱい。
05/10/28 08:02:46 .net
procmailで$HOME/.procmailrcを読みに行かなくすることってできるんでしょうか?
/etc/procmailrcだけで制御したいのですが、ググって調べてると、
「$HOME/.procmailrcが無いときは/etc/procmailrcが読まれる」
ってなことが書かれてて…。
56:名無しさん@お腹いっぱい。
05/10/29 07:14:48 .net
>添付ファイルを処理する際にカッコがあると
はて、どゆこと?>>54
57:名無しさん@お腹いっぱい。
05/10/29 13:55:36 .net
>>55
ユーザプロセスでは ~/.procmailrc を真っ先に読みに行くってのは
ソースレベルでの仕様だから、それが嫌ならソースを書き換えてビルドするか、
さもなくば全ユーザのホームディレクトリ上で
ln -s /etc/procmailrc ~/.procmailrc するしかないんじゃない?
58:名無しさん@お腹いっぱい。
05/10/30 11:42:12 .net
>>56
わかりにくい表現ですいません。
ログにこんなエラーがありました。
Unmatched ( in regex; marked by <-- HERE in m/^ESC$bfc dj8&5f7w2hESC( <-- HERE b.doc$/ at /var/qmail/bin/qmail-scanner-queue.pl line 22 12, <STDIN> line 3221.
ESCの部分は端末上反転していたので、実際は\\と思います。
添付されていたのは日本語の入ったPDFとワード書類です。
で、qmail-scanner-queue.plの該当行のソースがこれ。
push(@uufile_list, $uufile) if(!grep(/^$uufile$/,@uufile_list));
多分$uufileが正しくクオートされておらず、添付ファイル内の「(」が、
正規表現の一部とみなされているようです。
この推測が当たっていれば$uufile --> \Q$uufile\E とすればOKなはずです。(未確認)
で、一応は自己解決をみたわけですが、SpamAssassinのコミュニティに報告するのが
メンドクサイ仕組みなので、なんかどうでもいいやっていう気になってます。
59:名無しさん@お腹いっぱい。
05/10/30 12:15:53 .net
>>58 添付ファイル名やその中身に括弧文字が
入っていて起こる鰓てのは初耳す。
qmail-scannerの versionと、そのメールを作った
ソフトは何ですか(Winのoutlookとか thuderbirdとか、
**xのmewとか。。。?)
お話の感じだと、これ、SAの問題ではないと思う。
60:名無しさん@お腹いっぱい。
05/10/30 12:59:39 .net
>>59
qmail-scanner-queue.pl 1.25です。
メールを作ったソフトの方は折り返し戻っていってしまったので、
すぐには確認できませんが、送信者からの以前の話からすると
Macのソフトらしいです。たぶんEudora?
それはともかく、該当行の変数名からしてuuencodeされたファイルと思うのですが、
それが正しければSAの問題じゃないでしょうか・・・
61:59
05/10/30 14:07:55 .net
>>60
エラーが起きてるのは、qmail-scanner-queue.pl
の、sub check_and_grab_attachments の中ですよね。
uuencode/binhexしたファイル名をいろいろいじったやつ
を添付して試してみてるんだけど、症状再現しないす。
うちも qmail-scanner 1.2.5、んで、SA 3.1。
62:名無しさん@お腹いっぱい。
05/10/31 02:56:13 .net
>>61
あ・・・qmail-scannerの問題であってSAの問題じゃないのかな?
症状の再現性については、良くわからないけど
他の添付ファイルでいままで問題が起こったことがないので、
特殊な例かもしれません。
問題を起こす添付ファイルは手元に届いていないし、
届いたとしてもそのまま丸投げするわけに行かないので、
もうちょっと掘り下げてみます。
63:名無しさん@お腹いっぱい。
05/11/04 07:10:06 .net
bsfilter と共用してる人いる?
それって意味ある? (片方だけ使うよりも、spam と判断する
確率あがる?)
bsfilter、spamassassin はどちらも、 ベイズ推定に基づいてるので、あまり意味がないように感じてるんだけど、効果があるか気になった。
64:名無しさん@お腹いっぱい。
05/11/04 08:59:06 .net
>>63
ほとんど意味無いと思う。
SpamAssassinのベイジアンフィルタだけを使わないで、bsfilterを多段にかける
とかだったらまだわかるが。
65:名無しさん@お腹いっぱい。
05/11/04 10:31:57 .net
>>64
SA のベイジアンってそのまま使うと日本語考慮してくれなくね?
66:64
05/11/04 10:48:57 .net
>>65
あーなるほど。
bsfilterって最初から日本語化されてたっけ?
bsfilterをnkfとkakasiで日本語化して使うなら、SpamAssassinも
そうやって使うというのはどうだろ。
ちなみに、ベイジアンフィルタ使わなくても、設定でほとんど排除出来るよ。>>63
67:名無しさん@お腹いっぱい。
05/11/04 13:28:25 .net
中国語やらのspamもとんでくるしcharsetの指定とかがめちゃくちゃなのも多いので、
日本語だけ対応していても仕方がない。
実際spamassassinだけで日本語も中国語もほぼ全て弾けてるよ(カスタムルール有)。
たまに英語のspamが抜けてくるけど、一日一通以下(受け取るSPAMは100超/日)。
false alarmは登録したサイトの広告的なメールマガジンみたいなものだけ経験がある。
これは受け取り望んでることがわからなければどこからどうみてもSPAMだよなあ、
と思ったので学習は諦めてwhitelistに入れた。
68:名無しさん@お腹いっぱい。
05/11/07 17:29:00 .net
sa-learn --hamとか--spamって何を学習させているんですか?
メールの内容を見ているの?ヘッダ部分だけ?
69:名無しさん@お腹いっぱい。
05/11/07 17:56:12 .net
>>68
全部
70:名無しさん@お腹いっぱい。
05/11/08 12:30:48 .net
>>69 ありがと。
でもその割には、同じ内容のスパムが、何度も来るんだよね。
71:名無しさん@お腹いっぱい。
05/11/08 13:03:17 .net
>>70
そりゃBAYES_99になっても、他のスコアが低ければ通っちゃう罠
72:名無しさん@お腹いっぱい。
05/11/11 20:55:45 .net
>>63
全く無駄ではないと思う。
ごく稀にSAが取りこぼすspamを捕捉するときがある。
多少の取りこぼしが気にならないなら、入れる必要はないけど。
精度はDNSBLやRazor2とか使えて自動学習してくれる分、SAの方に
分があるように思う。
あと、bsfilterはhamの学習がうまくいかないことがたまにある。
73:名無しさん@お腹いっぱい。
05/11/12 08:09:09 .net
false alarmの可能性も同様に増えるから、そのリスクの見積もりと
SAのみの場合にどれだけ不満かの兼ね合いだろうね。
74:名無しさん@お腹いっぱい。
05/11/17 12:01:58 .net
>>71 そなのですか?あちゃあ。
BAYES_99は絶対にアウトにする方法ってありますか?
これするとまずい事もあるのですかね。
75:名無しさん@お腹いっぱい。
05/11/17 12:56:53 .net
>>74
BAYES_99 のスコアをやたら大きな値にしておけばいいんじゃない?
まずい事っていうか、ベイズを 100% 信じる!という運用ポリシーだと
自分を納得さることが出来るの? (俺には出来ない)
いろんなスコアの積み重ねで spam 判定を行うという仕組みは良く
出来てて、納得して利用しているけどなあ。
76:名無しさん@お腹いっぱい。
05/11/29 16:04:35 .net
>>74
推測が必要ない確定的なものはprocmailで捨てれば?
77:名無しさん@お腹いっぱい。
05/11/30 14:40:57 .net
>>75-76 サンクス!!
(もともと>>68です)
sa-learn --spamで学習させるという事は絶対にスパム!!wということですよね。
つまり人為的に学習させているわけだけど、BAYES_99のスコアをめちゃ高くしておくと、自動学習でのエラー、つまりハムをスパムと判定してしまったときに、困りますよね。
これはsa-learn --hamで修正するのでしょうけど。あれ?この場合、どっちが勝つんだろ?
仕組みが複雑すぎる..................
78:名無しさん@お腹いっぱい。
05/11/30 17:30:48 .net
頭の程度との比較の問題だなw > 仕組みが複雑
79:名無しさん@お腹いっぱい。
05/11/30 17:37:11 .net
>>77
ベイジアンフィルターの原理わかってる?
sa-learn --hamでそのメールをhamと学習させても、それ以前の
学習結果によって同じメールがBAYS_99と判別されることだってあるぞ。
あと、スコアリングについてまるで理解できてなさげだな。
80:名無しさん@お腹いっぱい。
05/12/02 18:36:49 .net
自動起動のサービスを止めることはできますか?
81:名無しさん@お腹いっぱい。
05/12/02 18:38:15 .net
え?
82:名無しさん@お腹いっぱい。
05/12/08 13:39:52 .net
>>80 具体的に述べよ。でも、たぶんできるよwww
83:名無しさん@お腹いっぱい。
06/01/10 11:52:34 .net
各ユーザーがベイジアン学習させるタイミングっていつ?
レン鯖で使っているんだけど、なかなか学習効果でないんですよ。
84:名無しさん@お腹いっぱい。
06/01/10 16:01:57 .net
>>83
設定による
85:名無しさん@お腹いっぱい。
06/01/10 20:20:03 .net
razor2 ほかと組み合わせないと、思ったほどの効果はすぐにでない。
86:名無しさん@お腹いっぱい。
06/01/17 12:46:17 .net
sa-learn --spamの学習は、各自のspamボックスを
sa-learn --spam --mbox /home/*/mail/spam
でなめさせるから良いと思うけど、
間違ってspamに入ってしまったのを、
訂正学習させるのはおまいらどうやってます?
sa-learn --ham --mbox /home/*/mail/notspam
とか訂正ボックス作れば良いのかな。
87:名無しさん@お腹いっぱい。
06/01/17 15:14:23 .net
wanderlust任せ。
88:名無しさん@お腹いっぱい。
06/01/18 12:34:30 .net
autolearn=spam が付いてる奴は既に学習済み、再学習する必要なし。
autolearn=no のみ sa-learn すべし。
89:名無しさん@お腹いっぱい。
06/01/24 20:53:03 .net
なんか学習させ過ぎるとある時点を境にspam検出率が物凄く落ちるような・・・
90:名無しさん@お腹いっぱい。
06/01/26 13:14:55 .net
いつも参考にしていたサイトがディスク障害でデータ消失だって。
URLリンク(ssss.jp)
サルベージしていった方がいいかなぁ。
91:名無しさん@お腹いっぱい。
06/02/04 19:03:29 .net
qmail/vpopmail
SpamAssassin3.1.0
qmail-scanner1.25
の環境です。
存在しないメールアドレス宛に着た場合、
~vpopmail/domain/example.jp/user1/auto-whitelist
~vpopmail/domain/example.jp/user1/auto-whitelist.mutex
が自動生成されてしまいます。
その為、ユーザーディレクトリが訳のわからない状況になってしまい、
このファイルの自動生成を停止させることはできますか?
検索してみたら、生成先のパスを変更する解説は多かったんですが、
自動生成停止は見つからなかったので、お願いします。
92:名無しさん@お腹いっぱい。
06/02/16 08:34:09 .net
SPAM判定されたものの行き先フォルダをscoreごとに分けてみた。
5-10: 1
10-20: 3
20-: 10
くらいの割合。
サブジェクトを眺めて誤判定がないか確認するのが楽になった。
scoreに応じて色が変わる(段階的または連続的に)というのも面白いと思ったが
wanderlustでそこまでするのは大変そうなので見送り。
93:名無しさん@お腹いっぱい。
06/03/11 11:45:40 .net
sendmail+spamassassin+milter で構築しておりやす
外部MTAへ送信するときもX-Flagが付加されているようで
自分自身が送信したメールがX-Spam-Flag:YESって笑えないことも
対策はないでしょうか?
94:名無しさん@お腹いっぱい。
06/03/11 11:56:46 .net
特定ドメインはチェックしないという設定が逢ったような気が。
95:名無しさん@お腹いっぱい。
06/03/11 12:50:52 .net
milter-spamc を使っていたわけで
spamass-milter の方がよさげかな 試してみます
96:名無しさん@お腹いっぱい。
06/03/23 14:03:58 .net
Spamassasin+Postfixで2年ぐらい前に利用してたのですが、
当時、1時間に2-3000通ぐらいしかメールできなくてしぶしぶ外した経験があります。
最近はハードのスペックも上がってきたし、また検討しているのだけど、
みなさんの負荷具合ってどうなんですかね。
実際運用してる方どうですか?どれぐらいのペースでメールの送受信できます?
なんとなく平均これぐらいは飛ぶよ、ってのがわかればいいんですけど。
97:名無しさん@お腹いっぱい。
06/03/23 14:57:00 .net
当時使ってたマシンのスペックは?
それが無いと比較できないよ
98:名無しさん@お腹いっぱい。
06/03/23 20:31:24 .net
>>96
以前古い処理能力の低い機械をメールゲートウェイにしていた頃は
並列度を上げるより下げた方が実質の処理能力があがったことはある
99:96
06/03/23 22:22:27 .net
>>97-98
当時はCeleronの600MHzぐらいのやつで、他のアプリもごりごり動いてたw
まぁ今回はP4-3GHzぐらいのやつで専用のメールゲートウェイにしようかと思うのだが、
メルマガが配信されることがあるサーバなので、できれば懐は広くしておきたいわけよ。
1時間で数万通とかは余裕?平均がどんなもんかしらないのでアレだけど
100:名無しさん@お腹いっぱい。
06/03/24 00:20:50 .net
> Celeronの600MHz
って全然2年前じゃないじゃん、5年以上前じゃない?
まあ少なくともパフォーマンスの良いシステムはいくらでも有るわけだから
心配ならそれにしとけば問題ないと思うね
取りあえず2chで使ってるくらいのにしといたら
101:96
06/03/24 12:53:03 .net
>>100
当時、そのスペック使ってた会社だったのでw
あと、何通送れるとかは検証するしかないのか。ちと面倒だな。
最後にSpamassasinのパフォーマンスに関して参考になるサイトがあれば教えて下さいです。
パフォーマンスが落ちるとかなんとか書いているサイトはあるけど具体的な数字で検証しているところが見つからない。
102:名無しさん@お腹いっぱい。
06/03/24 17:04:43 .net
ま、やってみたら、
結局マシンパワーの問題だから最近の高性能マシンならまず問題起きないよ
逆にそれで問題起こるならスンゴイ大量のユーザ抱えてるっと事だからもっと根本から見直した方が良い
メールGWを複数設置して並列処理するとかね、
ちなみに1時間に2~3000通って商売はSPAM屋かい?
103:名無しさん@お腹いっぱい。
06/03/24 17:48:04 .net
>>102
SPAM屋だったら単位時間あたり送付量にゼロの数が二つくらい足らないと思われ
104:名無しさん@お腹いっぱい。
06/03/24 18:20:00 .net
本物のSPAM屋 乙!
105:名無しさん@お腹いっぱい。
2
106:006/03/26(日) 16:08:02 .net
107:名無しさん@お腹いっぱい。
06/04/03 16:05:40 .net
$USER_HOME/.spamassassin/user_prefs:
各ユーザーがWebベースで、このファイルをメンテできるツールありますでしょうか。
108:名無しさん@お腹いっぱい。
06/04/04 01:05:04 .net
user_prefsをMySQLで管理しているのであれば、すぐにいくつか見つかると思う。
俺はSquirrelmailのプラグインを使っている。
URLリンク(www.squirrelmail.org)
109:名無しさん@お腹いっぱい。
06/04/04 11:20:19 .net
>>107 ありがとうございました。チャレンジしてみます。
他のツールご利用の方いましたら、よろしければ使用感など教えてください。
110:名無しさん@お腹いっぱい。
06/04/04 13:17:58 .net
>>106
List from SA
URLリンク(wiki.apache.org)
→phpsaadmin
URLリンク(www.misak.dk)
→WebUserPrefs
URLリンク(sourceforge.net)
111:名無しさん@お腹いっぱい。
06/04/04 15:59:54 .net
06.3.18 SpamAssassinユーザー会発足
URLリンク(www.spamassassin.jp)
112:名無しさん@お腹いっぱい。
06/04/30 08:10:26 .net
これってサーバーに入ってなくてもユーザーがホームディレクトリにインストールしてつかえるの?
113:名無しさん@お腹いっぱい。
06/05/03 11:35:52 .net
>>111
URLリンク(svn.apache.org)
114:名無しさん@お腹いっぱい。
06/05/15 11:28:45 .net
cronで、定期的に
sa-learn --spam /home/*/Maildir/.Spam/cur
とやっているんですが、最新の3.1.1にしてからメールが存在しない時に
archive-iterator: readdir found no mail in '/home/hogehoge/Maildir/.Spam/cur' directory
というエラーを吐くようになりました。このエラーを出さなくする方法ってないんでしょうか?
面倒だけど、メールが無かったら実行しないようにするスクリプトを組まないといけないのかなぁ。
115:名無しさん@お腹いっぱい。
06/05/17 01:22:09 .net
>>113
そりゃエラーじゃない、「読み込むべき対象がない」と報告したに過ぎない。
>メールが無かったら実行しないようにするスクリプト
それが本来の解決方法。
更に言うなら>>88参照。
116:名無しさん@お腹いっぱい。
06/06/05 15:25:24 .net
mysqlを設置したのですが、AWLはメールアドレスが順位付けられて
見ていて楽しいです。でも、ユーザー毎に設定されるのが無駄な気が。
デフォーで全ユーザー共通のが便利じゃないかなあ。
117:のくす牧場
06/07/09 22:26:05 .net
spamassasinは、スペースで単語を区切っているっぽいので、
日本語の場合はkakasiで分かち書きにして学習させるパッチを作ってみました。
せっかくなので興味のある人は使ってみてください。
URLリンク(sea-mew.jp)
118:名無しさん@お腹いっぱい。
06/07/09 23:29:01 .net
自分のやってることが車輪の再発明でないかまず確認してもよかったのではないかと。
いや、努力を否定するつもりはないんだけど……。
119:名無しさん@お腹いっぱい。
06/07/09 23:43:16 .net
お、使ってみる。
120:116
06/07/10 00:01:24 .net
>>117
もちろん、こんなことだれかが考えていると思って探したら、
ITmediaに記事が出ていたんだけども、
そのサイトに行ってみたけど、
どこから落として良いのかわからなかったのですよ。。。
と思ったら、
URLリンク(mm.apache.jp)
が見つかりました。
121:116
06/07/10 00:29:24 .net
URLリンク(www.emaillab.org)
ここに新しい物がありました。こちらを使う方が良さそうです。
122:名無しさん@お腹いっぱい。
06/07/10 12:02:32 .net
>>116
SpamAssassinほどメジャーなツールで、意外にずっと分かち書き対応パッチ無かったよね。
自分もずっと探してたんだけど、ずっと見つけられなかったもの。
もう一歩遅かった。
123:名無しさん@お腹いっぱい。
06/07/10 20:23:50 .net
そんなの必要?
うちだとそんなことしなくても
日本語のSPAMはほぼ完全に蹴ってくれるけど。
パラメータやルールはカスタマイズしてるものの。
124:名無しさん@お腹いっぱい。
06/07/10 23:28:01 .net
123
125:名無しさん@お腹いっぱい。
06/07/11 00:25:57 .net
>>122
ベイジアンフィルタの性能は低いよ。原理的に考えてもそうだよね。分かち書きしてないんだから。
だからよく誤検出の元になる。蹴らないんじゃなくて蹴りすぎる。
126:名無しさん@お腹いっぱい。
06/07/11 11:01:59 .net
うちで蹴りすぎる例はほとんどない。
電気店とかの商売メルマガがたまに蹴られるくらいで、
自分で見てもこれはまあ仕方がない、と思ってしまうようなもの。
2、3回くらいhamとして登録すれば問題なくなるけど、もっとも
こういうのはspamassassinに通すより先に振り分けてしまうからな。
127:名無しさん@お腹いっぱい。
06/07/13 00:45:22 .net
>>122
そんなパラメータの調整なんて必要?
うちは、日本語化パッチを当てるだけで、完全に蹴ってくれるよ。
そもそも、学習が自動で、調整が要らないのがベイズフィルタの利点では。
>うちで蹴りすぎる例はほとんどない。
蹴っているメールをチェックしなければいけないのであれば、
蹴る意味がないのでは?
(蹴っているんじゃなくて、振り分けているだけでは?)
もちろん、�
128:サんなの人それぞれですけどね。 導入も我慢も諦めも、コストですから。 しかし、このパッチの導入コストは、メリットに十分見合うと思うけどね。
129:名無しさん@お腹いっぱい。
06/07/13 13:48:55 .net
>>126
単語の出現確率だけを扱うようなベイスフィルタでは原理的に捉えられない特徴を
ルールに書いてるので。
ベイズフィルタだけを信用するようなスコア設定にもしていないしね。
spamassassinの導入はportsに頼ってるのでパッチはコストが高いです。
130:名無しさん@お腹いっぱい。
06/07/13 21:54:23 .net
>>127
> ベイスフィルタでは原理的に捉えられない特徴を
であれば、そのフィルタとベイジアンフィルタの効果は独立事象になるわけだから
ベイジアンフィルタの認識率を上げることは、false positiveを下げるために意味ある
ことになると思うんだけど。
つまり、ベイジアンフィルタの性能を高めることは意味がある、ということね。
ただ、portsだとかaptだとか使ってる場合、パッチだと導入障壁が高いというのは理解できる。
131:名無しさん@お腹いっぱい。
06/07/14 17:59:35 .net
portsに日本語化patchをオプションで適用できようにsend-prすりゃええやん。
132:名無しさん@お腹いっぱい。
06/07/15 13:56:50 .net
p5-SpamAssassinってちょくちょくアップデートされるんで
パッチがすばやく追随してくれる保証があってかつporterが日本人じゃないと
無理じゃない?
japanese/ 以下にslave portを作るとかかな。
俺は使う気ないからやらないが。
133:名無しさん@お腹いっぱい。
06/07/15 15:31:04 .net
>>127
おれ、Fedoraだからわからんけど、Portsって不便なんだな。
update調べてパッチ当ててrebuildする10行のスクリプト、cronで動かしてるよ。
134:名無しさん@お腹いっぱい。
06/07/16 00:07:25 .net
コスト云々はそういう話じゃないと思うが。
135:名無しさん@お腹いっぱい。
06/07/16 04:42:41 .net
>131
portsだとMakefile.localで1行でローカルなpatchは当てられる
136:名無しさん@お腹いっぱい。
06/07/16 04:59:19 .net
>>133
なんだ。それはそれですげぇな。
>>126は、そもそも
> 単語の出現確率だけを扱うようなベイスフィルタでは原理的に捉えられない特徴を
> ルールに書いてる
と言っているので、日本語対応のレベルの話じゃなかったな。すまん。
ともあれ、>>120 のパッチすげー。
137:名無しさん@お腹いっぱい。
06/07/16 05:07:42 .net
>>131
知らないのなら口を出さないほうがいいぞ。あまりにも的外れ。
138:131
06/07/17 00:48:40 .net
>>135
すまんかった。今は反省している。
139:名無しさん@お腹いっぱい。
06/07/17 06:51:49 .net
なんか素直な奴だなww
140:名無しさん@お腹いっぱい。
06/08/09 18:43:52 .net
# SpamAssassin 3.1.4に対応した日本語対応パッチ
(案、その5)が発表されました (2006-7-29)
# SpamAssassin 3.1.4がリリースされました (2006-7-27)
from URLリンク(www.spamassassin.jp)
141:名無しさん@お腹いっぱい。
06/09/12 16:40:39 .net
3.1.5 にしたら sa-learn が mbx 形式に対してエラーを吐くので調べてみた。
ArchiveIterator.pm の 1144行目。
--- ArchiveIterator.pm.orig Tue Sep 12 16:39:47 2006
+++ ArchiveIterator.pm Tue Sep 12 16:39:58 2006
@@ -1141,7 +1141,7 @@
}
$self->bump_scan_progress();
- $info->{"$file.$offset"} = Mail::SpamAssassin::Util::receive_date($header);
+ $info->{$offset} = Mail::SpamAssassin::Util::receive_date($header);
# go onto the next message
seek(INPUT, $offset + $size, 0);
142:名無しさん@お腹いっぱい。
06/09/12 20:39:30 .net
>>139
ここに書いてどうする気なんだよ……
143:名無しさん@お腹いっぱい。
06/09/12 20:42:46 .net
確かに…
144:139
06/09/13 01:27:34 .net
誰かエロい人が project に言ってくれねーかなぁと・・・
145:名無しさん@お腹いっぱい。
06/09/13 02:01:41 .net
>>142
お前さんの手柄なんだから自分でコミットすればいいじゃん
146:名無しさん@お腹いっぱい。
06/09/13 09:28:55 .net
ホームページ制作王は、世界の権威として名高いCOMDEXが
21世紀のワールドスタンダードに認定したWebパブリッシングアプリケーションである。
ホームページ制作王に不可能はない。
不可能があるとすれば、そこが人類の英知の限界点である。
21世紀、世界のWebはホームページ制作王を中心に回っていくのである。
にもかかわらず、ここ日本では、心ない風評のため、まだまだ普及に
遅れがみられる。
ホームページ制作王を普及させないかぎり、我が国のWebは、
世界の趨勢の後塵を拝するばかりである。
世界が認めた高性能!ホームページ制作王
スレリンク(hp板)
147:名無しさん@お腹いっぱい。
06/10/07 01:02:21 .net
3.1.6出たね。
148:名無しさん@お腹いっぱい。
06/10/09 10:15:41 .net
ルールを書く際に日本語文字列を使う場合はJISコードに変換して,
さらに,メタキャラクタをエスケープしなければなりませんが,
皆さんこの辺はどうやっているのでしょうか。
JISコードへの変換は次のようにやればいいと,ググって見つけたのですが,
メタキャラクタのエスケープを実行してくれるような方法はないのでしょうか。
echo 'サンプル' | nkf -j | awk '{gsub(/\x1B[$(]B/,"");print}'
149:名無しさん@お腹いっぱい。
06/10/10 03:55:17 .net
つ tlec.linux.or.jp の「おりじなるこんてんつ」
150:名無しさん@お腹いっぱい。
06/10/11 23:52:15 .net
>>146
あまりスマートとは言えませんが、
そのあとにsedでもかければいいのではないでしょうか
echo 'サンプル' | nkf -j | awk '{gsub(/\x1B[$(]B/,"");print}' | sed 's/\(\.\|\`\|\*\|\+\|\/\|\?\|\^\|\$\|\#\|\{\|\}\|\(\|\)\|\[\|\]/\\\1/g'
151:148
06/10/11 23:57:59 .net
>>146
ごめん、今試したらミスってた。
↓でどうでしょう?
echo 'サンプル' | nkf -j | awk '{gsub(/\x1B[$(]B/,"");print}' | sed 's/\(\.\|`\|\*\|\+\|\/\|\?\|\^\|\$\|\#\|{\|}\|(\|)\|\[\|\]\)/\\\1/g'
# どっちにしろスマートじゃないよなぁ。
152:146
06/10/12 09:47:07 .net
>>149
サンクス。これはすばらしい。早速使わせてもらいます。
153:名無しさん@お腹いっぱい。
06/10/12 14:04:14 .net
URLリンク(sa.intaa.net) なんてのもある。
154:148
06/10/12 16:40:22 .net
sa-updateについて質問です。
URLリンク(spamassassin.jp)
↑を見てsa-updateを使える状況にはなっています。
crontabに登録して自動的に更新するようにしたいのですが、
どのくらいの頻度で更新するのがよいのでしょうか?
現在は
0 2 * * 5 /somewhere/spamassassin-update
として金曜日に更新するようにしています。
週1回くらいでちょうどいいものなのでしょうか?
spamassassin-updateはsa-updateとspamdのrestartをしています。
155:146
06/10/13 09:06:42 .net
>>151
おお,これはすばらしい。これなら,簡単にルールを作れそうです。
どうもありがとうございます。
156:名無しさん@お腹いっぱい。
06/10/18 18:45:16 .net
最近、捕捉率が低下したorz
157:名無しさん@お腹いっぱい。
06/10/18 19:29:42 .net
最近は Returned mail 型が大量に増えますた。一括で別フォルダに振り分けるしかないか。
158:すまん
06/10/18 20:39:23 .net
スレリンク(dqnplus板)l50
スルーしてね。
159:名無しさん@お腹いっぱい。
06/10/19 11:41:12 .net
>>155 Gmailとthunderbirdで同系列のメールを受信させているけど、
こちらはやや低下してはいるけど、assassinの捕捉率ががた落ちしちゃった。
例えば、
------------------------------------
Company name: Texhoma Energy, Inc.
Stock symbol: TXHE.PK
Current price: 0.10$ (growth + 10%)
Expected price 10/18/2006: 0.29$
Expected price 10/20/2006: 4.52$
------------------------------------
Please read this mail attentively!!!!!!!!! This is strictly confidential information. Don't send it
to anybody. Only now is a right moment to buy that stock. You can take it now for a low price. On Friday , 20
October the following news will be announced:
以下略
160:名無しさん@お腹いっぱい。
06/10/19 21:58:20 .net
>>157
うちもすり抜けてウザーだったから
portupgrade mail/p5-Mail-SpamAssassinしたら
3.1.6で補足出来てますよ~
161:名無しさん@お腹いっぱい。
06/10/29 09:24:22 .net
>>154
どんなのがすり抜けてきてる?
162:名無しさん@お腹いっぱい。
06/11/02 05:05:58 .net
spamassassinがqmailscannerと連動してくれない
clamavやperlscannerとは連動しているのに
どうしてなんだろ
163:名無しさん@お腹いっぱい。
06/11/14 16:54:34 .net
3.1.5です。>157みたいな英文のスパムの捕捉率がついに50%割っちゃったotz
レンサバなので3.1.6にできない。くやしーw
164:名無しさん@お腹いっぱい。
06/11/16 11:32:47 .net
Company: The Motion Picture Group
Symbol: MPRG
Price: $0.25
3 Day Target: $1.00
Status: Strong Investment
この書式をNG登録する良い方法って無いでしょうか。
Company:
Symbol:
Price: $
3 Day Target:
Status:
165:名無しさん@お腹いっぱい。
06/11/16 22:17:55 .net
>>162
それボットネット野郎のspamですなw
SAのスレなのは承知でひとつ、
どうしてもSAでダメならProcmailのレシピで
SAに飛ばす手前で処理させればよろし。
振り分けがmilterだったら調べてくだされ。
例)
:0 B
* < 3000
* .*Symbol*
* .*Price*
* .*3 Day Target*
* .*Status*
$MAILDIR/trash/.
166:名無しさん@お腹いっぱい。
06/11/17 15:20:45 .net
URLリンク(www.spamhaus.org)
世界トップ10スパマーだって。天誅!
167:名無しさん@お腹いっぱい。
06/11/17 19:50:44 .net
>>164
ここまでわかってるのになんでタイーホできないんだろうねぇ
やっぱり国の事情なのかなぁ(´・ω・`)
腹立ってしょうがない
168:名無しさん@お腹いっぱい。
06/12/04 10:44:33 .net
>162
ここの日記が参考になります。
株式spamの排除 その3 2006年11月14日
URLリンク(nikki.hart.co.jp)
URLリンク(nikki.hart.co.jp)
169:名無しさん@お腹いっぱい。
06/12/07 12:00:52 .net
安倍内閣メールマガジン URLリンク(www.kantei.go.jp)
このメールのアドレスを
whitelist_from kantei@mmz.kantei.go.jp
としたんだけどスパム扱いになってしまった。
どうも、Fromの "首相官邸 <kantei@mmz.kantei.go.jp>" ってやつの
首の字がまずいような気がする。
( 首が、JISで 3c37 ってことは < と同じなんだよね。)
全国の首の字で始まる方、ご注意ください。
170:名無しさん@お腹いっぱい。
06/12/07 18:11:45 .net
MIMEエンコードされてるのに何言ってんの
171:名無しさん@お腹いっぱい。
06/12/08 12:47:51 .net
生JISで送られてきたんじゃね?w
172:名無しさん@お腹いっぱい。
06/12/08 18:29:08 .net
だったらそんなフィルタ入れてる上流に文句言うべきだよな。
俺のところにはちゃんとMIMEエンコードで来てたから。
173:名無しさん@お腹いっぱい。
06/12/08 18:37:07 .net
生JISは悪くないだろ
174:名無しさん@お腹いっぱい。
06/12/08 20:48:18 .net
もしかして、日本語対応パッチっていうのをやっているからなのかなぁ...
MeCabいれて、MeCabの辞書いれて、いくつかのPerlモジュールいれたんだよなぁ...
日本語対応パッチがヘッダのエンコードをデコードしてしまっているためかもしれないなぁ...
よくわからんけど...
175:名無しさん@お腹いっぱい。
06/12/08 21:54:18 .net
>>172
それだったらさらに関係ないんじゃない?
日本語パッチでは確か、内部UTF-8処理だったと思うんで。
176:名無しさん@お腹いっぱい。
06/12/09 10:40:24 .net
でも、JIS のMIMEエンコードをデコードしてからUTF-8に変換するんじゃないの?
177:名無しさん@お腹いっぱい。
06/12/09 11:32:44 .net
MIMEエンコードをデコードしてそれを処理してからUTF-8に変換するのか? 変な奴。
178:名無しさん@お腹いっぱい。
06/12/11 12:56:53 .net
>>163
このシリーズで、gifに埋め込まれて送られるバージョンが来た!!
179:名無しさん@お腹いっぱい。
06/12/11 19:17:57 .net
RBL関連のスコアはかなり低くしといたほうがよさげ。
SORBSとNJABLでInfoWebの動的IPがblacklist入りして、それだけでスコアが3.9に。
RCVD_NUMERIC_HELOが1.5なので、HELOに適当なホスト名ではなく自分のIPアドレスを
名乗るMTAだったりすると、もうspamと判定されちゃう。
180:163
06/12/11 22:39:29 .net
>>176
株式タイプはgifだけじゃなくてpngもjpegもあるよ、
うちにはずいぶん前からきてる
procmailの場合下のキーワードにwindows-1250なんかの文字コードや
他にいくつかのキーワードを混ぜてはじいてる。
おいらはSA使ってないからよくわからんけど
(ってかSA使うスキルないからこのスレ指くわえて見てるだけのヘタレだけど)
SAはデフォルトだと画像系防げないの?
* ^Content-Type: image/gif;
181:名無しさん@お腹いっぱい。
06/12/12 09:05:29 .net
>>177
自分のIPを名乗るMTAって、それだけでだいぶダメなんだが。
182:名無しさん@お腹いっぱい。
06/12/12 11:37:23 .net
>>179
ヘッダを見ると
Received: from 会社のメールサーバのFQDN
Received: from xxx.xxx.xxx.xxx (foo@sample.com@xxx.xxx.xxx.xxx)
Received: from unknown (HELO ?192.168.1.33?) (foo@sample.com@xxx.xxx.xxx.xxx)
注: xxx.xxx.xxx.xxxはプロバイダのIPアドレス
で、最後にヲレ専用のメールサーバに着いていた。
どうやら、送信側の自宅のMUA -> 会社のメールサーバ -> ヲレ専用のメールサーバ
ってな感じで配送されてきたメールの模様。
んで、user_prefsのinternal networksに会社のメールサーバのネットワークを
書いていたんで、xxx.xxx.xxx.xxxにRBLやRCVD_NUMERIC_HELOが適用されたのかな。
183:名無しさん@お腹いっぱい。
06/12/12 12:51:05 .net
>>178 gif全部はじいちゃうの?漢ですね。
184:名無しさん@お腹いっぱい。
06/12/12 12:52:01 .net
>>180 なんか順序違うし、情報が足りない?
185:名無しさん@お腹いっぱい。
06/12/12 13:20:50 .net
>>180
それスパムじゃないメールなの?
相手はどんな環境からメール出してるんだ??
186:名無しさん@お腹いっぱい。
06/12/12 13:30:53 .net
>>183
そ。普通の文章を普通のMUAからNATルータ越しに送ってきたもの。なので、最初のHELOは
ローカルIPが生で入っている模様。
会社のサーバでqmail-scannerでウイルスチェックかけて、ヲレのサーバでもclamdで
ウイルスチェックかけているんで、実際のreceived:はもうちょっと煩雑なものになるんだけど。
187:名無しさん@お腹いっぱい。
06/12/12 15:00:08 .net
>>184
つまりMTA->MTAじゃなくMUA->MTAってことなんだろ?
ということは自分とこのユーザってことだから、それは当然だわな。
その場合も、MTAからのものと同じようにSpamAssassinのチェックが掛かるということが
177が言ってる問題の本質とみた。
188:名無しさん@お腹いっぱい。
06/12/12 16:34:04 .net
あ、clamdじゃなくてclamsmtpで、ですな。ウイルスチェック自体はclamdがやっているけど。
189:>>185 そそ。動的IPアドレスブロックつかって自前のMTAをあげている場合なら まだしも、MUAからのメールではまることがあったので驚いたのですだ。 あと、別のサーバから転送されてくるspamの判別を効かせるためにinternal networks を設定するとはまることがあるんだなぁというお話。
190:名無しさん@お腹いっぱい。
06/12/12 17:32:36 .net
>>177 自分のIPアドレスを 名乗る「MTA」だったりすると、もうspamと判定されちゃう。
これで>>180「MUA」を例示するからややこしい。
そもそも、RBL系を利用しているのだから、判定されやすいのは当然なのに。
それに、MUAが吐き出すHELOはほぼ不正なんだけど。
191:名無しさん@お腹いっぱい。
06/12/12 17:37:41 .net
まあ、spamassassinのデフォルト設定のスコアリングの危険性が知られるのはいいことだと思う。
192:名無しさん@お腹いっぱい。
06/12/12 18:31:18 .net
俺の環境では、LANのIPアドレスがRCVD_NUMERIC_HELOでスコアされる事はないぞ。
MTA上でspamdとして動いています。
user_prefsはtlec謹呈。
3.1.5 & 3.1.7
193:名無しさん@お腹いっぱい。
06/12/12 18:54:30 .net
その辺、internal_networksやtrusted_networksの書き方次第じゃないの?
194:名無しさん@お腹いっぱい。
06/12/12 18:58:12 .net
>>190 tlecのuser_prefsがイイってこと?
195:名無しさん@お腹いっぱい。
06/12/12 23:52:07 .net
>>181
>他にいくつかのキーワードを混ぜてはじいてる。
196:名無しさん@お腹いっぱい。
06/12/13 11:06:16 .net
>>190
tlecのuser_prefsには、internal_networksの記述は無い。
trusted_networksはコメントアウトされている。
197:名無しさん@お腹いっぱい。
06/12/13 21:44:32 .net
>>193
trusted_networks は利用者が個別に書くことを推奨している。
それが private_prefs と作者が勝手に名付けている奴。
198:名無しさん@お腹いっぱい。
06/12/14 10:23:09 .net
これは、private_prefsファィルを設置しないと、働かないんでしょ?
199:名無しさん@お腹いっぱい。
06/12/16 17:48:10 .net
>>195
user_prefs のうち、ユーザ個別の設定項目を
別ファイルにした、というのが private_prefs 。
private_prefs には trusted_networks と
MYMTA という設定項目がある。
これらを設定すると有効になるルールが幾つかある。
URLリンク(spamassassin.jp)
URLリンク(spamassassin.jp)
200:名無しさん@お腹いっぱい。
07/01/07 20:58:36 .net
spamass-milterでsubjectだけ加工するってのは無いのかょ
201:名無しさん@お腹いっぱい。
07/01/07 22:54:43 .net
ここって、amavisdの話もおk?
202:名無しさん@お腹いっぱい。
07/01/09 09:28:12 .net
ok
203:名無しさん@お腹いっぱい。
07/01/09 11:17:34 .net
spamassassinにスパム学習させる為だけに怪しい出会い系に
入会した私は変態でしょうか?
204:名無しさん@お腹いっぱい。
07/01/09 12:11:32 .net
なあに、かえって検出力がつく。
205:200
07/01/09 13:33:17 .net
出会い系の登録してそこからのメールを自動的にスパム学習させると
スパムのトレンドに自動的に追随してくれるかなと思って
出来心でやってしまいました。
でも、今一番難しいのは株を買え!系なんですが。
206:名無しさん@お腹いっぱい。
07/01/09 14:38:18 .net
>>202
折角なんで有効活用したら?w
株系の画像添付はなかなか難しいよなぁ・・・
207:名無しさん@お腹いっぱい。
07/01/09 21:58:40 .net
うちではほとんどカットしてくれてるけどなあ >画像添付
何かコピペか自動生成かって感じの文章が書いてあるだけのが時々抜けてくる。
208:名無しさん@お腹いっぱい。
07/01/10 00:08:51 .net
>> 202
FuzzyOCR
209:名無しさん@お腹いっぱい。
07/01/10 19:03:36 .net
SPAM朝日
スレリンク(mass板)l50
210:名無しさん@お腹いっぱい。
07/01/19 10:41:00 .net
スレリンク(tech板:81番)
211:名無しさん@お腹いっぱい。
07/02/15 16:55:20 .net
SpamAssassinを使っているのですが
OBSCURED_EMAIL BODY: Message seems to contain rot13ed address
でSPAM扱いされるメールがあるのですよ。
ROT13(アルファベットを十三文字ずらすあれ)でエンコードされたアドレスがある
というのは判るんだが
何を基準にrot13edかそうでないかを判断してるのかが判らんとです。
教えてエロイ人。
212:名無しさん@お腹いっぱい。
07/02/15 17:13:04 .net
>>208
^ と ( を見てるくさい。
@ と . がこれに変換されるのかな。
213:208
07/02/15 18:07:57 .net
ってことは
/usr/share/spamassassin/20_body_tests.cf
の
body EMAIL_ROT13 /\b[a-z(\]-]+\^[a-z-]+\([a-z]{2,3}\b/
ですか。
a-z,(,],- の繰り返しで始まり、
^
a-z,- の繰り返し、
(
a-z (2 or 3) で終わるってことニカ?
なんか違うような・・・正規表現ですよねこれ
214:名無しさん@お腹いっぱい。
07/02/15 22:38:48 .net
最近、株式SPAMのキーワードがコロコロ変わって大変です。
こんなのや
S.umbol: UTEV
Current price: $0.012
Recommendation: very aggresive buy!!!
こんなの
Search for: UTEV
Current price: $0.012
Market: bullish.
215:名無しさん@お腹いっぱい。
07/02/15 23:11:36 .net
全部の文字間にHTMLタグとか
テーブルのセル1個に1文字とか
そんなん?
216:名無しさん@お腹いっぱい。
07/02/16 00:26:47 .net
いえ、textっす(´・ω・`)
今、また13発着弾してしまいました。
217:名無しさん@お腹いっぱい。
07/02/21 11:36:42 .net
/etc/mail/spamassassin/local.cfを、
URLリンク(tlec.linux.or.jp)の
user_prefsと入れ換えてもOKですか?
ユーザーは50人位です。
218:名無しさん@お腹いっぱい。
07/02/22 08:03:30 .net
>>214
個人向け、つまりfalse_positiveも自己責任で処理することを
前提に作られているから、正直お勧めしない。
多少取りこぼしてもよいのなら、 required_score 30 以上に
すれば、少しは安全になるかも。
219:名無しさん@お腹いっぱい。
07/03/23 22:10:57 .net
report_safe 0の
設定を/etc/mail/SA/local.cfに書いているのですが、
なぜか、スパムの判定結果がattachedされてしまいます。
3.17のときは全く問題なかったのですが、3.18にあげてから、
このようになりました。
どなたか教えていただけないでしょうか。
220:名無しさん@お腹いっぱい。
07/03/25 11:48:06 .net
>>216
SAを実行するユーザにて su して、
spamassassin -d spamfile|spamassassin -t -D 2>&1|lv
する。
spamd を使っている場合は、spamd を止めてから spamd -D 2>&1 とする。
デバッグメッセージに以下のようなメッセージが出てくる筈。
> [3772] dbg: config: read file /etc/spamassassin/local.cf
221:名無しさん@お腹いっぱい。
07/03/25 12:20:28 .net
>>217
レスありがとうございます。
仰せの通りやってみました。
[4218] dbg: config: using "/etc/mail/spamassassin" for site rules dir
[4218] dbg: config: read file /etc/mail/spamassassin/local.cf
という感じで、ただしく設定したものを読んでいるようです。
222:名無しさん@お腹いっぱい。
07/03/25 23:59:31 .net
>>218
なら、その後に何か error 或は warning が出てきてないか?
因みに俺の手元では spamc で問題なく実行できた。
local.cf の中身を report_safe 0 だけにしてみる。
それでダメなら、ファイルの改行コードを疑う。
223:名無しさん@お腹いっぱい。
07/03/27 00:15:56 .net
pyzor ping 通ってる?>皆の衆
224:名無しさん@お腹いっぱい。
07/03/27 00:46:16 .net
>>220
通らないね。なのでRazor2とDCCだけ。
225:名無しさん@お腹いっぱい。
07/03/27 06:56:59 .net
>>219
いろいろありがとうございます。
ふと思いついてHTML::Parserのモジュールを
アップグレードしてみたら、今のところ、うまく
動いているようです。
お騒がせしました。
普段はCPANでアップグレードしていたのですが、
気づかないうちに整合性がとれていなかったのかもしれません。
226:名無しさん@お腹いっぱい。
07/04/11 23:18:42 .net
I am a nice pretty girl.
227:名無しさん@お腹いっぱい。
07/04/11 23:32:48 .net
You is big fool man.
228:名無しさん@お腹いっぱい。
07/04/12 13:11:48 .net
>>223
これspamの常套句じゃんw
229:名無しさん@お腹いっぱい。
07/04/25 23:18:21 .net
前から気になってたんですが、
spamassassinが、SURBL等に参照するときに、
bodyを全部送っているのでしょうか?
http://と続く部分だけ送っているのでしょうか?
httpプロトコルのように、
RBLサーバとのやりとりが説明されたサイトはありませんか?
みんなが使うから、たぶん効率の良い方法を取っていると思うのですが、
どういう方法にて、やりとりしているのでしょうか?
230:名無しさん@お腹いっぱい。
07/04/26 11:32:09 .net
SURLBLの問い合わせもDNSBLと同じ、つまりDNS引いてるだけだから
送られるのはドメイン名のみのはず。
231:名無しさん@お腹いっぱい。
07/04/30 05:00:33 .net
sniff すりゃええやん
232:名無しさん@お腹いっぱい。
07/05/03 04:05:31 .net
んむ、3.2.0か。
233:名無しさん@お腹いっぱい。
07/05/03 10:54:36 .net
* bug 4636: Add support for charset normalization, so rules can be written in UTF-8 to match text in other charsets.
UTF-8対応したんだね。
分かち書きは対応してないのかな?
234:名無しさん@お腹いっぱい。
07/05/06 00:42:10 .net
postfixでバーチャルドメインな環境ですが、
特定のドメインのユーザ(複数ドメイン指定)だけ、spamassassin先生を呼ぶことはできますか?
hogehoge@aaa.com → spamassassin → メールボックス
sagesage@aaa.com → spamassassin → メールボックス
fugaduga@bbb.com → そのままメールボックスへ
hagehage@ccc.com → spamassassin → メールボックス
それとも、postfixは、すべてのメールをspamassassinに渡してしまうのでしょうか?
235:名無しさん@お腹いっぱい。
07/05/07 01:37:42 .net
spamc の -u オプションを使えないようにしたい
(spamdの起動ユーザを spamcの起動ユーザのみにしたい)
のですが、ソースをどう修正すればよいでしょうか。
spamc -u hoge としてspamdを起動すれば、
/home/hoge/.spamassassin/user_pref
を意図的に作り出せることが出来てしまいます。
これを避けたいためです。
spamd は perl ですが、
spamc は C言語なんですね、、、
spamd だけの修正(パッチ当て)で何とか対応できないでしょうか。
236:名無しさん@お腹いっぱい。
07/05/07 09:51:02 .net
>>232
spamcはspamdを呼び出すためのインターフェイスなだけだから
実際にuser_prefを作ってるのはspamdのはずだよ。
でspamdはrootとか特権ユーザで動いてるから、そうやってファイル作ることも出来てるわけ。
spamcとspamdは通信でユーザを渡してると思うので、根本的に対応するには、そのプロトコルから
変更しないと無理だと思われ。
小手先だけの対応なら、spamcのソースから-uオプションの指定をはずしてやればいいんでない?
237:名無しさん@お腹いっぱい。
07/05/07 09:52:48 .net
>>231
spamassassinはどうやって呼び出してる?
単に.forwardから呼んでるなら、フィルタしたくないユーザの.forwardからはずしてやればいいだけ。
238:名無しさん@お腹いっぱい。
07/06/22 16:43:49 .net
FreeBSD6.2 + p5-Mail-SpamAssassin-3.2.1で構築中なのですが、
デフォルトでユーザ毎にできる学習ファイル
$HOME/.spamassassin/bayes_seen
などを全ユーザで1つにして共有したいのですが、
どこかにそれ用の設定ありますでしょうか?
239:名無しさん@お腹いっぱい。
07/06/22 21:54:49 .net
>>235
amavis とか使ってMTA側でやれば?
240:名無しさん@お腹いっぱい。
07/06/24 20:05:25 .net
>>236
その場合sa-leranもamavisユーザでやるってことでしょうか?
241:名無しさん@お腹いっぱい。
07/06/26 17:07:36 .net
bayes_path
242:名無しさん@お腹いっぱい。
07/06/29 19:25:40 .net
なんかここ1-2週間、spamasassinをすりぬけてくる
日本語のspamが急激に増えたんだけど、なんでだろう?
243:名無しさん@お腹いっぱい。
07/07/03 00:29:52 .net
こっちはpdf添付の空メールが増えてる
244:名無しさん@お腹いっぱい。
07/07/04 01:56:00 .net
>>239
うちは SpamAssassin の前段階の maildropfilter で結構弾いてるっぽい。
よぉく見ると特徴的なヘッダしてるからそれで弾いてる。
245:名無しさん@お腹いっぱい。
07/08/02 01:39:02 .net
以下のヘッダ(xxx は IP アドレス)が付いている spam が多くて、対策を検討中です。
Received: from unknown (HELO ?xxx.xxx.xxx.xxx?) (xxx.xxx.xxx.xxx)
「RCVD_NUMERIC_HELO」ってルールが標準であるようですが、
上記メールは RCVD_NUMERIC_HELO に引っ掛かっていませんでした。
「RCVD_NUMERIC_HELO」というルールを使うためには、何か特別な設定が必要なのでしょうか?
/etc/mail/spamassassin/local.cf は松田さんのところの user_prefs を
private_prefs 未使用にして置き換えています。
246:名無しさん@お腹いっぱい。
07/08/08 20:54:47 .net
>>242
spamassassin.jpに相談したほうがいい
247:名無しさん@お腹いっぱい。
07/08/10 09:28:35 .net
3.1.8だと問題なくmake test通るけど、3.1.9と3.2.2でmake testでエラー出るんだけど何か変わった?
248:名無しさん@お腹いっぱい。
07/08/12 08:41:32 .net
>>244
>>243
249:名無しさん@お腹いっぱい。
07/09/02 20:08:03 .net
最近来るスパムメールって、特定のパターンにひっかからない
奴が多い。サブジェクト普通だし差出人もいろんな国から
色んなアドレス使って来る。(パターン化しないようにしてる?)
メール本文は○○.pdfが添付されてるだけだったり、 ○○.html とかが多い。
みんなどうやってはじいてるの?
250:名無しさん@お腹いっぱい。
07/09/02 20:36:35 .net
たとえば差出人や見出しはこんな感じ
Subject: oh man your nutz
From: <rkirchho@first-lan.de>
Sender: User kwaneix <kwaneix@tkhfvj>
251:名無しさん@お腹いっぱい。
07/09/03 18:23:53 .net
こんなのは動的アドレスから来てるから Postfix の方で弾いちゃってるよ
252:名無しさん@お腹いっぱい。
07/09/03 22:48:04 .net
>>246
まだpdf spam来てる?
オレんとこは8/21を最後に来てないんだが。
>>247
その情報だけじゃわかんない。
少なくとも送信元のReceived:が欲しい。
>>248
動的アドレスって、どうやって判断するんだ?
逆引きのないIPや、一見動的っぽく見えるFQDNとか、
バリエーションは世界中に無数に存在するのに?
IPとFQDNだけでspamって判断できるのか?
253:248
07/09/03 23:54:12 .net
>>249
ヒント: 送信を遅延
254:名無しさん@お腹いっぱい。
07/09/04 00:42:42 .net
>>250
smtp の応答を遅延じゃね?
255:名無しさん@お腹いっぱい。
07/09/05 20:36:29 .net
tarpitting でしょ?
256:名無しさん@お腹いっぱい。
07/09/06 06:39:47 .net
ISPのメアドじゃ出来ない方法か。
なるほど、確かにspammerはそんな極少数派の対策などする訳がないな。
257:名無しさん@お腹いっぱい。
07/11/17 21:50:43 .net
PostfixにSpamAssassinとClamAVを導入しようと思っているのですが、
amavisd-newを使うやり方と、SpamPDとClamSMTPを使うやり方とがあるっぽいんですが、
どっちがオススメでしょうか?
258:名無しさん@お腹いっぱい。
07/11/17 22:03:26 .net
>>254
俺はSpamPDとClamSMTPでやってます。
259:名無しさん@お腹いっぱい。
07/11/18 12:26:56 .net
qmail-scanner+SpamAssassin の組み合わせを使っているんですが
最近、英文Spamが大量にスルーされるのは、俺だけのところですかね?
260:名無しさん@お腹いっぱい。
07/11/18 13:01:10 .net
>>254
SpamPD+ClamSMTPで使ってるけど、安定して運用できてるよ。
261:254
07/11/18 15:24:23 .net
>>255,257
レスありがとう、SpamPDとClamSMTPで挑戦中です。
ですが、よく考えたら自鯖にSMTPで来るメールよりも、ISPからfetchmailで持ってくる
メールのほうが多数だったみたいで(あまり意識してなかった。。。)
こんな場合はやっぱ普通にfetchmail->procmail->spamc/clamdscan ですかね。
この場合はSMTP->procmailのルートの時に二重にスパムチェックしそうなので、
procmailrc分けてみようか、、、とか考えてます。
262:名無しさん@お腹いっぱい。
07/11/18 16:31:39 .net
>>258
postfix の filter 使ったら?
ClamSMTP を使いたい無いサイトは filter前に登録してチェックさせないようにしているよ。
263:254
07/11/18 16:58:38 .net
とりあえずspamPDとClamSMTPで出来たっぽいですヽ(゚∀゚)ノ
>>259
spamPDを使った場合、fetchmailで持ってくる分については別口でやらないと
いけないなぁ、という感じなんですが、postfixのfilterでやれます?
264:254
07/11/18 19:45:37 .net
そうか、fetchmailで smtphost localhost ってやればいいんですね。。(゚Д゚;)
スレ汚し失礼しました
265:名無しさん@お腹いっぱい。
07/11/19 19:38:01 .net
spamPDで質問なんですが、sa-learnするときはやはりspampdを動かしてるユーザで
やるのが正解でしょうか?
debian etchのaptでspamPDを入れたら、spampdユーザが作られて実行されるんですが、
spampdユーザにはhomeが無い、、、
で、なんとなくrootでsa-learnしてたんですが、なんか違うかな~と思いまして。。。
266:名無しさん@お腹いっぱい。
07/11/19 21:15:52 .net
>>262です
>>238 ってことですかね、、、スイマセン
267:DNS未登録さん
07/12/11 17:27:06 .net
spamdをroot権限以外で起動したいのですが、どうすればよいのでしょうか?
268:名無しさん@お腹いっぱい。
07/12/11 22:49:35 .net
>>264
-u オプションと -g オプションでユーザとグループを指定できる。
とりあえず、spamd -h、perldoc spamd 見るべし。
269:名無しさん@お腹いっぱい。
07/12/29 07:16:59 .net
>>262
sudo -H -u spampd sa-learn ... とかでよくね?
($HOMEを変更しないと ~root/.spamassassin/ を見に行くので -H 必須)
270:名無しさん@お腹いっぱい。
08/02/07 22:30:00 .net
日本語パッチあてたら日本語スパムでもBAYES_99出るようになったー!
けどやっぱまだBAYES_50止まりが大半、、、
tlecのuser_prefsのおかげでBAYES_99いかなくてもけっこう弾けてるけど、
スパム判定されて本文が添付になってしまったメールをlearnさせても正常に
(添付のオリジナルメッセージだけを対象に)学習してくれるモノでしょうか?
271:名無しさん@お腹いっぱい。
08/03/25 12:08:07 .net
探したんだけどピッタリなスレが見あたらなかったんでここで質問させてちょ
bsfilter と spamcopを組み合わせて使う方法ってどこかに書かれてないかな?
MTA直でspamcop呼び出すと必要なメールまで根こそぎ蹴られてしまいそうなので
なんとかフィルタとして微調整しながら使いたいんだけど
ベイジアンフィルタだけではもう限界だわorz
272:名無しさん@お腹いっぱい。
08/03/25 23:08:09 .net
苦労して組み合わせて使う仕組み構築するくらいなら、素直にSpamAssassin使えよ。
273:名無しさん@お腹いっぱい。
08/03/25 23:32:04 .net
bsfilter関連でいろいろと組み上げた細工もあるしさ、それも含めてルーチン
ワークができあがってるし、できるもんならそのまま引き継いで使いたいさね
ちょいと程度の苦労で済むなら・・w
どうにもアレなようならSpamAssasinに切り替えようかとは思ってるんだが
274:名無しさん@お腹いっぱい。
08/03/27 00:56:16 .net
SpamAssassin 3.2.4使ってるんですが、この手のフィルタ避けのせいか、
SPAMがすり抜けてしまいます。
>封.筒発.送して毎.月39.万.円.稼ぐ
>
>ビジ.ネスマニュ.アルに沿って初.心者でも活.動が可.能となりました。
>
>活.動時.間は自分で選択!
sa-learnしたんですが、キーワードが間の「.」で分割されているせいか、
学習出来ていないようです。
うまく排除する方法は無いもんでしょうか?
275:名無しさん@お腹いっぱい。
08/03/27 09:13:15 .net
単発個別のものに対処しようとせずに気長に…
276:名無しさん@お腹いっぱい。
08/03/27 10:50:09 .net
>>271
へー、日本語スパムでもベイジアン対策してるの出てきたんだな。
277:名無しさん@お腹いっぱい。
08/03/27 14:58:08 .net
そんなのきてるんだ。
中国・韓国・フィリピンなどの発信元を拒否してるためか、
手元にはまだ届いてない。
278:名無しさん@お腹いっぱい。
08/03/27 15:58:42 .net
気長に学習させるか、他のヒューリスティックなスコアリングに
頼るかのどちらかしかないものなぁ
279:名無しさん@お腹いっぱい。
08/04/01 01:21:43 .net
>271
そんだけ個性があれば個別のルールでスコア付けとけば良くね?
280:名無しさん@お腹いっぱい。
08/04/13 17:37:22 .net
溜まったspam判定されたメールのチェック、どうしてる?
MH形式で保存してあるんでフィルタ書いてサマリの形にしてlessでざーーーーーっと眺めるような
形にしてる(1日200~400通くらい来るから、ちんたらやっとられん)んだけど、困るのが日本語のメール。
base64とか出てくるし、もう、このクソがと。
今は読めないメールは個別にMUAで開いたりnkf通して中身確認してるんだけど、なんかスマートな
方法ないかな?
未チェックのまま捨てる事ができればいいんだけどorz
281:名無しさん@お腹いっぱい。
08/04/13 20:06:18 .net
>>277
俺はMUAでFromだけザーと流し見して捨ててるなぁ
BAYES_99をけっこう高めに設定してるんでいちおう見てるけど、
日に200件を超えるんで、ほんとは見ずに捨てたいところ。
282:名無しさん@お腹いっぱい。
08/04/13 20:39:26 .net
spam判定された物は別アドレスに転送、
条件付きフィルタでヘッダ部分を判別して自動削除してる。
283:名無しさん@お腹いっぱい。
08/04/13 23:10:59 .net
>>278-279
やっぱ別アドレス用意しといて転送、後は/var/mail/hogehoge を直接いぢるくなり
MTA使うなり・・ってのが一番融通も効いてよさそだねえ
出先で処理しなくちゃならんケースもあって、そういうのって常にMTAが使える訳でもなくてさ
telnetしか使えないとかPDAしか使えないとか
ああ、頭いてえ
284:名無しさん@お腹いっぱい。
08/04/13 23:13:05 .net
s/MTA/MUA/g
285:名無しさん@お腹いっぱい。
08/04/14 00:07:15 .net
>>277
サーバ側にSquirrelMail立ってて受信フォルダとは別のフォルダに
移動させておいて、暇なときにFrom/Subjectをざーっと見て全チェック→削除。
286:名無しさん@お腹いっぱい。
08/04/24 12:22:49 .net
spamとして弾かれるときにテンプレにされてオリジナルメールは添付ファイルになっちゃうけど
これやめさせられない?オリジナルのままヘッダに情報追加する形、もしくは追加情報いらんから
オリジナルのままにさせときたいんだけど
でないと学習させんのがメガマンドクセー><
287:名無しさん@お腹いっぱい。
08/04/24 23:22:31 .net
>>283
> これやめさせられない?
できるけど。
288:名無しさん@お腹いっぱい。
08/04/24 23:26:07 .net
そっか。さんきゅー!
289:名無しさん@お腹いっぱい。
08/04/25 09:10:03 .net
( ゚д゚)ポカーン
290:名無しさん@お腹いっぱい。
08/04/25 11:04:14 .net
,..-─‐-..、
/.: : : : : : : .ヽ
R: : : :. : pq: :i} この知りたがり屋!
|:.i} : : : :_{: :.レ′
ノr┴-<」: :j|
/:r仁ニ= ノ:.ノ|! _
/:/ = /: :/ }! |〕) ペシ ペシ
{;ハ__,イ: :f | /´ ☆
/ }rヘ ├--r─y/
/ r'‐-| ├-┴〆 _, 、_ '⌒ �
291:� 仁二ニ_‐-イ | | ∩`Д´) | l i 厂  ̄ニニ¬ ノ ⊂ノ ,ゝ、 \ \ __厂`ヽ (__ ̄) ) / /\_i⌒ト、_ ノrr- } し'し′ └-' ̄. | |_二二._」」__ノ
292:名無しさん@お腹いっぱい。
08/04/26 13:51:30 .net
local.cf を更新した時って、spamassassinのプロセス再起動が必要でしょうか?
293:名無しさん@お腹いっぱい。
08/05/14 08:31:10 .net
>>288 勿論。 >>267 perldoc sa-learn の OPTIONS の --ham 又は --spam を見ろ。
294:名無しさん@お腹いっぱい。
08/06/03 11:09:15 .net
htmlメール中に張られている、画像リンクを対処する場合、
user_prefs にどういう風に記述すればいいのでしょう???
295:名無しさん@お腹いっぱい。
08/06/03 17:47:20 .net
>>290
> 画像リンクを対処する
ってどういうことか説明しないと。
296:名無しさん@お腹いっぱい。
08/06/05 23:36:16 .net
>>290
rawbody
297:名無しさん@お腹いっぱい。
08/08/29 18:09:27 .net
tlec.linux.or.jpから落としてリネームしてそれだけって人
大丈夫なのかな・・・・
一度、デバッグしたほうがいいと思うんですが
大量のエラーがでますから
298:名無しさん@お腹いっぱい。
08/08/29 18:10:17 .net
spamassassin --lint -D
299:名無しさん@お腹いっぱい。
08/10/29 18:48:36 .net
tlec.linux.or.jp いつも更新乙です
300:名無しさん@お腹いっぱい。
08/11/13 12:28:06 .net
Content-Type: を宣言していないheaderを持つメールにスコア与えるには
どんなレシピ設定をしてやれば良いのでしょうか?
301:名無しさん@お腹いっぱい。
08/11/13 15:56:31 .net
header使えば?
302:名無しさん@お腹いっぱい。
08/12/01 16:19:53 .net
>>294
warn: config: failed to parse, now a plugin, skipping, in "/usr/local/etc/tlec_linux_or_jp/user_prefs": ok_languages ja en
303:名無しさん@お腹いっぱい。
08/12/02 11:34:17 .net
dnsrbl.com ダウン? 長いな~
304:名無しさん@お腹いっぱい。
08/12/18 18:30:52 .net
今日の昼ぐらいから急にSpamAssassinがSIGPIPEで死ぬようになって難儀している。
procmailで食わせているんだけど、毎回死ぬわけでもなく、時々。
インストールしてあるものを何か入れ替えたわけでもないし、ディスクが足りてない
わけでもない。何故だろう……。
305:名無しさん@お腹いっぱい。
08/12/18 23:22:59 .net
俺のセブンセンシズによればハードディスクが壊れかかっている。
306:名無しさん@お腹いっぱい。
08/12/19 05:58:11 .net
そうか、ディスクか。
……でもログとSMARTの情報を見たけど別段おかしくはなさそうだ。
307:名無しさん@お腹いっぱい。
08/12/19 10:28:29 .net
うちではメモリが少ないと死ぬような気がする
308:名無しさん@お腹いっぱい。
08/12/20 00:32:24 .net
メモリーが壊れかかっているのを感じるぞ。
うおー、燃え上がれ俺のコスモ!memtest86拳
309:名無しさん@お腹いっぱい。
09/01/17 18:20:40 .net
>>300
razor_agentがらみかも
310:名無しさん@お腹いっぱい。
09/01/18 10:18:27 .net
>>305
するどい。調べてみたところ、razor-users MLでの報告を発見。
それによるとどうやら c303.cloudmark.com というサーバだけが、なぜかときどき
空のgreetingを返してくれて解析に失敗して死ぬらしい。
servers.catalogue.lst からc303を外して様子をみてみる。どうもありがとう。
311:名無しさん@お腹いっぱい。
09/02/18 19:51:23 .net
お世話になってます。ところでちゃんとしたルールを自作して役に立ちたいのですが、
ルール作成のマニュアルはどこを参照したらよろしいでしょうか?
本家のDOCを斜め読みしたのですが、いまいち解りにくく。
URLリンク(wiki.apache.org)
URLリンク(spamassassin.apache.org)
URLリンク(svn.apache.org)
312:名無しさん@お腹いっぱい。
09/02/19 12:57:51 .net
s-jis → jis → 正規表現
このツールなら見かけたけど。
313:名無しさん@お腹いっぱい。
09/02/19 14:53:29 .net
豚切りスマソ
uriとかrawbodyって何。
fullはメイル全体を正規表現によるマッチングの対象とします。
したがって、"^"はメイル全体の先頭、"$"はメイル全体の末尾を意味します。
添付ファイルのヘッダを引っ掛けたいなら、 mimeheader の使用をお勧めします。
314:名無しさん@お腹いっぱい。
09/02/20 11:34:08 .net
>>307 >>309 精進頼む
対象説明
header ヘッダ
(MIME復号化済み)
body ボディのテキストパートのみ
(MIME復号化済み、HTMLタグ等の除去あり)
nbody ボディのテキストパートのみ(MIME復号化済み、
HTMLタグ等の除去あり、UTF-8に変換済み)
uri ボディに記述されたURI
rawbody ボディのテキストパートのみ(MIME復号化済み)
full 生メッセージ全体(MIME復号化なし)
URLリンク(www.emaillab.org)
315:名無しさん@お腹いっぱい。
09/02/23 19:00:43 .net
URLリンク(stock.sharpdecimal) com
このスペースが無いuriに困りましたw
316:名無しさん@お腹いっぱい。
09/02/25 22:31:57 .net
誰かSpamAssassinのマニュアルとかドキュメントのあるURLを教えてくれないか?!
317:名無しさん@お腹いっぱい。
09/02/26 12:22:03 .net
>>312 URLリンク(spamassassin.apache.org)
318:名無しさん@お腹いっぱい。
09/02/26 22:42:44 .net
>>313
㌧クス でもできれば、もう少しこう・・・温かみのある場所を頼む!
319:名無しさん@お腹いっぱい。
09/02/26 23:17:54 .net
Docs ってあるだろ
そこ見ろよ
温かみって具体的になんなんだよ
320:名無しさん@お腹いっぱい。
09/03/02 11:38:59 .net
>>315 まあそう責めるなよ
docsが不親切なのは事実だし、普及の妨げ要因なわけだし。
>>312 何が解らないんだよ?
321:名無しさん@お腹いっぱい。
09/03/02 20:00:36 .net
>>315
そこにあるドキュメントだと、どーも理解が難しくてつらかったんだよ!
>>316
単純にspamassassinで、どういう設定したらこーなるよ~ってのを調べたかったんだ
docsのMail::SpamAssassin::Conf を見ればある程度わかってきたから
あとはぐぐってがんばってみるよ
322:名無しさん@お腹いっぱい。
09/03/03 13:19:39 .net
>>317 結局クグルしかw
ググっても解らん事はここで質問すると、
後続ユーザーの為にもなるから良いんじゃね?
323:名無しさん@お腹いっぱい。
09/03/03 14:03:40 .net
URLリンク(tlec.linux.or.jp)
こういう、実践的なコードを読みながらマニュアルとつけあわせした方が
近道じゃないか?
324:名無しさん@お腹いっぱい。
09/03/03 15:21:42 .net
>>319 そのマニュアルが解りにくいって何度言ったら(ry
user_prefsは、>>310のリンク先の文章程度のが無いと理解できないのでは?
鯖管はともかく、事務系の一般ユーザーが正規表現なんかは無理。
spamassassinでググると、日本SpamAssassinユーザ会がトップw
壁が高すぐwwwwwww
325:名無しさん@お腹いっぱい。
09/03/03 16:20:02 .net
そもそも一般ユーザも使えるというだけで
一般ユーザの積極的な利用に配慮しているとは言い難いから
多少やさしく書いたところで>>320の言うような対象者は読まんだろ
素人フレンドリーにしたいなら
設定を作成する前処理系でも作ればいいと思うぞ
326:名無しさん@お腹いっぱい。
09/03/03 16:27:43 .net
そこまで大袈裟な話では無いのでは。
user_prefsを子ユーザーが書き込むGUIはいくつか有るし。
俺様ルールが書けるだけでとりあえずは十分でしょ
327:。 今はこのマニュアルすら、まともなのは無い訳で。
328:名無しさん@お腹いっぱい。
09/03/03 18:22:09 .net
向上心のないただの脳なしのくせにどうしてえらそうなんだ?
329:pupupuPu
09/03/03 18:53:09 .net
>>323 おまえはどれくらい偉いんだ?w
330:名無しさん@お腹いっぱい。
09/03/03 19:32:16 .net
天才なおまいらがマニュアル分かりやすく訳してから晒してくれ
331:名無しさん@お腹いっぱい。
09/03/03 22:41:49 .net
天才と聞いて俺様見参。
で、何を訳してほしいの?
332:名無しさん@お腹いっぱい。
09/03/03 23:56:03 .net
情報が少ないのは求められてない証拠
それではいかんと思うなら自分で行動を起こせ
オレは困ってないから興味ないわ
333:名無しさん@お腹いっぱい。
09/03/04 12:56:55 .net
>>327 ハイハイさみしいのね。
情報が少ないのは、ユーザーが少ないからw
本家DOCが、ここまで糞なのも珍しい。
334:名無しさん@お腹いっぱい。
09/03/04 16:01:21 .net
一般ユーザはすり抜け分をMUAの学習型フィルタで簡単に対処できるよな
なのにややこしいルールを書きたい一般ユーザがどれだけいるんだ?
335:名無しさん@お腹いっぱい。
09/03/04 17:54:55 .net
>>329 イタイヤツ?
>簡単に対処できるよな 簡単に対処できるよな 簡単に対処できるよな
できない場合がある。
>なのにややこしいルールを書きたい一般ユーザがどれだけいるんだ?
ややこしいルールは書きたくないだろ普通。
簡単なルールを書きたいユーザーは多い。
ただユーザーそのものが少ないがw
ユーザーが増えない理由位は想像できるよな?
336:名無しさん@お腹いっぱい。
09/03/04 18:58:16 .net
Outlook/Thunderbird/Shurikenなどにはビルトインのフィルタがあるし
Outlook Express、Beckey!、秀丸などでもフィルタを追加できる
ユーザはルールを記述するよりもGUIの方が喜ぶと思うぞ
で、そういった手元のフィルタを有効に出来ない場合がどれだけある?
簡単なルールを書きたいユーザが多いのはお前の周囲だけだったりしないのか
ユーザ数に執着するところも理解できない
うまく使えるやつは使うしお前みたいなのは使わなきゃいいだけなのにな
337:名無しさん@お腹いっぱい。
09/03/04 20:57:39 .net
>Outlook Express、Beckey!、秀丸などでもフィルタを追加できる
これは大変だろ?
そもそも、他人と情報を共有するのが難しい。
>お前の周囲だけだったりしないのか
お前、人と直接話す機会少ないだろ?友達も少ないとか......
rf[:@ZwE|6b@Zw7\4t>wwww
>ユーザ数に執着するところも理解できない
執着しているのは、むしろお前なのでは?
ところでお前は何がしたいんだ?お前が作ったDOCでも有るまいて?
ただのかまってちゃんなら消えろ。
338:名無しさん@お腹いっぱい。
09/03/04 21:30:15 .net
その言葉をそっくりお返しするぜ
草を生やしたがるやつにはろくなのがいねえわ
339:名無しさん@お腹いっぱい。
09/03/05 09:23:59 .net
俺は前衛だって上から目線だからひとりぼっちなんだよ。
まあシコシコと一人上手やってろ。
このままじゃ、いずれ消滅するソフトだし。
340:名無しさん@お腹いっぱい。
09/03/05 16:36:47 .net
まだ粘着するのか、このキチガイ。
341:名無しさん@お腹いっぱい。
09/03/05 19:07:02 .net
はたからみてるとお前も粘着している
342:名無しさん@お腹いっぱい。
09/03/06 21:06:31 .net
>>327-328
どちらも違う。
本家MLを見るとわかるが、ユーザ数は少なくはない。
結構活発に投稿されている。
そして、同じような内容の質問が度々見受けられる。
なのに、文書は更新されない。
これは開発メンバーにやる気がないと考えるのが妥当じゃないか。
343:名無しさん@お腹いっぱい。
09/03/06 23:10:02 .net
>>326
是非とも訳して欲しいものがある。
URLリンク(www.nabble.com)
trusted_networks と internal_networks の違いの質疑応答なんだが、
正直何が書いてあるんだかさっぱりわからない。
他のユーザも文書が欠けてるって認識を持ってる模様。
URLリンク(archives.free.net.ph)
344:名無しさん@お腹いっぱい。
09/03/07 00:23:05 .net
>>337
よく知ってる/使い込んでる連中にもやる気がない、が抜けてる
345:名無しさん@お腹いっぱい。
09/03/07 03:12:13 .net
訳すもなにも見たまんまじゃないの?
trusted_networks: スパム送信したり3rd party relayするような悪い子じゃないと仮定する。
善意の第三者なので悪い子から送りつけられちゃったスパムをリレーしてくるかも知れないけど
自分でスパムの送出源になったりヘッダを改竄したりはしない。
internal_networks: そのアドレス内にあるサーバは自組織内のメールサーバ(つまり
そこが送り出すメールは全て自組織発)か自組織のMX。
メールサーバ自身もそれを使ってメールを送る人も、誰も悪いことしないいい子ちゃん。
自分が使ってるISPのメールサーバは、その子自身に悪意がないことはまあ仮定できる。
でも自分と同様にそれを使ってメールを出すISPのユーザの中にスパマーもいるかも知れない。
だからtrusted_networksには指定してもい
346:いけどinternal_networksに指定するのは甘過ぎる。 これでわかるように、internal_networksはtrusted_networksより厳しいので、 常にtrusted_networksの部分集合になるはず。 んで、trusted_networksが指定されてinternal_networksが指定されない場合、 internal_networksはtrusted_networksの値を使う。 ……と書いてあるがほんとかね。その仕様はマズいんじゃないの。 より甘いもののデフォルト値としてより厳しいものを使うというなら安全だけど より厳しいもののデフォルト値としてより甘いものを使うのって安全じゃないよねえ。
347:名無しさん@お腹いっぱい。
09/03/07 06:39:00 .net
>>340
ありがとう、助かったよ
いきなり PBL/DUL check とか FP とかいう意味不明な略語が出てきて全くわからなかった
よければこれらの略語の意味を教えてくれないか
安全か否かの話なんだが
trusted_networks と internal_networks は仮想ヘッダの作成に使われる
trusted_networks は X-Spam-Relays-Untrusted / X-Spam-Relays-Trusted の判断に
internal_networks は X-Spam-Relays-External / X-Spam-Relays-Internal の判断に
仮想ヘッダはデバッグ出力で見ることができる
これらは全く別の判断で、相互に影響し合うものじゃないから
片方の設定値がない場合はもう片方の設定を引っ張ってくる、という仕様じゃないかな
348:名無しさん@お腹いっぱい。
09/03/07 13:26:27 .net
そのあたりは本題と関係ないと思ってすっとばしたんで知らん。というのもなんなので……
PBLはopen relayとかの悪い子メールサーバのリストじゃなかったっけ?
うっすらとした記憶によればDULはたぶんDial Up List。FPは知らない。
> これらは全く別の判断で、相互に影響し合うものじゃないから
あなたのいう「判断」は仮想ヘッダを生成するかどうかの判断だよね?
それらの仮想ヘッダの役割はいってみればtrusted_networks/internal_networks
(によるそのメールの仕分け)を後段に渡すだけなので、生成が独立なのは当たり前じゃないかな。
349:名無しさん@お腹いっぱい。
09/03/07 16:46:44 .net
ありがとう
> あなたのいう「判断」は仮想ヘッダを生成するかどうかの判断だよね?
ビミョーに違う
仮想ヘッダってのは Received: 行を正規化したもので
生成の際、何処までが trusted で何処から untrusted なのかを決める指標が
trusted_networks で
何処までが internal で何処から external なのかを決める指標が internal_networks
これらは設定しないと、 SA は設定がないなりに何とか切り分けようと努力する
つまり、設定されていなくてもそれなりに動作し、仮想ヘッダは必ず生成される
今手元で確認したんで断言できる
> 生成が独立なのは当たり前じゃないか
それが正直今までわからなかった
もしかすると internal にあって trusted にない IP が何か関係するのかと思ってた
350:名無しさん@お腹いっぱい。
09/03/07 22:19:54 .net
> > 生成が独立なのは当たり前じゃないか
>
> それが正直今までわからなかった
> もしかすると internal にあって trusted にない IP が何か関係するのかと思ってた
そのあたりは後段のルールの役割でしょうね。
あなたの着目した部分の役割というのは
要するにメールが経由したパスの信頼性を分類して、後段が扱いやすくすることだと思います。
351:名無しさん@お腹いっぱい。
09/03/08 13:38:53 .net
FP は False Positive で、PBL は Public BlackList じゃないかな。
352:名無しさん@お腹いっぱい。
09/03/15 21:39:27 .net
>>344-345
ありがとう
プロバ規制でずっと書き込めなくて
今はダイヤルアップで書いてる
>>339
言われてみればそれもあるかも
少なくとも開発のペースはすっかり落ちてるし
sa-update しても更新されない
ところで、ふと思ったんだけど、
spam自体が下火になりつつある、ってことはないかな?
なんか、あんまり増えたって気がしないのは自分だけかな?
353:名無しさん@お腹いっぱい。
09/03/17 11:59:59 .net
>spam自体が下火になりつつある、ってことはないかな?
ない
>なんか、あんまり増えたって気がしないのは自分だけかな?
うん
354:名無しさん@お腹いっぱい。
09/08/17 12:51:56 .net
ヘッダに
autolearn=no
が付加されたものは、
『スパムじゃないと判断したし、何も学習してないよ』
ということなんでしょうか。
また、ヘッダに付加された
autolearn=ham
は一体何なのでしょうか。
355:名無しさん@お腹いっぱい。
09/08/17 13:29:22 .net
>>3
356:48 SpamAssasin に学習させるときは spam か ham かで学習させる。 autolearn=yes は強化学習したって事じゃないかな。
357:名無しさん@お腹いっぱい。
09/08/17 18:56:50 .net
そのヘッダの意味はわからないけど、ham はスパムフィルターの用語では
スパムでないメッセージのこと。
358:名無しさん@お腹いっぱい。
09/08/21 14:19:36 .net
>>349-350
ありがとうございました
359:名無しさん@お腹いっぱい。
09/09/04 11:42:38 .net
これ精度めちゃくちゃ低いなぁ…調教次第なのかな?
POPFILEだとほぼ完璧に振り分けてるのに迷惑メールを
ザクザク受信トレイに放り込むし、閾値上げるとちょっとした
重要メールまで迷惑メールにするし、いやはや。
360:名無しさん@お腹いっぱい。
09/09/04 12:11:35 .net
調教muripo
361:名無しさん@お腹いっぱい。
09/09/04 12:42:03 .net
少なくとも ベイジアンフィルタ は学習なしには機能しないよ?
362:名無しさん@お腹いっぱい。
09/09/04 18:09:28 .net
学習させて覚えが悪いってことはない?
363:名無しさん@お腹いっぱい。
09/09/04 19:02:07 .net
月に1万通くらいスパム認定しているが、スパムじゃないのをスパム認定したのは
3、4通くらい。それもメールアドレスが ***.@*** みたいなイレギュラーアドレス。
すり抜けたスパムが5、6通くらいかな。結構快適。
364:名無しさん@お腹いっぱい。
09/09/04 23:04:24 .net
学習した結果って外に出したり共有したりできないの?
365:名無しさん@お腹いっぱい。
09/09/11 09:39:47 .net
関係ないけどpostgrey入れてみたら超快適
3日間様子を見たけど、1日平均100通のspamが0だった
postfixもほとんど弄らないでいいし、ホント入れるだけに近い
まぁ原理的にトラフィックが増えてしまうんだけど、中小なら
この程度の対策で良いのかもなーと
366:名無しさん@お腹いっぱい。
09/09/11 10:54:46 .net
トラフィックは増えないよ。
セッション数は増えるけど、本文は流れないから通信量は減る。