[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[connect24h:7304] Re: お勧めのSPAM フィルタ
- To: connect24h@xxxxxxxxxx
- Subject: [connect24h:7304] Re: お勧めのSPAM フィルタ
- From: Tietew <tietew@xxxxxxxxxx>
- Date: Fri, 19 Mar 2004 16:29:34 +0900
On Fri, 19 Mar 2004 02:18:19 +0900 (JST)
In article <20040319.021819.133816958.eisaku@xxxxxxxxxxxxxxxxxx>
[[connect24h:7294] Re: お勧めのSPAM フィルタ]
Eisaku YAMAGUCHI <eisaku@xxxxxxxxxxxxxxxxxx> wrote:
> > 英文/日文spamはほぼ完璧です。
> > 中文/韓文は英文と見なすので多少認識率落ちてしまいます。
>
> これは,Ja or Other(==C)という判定をしているためなので,同様に
> 中文/韓文の判定ルーチンを組み込むだけの問題だと思います.
御意。
> 多国語への対応となると,それなりに必要となるCT:の整理や,CT:が宣言され
> ていない場合などのDBをどのように管理するかというポリシを明確にしないと
> クリアできない事項かと思います.
すみません。CT:て何でしょうか。
> > 問題点としては:
> > ・HTMLメールの処理が完璧じゃない。エンコーディングを誤認すると
> > spam認定されることが。(infoseek の広告とか :-)
>
> これは,パーサを忠実に実装する価値があるか否かですよね.
ISO-2022-JP + QP で化けたりしますね。
でもちゃんと調べてないです。
> > ・最近流行の本文が短いワーム類は抜けてくる
>
> 個人的には,きちんと引っ掛かってくれています.
引っかかるのもあるんですが,抜けてくるのも相当数ありますね。学習
はさせているのですが。
> > ・SDBM が無限ループに嵌ることがある
>
> これは誤解があるようです.
> 旧BBSをご覧いただくとわかりますが,sdbmの縮小処理の際に非常に時間がか
> かり,以前はUltraSPARC 300MHz + Memory. 256MBの環境で,LANG=Cのspamの
> DB縮小に7,8時間かかるような状況でした.
> これは,DBからremoveするのではなく,新たにDBを再構築して頂く形に修正
> いただくことで,7〜8時間が7,8分と,1/60の所要時間に改善されています.
そうなんですか。bkbsfilter の受信フィルタが固まってしまうので
--auto-update 相当の処理を外していたのですが,また試してみよう。
> 無限ループでなく,多くの時間がかかって正常終了するのか否かを一度
> ご確認いただくのが賢明かと思います.
POP 受信中に数時間も待てません (;_;)
--auto-update 相当の処理を戻して様子を見てみます。
―[ Tietew ]――――――――――――――――――――――――――
メ : tietew@xxxxxxxxxx / tietew@xxxxxxxx / tietew@xxxxxxxxxxxx
ホペ: http://www.tietew.net/ Tietew Windows Lab.
http://www.masuclub.net/ 鱒倶楽部
指紋: 26CB 71BB B595 09C4 0153 81C4 773C 963A D51B 8CAA
--[PR]------------------------------------------------------------------
●● 1つでもあてはまるようなら、今すぐ→無料登録へ ●●
□今すぐ恋愛がしたい!
□自分の恋の方法は間違ってるのか疑問!?
□私は本当に結婚できるか不安・・
お見合い相手を探す→ http://ad.freeml.com/cgi-bin/ad.cgi?id=c9VsT
------------------------------------------------------------------[PR]--
<GMO GROUP> Global Media Online www.gmo.jp