[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[connect24h:7304] Re: お勧めのSPAM フィルタ



On Fri, 19 Mar 2004 02:18:19 +0900 (JST)
In article <20040319.021819.133816958.eisaku@xxxxxxxxxxxxxxxxxx>
[[connect24h:7294] Re: お勧めのSPAM フィルタ]
Eisaku YAMAGUCHI <eisaku@xxxxxxxxxxxxxxxxxx> wrote:

> > 英文/日文spamはほぼ完璧です。
> > 中文/韓文は英文と見なすので多少認識率落ちてしまいます。
> 
> これは,Ja or Other(==C)という判定をしているためなので,同様に
> 中文/韓文の判定ルーチンを組み込むだけの問題だと思います.

御意。

> 多国語への対応となると,それなりに必要となるCT:の整理や,CT:が宣言され
> ていない場合などのDBをどのように管理するかというポリシを明確にしないと
> クリアできない事項かと思います.

すみません。CT:て何でしょうか。

> > 問題点としては:
> > ・HTMLメールの処理が完璧じゃない。エンコーディングを誤認すると
> >   spam認定されることが。(infoseek の広告とか :-)
> 
> これは,パーサを忠実に実装する価値があるか否かですよね.

ISO-2022-JP + QP で化けたりしますね。
でもちゃんと調べてないです。

> > ・最近流行の本文が短いワーム類は抜けてくる
> 
> 個人的には,きちんと引っ掛かってくれています.

引っかかるのもあるんですが,抜けてくるのも相当数ありますね。学習
はさせているのですが。

> > ・SDBM が無限ループに嵌ることがある
> 
> これは誤解があるようです.
> 旧BBSをご覧いただくとわかりますが,sdbmの縮小処理の際に非常に時間がか
> かり,以前はUltraSPARC 300MHz + Memory. 256MBの環境で,LANG=Cのspamの
> DB縮小に7,8時間かかるような状況でした.
> これは,DBからremoveするのではなく,新たにDBを再構築して頂く形に修正
> いただくことで,7〜8時間が7,8分と,1/60の所要時間に改善されています.

そうなんですか。bkbsfilter の受信フィルタが固まってしまうので 
--auto-update 相当の処理を外していたのですが,また試してみよう。

> 無限ループでなく,多くの時間がかかって正常終了するのか否かを一度
> ご確認いただくのが賢明かと思います.

POP 受信中に数時間も待てません (;_;)
--auto-update 相当の処理を戻して様子を見てみます。


―[ Tietew ]――――――――――――――――――――――――――
 メ : tietew@xxxxxxxxxx / tietew@xxxxxxxx / tietew@xxxxxxxxxxxx
ホペ: http://www.tietew.net/     Tietew Windows Lab.
      http://www.masuclub.net/   鱒倶楽部
指紋: 26CB 71BB B595 09C4 0153  81C4 773C 963A D51B 8CAA


--[PR]------------------------------------------------------------------
●● 1つでもあてはまるようなら、今すぐ→無料登録へ ●●
□今すぐ恋愛がしたい!
□自分の恋の方法は間違ってるのか疑問!?
□私は本当に結婚できるか不安・・
お見合い相手を探す→ http://ad.freeml.com/cgi-bin/ad.cgi?id=c9VsT
------------------------------------------------------------------[PR]--
<GMO GROUP> Global Media Online  www.gmo.jp