Top / Shuriken / 学習型フィルタ観察記
- PC公開アドレスに届いているSPAMを学習させる
- 内容別の量はだいたい以下の様な感じ
- 英語各種 >> 日本語出会い系(広告風) > 日本語出会い系(女の子偽装風) ≒ 日本語広告系 > MAILER-DAEMONもどき
- 携帯でのメールのやりとり(個人別/自分のを含む)を判別
- 1人目 女の子偽装風と類似扱いされそうなメール + 出会い系にも出てきそうな単語が出現するメール 合わせて 5% ぐらい迷惑メール扱いに
自分のは後者で4通ほど
- 誤判定されたものをCLEAN学習
- 移行の10人は誤判定もなくスルー
- 12人目 一言だけのメールが1通迷惑メール扱いに → 一応学習
- 13人目 3% ほど誤判定 1人目と同様 → 学習
- 携帯未分類 ある人のメールが5/23通誤判定 内容を読んでも判定された理由がわからず
- MAILER-DAEMONからのメールが誤判定
- もどきのSPAM学習はしているがCLEAN学習はしていないので当然
- Justsystemから(MyShop他関連するもの全て)のメールを判定
- 携帯あてのSPAM(ほとんどエロ系)を判定 → 学習
- 57/273 が判定漏れ
- PC用とでは傾向が違うのか割と判定漏れが多い印象
- バイト先の日報フォルダ(22923通)を PentiumM1.2G + 768M(CF-W2)で判定
- meeting のメールが誤判定
- タイトルが英語なせい?
- 「メールお願いします」がSPAMっぽい気もする
- 納得できてしまう内容なので固有名詞覚えてください、てな感じ
|