Shuriken/学習型フィルタ観察記

Top / Shuriken / 学習型フィルタ観察記
  1. PC公開アドレスに届いているSPAMを学習させる
    • 内容別の量はだいたい以下の様な感じ
    • 英語各種 >> 日本語出会い系(広告風) > 日本語出会い系(女の子偽装風) ≒ 日本語広告系 > MAILER-DAEMONもどき
  2. 携帯でのメールのやりとり(個人別/自分のを含む)を判別
    1. 1人目 女の子偽装風と類似扱いされそうなメール + 出会い系にも出てきそうな単語が出現するメール 合わせて 5% ぐらい迷惑メール扱いに
      自分のは後者で4通ほど
    2. 誤判定されたものをCLEAN学習
    3. 移行の10人は誤判定もなくスルー
    4. 12人目 一言だけのメールが1通迷惑メール扱いに → 一応学習
    5. 13人目 3% ほど誤判定 1人目と同様 → 学習
    6. 携帯未分類 ある人のメールが5/23通誤判定 内容を読んでも判定された理由がわからず
  3. MAILER-DAEMONからのメールが誤判定
    • もどきのSPAM学習はしているがCLEAN学習はしていないので当然
  4. Justsystemから(MyShop他関連するもの全て)のメールを判定
    • 当然?ながら全部セーフ
  5. 携帯あてのSPAM(ほとんどエロ系)を判定 → 学習
    • 57/273 が判定漏れ
    • PC用とでは傾向が違うのか割と判定漏れが多い印象
  6. バイト先の日報フォルダ(22923通)を PentiumM1.2G + 768M(CF-W2)で判定
    • 所要時間:2分20秒
    • ちなみに全部セーフ
  7. meeting のメールが誤判定
    • タイトルが英語なせい?
    • 「メールお願いします」がSPAMっぽい気もする
    • 納得できてしまう内容なので固有名詞覚えてください、てな感じ

トップ   差分 バックアップ リロード   一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2005-11-15 (火) 16:48:05 (5056d)