コメントスパム、トラックバックスパムの撃退にはMT-Blacklistというブラックリスト参照型のスパムフィルタを使用してきた。これはブラックリストに登録されたキーワードやURLに引っかかるトラックバックやコメントをスパムと判断する仕組みのものであり、学習型ではないためにリストに載っていない(新)スパムについてはフィルタ出来ずに書き込まれてしまうというものだ。
新スパムが書き込まれる毎にリストへの追加を行なうというイタチゴッコにいい加減ウンザリして、メールソフトのThunderbirdで使用されているような自己学習型のベジアンフィルタを使ったMovabletype用スパムフィルタが出てないかなーとと改めて探していたところ、Bayesian filter for MTというのが既にあることを発見した。
なーんだ、既にあるんじゃん。早速インストールして運用開始してみた。
ベジアンフィルタの場合、最初はスパムと非スパムの判定を学習させる必要があり、当初は誤判定を行なう可能性もあるのでトラックバックが消されてしまった場合は御容赦の程、ご一報ください。
・Bayesian filter for MT : http://james.seng.cc/archives/000152.html
なお、このフィルタを探している最中にBlacklistに対するベジアンフィルタの優位性に関する面白いディスカッション記事に出くわしたので以下に参照する。
・James Seng's Blog "Problem with blacklist" : http://james.seng.cc/archives/000156.html・Paul Graham "Filters vs Blacklists" : http://www.paulgraham.com/falsepositives.html
・・・ということでビジネスチャンスがぁ~>誰となく