TrackBack Spam:一颗老鼠屎真的能坏一锅汤

最近DoNews Blog又时常出现不稳定的状况。Keso告诉我,怀疑是trackback spam在捣乱,因为每次不稳定,随后都会看到一大堆垃圾trackback。

嗯,关于trackback spam,早有听闻、亦已目见,只是从来没觉得它会对系统运行产生什么影响。可巧今天DoNews Blog突然又出问题,用性能查看器一检查,每秒访问数剧增,很多请求不得不排队,请求队列排满后,就不断被弹出、拒绝服务。于是——大家熟悉的黄屏错误就出现了。

清空Cache、清理缓存池、重启IIS、重启服务器都没用,被拒绝的请求数直线上升。这时候,我想起了Keso的怀疑。查询一下数据库,嗬,短短时间内,成百上千条trackback spam出现在眼前。再仔细查看,大概是这么几种:卖伟哥的、开赌场的、以及放高利贷的。嗯,域名五花八门,都围绕pharmercy、gambling、poker、loans打转转。查IP,发现它们来自于不超过4个站点。暂时停止trackback功能后,blog恢复正常。

然后我开始上网搜trackback spam,查询结果满满当当2,450,000项。嗯,整个blog世界,都在为这种垃圾烦恼呢!

有一个名为MT-Blacklist/Comment Spam Clearinghouse的站点,专门研究如何阻止trackback spam。虽然它是针对MT系统的,不过对改造.Text也颇有帮助。我想说的不是技术问题,而是其中一篇文章。这篇文章列出了根据内容判断一条trackback是否spam的正则表达式。一看之下,不禁笑出声来。原来,让老外烦恼的那些trackback spam,其中一些也就是让DoNews Blog不正常的那些。

看看URL匹配黑名单——

URLPattern Action
casino Block
penis Block
viagra Block
poker Block
pills Block
hentai Block
zoo Moderate
teen Moderate
incest Block
ambien\b Block
blackjack Block

有趣吧?hentai、zoo、teen和incest似乎在DoNews Blog没有见过,其他词都是老熟人了。黄赌毒,此trackback spam之三要义也。从国外blogger的反馈来看,trackback spam很多来自少数几个网站。Trackback这么好的理念和实现,就这样被无耻地利用了。几颗老鼠屎,确乎是可以坏一锅汤的。最怕有一天,中国人突然学会了利用trackback spam……

TrackBack Spam:一颗老鼠屎真的能坏一锅汤》有9个想法

  1. 相比之下,我觉得最新的MT3.17防止spam还是很有效果的,不过这里的blog我就不清楚怎么样,后台是否有审核,还是简单的用MT-Blacklist

  2. 这样做还是没有用的
    对于聪明的发送程序
    利用HTML的特性
    把关键字拆开,在中间加入hidden的span
    就能攻破这个限制
    例如
    casino变成cassajhdckajsino
    显示的效果还是一样,但是你的分析代码就无效了
    或者更简单的全角半角组合使用
    🙁

    我有了一些Trackback Anti-spam的经验,并且试验成功,效果不错
    具体的办法,请参考我的这篇文章
    http://wells.osall.com/blog/index.php?uid=1&m=content&p=344

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注