最近DoNews Blog又时常出现不稳定的状况。Keso告诉我,怀疑是trackback spam在捣乱,因为每次不稳定,随后都会看到一大堆垃圾trackback。
嗯,关于trackback spam,早有听闻、亦已目见,只是从来没觉得它会对系统运行产生什么影响。可巧今天DoNews Blog突然又出问题,用性能查看器一检查,每秒访问数剧增,很多请求不得不排队,请求队列排满后,就不断被弹出、拒绝服务。于是——大家熟悉的黄屏错误就出现了。
清空Cache、清理缓存池、重启IIS、重启服务器都没用,被拒绝的请求数直线上升。这时候,我想起了Keso的怀疑。查询一下数据库,嗬,短短时间内,成百上千条trackback spam出现在眼前。再仔细查看,大概是这么几种:卖伟哥的、开赌场的、以及放高利贷的。嗯,域名五花八门,都围绕pharmercy、gambling、poker、loans打转转。查IP,发现它们来自于不超过4个站点。暂时停止trackback功能后,blog恢复正常。
然后我开始上网搜trackback spam,查询结果满满当当2,450,000项。嗯,整个blog世界,都在为这种垃圾烦恼呢!
有一个名为MT-Blacklist/Comment Spam Clearinghouse的站点,专门研究如何阻止trackback spam。虽然它是针对MT系统的,不过对改造.Text也颇有帮助。我想说的不是技术问题,而是其中一篇文章。这篇文章列出了根据内容判断一条trackback是否spam的正则表达式。一看之下,不禁笑出声来。原来,让老外烦恼的那些trackback spam,其中一些也就是让DoNews Blog不正常的那些。
看看URL匹配黑名单——
URLPattern | Action |
---|---|
casino | Block |
penis | Block |
viagra | Block |
poker | Block |
pills | Block |
hentai | Block |
zoo | Moderate |
teen | Moderate |
incest | Block |
ambien\b | Block |
blackjack | Block |
有趣吧?hentai、zoo、teen和incest似乎在DoNews Blog没有见过,其他词都是老熟人了。黄赌毒,此trackback spam之三要义也。从国外blogger的反馈来看,trackback spam很多来自少数几个网站。Trackback这么好的理念和实现,就这样被无耻地利用了。几颗老鼠屎,确乎是可以坏一锅汤的。最怕有一天,中国人突然学会了利用trackback spam……
难怪上去那边的时候发现CSS不见了……还没见到黄屏
把这个BLOG隐藏吧。
不然,这等于是给“TrackBack Spam”做宣传哟。
相比之下,我觉得最新的MT3.17防止spam还是很有效果的,不过这里的blog我就不清楚怎么样,后台是否有审核,还是简单的用MT-Blacklist
不过是另外一种DDOS
哎~~这篇文章也有SPAM留言啊
可怜
trackback IS WAHT? WHO CAN GIVE A EXPLAIN!?
哈哈。。。。。
这样做还是没有用的
对于聪明的发送程序
利用HTML的特性
把关键字拆开,在中间加入hidden的span
就能攻破这个限制
例如
casino变成cas ino
显示的效果还是一样,但是你的分析代码就无效了
或者更简单的全角半角组合使用
🙁
我有了一些Trackback Anti-spam的经验,并且试验成功,效果不错
具体的办法,请参考我的这篇文章
http://wells.osall.com/blog/index.php?uid=1&m=content&p=344