最近DoNews Blog又时常出现不稳定的状况。
Keso告诉我,怀疑是trackback spam在捣乱,因为每次不稳定,随后都会看到一大堆垃圾trackback。
嗯,关于trackback spam,早有听闻、亦已目见,只是从来没觉得它会对系统运行产生什么影响。可巧今天DoNews Blog突然又出问题,用性能查看器一检查,每秒访问数剧增,很多请求不得不排队,请求队列排满后,就不断被弹出、拒绝服务。于是——大家熟悉的黄屏错误就出现了。
清空Cache、清理缓存池、重启IIS、重启服务器都没用,被拒绝的请求数直线上升。这时候,我想起了Keso的怀疑。查询一下数据库,嗬,短短时间内,成百上千条trackback spam出现在眼前。再仔细查看,大概是这么几种:卖伟哥的、开赌场的、以及放高利贷的。嗯,域名五花八门,都围绕pharmercy、gambling、poker、loans打转转。查IP,发现它们来自于不超过4个站点。暂时停止trackback功能后,blog恢复正常。
然后我开始上网搜trackback spam,查询结果满满当当
2,450,000项。嗯,整个blog世界,都在为这种垃圾烦恼呢!
有一个名为
MT-Blacklist/Comment Spam Clearinghouse的站点,专门研究如何阻止trackback spam。虽然它是针对MT系统的,不过对改造.Text也颇有帮助。我想说的不是技术问题,而是其中一篇文章。这篇文章列出了根据内容判断一条trackback是否spam的正则表达式。一看之下,不禁笑出声来。原来,让老外烦恼的那些trackback spam,其中一些也就是让DoNews Blog不正常的那些。
看看URL匹配黑名单——
URLPattern |
Action |
casino |
Block |
penis |
Block |
viagra |
Block |
poker |
Block |
pills |
Block |
hentai |
Block |
zoo |
Moderate |
teen |
Moderate |
incest |
Block |
ambien\b |
Block |
blackjack |
Block |
有趣吧?hentai、zoo、teen和incest似乎在DoNews Blog没有见过,其他词都是老熟人了。黄赌毒,此trackback spam之三要义也。从国外blogger的反馈来看,trackback spam很多来自少数几个网站。Trackback这么好的理念和实现,就这样被无耻地利用了。几颗老鼠屎,确乎是可以坏一锅汤的。最怕有一天,中国人突然学会了利用trackback spam……
评论
难怪上去那边的时候发现CSS不见了……还没见到黄屏
把这个BLOG隐藏吧。
<br>
<br>不然,这等于是给“TrackBack Spam”做宣传哟。
相比之下,我觉得最新的MT3.17防止spam还是很有效果的,不过这里的blog我就不清楚怎么样,后台是否有审核,还是简单的用MT-Blacklist
不过是另外一种DDOS
哎~~这篇文章也有SPAM留言啊
可怜
trackback IS WAHT? WHO CAN GIVE A EXPLAIN!?
哈哈。。。。。
这样做还是没有用的
对于聪明的发送程序
利用HTML的特性
把关键字拆开,在中间加入hidden的span
就能攻破这个限制
例如
casino变成cas<span style="display:none">sajhdckajs</span>ino
显示的效果还是一样,但是你的分析代码就无效了
或者更简单的全角半角组合使用
:(
我有了一些Trackback Anti-spam的经验,并且试验成功,效果不错
具体的办法,请参考我的这篇文章
http://wells.osall.com/blog/index.php?uid=1&m=content&p=344
留下您的评论