2010年4月2日星期五

gfw对某些网站有特殊的“关照”方法

gfw的url关键字屏蔽不是简单的按照单个字符串进行匹配的。比如“http://www.usa.gov/温家宝/”就不会触发gfw,但是“http://www.usa.gov/温家宝 zh.wikipedia.org/”则会触发gfw。

为了方便叙述,我把在任何url中都会触发gfw的关键字称为“一级关键字”;把和某些字符串组合后才能触发gfw的关键字称为“二级关键字”,把这些字符串称为“二级触发字”。

目前已知的二级触发字“zh.wikipedia.org”、“.google.”、“search?q=”。二级触发字有自己的二级关键字。比如“温家宝”和“.google.”会触发gfw,但是和“search?q=”就不会触发gfw。

通过二级关键字和二级触发字,gfw实现了对特定网站特定内容的屏蔽,对一些简单的url变换也起作用,也减少了误杀的概率。根据前面的几个小测试,维基百科和Google的url含有二级触发字,是gfw重点关注的对象,很多搜索引擎因为使用“search?q=”来标记关键词,所以也是gfw重点关注的对象。

大部分的gfw关键字都是二级关键字,一级关键字主要是国家领导人的姓名、六四、法轮功、动态网、无界等极不和谐的词。

没有评论:

发表评论