2013年9月3日星期二

加拿大研究员解密微博敏感词

微博上什么关键词会被屏蔽?为何会被封锁?多伦多大学公民实验室研究员伍仟华(Jason Q. Ng)近日推出新书《微博上的封锁》就此给出答案。 

“根据相关法律法规和政策,“xx搜索的结果未予显示。”部分网友对这新浪微博上跳出的这句话应该并不陌生。新浪微博上的敏感词层出不 穷,有不少词也会随着时间的流逝而被解禁。多伦多大学公民实验室(The Citizen Lab)谷歌政策研究员伍仟华(Jason Q. Ng)通过一个自己编写的脚本程序,在数月时间里收集了1574个会被删除的关键词。他将其中150个收进最新出版的《微博上的封锁》(Blocked on Weibo),并在每个词条后解释其被封锁的原因。

毫不遮掩 不可思议

 
《微博上的封锁》封面
 
读研究生之前的伍仟华曾从事书籍编辑工作,他编辑的一本有关中国中央电视台的书引起了他对中国矛盾且奇异的媒体环境的研究兴趣。在读研 期间他的教授展示了一张有关搜寻09年新疆暴乱结果的图表,这种毫不遮掩的封锁行为让他觉得不可思议,于是他就想弄清什么字眼在中国会被列为敏感词和其被 封的原因。

“中国数字时代”网站也推出了一个不断更新的新浪微博搜索敏感词列表。伍仟华向德国之声介绍说:“他们是通过阅读新闻而猜测哪些字眼会被封锁,输入发现确认被封锁后则将其收入列表。我则是将70万条中国维基百科字条通过一个电脑脚本程序测试了数月之后收集到这些结果。”

范围之广 过滤之细

至于这些词条被屏蔽的理由则是基于他对中国的研究了解以及与相关专家的交流。在他看来,其中最有意思的发现是那些被封锁的人名,伍仟华解释说:“我想很多 人都知道不少人名是敏感词,但他们不了解封锁范围之广和过滤之细。最初我很惊讶,因为在西方,作为政客如果民众谈及你,那是好事,但在中国,民众反正不能 进行真正的选举,所以政客认为被民众谈论得不偿失。有些甚至并未陷入丑闻的政客也搜不到。”

伍仟华推出其新书后已接受了一些英文媒体的采访,他发现对中国了解甚微的外国人会觉得这些被封锁的字本身很有意思,但他却认为字本身固然有意思,但背后隐藏的信息更是大家应该关心的内容。

“毛腊肉”“加拿大法语”为何被禁?

多伦多大学公民实验室谷歌政策研究员伍仟华
 
伍仟华继续介绍说,很多字被封锁的理由显而易见,但有些则需要经经过一番推敲。比如用来代表毛泽东的“毛腊肉”,腊肉表示毛泽东在纪念堂里遗体,因为包含对领导人不敬之意,所以被禁。而“加拿大法语”中的“大法”则和“法轮功大法”有关,所以也曾被屏蔽。

据伍仟华透露在其新书发布会上,一名现场华人听众称,他将《微博上的封锁》海报贴在微博上后,几分钟内就被删除。伍仟华在接受德国之声的采访最后强调这仅 是一份科学研究结果,并无任何政治色彩,他的这本英文书将被翻译成繁体中文并在台湾发行。他也希望这本书有朝一日能和中国大陆读者见面。

作者:安静
责编:洪沙


德国之声中文网

没有评论:

明鏡關注點

明镜博客 » 时事

明鏡歷史網

明鏡網

明鏡十大热帖