美國大學首次大規模分析中國微博「軟審查」

人氣 1
標籤:

【大紀元2012年03月15日訊】(大紀元記者李曉宇編譯報導)美國卡內基梅隆大學(Carnegie Mellon University,簡稱 CMU)計算機學院的語言技術專家分析了5700萬條中國的微博信息後,發現被審查的敏感詞各種各樣,從「法輪功」到「碘鹽」等不一而足。敏感詞相關信息被刪除的頻率則因當前時事和地理位置的變化而變化,被刪除的強度也有不同。這是首次有正式的學術機構針對中共對社交媒體的網絡審查展開大規模分析。

刪除博文與事件熱點和地理位置相關

卡內基梅隆大學計算機學院的研究人員分析了數以百萬條中國的微博,發現了一系列政治上敏感的短語,會引起中共的審查系統的注意。一旦博文中包含這些短語,通常都會被刪除,刪除的頻率與當前事件熱點和地理位置有關。

研究人員發現,中國的在線審查高度發達,經常被刪除的短語包括廣為人知的禁詞,比如法輪功,還有人權活動家艾未未。還有些禁詞是基於當前事件;在2011年2月期間,當兩會成為指稱「計劃中的抗議」的暗語時,這個本來是指全國人民代表大會和政治協商會議的詞成為了刪除對象。

CMU的研究也顯示某些省份微博的審查頻率更高。這一現象在西藏尤其引人注目,西藏高達53%的當地微博被刪除。

被刪博文各式各樣

舉例來說,在去年6月底和7月初的時候,網絡上開始流傳江澤民的死訊,他是在1989年天安門抗議之後掌握權力的中共前總書記。在7月6日,傳言達到了高峰,83條帶有他的名字的信息當中有64條被刪除,在7月7日,31條這樣的信息中有29條被刪除。

經常被刪除的許多微博包括了政治敏感的短語和名字,比如設計「防火長城」的方濱興,以及提到中宣部的博文。其他的則體現出事件的敏感性,去年七月溫州動車事故造成40人死亡,之後「請辭」成為了刪除對象,這明顯指的是鐵道部部長。

被刪除的詞語並非總是政治性的。2011年3月,日本福島核災難發生之後,政治上不敏感的短語,如碘鹽和輻射強度都被大量刪除。研究者們相信這是因為政府想要遏制謠言,不希望核事故導致囤積鹽的行為。

研究人員康納說:「你會看到在某些微博中,博主甚至會問,『這會被刪除嗎?』」2010年年末,紐約時報的專欄作家紀思道(Nicholas Kristof)在中國的(新浪)微博網站上開了一個賬號;在他發了一條關於法輪功的消息之後一小時之內,他的帳號被關閉了。

新浪微博審查比推特嚴重的多

研究人員還作了一項調查,把新浪微博上的消息和推特上的中文消息進行對比,後者雖然在中國被屏蔽了,但還是有精通網絡的用戶能登錄。7月6日,每75條推文中就會出現一次江澤民的名字,但在新浪微博上,5666條微博中才會出現一條——這是另一個證據說明在新浪微博上,關於江澤民的討論被壓制了。

研究方法建立 可找出規避審查的暗語

參與這項研究的人員有語言技術學院(LTI)的助理教授諾亞.史密斯(Noah Smith)、博士生大衛.巴曼(David Bamman)和機器學習系的博士生卜蘭丹.康納(Brendan O’Connor)。
研究人員在論文中指出,所謂的「防火長城」用以阻止中國居民登陸如谷歌和Facebook這樣的外國網站,這是中國最廣為人知的審查工具。

巴曼說,儘管如此,當局如果想要從網上交易或在線教育中受益的話,關閉所有網站是不可能的。替代的方式就是允許登陸網站,但是審查內容,去除那些被認為「有害」的信息。一些信息可以採用自動方式刪除,其餘的則須通過人工刪除。

CMU的團隊為了研究這種「軟」審查,分析了新浪微博上將近5700萬條消息,新浪微博有超過2億個賬號。從2011年6月27日到9月30日,他們用新浪微博提供給開發者的一個應用程序軟件(API)來收集樣本。

他們後來使用同樣的API,以隨機的方式檢查了部份微博,查看它們是否被刪除了,然後再取另一部份包括了已知的敏感詞的微博進行測試。如果這條微博被刪除,新浪則會回覆給開發者一條信息:該微博已不存在。

研究者們建立起了研究中國的軟審查的方法,現在他們有了一個工具可以積極地觀察社交媒體的審查如何隨時間演變,同時也有方法可以讓調查更深入,比如找出那些用來規避審查機器的暗語和隱喻。

相關新聞
押王立軍返北京的七名官員全部「失蹤」
大陸官方另類林書豪熱 爭祖籍 掩信仰
週五重慶日報頭版不見薄熙來
大紀元九評和退黨周刊(12-02/05-02/18)
如果您有新聞線索或資料給大紀元,請進入。
評論