「鐘馗」用DNA技術抓出垃圾郵件

標籤:

【大紀元8月26日訊】(BBC科學技術記者 推斯特報導) 很少會有人想到,當年克里克與沃森揭開DNA雙螺旋結構奧秘的方法,今天可以用來打擊垃圾電子郵件。

美國IBM公司TJ沃森研究中心的計算機生物學家,竟然根據基因排序中用到的分析方法,設計出一種對抗垃圾郵件的過濾軟件。

這種以風水人物「鐘馗」命名的算法程序能夠自動識別垃圾郵件的措辭規律,從而有效過濾互聯網上96.5% 的垃圾郵件。 這種過濾程序對正常郵件的誤識別率僅為六千分之一。 IBM生物信息學和特徵發現研究小組的兩名科學家是一年前開始開發這種算法的。

他們將算法稱作「鐘馗」,是因為鐘馗手持寶劍神筆,在八仙中是驅鬼除惡,保護商人貴重物品的重要人物。 「鐘馗」的前身是另外一種給蛋白質進行生物排序的算法程序。

防毒原理

先在一個普通的處理器上用88,000條垃圾郵件作練習,需要大約15分鐘,如果一個小時後,再次發現垃圾郵件,「鐘馗」就可以將新的垃圾郵件增加到原來的記憶中。

研究人員裡格特索斯說:「我們的信箱裡就有現成的大量垃圾郵件,如果我們進行形式分析,就可以看到有些字母是頻繁出現的。」「我們算法的一個特性就是能夠在垃圾字符二次或多次出現時識別出來。在不在郵件內容裡面都行。」

研究人員說,該算法具備強大的索引功能,可以通過辨析和索引技術有效識別已知垃圾。經過特殊處理的算法將垃圾郵件中的字符串類比成一種冗長DNA鏈式結構,對其中近600萬處特徵審查碼進行識別收集。 這些特徵審查碼彷彿就是垃圾郵件中的特徵探點,通過對它們的甄別,人們便能高效地實現垃圾郵件的識別和過濾。

各種防毒軟件識別和清除垃圾郵件的技術各不相同,但IBM公司相信,使用基因排序法的防毒軟件,只有「鐘馗」一個。 不過,「鐘馗」系統投入實際應用,還要進行一些試驗和試運行。

這項研究成果最初發表在《新科學家》雜誌上。
(//www.dajiyuan.com)

相關新聞
焦國標:我的後討伐中宣部時代
紐約時報指新一代蓋達勢力崛起
斯里蘭卡美使館無限期關閉
微軟警告:企業網路郵件產品出現漏洞
如果您有新聞線索或資料給大紀元,請進入。
評論