“钟馗”用DNA技术抓出垃圾邮件
【大澳门威尼斯人赌场官网8月26日讯】(BBC科学技术记者 推斯特报导) 很少会有人想到,当年克里克与沃森揭开DNA双螺旋结构奥秘的方法,今天可以用来打击垃圾电子邮件。
美国IBM公司TJ沃森研究中心的计算机生物学家,竟然根据基因排序中用到的分析方法,设计出一种对抗垃圾邮件的过滤软件。
这种以风水人物“钟馗”命名的算法程序能够自动识别垃圾邮件的措辞规律,从而有效过滤互联网上96.5% 的垃圾邮件。 这种过滤程序对正常邮件的误识别率仅为六千分之一。 IBM生物信息学和特征发现研究小组的两名科学家是一年前开始开发这种算法的。
他们将算法称作“钟馗”,是因为钟馗手持宝剑神笔,在八仙中是驱鬼除恶,保护商人贵重物品的重要人物。 “钟馗”的前身是另外一种给蛋白质进行生物排序的算法程序。
防毒原理
先在一个普通的处理器上用88,000条垃圾邮件作练习,需要大约15分钟,如果一个小时后,再次发现垃圾邮件,“钟馗”就可以将新的垃圾邮件增加到原来的记忆中。
研究人员里格特索斯说:“我们的信箱里就有现成的大量垃圾邮件,如果我们进行形式分析,就可以看到有些字母是频繁出现的。”“我们算法的一个特性就是能够在垃圾字符二次或多次出现时识别出来。在不在邮件内容里面都行。”
研究人员说,该算法具备强大的索引功能,可以通过辨析和索引技术有效识别已知垃圾。经过特殊处理的算法将垃圾邮件中的字符串类比成一种冗长DNA链式结构,对其中近600万处特征审查码进行识别收集。 这些特征审查码仿佛就是垃圾邮件中的特征探点,通过对它们的甄别,人们便能高效地实现垃圾邮件的识别和过滤。
各种防毒软件识别和清除垃圾邮件的技术各不相同,但IBM公司相信,使用基因排序法的防毒软件,只有“钟馗”一个。 不过,“钟馗”系统投入实际应用,还要进行一些试验和试运行。
这项研究成果最初发表在《新科学家》杂志上。
(//www.dajiyuan.com)