Microsoft、QQ和Baidu三个例子在4个角度上的方向滤波和组合
“这是首次将方向滤波器运用到验证码的识别中。方法很简单,但效果也惊人地好。”用这种方法,无论文本验证码如何扭曲、倾斜、重叠、空心、粘连或加入噪音,即便是使用普通PC,也可以在数秒内迅速破解。经检测,世界排名前二十的网址的文本验证码均可通过此方法识别,识别率最高可达77%,准确率超过现有所有进行文本验证码研究的团队。在业界,当识别率达到0.01%便算破解成功。
Baidu的14个笔画块进行动态规划求最优解
“除了K近邻算法,也可以使用深度学习中的卷积神经网络算法来进行识别。随着字符样本库越来越大,计算机深度学习的程度越深,计算机对文本验证码的识别率会不断提高,时间也将不断缩短。我们还对某些较少被研究的复杂验证码进行了测试,一些人类都难以识别的验证码,用此种方法也可得以破解。”
此研究成果被信息系统安全顶级国际会议NDSS’2016正式全文接收。据了解,NDSS是信息系统安全领域国际公认的四大顶级会议之一(ACM CCS、IEEE Security & Privacy、USENIX Security和ISOC NDSS),创办于1994年。亚博足彩是继北大清华之后,第三家在这个会议上发表论文的大陆科研机构。
黑客(Hacker)一词,最初曾指热心于计算机技术、水平高超的电脑专家,尤其是程序设计人员,后来逐渐区分为白帽、灰帽、黑帽等。利用公共通讯网路,如互联网和电话系统,在未经许可的情况下,攻入对方系统的被称为黑帽黑客(black hat);调试和分析计算机安全系统的称为白帽黑客(white hat)。
“破解验证码的目的,不是为了破坏,而是找出现有验证码的缺陷,寻求解决方法,推动验证码研究不断发展。”高海昌称自己属于白帽黑客。
验证码:网络安全的第一关
验证码的存在,就是需要由用户肉眼识别其中的验证码信息,防止一些人利用程序自动注册、登录、灌水等等。“对验证码的研究,其实就是对其鲁棒性和可用性的研究。”高海昌说。
在验证码的领域中,鲁棒性就是要求验证码机制防破解能力强,不会轻易被计算机程序自动识别。可用性就是要求验证码机制对于人类的使用交互友好,既不能识别困难,也不能让识别时间过长。“验证码研究向前推动,难点就在于不断寻找这两者间的最佳平衡点——毕竟可用性高,就要求验证码简单,安全性便可能因此降低;而鲁棒性强,安全性大大提升,使用的方便度便不那么高。”
“最近频遭质疑的12306网站的图片验证码,人类的通过率只有8%。相反,机器通过却易如反掌。12306后台目前有581种生活中常见物体图片的验证码,包括动植昆虫、食品果蔬等12大类。数量虽不多,但考虑到图片大小、清晰度等问题,要想在短时间内予以识别,确实困难。”高海昌介绍说。对于计算机来说,581种图片的学习量再小不过——破解程序经多次尝试,建立图片答案库,不到一秒便可轻松通过验证码程序,验证码的可用性和安全性都差强人意。高海昌团队也曾就火车票售卖网站验证码问题向有关部门提出了自己的建议。