人工智能(AI)技术有效提升恶意代码检测识别能力

发布时间 2021-02-04

近年来,随着各个行业、产业的数字化、网络化、智能化转型,数字基建走进了人们的视野。


与此同时,信息安全作为数字基建的基础保障,也迎来了新的挑战,其中对于新型关键信息基础设施的未知威胁的检测与防护提出了更高要求!


1.png


不过,不用担心~


人工智能(AI)技术的产生能够有效提升恶意代码的检测识别能力,为关键信息基础设施的防护提供强力支撑。


2.jpg


虽然“AI”我们听到了无数次,但是它到底是怎么实现恶意代码检测和分类的呢?


让我们先来了解一下机器学习吧。


机器学习其实就是一种专门研究计算机是怎样模拟或实现人类的学习行为的技术。


它的学习过程与人类的学习过程非常相似,为了便于理解,以阿童木识别坏人为例,在他看过坏人的大量相关视频后,大脑在许多遍相似图像的刺激下,就会把坏人的形象总结出规律,之后阿童木再看到符合规律的形象,就能识别谁是坏人了。


3.png

以上整个过程,称为“机器学习”


而恶意代码检测就是通过对大量的代码进行学习,其中既包括恶意的代码也包括正常的代码,这些代码在经过学习后构成了模型就可以对未知的样本进行预测和分类啦~


6.png


与此同时,作为机器学习分支的深度学习发展迅猛,它相比于传统机器学习而言,可以将特征提取的过程从手动转变为自动化提取。


7.jpg

9.jpg


不过,深度学习的模型参数虽然能远远超过传统机器学习,但是只有在训练样本足够多的情况下才可以实现。


对于部分应用而言,可以将传统机器学习和深度学习结合起来,优势互补,从而实现更好的效果。


10.jpg


在经过大量的论文调研以及实战比较之后,我们发现XGBoost(传统机器学习分类器)和TextCNN(深度学习分类器)相结合的方式就更加适合做检测恶意代码的事情。


11.png


XGBoost是基于提升树的传统机器学习分类器。它是一种极限梯度提升算法,在传统机器学习中运算速度和性能都非常优秀。


12.png


TextCNN是基于卷积神经网络的深度学习分类器。将它与XGBoost结合使用可以实现对局部特征和整体形象的兼顾。


以上整个过程串联起来就是我们基于AI的恶意代码检测方法啦。


再一起回顾一下吧~~


13.jpg


这套系统在通过大量丰富的实验和评估后,结果表明它能够有效检测识别多种不同类型的恶意代码,相比于过去已有的检测方法,比如说2016年的神经网络、2017的MSA等等,该系统在检测识别能力和准确率方面均有较大的提升!如今人工智能技术也仍在不断精进~~


14.jpg


其实,人工智能(AI)早在五六十年代时就已经正式提出,多年来经历过高峰与低谷。时至今日,它的发展日新月异,此刻的AI已经走出实验室,通过智能客服、智能医生、智能家电等服务场景在诸多行业进行深入而广泛的应用。


可以说,AI正在全面进入我们的日常生活,属于未来的力量正席卷而来。


目前,人工智能、大数据等技术也已融入启明星辰大数据安全分析、安全威胁检测、态势感知、威胁情报等多项能力中,并且服务于安全运营中心及各重点监测项目,取得了丰硕成果和客户肯定。


未来,启明星辰集团将继续深入这一研究,解决数据集不平衡所造成的分类准确率受影响问题,并进一步提升系统的运行效率,从而更好的支持大数据时代的网络安全威胁检测业务。