导图社区 Cyber Applications of DL
Cyber Application of Deep Learning,深度学习在网络空间安全领域的应用思维导图
编辑于2020-03-07 14:16:14Cyber Applications of Deep Learning Methods
Domain Generation Algorithms and Botnet Detection
DGA
C2服务器自动生成大量域名难以追溯,用于垃圾邮件、窃取个人数据、DDoS攻击等
A等[107]使用GAN合成数据,将语言编码为数字,LSTM层作为自动编码器,第一层正则化,最后一层逻辑回归,TPR从68%提高到70%
W等[108]RNN中的域名和GRU节点分类,TPR和FPR为98%和0.1%,[109]AUC0.996,[110]嵌入和LSTM与SVM和双向LSTM结合,[111]CNN+LSTM
原始域、Inception V4、LSTM-SVM、双向LSTM、MI、二进制等。[100-104]
Botnet
行为检测,To等人[115]特征热编码LSTM,dropout,十次交叉验证,不同采样方法
IOT设备及网络,M[116]双向LSTM,单词嵌入层,Mirai僵尸网络[117],四种洪泛攻击,多向量攻击,准确率91.95%到99.999%
Drive-By Download Attacks
S[118]
去燥CNN,降低良性URLs影响
1、使用了具有历史意义域特性,基于通信的方法监视域内IP和自治系统内IP间活动
2、基于URL的瞬时特征,实例相关,惟一性。3、与IP地址的地理位置相关的信息
减少了CNN误报率,从27.6%到14.8%,但检出率为90%,CNN为97%
Y[119]
使用EDCNNs和相关历史IP地址、相关历史域名及基于URL的特征分类
多个URL,检测率为95%,高于[118],但误报率达39.1%
创建EDCNN分类器集合,检出率达97.3%,FPR降低至19.6%
Network Traffic Identification
[161]W等人3层AE堆+1层sigmoid,TCP流数据(除HTTP协议),精确率91.74-100,召回率90.9-100
[162]AE+CNN+一个分类层,可识别加密和VPN流量,应用识别和流量分类F1分数分别为98和93
[163]W等1D CNN,ISCX VPN和non-VPN数据集[164],精确率和召回率99-100,VPN流量分类精确率94.9,97.3 召回率92,95.2 non-VPN(6类和12类)
File Type Identification
[165]C等信号处理,三类特征,去燥AE堆+4层DBN,准确率97.44
(1)256字节窗口中使用香农熵,50%重叠,三次插值
(2)字节序列作为信号,转换成频率空间
(3)第三类特征集是字节直方图
SPAM Identification
[165]T等人,3隐藏层RBM+DBN,准确率99.45、97,5和97.43,高于SVM
[166]M等人,5隐藏层AE,准确率95,高于DNN
Insider Threat Detection
[167]T等,DNN+RNN:每天每个用户系统日志作为特征向量输入DNN或LSTM,输出作为第二天的输入。DNN由于LSTM,PCA和SVM等,95检测率
Border Gateway Protocol Anomaly Detection
BGP缺陷会导致DDoS、嗅探、改变路由和窃取网络拓扑数据
[169]C等提取了33个特征,LSTM+逻辑回归,正确率99.5%
Verification If Keystrokes Were Typed by a Human
[170]K等人RNN+sigmoid,80准确率,0误报,LSTM+sigmoid也可以
User Authentication
[171]S等人,提取信道状态信息,3层AE,SVM检测,准确率91
False Data Injection Attack Detection
CPS、智能电网等遭受FDI攻击
[172]H等人,CGBTBMs+4隐藏层CDBN,大于93准确率
Network Intrusion Detection
DBN
[119-121]6层DBN,最佳,优于SVM+更少层DBN,93.49%准确率,TPR 92.33%
[122]6层DBN,获得97.9%准确率,[123]准确率97.5%,训练40%数据
RBM
[124]体系结构较[120】简单,准确度41%-82%
[125】使用AE降维,RBM+DBN,92.2%TPR和1.58%FPR
AE
[103]4隐藏层AE+高斯朴素贝叶斯,83.34%准确率
[126]AE和RBMs KDD-99降维,9个特征,K-means聚类,91.86%,92.12%准确率
[127、128]变分AE,97.59%准确率,低于使用类不平衡校正技术,多数投票分类器最好达99.99%,[129]AE集合,AE重建均方根误差训练新AE,比隔离森林和高斯混合好
wang[131]
CTU-13和USTC-TFC2016数据集,正常和恶意分类各10个类型
预处理:将原始网络流量数据转为图像,输入LeNet[132]CNN中
20类分类器(99.17%,10类正常99.4%,恶意98.52%)+二进制分类器(100%)
J[133]
稀疏AE+有监督softmax 3层,两个模型:正常恶意流量类型,正常和四种攻击类型
AE包含两个隐藏层,结果给四个隐藏层DNN,二类高于五类,分别为88.4%和79.1%
RNN&DNN[136-142]
[137]效果最好,100%检测率和2.3%误报率,KDD-99
[142]83.23%准确率,NSL-KDD,正则化技术效果更好
[143]Cooja网络仿真SDN,准确率75.75%,J48 (81.05%), 朴素贝叶斯树(82.02%), 随机森林81.59%, 多层感知 77.41%
IOT
[144]5层DBN,TPR95.4%,准确率95.03%,[145]准确率99.2%二类,98.27%四类
[146]雾生态系统+5层DNN,99.2%准确率,99.27%检测率,0.85%误报率
梯形网络
[148]KDD99,90%准确率每类1000个样本,99.03%每类5000
DCAEs
[150]1层卷积层+带ReLU的全连接层+分类层,准确率98.5%
Vehicle
[154]11层DBN,用RBMs,特征来自CAN,准确率97.8%,FPR1.6%,通用命令注入攻击检测,[155]LSTM,86.9准确率,多种类型攻击检测,优于机器学习方法
WiFi
[156]AWID数据集,[157]A等2隐藏层无监督AE特征提取+两中心K-means聚类,检测率92.18,错误率4.4,精确率86.15
5G
[158-159]M等用CTU数据集,2层隐藏DBN+RNN,精确率81.26,召回率99.34
Malware
Detection
基于dll恶意安卓检测[76/77]
特性来源:所需权限、敏感API静态分析、动态行为
静态特性(分析install .apk)+动态特性(通过DroidBox沙箱分析)
双隐层DBN效果最好,准确率为96.76%,TPR为97.84%,FPR为4.32%
动态特征分析如Pascanu等人[78]
从沙箱中运行软件派生的API调用等特性
RNNs(无监督)+MLP+逻辑回归进行分类
TPR为71.71%,FPR为0.1
CNNs+RNNs Kolo等人[79]
one-hot编码将API内核转成二进制向量
分类数据训练DL算法:CNN+RNN(LSTM+softmax)
accuracy准确率 89.4%, precision精确率 85.6% recall召回率 89.4%
RNN+CNN Tobi等人[80]
API时间序列到RNN(LSTM)特征提取
特征转为图像,CNN(两个卷积层和两个池化层)分类
AUC(area under Curve) 0.96
DBN Ding等人[81]
预处理PE,操作码创建DBN提取N-Gram
DBN准确率96.7,优于SVM,K-nc,决策树
MC等人[82]
嵌入层处理操作码,输入到两层CNN(最大化池层+全连接层)+分类层
准确率98%和80%,精确率99%和27%,召回率95%和85%,F1分值97%和78%
不同数据集
AE+sigmoid,accuracy 95.64%[83]
使用RBMs,取决于数据集和方法[84-88]
zhu使用了谷歌、Gen、GRE、Viru等四类数据集,F1 95.05%[86]
软件二进制转为直方图,四层N,参数校正的线性或s型激活函数和dropout层
网络行为如C2
Shi等人[91],关注通信目的的改变和共同的潜在功能
RSNN,29562恶意样本,精确率97.6%,召回率为96.2%,F1得分为96.9
外部HTTP头,M等人[92]识别由恶意软件流量,准确率为97.1%,FPR为1.0%,DNN
移动边缘计算MEC的安全问题
一个RBMs隐层的DBN无监督+分类层,准确率高91%到96%
500个恶意+5000个良性
勒索软件
H[94]动态CNNs对编译的BE加密原语分类
DCNN和11个卷积+k-mas池化,准确率91.3%
Classification
DNN
微软[98],空终止模式、API调用三元组、单个API调用和一个输入参数不同组合
参数组合生成5千万特征,选取17.9万,随机投影压缩到几千个
无RBMs的单层DNN表现最好,FPR0.35%
C等人[99]9层DNN,层间BN+dropout,准确率97%,二维可视化
[104]特征仅依赖软件动态分析,原始可执行文件、API和参数流,0.36%误差率
CNN
二进制文件到二维灰度图,二维CNN分类[100]
操作码视为单词,一维CNN分类,增加一个嵌入层,准确率99.52%
DBN
D等人[101] DBN训练、生成签名、分类、AE去燥
沙箱提取日志,n-gran,8层DBN去燥,AE预训练,30个数字的向量
C4 security1.8k软件训练,SVM分类,准确率98.6%
RNN+AE,SVM
W[102]使用双向RNN+AE将API序列变为低维向量,准确率99.1%
RNN+AE模型解释文件访问模式,分类0day攻击,99.2%准确率
[103]调用API构建AE分类器,SVM分类器最好,96.3准确率
但使用一元Xgboost分类器准确率98.2%
aDLmodel[105]
在对抗样本上进一步测试模型,测试DNN泛化能力
DNN:两个隐藏层+softmax层,准确度95.93%到98.35%