机器学习在恶意软件检测中的应用

)

print "Clean Files Statistics"

clean.describe()

print "Malicious Files Statistics"

malicious.describe()

以下两缸莨狁分别对应了正常法度榜样和恶意文件的统计情况：

我们可以看到这两组数据集之间的差别，特别是前两个特点字段，差别更为明显。我们可以绘制一个图表，大年夜直不雅上感触感染这些差别。

恶意软件是企业和用户天天面对的紧急威逼。无论是垂纶邮件照样经由过程浏览器直接投放的马脚应用对象，这些恶意软件可以与多种规避技巧和其他安然马脚相结合，将现有的防御体系远远抛在脑后。诸如Veil、Shelter等恶意软件框架已经被专业人士用于渗入渗出测试中，取得了异常不错的效不雅。

malicious['clean'] = 0 
clean['clean'] = 1 
import seaborn 
%matplotlib inline 
fig,ax = plt.subplots() 
x = malicious['IATRVA'] 
y = malicious['clean'] 
ax.scatter(x,y,color='r',label='Malicious') 
x1 = clean['IATRVA'] 
y1 = clean['clean'] 
ax.scatter(x1,y1,color='b',label='Cleanfiles') 
ax.legend(loc="right")

图表如下：

大年夜上图可知，恶意软件样本“聚类”程度较高，而正常文件样本稀少分布在x轴上。接下来我们可以试着绘制其他特点的图表，以便周全懂得这些样本数据。

%matplotlib inline 
fig,ax = plt.subplots() 
x = malicious['DebugRVA'] 
y = malicious['clean'] 
ax.scatter(x,y,color='r',label='Malicious') 
x1 = clean['DebugRVA'] 
y1 = clean['clean'] 
ax.scatter(x1,y1,color='b',label='Cleanfiles') 
ax.legend(loc="right")

机械进修重要办法有两种：有监督进修(supervised learning)和无监督进修(unsupervised learning)。有监督进修中，我们要处理的数据已事先打上标签，无监督进修则与之相反」?现办法都可以用于恶意软件检测，但我们重要存眷第一种办法，因为我们的目标是对文件进行归类。

绘制的图表如下;

分析“ExportSize”特点：

%matplotlib inline 
fig,ax = plt.subplots() 
x = malicious['ExportSize'] 
y = malicious['clean'] 
ax.scatter(x,y,color='r',label='Malicious') 
x1 = clean['ExportSize'] 
	
			 3/6   首页 上一页 1 2 3 4 5 6 下一页 尾页	
			

　　推荐阅读
　　Python一行代码完成并行任务
            
            众所周知，Python的并行处理才能很不睬想。我认为如不雅不推敲线程和GIL的标准参数(它们大年夜多是合法的)，其原因不是因为技巧不到位，而是我们的应用办法不恰当。大年夜多半关于Python线>>>详细阅读


本文标题：机器学习在恶意软件检测中的应用
地址：http://www.17bianji.com/lsqh/34783.html
 1/2    1