作家
登录

机器学习在恶意软件检测中的应用

作者: 来源: 2017-04-14 10:03:33 阅读 我要评论

  • self.ExportSize = self.pe.OPTIONAL_HEADER.DATA_DIRECTORY[0].Size 
  • self.IATRVA = self.pe.OPTIONAL_HEADER.DATA_DIRECTORY[12].VirtualAddress 
  • self.ResSize = self.pe.OPTIONAL_HEADER.DATA_DIRECTORY[2].Size 
  • self.LinkerVersion = self.pe.OPTIONAL_HEADER.MajorLinkerVersion 
  • self.NumberOfSections = self.pe.FILE_HEADER.NumberOfSections 
  • self.StackReserveSize =self.pe.OPTIONAL_HEADER.SizeOfStackReserve 
  • self.Dll =self.pe.OPTIONAL_HEADER.DllCharacteristics 
  • 如今我们写个简单的函数,为每个PE文件结垢荷琐字典,字典的键为特点字段,其值为特点值,如许每个样本都可以表示为一个python字典对象。如下所示: 
  • def Construct(self): 
  • sample = {} 
  • for attr, k in self.__dict__.iteritems(): 
  • if(attr != "pe"): 
  • sample[attr] = k 
  • return sample 
  • 如今我们写个简单的函数,为每个PE文件结垢荷琐字典,字典的键为特点字段,其值为特点值,如许每个样本都可以表示为一个python字典对象。如下所示:

    1. def pe2vec(): 
    2.     dataset = {} 
    3. for subdir, dirs, files in os.walk(direct): 
    4. for f in files: 
    5. file_path = os.path.join(subdir, f) 
    6. try: 
    7.                 pe = pedump.PEFile(file_path) 
    8.                 dataset[str(f)] = pe.Construct() 
    9. except Exception as e: 
    10. print e 
    11. return dataset 
    12. # now that we have a dictionary let's put it in a clean csv file 
    13. def vec2csv(dataset): 
    14.     df = pd.DataFrame(dataset) 
    15.     infected = df.transpose()  # transpose to have the features as columns and samples as rows 
    16. # utf-8 is prefered  
    17.     infected.to_csv('dataset.csv', sep=',', encoding='utf-8'

    接下来我们预备处理这些数据。

    (二)摸索数据

    这不是须要步调,但可以让你对这些数据有直不雅上的懂得。

    1. import pandas as pd 
    2. import numpy as np 
    3. import matplotlib.pyplot as plt 
    4. malicious = pd.read_csv("bucket-set.csv"
    5. clean = pd.read_csv("clean-set.csv"

        推荐阅读

        Python一行代码完成并行任务

      众所周知,Python的并行处理才能很不睬想。我认为如不雅不推敲线程和GIL的标准参数(它们大年夜多是合法的),其原因不是因为技巧不到位,而是我们的应用办法不恰当。大年夜多半关于Python线>>>详细阅读


      本文标题:机器学习在恶意软件检测中的应用

      地址:http://www.17bianji.com/lsqh/34783.html

    关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)