作家
登录

进行数据挖掘的8个最佳开源工具

作者: 来源: 2017-04-10 09:12:25 阅读 我要评论

8、Rattle

数据发掘,又称为材料探勘、数据采矿。它是数据库常识发明(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步调,是一个发掘和分析大年夜量数据并大年夜中提守信息的过程。个一一些应用包含市场细分 - 如辨认客户​​大年夜特定品牌购买特定产品的特点,讹诈检测 - 辨认可能导致在线讹诈的交易模式等。在本文中,我们整顿了进行数据发掘的 8 个最佳开源对象。

1、Weka

进行数据发掘的8个最佳开源对象

2、Rapid Miner

RapidMiner是世界领先的数据发掘解决筹划,在一个异常大年夜的程度上有着先特技巧。它数据发掘义务涉及范围广泛,包含各类数据艺术,能简化数据发掘过程的设计和评价。

3、Orange

进行数据发掘的8个最佳开源对象

4、Knime

Orange 是一个基于组件的数据发掘和机械进修软件套装,它的功能即竽暌寡好,又很强大年夜,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开辟。它包含了完全的一系列的组件以进行数据预处理,并供给了数据帐目,过渡,建模,模式评估和勘察的功能。其由C++ 和 Python开辟,它的图形库是由跨平台的Qt框架开辟。

KNIME (Konstanz Information Miner) 是一个用户友爱,智能的,并有丰演的开源的数据集成,数据处理,数据分析和数据勘察平台。

5、jHepWork

进行数据发掘的8个最佳开源对象

jHepWork是一套功能完全的面向对象科学数据分析框架。 Jython宏是用来展示一维和二维直方图的数据。该法度榜样包含很多对象,可以用来和二维三维的科学图形进行互动。

6、Apache Mahout

Apache Mahout 是 Apache Software Foundation (ASF) 开辟的一个全新的开源项目,其重要目标是创建一些可伸缩的机械进修算法,供开辟人员在 Apache 在许可下免费应用。该项目已经成长到了它的最二个岁首,今朝只有一个公共发行版。Mahout 包含很多实现,包含集群、分类、CP 和进化法度榜样。此外,经由过程应用 Apache Hadoop 库,Mahout 可以有效地扩大到云中。

7、ELKI

ELKI(Environment for Developing KDD-Applications Supported by Index-Structures)重要用来聚类和找离群点。ELKI是类似于weka的数据发掘平台,用java编写,有GUI图形界面。可以用来寻找离群点。

进行数据发掘的8个最佳开源对象

Rattle(易于进修的 R 分析对象)供给数据的统计和可视化摘要,将数据转换成轻易建模的情势,大年夜数据中构建无监督和监督模型,以图形方法出现模型的机能,并得出新的数据集。

【编辑推荐】

  1. Web应用防护体系OpenWAF开源CC防护模块
  2. 4个开源在线查询拜访对象
  3. 3个开源的链接缩短器
  4. 天猫团队开源跨平台模块化UI界面开辟框架Tangram
  5. 开源Cillium项目为容器供给强大年夜的收集功能
【义务编辑:51CTO_OS TEL:(010)68476606】

WEKA作为一个公开的数据发掘工作平台,集合了大年夜量能承担数据发掘义务的机械进修算法,包含对数据进行预处理,分类,回归、聚类、接洽关系规矩以及在新的交互式界面上的可视化。



  推荐阅读

  我国光芯片技术升级加速 光器件占比逐年攀升

光芯片和光组件是制造光器件的基本元件,个中芯片占据技巧与价值的制高点,国内市场仍然脆弱;光组件重要包含陶瓷套管/插芯、光收发接口组件等,中国为全球最大年夜的临盆产地,市场竞争激>>>详细阅读


本文标题:进行数据挖掘的8个最佳开源工具

地址:http://www.17bianji.com/lsqh/34670.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)