作家
登录

最全解析:大数据和机器学习有什么区别

作者: 来源: 2017-05-08 16:03:28 阅读 我要评论

统计进修

计算机视觉

计算机视觉=图像处理+机械进修。图像处理技巧用于将图像处理为合适进入机械进修模型中的输入,机械进修则负责大年夜图像中辨认出相干的模式。计算机视觉相干的应用异常的多,例如百度识图、手写字符辨认、车牌辨认等等应用。这个范畴是应用前景异常火热的,同时也是研究的热点偏向。跟着机械进修的新范畴深度进修的成长,大年夜大年夜促进了计算机图像识其余效不雅,是以将来计算机视觉界的成长前景弗成估计。

语音辨认

语音辨认=语音处理+机械进修。语音辨认就是音频处理技巧与机械进修的结合。语音辨认技巧一般不会零丁应用,一般会结合天然说话处理的相干技巧。今朝的相干应用有苹不雅的语音助手siri等。

天然说话处理

天然说话处理=文本处理+机械进修。天然说话处理技巧主如果让机械懂得仁攀类的说话的一门范畴。在天然说话处理技巧中,大年夜量应用了编译道理相干的技巧,例如词法分析,语法分析等等,除此之外,在懂得这个层面,则应用了语义懂得,机械进修等技巧。作为独一由仁攀类自身创造的符号,天然说话处理一向是机械进修界赓续研究的偏向。按照百度机械进修专家余凯的说法“听与看,说白了就是阿猫和阿狗都邑的,而只有说话才是仁攀类独有的”。若何应用机械进修技巧进行天然说话的的深度懂得,一向是工业和学术界存眷的核心。

机械进修的办法

1、回归算法

在大年夜部分机械进修课程中,回归算法都是介绍的第一个算法。原因有两个:一.回归算法比较简单,介绍它可以让人腻滑地大年夜统计学迁徙到机械进修中。二.回归算法是后面若干强大年夜算法的基石,如不雅不睬解回归算法,无法进修那些强大年夜的算法。回归算法有两个重要的子类:即线性回归和逻辑回归。

线性回归就是我们常见的直线函数。若何拟合出一条直线最佳匹配我所有的数据?一般应用“最小二乘法”来求解。“最小二乘法”的思惟是如许的,假设我们拟合出的直线代表数据的┞锋实值,而不雅测到的数据代表拥有误差的值。为了尽可能减小误差的影响,须请求解一条直线使所有误差的平方和最小。最小二乘法将最优问题转化为求函数极值问题。函数极值袈溱数学上我们一般会采取求导数为0的办法。但这种做法并不合适计算机,可能求解不出来,也可能计算量太大年夜。

计算机科学界专门有一个学科叫“数值计算”,专门用来晋升计算机进行各类计算时的精确性和效力问题。例如,有名的“梯度降低”以及“牛顿法”就是数值计算中的经典算法,也异常合适来处理求解函数极值的问题。梯度降低法是解决回归模型中最简单且有效的办法之一。大年夜严格意义上来说,因为后文中的神经收集和推荐算法中都有线性回归的因子,是以梯度降低法在后面的算法实现中也有应用。

逻辑回归是一种与线性回归异常类似的算法,然则,大年夜本质上讲,线型回归处理的问题类型与逻辑回归不一致。线性回归处理的是数值问题,也就是最后猜测出的结不雅是数字,例如房价。而逻辑回归属于分类算法,也就是说,逻辑回归猜测结不雅是离散的分类,例如断定这封邮件是否是垃圾邮件,以及用户是否会点击此告白等等。

实现方面的话,逻辑回归只是对对线性回归的计算结不雅加上了一个Sigmoid函数,将数值结不雅转化为了0到1之间的概率(Sigmoid函数的图像一般来说并不直不雅,你只须要懂得对数值袈浣大年夜,函数越切近亲近1,数值袈浣小,函数越切近亲近0),接着我们根据这个概率可以做猜测,例如概率大年夜于0.5,则这封邮件就是垃圾邮件,或者肿瘤是否是恶性的等等。大年夜直不雅上来说,逻辑回归是画出了一条分类线,见下图。

假设我们有一组肿瘤患者的数据,这些患者的肿瘤中有些是良性的(图中的蓝色点),有些是恶性的(图中的红色点)。这里肿瘤的红蓝色可以被称作数据的“标签”。同时每个数据包含两个“特点”:患者的年纪与肿瘤的大年夜小。我们将这两个特点与标签映射到这个二维空间上,形成了我上图的数据。

当我有一个绿色的点时,我该断定这个肿瘤是恶性的┞氛样良性的呢?根据红蓝点我们练习出了一个逻辑回归模型,也就是图中的分类线。这时,根据绿点涌如今分类线的左侧,是以我们断定它的标签应当是红色,也就是说属于恶性肿瘤。

逻辑回归算法划出的分类线根本都是线性的(也有划出非线性分类线的逻辑回归,不过那样的模型在处理数据量较大年夜的时刻效力会很低),这意味着当两类之间的界线不是线性时,逻辑回归的表达才能就不足。下面的两个算法是机械进修界最强大年夜且重要的算法,都可以拟合出非线性的分类线。

2、神经收集

神经收集(也称之为人工神经收集,ANN)算法是80年代机械进修界异常风行的算法,不过在90年代半途式微。如今,携着“深度进修”之势,神经收集重装归来,从新成为最强大年夜的机械进修算法之一。

神经收集的出生来源竽暌冠对大年夜脑工作机理的研究。早期生物界学者们应用神经收集啻校仿大年夜脑。机械进修的学者们应用神经收集进行机械进修的实验,发明在视觉与语音的辨认上效不雅都相当好。在BP算法(加快神经收集练习过程的数值算法)出生今后,神经收集的成长进入了一个高潮。BP算法的创造人之一是前面介绍的机械进修大年夜牛Geoffrey Hinton(图1中的中心┞愤)。

具体说来,神经收集的进修机理是什么?简单来说,就是分化与整合。在有名的Hubel-Wiesel实验中,学者们研究猫的视觉分析机理是如许的。

让我们看一个简单的神经收集的逻辑架构。在这个收集中,分成输入层,隐蔽层,和输出层。输入层负责接收旌旗灯号,隐蔽层负责对数据的分化与处理,最后的结不雅被整合到输出层。每层中的一个圆代表一个处理单位,可以认为是模仿了一个神经元,若干个处理单位构成了一个层,若干个层再构成了一个收集,也就是"神经收集"。


  推荐阅读

  一步一步搭建一个图片上传网站(后台服务器用nodejs)

前几天看了腾讯云社区的一个文件上传的文┞仿 <文件上传那些事儿> ,大年夜体上讲了以下h5中图片上传的几个核心道理,然则没有后端接收的办事器代码,没法做测试。也没有具体的一个实例都是一些根本的道理片段,并且>>>详细阅读


本文标题:最全解析:大数据和机器学习有什么区别

地址:http://www.17bianji.com/lsqh/35076.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)