作家
登录

有关机器学习每个人都应该了解的东西

作者: 来源: 2017-10-24 16:08:41 阅读 我要评论

沙龙晃荡 | 去哪儿、陌陌、ThoughtWorks在主动化运维中的实践!10.28不见不散!


本文科普了机械进修方面的常识,简单介绍了机械进修可以做什么,以及若何做的。以下是译文。

在以前的几个月中,我与很多的决定计划者交换了有关人工智能特别是机械进修方面的问题。个中有几名高管已经被投资者询问了有关他们在机械进修(Machine Learning)方面的┞方略,以及在哪些方面应用了机械进修。那么这个技巧课题为什么忽然会成为公司董事会评论辩论的话题呢?

计算机应当为仁攀类解决问题。传统的办法是“编写”所需的法度榜样,换句话说,就是我们教电脑问题解决的算法。该算法具体描述懂得决问题的过程,就像食谱一样。很多义务都可以用算法来描述。例如,在小学里,我们进修了数字加法算法。当涉及到要快速、完美地运行这种算法时,计算机比仁攀类更胜任这个工作。

机械进修

然而,这个问题解决的过程是有局限性的。我们若何辨认一张猫的┞氛片呢?这个看起来很简单的义务却难以用一种算法来描述。让我们稍等少焉,细心想想。即使是简单的解释(如“有四条腿”或“有两只眼睛”)也有其缺点,因为这些特点可能会被隐蔽,或照片可能只显示了猫的一部分。如不雅我们碰到辨认腿或眼睛的义务时,那与辨扰绫迁一样的艰苦。

这恰是机械进修展示其实力的处所。计算机不须要开辟算法来解决问题,而是应用示例来进修算法本身。我们悠揭捉?本来练习计算机。对于辨扰绫迁这个例子,我们须要应用大年夜量的标注了猫的┞氛片来练习体系(监督进修)。经由过程这种方法,算法会产生进化,继而成熟,并最终可以或许辨认出陌生图片上的猫。

遵守某种模式的反复操作就是一个典范的例子。假设有一个计算机法度榜样,你可以经由过程点击一系列复杂的菜单来应用它的一百个功能,但你天天只主动地应用个中的某些功能。经由过程不雅察你日常平凡点击的步调,计算机可以进修猜测你的下一步动作,大年夜而进步你操作的效力。计算机经由过程“进修”这些反复的数据和对象,可以使得很多步调主动化履行,大年夜而加快了速度。

事实上,在这种情况下,计算机平日不会进修经典法度榜样,甚至都不会进修模型中的参数,例如收集中的边沿权重。这个道理可以与我们大年夜脑(包含了神经元)的进修过程比拟较。像大年夜脑一样,与传统法度榜样不合,这种具有边沿权重的收集几乎弗成能被仁攀类所懂得。

在每个范畴都可以找到更多的例子:针对个别学生(特别是“大年夜型开放式在线课程”,即MOOC)定制进修教材、疾病的早期诊断、在线营销目标群体、客户流掉、主动辨认数据质量问题,或经由过程约会办事匹配用户小我信息。

在这种情况下,被称为深度进修的人工神经收集进修办法获得了巨大年夜的成功。深度进修是一种特别的机械进修,反过来竽暌怪是人工智能的一门学科,是计算机科学研究的重要分支。早在2012年,谷歌研究小构成功地练习了一个拥有16000台计算机,并大年夜1000万段YouTube视频中辨扰绫迁(和其他对象类别)的收集。他们采取的就是深度进修技巧。

机械进修

很多与演习有关的问题更偏向于属于“辨扰绫迁”这个类别,而不是“数字加法”,是以,很难用仁攀类编写的算法来解决这些问题。这些问题平日是在某些数据中辨认模式,例如辨认图像中的对象、说话中的文本或交易数据中的讹诈行动。

这里有一个简单的例子,我们来看一下猜测性保护。想象一下很多传感器正在发送数据流,有时,某些机械会产生故障。如今的难题就是进修导致故障的数据流的模式。一旦学会了这种模式,就可以在正常操作时代辨认出这种模式,大年夜而预防潜在的故障。

固然机械进修的道理并不新鲜,但今朝深受大年夜众的追捧。这重要有三个原因:起首,用于应用和练习的大年夜量数据的可用性(“大年夜数据”);其次,我们如今拥有巨大年夜的计算才能,特别是在云端;第三,一系列的开源项目使得每小我或多或少会应用一些算法。

机械进修不克不及代替传统编程,而是对传统编程的弥补。它供给了一些对象,使得我们可以或许解决迄今为止难以甚至弗成能解决的很多类问题。总而言之,这些给我们带来了新的机会,而现有的体系也越来越多地被改革并参加了机械进修功能。

因为Spark拥有很多先辈的对象,它(集成在Hadoop中)已经在机械进修范畴成为领先的大年夜数据框架。 Talend也正向着这个目标成长,并且经由过程建模可以或许抽象出一个更高的层次。建模可以降低复杂度,同时还会弱化与成长敏捷并且门槛较高的基本技巧之间的依附关系。

只有少数专家须要真正懂得机械进修方面的算法细节。然则,如不雅每小我都能懂得机械进修相干概念的话也是有好处的,比如知道机械进修是大年夜示例中进修模式,并且可以或许应用到新的数据集上。最终,机械进修扩大年夜了机械可以解决问题的类别,大年夜而实现主动化:具体来说就是经由过程决定计划来实现。这恰是计算机学到的器械;它根据大年夜练习数据积聚到的常识,对新的数据做出决定计划。一方面,我们可以经由过程主动化的决定计划,将机械进修应用在我们的营业或圈子中。另一方面,我们本身本身就是一个数据源,其他的机械可以对我们进行分析并优化他们本身的营业。


  推荐阅读

  令人抓狂的代码 - 万能正则表达式.*陷阱

启用dotall模式。在dotall模式下,模式中的.匹配随便率性字符,包含换行符。在默认情况下(即未启用dotall模式),.不匹配换行符。等价于润饰符(?s)。 启用Unix换行模式,应用"\n"标识每一行的末尾,等价>>>详细阅读


本文标题:有关机器学习每个人都应该了解的东西

地址:http://www.17bianji.com/lsqh/38145.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)