作家
登录

如有有一天,你的小孩问:「爸爸,什么是机器学习呀?」

作者: 来源: 2017-11-02 16:13:22 阅读 我要评论


爸爸,什么是机械进修呀?

根据练习数据,模型中的特点分可能会被设置为甜3分,咸1分,松脆1分,蔬菜为-1分。则巧克力冰淇淋、披萨、草莓、凤尾鱼、花椰菜、和球芽甘蓝在模型中的得分如下:

近日,计算机科学博士Daniel Tunkelang就在Quora上答复了这个问题——

不如我们由机械进修中的分类问题入手,教计算机进修哪些食物好吃,哪些难吃。

如有有一天,你的小孩问:「爸爸,什么是机械进修呀?」

和仁攀类不一样,计算机没有淄?棘不克不及品尝食物。所以,我们须要用很多食物样例(标记的练习数据)教管帐算机。这项样例中有厚味的食物(正例),也有恶心的(负例)。对于每个被标记的示例,我们给计算机供给了描述食物(特点)的办法。

在真正的机械进修体系中,你可能须要更多的练习数据,但3正3负的例子够我们懂得概念了。

如有有一天,你的小孩问:「爸爸,什么是机械进修呀?」

如今,我们须要一些特点。不妨就将这些样例设置为甜、咸和蔬菜三个特点,因为为二元特点,所以每种食物的每个特点都被付与“是”或“否”的值。

如有有一天,你的小孩问:「爸爸,什么是机械进修呀?」

有了这些练习数据后,计算机的工作就是大年夜这些数据中总结一个公式(模型)。如许,当它会碰到新食物时,它能根据模型决定食物是厚味照样恶心的。

一种模型是点体系(线性模型)。如不雅具备每个特点,就会获得必定分数(权重),如不雅不具备就没有分数。然后,模型将食物的点数加起来,获得最终分。

模型里有一个分界点,若得分高于分界点,模型就剖断食物厚味;如不雅分数低于分界点,就剖断难堪吃。

如有有一天,你的小孩问:「爸爸,什么是机械进修呀?」

权重绕揭捉?择分界点更轻易,因为正例都得分≥2,负例得分≤1。

总能精确找到权重和分界点不太轻易。即使找到了,最终可能会获得一个只实用于这个练习数据的模型,但当我们用新例子时,模型效不雅就没这么好了(过度拟合)。

难以答复!抓了抓开端脱发的脑袋,爸比照样被这个问题KO了。这个有些学术的问题,若何给孩子解答?

正例被标记为“厚味”,比如巧克力冰淇淋、披萨、草莓等。负例被标记为“恶心”,比如凤尾鱼、花椰菜和球芽甘蓝。

幻想的模型不仅在练习数据中精确率高,在新例中仍然有效(泛化)。平日,简单模型比复杂模型(奥卡姆剃刀)更轻易一般化。

我们可以不应用线性模型,构建决定计划树也是个好办法。在决定计划树中,只能问能用“是”和“否”答复的问题。

悠揭捉?练数据让决定计划树答对并不难,在这个示例中练习数据是如许应用的:

  • 这是蔬菜吗?
  • 如不雅是,则难吃。
  • 如不雅不是,那它是甜的吗?
  • 如不雅是,则好吃。
  • 如不雅不是,那它是松脆的吗?
  • 如不雅是,则好吃。
  • 如不雅不是,则难吃。

如同线性模型,我们须要担心过度拟合,不克不及让决定计划树太深。所以这意味着最终可能会有一个模型,固然在我们的练习数据上会犯错,但能对新数据更好泛化。

欲望孩子能听懂这个机械进修的解释~

【编辑推荐】

  1. 大年夜概念到案例:初学者须知的十大年夜机械进修算法
  2. 安然人寿谢佳标:应用Microsoft R Server对大年夜数据进行机械进修
  3. 资本盘点:有效的主动化数据科学和机械进修软件
  4. 大年夜算法实现到MiniFlow实现,打造机械进修的基本架构平台
  5. 转行AI和机械进修,你最须要控制这五大年夜技能
【义务编辑:未丽燕 TEL:(010)68476606】

  推荐阅读

  使用递归遍历并转换树形数据(以TypeScript为例)

一个同伙问我应当怎么年腋荷琐树的 JSON 数组生成 HTML,应用 <ul> 和 <li> 来构建页面元素。于是我简单的画了个树型构造图然后写了对应的模仿数据(JavaScript 对象)深度遍历const data >>>详细阅读


本文标题:如有有一天,你的小孩问:「爸爸,什么是机器学习呀?」

地址:http://www.17bianji.com/lsqh/38417.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)