降维算法的重要感化是紧缩数据与晋升机械进修其他算法的效力。经由过程降维算法,可以将具有几千个特点的数据紧缩至若干个特点。别的,降维算法的另一个好处是数据的可视化,例如将5维的数据紧缩至2维,然后可以用二维平面来可视。降维算法的重要代表是PCA算法(即主成分分析算法)。
推荐算法是今朝业界异常火的一种算法,在电商界,如亚马逊,天猫,京东等获得了广泛的应用。推荐算法的重要特点就是可以主动向用户推荐他们最感兴趣的器械,大年夜而增长购买率,晋升效益。推荐算法有两个重要的类别:
一类是基于物品内容的推荐,是将与用户购买的内全军似的物品推荐给用户,如许的前提是每个物品都得有若干个标签,是以才可以找出与用户购买物品类似的物品,如许推荐的好处是接洽关系程度较大年夜,然则因为每个物品都须要贴标签,是以工作量较大年夜。
另一类是基于用户类似度的推荐,则是将与目标用户兴趣雷同的其他用户购买的器械推荐给目标用户,例如小A汗青上买了物品B和C,经由算法分析,发明另一个与小A近似的用户小D购买了物品E,于是将物品E推荐给小A。
两类推荐都有各自的优缺点,在一般的电商应用中,一般是两类混淆应用。推荐算法中最有名的算法就是协同过滤算法。
(7)、其他
除了以上算法之外,机械进修界还有其他的如高斯判别,朴实贝叶斯,决定计划树等等算法。然则膳绫擎列的六个算法是应用最多,影响最广,种类最全的典范。机械进修界的一个特点就是算法浩瀚,成长百花齐放。
下面做一个总结,按照练习的数据有无标签,可以将膳绫擎算法分为监督进修算法和无监督进修算法,但推荐算法较为特别,既不属于监督进修,也不属于非监督进修,是零丁的一类。
监督进修算法:
线性回归,逻辑回归,神经收集,SVM
无监督进修算法:
推荐算法
6.机械进修的子类--深度进修
5.机械进修的应用--大年夜数据
今朝业界很多的图像辨认技巧与语音辨认技巧的进步都源竽暌冠深度进修的成长,除了本文开首所提的Cortana等语音助手,还包含一些图像辨认应用,个中典范的代表就是下图的百度识图功能。
说完机械进修的办法,下面要谈一谈机械进修的应用了。无疑,在2010年以前,机械进修的应用在某些特定范畴发挥了巨大年夜的感化,如车牌辨认,收集进击防备棘手写字符辨认等等。然则,大年夜2010年今后,跟着大年夜数据概念的鼓起,机械进修大年夜量的应用都与大年夜数据高度耦合,几乎可以认为大年夜数据是机械进修应用的最佳场景。
譬如,但凡你能找到的介绍大年夜数据魔力的文┞仿,都邑说大年夜数据若何精确精确猜测到了某些事。例如经典的Google应用大年夜数据猜测了H1N1在美国某小镇的爆发。
图13 Google成功猜测H1N1
百度猜测2014年世界杯,大年夜镌汰赛到决赛全部猜测精确。
图14 百度世界杯成功猜测了所有比赛结不雅
这些实袈溱太神奇了,那么毕竟是什么原因导致大年夜数据具有这些魔力的呢?简单来说,就是机械进修技巧。恰是基于机械进修技巧的应用,数据才能发挥其魔力。
大年夜数据的核心是应用数据的价值,机械进修是应用数据价值的关键技巧,对于大年夜数据而言,机械进修是弗成或缺的。相反,对于机械进修而言,越多的数据会越 可能晋升模型的精确性,同时,复杂的机械进修算法的计算时光也急切须要分布式计算与内存计算如许的关键技巧。是以,机械进修的隆盛也离不开大年夜数据的赞助。 大年夜数据与机械进修两者是互相促进,相依相存的关系。
机械进修与大年夜数据慎密接洽。然则,必须清醒的熟悉到,大年夜数据并不等同于机械进修,同理,机械进修也不等同于大年夜数据。大年夜数据中包含有分布式计算,内存数据库,多维分析等等多种技巧。单大年夜分析办法来看,大年夜数据也包含以下四种分析办法:
1.大年夜数据,小分析:即数据仓库范畴的OLAP分析思路,也就是多维分析思惟。
2.大年夜数据,大年夜分析:这个代表的就是数据发掘与机械进修分析法。
3.流式分析:这个重要指的是事宜驱动架构。
除了这些算法以外,有一些算法的名字在机械进修范畴中也经常出现。但他们本身并不算是一个机械进修算法,而是为懂得决某个子问题而出生的。你可以懂得他们为以上算法的子算法,用于大年夜幅度进步练习过程。个中的代表有:梯度降低法,重要应用在线型回归,逻辑回归,神经收集,推荐算法中;牛顿法,重要应用在线型回归中;BP算法,重要应用在神经收集中;SMO算法,重要应用在SVM中。
4.萌芽分析:经典代表是NoSQL数据库。
也就是说,机械进修仅仅是大年夜数据分析中的一种罢了。尽管机械进修的一些结不雅具有很大年夜的魔力,在某种场合下是大年夜数据价值最好的解释。但这并不代表机械进修是大年夜数据下的独一的分析办法。
图15 机械进修精确率与数据的关系
人工智能的成长可能不仅取决于机械进修,更取决于前面所介绍的深度进修,深度进修技巧因为深度模仿了仁攀类大年夜脑的构成,在视觉辨认与语音辨认膳绫亲锒裨的冲破了原有机械进修技巧的界线,是以极有可能是真正实现人工智能妄图的关键技巧。无论是谷歌大年夜脑照样百度大年夜脑,都是经由过程海量层次的深度进修收集所构成的。也许借助于深度进修技巧,在不远的将来,一个具有仁攀类智能的计算机真的有可能实现。
推荐阅读
2017 年 3 月 9 日,黑客地下技巧专家兼作家 ZT,即将出版一本中篇小说:建筑师启发录。他的跟随者集合在美国田纳西州首府纳什维尔的一家放弃酒吧的地下室中拜读这本小说。恰逢第 3 届年>>>详细阅读
本文标题:从机器学习谈起
地址:http://www.17bianji.com/lsqh/34959.html
1/2 1