毫无疑问,机械进修/人工智能的子范畴在以前几年越来越受迎接。今朝大年夜数据在科技行业已经炙手可热,而基于大年夜量数据来进行猜测或者得出建议的机械进修无疑是异常强大年夜的。一些最常见的机械进修例子,比如 Netflix 的算法可以根据你以前看过的片子来进行片子推荐,而 Amazon 的算轨则可以根据你以前买过的书来推荐书本。
所以如不雅你想懂得更多有关机械进修的内容,那么你该若何入门?对于我来说,我的入门课程是我在哥本哈根出国留学时参加的人工智能课。当时我的讲师是丹麦技巧大年夜学(Technical University of Denmark)的应用数学和计算机科学的全职传授,他的研究偏向是逻辑与人工智能,侧重于应用逻辑学来对人道化的筹划、推理和解决问题进行建模。这个课程包含对理论/核心概念的评论辩论和本身着手解决问题。我们应用的教材是 AI 经典之一:Peter Norvig 的 Artificial Intelligence—A Modern Approach(中文译本:《人工智能:一种现代的办法》),这本书重要讲了智能体、搜刮解决问题、对抗搜刮、概率论、多智能系一切、社会 AI 和 AI 的┞奋学/伦理/将来等等。在课程停止时,我们三小我的团队实现了一个简单的编程项目,也就是基于搜刮的智能体解决虚拟情况中的运输义务问题。
在那门课程上我已经学到了很多常识,并决定持续进修相干的课题。在以前的几个礼拜里,我在旧金山参加了多次相干的技巧讲座,涉及到深度进修、神经收集和数据构造,并且参加了一个有很多该范畴的有名专家学者参加的机械进修会议。最重要的是,我在 6 月初参加了 Udacity 上的 Intro to Machine Learning(机械进修入门) 在线课程,前几天才完成。在这篇文┞仿中,我想分享一下我大年夜课程中学到的一些最常用的机械进修算法。
机械进修算法可以分为三大年夜类:监督进修、无监督进修和强化进修。监督进修可用于一个特定的数据集(练习集)具有某一属性(标签),然则其他数据没有标签或者须要猜测标签的情况。无监督进修可用于给定的没有标签的数据集(数据不是预分派好的),目标就是要找出数据间的潜在关系。强化进修位于这两者之间,每次猜测都有必定情势的反馈,然则没有精确的标签或者缺点信息。因为这是一个介绍课程,我没有进修过强化进修的相干内容,然则我欲望以下 10 个关于监督进修和无监督进修的算法足以让你感兴趣。
监督进修
1. 决定计划树(Decision Trees)
决定计划树是一个决定计划支撑对象,它应用树形图或者决定计划模型以及可能性序列,包含有时事宜的结不雅、资本成本和效用。下图是其基来源基本理:
大年夜营业决定计划的角度来看,决定计划树是人们必须懂得的起码的是/否问题,如许才能评估大年夜多半时刻做出精确决定计划的概率。作为一种办法,它许可你以构造化和体系化的方法来解决问题,大年夜而得出合乎逻辑的结论。
2. 朴实贝叶斯分类 (Naive Bayesian classification)
朴实贝叶斯分类器是一类简单的概率分类器,它基于贝叶斯定理和特点间的强大年夜的(朴实的)自力假设。图中是贝叶斯公式,个中 P(A|B)是后验概率,P(B|A)是似然,P(A)是类先验概率,P(B)是猜测先验概率。
一些应用例子:断定垃圾邮件
- 对消息的类别进行分类,比如科技、政治、活动
- 断定文本表达的情感是积极的┞氛样消极的
- 人脸辨认
3. 最小二乘法(Ordinary Least Squares Regression)
线性指的是你用来拟合数据的模型,而最小二乘法指的是你最小化的误差度量。
4. 逻辑回归 (Logistic Regression)
逻辑回归是一个强大年夜的统计学办法,它可以用一个或多个解释变量来表示一个二项式结不雅。它经由过程应用逻辑函数来估计概率,大年夜而衡量类别依附变量和一个或多个自力变量之间的关系,后者服大年夜累计逻辑分布。
总的来说,逻辑回归可以用于以下几个真实应用处景:
- 信用评分
- 计算营销晃荡的成功率
- 猜测某个产品的收入
- 特定的某一天是否会产生地动
5. 支撑向量机(Support Vector Machine,SVM)
SVM 是二进制分类算法。给定 N 维坐标下两种类型的点,SVM 生成(N-1)维的超平面来将这些点分成两组。假设你在平面上有两种类型的可以线性分别的点,SVM 将找到一条直线,将这些点分成两种类型,并且这条直线尽可能远离所有这些点。
大年夜范围上看,应用 SVM(经由恰当的修改)解决的一些最大年夜的问题包含显示告白、仁攀类剪切位点辨认(human splice site recognition)、基于图像的性别检测,大年夜范围图像分类……
6. 集成办法(Ensemble methods)
集成办法是进修算法,它经由过程构建一组分类器,然后经由过程它们的猜测结不雅进行加权投票来对新的数据点进行分类。原始的集成办法是贝叶斯平均,然则比来的算法包含纠错输出编码、Bagging 和 Boosting。
推荐阅读
使用Visual Studio Code对Node.js进行断点调试
在开辟的过程中,几乎弗成能一次性就能写出毫无马脚的法度榜样,断点底时菌码是一个广泛的需求。作为前端开辟工程师,以往我们开辟的JavaScript法度榜样都运行在浏览器端,应用Chrome供给>>>详细阅读
本文标题:机器学习工程师必知的十大算法
地址:http://www.17bianji.com/lsqh/34824.html
1/2 1