作家
登录

转型AI的励志故事,从非科班到拿下阿里云栖一等奖,他经历的坑足够你学习100天

作者: 来源: 2017-11-16 09:00:56 阅读 我要评论

几乎所有人都知道人工智能这个概念;有一部分人知道“机械进修”这个概念;个一一小部分人能清跋扈描述“深度进修”、“机械进修”和“神经收集”的关系; 很少一部分人可以或许精确解释“卷积”、“池化”、“CTC”这些名词的┞俘确含义与计算/实现的办法;异常少的人能清跋扈地舆解损掉函数和反向传播的数学表达;极少极少的人可以或许阐述收集的一个修改(比如把卷积核改小)对precision/recall会产生什么竽暌拱响;几乎没有人能描述上述影响到底是什么道理。

这就是今朝“法度榜样员”这个群体,对于机械进修的懂得程度。

而我们的目标,则定位成为“异常少的人”,也就是可以或许懂得损掉函数/反向传播这些较为基本、较为底层的常识,使得本身可以或许设计新的算法或收集,或至少能帮助大年夜牛去实现他们所假想的算法和神经收集。

要实现这个小目标,我们就必须控制最基本的常识,就似乎学写汉字时,不练反正瓢响栲折是不实际的。

然则,作为“不明本相的广大年夜群众”,大年夜哪白叟手好呢? 线性代数?概率论?那是最糟糕的选择!它们只会让你入门之前就彻底损掉信念,其漫长而陡峭的进修曲线还会让你误认为这是一个不友爱的范畴。事实上,只有成为“很少一部分人”(可以或许精确解释“卷积”,“池化”,“CTC”这些名词的┞俘确含义和计算/实现办法)之后,你才真正须要去复习它们。

在这之前,你所要用到的数学常识,只有以下这三点:

1. 懂得矩阵运算的根本计算办法,可以或许手动计算[3×4]×[4×3]的矩阵,并明白为什么会获得一个[3×3]的矩阵。

2. 懂得导数的根本含义,明白为什么可以应用导数来计算梯度,并实现迭代优化。

3. 可以或许计算根本的先验及后验概率。

只要大年夜学测验不是完妒攀赖抄谜底,稍微翻翻书,你就能把这点常识找回来,可能半天都用不上。

然后就可以入门了,对于所有零基本的同窗,我都建议大年夜吴恩达的机械进修课程开端: Machine Learning - Stanford University | Coursera

吴恩达的英语又慢又清楚,课程字幕的翻译碰到位,课程设置与课中测验及时而又合理,重点清楚、功课便利,再加上吴恩达传授深刻浅出的讲解,讲解过程中不时的鼓励和奚弄,都能让你更为积极地投入到机械进修的进修之中,让你扎实而快速地控制机械进修的必备基本常识。

这门在线课程,相当于斯坦福大年夜学CS229的简化版,涵盖内容包含机械进修最基本的常识、概念及其实现,以及最常用的算法(例如PCA、SVM)和模型(全连接神经收集)。进修这门课程,重要的是基本的概念与实现。作为一名具备编程基本的开辟人员,在这个阶段要将自身理论同实践相浇忧⒛优势发挥出来,充分应用它所供给的编程功课,尽可能多地实践,大年夜理论和代码两个角度去懂得课程中的常识点。

进修完成后,你能懂得到机械进修的一些根本名词和概念,并具备必定的算法层面的编码才能。打好理论和实践的基本,你就可以进行下一阶段的进修了,个中有两大年夜的偏向:夯实基本和选择范畴。

所以,在持续进修深度神经收集之前,建议结合本身所学到的常识,回头去看一遍CS229,将传统算法整体熟悉一遍,尽可能把所有的根本概念都控制扎实。

而选择范畴,则是因为义务目标的不合,深度进修范畴已在大年夜体上分成了计算机视觉(CV)、天然说话处理(NLP)以及其他一些子范畴,例如语音和更为特别的强化进修等。在每个范畴下,都有大年夜量的研究者在投入精力研究,揭橥论文和结不雅。推敲到小我精力的限度,建议选择一到两个偏向作为主攻,跟上学术界主流的进展,其他子范畴有基本的懂得即可,须要时作为参考即可。

在完成了响应范畴的进修后,下一步要做的就是测验测验浏览最新的经典论文测验测验图复现它们了。

编程说话与深度进修框架的选择

当然,作为开辟者,想要去实现一个模型,绕不开的问题就是:

应钙揭捉?择什么竽暌癸言?应钙揭捉?择什么框架?

对于开辟人员而言,说话的选择其实不是问题。但作为入门,最为理所当然的建议则是Python,原因也异常简单:Python最好学。

而框架方面,大年夜应用者的维度去划分,当前数量异常之多的机械进修框架,则可大年夜体上分为两大年夜阵营。

  • 学术友爱型: Theano、Torch与Caffe

学术研究时,弄出来一个新模型、新算法、新函数是常有的事,做出新的冲破也是学术研究最根本的请求。所以,这些框架平日都便于定制模型,也可深刻修改内部实现。很多新结不雅都邑在揭橥论文的同时,供给这些框架上的实现代码以供参考。它们在机能方面也比较出色。

其价值就是,要么是应用了艰苦(Caffe:C++)或小众(Torch:Lua)的开辟说话,要么是有一些古怪的缺点(Theano:编译超等慢)。

并且,这些框架似乎都没怎么推敲过“怎么供给办事”的问题。想要安排到办事器上?Caffe已算是最简单的了,但仍要经历漫长而苦楚的摸索过程。

  • 工业友爱型: Tensorflow、MXNet与Caffe

工业上往往更重视“把一个器械做出来,并且让它运行得优胜”。所以这些框架起首就须要支撑场行练习。个中Tensorflow和MXNet支撑多机多卡、单机多卡、多机单卡并行,Caffe则支撑单机多卡,固然机能还不是特别幻想。

在我们的测试中,Tensorflow的双卡并行只能达到单卡的1.5倍阁下机能,卡越多,这个比例越低。Caffe要好一些,但参数同步和梯度计算无论若何也都须要时光,所以没有哪个框架能在没有机能损掉的情况下实现扩大。而多机情况下,机能损掉更大年夜,很多时刻都让人认为无法接收。

相对来说,只有Tensorflow供给了比较好的安排机制(Serving),并且有直接安排到移动端的筹划。而MXNet和Caffe则是直接编译的方法,固然也能实现,然则说实话,依然很麻烦。

至于缺点,除Caffe之外,其他两种框架对于学术界动态的跟踪都不太紧,Tensorflow到如今都没有PReLU的官方实现,前不久才刚推出一系列检测(Detection)的模型。MXNet这一点上要积极些,可是受限于较小的开辟者社区,很多结不雅都只能等待大年夜神们的contribution,或是自行实现。


  推荐阅读

  腾讯高级工程师自述:我为什么选择离开管理岗位?_技术栈微信半月刊第06期

Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践 【义务编辑:陶家龙 TEL:(010)68476606】【义务编辑:陶家龙 TEL:(010)68476606】【义务编辑:陶家>>>详细阅读


本文标题:转型AI的励志故事,从非科班到拿下阿里云栖一等奖,他经历的坑足够你学习100天

地址:http://www.17bianji.com/lsqh/38897.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)