作家
登录

大数据人工智能领域从菜鸟到高手晋级指南

作者: 来源: 2017-11-16 09:02:52 阅读 我要评论

其实对于绝大年夜多半人,英语并不该该被算作一门“学科”来进修,而应当被算作“对象”来竽暌姑。具体的做法也没有捷径,就是看到不懂的单词急速查,单词不消克意去记忆,下次碰到不会就再查一次,一切以快速弄懂句子含义为目标。

Arxiv以及Github是各位读者将来会特别常用的两个网站/对象,Arxiv上有最新最全的共享论文,论文中会对各类算法进行详尽的阐释,Github上有最新最好的开源代码,这些代码往往是对某种算法的实现,具体的应用办法网上有很多教程,在此不做展开。

读者可以简单的懂得为Arxiv是修炼内功的处所,而Github是修炼外功的处所。只练内功不练外功是无法解决实际问题的,但只练外功不练内功又往往毫无威力,必定要表里兼修。最后再向大年夜家介绍一个神奇的网站名叫“gitxiv”,会赞助各位找到论文与代码的对应关系。

2. 不要看书、不要看书、不要看书

一门学科怎么入门呢?菜鸟在面对这个问题时,最轻易踩入的“深坑”就是找一本威望的书来大年夜头学起,一旦踏入此坑,轻则荒废本身数周时光,重则对某一门学科彻底掉望毕生。起首好书本来就不多,往往可遇弗成求。其次即便碰到好书,为了包管学术性,书顶用语往往“严谨”但难解,且会大年夜学科的早期汗青为读者打下“坚实基本”,讲到比来的技巧手段时又戛然而止。最后,就算读者倾尽数月之功力,保持读完了,笔者可以悠揭捉?淋林的亲自实践告诉你,书中前半部分的内容一般人肯定会忘的。

当然也有间谍作况,如不雅各位已经肯定了本身的研究偏向,并且有高人/导师指导,给出了响应范畴内必读好书的名录,这一类书照样值得一看的。不过在看的时刻也要留意,不要纠结于某些细节问题,看不懂的处所可以先记下来,这类细节往往会在各位后面实践过程中的具体场景下恍然大年夜悟。

精确的做法一句话就可以概括,好书是用来查的而不是用来啃的,什么时刻来查呢?下文会慢慢解答。

3. 找对好基友,连滚带爬往前走

如今已经不是一个单打独斗,凭着跌落断崖后找到一本秘笈闭关几年就能横扫世界的时代了,无论是像Hinton(颠覆了BP算法的BP算法之父)如许的泰斗,照样像何凯明(发best paper像一般人发paper一样轻易的神奇学霸)如许的新秀,都处在各自异常靠谱的团队中与小伙伴们合营摸索。好基友不须要多,有一两个真正靠谱的就已经足够,至于队友的重要性后文会慢慢阐释。

菜鸟筑基这部分最后要给出的建议就是,切切不要在这个阶段逗留太久,不要等“预备好了”再去着手实践,因为这里的“预备好了”往往包含菜鸟的不自负,不去进一步晋升本身是永远预备不“好”的。一般情况下,想做“计算机视觉”或者“天然说话处理”等偏AI偏向的同窗在完成吴恩达的《深度进修》课程后,想做“数据发掘”的同窗在完成吴恩达的《机械进修》课程后,就可以选择响应的实践项目预备进入下一阶段了。

那么我们钙揭捉?择什么实践手段呢?最佳的情况是有大年夜神带队做真实项目,然则如许的机会往往可遇而弗成求,在此不展开评论辩论。普罗大年夜众型的办法是参加一个大年夜数据比赛项目,如今国内的“阿里天池”以及国外的“Kaggle”都是开放式的大年夜数据比赛平台,平台上会有各类组织宣布的各类真实项目供大年夜家实践、比赛。读到这里各位心里可能还存有很大年夜的疑问:“就似揭捉?会了根本课程,在没有人带的情况下能上手实践吗?”,下文将陆续答复若何“连滚带爬”的进行实践。

三、初入江湖

1. 找到一个最高的baseline

这里的“baseline”可以懂得为前人已经做出结不雅,当本身正好须要去做雷同工作时的参照。对于上文提到的情况,如不雅有大年夜神带队进行实践的话,那么带队大年夜神此前的实践经验就成为了全部小队成员的“baseline”。那对于没有“大年夜神”资本的广大年夜读者是否有更通用的解决办法呢?谜底是肯定的。如不雅读者今朝对于一类问题无大年夜下手,例如方才学完“深度进修”的课程,然则不知道若何去做“天然说话处理”类的项目,最好的办法是应用好国内的“万方”以及“知网”如许的论文萌芽平台,去萌芽相干范畴国内通俗高校的学位论文,如许的论文绝大年夜部分都是中文并且会在论文中介绍大年夜量的基本背景常识,正好知足了我们的需求。

读过背景铺垫后信赖已经不需笔者再解释为什么最好的资本往往是公开的,在此直接给出一些获取高质量资本的渠道。起首推荐国外的三个网站,分别是“Coursera”、“Arxiv”以及“Github”。

如不雅是对某一技巧方的特定常识点不明所以,例如在做“天然说话处理”偏向的项目,但却不太懂得“LSTM”,则可以应用好国内的诸如“知乎”、“家信”以及“CSDN”这类的常识分享网站,只要不是太新的理论,都可以找到响应的博文或者解答。应用上述两类渠道的合营技能是,多搜几篇文┞仿比较着看。同一个概念或者技巧,一篇文┞仿很难周全描述清跋扈,并且因为文┞仿作者不合,解释问题的出发点也不尽雷同,所以如不雅各位碰到看不懂某篇文┞仿的情况时,不消浮躁,接着看下一篇文┞仿就好。别的,前文提到的“好书”在这里就可以用来查了,读者会发明本来想记都记不住的常识点,只要“查”拆档且“用”过,那么一般想忘都忘不掉落。


  推荐阅读

  超越Softmax瓶颈:一种高秩RNN语言模型

Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践在因式分化(factorization)的基本上,基于轮回神经收集(RNN)的说话模型在多项基准上都达到了当缁ゎ佳的程度。尽管 RNN >>>详细阅读


本文标题:大数据人工智能领域从菜鸟到高手晋级指南

地址:http://www.17bianji.com/lsqh/38906.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)