机械进修的成长诠释了多学科交叉的重要性和须要性。然而这种交叉不是简单地彼此知道几个名词或概念就可以的,是须要真正的融合贯通。统计学家弗莱德曼早期大年夜事物理学研究,他是优化算法大年夜师,并且他的编程才能同样令人赞叹。乔丹传授既是一流的计算机学家,又是一流的统计学家,而他的博士专业为心理学,他可以或许承担起建立统计机械进修的重担。辛顿传授是世界最有名的认贴心理学家和计算机科学家。固然他很早就成就斐然,在学术界申明鹊起,但他依然始终活泼在一线,本身写代码。他提出典范多设法主意简单、可行又异常有效,被称为巨大年夜的思惟家。恰是因为他的睿智和身材力行,深度进修技巧迎来了概绫屈性的冲破。这些学者异常务实,大年夜不提那些空洞无物的概念和框架。他们遵守自下而上的方法,大年夜具体问题、模型、办法、算法等着手,一步一步实现体系化。
可以说机械进修是由学术界、工业界、创业界(或比赛界)等合力培养的。学术界是引擎,工业界是驱动,创业界是活力和将来。学术界和工业界应当有各自的职责和分工。学术界的职责在于建立和成长机械进修学科,培养机械进修范畴的专门人才;而大年夜项目、大年夜工程更应当由市场来驱动,由工业界来实施和完成。
我国机械进修成长近况和前程
机械进修在我国获得了广泛的存眷,也取得了必定的成就,但我认为大年夜多半研究集中在数据发掘层面,我国大年夜事纯粹机械进修研究的学者屈指可数。在计算机学术界,理论、办法等基本性的研究没有获得足够看重,一些理论背景深挚的范畴甚至被边沿化。而一些“多余学科”、“夕阳学科”则集合了大年夜量的人力、财力,这使得我国在国际主流计算机范畴中缺乏竞争力和影响力。
统计学在我国照样一个弱势学科,比来才被国度定为一级学科。我国统计学处于两个极端,一是它被算作数学的一个分支,重要研究概率论、随机过程以及数理统计理论等。二是它被划为经计揭捉?的分支,重要研究经济分析中的应用。而机械进修在统计学界还没有被深度地存眷。统计学和计算机科学仍处于沃塞曼所说的“各自为战”阶段。
我国计算机学科的培养体系还根本逗留在早期成长阶段,如今的学生大年夜小就与计算机接触,他们的编程才能和国外学生比拟没有任何劣势。但因为理论常识一向没有被充分看重,并且统计学的重要性没有被充分熟悉到,这些造成了学生的数学才能和国外有名高校比拟差距很大年夜。我国大年夜多半大年夜学计算机专业的本科生都开设了人工智能课程,研究生则开设了机械进修课程,但无论是深度、宽度照样常识构造都落后于学科的成长,不克不及适应时代的须要。是以,人才的培养无论是质量照样数量都无法知足工业界的急切需求。
今朝数据科学专业袈溱我国获得了极大年夜的存眷,北京大年夜学、复旦大年夜学和中国人平易近大年夜学等依托雄厚的统计学实力纷纷建立了数据科学专业或大年夜数据研究院,并已经开端招收本科生和研究生。然则今朝还没有一所大年夜学开设机械进修专业。机械进修对其他应用或理论学科有辐射感化,也是连接两者的纽带。一方面它可认为理论端贮备人才,另一方面可以结合不合范畴问题,比如医疗数据、金融数据、图像视频数据等,为应用端输送人才。是以,我认为在计算机科学本科专业中,增长机械进修的练习是须要的。
1.加强概率与统计的基本课程,建议采取莫里斯·德格鲁特(Morris H. DeGroot)和马克·舍维什(Mark J. Schervish)合著的第四版《概率论与数理统计》(Probability and Statistics)为教材。
2.在线性代数课程里,加强矩阵分析的内容。教材建议应用吉尔伯特·斯特朗(Gilbert Strang)的《线性代数导论》(Introduction to Linear Algebra)。吉尔伯特·斯特朗在麻省理工学院一向讲述线性代数,他的网上视频课程堪称经典。后续建议开设矩阵计算,采取特雷费森·劳埃德(Trefethen N. Lloyd)和戴维·鲍(David Bau lll)著作的《数值线性代数》(Numerical Linear Algebra)为教科书。
机械进修集技巧、科学与艺术于一体,它有别于传统人工智能,是现代人工智能的核心。它牵扯到统计、优化、矩阵分析、理论计算机、编程、分布式计算等。是以,建议在已有的计算机专业本科生课程的基本上,恰当加强概率、统计和矩阵分析等课程,下面是具体课程设置和相干教材的建议:
3.开设机械进修课程。机械进修有很多经典的书本,但大年夜多不太合适做本科生的教材。比来,麻省理工学院出版的约翰·凯莱赫(John D. Kelleher)和布瑞恩·麦克·纳米(Brian Mac Namee)等人著作的《机械进修基本之猜测数据分析》(Fundamentals of Machine Learning for Predictive Data Analytics),或者安得烈·韦伯(Andrew R. Webb)和基思·科普塞(Keith D. Copsey)合著的第三版《统计模式辨认》(Statistical Pattern Recognition)比较合适作为本科生挡裉科书。同时建议课程设置实践环节,绕揭捉?生测验测验将机械进修办法应用到某些特定问题中。
此外,我建议设立以下课程作为本科计算机专业的进步课程或者荣誉课程。特别是,国内有些大年夜学计算机专业设立了拔尖人才项目,我认为以下课程可以推敲列入该项目标培养筹划中。事实上,上海交通大年夜学ACM班就开设了随机算法和统计机械进修等课程。
1.开设数值优化课程,建议参考教材乔治·诺塞达尔(Jorge Nocedal)和史蒂芬·赖特(Stephen J. Wright)的第二版《数值优化》(Numerical Optimization) ,或者开设数值分析,建议采取蒂莫西·索尔的《数值分析》(Numerical Analysis)为教材。
2.加强算法课程,增长高等算法,比如随机算法,参考教材是迈克尔·米曾马克(Michael Mitzenmacher)和伊莱·阿普法(Eli Upfal)的《概率与计算:随机算法与概率分析》(Probability and Computing: Randomized Algorithms and Probabilistic Analysis)。
3.在法度榜样设计方面,增长或加强并行计算的内容。特别是在深度进修技巧的履行中,平日须要GPU加快,可以应用戴维·柯克 (David B. Kirk) 和胡文美(Wen-mei W. Hwu)的教材 《大年夜范围并行处理器编程拭魅战》(第二版)(Programming Massively Parallel Processors: A Hands-on Approach, Second Edition);别的,还可以参考优达学城(Udacity)上英伟达(Nvidia)讲解CUDA计算的公开课。
推荐阅读
美国国防部通用拜访卡(Common Access Card,CAC,美国国防部用来进行多重身份验证的智能卡)负责人皮列里表示,身份验证要达到简略单纯操作的程度,面对的挑衅十分巨大年夜。国防部正在研究一种更灵活的身份验证办法>>>详细阅读
本文标题:机器学习的发展历程及启示
地址:http://www.17bianji.com/lsqh/34706.html
1/2 1