作家
登录

AI实践者需要掌握的10大深度学习方法:反向传播、迁移学习、梯度下降……

作者: 来源: 2017-11-20 15:52:07 阅读 我要评论

基于上述假设,你可以推敲一个高低文窗口(context window,一个包含k个持续项的窗口),然后你跳过个一一个悼?船试着去进修一个可以或许获得除跳过项外所有项的神经收集,并猜测跳过的项是什么。如不雅两个词在一个大年夜语料库中反复共享类似的语境,则这些词典嵌入向量将具有邻近的向量。

在天然说话处理问题中,我们欲望进修将文档中的每个单词表示为一个数字向量,使得涌如今类似的高低文中的单词具有彼此接近的向量。在持续的单词模型中,我们的目标是可以或许应用环绕特定单词典高低文并猜测特定单词。

9. 持续词袋(Continuous Bag Of Words)

我们经由过程在一个宏大年夜的语料库中采取大年夜量的句子来做到这一点,每当我们看到一个单词时,我们就会提取它四周的单词。然后,我们将高低文单词输入到一个神经收集,并猜测位于这个高低文中间的单词。

当我们有成千上万的┞封样的高低文单词和中间词今后,我们就有了一个神经收集数据集的实例。练习神经收集,最后编码的隐蔽层输出表示特定单词典嵌入。而当我们对大年夜量的句子进行练习时也能发明,类似语境中的单词获得的是类似的向量。

10. 迁徙进修

让我们推敲图像若何穿过卷积神经收集。假设你有一个图像,你应用卷积,并获得像素的组合作为输出。假设这些输出是边沿(edge)。如今再次应用卷积,如今你的输出就是边或线的组合。然后再次应用卷积,你的输出是线的组合,以词攀类推……你可以把它看作是每一财揭捉?找一个特定的模式。神经收集的最后一层往往会变得异常特异化。如不雅你在ImageNet上工作,你的收集最后一层大年夜概就是在寻找儿童、狗或飞机等整体图案。再往后倒退几层,你可能会看到统??寻找眼睛或耳朵或嘴巴或轮子如许的构成部件。

深度CNN中的每一层都慢慢建立起越来越高层次的特点表征。最后几层往往是专门针对输入模型的数据。另一方面,早期的图层更为通用。而迁徙进修就是当你在一个数据集上练习CNN时,切掉落最后一层,在不合的数据集上从新练习最后一层的模型。直不雅地说,你正在从新练习模型以辨认不合的高等特点。是以,练习时光会削减很多,所以当你没有足够的数据或者练习须要太多的资本时,迁徙进修是一个有效的对象。

结语

这篇文┞仿简单介绍了深度进修,如不雅你想懂得更多更深层次的器械,建议你持续浏览以下材料:

  • Andrew Beam “Deep Learning 101”http://beamandrew.github.io/deeplearning/2017/02/23/deep_learning_101_part1.html
  • Andrey Kurenkov “A Brief History of Neural Nets and Deep Learning”http://www.andreykurenkov.com/writing/a-brief-history-of-neural-nets-and-deep-learning/
  • Adit Deshpande  “A Beginner’s Guide to Understanding Convolutional Neural Networks”https://adeshpande3.github.io/adeshpande3.github.io/A-Beginner%27s-Guide-To-Understanding-Convolutional-Neural-Networks/
  • Chris Olah “Understanding LSTM Networks”http://colah.github.io/posts/2015-08-Understanding-LSTMs/
  • Algobean  “Artificial Neural Networks”https://algobeans.com/2016/03/13/how-do-computers-recognise-handwriting-using-artificial-neural-networks/
  • Andrej Karpathy “The Unreasonable Effectiveness of Recurrent Neural Networks”http://karpathy.github.io/2015/05/21/rnn-effectiveness/

深度进修强烈重视技巧。对每一个新设法主意都没有太多具体的解释。 大年夜多半新设法主意都附带了实验结不雅来证实它们可以或许工作。深度进修就像玩乐高。控制乐高跟控制其他艺术一样具有挑衅性,但入门乐高可是相对轻易很多的。祝钠揭捉?习高兴~

 

  推荐阅读

  流计算框架Flink与Storm的性能对比

Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践1. 背景Apache Flink 和 Apache Storm 是当前业界广泛应用的两个分布式及时F算框架。个中 Apache Storm(以下简称&ldq>>>详细阅读


本文标题:AI实践者需要掌握的10大深度学习方法:反向传播、迁移学习、梯度下降……

地址:http://www.17bianji.com/lsqh/39041.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)