我将这个游戏机械人练习了 5000 个 epoch,结不雅表示得很不错!
Catch 机械人的动作
正如你在上述动图中看到的那样,机械人可以抓住大年夜天空中掉落落的苹不雅。为了将这个模型进修的过程可视化,我绘制了每一个 epoch 的胜好处动平均线,结不雅如下:
【编辑推荐】
- 深度进修|用最懂法度榜样员的方法快速入门TensorFlow
- 深度进修高手该如何炼成?这位阿里天池大年夜赛冠军为你筹划了一份专业成长路径
- 移动设毕喔赡及时深度进修
- 一篇文┞仿讲清跋扈人工智能、机械进修和深度进修的差别与接洽
- AI实践者须要控制的10大年夜深度进修办法:反向传播、迁徙进修、梯度降低……
接下来做什么?如今,你已经对强化进修有了初步的直觉懂得。我建议细心浏览该教程的完全代码。你也可以实验看看。
推荐阅读
Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践 传统小IDC存活将更难,那么必>>>详细阅读
本文标题:深度强化学习入门:用TensorFlow构建你的第一个游戏AI
地址:http://www.17bianji.com/lsqh/39071.html
1/2 1