作家
登录

被阿里挖来的高级别华人科学家,聊聊AI带来的想象空间

作者: 来源: 2017-10-16 09:34:51 阅读 我要评论


他曾是亚马逊最高等其余华人科学家,他也是 1 年前轰动全球零售业的亚马逊无人零售店项目 Amazon Go 的重要策划者。而如今,他的身份是阿里巴巴 iDST 首席科学家兼副院长。

付出肯定是一个偏向,有很多情况下我们会思虑很多工作在线上比较轻易做的,像逗留时光、个性化。如今到了一个其实我们在线下也可以或许做瞎逡祺械的时刻。

是以,在云栖大年夜会新零售峰会上,任小枫大年夜概是谈「人工智能如安在新零售场景下进行应用」这个话题中最有话语权的科学家之一。

除了向大年夜家介绍了本身最为善于的计算机辨认技巧,他也在演讲中披露了本身对新零售诸多应用处景中的 4 个最感兴趣也最看好的应用偏向:

加强实际、聪明门店、机械人、可穿戴设备。

至于原因,请细心浏览任小枫在此次大年夜会上由机械之能整顿的全篇演讲:

今天异常高兴可以或许有这个机会来这里跟大年夜家分享一下我的一些设法主意。

刚才看到天猫小店的视频,异常好,它的存在已经给了大年夜家很多 想像 的空间。也给大年夜家描述了很好的将来。而作为一个技恋人员,我日常平凡大年夜多半时光其实是在思虑怎么样解决实际的技巧问题,怎么实现这个将来。

当然,解决问题也并不是工作的全部,有的时刻确切也挥蓦一下将来会是什么样子的,所以很高兴有这个机会跟大年夜家分享一下。

比方说,视觉是通用的办法,有一个相机在琅绫擎可以干很多工作,可以辨认人、物、动作,也是异常高信息量的感知的办法,像如今比如 1080P的视频异常普及,1080P 的象素下面可以看到很多器械。

不过因为其实我在美国工作生活了很长时光,所以新零售这件工作很多时刻对我来说也是一个迷,前面听了曾传授也好,还有其它各位讲的,我也学到很多。

如何去解开这个谜呢?我去看了一下前段时光阿里研究院有关于新零售的申报,那个对于新零售有一个异常周全的总结: 新零售是以花费者体验为中间的,数据驱动的泛零售的形态。

其实固然是短短的一句话,但琅绫擎有很多的信息。有一个比较难让我们控制这个 想像 空间的是因为可以或许应用的场景是异常的多,比方说批发零售、物流、娱乐、餐饮,其实就是说我们说到新零售有很多可以应用的处所。

然则我们看到这句话的描述中有几个关健词,一个是体验、一个数据、一个泛零售。

大年夜体验来说我信赖很多在座的比我会有更多设法主意,也有更多经验去想如何才是更好的用户体验。而对我来说,因为我做的是人工智能,特别是计算机视觉,想的则是怎么样可以或许获得有效的数据。

大年夜数据的角度来说,因为应用的场景很多,百货公司、购物中间,便利店,甚至还有很多比方说是直播,视频、电子商务。

大年夜各个场景来看,买器械的本质,无非就是人和商品。我们做的工作就是去懂得人,懂得物,然后把人跟物接洽起来,让用户更好和更快地找到他知足的商品,把商品可以或许更快更好的送到用户的手里。

大年夜信息的角度来说,要获得关于人的信息或者关于物的信息,特别在很多线下的场景傍边,我本身认为计算机视觉或者用相机是异常好的办法。

当然视觉它其实有很多问题,起首必须要有光照,比较好的光照才能够获得比较好的信息。但这问题也不是太大年夜,因为人的眼睛也须要好的光照才能看到。

另一个是遮挡,这是个比较大年夜的问题。相机被盖住,后面的器械确切没法看到。这个其实也是跟高信息量相干的,因为我们用的是可见光,波长很短,须要高信息量的时刻没办法绕过前面的┞汾挡物。而计算机视觉应用最大年夜的问题是它的精度,很多时刻精度不敷,然则比来几年有很大年夜的改变,很大年夜程度上来说精度并不是特别大年夜的问题了。

下面我想介绍一下如今计算机范畴的成长状况,也让大年夜家对其有更好的懂得,看看我们技巧已经进步到什么程度。

大年夜物来说大年夜家知道有一个异常有影响力的比赛是物体分类的比赛,一千个物体,所要做的就是给每一张图打上一个标签,知道它是什么。这个是以前八年傍边 ILSVRC 膳绫擎的进展,Y 轴描述是缺点率,照样异常难的,比来这八年进步异常快。

2012 年的时刻深度进修开端就是说袈溱这个问题傍边获得应用,在全部计算机视觉范畴获得应用。2012 年之后,以前的六年傍边精度一向在进步。

可以比较一下,有人测过人在这个问题的缺点率是 5%,并不是计算机跨越人,它也有各类各样的问题。但在必定程度上,计算机在某些情况下可以达到人的精度。

光是一张图一个物体并不是视觉独一的问题,很多情况下须要处理一个复杂的场景,所以 ilsvrc 也有物体检测的比赛,给你复杂的场景,须要找到各类各样的物体,这个问题这几年的进崭荷饲很快的,当然深度进修是一个原因,当然数据其它的都是原因。

这个图稍微复杂一点,因为检测的问题来说,要做到精确的检测须要有精确的标签和精确的地位,检测问题还有一个预值的问题,可以把预值调高,返回的问题少会错掉一些,调低返回的更多,然则会有一些误会。

总的来说如今的 MAP,就是平均精度达到 0.75,这个确切跟人还有必定的距离。然则大年夜家看一下这个图,很多情况下照样可以或许做的很好。像这个场景傍边有很多器械,有人,有狗,有雨伞,后面还有一些比较小的器械,比如椅子,很多情况下都是可以或许检测到的。

大年夜家再看一下这个语义瓜分的例子。很多情况并不是只是找边框,这个问题在每个 象素点 上我们都去标注这个到底是什么。这是主动驾驶的例子,算法可以标树、车、行人,还有各类各样的在场景傍边可以或许碰着的物体,这也是一个已经可以或许达到不错的精度,如今用相机做无人车也是异常有意思的偏向。


  推荐阅读

  提升代码可读性的 10 个技巧

代码可读性是计算机编程范畴中广泛存在的问题。这也是我们成为开辟者起重要进修的工作之一。本文会具体介绍在编写强可读性代码时最佳实践中最重要的一部分内容。 具有较强可读性的代码,能>>>详细阅读


本文标题:被阿里挖来的高级别华人科学家,聊聊AI带来的想象空间

地址:http://www.17bianji.com/lsqh/37907.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)