总之,对仁攀来说,其实视觉也可以或许做很多器械。这又是一个例子,这是一个多相机的跟踪的例子,比方用八个相机,人在走动,很多情况下我们可以比较精准地跟踪这些人,不时刻刻知道这小我的处所。多相机的跟踪可以做很多事,起首可以获得人的身份,可以知道这小我是谁,还有一个就是可以比较精准的获得这小我的地位。
大年夜家知道室内定位,其实有很多办法,WIFI 也好,蓝牙也好,超声波。而精准定位,视觉可以或许给我们一个至少是厘米级的定位的精度,很多情况下是很有效的。
不是说只是去检测这小我在哪里,在很多情况下,我想给大年夜家看的是其实我们在很多情况下可以或许做到对人姿势及各类动作的断定——不但知道人在哪,也能知道眼睛、耳朵、肩膀、手臂是如何晃荡的。
这是一张图片,就是其实是一个基于人姿势的动作辨认。膳绫擎那个蓝色的是我们想获得的器械,绿的是算法的估计。这个相对来说是一个比较简单的问题,这个视频相对来说比较简单,想给大年夜家看一下,有了姿势之后,还可以在姿势的基本上做一些动作的辨认,物体的辨认,很多情况下可以或许辨认人的动作。
如不雅我们往前瞻望一下,无论是一个室外场景也好或者室内场景也好,如今计算机视觉真的可以或许做很多器械。
稍微夸大一下的说,其实很多情况下,我们看得见的工作,人能做的工作确切计算机如今都能做。在几年进步对不敢嗣魅这句话,然则如今算法的成长也好,其它才能的进步也好,很多情况已经很接近了。
当然,大年夜另一个方面来说,如不雅相机看不见的也没办法。这个也不是纯开打趣,因为大年夜解决实际问题的角度出发,相机的安排其实是一个很重要的问题,你欲望可以或许有一个很好的安排,可以或许在最大年夜程度上获得你想获得的信息。
除了相机之外,其实我们还有很多其余问题须要推敲,比方说数据、计算量、成本,这些跟算法须要结合在一路。我对视觉照样有异常有信念的,认为有很多情况下很多工作都能做的。
回到新零售的评论辩论,如不雅说新零售是一个数据驱动,其实也可以把这个说法做小小的修改,可以应用信息驱动的形态。怎么说呢?有很多时刻数据并不是现成的,有很多时刻数据须要我们花力量获得的,特别线下的场景傍边,或者线上也好,很多情况用视觉或者其它获得对我们有效的信息。
说完了视觉,前段时光的进展或者技巧,我也想跟大年夜家说一下我本身异常感兴趣的几个应用偏向,在这么多的应用处景傍边,我想提几个本身比较感兴趣的:
加强实际,聪明门店,机械人,全能助手(可穿戴)。
即使比较复杂的场景下,即便人的动作变更很大年夜,我们也一样可以或许去获得这些信息。人的姿势其实是一个对人懂得的基本。
想给大年夜家看一下几个例子,看看如今技巧大年夜概成长到什么程度:
加强实际是实际世界跟虚拟世界的叠加。就像这个图上显示的,我们买家具,可以拿 PAD 看家里,可以把家具放那边。这琅绫擎有几个比较关键的问题,比如三维定位、三维建模,衬着。建模与衬着是比较简单的问题,对定位来说如今也到了一个时刻。
大年夜家知道前几个月苹不雅公司宣布了他们可以或许在苹不雅手机膳绫擎做到相当精准的及时的三维的定位,它的计算量都达到了应用的程度。
三维定位解决之后,其实袈漩强实际可以或许有很多应用的,给大年夜家稍微看一下几个例子。
这是一个例子是就是说是相当于赞助你去找器械,其实对我来说是一个很重要的工作。经常我太太让我到店里买器械,不知道在哪,我也不肯意问人,要花很长时光。
如不雅有了定位技巧,然后如不雅以这个店琅绫擎商品的地位做一个比较精确的地图,就可以想像可以用加强实际去做一些导引方面的器械。
当然其实我们也可以说袈溱这个例子傍边,加强实际不必定是异常关键的器械。回到刚才说的虚拟购物,也是大年夜家经常说的器械,如不雅有了加强实际,可以在网上找到这些家具可以放到家里可以看大年夜小,可以看搭配,很多情况下还可以看光影的效不雅等等。这个在如今也是一个可能也是一个比较成熟的,很多人可能有很多人在做,很多时刻很快可以用到。
下一?想跟大年夜家稍微评论辩论一下的是智能门店,大年夜家知道我以前是在亚马逊的,我很荣幸在亚马逊 GO 项目开端的时刻参加了进去,我们花了四年时光做了这么一个店,照样异常高兴和骄傲的。
我们解决的问题是在一个相对通用的场景下解决付出的问题,做到进去之后拿了直接走,不须要列队结账环节。
做了 4 年之后,如今每次买器械列队都欲望可以或许把付出环节做好,省掉落列队跟 结帐 。固然只是付出一个环节,但要做到高精度就有很多问题要解决,解决人的问题、商品的问题、动作方面的问题,知道人拿的什么商品。
很多情况下可以想像成是一个相对通用的线下智能体系,如不雅有一个相机收集,可以做很多工作,可以用来跟踪人,可以用来分析人流,可以看逗留的时光,看竽暌剐人有没有拿器械,看了多久,有没有放归去,可以用相机监控货架。
如不雅跟身份结合,或者用人脸或者其它方法,可以做到很多个性化的体验,可以或许让你在不时刻刻在店琅绫擎知道你是谁,供给个性化的办事。
实际上,有些器械在线上不是那么轻易做的,比方说我们可以做神情辨认,这是一个例子,就是我们可以经由过程对人脸的分析知道它是高兴照样不高兴,是朝气了照样无聊,其实很多时刻这件工作都是可以做的。
推荐阅读
代码可读性是计算机编程范畴中广泛存在的问题。这也是我们成为开辟者起重要进修的工作之一。本文会具体介绍在编写强可读性代码时最佳实践中最重要的一部分内容。 具有较强可读性的代码,能>>>详细阅读
本文标题:被阿里挖来的高级别华人科学家,聊聊AI带来的想象空间
地址:http://www.17bianji.com/lsqh/37907.html
1/2 1