作家
登录

当城市数据和社会关系被可视化,每个人都可能是福尔摩斯

作者: 来源: 2017-10-25 15:09:47 阅读 我要评论

我们拿到的原始数据,打开一个文件须要10分钟,但在我们对数据进行处理和建立索引后,用户的萌芽同样也做到了及时。

我们可以做双向车道、潮汐车道的比较,还可以分析交财路口、堵车等各类交通方面的问题。

比如,下图展示的是杭州天目山路和曙光路的情况。这是两条平行门路,然则因为曙光路施行了潮汐车道,所以,大年夜图中可以看出,曙光路的拥塞情况较轻,大年夜右侧的散点图能看出曙光路的车流量要比天目山路(骨干道)更大年夜。

当城市数据和社会关系被可视化,每小我都可能是福尔摩斯

下面的视频,展示了杭州8300辆出租车的轨迹的情况,以及我们基于这些数据对车流和交通状况的一些分析:

将机械进修惹人城市空间地位的可视表达与分析

在对数据实现可视萌芽后,我们认为,要对深层次的信息进行描述,我们还可以采取一些机械进修的办法来进行表达。

比如说,我们比来就进行了一个简单的测验测验。大年夜家知道,比来有一种最新的word2vec办法,它实际是一种深度进修的数据表达。我们也把这个办法扩大到了非构造化数据的处理上。用于对时空、人群和出租车轨迹的数据分析。大年夜而可以或许赞助我们更好地来不雅察人群地位移动等。

经由过程把粗拙的信息进行过滤后,用户还可以或许大年夜中找到一些很有趣的信息。

下面是我们的一些可视化界面截图:

当城市数据和社会关系被可视化,每小我都可能是福尔摩斯

经由过程惹人机械进修,我们可以摸索手机基站的类似性关系、城市门路的类似性、手机基站各向异性属性与门路的相干性分析等等。可以更好的摸索人群和城市地点之间的交互过程。

我们认为,对这些信息进行可视化不仅是为了让用户看,更重要的是懂得在三元空间中的人、机、物之间产生了什么事。

最后再来谈谈我们若何对小我的社会关系进行可视推理,以及不合构造类型的数据若何进行接洽关系分析。

我们欲望基于三元空间里的诸如微博数据、手机的基站相干的地位数据、出租车数据,来推想某一个不明身份者的社会关系。

先来举个例子。有一个妊妇,在生小孩前后经由过程手机在车上持续发了7条带有地位的微博,然则微博琅绫擎的地舆信息地位不敷精确,而我们正好有这个时光段里的手机基站和出租车轨迹的相干数据,经由过程简单的办法,我们可以在1-2分钟内,快速把这个妊妇住在哪、她的┞飞夫是谁、她的手机是哪一个ID等等,都能找出来。

对于这类关系的分析,我们须要借助于人和机械的智能融合,来让用户经由过程时光线的表达,经由过程地舆、时光,来快速迭代地把四元空间中可能会产生信息碰撞(公安相干范畴一个术语)的人物关喷鼻魅找出来。

做如许的分析,我们当然不是为了破坏隐私,反过来懂得,我们其实也在做关于隐私保护的可视化分析。我们欲望能给我们的用户一种言必有中、快速而敏捷地找到某小我的社会关系的一种办法。留意这些今朝还不是主动做到,而是须要把人的常识,经验融入到机械,经由过程可视化的交互方法去迭代地融入,如许才能找到一些蛛丝马迹。

接着再来看看若何对异构数据进行接洽关系分析。

我们认为,对于大年夜数据,第一步是要“存”(存储),第二步是“通”(接洽关系),第三步是能做一些分析。

别的,经由过程词攀类分析,我们还可以找到交班的出租车地位信息,人群的通勤规律等等。

经由过程把不合的线索快速汇聚在一路,能让大年夜家快速成为福尔摩斯。经由过程对不合线索的汇聚,对数据进行接洽关系推理分析,这里我照样举两个例子。

第一个例子,某小我在微博中称其在某个时光打车时丢了一部手机,半小时后用德律风打以前发明手机关机。谁会拿走他的手机呢?我们经由过程数据,两分钟之内可以或许查出来。可以大年夜几千条出租车轨迹中,快速匹配出来。最后还原出来全部事宜:本来是出租车司机把这个手机拿走了。

下面这张图展示了大年夜某条微博,到最终定位到某位出租车司机的推理过程:

当城市数据和社会关系被可视化,每小我都可能是福尔摩斯

(图片解释:城市数据的多样化导致了多源异构的数据,它们在带来信息量的同时带来了很大年夜的数据进修成本和数据萌芽成本。本文作者团队建立的一套模型,可以进步数据萌芽效力,应用可视化的办法,用户可以或许简捷直不雅地自定义数据萌芽目标,并应用不合视图展示萌芽结不雅,有效进步了城市数据的分析效力。这个图展示了某个事宜的分析推理过程。)

将向量场应用到人群流动分析中,可以用来描述人群在大年夜范围内的宏不雅的流动。下面这张图是我们和阿里合作的人群及时流动的可视化分析的截图:

基于这些数据,我们能做到什么呢?

2012年时,杭州市有8300多辆出租车,这些出租车的车流占全部城市车流的7%阁下,是以出租车的轨技可以或许反竽暌钩城市交通的某种状况。

第二个例子,是关于某一路车祸。车祸产生前,所有的气象情况、门路情况以及它引起的交通拥堵等情况,都可以快速进行分析。此外,我们的平台上还汇集了手机信令、出租车轨迹、微博数据、谷歌视频、地图、街道等各类网上信息。可以将不合的数据接洽关系起来。

再进一步,可能还须要进行更多的数据发掘,惹人机械进修、人工智能等算法,才能够让我们聪明城市扶植走得更远,形成一个以数据为中间的城市大年夜脑。


  推荐阅读

  带来高收入的10大开源技术,可以涨工资了!

沙龙晃荡 | 去哪儿、陌陌、ThoughtWorks在主动化运维中的实践!10.28不见不散! 摘要: 领先的开源项目常识和经验可以使求职者更轻松地找到待遇优厚的工作。Linux 基金会和在线求职雇用网站>>>详细阅读


本文标题:当城市数据和社会关系被可视化,每个人都可能是福尔摩斯

地址:http://www.17bianji.com/lsqh/38198.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)