人的社会关系的可视推理和异构数据的接洽关系分析
沙龙晃荡 | 去哪儿、陌陌、ThoughtWorks在主动化运维中的实践!10.28不见不散!
现代城市是由人、机、物等构成的繁复的生活体系,其间产生的数据可用巨量来形容。要对这些宏大年夜的数据进行收集、梳理并作分析,难度有之。在日前举办的杭州云栖大年夜会上,浙江大年夜学陈为传授为我们分享了其团队近几年在城市大年夜数据可视化方面的部分科研结不雅,并商量了机械进修等在城市数据研究中的重要性。本文为其演讲实录,并略经编辑、删减。
可视分析研究的鼓起
今天我向各位分享的是我们浙江大年夜学可视化与可视分析小组比来两年的研究工作。
起首简单给大年夜家两个定义。
- 第一个,可视化是什么?可视化实际上是把数据信息转化为人眼能识其余可视符号,经由过程眼睛来增能仁攀类大年夜脑认知的一种办法。可视化其实是人机交互、虚拟实际应用琅绫擎的关键技巧。
- 第二个,可视分析是什么?2004年美国在对反恐谍报的分析中,出现了一些核心问题(DT君注:美国国土安然局之后成立国度可视化与分析中间),后来就演变出了一个新的学科,叫做可视分析学。这门学科是把可视化、人机交互、数据发掘结合起来,形成的一种新的解决问题的综合性的思维方法。
我大年夜2004年开端就转向了可视化分析方面的研究。尤其比来几年,人工智能的鼓起使得我们可以或许更好地推敲去做智能可视化,来分析一些问题。
今天要向大年夜家展示的,是环绕比来几年我们拿到的一些真实、少量的数据,以及我们所做的部分研究工作。
对人群地位和手机通话关系做可视化
第一项研究,是基于手机基站数据。简单来讲,每一个手机用户,他每分钟在什愦地位,这个地位是不精确的,而是一个基站的ID。
用户在某些基站可能会逗留,也可能会移动,这其实反竽暌钩了城市人群的流动。同时我们也获得了这些用户互相之间的通话数据。有了这些数据后,我们天然而然想:这个城市的人群到底是怎么流动的呢?当然这是基于基站的流动,不是基于车辆,也不是基于GPS。
- 上图是我们设计的4个视图。左上角是以手机基站为中间的人群流动的范围分析,以及跟着时光演变,它的变更趋势。
- 左下角是一个热力争,它展示了在不合的区域,人群的密度、分布情况。
- 右上角是一个传统的统计可视化,经由过程统计的报表来分析。
- 右下角是结合了聚类,用数据发掘的传统办法,来研究社交关系和人群流动之间有没有一些没法用统计办法来表示的规律。
在全部界面上,我们分成了几个视图,视图本身是用WebGL进行加快,它的背后是全部城市数百万人的手机每分钟的地位数据,以及不准时的发短信和德律风的记录等数据的支撑。
在我们看来,可视化一个异常重要的功能是给人一个提示、给人一个直觉、给人一个恍然大年夜悟的感到。
须要留意的是,我们今天给大年夜家供给的例子,都是以二维为背景的,因为我们认为固然三维的背景在某些应急批示或者城市筹划中应用很广泛,但在一些非构造化、时空和非时空的信息分析傍边,二维和高维的空间数据分析加倍合适。
在这个视图中,我们应用了开源的OpenStreetMap作为调处,在此基本上做了叠加和WebGL加快,大年夜而可以或许做到及时出现。
基于手机信令数据做人群流动的可视化
接着我们来看看,我们在敌手机信令数据的进一步发掘中,若何不雅察人群的流动。
若何来衡量人群流动呢?我们发明,20世纪80年代,国内已经有人在研究张量场和流场如许的理论,我们认为,在城市人口密集区域研究人群流动,也可以经由过程流场来表达和描述,然后再采取一些扩散对流的办法,来进行表达。
获得了手机信令相干的原始数据后,要进行梳理和清洗,再转化为向量场。什么是向量场呢?就比如风朝某个偏向吹,其实就是一种向量场。
在图中,人群的流动是产生在门路上的。在日夕岑岭,它具有某种大年夜范围的宏不雅流场特点。经由过程可视化的办法,我们能让用户看到人群移动的偏向,以及分叉和融合、集合和扩散的情况。
我们今朝的数据可能还不是那么精确,因为我们是将某个区域划分为若干个小方格来进行计算、统计人群的流动,如不雅我们有GPS之类数据的话,可以更好地采取类似的计算机视觉的技巧,来监测人群中可能产生的踩踏情况。
理论上来说,如不雅我们的数据汇聚得比较好,是可以提前预防踩踏事宜的。
大年夜出租车轨迹来对路况进行可视化萌芽
第三个例子是基于出租车轨迹的相干数据对路况进行可视化萌芽。
要经由过程出租车的数据来萌芽哪个处所堵车,哪个路口的人群往哪里走等等,我们须要有一个可以或许即时反馈的萌芽对象。
固然我们也可以写一个法度榜样,用Excel打开进行萌芽,然则要做到随时随地萌芽、对不合区域进行比较等,如许我们就须要一个可视化分析的界面,因为这才是一个即时的分析对象。
我们的课题组重要做的就是将空间的数据转化为可视化的交互界面萌芽,向用户供给一个更简单、敏捷地的数据对象。这背后当然须要一些数据发掘算法。
这里来看下一我们的原始数据的情况:
推荐阅读
沙龙晃荡 | 去哪儿、陌陌、ThoughtWorks在主动化运维中的实践!10.28不见不散! 摘要: 领先的开源项目常识和经验可以使求职者更轻松地找到待遇优厚的工作。Linux 基金会和在线求职雇用网站>>>详细阅读
本文标题:当城市数据和社会关系被可视化,每个人都可能是福尔摩斯
地址:http://www.17bianji.com/lsqh/38198.html
1/2 1