即使有少量的数据,这也可能是因为延迟而产生。例如,企业将其应用法度榜样办事器迁徙到云端,同时将数据库办事器保存在本地,这可能在理论上可行,然则当应用法度榜样对数据库与数据库之间的收集延迟敏感时,就根本不起感化。对于少量的数据来说,情况就是如斯。这就是为什么很多组织都在测验测验调剂软件的原因,使其对延迟的敏感度降低,大年夜而可以或许进入云端。然则,如不雅数据量很大年夜,则须要将数据处理和数据彼此接近,不然就无法工作。企业袈漩加对大年夜量并行性的需求来处理这些数据,并获得Hadoop和其他处理大年夜量数据问题的体系构造。
【限时免费】岁尾最强一次云计算大年夜会,看传统、社区、互联网企业若何碰撞?
比来,IT行业专家在参加相干会议时发清楚明了一个隐蔽的主题,那就是固然很多人将存眷的重点缀移到基于云计算的架构(混淆云)以及所须要的云治理平台,但会议的申报注解,很多人都承认并没有密切存眷全球数字数据量的巨大年夜增长。
存储供给商PureStorage公司的演讲申报引用了其他两家供给商的两个数据点:起首,思科公司2017年6月宣布的白皮书“Zettabyte时代:趋势与分析”揣摸了互联网带宽的增长。其次是由希捷公司宛转IDC公司进行研究的查询拜访申报“数据时代2025”推想了全球数据增长的趋势。PureStorage公司结合了这两家公司的揣摸,得出了却论。如下图所示。

如不雅这些趋势成为实际,并且有足够的来由认为这些猜测是合理的,那么这些趋势将在将来几年对计算和数据格局产生重大年夜影响。并将对云计算的应用产生特其余影响。留意:云计算是真实的,将成为将来IT情况的重要构成部分,然则IT部分认为它是一种灵丹妙药这种简单化的设法主意,会让人想起当初收集高潮的幻灭。而人们知道将会有什么样的结不雅。
不克不及躲避的问题
无论若何,所有IT都有两个核心要素:数据与数据的逻辑。每个应用大年夜数据的人都知道:要应用大年夜量的数据,起首须要对数据进行处理,而其处理都邑产生一个传输瓶颈,并严重影响其机能,并且这种逻辑的任何功能都变成纯粹的理论。
如今,全球的数据量呈指数增长。如不雅IDC公司的推想成为事实的话,那么在几年的时光里,全世界将存储大年夜约50ZB的数据。另一方面,固然互联网传输数据的总容量也在增长,但增长速度更为迟缓。在全球数据量增长到50ZB的同一时代,互联网总带宽将达到每年2.5ZB(如不雅思科的揣摸成为事实的话)。
大年夜这两个揣摸(并不是不合理的)中得出的结论是,全球可用的互联网带宽远远不克不及知足移动大年夜量数据的需求。并且这也忽视了今朝大年夜约80%的带宽用于流媒体视频的事实。是以,即使企业已经针对核心应用法度榜样中的延迟问题编写了代码,对于数据量较大年夜的情况,也会出现带宽问题。
如今这个隐患实际上成为了一个问题吗?如不雅处理或应用这些数据在本地安排的数据中间产生的话,也就是说袈溱同一个数据中间中存储数据。然则,一方面,数据量呈指数增长,另一方面,全球各行业也在积极寻求云计谋,就是把将所有类型的工作负载都迁徙到云端,即使是“无办事器”(例如,AWS Lambda),如许的做法也是绝对极端的。
假设只有小范围的结不雅(大年夜宏大年夜的数据集上钩算出来)也许会有所赞助,因为大年夜量数据的实际价值来自它们的结合。这可能意味着将来自不合所有者的数据(例如企业的客户记录邮攀来自Twitter的数据)结合起来。而这所有不合的集合将会成为一个难题。
所以,人们看到的昵嘟个相反的事态成长。一方面,人们都忙于适应基于云的体系构造,这种体系构造最终是基于分布式数据的分布式处理。另一方面,人们应用的数据量越来越大年夜,必须将数据和处理整合到一个物理地位。
那么这意味着什么?
人们可以预期,Hadoop在应用法度榜样架构层面所做的工作也将在全球范围内产生:宏大年夜的数据集将成为使数据的逻辑具有意义的吸引力。而那些宏大年夜的数据集将会被吸引到一路。
举个例子:很多公司如今都在尽力削减移动数据的需求。是以,在物联网范畴有很多关于边沿计算的评论辩论:本地处理传感器和其他物联网设备的数据。当然,这也意味着处理过程也必须是本地化的,可以宁神地假设一下,企业不会在一组传感器中拥有同样的计算才能,而不是在大年夜分析中可以做到的设置。或者:也许自立驾驶汽车的数据很可能不会再采取Hadoop集群,而可以经由过程这种方法来最小化数据流量,但以计算量为价值。
PureStorage公司的申报描述了全球数据增长和全球互联网带宽增长之间的冲突
这个问题还有另一个解决筹划:与数据中间结合在一路。数据中间托管供给商供给的办事正在崛起。他们供给具有优化内部流量功能的大年夜型数据中间,云计算供给商和大年夜型云用户的办事器都在一路。大年夜逻辑上讲,用户的营业可能在云端,但实际上与云计算办事供给商在同一处所。
企业不仅想在AWS或Azure上运行其逻辑数据,也想在数据中间┞封样做,企业也有本身的私稀有据湖,所以所有的数据都在本地处理,数据聚合也在本地。然则数据中间托管模式是另一种可能的解决筹划,用于解决因数据呈指数级增长而带来的带宽和延迟问题。
情况可能不像那两个查询拜访申报描述的那样恐怖。例如,所稀有据的实际平均波动率最终将异常低。另一方面,企业不欲望在陈腐的数据上运行分析。然则可以得出一个结论:简单地假设企业可以将其工作负载分派给不合的云供给商是有风险的,尤其是如不雅同时处理的数据量(如不雅企业都想把他们本身的数据邮攀来自Twitter、Facebook的数据流结合起来,那么更不消嗣魅这些组合产生了各类各样的新数据流)。
是以,企业对数据和处理的地位做出优胜的┞方略设计决定计划是成功的关键。
【编辑推荐】
- AI和大年夜数据2017“成长的懊末路”
- 大年夜数据关键技巧分析
推荐阅读
办事不克不及只是浮于外面,不克不及使租客的身材健康得不到保障,权益得不到保护,这是租房网站须要严逝世面对和改进的问题。数据显示,一家租房网站产生恶劣事宜后,有48%的人选择不再持续应用,毕竟信用和口碑是用>>>详细阅读
本文标题:大数据和云计算的冲突
地址:http://www.17bianji.com/lsqh/40232.html
1/2 1