作家
登录

盘点对象存储九大关键点

作者: 来源: 2017-04-19 09:07:36 阅读 我要评论

有评论表示,对象存储是一个相对新的市场部分,今朝持续稳步增长,并有更多值得采取的来由。

对象存储

对于不懂得的仁攀来说,对象存储用于保存大年夜量的非构造化数据,个中每个“对象”本质上是没有特定格局的文件(也称为二进制文件)。对象存储可以保存任何类型的数据,大年夜仁攀类可读的小对象文件到媒体(音频和视频)或其他行业特定的格局(石油和天然气,医学成像等)。

与传统存储比拟,应用对象存储的好处是多方面的。基于块的体系(例如光纤通道和iSCSI)不克不及很好地向外扩大,并且对存储的数据没有真正的懂得。它们是以低延迟和高粒度供给内容的“哑”块设备。文件体系将一些构造放在数据上,将文件对象放入层次构造(文件夹/目次)中并将元数据附加到这些对象上。然而,元数据通构造基于存储文件所须要的信息(创建时光、时光更新、拜访规矩)。

对象存储进一步进行并删除文件夹层次构造。对象存储有平日可高度搜刮的可扩大元数据。在范围方面,对象存储可以增长到多个(即使不是几百个)PB,平日对数据地舆没有限制。对象存储的应用正在企业中被采取,因为平台供给了优于传统情势的存储长处。基于块的存储阵列不克不及很好地进行扩大,并且具有大年夜量的HDD和SSD数据保护(例如RAID)问题。

扩大协定支撑意味着可以轻松地移植或修改现有应用法度榜样,以便为其数据应用对象存储。还值得推敲的是,与横向扩大文件存储比拟,经由过程应用模仿文件存储的对象存储供给的体系构造之间的差别。 底层数据不是应用基于inode和目次的构造存储的,是以体系崩溃后FSCK(文件体系扫描)的概念不实用。与传统文件体系比拟,这对支撑文件体系的对象存储的可扩大性和机能有很大年夜的影响。

基于文件的体系受到文件体系本身可扩大性的限制,无论是在对象计数、并发或并行拜访以及恢复时光方面,以检查文件体系构造的一致性。对象存储代表一种更简单,更可扩大的解决筹划,并且可以经由过程标准的基于收集的协定轻松拜访。

对于寻求采取对象存储的IT组织来说,最大年夜的挑衅是选择若何应用平台以及若何评估供给商的产品。对象存储应用基于Web的协定,是以须要必定程度的编码才能应用。这正在产生改变,我们将在后面进行评论辩论。

大年夜特点的角度来看,对象存储有很多方面使得一个平台比另一个平台更合适。在本文的残剩部分,我们将大年夜辨认、分类和描述方面对合适IT组织的对象存储平台进行寻找。

可扩大性 - 大年夜和小

如已经评论辩论的,对象存储被设计为比诸如横向扩大NAS的传统数据存储个更进一步的扩大。供给商产品具有多个PB级的功能,可以存储数十亿个对象。然而,实现高可扩大性不仅仅是简单地测量对象计数和数据量。 留意事项包含:

容量限制。容量是否有真正的限制? 容量增长是否须要添加更多的硬件或软件节点? 我可以简单地扩大存储吗?

分层懈弛存。对象存储若何治理数据分层?跟着容量的增长,天然地大年夜量数据将长短晃荡的,并且供给了存档到更便宜的序言的机会。在这一点上,分层成为一个关键的才能。闪存介质还可用于在用作缓存或分层时进步机能。

元数据治理。跟着对象存储的增长,元数据治理得若何?对象存储的大年夜小是否影响搜刮的机能?

最后一点对于构建可以并行地供给对很多对象存储/检索请求的拜访的对象存储(例如用作CDN收集的后端体系)特别重要。增长对象存储中的对象数量,而不该明显增长检索时光,或更重要的是“到第一个字节的时光”,这是大年夜接收点开端将对象流回请求者所花费的时光请求。

当然,我们不该该忘记对象存储可能启动时须要的范围很小,不须要具有几百TB或PB级的初始占用。 具有小型入门级功能的才能,有助于削减对象存储采取的进入障碍,增长的需求是可以或许以最小的操作影响供给大年夜小到大年夜的线性扩大。

数据保护

数据保护的概念涵盖了对象存储中典范多方面。与传统的“主”存储比拟,对象存储可能用于经久保存数据,是以数据持久性成为一个重要身分。我们可以将持久性视为须要确保因为一系列缺点(包含硬件攫取掉败和数据破坏)而对正在存储的数据不二生逻辑破坏。

对象拜访。跟着对象存储的增长,任何零丁对象的拜访时光是否增长(欲望不是所有)?

与四分之一个世纪前应用的设备比拟,现代硬盘驱动器异常靠得住。尽管如斯,驱动器仍然遭受攫取缺点和其他的瞬态问题。对象存储应当履行一系列磁盘治理功能,包含数据清理、CRC检查和破坏或不一致数据的重建。这些后台义务表示,在须要经久保存至关重要的情况下保持数据健康的过程。

第二个要推敲的是硬件故障保护。大年夜多半现代存储阵列实现RAID(便宜磁盘冗余阵列)作为大年夜硬件故障导致的损掉中恢复数据的办法,跟着数据量开端上升,RAID存在可扩大性问题。存储供给商已实现双重甚至三重奇偶校验,以防止大年夜型硬盘容量的多个驱动器故障。然则,延长的驱动看重建时光使得RAID对于对象存储中的大年夜量数据不切实际。

对象存储应根据客户须要供给具有可变保护值的擦除编码。因为擦除编码具有可以或许明显的处理开销,是以RAID还可以用于保护较小的对象并改良拜访机能。如不雅数据在地舆上分布的情况下,重建对收集的影响变得重要。是以,擦除编码体系的具体实现(以及在WAN上检索数据的须要)将直接影响恢复时光和客户SLA(办事程度协定)。当本地LAN延迟较高时,也会产生此问题 - 任何基于分布式收集的恢复将始终受到收集机能的影响。快速恢复异常重要,因为不受保护的数据须要快速从新保护,以避免潜在的数据损掉。

搜刮、索引和元数据

在对象存储中搜刮和检索数据的才能是最关键的请求之一。与构造化数据(如数据库和文件体系)比拟,对象存储将数据保存在平面层次构造中,只有少量的逻辑或物理分隔(例如存储桶或池)。这意味着存储的每个对象都须要有大年夜量的信息,以便于数据检索。


  推荐阅读

  Apriori算法介绍(Python实现)

跟着大年夜数据概念的火热,啤酒与尿布的故事广为人知。我们若何发明买啤酒的人往往也会买尿布这一规律?数据发掘中的用于发掘频繁项集和接洽关系规矩的Apriori算法可以告诉我们。本文起首>>>详细阅读


本文标题:盘点对象存储九大关键点

地址:http://www.17bianji.com/lsqh/34842.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)