作家
登录

如何像专业人士一样挖掘大数据?

作者: 来源: 2017-11-06 15:15:54 阅读 我要评论


髋关节置换手术须要多长时光?

这对病院来说并不是学术问题。2015年,病院约有360亿美元的无偿保健费用,个中大年夜部分来自患者未付的┞匪单。

这个问题的一个解决筹划是限制与手术相干的成本,然则若何才能杀青呢?谜底是机械进修。病院如今应用猜测分析学来猜测述术的平均时光和潜在问题,如髋关节手术。

若何像专业人士一样发掘大年夜数据?

例如,医疗保健购买者的数据显示患者年纪、核心医疗保健供给者和二次诊断。应用机械进修和猜测分析,数据可以估计将来的成本,赞助肯定可能在恢复中出现问题的患者。此举可使病院做出更好的临床决定,降低二次入院率,缩短患者的住院时光,并供给更好的护理。

思虑外部法度榜样。你并非老是拥有所有的信息、人才、分析和聪明。这是一个关乎生态体系的问题,那些发掘他们四周事物的才能的人将会获胜。众包数据科学家、机械进修和外部数据集都具有强大年夜的潜力。

弗雷斯特研究公司(Forrester Research)的分析师Mike Gaultieri指出,机械进修并不像传统的贸易谍报工作那样,其结不雅是肯定的。他说:“如不雅你在寻找一种机械进修模式,可以说‘我会测验测验’,但你可能无法成功实现。企业应当明白仅仅因为欲望拥有猜测股市的模型,并不料味着就会实现欲望。”

各地企业袈溱应用机械进修分析数据的过程中,发清楚明了类似的实际效不雅。但问题是效不雅周期往往短暂。

DXC技巧分析数据实验室是数据科学家的全球研究中间,他们专注于咨寻谕寻找实施分析的办法。实验室负责人Rags Raghavendra表示企业的表示令人沮丧,因为它们往往遭受太多包袱。他说:“客户在测验测验发掘其有权拜访的各类数据的意义时往往好高骛远。我们建议着眼于本身可以拜访的数据,然后再着手下一步的行动。”

如不雅企业测验测验但未能大年夜数据中发掘到有悠揭捉?息,起首应当接收掉败和反复是这一过程的一部分。然则,经由过程更奇妙地应用机械进修,他们可以最大年夜限度地进步成功几率。以下是应用机械进修的八种办法:

大年夜想要解决的问题开端。直接研究数据,等待急速发明有悠揭捉?息是缺点的办法。精确的数据研究办法始于肯定精确的机能衡量标准,这种标准将营业结不雅和与数据相干的问题接洽起来。然则,所选标准应当恰当。例如,当DXC比来与媒体公司合作,解释订户分开的原因时,最直不雅的标准是“订阅┞愤基数”。事实证实,相干标准是每个用户的平均收入(ARPU),这与公司为增长收入而制订的较大年夜营业目标挺接相干。

无需担心筒仓。筒仓是很多企业进行数据发掘项目标灾害,因为它们阻拦拜访同一的数据池。然则,筒出场不像有些人认为的那样是巨大年夜的┞废碍。Raghavendra说:“如不雅你有智能数据和平台计谋,就无需那么担心筒仓。”简言之,只要不是钠揭捉?择的所要解决的问题,就不必对此担心。然而,你应当经由过程整合不合的数据源来预备解决今后出现的问题。“灵活和模块化的平台许可你在须要时整合数据,”Raghavendra弥补说道。

应用数据湖。数据湖就是存储库,不管格局若何,你都可以按原样存储所有现存的数据。Raghavendra表示,公司应当把所稀有据放在数据湖中,即使起先不知道若何应用它。但不要一开端就推敲构建数据湖。

使机械进修过程家当化。Raghavendra表示:“大年夜数据分析的┞符个过程尚未实现工业化,”其实验室支撑包含制造业、电信、汽车、航空、能源、金融办事和医疗保健在内的各类行业。“很多时刻,你几回再三反复分析或无法扩大分析。”DXC是工业化机械进修的果断支撑者,这种进修模式简单高效,认为分析中的所有阶段,即大年夜采取和清洗数据,构建算法,到将其投入临盆并获取有悠揭捉?息,应在企业技巧上可反复应用和安排。

带着目标实施摸索性数据分析(EDA)。数据发掘的第一个阶段是EDA,旨在总结可视豢?浊可视化数据。DXC高等数据科学家Bharathan Shamasundar说:“我发明摸索性数据分析老是被置于筒仓内。“EDA的目标是供给有关数据模式的看法,并告诉人们下一步应做的工作。但平日情况下,公司只是敷衍了事。”DXC与能源公司的经验强调了智能EDA的重要性。该公用事业公司正致力于精确猜测风力发电机所产能源的数量。因为该公司将EDA应用于算法,DXC团队鞭挞了现有标准,该标准认为涡轮机95%的时光都在发挥机能,尽管应用较少的变量进行计算。这种经验注解有意义的EDA(提前完成),将会更经常得出合适现稀有据的算法。

应用智能抽样。公司无法大年夜大年夜数据中获取有悠揭捉?息的一个原因是,他们应用的太多。Shamasundar说:“抽样这个词语变得不堪中听。数据抽样对于处理数据来说十分明智。”平日,“大年夜数据”看起来充斥了冗余信息。对于商品贸易公司,DXC肯定存储中的大年夜部分数据都是多余的,因为其94%的贸易交易是基于较小的数正人集。这注解评估质量和相干性是数据计谋的重要构成部分。

为数据科学筹划制订灵活的操作模式。Raghavendra建议:不要因为不克不及雇用数据科学家而推出数据分析法度榜样。数据科学家的需求量今朝比现稀有量赶过60%,并且尚未竽暌剐迹象注解这种差改┞俘在缩小。Raghavendra表示,如不雅企业无法配备足够的数据科学家,他们应当推敲应用供给专家分析支撑和“公平易近数据科学家”的合作组织。公平易近数据科学家懂得雇主企业的地点范畴和营业经营。他们可以应用现成的分析平台来进行合理的分析,这些平台简化了数据发掘的某些义务。跟着企业应用分析解决问题,合作伙伴可以赞助扩大法度榜样,并在多个范畴建立更深层次的功能。


  推荐阅读

  防止数据中心停机需要采取什么措施

数据中间行业厂商经由过程对欧洲各国IT和数据中间治理人员的查询拜访注解:27%的受访者表示在以前的三个月遭受>>>详细阅读


本文标题:如何像专业人士一样挖掘大数据?

地址:http://www.17bianji.com/lsqh/38503.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)