作家
登录

R vs Python:R是现在最好的数据科学语言吗?

作者: 来源: 2017-07-05 16:07:27 阅读 我要评论

在前一段时光的博客中,我说清楚明了为什么你应当控制 R 说话(即便它最终可能过时):http://sharpsightlabs.com/blog/master-r-obsolete/。我写这篇文┞仿是为了向那些声称控制 R 说话浪费时光的人致辞。(因为它最终会变得过时)。

然则当我认为 R 说话最终会变得过不时,这似乎引起了恐怖——仿佛 R 说话已经由时了。

我想要清除你的恐怖:R 说话仍然很风行。

R 说话是以前十年中成长最快的编程说话之一。

所以,我想向你包管。R 说话绝对没有过时的。事实上,R 说话是异常受迎接的并且是最好的数据说话。

为此,我想解释为什愦我对 R 说话的经久前景异常乐不雅,以及为什愦我认为这也许是今天可以进修的最好的数据科学说话。

R 说话始终是最好的说话之一

我想让你们明白的一件工作是:今朝 R 说话是存在的最受尊敬、排名最高、增长最快的说话之一。

在很多方面,R 说话就代表了数据说话。在数据科学范畴,这是一个仍处于顶端的说话(只有 1 到 2 个真正的竞争者)。

IEEE:R 说话排名第 5

世界上最大年夜的技巧专业协会 IEEE 在几年前已经创建了一个编程说话排名。

这个 IEEE 的排名体系应用一组 12 个指标,包含比如谷歌的搜刮量、谷歌的趋势、Twitter 的点击次数、GitHub 的库、Hacker News 的帖子等等。

在他们对 2016 年顶级编程说话的回狭闼楝R 说话已经攀升到了第 5

2016排名

IEEE 的办法是异常周全的,所以这对于 R 相对于其他说话的力涟谕进修的相对价值是一个很好的指导。

TIOBE:R的排名高,且具有持续的上升趋势

另一个排名体系,TIOBE 索引,为各类编程说话创建了类似的分数和排名。

如不雅我们看看 R 说话在 TIOBE 索引上的表示,我们可以看到近十年以来一个稳定的上升趋势。

趋势

请记住,TIOBE 索引的构造是「编程说话受迎接程度的指导」。索引每个月更新一次,评分是基于世界范围内的精尖工程师、课程和第三方供给商的应用量。像谷歌、Bing、雅虎、维诽谤科、亚马逊、油管和百度等热点搜刮引擎则用来计算排名。

为什么这么说呢?让我们看看几个重要的查询拜访和编程说话排名的结不雅,看看 R 说话排在哪里。

这注解,如不雅你想进修数据科学,今朝进修 R 说话仍然是一个很好的选择。(要清跋扈,Python 在 TIOBE 索引上的排名较高,然则很难大年夜 Python 相干应用的严格数据平分别出收集和软件开辟的应用情况,是以这可能不是一个公平的比较)。

Redmonk:R说话排名12

另一个经常选择的说话排名体系是 Redmonk 编程说话排名,它是大年夜 GitHub(代码行数)和 Stack Overflow(标签数量)上的风行度衍生出来的。

截至 2016 年 11 月,R 说话在所有编程说话中排名第 13 位。

此外,R 说话几年来一向呈上升趋势

在前 20 种说话的后半部分中,跟着时光的推移,R 说话显示出最一致的上升趋势。大年夜 2012 年的第 17 位开端,它跟着时光的推移稳步上升,但似乎在 13 这个地位上逗留了持续三个季度。然而这一次,R 说话代替了排名 12 位的 Perl,使其跌落到 13 位。固然仍然有大年夜量的 Perl 说话在流畅,然则加倍专业的 R 说话已经攫取了这个一度被认为是收集粘结剂的 Perl 说话的地位。当然这与 R 说话的支撑者们无关。R 说话相对独特的前 20 路径是值得它们的粉丝所欢呼的。

O’Reilly:R说话可以说是最常见的数据编程说话

最后,媒体 O'Reilly 在以前的几年迈进行了一次数据科学查询拜访,他们应用查询拜访数据来分析数据科学的趋势。除了其他的之外,它们分析对象的应用情况来肯定哪些对象是数据科学家最常应用的。

在 2016 年的查询拜访申报中,R 说话是最常用的编程说话(如不雅我们清除 SQL,这不是我在这里所指的编程说话)。57% 的受访者应用 R 说话(比拟之下,应用 Python 的有 54%)

他们还查询拜访了人们去辨认数据可视化的对象。他们发明 ggplot2 是最常见的可视化对象。我会在一篇即将宣布的博客中解释为什愦我爱好 ggplot2,但如不雅我们只跟踪人气,O'reilly 的查询拜访注解 ggplot2 时最常被应用的对象之一,甚至可能就是最常被应用的。

R 说话成为一门极佳的数据科学说话,在广泛性之外,另一大年夜原因是:它是一门异常好的进修数据科学的说话。

R 说话是真正的「数据说话」

事实上,如不雅你开端进修数据科学,我仍然推荐大年夜 R 说话开端。

R 说话之所以如斯合适数据科学的原因部分跟它本身的说话特点有关。自 R 说话创造之初,数据及统计的不雅念便融入个中。R-Project 形容其为「为统计计算而预备的编程说话及情况」。也就是说,R 说话的 DNA 中就含有统计及数据的基因。

如斯说来,R 说话在浩瀚编程说话中可谓独树一帜。它是一门为统计而生的说话,是一门为(处理)数据而设计的说话。当你在进修数据科学的时刻,这将带来很大年夜的优势——因为几乎所有的统计测试或办法都可以或许在 R 说话及其拓展库中找到。

笔者亦推荐 Hadley Wickham 所著的书。如不雅你对应用 R 说话进行数据可视化感兴趣的话,那么你应当拥有 ggplot2 这本书。它不仅教会你若何应用 R 说话中数据可视化库的应用办法,还可以或许改变你对数据进行可视化的不雅念。

最好的书本和资本都应用了 R 说话

俨然,R 说话已是一门「统计计算」说话。与之相干的是,很多很好的书本及进修资本都采取了 R 说话。

这异常重要。如不雅你是一名初学者,在数据科学范畴才方才起步,那么你将须要进修很多常识。要真正控制数据科学,你须要进修包含概率论、统计学、数据可视化、数据处理及机械进修在内的诸多子范畴。所有这些范畴都包含潦攀理论基本(也就是你须要进修的内容),同时你也须要经由过程编写法度榜样实际应用它们。


  推荐阅读

  开发一个Linux调试器(三):寄存器和内存

你可以在这里找到这篇博文的代码。 上一篇博文中我们给调试器添加了一个简单的地址断点。此次,我们将添加读写存放器和内存的功能,这将使我们可以或许应用我们的法度榜样计数器、不雅察状>>>详细阅读


本文标题:R vs Python:R是现在最好的数据科学语言吗?

地址:http://www.17bianji.com/lsqh/36048.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)