作家
登录

R vs Python:R是现在最好的数据科学语言吗?

作者: 来源: 2017-07-05 16:07:27 阅读 我要评论

如不雅你想进修数据科学,那么就进修 R 说话吧

你应当记住的是,如不雅想要进修数据科学,R 是可以说是最好的选择。在人气方面,R 拥有异常高的排名,并且还处于上升趋势。此外,有很多最好的数据科学的书本和教程都是应用 R 说话来描述的。

如不雅你想要开端进修数据科学,我的建议如下:

  • 重灯揭捉?习 ggplot2、dplyr、tidyr、lubridate 和一些其它用于实现数据的可视化和控制的 Hadleyverse 对象

  • 进修同时应用这些对象来进行数据分析。

  • 当你对这些 R 对象包有所懂得之后就可以开端进修概率、统计学和机械进修的内容了 (我推荐大年夜家应用我在本文中所谈到的那些材料)

(别的,有 70% 的受访者应用 SQL。如不雅你正在寻找 R 之后的另一个说话去进修,我会推荐 SQL)

R vs Python - 超等豪杰

R 这么好,也不要忘记 Python。在这一部分我们比较一下数据科学家的两个超等豪杰——R 和 Python。

Python 就像是超人,而 R 和蝙蝠侠之间有几点类似之处。让我们创建一个表来列出这些类似之处。

类似之处

R 就像蝙蝠侠

  • 侦察工作

  • 聪明

  • 滑头

  • 应用对象

  • 动脑多于蛮力

Python 就像超人

  • 肌肉力量

  • 超等力量

  • 应用面广

  • 蛮力多于动脑

接下来解释一下 R 和 Python 之间的差别及原因。此外,让我们赞助数据科学家找到更好用的编程说话。

R vs Python / R 和 Python : 哪一种更好用?

R 和 Python 都是开源的、免费的高等编程说话。R 专门用于统计计算。它有大年夜量附加包(package)/对象来支撑机械进修和数据分析。另一方面,Python 是一种通用的强大年夜的编程说话,在数据预备、数据调试和数据分析方面有特别的应用。

这种差别也是不合分析人士爱好这些编程说话的原因。Python 平日被测验测验开辟数字处劳憾ブ析技能的计算机法度榜样员所青睐。另一方面,R 被数学家和统计学家优先选择。这些差别在这些说话的进修资本(书本和网上论坛)中是显而易见的。例如,推敲以下 4 本免费的在线图书。

在线图书

所有这些书都是高质量的统计教材,用 R 作为首选编程说话。这些只是几个例子。请留意,第一本书不是专门用于 R,与第二本书有雷同的作者。你很少会找到用 Python 作为首选说话的书本。是以,R 更有才能处理数据发掘和统计分析的相干问题。另一方面,Python 供给了异常好的应用法度榜样来处理非构造化和复杂的数据集,如图像、书面文本(收集、电子邮件等)、基因、声音等。

本质上,Python 和 R 一路构成了数据科学家的对象包。是以,对于务实的和面向应用的数据科学家来说,懂得这两种说话的超等才能和特点是至关重要的。

特点

应用 R 进行分析、数据可视化与建模:

  • 为分析供给了极好的灵活性

  • R 使你在分析的时刻更轻易思虑

  • 因为有着十分活泼的统计与数学社区,可以持续的更新和加强分析功能优良的数据可视化对象

  • 优良的数据可视化对象

应用 Python 进行数据预处理、数据清洗,特别针对于非构造化数据(如网页,图像,文本等):

  • 极强的灵活性,可以或许大年夜自由文本、网站和社交媒体网站提守信息

  • 便于图像发掘和为分析预备数据

  • 应用 R 说话进修贝叶斯统计学

    R 说话是进修数据科学的极佳说话

    到 2016 年 12 月,R 说话的总排名是 17(在所有编程说话中)。它的最高排名是 2015 年 5 月的第 12 名。

    处理大年夜量的数据的时刻比 R 说话更好

对于一个卖力的数据科学家来说,R 和 Python 都应当懂得。我们须要的是 R+Python,而不是 R vs Python。

【编辑推荐】

  1. MIT 提出Network Dissection框架,全主动窥测神经收集练习的黑箱
  2. ARKit & OpenGL ES - ARKit 道理及实现
  3. 微办事架构:基于微办事和Docker容器技巧的PaaS云平台架构设计(微办事架构实施道理)
  4. 谈一下关于CQRS架构若何实现高机能
  5. 大年夜TensorFlow到Theano:横向比较七大年夜深度进修框架
【义务编辑:张子龙 TEL:(010)68476606】

应用这种办法,他们将几十种编程说话进行排名和分类。



  推荐阅读

  开发一个Linux调试器(三):寄存器和内存

你可以在这里找到这篇博文的代码。 上一篇博文中我们给调试器添加了一个简单的地址断点。此次,我们将添加读写存放器和内存的功能,这将使我们可以或许应用我们的法度榜样计数器、不雅察状>>>详细阅读


本文标题:R vs Python:R是现在最好的数据科学语言吗?

地址:http://www.17bianji.com/lsqh/36048.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)