也就是说,你须要如许一种说话:
-
可以或许在这些范畴都可以或许发患咀用(如数据可视化、数据处理、机械进修(也叫做统计进修))。
-
这门编程说话在这些范畴内还有高质量的进修、练习素材。
尽管市情上有很多关于数据科学的书本与课程,但个中最好的大年夜多都是基于 R 说话的。
话虽如斯,对于数据科学的初学者来说,我仍然认为 R 是更好的选择,个中的原因我在上文中已经进行了概述。
应用 R 说话进修概率论
《Introduction to Probability》。这本书基于哈佛有名的统计学课程编写。
《Probability with Applications and R》。这本书说话朴实、通俗易懂、层次清楚。
优雅
这只是两个简单的例子。如不雅你进一步发掘的话,你会发明几乎所有的关于概率论的书本都应用了 R 说话。
应用 R 说话进修频率论统计学(frequentist statistics)
对于统计学方面的书本也是如斯。
因为统计学已经深刻 R 说话的骨髓,所以很多统计学教材应用 R 说话作为其进修对象。
《Statistics: an Introduction using R》是一本介绍频率论统计学的优良书本。
一样的,如不雅你在亚马逊上快速搜刮一下,你找到的大年夜部分统计学入门的教材都应用了 R 说话作为它们的进修对象。
当你正在寻找一本关于贝叶斯统计学的入门书本时,这种趋势变得更为明显。
几乎所有的关于贝叶斯统计及揣摸的书本都是用了 R 说话。尽管有些例外(有些书应用了 C 说话或者 Python),但主导的仍然是 R 说话。
如不雅你对贝叶斯统计学感兴趣,你可以查看这几本书:
-
Introduction to Bayesian Statistics
-
Statistical Rethinking
-
Doing Bayesian Data Analysis
如不雅你对贝叶斯办法感兴趣的话,这些书是你最棒的选择了,并且它们都应用了 R 说话。
进修如安在 R 中进行数据可视化
当你在进修数据可视化的时刻,尽管你会有相对更多的编程说话可以选择,但笔者照样认为,大年夜多半最优的编程资本都应用了 R 说话。
如不雅你正在进修数据可视化,那么你可以参考 Nathan Yau 的工作。他经常在他的博客(flowingdata.com)上上传一些应用 R 说话的数据可视化教程。(笔者同时推荐他所写的《Data Points》作为参考,在这本书中重要讲解的是数据可视化的一些轨则而非编程实现。)
同时,你还可以参考这本书:R for Data Science。这本书包含了对数据可视化异常棒的介绍,还有对很多 R 说话数据可视化对象库的介绍,是一本进修 R 说话的必备书本。
应用 R 说话来进修机械进修
最后,如不雅你想开端进修机械进修,有很多优良的应用 R 说话描述的机械进修的书本可以参考。
我承认,如今有各类各样应用不合的编程说话的来描述机械进修的书本,但我认为,在最好的那一部分书本中有很大年夜比例都是应用的 R 说话。
下面有两个应用 R 说话来介绍机械进修的优良的教程:
-
统计进修导论(An Introduction to Statistical Learning)
-
应用猜测建模(Applied Predictive Modeling)
这些书写得十分严谨同时也很轻易懂得。书中会说起一些理论常识(然则不会用很复杂的数学常识来难堪你),同时也会传授你一些实用的技巧。
毫无疑问,这是我给想进修机械进修的初学者最常推荐的两本书,并且它们都应用的是 R 说话。
如不雅你想进修数据科学,R 说话是一个绝佳的选择
进修 R 说话
最后强调一下,R 是一种进修数据科学的优质说话,因为很多优良的书本(以及一些其它的教程)都应用 R 来作为编程说话。
所以,如不雅你是数据科学的初学者,因为数据科学进修材料的数量和质量所限制,所我认为 R 说话是最好的选择。
一个关于 Python 的快速注解
就数据科学编程说话来说,Python 是今朝独一可以替代 R 的说话。(因为其它的替代筹划缺乏完美的软件包生态体系或者长短开源/免费的)。
我不会在这里阐述我对 Python 的全部懂得,然则我必须要讲的是,Python 切实其实是一种优良的说话。我爱 Python。
再者,我认为关于基本数据科学概念(概率、统计、贝叶斯统计、机械进修)典范多最好挡裉科书和教程都是基于 R 的。当然,这并不是说没有优良的数据科学书本应用 Python,我只是认为基于 R 的书本的平均质量高于用其它编程说话描述的书本。
有关于 Python 的另一个问题是,很多学生在开辟过程中会碰到一些艰苦。他们在进修的过程中并没有花若干时光来进修统计数据、数据可视化、数据操作、概率等,而是花费了大年夜量的时光去进修数据构造、轮回、流程控制、面向对象的编程和 Web 框架。这些技能可以用来完美核心的数据科学对象包,但它们不是我们想要懂得的数据科学范畴的相干内容。事实上,我建议大年夜多半初学者先进修根本数据科学相干的内容(如数据操作、可视化、分析等)后再进修软件开辟。
固然大年夜多半的初学者在今后会进修软件开辟的技巧,然则很多应用 Python 来作为入门数据科学的初学者会陷入到软件开辟和 Web 开辟等范畴。我认为之所以会出现如许的问题,是因为在很多方面,Python 都是应用于这些范畴的。大年夜多半关于 Python 的书本并不是真正的数据科学书本,而是讲述一些有关于编程和开辟的内容。所以,有些数据科学的初学者选择应用 Python 描述的书本来进修数据科学,然而他们最终却花费了数月甚至数年来进修软件和 web 开辟而不是数据科学。
以概率论为例,两本关于概率论的优良书本都是用 R 说话来编写书上的上手案例的。这两本书分别是:
-
当然,我异常爱 Python,然则对于初学者而言,我认为选择 Python 有一些冒险。最好照样大年夜 R 说话开端,因为统计学和数据科学就像「它的 DNA」一样和它绑定在一路。应用 R 说话,不仅更轻易进修,也不轻易偏离我们的进修范畴。
推荐阅读
你可以在这里找到这篇博文的代码。 上一篇博文中我们给调试器添加了一个简单的地址断点。此次,我们将添加读写存放器和内存的功能,这将使我们可以或许应用我们的法度榜样计数器、不雅察状>>>详细阅读
本文标题:R vs Python:R是现在最好的数据科学语言吗?
地址:http://www.17bianji.com/lsqh/36048.html
1/2 1