首页 > 其他分享 >R语言实战(第三版)全新升级版,超过30万学习者入手的畅销书

R语言实战(第三版)全新升级版,超过30万学习者入手的畅销书

时间:2023-06-19 17:23:27浏览次数:34  
标签:实战 数据分析 语言 30 新增 学习者 数据管理 数据 升级版

在我刚入学那会儿初次接触R语言,看的第一本工具书就是《R语言实战》,收获良多,当时还只是第二版。最近和人民邮电出版社的好朋友交流发现,他告诉我上个月刚刚出版了《R语言实战 第三版》 ,豆瓣评分9.2,被称为最牛R语言实战书升级版。


上面这本书的第 1 版于 2012 年出版,距今已经过去 11 年了,第 2 版于 2016 年出版,豆瓣评分 9.2,全系列累计销量已经突破 30 万 册,是一本口碑与品质兼具的佳作。

为什么要学习R语言?

目前 R 已经成为统计、预测分析和数据可视化的全球通用语言。它提供各种用于分析和理解数据的方法,从最基础的到最复杂、最前沿的,无所不包。

R 最为人所知的是能够创建漂亮优雅的图形,但实际上它也可以处理各种统计问题。R 的基本安装版本就提供了数以百计的数据管理、统计和图形函数等功能。不过,R 很多强大的功能都来自社区成员所开发的数以千计的扩展功能(包)。

这种扩展的广度也是有代价的。对于新手来说,经常遇到的两个基本难题就是:R 到底是什么? R 究竟能做什么?甚至是经验丰富的 R 用户也常常惊讶地发现一些他们之前闻所未闻的新功能。

怎么高效学习R语言?

学习的方法非常重要,一本有助于新手学习的工具指南书能发挥高效作用。熟悉 R 语言的人对这本领域内的经典著作《R语言实战》一定不陌生。这本书为 R 语言初学者铺就了平缓的学习之路,帮助了很多 R 语言学习者入门。

这本书上个月上市出版以来,在各大平台收到广泛关注,收获了一致好评。

新版本有什么亮点?

这几年 R 发生了一些变革,大数据的增长、tidyverse 软件的广泛应用、新的预测性分析和机器学习方法的快速发展,以及更多崭新且强大的数据可视化技术的进步促使 R 也发生了变革。

而本书的原作者也一直关注着这些变化,他针对读者反馈的新需求,对书中的内容进行了全新升级,力求能够跟上 R 的新变化。

第 3 版有许多变化,尤其是新增了 tidyverse 系列包在数据管理和数据分析方面的各种功能。以下将列出一些重要变化:

第 2 章(创建数据集)将介绍用于导入数据的 readr、readxl 和 haven 包。另外,新增的一节将专门介绍 tibble 数据结构。tibble 是对传统数据框的一种全新改进。

第 3 章(基本数据管理)和第 5 章(高级数据管理)将介绍用于数据管理、转换和汇总的 dplyr 和 tidyr 包。

第 4 章(图形初阶)、第 6 章(基本图形)、第 11 章(中级绘图)和第 19 章(高级绘图)是新增内容,将详细介绍 ggplot2 及其扩展包。

第 16 章(聚类分析)将提供改进后的图形绘制方法。其中新增的一节将专门介绍如何计算数据聚类。

第 17 章(分类)新增了一节,将介绍 Shapley 值图和细分图的用法,以便读者更好地理解黑箱模型。

第 18 章(处理缺失数据的高级方法)新增了几节,将介绍用于缺失值插补的 k 近邻方法和随机森林方法。

第 20 章(高级编程)新增的几节将介绍非标准计算和可视化调试。

第 21 章(创建动态报告)新增了 R Markdown 的内容,以及有关参数化报告和常见编码错误的内容。

第 22 章(创建包)被全面重写,以便涵盖使用新工具来简化包的创建步骤的内容。另外,这一章还新增了如何通过 CRAN、GitHub 和软件生成网站来分发和改进包的内容。

根据图形用户界面的最新变化,作者对附录 A(图形用户界面)进行了更新。

还对附录 B(自定义启动环境)进行了修订,增加了新的自定义启动环境的方法,以及对可重复性研究的潜在副作用的更多提醒。

针对附录 F(处理大型数据集)还新增了一些包,用于处理超过内存大小的数据集,新增了用于解决 TB 级数据问题的分析方法,以及将 R 和云服务进行整合的新包。

第 3 版更是新增了使用 RStudio 进行编程、调试、编写报告和创建包的内容。还第 3 版还对文字进行了大量的更新和修正。

这本书适合哪些人?

对于有数据处理需求的读者来说,这本书不需要你有任何统计编程或者 R 知识背景,就算是 R 新手也能够读懂。对于有经验的 R 老手,书中也有足够多的实用内容。

作者尽可能地让每一章都能同时满足数据分析新手和数据分析专家的需求,让所有人都能发现有趣和实用的内容,并从中获益。
读者可以根据自身所处阶段和需求来阅读。

作者和翻译者简介


大咖推荐与点评

第 3 版新增了 R 语言的最新数据分析包的用法,是提升数据分析能力的实战用书,可引导读者在编写 R 代码的同时熟练掌握数据分析方法。

——王小宁,中国传媒大学数据科学与智能媒体学院副教授、统计之都秘书长

作者在本已精良的前版基础上,又补充与更新了大量内容,实现了自我超越。

——Alain Lompo,IsO-Gruppe公司

多年来,《R语言实战》一直是我不离手的参考书。第 3 版对 tidyverse 系列包和其他工具包的增补实在及时。我当然会毫不犹豫地推荐此书。

——Daniel Kenney-Jung,美国杜克大学儿科医学部医学博士

标签:实战,数据分析,语言,30,新增,学习者,数据管理,数据,升级版
From: https://www.cnblogs.com/JewelZ/p/17491630.html

相关文章

  • 从3000ms到25ms!看看人家的接口优化技巧,确实很优雅!!
    批处理避免多次IO异步处理空间换时间使用缓存预处理预计算池化思想数据库连接池,线程池。避免重复创建与销毁。优化程序结构程序经过多次迭代,多人维护开发情况下,会出现一些重复操作等等。串行改并行索引加索引,排除索引失效场景避免大事务......
  • Android面试「25K—30K」的坑位,面试官喜欢问些什么?
    前言掉帧监控,函数插桩,慢函数检测,ANR监控,启动监控……这些让Android开发者们头皮发麻的内容,如今可都成为了大厂中面试必问题目:用什么机制去监控,在哪里函数插桩,反射调用用哪个类哪个方法和哪个属性?这些问题恐怕是会难倒一大批向高阶进军的开发者。目前大公司的app开发都要基于模块化......
  • 20230308 java.util.ArrayList
    简介java.util.ArrayListList接口的可调整大小的数组实现。源码中对数组的操作非常精彩,值得学习数组一旦初始化长度就不可以发生改变数组结构特点增删慢:每次删除元素,都需要更改数组长度、拷贝以及移动元素位置。查询快:由于数组在内存中是一块连续空间,因此可以根据地址......
  • ABC306G 与 CF1835D 的思考
    两道题似乎都涉及了一个经典模型:在一张有向图上,给定起点\(s\)和终点\(t\),询问\(s\)到\(t\)与\(t\)到\(s\)是否均存在一条长度\(=L\)的路径(\(L\)是一个\(\gen^3\)的数)。首先\(s\)与\(t\)必须在同一个SCC内(考场上没看到互相可达直接以为不可做)。考虑取......
  • 20230406 9.2. 希尔排序( by Donald Shell )
    希尔排序(byDonaldShell)定义增量序列\(D_M>D_{M-1}>…>D_1=1\)对每个\(D_k\)进行\(D_k-间隔\)排序(k=M,M-1,…1)注意:\(D_k-间隔\)有序的序列,在执行\(D_{k-1}-间隔\)排序后,仍然是\(D_k-间隔\)有序的希尔增量序列原始希尔排序$D_M=N/2$......
  • 20230618 java.util.stream.Stream
    介绍java.util.stream.StreampublicinterfaceStream<T>extendsBaseStream<T,Stream<T>>APIstaticbuilder返回Builder创建流:ofofNullableempty创建无限流:iterategenerateconcat<T>Stream<T>concat(Stream<?ext......
  • 20230227 0. 数据结构-浙大【归档】
    前言这个视频是大学教学内容,之前也学习过尚硅谷的视频课程,相对于尚硅谷的,内容要更全面一些,有对应的教材,但是语言是C,尚硅谷的实例更多一些。对于入门来说,这个视频教程更好一些目录概论202302271.1.什么是数据结构202302271.2.什么是算法202302271.3.应用实例线......
  • 20230426 22. 桥接模式 - 手机软件
    介绍对象的继承关系是在编译时就定义好了,所以无法在运行时改变从父类继承的实现。子类的实现与它的父类有非常紧密的依赖关系,以至于父类实现中的任何变化必然会导致子类发生变化。当你需要复用子类时,如果继承下来的实现不适合解决新的问题,则父类必须重写或被其他更适合的类替换。......
  • 20230426 21. 单例模式
    介绍单例模式(Singleton),保证一个类仅有一个实例,并提供一个访问它的全局访问点。通常我们可以让一个全局变量使得一个对象被访问,但它不能防止你实例化多个对象。一个最好的办法就是,让类自身负责保存它的唯一实例。这个类可以保证没有其他实例可以被创建,并且它可以提供一个访问该......
  • 20230421 10. 模板方法模式 - 试卷答题
    既然用了继承,并且肯定这个继承有意义,就应该要成为子类的模板,所有重复的代码都应该要上升到父类去,而不是让每个子类都去重复当我们要完成在某一细节层次一致的一个过程或一系列步骤,但其个别步骤在更详细的层次上的实现可能不同时,我们通常考虑用模板方法模式来处理模板方法(Templa......