By 超神经
内容提要:目前,市面上的人工智能书籍并不少,作为一名人工智能爱好者,该如何筛选书单?新年伊始,KDnuggets 整理了一份 AI 书单,请大家按需取用。
关键词:AI 书单 机器学习 数据科学
专注于机器学习、大数据、分析学的顶级网站 KDnuggets,近期整理了一份书单,共 15 本书籍,涵盖机器学习、NLP、数据科学等多个方向,书籍的作者也都是来自人工智能领域的顶尖学者、研究者。
无论你是刚开始接触人工智能的初学者,还是对相关技术已经有所掌握,清单中的这些书籍总有一款适合你。所有书籍都可免费在线阅读,可以说非常 nice 了。
1. 数据科学与机器学习:数学和统计方法
作者:D.P. Kroese, Z.I. Botev, T. Taimre & R. Vaisman
简介:这是一本实践性很强的书籍,重点关注进行数据科学和使用 Python 实现机器学习模型。它很好地解释了相关的理论,并根据需要引入了必要的数学运算,因此为全篇奠定了良好的节奏。
阅读地址:
https://people.smp.uq.edu.au/DirkKroese/DSML/DSML.pdf
2. 文本挖掘:基于 R 语言的整洁工具
作者:Julia Silge,David Robinson
简介:文本挖掘是一种从文本数据中,抽取有价值的信息和知识的计算机处理技术,也是自然语言处理的热门话题。
本书主要介绍整洁数据的文本挖掘与分析,所有代码都是基于 R 语言来编写的,对于 R 语言新手来说很不错。
全书一共分 9 个章节,介绍了如何使用基于 R 的整洁工具来进行文本分析。整洁数据具有简单且新颖的结构,对其进行分析会更有效、更容易。
阅读地址:
https://github.com/dgrtwo/tidy-text-mining
3. 因果推理:What if
作者:Miguel Hernán,Jamie Robins
简介:本书由哈佛大学 Miguel Hernan、Jamie Robins 教授编著,对因果推理的概念和方法做了系统性阐述。该书在知乎等各大平台一直呼声很高,是众多计量学者期待已久的书籍。
因果推理是一个复杂的、包罗万象的主题,但本书的作者尽其所能,将他们认为最重要的基本方面浓缩到大约 300 页的文字中。如果你对建立自己的概念基础感兴趣,这本书可能是你的首选。
阅读地址:
https://cdn1.sph.harvard.edu/wp-content/uploads/sites/1268/2021/01/ciwhatif_hernanrobins_31dec20.pdf
4. 使用 Julia 的统计学:数据科学基础、机器学习和人工智能
作者:Yoni Nazarathy,Hayden Klok
简介:这本书在第二章介绍了统计概念,从这一章开始,这些概念便相互依存,并引发了更高级的主题,如统计推断,置信区间,假设检验,线性回归,机器学习等。
荐书者表示,这是他一直在等待的资源,以他一直想要的方式有效地学习 Julia 的数据科学,希望也对你的口味。
阅读地址:
https://statisticswithjulia.org/StatisticsWithJuliaDRAFT.pdf
5. 数据科学基础
作者:Avrim Blum,John Hopcroft,Ravindran Kannan
简介:在许多当代书籍中,数据科学已简化为一系列编程工具,如果掌握了这些工具,它们有望为你完成数据科学。
一直以来,其它书籍似乎很少强调与代码分离的基本概念和理论。本书是与此趋势相反的一个很好的例子,毫无疑问,这本书将为你提供扎实的基础知识,为你从事数据科学事业提供必要的理论知识。
阅读地址:
https://www.cs.cornell.edu/jeh/book%20no%20so;utions%20March%202019.pdf
6. 理解机器学习:从理论到算法
作者:Shai Shalev-Shwartz,Shai Ben-David
简介:一旦重数学(math-heavy)理论可能带来的冲击消失,你会发现从偏方-方差权衡到线性回归、模型验证策略、模型提升、内核方法、一直到预测问题等主题,都会得到彻底的处理。而这样透彻处理的好处是,你的理解将比仅仅掌握抽象的直觉更深入。
阅读地址:
7. 使用 Python 进行自然语言处理
作者:Steven Bird,Ewan Klein,Edward Loper
简介:这本书从描述 NLP 缓缓展开,介绍了如何使用 Python 来执行一些 NLP 编程任务,以及如何访问自然语言内容来处理,然后转向更宏大的概念,包括概念(NLP)和编程(Python)。
很快,它就涉及到分类、文本分类、信息抽取以及其他通常被认为是经典自然语言处理的主题。
在通过这本书了解了 NLP 的基础知识后,你就可以继续学习更现代和前沿的技术。
阅读地址:
8. 使用 Fastai 和 PyTorch 进行编码的深度学习
作者:Jeremy Howard,Sylvain Gugger
简介:本书的作者之一 Jeremy Howard,是大数据竞赛平台 Kaggle 的前主席和首席科学家。他本人还是 Kaggle 的冠军选手。他也是美国奇点大学(Singularity University)最年轻的教职工。
合著者 Sylvain 是法国巴黎高等师范学院的校友,并获得巴黎十一大学(法国奥赛)的数学硕士学位。他也是 fast.ai 的前任老师和研究科学家,致力于通过设计和改进允许模型在有限资源上进行快速训练的技术来使深度学习更加容易。
这本书的与众不同之处在于,它是「自上而下」来讲解的。它通过真实的例子来讲解一切。在构建这些示例时,会越来越深入,会告诉读者如何让其项目越来越好。这意味着,读者将在上下文中逐步学习他们所需要的所有理论基础,从而了解其重要性,以及它如何工作。
作者表示,他们花了很多年的时间来建立工具和教学方法,使以前复杂的主题变得非常简单。
阅读地址:
http://50315d5e32ce03ba1773cc0ce6940a86.registreimarcasepatentes.com.br/read/
9. 面向所有人的 Python
作者:Charles R. Severance
简介:这本书在亚马逊共 1200 多个评分,平均评分为 4.6(满分 5 分),这就说明了,大多数读者都认为该书很有用。很多读者认为,这本书深入浅出,以一种易于理解的方式进行了介绍,并带动你去使用 Python 语言写简单项目的代码中。
本书中提及到的知识点都非常浅显易懂,十分适合入门学习。
阅读地址:
http://do1.dr-chuck.com/pythonlearn/EN_us/pythonlearn.pdf
10. AutoML:方法,系统,挑战
由 Frank Hutter,Lars Kotthoff,Joaquin Vanschoren 编辑
简介:如果你对实际的 AutoML 知之甚少,那么也不必担心。本书以扎实的主题介绍开始,并逐章明确列出了值得读者期待的每一章,这在一本由独立的章节组成的书中是很重要的。
之后,在本书的第一部分,你可以直接阅读有关当代 AutoML 的重要主题,并对此满怀信心,因为这本书是在 2019 年被整理、编辑的。第一部分之后,将介绍用于实现这些 AutoML 概念的六种工具。
最后一部分是对 2015 年至 2018 年期间,存在了几年的 AutoML 挑战系列的分析,在这段时间里,人们对机器学习的自动化方法的兴趣,似乎出现了爆炸式增长。
阅读地址:
https://www.automl.org/wp-content/uploads/2018/12/automl_book.pdf
11. 深度学习
作者:Ian Goodfellow,Yoshua Bengio和Aaron Courville
简介:这本《深度学习》应该不需要过多介绍,它由人工智能界的领军人物 Ian Goodfellow,Yoshua Bengio 以及 Aaron Courville 合著。马斯克曾经评价道:「《Deep Learning》由领域内三位专家合著,是该领域内唯一的综合性书籍。」
本书的结构,第一部分介绍基本的数学工具和机器学习的概念,第二部分介绍最成熟的深度学习算法,而第三部分讨论某些具有展望性的想法,它们被广泛地认为是深度学习未来的研究重点。
阅读地址:
https://www.deeplearningbook.org/
12. 深入学习(Dive Into Deep Learning)
作者:Aston Zhang, Zachary C. Lipton, Mu Li和Alexander J. Smola
简介:本书的独特之处在于,作者采用了「通过实践来学习」的理念,整本书都包含了可运行的代码。作者试图将教科书的优点(清晰度和数学),与实践教程的优点(实践技能、参考代码、实现技巧和直觉)结合起来。每个章节通过多种形式,交织散文,数学,和一个自包含的实现,教你一个关键思想。
阅读地址:
13. 机器学习数学基础
作者:Marc Peter Deisenroth、Aldo Faisal,Cheng Soon Ong
简介:这本书的第一部分涵盖了纯粹的数学概念,完全没有涉及机器学习。第二部分将注意力转向将这些新发现的数学技能应用于机器学习问题。
根据读者的意愿,可以采取自上而下或自下而上的方法,来学习机器学习及其潜在的数学知识。
阅读地址:
https://mml-book.github.io/book/mml-book.pdf
14. 统计学习基础
作者:Trevor Hastie,Robert Tibshirani,Jerome Friedman
简介:本书是亚马逊上的高分作品,作者是斯坦福大学的三位统计学教授。
作者对于如何传达他们的专业知识,有一种自己的方法。他们的方法似乎遵循了一种逻辑有序的方法,即读者应该在什么时候学习什么。然而,单独的章节也是独立的,所以拿起这本书,就可以直接进入模型推理的章节,只要你已经理解了这本书之前的内容。
阅读地址:
https://web.stanford.edu/~hastie/Papers/ESLII.pdf
15. 统计学习导论:基于R应用
作者:Gareth James,Daniela Witten,Trevor Hastie,Robert Tibshirani
简介:本书作者是来自南加利福尼亚大学、斯坦福大学和华盛顿大学的四位教授,他们都有统计学背景。这本书比《The Elements of Statistical Learning(统计学习基础)》更为实用,它给出了一些使用 R 语言实现的案例。
阅读地址:
https://statlearning.com/ISLR%20Seventh%20Printing.pdf
这些书籍不仅口碑极高,而且英文原版书都价格不低,基本在 50-100 美元不等。现在免费就可阅读,读到就是赚到呢~
资料来源:
https://www.kdnuggets.com/2020/12/15-free-data-science-machine-learning-statistics-ebooks-2021.html
—— 完 ——