首页 > 其他分享 >《数据科学家访谈录》读书笔记

《数据科学家访谈录》读书笔记

时间:2022-10-07 10:03:31浏览次数:50  
标签:读书笔记 人工智能 访谈录 科学家 领域 科学 数据 数据模型


一、本书内容的介绍

《数据科学家访谈录》是一本对当前全球最知名的25位数据科学家的深度采访,然后汇聚成册的访谈录,读者可以从中学习到这25位数据科学领域的大师的个人经历及其成长过程,以及在各自的职业生涯所面临的各种选项时所做出的选择,具有很高的参考价值。

这25位数据科学家大都拥有国外名校的博士学历文凭,但是大都不想继续从事科研工作,而是希望能够将自己的科学研究成果应用到现实生活当中,从而让人们的生活变得更加美好,因此他们大都从学术界走向了工业界,这些大师从学术领域向工业领域转变的经历和过程非常值得学习和参考。虽然他们的专业研究领域各不相同,但数据科学这个研究方向把他们联系到一起,共同推动了数据科学领域的发展。他们各自所拥有的领域知识以及计算机专业技能,帮助他们在各自的研究应用领域获得丰硕成果,这也从另外一个方面验证了数据科学其实是一门理论与实践相结合的科学。

此外,本书当中这些大师们给出的方法论和经验也同样非常值得读者学习和思考。比如去大公司还是小公司的问题,Hillary认为应该是去那些能让你学到很多东西并且快速成长的公司。再比如做事情是从简单的开始还是复杂的做起,DJ认为做事情要从简单的开始做起,然后慢慢开始做复杂而又艰难的事情。这样子做事情就会有一个好的开始,进而一步一步的完成。

总的来说,《数据科学家访谈录》是一本经得起时间考验的好书,处于各种不同阶段的人群都可以从本书当中获取知识和经验,而且每次阅读都会有新的认识和收获。

二、数据科学的组成

1、数学相关的基础知识(85%): 包含了线性代数、概率论、微积分、统计学(工具)、机器学习(算法)等内容。

2、编程基础技能(15%): 1)SQL/NoSQL 2)Hadoop/Spark 3)R 4)主流编程语言,比如:C++/Java 5)主流脚本语言,比如:Python 6)Excel

三、数据科学的步骤

1、 获取数据 通过数据库、web接口、网络爬虫等获取网络上的数据(结构化和非结构化数据)。

2、 清洗数据 通过数值化、降维等手段去除数据噪音,实现数据的清洗。

3、 探索数据 在数据清洗工作的基础上,通过变量分析、处理缺失值、处理离群值等手段对数据进行初步的探索。

4、 数据建模 在探索数据工作的基础上,通过数学等工具建立合适的数据模型。有人认为好的数据模型是数据科学当中最核心的步骤,列出的优先级顺序是:高质量的数据>数据规模>好的数据模型。

5、 解释数据 数据可视化(D3、highcharts),通过可视化的web界面把数据和结论表达出来。

四、数据科学与大数据、人工智能的关系

大数据是一个内涵丰富的词汇,包含了技术、商业等因素的描绘,而数据科学是作为一门实实在在的应用科学而存在,是实现大数据应用的基础应用型学科,人工智能则是在数据科学的基础之上,向着让机器或程序有着类似人类智能的方向前进。因此数据科学是实现大数据的工具,是实现人工智能的基础。

数据科学也是一门理论与实践相结合的学科,并且有着与其它领域相互结合、共同发展的趋势。随着数据科学问题的规模越来越大,现代科研和应用更加强调拥有多领域、多学科背景的人进行团队合作,因此数据科学也有着软件工程的特征。

人工智能的基础是大数据(数据科学),大数据(数据科学)的基础是云计算。当前大数据技术已经与人工智能技术紧密结合,让各种程序和系统更加智能,从而进一步影响我们的生活。


标签:读书笔记,人工智能,访谈录,科学家,领域,科学,数据,数据模型
From: https://blog.51cto.com/u_13127751/5734220

相关文章

  • 读书笔记1
    就同我在上篇读书笔记中说的那样,这本书中的一些方法和思想,需要我们在之后的编程学习过程中一点一点的参悟和领会。比如说从我的第一次个人作业中,我对书中提到的曳光弹代码......
  • 读书笔记2
    最近阅读了《程序员的修炼之道:从小工到专家》第四章:“注重实效的偏执”,再结合上周一的期中考试,让我感触颇深。本章开始先讲述了“按合约设计”,大该讲的是与计算机打交道......
  • 产品经理必懂得技术那点事儿——读书笔记
    产品经理必懂得技术那点事儿1.产品思维与技术思维1.1.产品经理为什么要懂技术当产品经理与工程师就某一个具体问题进行讨论时,双方站在各自角度就问题进行分析和讨论,固有......
  • 9月《代码大全2中文版》读书笔记
         本月,在王老师的推荐下,我进行了对美国的史蒂夫·麦克奈尔先生编著的《代码大全2中文版》这本书的学习工作。本次学习让我受益匪浅,以下是我个人的一些所思所想......
  • 读书笔记1
    读书笔记1程序员所应该遵循的实用主义原则。我的源码让猫给吃了:出现错误时,要诚实,不要推诿或者找借口。要提供各种可能的解决方案与后果并与他人沟通,而不是提供借口。软......
  • 读书笔记2
    程序需要遵守的实用主义原则。重复的危害:如果某个事物在代码中重复多次,就可能会在维护过程中带来问题,因为改动了一处而忘记改动另一处造成自相矛盾。这加大了维护难度。要......
  • 《程序员修炼之道:从小工到专家》读书笔记2
    除了是程序员,AndyHunt还是一位木匠和音乐家,你LD将v到h与这样的背景粕关单引擎飞机。尽管作者未曾明言,在本书的许多地方、你都将看到与这样的背景相关的叙述。我想,对于两位......
  • 九月读书笔记《程序员修炼之道——从小工到专家》
        本月,在王老师的推荐下,我进行了对美国的安德鲁·亨特和大卫·托马斯编著的《程序员修炼之道——从小工到专家》这本书的学习工作。本次学习让我受益匪浅,以下是我......
  • 《程序员修炼之道:从小工到专家》读书笔记1
    本书原名“ThePragmaticProgrammer”.也就是“注重实效的程序员”。正如书名所示.本书将围绕“注重实效”讲述关于编程的各种话题:个人责任、曳光弹开发、调试策略、元程......
  • 读书笔记1
    就同我在上篇读书笔记中说的那样,这本书中的一些方法和思想,需要我们在之后的编程学习过程中一点一点的参悟和领会。比如说从我的第一次个人作业中,我对书中提到的曳光弹代码......