首页 > 其他分享 >什么是数据科学,如何才能成为一名数据科学家?

什么是数据科学,如何才能成为一名数据科学家?

时间:2023-04-18 15:33:31浏览次数:35  
标签:逻辑 不是 知识 一名 数学 数据 科学家 就是


数据科学家的年薪是多少,这都不是我们的目标,也不是成功的标志,这是一种价值的标志。怎么样才能有价值?我们要有能力,谁都想要你,不是因为你是他的亲戚或者学生,他想要你这才是价值,我们要的是价值,而不是所谓的成功。

什么是数据科学?

数据科学有很多很多定义,最基本的定义就是computerscience,还有数学、统计、目标、知识,这是最基本的,再说多了就过分了。一般对于年轻人来说,现在不可能到那么细的程度,我们应该变成一个通才,哪个公司都愿意要我们。清华大学之所以现在变成这个样子,就是因为在1952年院系调整的时候,每一个专业就是一个生产线,弄的很细很细,没有一个更宽广的视野。大数据,所谓大就是这个样子。数学关键是逻辑而不是具体的方法,不是你怎么求多项式的根,而是它的基本逻辑,它的数学语言,这一点要懂。数学逻辑是各种学科当中最严格的逻辑,无论你学逻辑的,学物理的,学什么的,文科学逻辑的肯定是不如学物理的,学物理的逻辑肯定不如学数学的,所以你要跟学数学的辩论的话就很困难。文理分科造成没有逻辑的文章,没有逻辑的法官。

如何成为数据科学家?

计算机最根本的就是领域知识,你必须了解领域知识,你才能够知道该怎么做

如果你仅仅是一个干巴巴的统计学家,你不了解统计,你可以做很多荒谬的事,不了解实际问题。有一个例子,在医学杂志发表的一个很有名的文章,说如果父母在婴儿房间内睡觉总是开着灯,婴儿就会有高度近视。后来再发现,凡是父母高度近视的,往往有给小孩开灯的习惯。到底什么造成小孩高度近视,现在你们知道的,但是当时的人不知道,所以要有很深刻的领域知识,只有明白目标领域知识的人才能明白它的意义,知道往哪个方向努力,去判断分析结果的可能性。如果没有领域知识主导的人分析肯定有误导,无论什么地位。在中国院士到哪儿都去发表理论,就像金正恩到哪儿都发表指示一样。所以用数据来说话,其他的一切都是废话。我每年看到很多很多的文章,包括一些大赛,这个赛那个赛,好多都是莫名其妙的假定,就连31个省市自治区的数据都假设是正态分布,这31个省市自治区的就不是样本,更不用说是正态分布。

作为科学就这么多内容,对年轻人来说就是要明白这些基本的东西,太花哨的东西就没意义了,那就是扩展了也不是没意义,不要钻进去出不来了。

你离得越远看得越清楚,站得越高了解的全局越好

不要太具体了,不要迷信这些炒作的新名词、新概念,用自己的大脑,用常识判断,想想合不合理。过去某个人的经验是他的经验,不是你的经验,他在特定环境、特定时间有作用,但不是现在。如果你要跟风就意味着永远是跟随,也绝对不会有出息。炒作没人管,只要有观众给你鼓掌,观众回去一脑袋浆糊,但是每个人自己不能糊涂。第一原料就是数据,什么是数据?照片都可以变成数据。

要有批判性思维

要有基于数据的批判性思维,而不是基于主观经验、权威或者是局部的知识,也不是迎合取宠式的思维。在中国取宠思维很厉害,你说GDP增加多少就是多少,这不是说的,要有人做。工具就是刚才说的能力加计算机系统加泛型。

个人还要有快速的自学能力和对数据分析的爱好

我从来没学过计算机,也没学过计算机编程。英文都没学过,全都是自学的,所以我对自学很相信。现在我教的东西都是最近这几年的东西,我现在实际上比一个全职教师教的课还多,但是我教的东西好多都是前一天网上才出现的,我觉得有价值,第二天就放到课堂上了。只有不断的自学,不断的学习才能当老师。如果你不断的跟学生演示80年前的推导过程,显示你的记忆力好,那不是好老师。
 

标签:逻辑,不是,知识,一名,数学,数据,科学家,就是
From: https://blog.51cto.com/u_13973070/6203469

相关文章

  • 对于数据分析的方法,具体包含哪几种?
    对于数据的解读,每个人都有不同的方式。如果我们要简单的总结,数据分析的方法,具体有以下几种:1)确定数据的准确性这里包含了选择数据维度的合理性、数据统计的准确性。如果数据维度选择不合理、数据统计结果不精确,我们可能是无法得出正确的分析结果的。这是基础。2)明确影响数据的因素一......
  • 数据分析方法论,统计分析方法论与营销管理常用分析方法论的介绍
    数据分析方法论重点包括两块,一块是统计分析方法论:描述统计、假设检验、相关分析、方差分析、回归分析、聚类分析、判别分析、主成分与因子分析、时间序列分析、决策树等;一块是营销管理常用分析方法论:SWOT、4P、PEST、SMART、5W2H、Userbehavior等。一、统计分析方法论:1.描述统计(Des......
  • 企业运用大数据,需要以下三种人才?
    大数据的意思是,企业能汇集到庞大的资料量,也有能力分析这些资料,统计身为汇整说明资料意义的科学,因而成为当红的趋势。因此,为了善加运用大数据,经理人更需要具备统计的素养。大数据能够做到什么,可以从一个故事讲起。有一天,百货公司寄了一份婴儿用品型录给你未婚的女儿。你认为这是对你......
  • Zabbix历史数据清理
    使用truncate命令直接清空数据库,注意:清理数据属于高危操作,请在测试环境中验证后再执行线上操作!!!truncatetablehistory;truncatetablehistory_uint;truncatetablehistory_str;truncatetablehistory_text;truncatetabletrends;truncatetabletrends_uint;truncate......
  • 从国家基因组科学数据中心下载数据
     001、官方网站:https://ngdc.cncb.ac.cn/ 002、入口: 003、输入数据编号: 004、 005、 06、linux下载说明 ......
  • jmeter数据库连接6
    1,准备资料1.一个可用的数据库2.连接数据库需要的驱动2,jmeter连接数据库3,发送插入语句请求4,发送查询语句请求5,发送删除语句请求6,对数据库进行压测本文永久更新地址:1,准备资料1.一个可用的数据库搭建一个mysql8.0的数据库环境,并设置数据库可以远程访问docker......
  • Redis Linux环境 安装,卸载,启动,通用名令,数据结构,字符串类型操作
    目录Redis高级Linux下安装redis卸载教程redis启动方式1.在redis目录下的src文件路径下2.动态参数启动3.配置文件启动客户端连接命令配置文件redis通用命令redis数据结构Redis字符串类型操作redis单线程为什么这么快Redis高级速度快:10wops(每秒10w读写),数据存在内存中,c语言实现,单......
  • 运行时数据区域
    根据《Java虚拟机规范》规定,Java虚拟机所管理的内存包括以下几个运行时数据区域。Java虚拟机运行时数据区程序计数器是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器。在Java虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一......
  • 农业大数据|提取遥感影像指定经纬度的WDRVI并与LAI回归分析
    实验目的​ 熟练遥感数据的处理流程;通过探讨地面测量的叶面积指数与遥感观测的植被指数关系,理解地面测量数据与遥感观测数据的联系。实验内容预处理遥感数据,得到WDRVI指数影像,并提取地面观测LAI对应时间,卫星观测的试验田所在位置的WDRVI均值。对比LAI与WDRVI指数,构建模型,绘......
  • 数据类型
    常量:程序执行过程中,不可以改变的量数字常量:所有的数字都称为数字常量整数常量(整数),实型常量(小数)字符串常量:由''(单引号)、""(双引号)、``(飘)引起的内容(英文状态下的)布尔常量:真(true)假(false) 变量:表示一些可以变化的数据,在程序的运行中可以再次发生变化......