首页 > 其他分享 >数据分析基础概念1

数据分析基础概念1

时间:2024-11-07 20:16:47浏览次数:5  
标签:数据分析 基于 假设 基础 概念 算法 实验 数据 发现异常

一、什么是数据分析?

观测、实验、应用

二、重新认识数据分析

观测:对实物形成客观量化的认知(报表、图表、仪表盘)

实验:发现规律、验证假设(科学研究、A/B实验)

应用:不断基于数据反馈迭代产品;基于数据训练算法,让机器自动化地完成工作

三、观测

采集数据、储存数据、展示数据


1、采集数据的方式

解析系统日志

埋点获取新数据

通过传感器采集

根据api获取数据

根据爬虫解析网站

2、储存数据(数据采集完后进行存储)

数据库的分类:hive,mysql,postgresql,impala

连接数据库取数:数据存储在哪个数据库中

3、展示数据

从数据库获取后进行展示数据:可视化高效传达信息


四、测量

设定标准、发现异常、研究关系

-----------------------------

分析数据的目的是什么?

1、及时发现异常

2、找到数据之间的因果关系

怎么做到?

数据是客观统一的,所以有统一的认知才能有共同的目标


1、及时发现异常

设定标准+发现异常

举例:当月的销售额设定一个基准值,超出和下降就是变化,提前发现异常

研究关系:可视化查看相关性、建模推导相关性、设计实验提出假设,然后验证假设

举例:观测到差评率飙升,假设由恶劣天气引起,通过天气数据验证

2、找到数据之间的因果关系

所有未经事实数据验证的想法都是假设

设计a/b测试获取数据

--实验目标、实验假设、实验打分、实验指标、实验观众、实验版本、开发验收、实验结果、实验分析、后续计划

---------

如何在业务只有少量数据时设计数据实验?

如何在无法同时测试两个版本时比较数据?

1、基于数据反馈不断迭代产品喝业务策略

2、基于数据训练算法,让机器自动化地完成工作

五、应用-如何应用数据创造价值

 —基于数据反馈不断迭代产品和业务策略

 —明确业务的目标,拆解目标,得到标准值

—流程拆解法、二分法、象限拆解法、杜邦分析法、AARRR、pest、rfm、swot、5w1h(拆解只要符合mece法则即可)

—将数据应用于业务

—将数据应用于算法

①为算法设定明确的业务目标

②为算法提供高质量的数据

③判断算法是否真的创造了实际价值

④帮助业务更好地使用算法

基于数据和算法的竞争,无时无刻不在互联网行业上演;

基于数据训练算法,让机器自动化地完成工作

标签:数据分析,基于,假设,基础,概念,算法,实验,数据,发现异常
From: https://blog.csdn.net/weixin_51482243/article/details/143503842

相关文章

  • 三十四、Python基础语法(文件操作-上)
    一、介绍文件:可以储存在长期储存设备上的一段数据,在计算机储存的数据都是二进制的形式储存的,我们用软件打开文件不是看见0和1是因为软件会自动将二进制数据进行转换。二、文件操作1.打开文件打开文件:文件是在硬盘中储存的,打开文件可以理解为将硬盘中文件加载到内存中,在pyth......
  • 三十三、Python基础语法(面向对象其他语法-下)
    一、属性划分1.类属性类属性:类属性就是类对象具有的属性,一般写法在类内部、方法的外部定义的变量,就是类属性,类属性在内存中只有一份。可以通过类名直接访问,也可通过实例访问。classCircle:#类属性,定义圆周率pi=3.14159def__init__(self,radius):......
  • 三十、Python基础语法(继承-下)
    方法重写重写:在子类中定义和父类中名字相同的方法,如果父类中方法不能满足子类对象的需求,重写的形式有覆盖和扩展一、覆盖式重写classVehicle:defmove(self):print("Thevehicleismovinginageneralway.")classCar(Vehicle):#重写move方法......
  • 真题练习46-PowerPoint演示文稿-全国计算机等级考试一级计算机基础及MS Office应用考
    第46组打开考生文件夹下的演示文稿yswg.pptx,按照下列要求完成对此文稿的修饰并保存。1.在第一张幻灯片前插入4张新幻灯片,第一张幻灯片的页脚内容为“D”,第二张幻灯片的页脚内容为“C”,第三张幻灯片的页脚内容为“B”,第四张幻灯片的页脚内容为“A”。2.为整个演示文稿应用“丝......
  • hive基础知识分享(二)
    写在前面今天继续学习hive部分的知识。以下是您提供的内容转成的Markdown格式:Hive相关知识hive中不同的count区别selectclazz,count(distinctid)ascnt,count(*)ascnt,count(1)ascnt_1,count(id)ascnt_idfromstudentsgroupby......
  • 训练好的模型怎么使用(非常详细),零基础入门到精通,看这一篇就够了
    前言“训练大模型的目的,就是为了解决业务问题”学习机器学习的人大部分都知道怎么设计并训练一个模型,但开发模型的目的是为了解决业务问题,所以怎么使用大模型也是重中之重。刚训练好的大模型事实上虽然可以用,但由于没有用户接口,所以只能自己用,无法对外提供服务;所以,刚训......
  • HTML基础
    HTML(超文本标记语言),可用来构建网页,告诉浏览器如何组织页面的标记语言。一个HTML由众多不同的元素组成,每一种元素都可以根据自己的特点对元素内部的内容进行编辑。如果我们想在页面上显示“HelloWorld!”,我们可以用一个<p>标签来实现<p>HelloWorld!</p>在上面这个例子中,......
  • 86分支汇编语言-0基础可选择
    在86汇编语言中,分支和循环是常见的控制流结构,主要用于根据条件执行不同的代码段,或者重复执行某段代码。下面我将详细讲解如何在86汇编语言中实现分支和循环。1.分支指令分支指令用于根据条件选择是否跳转到程序的其他部分。常见的分支指令有:1.JMP:无条件跳转。2.JE/JZ:......
  • 调度的概念与层次
    调度的概念与层次‍​​‍一、调度解决的问题理解:在资源有限不能同时处理所有任务的情况下,需要确定某种规则来确定处理这些任务的顺序(划分权级或短时优先或其他等)‍二、调度的层次划分​​‍(一)高级调度/长程调度/作业调度内存的空间有限,无法将所有任务同时装入内存。......
  • 线程的概念、作用和属性
    线程的概念、作用和属性线程的概念理解:线程可视作“轻量级进程”。线程是一个基本的CPU执行单元,也是程序执行流的最小单位。引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如QQ视频、文......