业务(表结构)数据分析
1.业务理解
准确
全面
2.数据收集
了解需要用到的数据有哪些
- 5W2H
结构化数据
- SQL、通过查询获取数据库资源
多源表结构数据
- 企业数据库数据
- 文本文件数据
- Excel文件数据
- 其他
3.数据加工处理
关系型数据结构
-
SQL
-
1.函数计算
-
2.添加字段及数据表
-
3.为新字段赋值,或者用查询结构填充新表
-
4.补全数据信息
-
纵向合并
-
横向合并
- 1.方向性
- 2.主附关系
- 3.对应关系
-
-
4.其他加工处理手段
-
非关系型数据结构
-
数据仓库,Power Query
- 列表
- 记录
- 表
4.数据建模
搭建多维数据集
-
Power Pivot
-
1.ER关系图
-
2.创建连接关系
-
1.对应关系
- 1.一对多
- 2.一对一
- 3.多对多
-
2.筛选器方向
- 1.单向
- 2.双向
-
-
5.数据汇总分析
1.维度
- 1.行、列标签
- 2.坐标轴
- 3.切片器
- 4.层级关系
2.度量
- 连续型变量为度量
3.汇总规则
-
1.基本汇总规则 - 求和、计数、求平均、最大值、最小值
-
2.删选条件下的汇总
-
1.筛选上下文
- 类型1
-
2.行上下文
- 类型2
-
6.数据展现
1.业务类描述性图表
-
1.基本业务类图表
- 1.柱形图
- 2.条形图
- 3.折线图
- 4.饼图、环形图
-
2.特殊业务类图表
2.统计类描述性图表
- 1.箱线图
- 2.直方图
- 3.气泡图、散点图
表结构数据处理时的注意点
1.明确表中数据的业务维度
2.明确表中字段的意义
3.明确表中主键
4.注意对null值的处理替换
5.明确表中字段的层次结构
6.明确当前表与其他数据表间的连接关系
表结构数据特点
1.一个表有一个主键,主键是表的记录单位
其他字段都需要围绕主键展开,用来扩充及
完善主键信息,不能围绕主键展开的字段不
能放在一个表下
2.主键可以由单一一个字段构成
叫单字段主键,也可以由多个不
同字段构成叫联合主键