3.1 选择子集
选择我们关注的子集,将不需要的子集删除。
JMP操作:查询数据时只选择关注的列即可。
![](https://pic1.zhimg.com/80/v2-9299f294b024724cbf8113e88af26910_720w.webp)
EXCEL 操作:将不需要的列删除即可。
![](https://pic1.zhimg.com/80/v2-b1960d706917b8d6199d0270ec81ff5c_720w.webp)
3.2 字段(列名)重命名
若数据集中出现同样列名称,或含义相同的两个列名,为避免干扰分析结果则需要针对某一个数据列的列名进行重命名。
JMP操作:在数据列双击更改列名即可。
![](https://pic2.zhimg.com/80/v2-7e74493cb8d53fa15e934a095a08ba59_720w.webp)
EXCEL操作: 双击修改列名内容即可。
![](https://pic4.zhimg.com/80/v2-611323222360e65ced485b6bca09833f_720w.webp)
3.3 删除重复值
删除数据中的重复数据值,注意只会保留重复数据的第一条数据
JMP操作:勾选“仅非重复行”即可
![](https://pic4.zhimg.com/80/v2-9ffaed44fc8955a39828c23818636a23_720w.webp)
EXCEL操作:表设计/删除重复值/选择一个或多个包含重复值的列
![](https://pic3.zhimg.com/80/v2-1aba49a6de45afaa30acfb686aeec6ca_720w.webp)
3.4 缺失值处理
原始数据中可能会出现数据值缺失,即数据集中存在无数据的数据单元格。在数据分析时会影响结果,需要将缺失的数据值进行补全。
JMP操作:快捷键CTRL+F调出搜索对话框按条件进行批量替换
![](https://pic1.zhimg.com/80/v2-d252b39ff3558b97cf86f692ea47604c_720w.webp)
EXCEL操作:快捷键CTRL+H调出搜索对话框按条件进行批量替换
![](https://pic4.zhimg.com/80/v2-fa186cb3d062cbcd97e891fead935fa7_720w.webp)
3.5 一致化处理
当字段命名规则发生变更时,可能会出现两种数据值,但其表达的意思完全一致。如下图所示,工序尺寸1与尺寸1检验表示的意思完全一样,为了便于分析,应该将其统一为相同名字。
![](https://pic3.zhimg.com/80/v2-2c08b0221806862a9e6cb043b6b316ea_720w.webp)
处理方式与3.4一样,将工序名替换为一致即可。
标签:总结,删除,重复,JMP,EXCEL,今日,数据,列名 From: https://www.cnblogs.com/zhaoyueheng/p/18069390