3.1 选择子集
选择我们关注的子集,将不需要的子集删除。
JMP操作:查询数据时只选择关注的列即可。
JMP选择子集
EXCEL 操作:将不需要的列删除即可。
EXCEL选择子集
3.2 字段(列名)重命名
若数据集中出现同样列名称,或含义相同的两个列名,为避免干扰分析结果则需要针对某一个数据列的列名进行重命名。
JMP操作:在数据列双击更改列名即可。
JMP字段重命名
EXCEL操作: 双击修改列名内容即可。
EXCEL字段重命名
3.3 删除重复值
删除数据中的重复数据值,注意只会保留重复数据的第一条数据
JMP操作:勾选“仅非重复行”即可
JMP删除重复值
EXCEL操作:表设计/删除重复值/选择一个或多个包含重复值的列
EXCEL删除重复值
3.4 缺失值处理
原始数据中可能会出现数据值缺失,即数据集中存在无数据的数据单元格。在数据分析时会影响结果,需要将缺失的数据值进行补全。
JMP操作:快捷键CTRL+F调出搜索对话框按条件进行批量替换
JMP缺失值处理
EXCEL操作:快捷键CTRL+H调出搜索对话框按条件进行批量替换
EXCEL缺失值处理
3.5 一致化处理
当字段命名规则发生变更时,可能会出现两种数据值,但其表达的意思完全一致。如下图所示,工序尺寸1与尺寸1检验表示的意思完全一样,为了便于分析,应该将其统一为相同名字。
一致化处理
处理方式与3.4一样,将工序名替换为一致即可。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。