3.1 选择子集

选择我们关注的子集,将不需要的子集删除。

JMP操作:查询数据时只选择关注的列即可。

JMP选择子集

EXCEL 操作:将不需要的列删除即可。

EXCEL选择子集

3.2 字段(列名)重命名

若数据集中出现同样列名称,或含义相同的两个列名,为避免干扰分析结果则需要针对某一个数据列的列名进行重命名。

JMP操作:在数据列双击更改列名即可。

JMP字段重命名

EXCEL操作: 双击修改列名内容即可。

EXCEL字段重命名

3.3 删除重复值

删除数据中的重复数据值,注意只会保留重复数据的第一条数据

JMP操作:勾选“仅非重复行”即可

JMP删除重复值

EXCEL操作:表设计/删除重复值/选择一个或多个包含重复值的列

EXCEL删除重复值

3.4 缺失值处理

原始数据中可能会出现数据值缺失,即数据集中存在无数据的数据单元格。在数据分析时会影响结果,需要将缺失的数据值进行补全。

JMP操作:快捷键CTRL+F调出搜索对话框按条件进行批量替换

JMP缺失值处理

EXCEL操作:快捷键CTRL+H调出搜索对话框按条件进行批量替换

EXCEL缺失值处理

3.5 一致化处理

当字段命名规则发生变更时,可能会出现两种数据值,但其表达的意思完全一致。如下图所示,工序尺寸1与尺寸1检验表示的意思完全一样,为了便于分析,应该将其统一为相同名字。

一致化处理

处理方式与3.4一样,将工序名替换为一致即可。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。