ad

实战之路《Excel 数据处理与分析实战宝典_第2版》_2.6.7 删除重复数据

网友投稿 119 2023-11-13

【摘要】 本书摘自《Excel 数据处理与分析实战宝典_第2版》一书中第2章,第6节,耿勇著。

2.6.7 删除重复数据

实战之路《Excel 数据处理与分析实战宝典_第2版》_2.6.7  删除重复数据

有时由于数据的来源不同,可能会包含重复的数据,这些重复数据对文件来讲是没必要存在 的数据,需要清除。下面介绍以下几种删除重复数据的方法。

1. 删除重复项

该功能可在“数据”选项卡中的“数据工具”分组中找到。该命令是 Excel 2007 开始新增的 一个功能,下面以一个实例来说明该功能的用法。

选中数据区域,单击“数据”选项卡下“数据工具”分组中的“删除重复项”按钮,“删除重 复项”对话框将列出数据区域的所有列。 一般情况下,需要选择所有列,单击“确定”按钮删除 重复行,Excel将提示有多少行重复数据被删除。当“删除重复项”对话框列出数据区域的所有列 时,只有当每列的内容重复时,才可以删除重复的行。

当Excel发现重复行时,只保留第一行数据,其后的重复行将被删除。

提示 重复值是由单元格显示的值确定的,不一定由单元格中存储的值确定。

当同列的数据中(比如金额)有的单元格带有货币符号(如¥、$),有的没有货币符号时,即

使数字大小一致,也会被视作不同的数据。

由此可见,在检查是否存在重复项时最好先检查每列数据的格式是否统一。

在删除重复项之前,请先从数据中删除所有的分类汇总;使用“删除重复项”功能时,将会 永久删除重复的数据。删除重复项之前,建议做好备份,以免出现意外而丢失任何信息。

2. 利用混合引用标示重复的数据记录

如果想标示出重复的记录,但又不删除重复的记录,可使用添加辅助列,然后对辅助列进行

计数的方法识别出重复记录。

在E2 单元格中定义公式:=A2&B2&C2&D2, 在 F2 单元格中定义公式:= COUNTIF(E$2: E2,E2), 在 E 列 、F 列中复制应用E2 和 F2 单元格中定义的公式。其中“计数”列中数据显示大 于1的就为重复的记录。

提示 这个案例也可以使用条件格式来标示出重复的记录,读者可以自行完成。

3. 利用高级筛选“选择不重复的记录”

这种删除重复项的方法在Excel2003 中已存在,不过远没有Excel2007 的“删除重复项”功 能使用方便。

2.6.8 利用 SQL 语句实现文件的瘦身

在日常工作中,我们有时会遇到文件打开与处理非常缓慢的异常状况,这类文件的数据大多 是从网页中复制的。查看该文件属性,发现文件大小有5.57MB,直接打开该表 格进行处理更是束手无策。

这时可以考虑利用 SQL 语句从该类型的文件中读取数据,步骤如下。

STEP 01 新建一个空白工作表,选择空白工作表的A1 单元格,单击“数据”选项卡中的“现有连接”,在打开的“现有连接”对话框中单击“浏览更多”按钮,进入“选取数据源”对话框。 找到需要瘦身的文件,单击“打开”按钮,关闭“选取数据源”对话框,进入“选 择表格”对话框。

srep 02 在“选择表格”对话框中,选择 “Sheetl$”, 单击“确定”按钮,关闭“选择表格” 对话框,进入“导入数据”对话框。

SrEP 03“导入数据”对话框中,单击“属性”按钮,进入“连接属性” 对话框。选择“定义”选项卡,在“命令文本”中输入“select*from[Sheet1S]”,单击“确定”按钮,即可从原来的文件中读取数据。

提示 有时外来表格明明有内容,但打开后却无任何数据显示(即一片空白,这种问题多是由版本兼 容性问题引起的)。这时可关闭该工作簿,另外新建一个空白表格,在空白表格中利用SQL 语句从原来

显示无数据的表格中读取数据,处理步骤与上述过程相同。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 18664393530@aliyun.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:打开《OpenStack 云平台-部署与高可用实战》_7.2.1 HBase 的安装部署
下一篇:实战之路《Excel 数据处理与分析实战宝典_第2版》_4.1 在数据透视表中定义公式
相关文章

 发表评论

暂时没有评论,来抢沙发吧~