powerquery去除重复值

powerquery去除重复值

问:数据透视表数据重复怎么办?
  1. 答:先将重复值剔除即可,剔除重复值方法有很多,具体如下:
    选择数据后,在【数据】菜单中的【删除重复值】即可
    运用高级筛选,保留唯一值也可剔除重复值
    用power query清洗数据,删除重复项
    最后将整理好的数据再上透视表
  2. 答:需要把数据源中重复的数据去掉
问:标记PowerQuyery重复数据
  1. 答:有时候我们不能删除重复数据,而是需要将其标记出来,或者筛选出来。
    可以用PowerQuery的分组功能来实现标记重复数据。
    1.选中要标记重复数据的列,点击左上角的“分组依据”【图1】。
    2.在分组设定窗口,可以看到PowerQuery将对Name列进行计数,如果是唯一值,则计数结果为1;如果包含重复值,则计数结果将大于1;将计数列重名为一个容易理解的名字;然后点击右边的+号,新增一列,在“操作”栏,选择新增的那一列的向下小三角,展开选项,选择最底下的“所有行”,这一步的目的是返回包含所有列的表格,因为我们只想标记出重复值,而不想对表格结构作出大的更改。【图3】设定好之后点击“确定”,回到PowerQuery数据预览窗口。
    3.我们现在可以看到重复数据标记结果了:重复的值会在计数列显示为大于1的整数。本例中,是第三行的“li”重复了,所以"Name计数"列显示为2。我们可以简单在“Name计数列”进行筛选【图4】
    4.然后,我们需要将数据还原,因为我们只想标记,不想删除或做别的处理,所以我们点击最后一列的展开按钮,展开表格,然后选择要展开的列,因为已经有Name列了,所以我们取消勾选“Name”列,我们也把最后的“使用原始列名作为前缀”选项取消勾选,因为这里我们不会搞混列名,所以不需要前缀。如果我们筛选大于1的重复值,并展开包括所有行的表格,最后得到的结果如【图5】所示。
    5.仔细观察展开的列和表格原始列的顺序,发现发生了变化,这是PowerQuery一个不太如人意的地方,如果顺序很重要,必须重新排序。对于列数少的表格,我们可以手工排序;如果列数很多,就必须采用别的办法。我将专门建立一个 帖子 。
问:用power-query合并文件夹下工作薄出现数据重复,怎么处理?
  1. 答:首先,点击"Power Query》获取外部数据》从文件》从文件夹"按钮。
    在接下来的“文件夹”对话框中,选择要合并的文本文件所在的文件夹的位置。然后点击"OK"和"确认"按钮。
    这时进入Power Query查询编辑器界面,在这个界面中,我们看到了所选文件夹下的所有文件列表。
    在这里我们只对该文件夹下的文本文件感兴趣。
    因此,我们下面对该列表中的"Extention"(文件扩展名)列进行筛选。按照图示进行操作,只保留.txt文件。
powerquery去除重复值
下载Doc文档

猜你喜欢