Python3,使用openpyxl进行excel数据对比,反手一个赞。

举报
Carl_奕然 发表于 2023/07/05 15:13:38 2023/07/05
【摘要】 网友:我要收藏。

1、引言


小云:鱼哥,我最近在对搞数据对比,你有什么便捷的方法?
小鱼:斗胆问一句,数据量多少?
小云:不多不多,几万条吧。
小鱼:确定几万条?
小云:多了也不敢说啊。
小鱼:但说无妨
小云:那这是你说的哈, 有一组数据是890W条数据
小鱼:奈斯,真棒,完美,超爽。
小云:你很兴奋啊。
小鱼:不啊,我就喜欢看你被虐的样子。
小云:别闹, 正儿八经的,相对比数据。
小鱼:好吧,那你说下,你想如何对比?
小云:openpyxl怎么能先对比一列,然后根据这列为基准去对比该行?
小鱼:真棒,我会,但是我不想说
小云:最近咱俩是不是没去洗澡了。
小鱼:额… 你有门票?
小云:你告诉我怎么实现,我就有门票。
小鱼:君子一言。
小云:澡堂见。

在这里插入图片描述

2、代码实战

2.1 安装

当然,涉及到第三方库, 老规矩,安装走起。

pip install openpyxl



然后就是等待着安装。

其它安装方式,直接看这两篇:

  • 《Python3,选择Python自动安装第三方库,从此跟pip说拜拜!!》
  • 《Python3:我低调的只用一行代码,就导入Python所有库!》


安装完成,我们就可以进行代码编写了。

2.2 代码实战


2.2.1 思路


在写代码前,我们要捋清楚思路, 总共分四步:

  • 1、读取excel表格数据,并将数据保存在一个列表中。
  • 2、调用 merge_cells 函数,将需要对比的两列数据作为参数传入,并设置参数 merge_cells 为 True,表示要对齐两列数据。
  • 3、循环遍历列表中的每一行数据,对比该行与对齐列的数据是否一致,如果不一致则记录下来。
  • 4、循环结束后,找到记录中不一致的行,将不一致的数据用新列表的形式保存起来即可。


捋清思路后,我们就开始下一步操作:撸代码。

2.2.2 代码示例

# -*- coding:utf-8 -*-
# @Time   : 2023-05-25
# @Author : Carl_DJ

'''
实现功能:
    使用openpyxl对excel表中的数据进行对比
'''
import openpyxl

# 读取excel表格数据,并将数据保存在一个列表中
data = []
with openpyxl.load_workbook('example.xlsx') as wb:
    sheet = wb['Sheet1']
    for row in sheet.iter_rows(min_row=2, values_only=True):
        row_data = []
        for cell in row:
            if cell.value is not None:
                row_data.append(cell.value)
        data.append(row_data)

# 对比需要对齐的两列数据
merged_data = []
for row_data in data:
    # 设置参数,两列数据对齐
    merge_cells = True
    for col_idx in range(len(row_data[0])):
        col_data = row_data[col_idx]
        for col_idx_2 in range(len(col_data)):
            if col_data[col_idx_2] != col_data[col_idx_2 + 1]:
                merge_cells = False
                break
    if merge_cells:
        # 循环遍历列表中的每一行数据,对比该行与对齐列的数据是否一致
        for cell_idx in range(len(col_data)):
            cell_data = col_data[cell_idx]
            for row_idx in range(len(merged_data)):
                if cell_data == merged_data[row_idx][cell_idx]:
                    # 如果一致,则将不一致的数据用新列表的形式保存起来
                    merged_data[row_idx][cell_idx] = [cell_data]
                    break

3、总结


今天主要使用openpyxl对excel表中的数据进行对比。
在实际的工作中,这种数据对比很常见,用好python,让你的工作量递减。


我是小鱼:

  • CSDN 博客专家;
  • 阿里云 专家博主;
  • 51CTO 博客专家;
  • 51认证讲师;
  • 认证金牌面试官;
  • 职场培训规划师;
  • 多个国内主流技术社区的认证专家博主;
  • 多款主流产品(阿里云等)测评一、二等奖获得者;


关注我,带你学习更多更有趣的Python知识。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。