Python3,自从掌握了自动PDF 到CSV转换器,让我的幸福感提升了200%。

举报
Carl_奕然 发表于 2023/08/28 17:36:30 2023/08/28
【摘要】 自动PDF 到CSV转换器,确实很难得,也是使用

1、引言


小云:鱼哥, 能不能分享几个自动化脚本,让我解放双手, 提升效率
小鱼:我不是写过自动化脚本专篇吗,
小云:额,我咋没印象了呢?
小鱼:… 我去找下


小云:鱼哥,你咋还睡着了。
小鱼:昂. 没睡,就是眼睛累,闭一会。
小云:好,你说没睡就没睡。找到了吗?
小鱼:找…找啥啊?
小云:额… 自动化脚本啊
小鱼:昂… 找,找到了,这篇《Python3,掌握这4个自动化脚本,让工作效率提升200%。》
小云:这篇啊, 我都会了,我的意思,最近有没有打算在分享一点自动化脚本小知识。
小鱼:最近…最近… 是可以哈。
小云:那整啊。
小鱼:整… 再整一瓶。
小云:我去~ 你这没醒酒呢?
小鱼:笑话, 我就没醉过, 不信,你看,我给你说几个python自动化小技巧
小云:鱼哥, 别说, 你写出来, 不然我记不住。
小鱼:写出来,写, 笔墨纸砚走着。


2、 自动PDF 到CSV转换器


实际工作中, pdf文档转换成csv文档,太常见了。
如果需要转换,处理花费银两买VIP进行转换之外, 我们还可以借助tabula库,进行转换。

2.1 tabula 介绍


Tabula是一个Python库,用于处理表格数据。
它支持读取和写入CSV、Excel、HTML和JSON格式的数据,并提供了一系列工具来处理表格数据,如数据清洗、合并和转换等。
Tabula-py库还提供了一些有用的数据可视化功能。


2.2 实例


代码示例

# -*- coding:utf-8 -*-
# @Time   : 2023-08-09
# @Author : Carl_DJ
'''
实现功能:
    pdf文件 → csv文件自动转换
'''

import tabula

filename = input("输入文件的地址: ")
df = tabula.read_pdf(filename, encoding='utf-8', spreadsheet=True, pages='1')
#转换csv文件
df.to_csv('output.csv')

3、总结


看到这里, 今天的分享差不多就到这里了。
其实,在平时的工作生活中,  PDF→CSV文件格式的转换,很常用的。

所以,掌握这这种小技巧,让我们的幸福感提升200%。

我是小鱼:

  • CSDN 博客专家;
  • 阿里云 专家博主;
  • 51CTO博客专家;
  • 51认证讲师等;
  • 认证金牌面试官;
  • 职场面试及培训规划师;
  • 多个国内主流技术社区的认证专家博主;
  • 多款主流产品(阿里云等)测评一、二等奖获得者;

关注我,带你学习更多更专业更前言的Python技术。



【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。