- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【python实战】批量操作txt文件并修改其中内容

一条coding 发表于 2021/10/19 00:35:44 2021/10/19

【摘要】任务要求对大量txt格式的小说删除其中网址解决思路: 列出目录下的全部文件读取文件将文件中网址替换(全为中文小说，可直接替换掉英文) 写入新文件删除旧文件源码 import reimport ostxtlist=os.listdir("C:\\Users\SAMSUNG\PycharmProjects\Lo...

任务要求

对大量txt格式的小说删除其中网址

解决思路:

列出目录下的全部文件

读取文件

将文件中网址替换(全为中文小说，可直接替换掉英文)

写入新文件

删除旧文件

源码


  
   
    
     
    
    
     
      import re
     
    
   
    
     
    
    
     
      import os
     
    
   
    
     
    
    
     
      txtlist=os.listdir("C:\\Users\SAMSUNG\PycharmProjects\LoadBaiDu\\txt\\novel") #列出目录下的全部文件
     
    
   
    
     
    
    
     
      for d in txtlist:
     
    
   
    
     
    
    
         if(d.endswith("t")):
     
    
   
    
     
    
    
     
              file=open("novel\\"+d,"r",encoding="gbk",errors="ignore") #编码问题
     
    
   
    
     
    
    
     
              file1=open("novel\\ "+d,"w")
     
    
   
    
     
    
    
             for i in file.readlines():
     
    
   
    
     
    
    
     
                  file1.write(re.sub(r"[a-zA-z]","",i)) #正则表达式匹配字母
     
    
   
    
     
    
    
     
              file1.close()
     
    
   
    
     
    
    
     
              file.close()
     
    
   
    
     
    
    
             print(d)
     
    
   
    
     
    
    
     
              os.remove("novel\\"+d)

问题解决

用python的时候经常会遇到文本的编码与解码问题，其中很常见的一种解码错误如题目所示，下面介绍该错误的解决方法，将‘gbk’换成‘utf-8’也适用。
（1）、首先在打开文本的时候，设置其编码格式，如：open(‘1.txt’,encoding

文章来源: blog.csdn.net，作者：一条coding，版权归原作者所有，如需转载，请联系作者。

原文链接：blog.csdn.net/skylibiao/article/details/103465795

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

【python实战】批量操作txt文件并修改其中内容

任务要求

解决思路:

源码

问题解决

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品