- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

python二级第十套答案

yk 坤帝发表于 2021/07/15 00:27:40 2021/07/15

【摘要】 python二级第十套答案 46、考生文件夹下，存在2个Python源文件和1个文本文件。其中，2个Python源文件对应2个问题，文本文件“data.txt”中包含一篇从互联网上下载的关于“德国工业4.0战略规划实施建议摘要”的文章。请分别补充2个Python源文件，完成以下功能。问题1(10分)：文件内容清洗。要求：在文件PY301-1.py中补充代码，对文件d...

python二级第十套答案
46、考生文件夹下，存在2个Python源文件和1个文本文件。其中，2个Python源文件对应2个问题，文本文件“data.txt”中包含一篇从互联网上下载的关于“德国工业4.0战略规划实施建议摘要”的文章。请分别补充2个Python源文件，完成以下功能。

问题1(10分)：文件内容清洗。要求：在文件PY301-1.py中补充代码，对文件data.txt的内容进行清理，去除中文标点符号，只保留中文、英文、数字、英文标点符号等字符，将结果输出到文件clean.txt中。示例如下：

德国工业4.0战略计划实施建议摘编机械工业信息研究院战略与规化研究所一德国实施工业…(略)

问题2(10分)：提取主题词及其出现频次。要求：在文件PY301-2.py中补充代码，提取clean.txt文件中长度不少于3个字符的词语并统计词频，将词频最高的10个词语作为主题词，并将主题词及其频次输出到屏幕。示例如下：

4.0:10,制造业:9,…(略)

注意:输出格式采用英文冒号和英文逗号，标点符号前后无空格，各词语中间用逗号分隔，最后一个词语后无逗号。

# 
# 以下代码仅供参考。
# 

import jieba
f=open('data.txt','r',encoding='utf-8')
data=f.read()
f.close()
f=open('clean.txt','w')
s=''
x='，。？、‘’“”；：、 ）\n（！'
for i in data: if i not in x: s+=i
f.write(s)
f.close()


  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16
  17

# 
# 以下代码仅供参考。
# 

import jieba
f=open('clean.txt','r')
data=f.read()
l=jieba.lcut(data)
d = {}
for i in l: if len(i)>=3: d[i] = d.get(i,0)+1
lt = list(d.items())
lt.sort(key = lambda x:x[1],reverse = True)
for i in lt[:9]: print(i[0],':',i[1],end=',',sep='')
print(lt[9][0],':',lt[9][1],sep='')
f.close()

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16
  17
  18

文章来源: blog.csdn.net，作者：yk 坤帝，版权归原作者所有，如需转载，请联系作者。

原文链接：blog.csdn.net/qq_45803923/article/details/115324944

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

python二级第十套答案

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

python二级第十套答案

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品