Python3安装第三方爬虫库BeautifulSoup4

举报
SHQ5785 发表于 2022/10/15 10:53:50 2022/10/15
【摘要】 一、前言在做Python3爬虫练习时,从网上找到了一段代码如下:#使用第三方库BeautifulSoup,用于从html或xml中提取数据from bs4 import BeautifulSoup自己实践后,发现出现了错误,如下所示:以上错误提示是说没有发现名为“bs4”的模块。即“bs4”模块未安装。进入Python安装目录,以作者IDE为例,控制台提示第三方库BeautifulSoup4...

一、前言

在做Python3爬虫练习时,从网上找到了一段代码如下:


#使用第三方库BeautifulSoup,用于从html或xml中提取数据
from bs4 import BeautifulSoup


自己实践后,发现出现了错误,如下所示:



以上错误提示是说没有发现名为“bs4”的模块。即“bs4”模块未安装。进入Python安装目录,以作者IDE为例,




控制台提示第三方库BeautifulSoup4安装成功!回到之前的程序中,会发现IntelJ已经检测到第三方库BS4的安装,已自更新项目,此时项目恢复正常,无错误提示。

二、常见问题

在做BS4爬虫练习时,新建的文件名为bs4.py,结果出现如下错误提示:



即ImportError: cannot import name BeautifulSoup一般有一下几种情况:


  1. python2.x下安装的BeautifulSouppython3.x下运行会报这种错,可用pip3 install Beautifulsoup4

  2. 导入时指定bs4 像这样: from bs4 import BeautifulSoup

  3. 太巧合,如果你测试的文件名正好命名为bs4.py,那怎么整都会报这个错,把名字改成其他的吧。

三、拓展阅读


四、延伸阅读 Python 字符串操作

4.1 去空格及特殊符号

s.strip().lstrip().rstrip(',')

4.2 复制字符串

#strcpy(sStr1,sStr2)
sStr1 = 'strcpy'
sStr2 = sStr1
sStr1 = 'strcpy2'
print sStr2

4.3 连接字符串

#strcat(sStr1,sStr2)
sStr1 = 'strcat'
sStr2 = 'append'
sStr1 += sStr2
print sStr1

4.4 查找字符

#strchr(sStr1,sStr2)
# < 0 为未找到
sStr1 = 'strchr'
sStr2 = 's'
nPos = sStr1.index(sStr2)
print nPos

4.5 比较字符串

#strcmp(sStr1,sStr2)
sStr1 = 'strchr'
sStr2 = 'strch'
print cmp(sStr1,sStr2)

4.6 扫描字符串是否包含指定的字符

#strspn(sStr1,sStr2)
sStr1 = '12345678'
sStr2 = '456'
#sStr1 and chars both in sStr1 and sStr2
print len(sStr1 and sStr2)

4.7 字符串长度

#strlen(sStr1)
sStr1 = 'strlen'
print len(sStr1)

4.8 将字符串中的大小写转换

#strlwr(sStr1)
sStr1 = 'JCstrlwr'
sStr1 = sStr1.upper()
#sStr1 = sStr1.lower()
print sStr1

4.9 追加指定长度的字符串

#strncat(sStr1,sStr2,n)
sStr1 = '12345'
sStr2 = 'abcdef'
n = 3
sStr1 += sStr2[0:n]
print sStr1

4.10 字符串指定长度比较

#strncmp(sStr1,sStr2,n)
sStr1 = '12345'
sStr2 = '123bc'
n = 3
print cmp(sStr1[0:n],sStr2[0:n])

4.11 复制指定长度的字符

#strncpy(sStr1,sStr2,n)
sStr1 = ''
sStr2 = '12345'
n = 3
sStr1 = sStr2[0:n]
print sStr1

4.12 将字符串前n个字符替换为指定的字符

#strnset(sStr1,ch,n)
sStr1 = '12345'
ch = 'r'
n = 3
sStr1 = n * ch + sStr1[3:]
print sStr1

4.13 扫描字符串

#strpbrk(sStr1,sStr2)
sStr1 = 'cekjgdklab'
sStr2 = 'gka'
nPos = -1
for c in sStr1:
    if c in sStr2:
        nPos = sStr1.index(c)
        break
print nPos

4.14翻转字符串

#strrev(sStr1)
sStr1 = 'abcdefg'
sStr1 = sStr1[::-1]
print sStr1

4.15 查找字符串

#strstr(sStr1,sStr2)
sStr1 = 'abcdefg'
sStr2 = 'cde'
print sStr1.find(sStr2)

4.16 分割字符串

#strtok(sStr1,sStr2)
sStr1 = 'ab,cde,fgh,ijk'
sStr2 = ','
sStr1 = sStr1[sStr1.find(sStr2) + 1:]
print sStr1
#或者
s = 'ab,cde,fgh,ijk'
print(s.split(','))

4.17 连接字符串

delimiter = ','
mylist = ['Brazil', 'Russia', 'India', 'China']
print delimiter.join(mylist)

4.18 截取字符串

str = ’0123456789′
print str[0:3] #截取第一位到第三位的字符
print str[:] #截取字符串的全部字符
print str[6:] #截取第七个字符到结尾
print str[:-3] #截取从头开始到倒数第三个字符之前
print str[2] #截取第三个字符
print str[-1] #截取倒数第一个字符
print str[::-1] #创造一个与原字符串顺序相反的字符串
print str[-3:-1] #截取倒数第三位与倒数第一位之前的字符
print str[-3:] #截取倒数第三位到结尾
print str[:-5:-3] #逆序截取,具体啥意思没搞明白?

4.19 python字符串跟整型互转

print ("整型:",int(50))
a=int(50)
print("整型:",type(a))
numStr = "50";
print ("字符串:",type(numStr))
convertedInt = int(numStr);
print("字符串转换为整型:",convertedInt)
convertedstr=str(a)
print("整型转换为字符串:",convertedInt)



【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。