- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Python教程之正则表达式详解(提高篇)

灰小猿发表于 2021/08/25 07:54:55 2021/08/25

【摘要】上一节大灰狼和大家分享了正则表达式的基础使用技巧，使用re模块中的compile()方法即可进行正则表达式的匹配运算，不清楚的可以查看上一篇“Python教程之正则表达式(基础篇)”。但我们知道正则表达式所要匹配的内容千姿百态，除了我们最常见的数字以外还有字母以及特殊符号，同时在一篇将要匹配的文本中，符合要求的匹配对象可能多个。所以应该可以按照要求将我们要匹配的内容全都读取出来，所以这一节大...

上一节大灰狼和大家分享了正则表达式的基础使用技巧，使用re模块中的compile()方法即可进行正则表达式的匹配运算，不清楚的可以查看上一篇“Python教程之正则表达式(基础篇)”
。

但我们知道正则表达式所要匹配的内容千姿百态，除了我们最常见的数字以外还有字母以及特殊符号，同时在一篇将要匹配的文本中，符合要求的匹配对象可能多个。

所以应该可以按照要求将我们要匹配的内容全都读取出来，所以这一节大灰狼和大家分享一下如何更加愣货的使用正则表达式来匹配文本。

findall()方法

首先在上一节关于正则表达式的基本匹配中讲到使用‘\d’来匹配数字0-9，同时在正则表达式中还有类似的匹配。

我们规定：在正则表达式的使用过程中，使用反斜杠‘\’加字母匹配常见的字符，具体的匹配规则如下图所示：

缩写字符分类	表示
\d	0到9的任何数字
\D	除0到9以外的任何字符
\w	任何数字、字母、下划线字符
\W	除数字字母下划线以外的任何字符
\s	空格、制表符、换行符
\S	除空格、制表符、换行符以外的任何字符

同时在正则表达式的使用过程中，re模块中还有另外一种读取文本匹配内容的方法：findall()方法。

该方法与我们之前所讲的group()方法不同，re模块中的group()方法只能匹配文本中的第一个符合要求的匹配对象，而findall()方法则匹配文本中所有符合要求的内容。

并且以列表的形式返回所有符合要求的匹配。对比实现效果代码如下：

search()和findall()方法比较

import re

charRegex = re.compile(r'\d\d\d-\d\d\d\d-\d\d\d\d')

text = 'the tel is 123-4567-8910 and 456-7891-1234 and 789-1234-5678'

mo = charRegex.search(text)

print('search()方法的匹配结果:')

print(mo.group())

print('findall()方法的匹配结果：')

print(charRegex.findall(text))

建立自己的字符分类

在使用正则表达式的时候我们通常会需要使用这些匹配字符以外的东西，如我们特定匹配某一个字母或数字。

因此在Python的re模块中设定，在建立正则表达式的时候可以使用‘[]’中括号来特定设定要匹配的字符，这样在匹配文本的时候，就会特定匹配中括号里面的内容，效果代码如下：

建立自己的字符匹配

import re

charRegex = re.compile(r'[abcd3]')

text = 'the tel is 456-7891-1234 and 789-1234-5678'

print(charRegex.findall(text))

不区分大小写的匹配

在使用正则表达式进行匹配的时候，我们可能往往会因为大小写字母的匹配而感到烦恼。

那么在re模块中就具备了不区分大小写的匹配设定，在正则表达式的设定过程中，使用re.IGNORECASE(简写为re.I)方法来消除大小写的匹配。

效果代码如下;

re.I方法不区分大小写匹配

import re

charRegex = re.compile(r'[abcde]', re.I)

text = 'Regex AND compile'

print(charRegex.findall(text))

sub()方法替换字符串

正则表达式不仅能够匹配特定的文本对象，而且还可以使用新的字符将这些字符替换，这便是re模块中的sub()方法的功能。

Regex的sub()方法将传入两个字符串参数，第一个参数是一个字符串，是用于替换发现的匹配，第二个参数是将要被匹配的文本对象，使用该方法可以将匹配到的内容替换掉。实现代码效果如下：

sub()方法

import re

charRegex = re.compile(r'and')

text = 'Regex and compile and is pythonandider'

print(charRegex.sub('www', text))

以上就是正则表达式最常用的一些方法，但正则表达式的使用并非仅限于此。

关注分享，灰小猿陪你一起进步！

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

Python教程之正则表达式详解(提高篇)

findall()方法

建立自己的字符分类

不区分大小写的匹配

sub()方法替换字符串

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

Python教程之正则表达式详解(提高篇)

findall()方法

建立自己的字符分类

不区分大小写的匹配

sub()方法替换字符串

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品