Python re.findall中正则表达式(.*?)和参数re.S使用

举报
悲恋花丶无心之人 发表于 2021/02/03 00:11:11 2021/02/03
【摘要】 目录 一、re.findall函数介绍 二、代码如下 三、re.findall中正则表达式(.*?) 四、re.findall中参数re.S的意义 关于正则表达式的用法,可参看:剑指 Offer 20. 表示数值的字符串,里面有更加具体的例子~ 一、re.findall函数介绍 它在re.py中有定义: def findall(pattern, strin...

目录

一、re.findall函数介绍

二、代码如下

三、re.findall中正则表达式(.*?)

四、re.findall中参数re.S的意义


关于正则表达式的用法,可参看:剑指 Offer 20. 表示数值的字符串,里面有更加具体的例子~


一、re.findall函数介绍

它在re.py中有定义:


  
  1. def findall(pattern, string, flags=0):
  2. """Return a list of all non-overlapping matches in the string.
  3. If one or more capturing groups are present in the pattern, return
  4. a list of groups; this will be a list of tuples if the pattern
  5. has more than one group.
  6. Empty matches are included in the result."""
  7. return _compile(pattern, flags).findall(string)

返回string中所有与pattern匹配的全部字符串,返回形式为数组。


二、代码如下

后面会讲解代码里的各个部分,先列出来~


  
  1. import re
  2. str = 'aabbabaabbaa'
  3. #一个"."就是匹配除 \n (换行符)以外的任意一个字符
  4. print(re.findall(r'a.b',str))#['aab', 'aab']
  5. #*前面的字符出现0次或以上
  6. print(re.findall(r'a*b',str))#['aab', 'b', 'ab', 'aab', 'b']
  7. #贪婪,匹配从.*前面为开始到后面为结束的所有内容
  8. print(re.findall(r'a.*b',str))#['aabbabaabb']
  9. #非贪婪,遇到开始和结束就进行截取,因此截取多次符合的结果,中间没有字符也会被截取
  10. print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']
  11. #非贪婪,与上面一样,只是与上面的相比多了一个括号,只保留括号的内容
  12. print(re.findall(r'a(.*?)b',str))#['a', '', 'a']
  13. str = '''aabbab
  14. aabbaa
  15. bb'''#后面多加了2个b
  16. #没有把最后一个换行的aab算进来
  17. print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']
  18. #re.S不会对\n进行中断
  19. print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa\n b']

三、re.findall中正则表达式(.*?)

字符串是

str = 'aabbabaabbaa'
 

1.一个 就 是匹配除 \n (换行符)以外的任意一个字符

print(re.findall(r'a.b',str))
 
['aab', 'aab']
 

2.* 前面的字符出现0次或以上

print(re.findall(r'a*b',str))
 
['aab', 'b', 'ab', 'aab', 'b']
 

3..* 贪婪,匹配从.*前面为开始到后面为结束的所有内容

print(re.findall(r'a.*b',str))
 
['aabbabaabb']
 

4..*? 非贪婪,遇到开始和结束就进行截取,因此截取多次符合的结果中间没有字符也会被截取

print(re.findall(r'a.*?b',str))
 
['aab', 'ab', 'aab']
 

5.(.*?) 非贪婪,与上面一样,只是与上面的相比多了一个括号,只保留括号的内容

print(re.findall(r'a(.*?)b',str))
 
['a', '', 'a']
 

四、re.findall中参数re.S的意义

1.字符串变为(后面多加了2个b)


  
  1. str = '''aabbab
  2. aabbaa
  3. bb'''

2.参数无re.S,没有把最后一个换行的aab算进来

print(re.findall(r'a.*?b',str))
 
['aab', 'ab', 'aab']
 

3.参数有re.S,不会对\n进行中断

print(re.findall(r'a.*?b',str,re.S))
 
['aab', 'ab', 'aab', 'aa\n b']
 

文章来源: nickhuang1996.blog.csdn.net,作者:悲恋花丶无心之人,版权归原作者所有,如需转载,请联系作者。

原文链接:nickhuang1996.blog.csdn.net/article/details/89182067

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。