- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Python re.findall中正则表达式(.*?)和参数re.S使用

悲恋花丶无心之人发表于 2021/02/03 00:11:11 2021/02/03

【摘要】目录一、re.findall函数介绍二、代码如下三、re.findall中正则表达式(.*?) 四、re.findall中参数re.S的意义关于正则表达式的用法，可参看：剑指 Offer 20. 表示数值的字符串，里面有更加具体的例子~ 一、re.findall函数介绍它在re.py中有定义： def findall(pattern, strin...

一、re.findall函数介绍

二、代码如下

三、re.findall中正则表达式(.*?)

四、re.findall中参数re.S的意义

关于正则表达式的用法，可参看：剑指 Offer 20. 表示数值的字符串，里面有更加具体的例子~

一、re.findall函数介绍

它在re.py中有定义：


  
   
    
     
    
    
     
      def findall(pattern, string, flags=0):
     
    
   
    
     
    
    
      """Return a list of all non-overlapping matches in the string.
     
    
   
    
     
    
    
     
      
     
    
   
    
     
    
    
     
       If one or more capturing groups are present in the pattern, return
     
    
   
    
     
    
    
     
       a list of groups; this will be a list of tuples if the pattern
     
    
   
    
     
    
    
     
       has more than one group.
     
    
   
    
     
    
    
     
      
     
    
   
    
     
    
    
     
       Empty matches are included in the result."""
     
    
   
    
     
    
    
      return _compile(pattern, flags).findall(string)

返回string中所有与pattern匹配的全部字符串,返回形式为数组。

二、代码如下

后面会讲解代码里的各个部分，先列出来~


  
   
    
     
    
    
     
      import re
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      str = 'aabbabaabbaa'
     
    
   
    
     
    
    
     
      #一个"."就是匹配除 \n (换行符)以外的任意一个字符
     
    
   
    
     
    
    
     
      print(re.findall(r'a.b',str))#['aab', 'aab']
     
    
   
    
     
    
    
     
      #*前面的字符出现0次或以上
     
    
   
    
     
    
    
     
      print(re.findall(r'a*b',str))#['aab', 'b', 'ab', 'aab', 'b']
     
    
   
    
     
    
    
     
      #贪婪，匹配从.*前面为开始到后面为结束的所有内容
     
    
   
    
     
    
    
     
      print(re.findall(r'a.*b',str))#['aabbabaabb']
     
    
   
    
     
    
    
     
      #非贪婪，遇到开始和结束就进行截取，因此截取多次符合的结果，中间没有字符也会被截取
     
    
   
    
     
    
    
     
      print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']
     
    
   
    
     
    
    
     
      #非贪婪，与上面一样，只是与上面的相比多了一个括号，只保留括号的内容
     
    
   
    
     
    
    
     
      print(re.findall(r'a(.*?)b',str))#['a', '', 'a']
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      str = '''aabbab
     
    
   
    
     
    
    
     
       aabbaa
     
    
   
    
     
    
    
     
       bb'''#后面多加了2个b
     
    
   
    
     
    
    
     
      #没有把最后一个换行的aab算进来
     
    
   
    
     
    
    
     
      print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']
     
    
   
    
     
    
    
     
      #re.S不会对\n进行中断
     
    
   
    
     
    
    
     
      print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa\n b']

三、re.findall中正则表达式(.*?)

字符串是

str = 'aabbabaabbaa'

1.一个 . 就是匹配除 \n (换行符)以外的任意一个字符

print(re.findall(r'a.b',str))

['aab', 'aab']

2.* 前面的字符出现0次或以上

print(re.findall(r'a*b',str))

['aab', 'b', 'ab', 'aab', 'b']

3..* 贪婪，匹配从.*前面为开始到后面为结束的所有内容

print(re.findall(r'a.*b',str))

['aabbabaabb']

4..*? 非贪婪，遇到开始和结束就进行截取，因此截取多次符合的结果，中间没有字符也会被截取

print(re.findall(r'a.*?b',str))

['aab', 'ab', 'aab']

5.(.*?) 非贪婪，与上面一样，只是与上面的相比多了一个括号，只保留括号的内容

print(re.findall(r'a(.*?)b',str))

['a', '', 'a']

四、re.findall中参数re.S的意义

1.字符串变为(后面多加了2个b)


  
   
    
     
    
    
     
      str = '''aabbab
     
    
   
    
     
    
    
     
       aabbaa
     
    
   
    
     
    
    
     
       bb'''

2.参数无re.S，没有把最后一个换行的aab算进来

print(re.findall(r'a.*?b',str))

['aab', 'ab', 'aab']

3.参数有re.S，不会对\n进行中断

print(re.findall(r'a.*?b',str,re.S))

['aab', 'ab', 'aab', 'aa\n b']

文章来源: nickhuang1996.blog.csdn.net，作者：悲恋花丶无心之人，版权归原作者所有，如需转载，请联系作者。

原文链接：nickhuang1996.blog.csdn.net/article/details/89182067

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

Python re.findall中正则表达式(.*?)和参数re.S使用

关于正则表达式的用法，可参看：剑指 Offer 20. 表示数值的字符串，里面有更加具体的例子~

一、re.findall函数介绍

二、代码如下

三、re.findall中正则表达式(.*?)

1.一个 . 就 是匹配除 \n (换行符)以外的任意一个字符

2.* 前面的字符出现0次或以上

3..* 贪婪，匹配从.*前面为开始到后面为结束的所有内容

4..*? 非贪婪，遇到开始和结束就进行截取，因此截取多次符合的结果，中间没有字符也会被截取

5.(.*?) 非贪婪，与上面一样，只是与上面的相比多了一个括号，只保留括号的内容

四、re.findall中参数re.S的意义

1.字符串变为(后面多加了2个b)

2.参数无re.S，没有把最后一个换行的aab算进来

3.参数有re.S，不会对\n进行中断

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

1.一个 . 就是匹配除 \n (换行符)以外的任意一个字符