Python学习的自我理解和想法(23)

举报
Pocker_Spades_A 发表于 2024/12/06 08:14:04 2024/12/06
【摘要】 正则表达式进阶

学的是b站的课程(麦叔),跟老师写程序,不是自创的代码!

今天是学Python的第23天,学的内容是正则表达式。开学了,时间不多,写得不多,见谅。

目录

1.七个境界

level 1 固定的字符串

level 2 某一类字符串

level 3 重复某一类字符

level 4 组合level2

level 5 多种情况

level 6 限定位置

level 7 内部约束

2.写正则表达式的套路

(1).确定模式包含几个子模式

(2).各个部分的字符分类是什么

(3).各个部分如何重复

(4).检查是否有外部位置限制

(5).检查是否有内部制约关系

3.正则表达式的语法大全

(1).字符类别表达

(2). 字符重复的次数

(3). 组合模式

(4). 位置

(5). 分组

(6). 标记

(7). 特殊字符

(8). 替换

总结 、


1.七个境界

level 1 固定的字符串

语法:找到是否含有一串字符串.

解析:r表示的是不进行转移,保留原字符串.

level 2 某一类字符串

语法:找到是否含有某一类字符串,如\d表示数字,\D表示不是数字,\w表示非标点符号的东西,[*****] 可以匹配符合标准的任意字符.

level 3 重复某一类字符

语法:+表示1-多个,?表示0个或者1个, * 表示0个或多个,{a,b}表示从范围在a到b之间的都行,a为0可以不写.

level 4 组合level2

用处:匹配特殊的数字,如座机电话,手机号码.

level 5 多种情况

用处:匹配电话号码,不限于是手机还是座机.

语法:| 表示或者,两者都行.

level 6 限定位置

用处:例如只要最前面的电话号码.

语法:^表示句子开头,$表示结尾

level 7 内部约束

用处:比如你要匹配个AA类型的数据.

语法:返回值是一个列表,列表里面又是一个元组,因为代码中有两个括号,括号将我们的结果分成了两个部分,(\1)使得第一个括号中匹配的内容不再单独匹配.

2.写正则表达式的套路

以包含分机号码的座机号码为例,比如说0571-88776655-9527.

(1).确定模式包含几个子模式

答案:3个,两两之间用-连接.

(2).各个部分的字符分类是什么

答案:这三个子模式都是数字类型,可以用\d,现在可以写出模式为:\d-\d-\d.

(3).各个部分如何重复

答案:第一个子模式重复3~4次,第二个子模式重复7~8次,第三个子模式重复3~4次.

加上限制次数后,模式成为: \d(3,4)-\d(7,8)-\d(3,4).

倒有些座机没有分机号,所以我们用或运算符让其支持两者:

\d(3,4)-\d(7,8)-\d(3,4) | \d(3,4)-\d(7,8)

(4).检查是否有外部位置限制

答案:没有

(5).检查是否有内部制约关系

答案:没有

3.正则表达式的语法大全

以下图片全是来自于视频(@麦叔编程 硬核Python进阶篇 - 一小时掌握正则表达式)的截图,如有侵权请联系作者删除,谢谢.

(1).字符类别表达

表达某一类字符,比如数字,字母,3~9之间的任意和数字等.

(2). 字符重复的次数

也叫做量词,比如身份证是数字重复15或18次.

(3). 组合模式

多个简单的模式组合在一起,可以使拼接,也可以是二者选其一.

(4). 位置

鉴定模式出现的位置,比如行首,行尾或者在特定字符之后等.

(5). 分组

把一个正则表达式分成几个部分,这样可以重复某个分组,或者指定两个分组必须相同等额外的要求.

(6). 标记

语法:flags=re.XX,XX表示标记语言.

(7). 特殊字符

匹配特殊的字符

(8). 替换

总结 

这是我今天学Python的自我想法和对其的理解,有不对的地方请同志们多多包涵,谢谢观看!

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。