- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

绝了！深度解析了1道华为Python笔试题，竟然可以学会12种Python里正则表达式的用法

程序员晚枫发表于 2022/07/14 01:07:49 2022/07/14

【摘要】华为笔试总结

大家好，这里是程序员晚枫。

今天用一道华为笔试题，带大家深入掌握一项Python技巧：正则表达式。

本文主要分为4个部分：题目解析、常用方法、专业方法、注意事项

一、题目解析

先来看一下题目。

看完题目，有以下2个解题思路：

纯手写：首先把输入的字符串，用0补全为8的倍数，然后遍历字符串，每8个组成一个新的字符。
使用内置方法和标准库：使用str的内置方法，用0补全右侧，然后使用正则每8个字符进行匹配。

1、思路1：纯手写

def cut_8ch(str):
    if len(str) < 8:
        str = str.ljust(8, '0')
    elif len(str) > 8:
        if (len(str) % 8) != 0:
            width = len(str) + (8 - len(str) % 8)
            str = str.ljust(width, '0')
    str2List = []
    i = 0
    while i < len(str):
        if (i + 8) < len(str):
            str2List.append(str[i:i+8])
        else:
            str2List.append(str[i:len(str)])
            break
        i = i + 8
    return str2List

output = []
tmp = input('请输入字符串-->>').strip()
output.append(cut_8ch(tmp))

for x in output:
    for y in x:
        print(y)

2、思路2：使用内置方法和标准库

import re

str = input('请输入字符串-->>')
if len(s) % 8 != 0:
    s = s.ljust(len(s) + (8 - len(s) % 8), str(0))

res = re.findall('.{8}', s)
[print(r) for r in res]

很明显，思路2实现起来，逻辑更清晰，代码更简洁。原因在哪里呢？

今天我们重点讲一下re模块的使用。
关于str的所有自带方法，如果大家想看的话，可以在评论区告诉我，我可以另写一个篇新的文章来介绍。

二、常用方法

按照惯例，我们对Python知识的解析，直接拿源码来研究。先看一下python源码里，re模块提供的12个方法👇

findall方法

找出所有符合条件的内容。

举例：

我们现在有一句话，里面有一些数字，我们想把这些数字都提取出来：程序员晚枫，今年18岁，家里存款100多，车有0辆，多谢各位的10086+个点赞

import re

str = '程序员晚枫，今年18岁，家里存款100多，车有0辆，多谢各位的10086+个点赞'
res = re.findall('[0-9]+',string=str)
print(res)
# 输出：['18', '100', '0', '10086']

split方法

对字符串进行分割。

举例：

假如我们现在有一组字符串:程序员晚枫5程序员晚枫4程序员晚枫7程序员晚枫，其中混进了一些无规律的数字：5、4、7，这次我们想根据这些数字，把这个字符串分割。

import re

str = '程序员晚枫5程序员晚枫4程序员晚枫7程序员晚枫'
res = re.split(pattern='[0-9]',string=str)
print(res)
# 输出：['程序员晚枫', '程序员晚枫', '程序员晚枫', '程序员晚枫，']

sub方法

可以替换字符串中的内容。

举例：

假如我们现在有一组字符串:程序员晚枫5程序员晚枫4程序员晚枫7程序员晚枫，其中混进了一些无规律的数字：5、4、7，我们想根据这些数字，替换成逗号：，。

import re

str = '程序员晚枫5程序员晚枫4程序员晚枫7程序员晚枫，'
res = re.sub(pattern='[0-9]', repl='，', string=str, count=0)
print(res)
# 输出：程序员晚枫，程序员晚枫，程序员晚枫，程序员晚枫，
# -----

# 参数1：pattern：表示正则中的模式字符串。
# 参数2：repl：就是replacement，表示被替换的字符串，可以是字符串也可以是函数。
# 参数3：string：表示要被处理和替换的原始字符串
# 参数4：count：可选参数，表示是要替换的最大次数，而且必须是非负整数，该参数默认为0，即所有的匹配都会被替换；

match方法

re.match()必须从字符串开头匹配！

举例：

match方法，可以帮我们匹配出这段文字中的英文字母，"CoderWanFeng，加好友，联系程序员晚枫"

import re

text = "CoderWanFeng，加好友，联系程序员晚枫"

res = re.match("[a-zA-Z]+", text)

print(res)  # 查看是否匹配到结果
print(res.group())  # 取出匹配的内容

fullmatch方法

fullmatch见名知义：只有在给定的字符串全部匹配时，才返回正确。

举例：

匹配用户输入的电话号码是否都是数字+符合11位。

import re

input = "19512345678"
pattern = "[0-9]+"

print(re.fullmatch(pattern, input))
print(re.fullmatch(pattern,input).group())

search方法

查找字符串中是否有符合条件的内容。

import re

str = "程序员晚枫"
# search 字符串第一次出现的位置
print(re.search("晚", str))
# 输出：<re.Match object; span=(3, 4), match='晚'>

三、专业方法

subn方法

subn和sub的方法类似，区别在于：subn()方法返回一个元组，其中包含所有替换的总数以及新字符串。
看到subn方法我困惑了一下，它和sub的区别时什么？

看过源码👇才知道，区别就是那个n。

import re

str = '程序员晚枫，程序员晚枫，程序员晚枫，程序员晚枫，'
res = re.subn(pattern='程序员晚枫', repl='点赞+关注', string=str, count=2)
print(res)
# 参数1：pattern：表示正则中的模式字符串。
# 参数2：repl：就是replacement，表示被替换的字符串，可以是字符串也可以是函数。
# 参数3：string：表示要被处理和替换的原始字符串
# 参数4：count：可选参数，表示是要替换的最大次数，而且必须是非负整数，该参数默认为0，即所有的匹配都会被替换；
# -----
# ('点赞+关注，点赞+关注，程序员晚枫，程序员晚枫，', 2)

finditer

这个方法返回的是一个迭代器。

import re

str = '程序员晚枫，今年18岁，家里存款100多，车有0辆，多谢各位的10086+个点赞'
res = re.finditer('[0-9]+',string=str)
print(res)
# 输出：<callable_iterator object at 0x000001C3E94D3F40>

compile

re.compile()是用来优化正则的，它将正则表达式转化为对象，re.search(pattern, string)的调用方式就转换为 pattern.search(string)的调用方式，多次调用一个正则表达式就重复利用这个正则对象，可以实现更有效率的匹配。

如下列代码所示，re.compile生成pattern后，依然需要调用re的方法。

import re

str = '程序员晚枫，今年18岁，家里存款100多，车有0辆，多谢各位的10086+个点赞'
reg = re.compile('[0-9]+')
res = reg.findall(string=str)
print(res)
# 输出：['18', '100', '0', '10086']

purge

如源码所说，这个方法主要是用来清楚缓存。

Python标准库中唯一调用re.purge()的位置是在测试中（特别是test_re模块的re单元测试和回归测试套件中的参考泄漏测试）。

template

这个方法我没找到怎么使用，欢迎大家在评论区补充。

escape

可以将字符串中所有可能被解释为正则运算符的字符进行转译。

re.escape('www.python-office.com')

# 输出：'www\\.python-office\\.com'

四、注意事项

match只能从头开始匹配
match和search的区别：search可以从全部内容中匹配
所有的匹配方法，都有一个属性：flags：
- 标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

绝了！深度解析了1道华为Python笔试题，竟然可以学会12种Python里正则表达式的用法

一、题目解析

1、思路1：纯手写

2、思路2：使用内置方法和标准库

二、常用方法

findall方法

split方法

sub方法

match方法

fullmatch方法

search方法

三、专业方法

subn方法

finditer

compile

purge

template

escape

四、注意事项

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

绝了！深度解析了1道华为Python笔试题，竟然可以学会12种Python里正则表达式的用法

一、题目解析

1、思路1：纯手写

2、思路2：使用内置方法和标准库

二、常用方法

findall方法

split方法

sub方法

match方法

fullmatch方法

search方法

三、专业方法

subn方法

finditer

compile

purge

template

escape

四、注意事项

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品