Qt正则表达式类QRegExp(附检验小程序)

举报
花狗Fdog 发表于 2021/03/29 03:14:44 2021/03/29
【摘要】 2020博客之星年度总评选进行中:请为74号的狗子投上宝贵的一票! 我的投票地址:点击为我投票        在许多场景中,我们需要验证用户输入的数据是否有效,或者是查找并修改文本,或者是提取指定数据,为此,相对于Qstring的一些函数,QT提供了一个更加强大的类——QRegExp,使用函数配合正则表达式来操作字符串,QRegExp可以进行下面的操作,并附带检...

2020博客之星年度总评选进行中:请为74号的狗子投上宝贵的一票!
我的投票地址:点击为我投票
在这里插入图片描述


       在许多场景中,我们需要验证用户输入的数据是否有效,或者是查找并修改文本,或者是提取指定数据,为此,相对于Qstring的一些函数,QT提供了一个更加强大的类——QRegExp,使用函数配合正则表达式来操作字符串,QRegExp可以进行下面的操作,并附带检验小程序,可在文末下载。在这里插入图片描述


一.正则表达式相关函数用法

1.提取数据

matchedLength() 匹配的长度

capturedTexts() 捕捉到的字符串列表,   对应的还有captureCount() ,获取表达式中含有的捕捉组的数目

cap(int n) 第n个组的内容(0代表匹配自身)

  • cap()参数缺省值为0。
  • cap(0):表示匹配的整个文本的值。
  • cap(1):表示第1个圆括弧中的值。
  • cap(2):表示第2个圆括弧中的值。

pos(int n) 第n个组的位置(默认值为0)

QRegExp::indexIn() 搜索字符串以找到匹配的字串,返回索引值,失败返回-1

QRegExp::lastIndexIn() 同上,只是从后向前搜索

 QString str = "(.*)=(.*)"; QRegExp rx_1(str); QString str_1 = ("a=100"); int pos = rx_1.indexIn(str_1); if(pos>=0) { qDebug()<<rx_1.matchedLength(); //5 qDebug()<<rx_1.capturedTexts(); //("a=100", "a", "100") qDebug()<<rx_1.cap(0);//"a=100" qDebug()<<rx_1.cap(1);//"a" qDebug()<<rx_1.cap(2);//"100" qDebug()<<rx_1.pos(0);//0 qDebug()<<rx_1.pos(1);//0 qDebug()<<rx_1.pos(2);//2 }

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

(?:pattern)是非捕获型括号 匹配pattern,但不捕获匹配结果
(pattern)是捕获型括号。 匹配pattern,匹配pattern并捕获结果,自动获取组号
(?<name> pattern ) 匹配pattern, 匹配pattern并捕获结果,设置name为组名
例如,将(.*)=(.*)改为(?:.*)=(.*),qDebug()<<rx_1.cap(1);该值将为100,而 qDebug()<<rx_1.cap(2);将为空。


2.修改文本

       将匹配到的字符串替换成其他字符串,例如将文本中的a=100修改为b=100

QString str = "a=100";
s.replace(QRegExp("(.*)="),"b=");

  
 
  • 1
  • 2

       将匹配到的字符串内容进行自定义或替换,例如将文本中的a=100修改为100=a

Qstring str = "a=100";
s.replace(QRegExp("(.*)=(.*)"),"\\2=\\1");// \\1就是相当于cap(1),表示第1个圆括弧中的值。

  
 
  • 1
  • 2

3.验证文本有效性

       这里用到QRegExp::exactMatch来判断输入的字符是否符合正则表达式。

QRegExp::exactMatch() 判断字符串是否完全(从头到尾)匹配,返回真或假

 QRegExp rx("\\d"); //正则表达式 bool match = rx.exactMatch("8");//验证文本 if(match == true) { //表达式正确 return; } //表达式错误

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

对此,QRegExp都有相对应的函数方法,还有一些函数上面没有写出来,例如:

isValid();//判断正则表达式是否合法,合法返回true,否则返回false。
pattern();//获得正则本身

其他完整函数,大家可在文末点击官方文档查阅,当然,所有的函数方法都离不开一个核心就是正则表达式,我们来看下。


二.正则表达式

正则表达式是由表达式+量词+断言组成。

首先是表达式:

例子 含义
c 除非具有特殊的正则表达式含义(., ^, $, [, ], * , +, ? ),否则字符表示自身。例如c匹配字符c
\c 除以下指定的字符外,反斜杠后面的字符与字符本身匹配。例如,要匹配字符串开头的文字插入符,请写\ ^
\a 匹配ASCII铃声(BEL,0x07)
\f 匹配ASCII换页(FF,0x0C)
\n 匹配ASCII换行符(LF,0x0A,Unix换行符)
\r 匹配ASCII回车(CR,0x0D)
\t 与ASCII水平制表符(HT,0x09)匹配
\v 匹配ASCII垂直制表符(VT,0x0B)。
.(dot) 匹配任何字符(包括换行符)
\d 匹配一个数字
\D 匹配一个非数字。
\s 匹配一个空白字符
\S 匹配非空格字符。
\w 任意单字字符(字母,数字或者下划线)
\W 任意非单字字符
\n 第n个反向引用,例如\ 1,\ 2等。

注意: C ++编译器将反斜杠转换为字符串。要将\包含在正则表达式中,请输入两次,即\\。要匹配反斜杠字符本身,请输入四次,即\\\\。

最简单的一个正则表达式就是字符,例如:

  • a 匹配字符a
  • b 匹配字符b
  • 9 匹配数字9

表达式后面可以加量词,默认情况下,表达式会自动由{1,1}进行量化,即它应该只出现一次。在下面的列表中,E代表表达。表达式是一个字符,或者是一组字符的缩写,或者在方括号中是一组字符,或者在括号中是表达式。

例子 解释
E? ?代表0个或1个
E* *代表0个或1个或多个
E+ +代表1个或多个
E{3} 匹配3次
E{3,} 匹配大于等于3次
E{,6} 匹配至多m次,等价于a{0,m}
E{3,6} 匹配至少3次,至多6次(包括3和6)

例如:

  • E?匹配0次或者1次E
  • E+ 匹配1次或者多次E
  • E{3,6} 匹配至少3次,至多6次E

可以在表达式和量词的基础,加入断言,进行一些限制,例如我们想要匹配0-9,我们可以将正则表达式写为/d,如果我们想要匹配0-99,我们可以写成[0-9]{1,2},这时,字符串“89”符合,字符串“我们今年21岁了”也符合,因为里面有21,单独使用[0-9]{1,2},它会匹配包括出现在字符串中间的整数,如果想匹配的整数是整个字符串,那么就需要使用断言“^”和“$”了。
断言在正则表达式中出现的位置对文本进行一些声明,但不匹配任何字符。在以下列表中,E代表任何表达式。

例子 解释
^ 尖号表示字符串的开头。如果您想匹配文字,则必须通过书写将其转义\。例如,^#include将仅匹配以字符’#include’开头的字符串。(当插入号是字符集的第一个字符时,它具有特殊含义,请参见字符集。)
$ 美元表示字符串的结尾。例如,\ d \ s * 将 匹 配 以 数 字 结 尾 ( 可 选 ) 后 跟 空 格 的 字 符 串 。 如 果 您 想 匹 配 文 字 将匹配以数字结尾(可选)后跟空格的字符串。如果您想匹配文字 ,则必须通过书写将其转义\$。
\b 单词边界。例如,正则表达式\ bOK \ b表示在单词边界(例如字符串或空白的开头)之后立即匹配字母“ O”,然后紧接在另一个单词边界(例如字符串或空白的结尾)之前匹配字母“ K”。但是请注意,该断言实际上并不与任何空格匹配,因此如果我们编写(\ bOK \ b)并且具有匹配项,即使该字符串为“ It’s OK now”,它也将仅包含“ OK ”。
\B 非单词边界。只要\ b为假,该断言就为真。例如,如果我们在“ Left on”中搜索\ Bon \ B,则匹配将失败(字符串的空格和结尾不是非单词边界),但将在“ t on ne”中匹配。
(?= E) 如果表达式此时在regexp中匹配,则此断言为true。
(?!E) 如果此表达式在regexp中不匹配,则此断言为true。

除此之外,还有其他一些其他字符可以和表达式组合,方括号表示匹配方括号中包含的任何字符。上述字符集缩写可以出现在方括号中的字符集中。除字符集缩写和以下两个例外外,字符在方括号中没有特殊含义。

例子 含义
^ 如果字符集作为第一个字符出现(即紧接在方括号之后),则插入符将否定该字符集。[ABC]匹配’a’或’b’或’c’的,但[^ ABC]匹配任何但’a’或’b’或’c’的。
- 破折号表示字符范围。[W-Z]与“ W”或“ X”或“ Y”或“ Z”匹配。

通配符匹配,大多数命令外壳(如bash或cmd.exe)都支持“文件通配”,即使用通配符标识一组文件的能力。所述setPatternSyntax()函数用于正则表达式和通配符模式之间切换。通配符匹配比完整的正则表达式简单得多,并且只有四个功能:

例子 解释
c 除了下面提到的那些字符以外,任何字符都代表自己。因此,c与字符c相匹配。
? 匹配任何单个字符。与相同。在完整的正则表达式中。
* 匹配零个或多个任何字符。与完整正则表达式中的。*相同。
[…] 字符集可以用方括号表示,类似于完整的正则表达式。在字符类中,与外部一样,反斜杠没有特殊含义。

其他一些组合

例子 解释
[abc] 方括号中间是几个字母,表示a,b,c这三个单独的字符
^abc 除了a,b,c以外的字符
[a-z] 匹配a到z之间(包括a和z)的所有单个字符
[a-zA-Z] a到z,A到Z的所有单个字符
(a|b) a或b

三.链接及下载

很多人找不到相对应的文档,这里大家可以注意下,例如我是qt5的,那么只需要doc.qt.io/qt-5/xxxxxxx.html,这里xxxxxxx只需要写对应的类名即可找到对应类的文档,QRegExp类使用正则表达式提供模式匹配。


我的博客即将同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=1f5f69uzg8o23

文章来源: blog.csdn.net,作者:花狗Fdog,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/Fdog_/article/details/108912591

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。