Java正则表达式【详解】
目录
一、什么是正则表达式
正则表达式是一组公式,是描述一种字符串匹配的格式。
正则表达式通常被用于判断语句中,用来检查某一字符串是否满足某一格式。。我们可以调用String中的matches(String regex)方法,判断字符串是否匹配给定的正则表达式,返回布尔值。
示例:
str.matches("[a-z]") 表示字符串是否是小写字母a-z中的某一字母
二、正则表达式元字符
正则表达式是含有一些具有特殊意义字符的字符串,这些特殊字符称为正则表达式的元字符。例如,"\\d" 表示数0~9中的任何一个,"\\d" 就是元字符。
元字符 | 正则表达式中的写法 | 意义 |
. | "." | 代表任意一个字符 |
\\d | "\\d" | 代表0~9的任何一个数字 |
\D | "\\D" | 代表任何一个非数字字符 |
\s | "\\s" | 代表空白字符,如“\t”、“\n” |
\S | "\\S" | 代表非空白字符 |
\w | "\\w" | 代表可用做标识符的字符,但不包括“$” |
\W | "\\W" | 代表不可用于标识符的字符 |
\p{Lower} | \p{Lower} | 代表小写字母a~z |
\p{Upper} | \p{Upper} | 代表大写字母A~Z |
\p{ASCII} | \p{ASCII} | ASCII字符 |
\p{Alpha} | \p{Alpha} | 字母字符 |
\p{Digit} | \p{Digit} | 十进制数字,即0~9 |
\p{Alnum} | \p{Alnum} | 数字或字母字符 |
\p{Punct} | \p{Punct} | 标点符号:!"#$%'()+,-./:;<=>?@[\]^_`{|}~ |
\p{Graph} | \p{Graph} | 可见字符:[\p{Alnum\p{Punct}}] |
\p{Print} | \p{Print} | 可打印字符:[\p{Graph}\X20] |
\p{Blank} | \p{Blank} | 空格或制表符:[\t] |
\p{Cntrl} | \p{Cntrl} | 控制字符:[\x00-\x1F\x7F] |
三、正则表达还是元字符使用方法
在正则表达式中可以使用方括号括起来若干个字符来表示一个元字符,该元字符可代表方括号中的任何一个字符。
例如,reg=“[abc]4”,这样字符串“a4”、“b4”、·“c4”都是和正则表达式匹配的字符串。除此之外还有很多格式。如:
[^456]:代表4、5、6之外的任何字符。
[a-r]:代表a~r中的任何一个字母。
[a-zA-Z]:可表示任意一个英文字母。
[a-e[g-z]]:代表a~e,或g~z中的任何一个字母(并运算)。
[a-o&&[def]]:代表字母d、e、f(交运算)。
[a-d&&[^bc]]:代表字母a、d(差运算)。
(ab)|(13)|(50):代表”ab”、”13”、”50”中任意一值。
四、正则表达式限定符
在正则表达式中允许使用限定修饰符来限定元字符出现的次数。例如,"A*"代表A可在字符串中出现0次或多次。
限定修饰符 | 意义 | 示例 |
? | 0次或1次 | A? |
* | 0次或多次 | A* |
+ | 一次或多次 | A+ |
{n} | 正好出现n次 | A{2} |
{n,} | 至少出现n次 | A{3,} |
{n,m} | 出现n次到m次 | A{2,6} |
正则表达式实例使用正则表达式来判断指定的变量是否是合法的E-mail地址。
设计思路:
[邮箱名] @ [服务器名称] [中间名] . [后缀]
合法字符串@ 合法字符串. 字符串(可无). 字符串(最大三个字符)\\w+ @ \\w+ \\.*\\w{2,3}* \\. \\w{2,3}
五、正则表达式示例
验证字符串是不是大陆手机号,大陆手机号是11位,前三位分别是130、131、132、133、134、134、135、136、137、138、139、150、151、152、153、155、156、157、158、159、180、185、186、187、188、189等
代码:
运行结果:
- 点赞
- 收藏
- 关注作者
评论(0)