正则表达式字符匹配

作者&投稿:杜泼 (若有异议请与网页底部的电邮联系)
~ 模糊匹配,有两个方向上的“模糊”:横向模糊和纵向模糊。

横向模糊指的是,一个正则可匹配的字符串的长度不是固定的,可以是多种情况的。

其实现的方式是使用量词。譬如{m,n},表示连续出现最少m次,最多n次。

比如/ab{2,5}c/表示匹配这样一个字符串:第一个字符是“a”,接下来是2到5个字符“b”,最后是字符“c”。

纵向模糊指的是,一个正则匹配的字符串,具体到某一位字符时,它可以不是某个确定的字符,可以有多种可能。

其实现的方式是使用字符组。譬如[abc],表示该字符是可以字符“a”、“b”、“c”中的任何一个。

比如/a[123]b/可以匹配如下三种字符串:"a1b"、"a2b"、"a3b"。

需要强调的是,虽叫字符组(字符类),但只是其中一个字符。例如[abc],表示匹配一个字符,它可以是“a”、“b”、“c”之一。

比如[123456abcdefGHIJKLM],可以写成[1-6a-fG-M]。用连字符-来省略和简写。

比如要匹配“a”、“-”、“z”这三者中任意一个字符,不能写成[a-z],因为其表示小写字符中的任何一个字符,可以写成如下的方式:[-az]或[az-]或[a\-z]。即要么放在开头,要么放在结尾,要么转义。总之不会让引擎认为是范围表示法就行了。

纵向模糊匹配,还有一种情形就是,某位字符可以是任何东西,但就不能是"a"、"b"、"c"。

例如[^abc],表示是一个除"a"、"b"、"c"之外的任意一个字符。字符组的第一位放^(脱字符),表示求反的概念。

\d就是[0-9]。表示是一位数字。

记忆方式:其英文是digit(数字)。



\D就是[^0-9]。表示除数字外的任意字符。



\w就是[0-9a-zA-Z_]。表示数字、大小写字母和下划线。

记忆方式:w是word的简写,也称单词字符。



\W是[^0-9a-zA-Z_]。非单词字符。



\s是[ \t\v\n\r\f]。表示空白符,包括空格、水平制表符、垂直制表符、换行符、回车符、换页符。

记忆方式:s是space character的首字母。



\S是[^ \t\v\n\r\f]。 非空白符。



. 就是[^\n\r\u2028\u2029]。通配符,表示几乎任意字符。换行符、回车符、行分隔符和段分隔符除外。记忆方式:想想省略号...中的每个点,都可以理解成占位符,表示任何类似的东西。

如果要匹配任意字符怎么办?可以使用[\d\D]、[\w\W]、[\s\S]和[^]中任何的一个。

量词也称重复。掌握{m,n}的准确含义后,只需要记住一些简写形式。

{m,} 表示至少出现m次。



{m} 等价于{m,m},表示出现m次。



? 等价于{0,1},表示出现或者不出现。记忆方式:问号的意思表示,有吗?



+ 等价于{1,},表示出现至少一次。记忆方式:加号是追加的意思,得先有一个,然后才考虑追加。



* 等价于{0,},表示出现任意次,有可能不出现。记忆方式:看看天上的星星,可能一颗没有,可能零散有几颗,可能数也数不过来。

\d{3,6} 贪婪模式(贪婪匹配) 尽可能多的匹配

其中正则/\d{2,5}/,表示数字连续出现2到5次。会匹配2位、3位、4位、5位连续数字。



贪婪模式会尽可能多的匹配。你能给我6个,我就要5个。你能给我3个,我就3要个。反正只要在能力范围内,越多越好。

\d{3,6}? 非贪婪模式(惰性匹配);尽可能少的匹配

通过在量词后面加个问号就能实现惰性匹配,因此所有惰性匹配情形如下:

{m,n}?

{m,}?

??

+?

*?

对惰性匹配的记忆方式是:量词后面加个问号,问一问你知足了吗,你很贪婪吗?

一个模式可以实现横向和纵向模糊匹配。而多选分支可以支持多个子模式任选其一。

具体形式如下:(p1|p2|p3),其中p1、p2和p3是子模式,用|(管道符)分隔,表示其中任何之一。

例1:

var reg = /good|nice/g;

var str = 'good idea ,nice try'

console.log(str.match(reg)); //['good','nice']

例2:

var regex = /good|goodbye/g;

var string = "goodbye";

console.log(string.match(regex)); //good

例3:

var regex = /goodbye|good/g;

var string = "goodbye";         console.log(string.match(regex)); //goodbye

以上结果说明,分支结构也是惰性的,即当前面的匹配上了,后面的就不再尝试了。


如何用正则表达式匹配指定字符开始和指定字符结束?
1,正则匹配指定字符开始和指定字符结束,如以a开始结束的正则表达式为:a.*?b ,即以a开始b结束的字符可能被匹配。2,将dedecms批量改动太的sql语句记下来,伪静太或动态页面的时候很有用。3,进入后台→系统→SQL命令行工具→运行SQL命令行: 单行命令执行查询命令:将所有文档设置为“仅动态”:...

正则表达式 .*? 是什么意思啊?
表达式 .* 就是单个字符匹配任意次,即贪婪匹配。 表达式 .*? 是满足条件的情况只匹配一次,即最小匹配.举例介绍:如: 懒惰模式正则:src=".*?"结果:src="test.jpg"

正则表达式怎样匹配任意字符
在正则中,匹配任意字符,其实写法网上有很多,但因为各种软件或程序写法不支持等原因导致的问题,大家可以多研究。今天在Java中想使用正则表达式来获取一段文本中的任意字符。于是很随意得就写出如下匹配规则:(.*)结果运行之后才发现,无法获得换行之后的文本。于是查了一下手册,才发现正则表达式中,“....

正则表达式匹配但不包括一段字符串加上几个字符开头的结尾子串?_百度...
按照你的要求编写的匹配字符串结尾子串的正则表达式如下(见图)下面我给你一个php语言的例子,你看看吧.(见图)

正则表达式里边<.+?>什么意思
详情请查看视频回答

如何用正则表达式匹配形如ABAB或者AABB的字符串
AABB型:\/([\一-\龥])\\1((?!\\1)[\一-\龥])\\2\/g;说明:1,[\一-\龥]:基本中文字符集。2,\\1匹配到的第一个字符,如:第一组第一个字符匹配到了“开”,那么\\1的位置就是该组的第一个字符 3,(?!\\1)非该组的第一个字符,即:不能重复第一个匹配到的,...

正则表达式如何匹配+号?
特殊字符 1、+ 匹配前面的子表达式一次或多次。要匹配 + 字符,使用 \\+。2、\\ 将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如, 'n' 匹配字符 'n'。'\\n' 匹配换行符。序列 '\\\\' 匹配 "\\",而 '\\(' 则匹配 "("。3、| 指明两项之间的一个选择。要...

如何利用正则表达式匹配指定的字符串
var str = '{ "listusersresponse" : { "count":9 ,"user" : [ {"id":"20b1266f-d9ec-4796-9537-3620bf7a3632","username":"wj","email":"wangjie101988@126.com","created":"2015-08-13T09:43:22+0800","state":"enabled","account":"wj","accounttype":0,"domainid":"...

如何用正则表达式匹配一段文字中,一个整行是指定字符,没有其他字符
\/^(.)\\1*$\/m就可以了 ^$限定整行 ,(.)匹配任意字符 \\1反向引用前面的那个字符 m代表多行模式

正则表达式怎么匹配4-10字符,包含汉字 和点号·
正则表达式:>([^<>]+)< 分组1匹配的内容就是标签里的内容 解释:> #匹配< ([^<>]+) #匹配标签之间的内容 < #匹配>

衡东县13698059822: 如何用正则表达式匹配一段文字中的字符 -
计曲必能: 要看你内容里是否有中括号的,如果没有,那就简单,用正则\[([^\[\]]*)\]这样就可以把括号内的内容匹配到$1分组里了,怎么取$1要看你用的是什么编程语言了

衡东县13698059822: 正则表达式怎么匹配到// -
计曲必能: 正则表达式匹配特殊字符时可以使用 :在字符前加上 "\" 来对字符进行转义 // javascriptvar str = "//123"; var re = /\/\/\d+/; re.test(str);//true

衡东县13698059822: 如何用正则表达式匹配汉字 -
计曲必能: 一般情况下可以这样匹配中文,如图:<img src="https://pic4.zhimg.com/50/edcbd2faf1a916675cec852bd886e599_hd.jpg" data-rawwidth="827" data-rawheight="600" class="origin_image zh-lightbox-thumb" width="827" data-...

衡东县13698059822: 怎样使用正则表达式匹配某个字符串 -
计曲必能: 是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式.正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配.可以通过在一对分隔符之间放入表达式模式的各种组件来构造一个正则表达式,即/expression/ 普通字符由所有那些未显式指定为元字符的打印和非打印字符组成.这包括所有的大写和小写字母字符,所有数字,所有标点符号以及一些符号.

衡东县13698059822: 用正则表达式怎样匹配 不包含特定字符串的字符串 -
计曲必能: 正则表达式匹配公式为:1. ^((?!XXX).)*$,XXX为字符串.2. 另外列举一些正则表达式的语法: [abc] a或b或c . 任意单个字符 a? 零个或一个a [^abc] 任意不是abc的字符 \s 空格 a* 零个或多个a [a-z] a-z的任意字符 \S 非空格 a+ 一个或多个a [a-zA-Z] 拓展资料:1. 字符串函数(String processing function)也叫字符串处理函数,指的是编程语言中用来进行字符串处理的函数,如C,pascal,Visual以及LotusScript中进行字符串拷贝,计算长度,字符查找等的函数.

衡东县13698059822: 正则表达式的匹配问题.我想要匹配英文字母的大部分(比如除了ahz的其它小写字母),可以使用[a - z^ahz]这种形式吗?还是必须把所有的匹配字母都写出来? -
计曲必能:[答案] 不同的语言用不同的正则实现.对于JAVA来说就可以使用下面的写法[abc] a、b或 c(简单类).例如[egd]表示包含有字符e、g或d.[^abc] 任何字符,除了 a、b或 c(否定).例如[^egd]表示不包含字符e、g或d.[a-zA-Z] ...

衡东县13698059822: 正则表达式 匹配字符串 -
计曲必能: 正则表达式:^(.?|[^/]{2}.*)(["“].*?["”]) 这里双引号支持英文和中文的双引号 匹配这一行第一个双引号开始到第二个双引号结束的内容 若这一行以//开通则不匹配 匹配成功后取第2组的值即为所要结果 java 代码示例:public class Test { ...

衡东县13698059822: 正则表达式字符串匹配规则 -
计曲必能: 如果将 String testStr = "ABCGTYU";改为 String testStr = "ABCG|TYU"; 得到的结果就不一样了 中括号表示字符集,以'^'开头表示否定,所以"[^GC]"表示所有除'G'和'C'以外的字符,因此用replaceal替换成空串,会保留G和C字符"[^G|^C]"表示的是除了'G','|','^','C'四个字符以外的字符,replaceall会保留这四个字符,注意在中括号中'|'就表示'!'这个字符,而不是a或者b的意思

衡东县13698059822: 正则表达式中如何匹配$字符 -
计曲必能: 楼主是要匹配$WE$223和$w$3这两项吧,匹配式如下: \$(\w){1,3}\$(\w){1,3} 其中,\$匹配“$”,而(\w){1,3}则表示匹配包括下划线的任何单词字符1到3个,由于是连续出现\$,因此,也可以改写为: (\$(\w){1,3}){2} 我在Excel中...

衡东县13698059822: 正则表达式,大写字母,怎么匹配? -
计曲必能: 正则表达式匹配大写字母的表达为/^[A-Z]+$/ 其他情况下的匹配表达式: 一.测试字符串 var str = 'Adobe InDesign、Microsoft Word 等对中文与西文(这里用「西文」来泛指用空格分词的外文)混合排版支持较好的软件,都默认增大汉字和西文...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网