mysql支不支持正则表达式里的零宽断言

作者&投稿:钟童 (若有异议请与网页底部的电邮联系)
mysql支不支持正则表达式里的零宽断言~

分类 代码/语法 说明 捕获 (exp) 匹配exp,并捕获文本到自动命名的组里 (?exp) 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp) (?:exp) 匹配exp,不捕获匹配的文本,也不给此分组分配组号 零宽断言 (?=exp) 匹配exp前面的位置 (

MySQL 一直以来都支持正则匹配,不过对于正则替换则一直到MySQL 8.0 才支持。对于这类场景,以前要么在MySQL端处理,要么把数据拿出来在应用端处理。
比如我想把表y1的列str1的出现第3个action的子 串替换成dble,怎么实现?

1. 自己写SQL层的存储函数。代码如下写死了3个,没有优化,仅仅作为演示,MySQL 里非常不建议写这样的函数。
mysql
DELIMITER $$
USE `ytt`$$
DROP FUNCTION IF EXISTS `func_instr_simple_ytt`$$
CREATE DEFINER=`root`@`localhost` FUNCTION `func_instr_simple_ytt`(
f_str VARCHAR(1000), -- Parameter 1
f_substr VARCHAR(100), -- Parameter 2
f_replace_str varchar(100),
f_times int -- times counter.only support 3.
) RETURNS varchar(1000)
BEGIN
declare v_result varchar(1000) default 'ytt'; -- result.
declare v_substr_len int default 0; -- search string length.
set f_times = 3; -- only support 3.
set v_substr_len = length(f_substr);
select instr(f_str,f_substr) into @p1; -- First real position .
select instr(substr(f_str,@p1+v_substr_len),f_substr) into @p2; Secondary virtual position.
select instr(substr(f_str,@p2+ @p1 +2*v_substr_len - 1),f_substr) into @p3; -- Third virtual position.
if @p1 > 0 && @p2 > 0 && @p3 > 0 then -- Fine.
select
concat(substr(f_str,1,@p1 + @p2 + @p3 + (f_times - 1) * v_substr_len - f_times)
,f_replace_str,
substr(f_str,@p1 + @p2 + @p3 + f_times * v_substr_len-2)) into v_result;
else
set v_result = f_str; -- Never changed.
end if;
-- Purge all session variables.
set @p1 = null;
set @p2 = null;
set @p3 = null;
return v_result;
end;
$$
DELIMITER ;
-- 调用函数来更新:
mysql> update y1 set str1 = func_instr_simple_ytt(str1,'action','dble',3);
Query OK, 20 rows affected (0.12 sec)
Rows matched: 20 Changed: 20 Warnings: 0
2. 导出来用sed之类的工具替换掉在导入,步骤如下:(推荐使用)
1)导出表y1的记录。
mysqlmysql> select * from y1 into outfile '/var/lib/mysql-files/y1.csv';Query OK, 20 rows affected (0.00 sec)
2)用sed替换导出来的数据。
shellroot@ytt-Aspire-V5-471G:/var/lib/mysql-files# sed -i 's/action/dble/3' y1.csv
3)再次导入处理好的数据,完成。
mysql
mysql> truncate y1;
Query OK, 0 rows affected (0.99 sec)
mysql> load data infile '/var/lib/mysql-files/y1.csv' into table y1;
Query OK, 20 rows affected (0.14 sec)
Records: 20 Deleted: 0 Skipped: 0 Warnings: 0
以上两种还是推荐导出来处理好了再重新导入,性能来的高些,而且还不用自己费劲写函数代码。
那MySQL 8.0 对于以上的场景实现就非常简单了,一个函数就搞定了。
mysqlmysql> update y1 set str1 = regexp_replace(str1,'action','dble',1,3) ;Query OK, 20 rows affected (0.13 sec)Rows matched: 20 Changed: 20 Warnings: 0
还有一个regexp_instr 也非常有用,特别是这种特指出现第几次的场景。比如定义 SESSION 变量@a。
mysqlmysql> set @a = 'aa bb cc ee fi lucy 1 1 1 b s 2 3 4 5 2 3 5 561 19 10 10 20 30 10 40';Query OK, 0 rows affected (0.04 sec)
拿到至少两次的数字出现的第二次子串的位置。
mysqlmysql> select regexp_instr(@a,'[:digit:]{2,}',1,2);+--------------------------------------+| regexp_instr(@a,'[:digit:]{2,}',1,2) |+--------------------------------------+| 50 |+--------------------------------------+1 row in set (0.00 sec)
那我们在看看对多字节字符支持如何。
mysql
mysql> set @a = '中国 美国 俄罗斯 日本 中国 北京 上海 深圳 广州 北京 上海 武汉 东莞 北京 青岛 北京';
Query OK, 0 rows affected (0.00 sec)
mysql> select regexp_instr(@a,'北京',1,1);
+-------------------------------+
| regexp_instr(@a,'北京',1,1) |
+-------------------------------+
| 17 |
+-------------------------------+
1 row in set (0.00 sec)
mysql> select regexp_instr(@a,'北京',1,2);
+-------------------------------+
| regexp_instr(@a,'北京',1,2) |
+-------------------------------+
| 29 |
+-------------------------------+
1 row in set (0.00 sec)
mysql> select regexp_instr(@a,'北京',1,3);
+-------------------------------+
| regexp_instr(@a,'北京',1,3) |
+-------------------------------+
| 41 |
+-------------------------------+
1 row in set (0.00 sec)
那总结下,这里我提到了 MySQL 8.0 的两个最有用的正则匹配函数 regexp_replace 和 regexp_instr。针对以前类似的场景算是有一个完美的解决方案。

不支持

在mysql中就没有检查约束

你在访问数据库时可以对样例数据用正则表达式验证一下

确保可行再用,不行,就只好想其他办法了


参考资料:《Mysql中使用正则匹配》


使用REGEXP关键字

1、基本字符匹配


SELECT prod_name  
From Products  
Where prod_name REGEXP'.000'


LIKE和REGEXP区别


LIKE会匹配这个列,而REGEXP会在列值内进行匹配

在MySQL中正则表达式不区分大小写,要区分需使用BINARY关键字,如Where prod_name REGEXP BINARY'Jet.000'


2、进行OR匹配

使用“|”

SELECT prod_name  
From Products  
Where prod_name REGEXP'1000|2000'


3、匹配几个字符之一


指定一组用[和]扩起来的字符

SELECT prod_name  
From Products  
Where prod_name REGEXP'[123]ton'


输出

1ton

2ton


4、匹配范围


[0-9]数字0到9

[a-z]a到z

[A-Z]A到Z   

[^0-9] ^表示非,即匹配不是0-9           

注意,后面的必须比前面大

SELECT prod_name  
From Products  
Where prod_name REGEXP'[0-9]ton'


5、匹配特殊字符


在特殊字符前加“\\”进行转义,注意在一般情况下正则表达式的转义加一个“\”就可以了,在MySQL中需要加两个

SELECT prod_name  
From Products  
Where prod_name REGEXP'\\.000'


输出

1.000ton


6、匹配字符类(Posix字符类)


使用的时候需要外面加一层[],例如[[:digit:]]

类    说明    

[:alnum:]    任意字母和数字(同[a-zA-Z0-9])    

[:alpha:]    任意字母(同[a-zA-Z])    

[:blank:]    空格和制表(同[\])    

[:cntrl:]    ASCII控制字符(ASCII0到31和127)    

[:digit:]    任意数字(同[0-9])    

[:graph:]    和[[:print:]]相同,但不包含空格    

[:lower:]    任意小写字母(同[a-z])    

[:print:]    任意可打印字符    

[:punct:]    即不在[[:alnum:]]又不在[[:cntrl:]]中的字符    

[:space:]    包括空格在内的任意空白字符(同[\\f\
\\\\v])    

[:upper:]    任意大写字母(同[A-Z])    

[:xdigit:]    任意16进制数字(同[a-fA-F0-9])    

SELECT * FROM `mytable`  
Where name REGEXP'name[[:digit:]]';


输出

name1

name6

7、匹配多个实例


元字符    说明    

*    0个或多个匹配    

+    1个或多个匹配    

?     0个或1个匹配    

{n}    指定数目的匹配    

{n,}    不少于指定数目的匹配    

{n,m}    匹配数目的范围(m不超过255)    

 

SELECT prod_name  
From Products  
Where prod_name REGEXP'[0-9]{1,3}'


输出

100

15


8、定位符

元字符    说明    

^    文本的开始    

$    文本的结尾    

[[:<:]]    词的开始    

[[:>:]]    词的结尾    


注意,^有两个用法,一个是非,一个是文本的开始,用[]中表示非,否则是文本的开始。



MySQL 一直以来都支持正则匹配,不过对于正则替换则一直到MySQL 8.0 才支持。对于这类场景,以前要么在MySQL端处理,要么把数据拿出来在应用端处理。

比如我想把表y1的列str1的出现第3个action的子 串替换成dble,怎么实现?


1. 自己写SQL层的存储函数。代码如下写死了3个,没有优化,仅仅作为演示,MySQL 里非常不建议写这样的函数。

  • mysql

  • DELIMITER $$

  • USE `ytt`$$

  • DROP FUNCTION IF EXISTS `func_instr_simple_ytt`$$

  • CREATE DEFINER=`root`@`localhost` FUNCTION `func_instr_simple_ytt`(

  • f_str VARCHAR(1000), -- Parameter 1

  • f_substr VARCHAR(100),  -- Parameter 2

  • f_replace_str varchar(100),

  • f_times int -- times counter.only support  3.

  • ) RETURNS varchar(1000)

  • BEGIN

  • declare v_result varchar(1000) default 'ytt'; -- result.

  • declare v_substr_len int default 0; -- search string length.

  • set f_times = 3; -- only support  3.

  • set v_substr_len = length(f_substr);

  • select instr(f_str,f_substr) into @p1; -- First real position .

  • select instr(substr(f_str,@p1+v_substr_len),f_substr) into @p2; Secondary virtual position.

  • select instr(substr(f_str,@p2+ @p1 +2*v_substr_len - 1),f_substr) into @p3; -- Third virtual position.

  • if @p1 > 0  && @p2 > 0 && @p3 > 0 then -- Fine.

  • select

  • concat(substr(f_str,1,@p1 + @p2 + @p3 + (f_times - 1) * v_substr_len  - f_times)

  • ,f_replace_str,

  • substr(f_str,@p1 + @p2 + @p3 + f_times * v_substr_len-2)) into v_result;

  • else

  • set v_result = f_str; -- Never changed.

  • end if;

  • -- Purge all session variables.

  • set @p1 = null;

  • set @p2 = null;

  • set @p3 = null;

  • return v_result;

  • end;

  • $$

  • DELIMITER ;

  • -- 调用函数来更新:

  • mysql> update y1 set str1 = func_instr_simple_ytt(str1,'action','dble',3);

  • Query OK, 20 rows affected (0.12 sec)

  • Rows matched: 20  Changed: 20  Warnings: 0

  • 2. 导出来用sed之类的工具替换掉在导入,步骤如下:(推荐使用)

    1)导出表y1的记录。

  • mysqlmysql> select * from y1 into outfile '/var/lib/mysql-files/y1.csv';Query OK, 20 rows affected (0.00 sec)


  • 2)用sed替换导出来的数据。

  • shellroot@ytt-Aspire-V5-471G:/var/lib/mysql-files#  sed -i 's/action/dble/3' y1.csv


  • 3)再次导入处理好的数据,完成。

  • mysql

  • mysql> truncate y1;

  • Query OK, 0 rows affected (0.99 sec)

  • mysql> load data infile '/var/lib/mysql-files/y1.csv' into table y1;

  • Query OK, 20 rows affected (0.14 sec)

  • Records: 20  Deleted: 0  Skipped: 0  Warnings: 0

  • 以上两种还是推荐导出来处理好了再重新导入,性能来的高些,而且还不用自己费劲写函数代码。

    那MySQL 8.0 对于以上的场景实现就非常简单了,一个函数就搞定了。

  • mysqlmysql> update y1 set str1 = regexp_replace(str1,'action','dble',1,3) ;Query OK, 20 rows affected (0.13 sec)Rows matched: 20  Changed: 20  Warnings: 0


  • 还有一个regexp_instr 也非常有用,特别是这种特指出现第几次的场景。比如定义 SESSION 变量@a。

  • mysqlmysql> set @a = 'aa bb cc ee fi lucy  1 1 1 b s 2 3 4 5 2 3 5 561 19 10 10 20 30 10 40';Query OK, 0 rows affected (0.04 sec)


  • 拿到至少两次的数字出现的第二次子串的位置。

  • mysqlmysql> select regexp_instr(@a,'[:digit:]{2,}',1,2);+--------------------------------------+| regexp_instr(@a,'[:digit:]{2,}',1,2) |+--------------------------------------+|                                   50 |+--------------------------------------+1 row in set (0.00 sec)


  • 那我们在看看对多字节字符支持如何。

  • mysql

  • mysql> set @a = '中国 美国 俄罗斯 日本 中国 北京 上海 深圳 广州 北京 上海 武汉 东莞 北京 青岛 北京';

  • Query OK, 0 rows affected (0.00 sec)

  • mysql> select regexp_instr(@a,'北京',1,1);

  • +-------------------------------+

  • | regexp_instr(@a,'北京',1,1)   |

  • +-------------------------------+

  • |                            17 |

  • +-------------------------------+

  • 1 row in set (0.00 sec)

  • mysql> select regexp_instr(@a,'北京',1,2);

  • +-------------------------------+

  • | regexp_instr(@a,'北京',1,2)   |

  • +-------------------------------+

  • |                            29 |

  • +-------------------------------+

  • 1 row in set (0.00 sec)

  • mysql> select regexp_instr(@a,'北京',1,3);

  • +-------------------------------+

  • | regexp_instr(@a,'北京',1,3)   |

  • +-------------------------------+

  • |                            41 |

  • +-------------------------------+

  • 1 row in set (0.00 sec)

  • 那总结下,这里我提到了 MySQL 8.0 的两个最有用的正则匹配函数 regexp_replace 和 regexp_instr。针对以前类似的场景算是有一个完美的解决方案。




mysql验证数据写入是否正确
使用 mysql --print-defaults 检查客户端是否设置默认的用户和密码,没有发现。发现一切都正常,再检查 plugin 字段,发现只有 root 用户是 auth_socket ,其它的用户都是 mysql_native_password,问题可能就出在这儿。问题解决 对 auth_socket 验证插件不了解,感觉是这个插件不安全,使用下面的命令修改后...

大家好,请问一下mysql的无符号字段类型是不是只能存储正数?存储人民...
存储人民币金额应该使用DECIMAL类型,保证存储和计算的精确性。如果确保金额不会包含小数部分,可以使用INT类型。绝对不可以使用浮点类型。

Widnows安装Discuz:请检查 mysql 模块是否正确加载
mysql 安装了吗? 如果安装了,那你卸载一下,然后重新安装一下mysql 卸载后清空原来的安装目录,保证没有原来的任何文件存在,然后重新安装再试!

为什么MySQL不能正常显示中文
说到底,还是数据库表格的CHARSET设置问题,或者字符设置上不统一。你可以用这两个命令,先确定目前使用的是什么字符。show variables like 'collation_%';show variables like 'character_set_%';现在大部分都是用utf-8了,还有一部分是用gbk。然后把第二个表格的字符也修改成一样就可以。

MySQL不正确的字符串值怎么解决
创建表的时候,在最后面加个ENGINE=InnoDB DEFAULT CHARSET=utf8 即create table XXX()ENGINE=InnoDB DEFAULT CHARSET=utf8 然后在插入就可以了

MySQL下载后无法正常使用的处理方法mysql下载完不能用
3. 远程连接问题 默认情况下,MySQL不允许来自远程客户端的访问和连接。如果需要允许远程连接,则需要更改MySQL权限设置。以下是更改MySQL权限设置的步骤:(1)进入MySQL命令行模式:mysql -u root -p (2)添加新用户并分配权限:CREATE USER ‘username’@’localhost’ ...

如何让MySql正常显中文
主要是对应好字符集,比如mysql里使用的是utf8,那配置文件中也用utf8,如果需要将数据库文件导入到另外的数据库中,使用mysqldump -uroot -p 数据库名>***.sql命令行形式导出,然后再导入,尽量不要直接复制数据库文件夹中的文件,注意:如果数据库版本不同很可能导致乱码。

MySQL乱码,用navicat for MySQL编辑显示正常,在cmd中乱码,但用客户端或...
只要html和程序中使用同一种编码 应该不会出现乱码 如果还有乱码则是数据库问题 建议修改如下 ① 首先把MySQL的服务停掉 在运行窗口输入:net stop mysql ② 把服务器和客户端的字符集改成自己想用的字符集:GB2312或是utf8等……具体操作为:打开mysql安装目录下的my.ini;找到default-character-set,...

MySQL无法正常启动原因揭秘mysql不启动indb
MySQL是一款开源的关系型数据库管理系统,广泛应用于各种网站和应用程序中。但有时候,你可能会遇到MySQL无法正常启动的情况,这可能是由于各种原因导致的,比如配置错误、端口被占用、权限问题等。下面,我们将一一介绍导致MySQL无法正常启动的常见原因,并提供相关的解决方法。原因一:MySQL配置文件出现错误 My...

mysqld报错
环境变量”部分,将`C:\\Program Files\\MySQL\\MySQL Server 8.0\\bin`添加到PATH环境变量中。3. 重新打开命令提示符窗口,然后再次尝试输入`mysqld`命令。如果以上步骤都正确无误,但问题仍然存在,那么用户可能需要检查是否有其他系统级的问题影响了命令的执行,或者考虑寻求更专业的技术支持帮助。

滦南县15892572899: mysql支不支持正则表达式里的零宽断言 -
戊信消结: include #include int jc(int m){ if(m!=1) return m*jc(m-1); else return 1; } int c(int m,int n){ if(m>=n) return jc(m)/(jc(n)*jc(m-n)); } int main(void){ int m,n; scanf("%d%d",&m,&n); printf("%d\n",c(m,n)); return 0; }

滦南县15892572899: mysql支不支持正则表达式里的零宽断言 -
戊信消结: 其实在mysql中就没有检查约束,都是骗人的,我学的时候老师就说了,你在访问数据库时对数据用正则表达式验证一下就行了!

滦南县15892572899: 哪个字符串操作函数返回除去null分隔符以后的字 -
戊信消结: 个人观点:由于MYSQL没有模式匹配,不支持正则表达式,字符串处理功能完全不能和PHP相比.一般的数据库只要支持REPLACE、SUBSTR(或者EXCEL的LETT、RIGHT、MID)基本上就够用了,不过MYSQL的字符串函数确实非常丰富(...

滦南县15892572899: SQL中可用正则表达式不 -
戊信消结: 当然可以,具体可查找sql字符串函数. 如mysql的语句:mysql> SELECT 'fo\nfo' REGEXP '^fo$';

滦南县15892572899: hql不支持正则表达式吗 -
戊信消结: 正则 的 规则里,是没有 [\w&&[^_]] 这种写法的.如果JAVA 好使,那就只是他自己的特殊处理了. 匹配字母和数字但不匹配“_”:你本身 匹配字母 和数字,就肯定不匹配“_”了. 所以改成:[0-9A-Za-z] 就行了吧

滦南县15892572899: mysql中使用正则表达式 -
戊信消结: 我查了网上的资料,应该是编码问题,你这个[\u4e00-\u9fa5]是unicode的 但是你保存到数据库里的编码不一定是.可以这样测试 你把“你”字保存在“产品编号”字段中 然后 select hex(产品编号) utf8是E4BDA0 还有一种是C4E3 unicode是4F60

滦南县15892572899: mysql目前支持断言和域约束吗 -
戊信消结: 不支持. 在mysql中就没有检查约束. 你在访问数据库时可以对样例数据用正则表达式验证一

滦南县15892572899: mysql的正则表达式有反向引用吗 -
戊信消结: mysql不支持正则表达式的反向引用.

滦南县15892572899: mysql正则表达式替换字符串 -
戊信消结: mysql的正则匹配用regexp,而替换字符串用REPLACE(str,from_str,to_str) 举例如下: UPDATE myTable SET HTML=REPLACE(HTML,'<br>','') WHERE HTML REGEXP '(<br */*>\s*){2,}' 达到的效果:会把所有<br>全部替换掉. mysql中常用的...

滦南县15892572899: linq to sql 使用正则表达式 -
戊信消结: 数据库仅支持精确查询和模糊查询,并不支持正则表达式.需要使用正则的地方,如果数据量不大,可以考虑将数据全部取出由程序做正则匹配.或者尝试将正则用模糊查询做成存储过程.

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网