寻找个支持正则表达式通配符的文本批量提取工具,谢谢

作者&投稿:和变 (若有异议请与网页底部的电邮联系)
正则表达式中如何实现原通配符*号的功能?~

A[\s\S]*B 可以匹配A和B中间的任意字符。

在编写处理字符串的程序或者网页时,经常会有查找符合某些复杂规则的字符串的需要,正则表达式就是用于描述这些规则的工具。换句话说,正则表达式就是记录文本规则的代码。
用户很可能使用过Windows中用于文件查找的通配符,也就是*和?。如果想要查找某个目录下的所有的Word文档的话,用户可以搜索*.doc。在这里,*被解释成任意的字符串。和通配符类似,正则表达式也是用来进行文本匹配的工具,只不过比起通配符,它能更精确地描述用户的需求,当然,代价就是更复杂,例如,用户可以编写一个正则表达式用来查找所有一0开头,后面跟着2-3位数字,然后是一个连字符“-”,最后是7位或者8位数字的字符串(如0010-12345678或者0376-7654321)。
正则表达式适用于进行文字匹配的工具,所以本文中多次提到了在字符串里面搜索/查找,这种说法的意思是在给定的字符串中,寻找与给定的正则表达式相匹配的部分。有可能字符串里又不知一个部分满足给定的正则表达式,这时每一个这样的部分都被称为一个匹配。
总体来说,正则表达式有以下三种作用:
(1)测试字符串的某个模式。例如,可以输入一个字符串进行测试看该字符串中是否存在一个电话号码模式或者一个信用卡模式,这成为数据的有效性检验。
(2)替换文本。可以再文档中使用一个正则表达式来表示特定文字,然后可以将其全部删除或者替换成别的文字。
(3)根据模式匹配从字符串中提取一个子字符串。可以用来在文本或者输入字段中查找特定的文字。
一个正则表达式是由普通字符(如字符a-z)以及特殊字符(又称为元字符)组成文本模式。在查找文字主体时该模板描述待匹配的一个或者多个字符。正则表达式作为一个模板将某个字符模式与所搜索的字符串进行匹配。
正则表达式的语法如下所示:
/匹配对象的模式/
其中,位于之间的部分就是将要在目标字符串中进行匹配的模式。在使用时,用户只需要将希望查找的匹配对象模板内容放入“//”定界符之间即可。
例如,在字符串“TestDemo”中查找匹配模式Test,就可以使用如下代码:
/Test/

推荐用软件Replace Pioneer完成,支持正则表达式和文本替换,提取,很灵活容易。

以下举例说明怎样把<a href 和 </a>之间的内容提取出来,其他的全部删除。

1. ctrl-o打开txt文件
2. ctrl-h打开Replace窗口
(1)在Search for pattern输入:
"<a href=.*?</a>"(不带双引号)
(2)在Replace with pattern输入:
$match\n
(3)去掉Print Unmatched Unit前面的勾
3. 点击Replace,完成!

注:去掉Print Unmatched Unit选项即实现了文本提取。

推荐用软件Replace
Pioneer完成,支持正则表达式和文本替换,提取,很灵活容易。
以下举例说明怎样把<a
href

</a>之间的内容提取出来,其他的全部删除。
1.
ctrl-o打开txt文件
2.
ctrl-h打开Replace窗口
(1)在Search
for
pattern输入:
"<a
href=.*?</a>"(不带双引号)
(2)在Replace
with
pattern输入:
$match\n
(3)去掉Print
Unmatched
Unit前面的勾
3.
点击Replace,完成!
注:去掉Print
Unmatched
Unit选项即实现了文本提取。

grep


正则表达式怎么在EXCEL使用
工具\/材料:Microsoft Office Excel2016版,Excel表格。1、首先选中Excel表格,双击打开。2、然后在该界面中,选中要使用正则表达式的单元格。3、再者在该界面中,公式栏中输入正则表达式的公式“=RegexString(A1,"([\\d]+)",1)”。4、其次在该界面中,单元格里显示正则表达式结果。5、继续在该界面中...

1-7 正则表表达式—查找功能
正则表达式和js配合可以完成3件事。1. 查找一个固定的敏感词出现的位置: 以往的方法: str.indexOf() var i=str.indexOf("敏感词",starti); 在str中,从starti位置开始,查找下一个“敏感词”的位置; 省略第二个参数starti,默认从0位置开始查找; 返回值: 如果找到,返回敏...

求一个查找相同字符串的正则表达式
正则:"(.*\\r\\n)(?=(.*\\r\\n)*?\\1)"(""中的部分)编辑器:EmEditor 7.0 步骤:1.打开EmEditor,菜单栏选择“搜索”→“在文件中替换”。2.在“查找”一项填上上述正则。3.“文件类型”和“搜索文件夹”选择你要替换的文件及其位置。4.记得选中“使用正则表达式(X)”复选框。5.点击“...

Java中什么是正则表达式
正则表达式是一种文本模式,模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式,又称规则表达式。英语:Regular Expression,在代码中常简写为regex、regexp或RE,计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。 许多程序设计语言都支持利用正则表达式进行字符串操作。 已赞...

正则表达式概述 什么是正则表达式
形容词性的匹配,即一个字符串匹配一个正则表达式。动词性的匹配,即在文本或字符串里匹配正则表达式。名词性的匹配,即字符串中满足给定的正则表达式的一部分。正则表达式的应用非常广泛,特别是在字符串处理方面。目前来说,正则表达式已经在很多软件中得到广泛了应用,如Linux、Unix、HP等操作系统,C#、...

Notepad++ 与正则表达式使用
昨天卖了个关子,今天就在此略微探讨一下正则表达式。眼下已经有了各公司的代码文件,000002、000006……排成一列,要想变成 a href="网页地址?code=公司代码"公司代码\/a,该如何做呢?为了简便起见,就用 URL 三个字符代替网页地址。用 Notepad++ 打开公司代码文件,把光标移至开头(快捷...

正则表达式如何判断是不是一个数字
可以使用正则表达式:【\/(^[\\-0-9][0-9]*(.[0-9]+)?)$\/】一、思路解析:1、^ 表示打头的字符要匹配紧跟^后面的规则 。2、$ 表示打头的字符要匹配紧靠$前面的规则 。3、\/^ 和 $\/成对使用是表示要求整个字符串完全匹配定义的规则,而不是只匹配字符串中的一个子串。4、\\d表示数字 。

正则表达式,只包含数字与连字符- 如何写?
) 方法的第二个参数为一个函数返回找到数字的两倍值的方法代码。2、使用正则表达式 \/\\d+\/g: 匹配至少一个数字的调用方法代码。3、测试输出的结果,如下图所示。4、取得的是数字 2014 和 2015,所以只要取得 arguments[0] 即可。。5、还可以使用正则表达式匹配固定位数的数字,方法代码如下。

求一个查找特定中文字符正则表达式
[ ],这个是表示字符集合,表示只匹配中括号中的字符。这里面的字符是空格。表示在这几个字符之间只能有空格。,这个符号通常是最小匹配,即匹配0个或多个,就是无论这四个字前后之间有没有空格,它都能匹配。此表达式己经试验通过。更多notepad++的正则表达式语法参考:http:\/\/my.oschina.net\/duw...

正则表达式 .*? 是什么意思啊?
表达式 .* 就是单个字符匹配任意次,即贪婪匹配。 表达式 .*? 是满足条件的情况只匹配一次,即最小匹配.举例介绍:如: 懒惰模式正则:src=".*?"结果:src="test.jpg"

台江区13060423607: 寻找个支持正则表达式通配符的文本批量提取工具,谢谢 -
上帘齐隆: 推荐用软件Replace Pioneer完成,支持正则表达式和文本替换,提取,很灵活容易.以下举例说明怎样把<a href 和 </a>之间的内容提取出来,其他的全部删除.1. ctrl-o打开txt文件2. ctrl-h打开Replace窗口(1)在Search for pattern输入:"<a href=.*?</a>"(不带双引号)(2)在Replace with pattern输入:$match\n(3)去掉Print Unmatched Unit前面的勾3. 点击Replace,完成!注:去掉Print Unmatched Unit选项即实现了文本提取.

台江区13060423607: 有没有正则表达式的文本批量搜索提取工具, -
上帘齐隆: 试试 文件批量处理百宝箱V8.0主界面的【批替换】或者其【更多功能】-文本行处理或者批量复制中的功能看看,或者Replace Poineer中的相应功能.

台江区13060423607: 如何批量处理文本中的其他端口?
上帘齐隆: 如果你是想整理文本,建议你找个支持“正则表达式”查找替换的文本编辑器(比如 EmEditor). 你的要求是:除了端口是8080或80的行,其他都删除? EmEditor 有多种方法来做这个,先讲一个最便捷的: (其他方法,如果你感兴趣,或你...

台江区13060423607: 如何批量正则替换文本 -
上帘齐隆: 使用Word即可进行文本的正则操作. 测试一下: 建立word文档,内容为Aaa bbb Ccc dddctrl+H快捷键调出查找替换对话框,选中使用通配符, 在“查找内容”框中键入以下字符.确保在两组括号之间包含了空格: (<*>) (<*>)在“替换为”框中,键入以下字符.确保在逗号和第二个斜杠之间包含了空格: \2, \1然后点全部替换,结果为: bbb, Aaa ddd, Ccc

台江区13060423607: word2007中支持正则表达式搜索吗?在哪呢? -
上帘齐隆: word2007支持的查找方式中,没有找到正则表达式搜索 可以把内容copy到ue里面,ue支持正则表达式 另: word2007有许多独特的查找方式,可以试试

台江区13060423607: Excel表格中怎么使用通配符筛选文本 -
上帘齐隆: 查找筛选文本,建议安装 OPENOFFICE.里面的电子表格支持正则表达式进行查找替换或筛选,甚至在sumif,countif等函数中也支持正则表达式.

台江区13060423607: 什么过滤操作?在Linux中如何实现? -
上帘齐隆: 过滤操作就是指在一大堆文本信息中筛选出你关心的数据. 一般用 ls + 通配符,或 grep, sed 或 awk 这些支持正则表达式的工具都可以实现过滤操作. 比如: ls *.jpg #过滤出当前目录下以jpg为后缀的所有文件,这是通配符用法 grep "abc" file.txt #过滤出file.txt中包含abc的行,这里没有使用正则表达式 ls | grep "[a-z][0-9].csv" #从ls的结果中过滤出文件名格式为一个字母加一位数字并以.csv为后缀的文件名,这里用了正则表达式(字母集合[a-z]与数字集合[0-9])

台江区13060423607: 如何删除文本文档每行前几个字(我需要非常详细的解释!!!) -
上帘齐隆: 建议你找一个支持 正则表达式查找 的文本编辑软件(例如 EmEditor).查找(勾选[正则表达式]): ^.{8} 替换为:(空)▲解释: ^表示:行首 .表示:任意1个字符 {8}表示:前面的表达式重复8次 ^.{8}表示:行首的任意8个字符若仍有疑问,请“补充说明”或“追问”,我继续帮你.要答题者详细解释,请先提供问题详情.比如: ▲你用什么软件? ▲待处理文本的具体情况或复杂程度.

台江区13060423607: 寻找可以批量替换批量字符的工具!(文本文件) -
上帘齐隆: 用软件Replace Pioneer实现,支持批量替换规则,批量文件处理,而且对正则表达式,二进制文件,unicode等70多种编码方式的支持非常完备. 详细步骤: 1. 打开Tools->Batch Runner菜单.2. 点击Pick Files把要替换的文件都选中.3. 点击...

台江区13060423607: 如何使用正则表达式批量搜索WORD文档多少页 -
上帘齐隆: 在替换窗口,点高级按钮,把使用通配符打上钩..如果要查找一定格式的字符,那么把光标定位在查找栏,再点高级按钮,点格式进行设置你要查找的格式.设置好后,会在查找栏下方出现.特殊字符里会有一些比如说换行符\制表符\任意数字之类的特殊字符选项..

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网