易语言正则获取页面链接和文字，求助

作者&投稿：邓颖（若有异议请与网页底部的电邮联系）

易语言正则表达式取网页文字~

你这个必须用采集器完成，比较成熟的采集器多的很，其中火车头名气比较大，你可以学习下他的采集规则。或者针对这个网址，求助名气比较大的采集器的采集规则，可能有人愿意为你做（不过现在商人很多，好多这种定制采集规则的也要收费，你可以去淘宝问问，好像不贵，几十块可以搞定）。你开始的需求不切实际。如果给你编个采集器程序，还公布源代码，这活本身工程量极大，淘宝上定做这类程序最少不低于2k，而且还未必给你源代码，源代码又是一个价格，如果这么简单，那些收费的采集器软件不就早没人用了你说是吧 ^_^。换个思路求助吧，你这样的需求给30万百度币也没人帮你做的，即使用开发周期最短的c shape做，有效代码最少也要几百行呢。高手没一天也真心干不完。。。。

正则只是一种简单的理解方式实现，其实取文本左边和取文本右边等等这些功能依旧是可以取到想要的功能例如上边这个小例子，同样的效果！

用 .*?就可以。

最后replace或split一下，把里面你需要的文字提取出来即可。

java语言利用正则表达式获取数组,急求!!
String testString ="var D_Room1 = new Array (25.2,52.3,230,6.1);" ;Pattern pattern = Pattern.compile("\\\\(.*\\\\)");Matcher matcher = pattern.matcher(testString);while(matcher.find()){System.out.println(matcher.group()); \/\/打印}比如上，可以得到结果(25.2,52.3,230,...

易语言取网页内容可以用来取卡密的,把拆分的卡密全部提取出来。求解...
我一般是利用post登陆好了之后，获取列表源文本，然后再用正则提取。有一些列表比较简单分辨的，也可以用文本_取出中间文本（）的命令来提取。

易语言表正则达式提取数据
共([\\s\\S]*?)页 .版本 2 .支持库 RegEx .子程序取页数, 文本型 .参数待取的文本, 文本型 .局部变量正则, 正则表达式 .局部变量搜索结果, 搜索结果, , "0"正则.创建 (“共([\\s\\S]*?)页”, )搜索结果＝正则.搜索全部 (待取的文本).如果 (取数组成员数 (搜索结果) ≠ 0...

易语言怎样提取网页元素?
.版本 2 .子程序取元素横坐标, 整数型 .参数元素对象, 对象 .局部变量元素坐标, 整数型 .局部变量元素父对象, 对象元素坐标＝元素对象.读数值属性 (“offsetLeft”, )元素父对象＝元素对象.读对象型属性 (“offsetParent”, ).如果真 (元素父对象.是否为空 () ＝假)元素坐标＝...

求人帮忙写易语言的正则表达式,提取html的table td中内容
(.*?) 上面是表达式，到易语言环境里面要处理下引号的问题你懂的。然后创建一个变量，类型为正则表达式，再创建一个变量，类型为搜索结果。正则表达式先使用创建（）方法，然后后面的操作记得不太清楚了，手头没有易语言环境..对了！记着取子匹配文本，取第二个括号里的内容才是你想要的哦。LS用取文...

如何用易语言制作一个可以获取网页视频音乐的软件啊,输入一个网址即可把...
简单说下原理，用http读文件得到网站的源码，通过正则表达式提取出下载地址，大部分不能直接提取，需要提取出下载地址的指向连接，然后单个进行分析出下载地址，加入到下载列表内，然后排队下载，另外因为是自己写的下载程序，没有网络加速功能！反正没有大公司写的好。

请问易语言正则表达式怎么取文本的前部分内容?
按照你的要求编写的程序如下(见图)

易语言正则表达式匹配第一页内容如何在取匹配第二页内容啊求解析_百度...
如果是网页的第一页和第二页获取静态地址重新读取即可

易语言如何正则取该网页到超级列表框
你网址没出来，只能根据你上面的源码来匹配，具体也不大清楚你要哪个信息，现在这个是匹配这些信息，你核对一下正则文本：id=([0-9]*)" class="dylink" title="(.*?)" target="_blank">(.*?)\\(([0-9]*)\\) ---

下载一个html网页后,怎么编程获得该网页上与显示相关的图片、css、js...
在网页的后面加上就可以完整的显示出来,如果要下载的话,就是用正则匹配到每一个SRC,LINK之类的.然后[原网站的域名加在前面],当然带http的这种绝对路径不用加,然后用程序下载就行了.不过css里的图片就需要和CSS的路径对应了

永定区15686055243： 易语言正则取网页内容的问题 - ？
用锦斯诺： 看了下你那一个,你应该是用了模块,但我那个是没有利用模块的,可能这样造成读取成功,你那个提问应该是写网址造成被系统删的,要输入网址就用图片截图吧 z0 = 到文本 (编码转换_转换 (编码转换_打开 (#编码_UTF_8, #编码_GB18030), HTTP读文件 (“这里写网址”), )) 大概是这样,还不行的话就真帮不上你了

永定区15686055243： 易语言如何用正则表达式来读取制定的网页文本最好源码上,谢谢 - ？
用锦斯诺： 正则代码自己写到常量里模块为精易模块3.12 常量:.版本 2.常量正则表达式, ＂＂全局变量.版本 2.全局变量正则表达, 正则表达式类然后代码如下:正则表达.创建 (#正则表达式,网页文本, ) 正则表达.取子匹配文本 (1, 1)

永定区15686055243： 易语言超文本浏览框如何获取编辑框文字并加上超链接 - ？
用锦斯诺： 用正则,还有网页要转码.像百度的话,首页是utf-8.什么编码,可以看看源码的标头,或者看浏览器右键.版本 2.支持库 HtmlView.支持库 RegEx.支持库 internet.支持库 iconv.子程序 _按钮1_被单击编辑框超链接地址.内容 = 取网页链接地址 (超文...

永定区15686055243： 易语言怎么获取网页指定内容? - ？
用锦斯诺： 用 HTTP读文件 (文本型 HTTP文件地址)可以返回欲读网页的字节集,然后用取字节集数据 (,#文本型 , )命令将字节集转换为文本,然后用正则表达式匹配你要找的文本内容,

永定区15686055243： 我想用易语言抓取网页的<p></p>内的文字其实大家也知道p标签就是文章我问下有没有大神知道该 - ？
用锦斯诺： 用正则表达式复制以下代码粘贴到易语言.版本 2.子程序 _按钮1_被单击.局部变量数组, 文本型, , ＂0＂.局部变量 i, 整数型正则搜索 (编辑框1.内容, “” + “(.*?)” + “”, , , 3, 4, 数组).计次循环首 (取数组成员数 (数组), i) ...

永定区15686055243： 易语言怎么写出取出网页的所有链接呢,那个网页源码里面没有链接,只有显示里有,谁能告诉我呀,谢谢 - ？
用锦斯诺： 找到HTML源码里面的

永定区15686055243： 在易语言中怎样把网页的文本提取出来? - ？
用锦斯诺： 可以用正则匹配出来不会正则的话就用文本取中间然后慢慢分割也可以

永定区15686055243： 易语言正则表达式取网页文字 - ？
用锦斯诺： 给你个思路,利用时钟去提取你需要的数据.也就是在时钟周期里写取出你需要的数据(比如赛事,时间等),再用时钟.时钟周期=5000,意思就是每5秒取一次数据,这个可以随便你自己写,你想多少秒就写多少秒,1秒=1000,你自己慢慢研究吧!

永定区15686055243： 易语言怎样提取网页中的文本 - ？
用锦斯诺： -----------------------------------------------------------------.版本 2.子程序取出文本, 文本型.参数文本, 文本型.参数头, 文本型.参数尾, 文本型.参数起始搜寻位置, 整数型, 可空.局部变量 pos1, 整数型.局部变量 pos2, 整数型.如果真 (起始搜寻位...

永定区15686055243： 易语言如何获取指定网站指定内容和信息? - ？
用锦斯诺：HTTP读文件(文本型网址) 然后转换为文本型,然后根据要找的信息匹配

你可能想看的相关专题

星空见康网

易语言正则获取页面链接和文字，求助

你可能想看的相关专题