c# 利用正则表达式 提取html中数据

作者&投稿:丑赖 (若有异议请与网页底部的电邮联系)
c# 通过正则表达式提取html里的内容~

var html = @"div class='1'> 啦啦啦 问题";var pattern = @"(?.*?).*(
.*)*.*?)""";var match = System.Text.RegularExpressions.Regex.Match(html, pattern);if (match.Success){ var title = match.Groups["title"].Value; var url = match.Groups["url"].Value;}

Regex.Match(wangye, @"(.+?)<").Groups[1].Value;

Macth m = Regex.Match(html, "<strong style=\"font-size: 14px\">(?<CompanyName>.*?)</strong>", ...);
if (m.Success)
{
    string companyName = m.Group["CompanyName"].Value;
}




            Match match = Regex.Match(str, "<strong\\s+style\\s*=\\s*\"font-size\\s*:\\s*14px\\s*\"\\s*>([^<]+)<");
            while (match.Success)
            {
                string value = match.Groups[1].Value;
                //do sth
                match = match.NextMatch();  //查找下一个匹配的公司名
            }



安县19537349362: c# 通过正则表达式提取html里的内容 -
哈青复肾: 1 2 3 4 5 6 7 8 9 10 11 12varhtml = @"div class='1'><h2>啦啦啦</h2><ul><li><a href=""http://"" target=""_blank"">问题</a>";varpattern = @"<h2>(?<title>.*?)</h2>.*(\r\n.*)*<a\shref=""(?<url>.*?)"""; varmatch = System....

安县19537349362: C# 正则表达式提取html的值 -
哈青复肾: 这是段落中的 粗体文本.显示文本 显示 HTML 这是js的,求采纳

安县19537349362: 用C# 写正则 提取HTML中 的值? -
哈青复肾: /// 返回处理后的字符串 ////// 需要处理的字符串 /// 处理后的字符串 public string RegStr(string objStr) { string returnStr = ""; MatchCollection ml = Regex.Matches(objStr, ".*?"); foreach (Match m in ml) { string str = m.Value.Replace("", ","); ...

安县19537349362: C# 正则表达式提取嵌套的html代码 -
哈青复肾: Regex rg = new Regex(@"<(?<HtmlTag>[\w]+)[^>]*\s[iI][dD]=(?<quot>('|""))idname(\k<quot>)[^>]*>((?<Nested><\k<HtmlTag>[^>]*>)|</\k<HtmlTag>>(?<-Nested>)|.*?)*</\k<HtmlTag>>",RegexOptions.IgnoreCase); 测试通过. idname换成你的id

安县19537349362: c# 正则表达式如何 提取html中 A B两个字符串之间的部分? -
哈青复肾: <script> var event=document.createEvent("MouseEvents"); event.initEvent("click",true,true); document.getElementById(").dispatchEvent(event)";</script>

安县19537349362: C#大神们,如何用正则怎么提取这段HTML中的内容,把取得的结果用DataGridView显示出来! -
哈青复肾: 你是想要结果还是过程 需要结果的话把HTML代码用网页打开,保存表格(或者复制粘贴) 要过程的话建议不要什么正则表达式.字符匹配,检测开始符号 和

安县19537349362: 求一条c# 正则表达式,来获取HTML标签的内容 -
哈青复肾: 按格式来.. 匹配位于 或者 或者 或者 之间的不包含尖括号符号的内容.不过这样匹配的文本不在同一个match里, 但是是确实可行的.(?)[^>)|(?)[^>)|(?)[^>)|(?)[^>) 如果完全与你的格式相同的话那就简单了.. - -就是只有一个的情况..Regex r=new Regex(@"(?[^>[\s\S]*?(?[^>") r.Replace(文本,"$1$2")

安县19537349362: c#怎么解析html文件 -
哈青复肾: 1. 可以将html文件内容当成字符串,使用正则表达式进行筛选你需要的内容(一般爬虫 使用正则很便捷) 2. 如果要解析html,使用一些开源组件进行解析 譬如HtmlAgilityPack 参考链接http://www.cnblogs.com/guwei4037/p/4720182.html 3. 或者参考链接http://www.cnblogs.com/gaoweipeng/archive/2009/09/02/1558279.html

安县19537349362: C#大虾们,如何写一个正则表达式来提取下面的HTML当中的 textarea标签当中的所有内容 -
哈青复肾: <textarea[^>]*>([^<]+)</textarea> 取第一个分组的内容,就是你想要的

安县19537349362: C#正则表达式提取网页数据 -
哈青复肾: 设textBox1.text="为你的文本"; string regexStr = @"<center>([^<]*)</center>"; Match mc = Regex.Match(textBox1.Text.Replace("\n", ""), regexStr, RegexOptions.IgnoreCase); MessageBox.Show("结果为:" + mc.Groups[1].Value);

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网