1. 苏葳的备忘录首页
  2. 编程

一个C#提取a标签的href及innerhtml的正则

c# 正则表达式正则表达式主要用于文本处理,其特点是灵活性、逻辑性和功能性非常的强,可以迅速地用极简单的方式达到字符串的复杂控制。Unix中一些工具,比如ed和grep,都支持正则表达式,而Windows下一些编辑器比如UltraEdit等,也支持正则表达式查找。虽然影响最大的仍是perl风格的正则表达式pcre,更为现代的.net语言中也对正则表达式提供了完备的支持。下面是一个用正则提取a标签中href属性及innerhtml的正则例子:

         MatchCollection matches = Regex.Matches(textBox2.Text, @"<\s*a\s+[^>]*href\s*=\s*[""'](?<HREF>[^""']*)[""'][^>]*>(?<IHTML>[\s\S]+?)<\s*/\s*a\s*>", RegexOptions.IgnoreCase);
            foreach (Match match in matches)
            {
                string s = match.Groups["IHTML"].Value + ":" + match.Groups["HREF"].Value;
                links.Add(s);
                listBox1.Items.Add(s);
            }

摘自自己某半途而废的程序。

原创文章,作者:苏葳,如需转载,请注明出处:https://www.swmemo.com/570.html

发表评论

邮箱地址不会被公开。 必填项已用*标注