正则表达式主要用于文本处理,其特点是灵活性、逻辑性和功能性非常的强,可以迅速地用极简单的方式达到字符串的复杂控制。Unix中一些工具,比如ed和grep,都支持正则表达式,而Windows下一些编辑器比如UltraEdit等,也支持正则表达式查找。虽然影响最大的仍是perl风格的正则表达式pcre,更为现代的.net语言中也对正则表达式提供了完备的支持。下面是一个用正则提取a标签中href属性及innerhtml的正则例子:
MatchCollection matches = Regex.Matches(textBox2.Text, @"<\s*a\s+[^>]*href\s*=\s*[""'](?<HREF>[^""']*)[""'][^>]*>(?<IHTML>[\s\S]+?)<\s*/\s*a\s*>", RegexOptions.IgnoreCase); foreach (Match match in matches) { string s = match.Groups["IHTML"].Value + ":" + match.Groups["HREF"].Value; links.Add(s); listBox1.Items.Add(s); }
摘自自己某半途而废的程序。
原创文章,作者:苏葳,如需转载,请注明出处:https://www.swmemo.com/570.html