C#用正则表达式提取文本中所有链接及其Href

不仅可以获取到指定文本中所有的完整A标签,还可获取Href和Name属性



//定义正则表达式
string pattern = @"<a\s*href=(""|')(?<href>[\s\S.]*?)(""|').*?>\s*(?<name>[\s\S.]*?)</a>";
MatchCollection mc = Regex.Matches(srcString, pattern);
foreach (Match m in mc)
{
   Response.Write("{0}---{1}", m.Groups["href"].Value, m.Groups["name"].Value);
}


原文链接:C#用正则表达式提取文本中所有链接及其Href