这篇文章主要介绍了C#提取网页中超链接link和text部分的方法,涉及C#正则表达式及字符串操作相关技巧,需要的朋友可以参考下
正文
C#提取网页中超链接link和text部分的方法
本文实例讲述了C#提取网页中超链接link和text部分的方法。分享给大家供大家参考,具体如下:
1
2
3
4
5
6
7
8
9
|
string s = ".." ; Regex re = new Regex( @"<a[^>]*href=(""(?<href>[^""]*)""|'(?<href>[^']*)'|(?<href>[^\s>]*))[^>]*>(?<text>.*?)</a>" , RegexOptions.IgnoreCase | RegexOptions.Singleline); Match m = re.Match(s); if (m.Success) { string link = m.Groups[ "href" ].Value; string text = Regex.Replace(m.Groups[ "text" ].Value, "<[^>]*>" , "" ); Console.WriteLine( "link:{0}\ntext:{1}" , link, text); } |
希望本文所述对大家C#程序设计有所帮助。
发表评论