找回密码
 注册
搜索
热搜: 回贴

提取HTML代码中文字的C#函数

2009-12-13 13:38| 发布者: admin| 查看: 63| 评论: 0|原作者: 仙之剑缘

▲/// ///去除HT......


///
/// 去除HTML标记
///

/// 包括HTML的源码
/// 已经去除后的文字
public static string StripHTML(string strHtml)
{
string [] aryReg ={
@"]*?>.*?",
@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",
@"([\r\n])[\s]+",
@"&(quot|#34);",
@"&(amp|#38);",
@"&(lt|#60);",
@"&(gt|#62);",
@"&(nbsp|#160);",
@"&(iexcl|#161);",
@"&(cent|#162);",
@"&(pound|#163);",
@"&(copy|#169);",
@"&#(\d+);",
@"-->",
@"

最新评论

QQ|小黑屋|最新主题|手机版|微赢网络技术论坛 ( 苏ICP备08020429号 )

GMT+8, 2024-9-29 21:20 , Processed in 0.188159 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.