none
如何将html转换为纯文本? RRS feed

  • 问题

  • asp.net C#,从数据库里读出来的 带各种标签的html文章,怎么样才能取其中的纯文本(只取文字,删掉html标签)?

    啥都不懂

    2012年4月23日 8:03

答案


  • 我只会用asp.net做网页,很多东西都没学。。。求多说些步骤

    啥都不懂


    你把从数据库捞出来的字符串传到StripHtml,返回值就是你要的东西了

    对,Shadow And Happy is right!

    补充:

    <%#StripHtml(Eval("字段"))%>

    注意——StripHtml后台方法,是public的!

    2012年4月24日 6:34

全部回复

  • 可以使用正则表达式

    参照

    http://wwb8.blog.163.com/blog/static/36263495201182925034978/


    http://blog.csdn.net/zx13525079024

    2012年4月23日 8:18
  • 这个是能忽略掉所有  <> 之中的内容?  还有,有一些其它的&xxxx内容,貌似也出现了


    啥都不懂

    2012年4月23日 8:23
  • 这几个你试试看吧

    http://www.cnblogs.com/ieihc0816/archive/2006/09/14/504398.html


    2012年4月23日 17:07
  • 或许你可以试试看HTML Agility Pack。

    http://msdn.microsoft.com/zh-tw/ee787055


    以上說明若有錯誤請指教,謝謝。
    http://www.dotblogs.com.tw/terrychuang/

    2012年4月23日 22:26
  • 这个HTML Agility Pack还需要自己根据情况写代码的?我现在情况是ckeditor存进数据库的html文档,读出来的时候额外要一份纯文本。


    啥都不懂

    2012年4月24日 0:43
  • 这个HTML Agility Pack还需要自己根据情况写代码的?我现在情况是ckeditor存进数据库的html文档,读出来的时候额外要一份纯文本。


    啥都不懂

    请给出您的Html代码示例,我们可以看看那……:-)
    2012年4月24日 2:30
  • 我做的是,点标题就能进详细页面,里面的内容是ckeditor存的,带html标签的(分段,字体大小都保留)。。。现在就是外面这一小段话,原意是保留90个字,

    <%#Eval("content").ToString().Replace("<p>","").Replace("</p>","").Replace(" ","").Replace("&nbsp;","").Replace(Environment.NewLine, "").Substring(0, 90)%>...         图中用的是这段话,明显保留的内容没有达到90个字,被其它标签占用了


    啥都不懂

    2012年4月24日 3:26
  • 我自己是用第2个Method http://www.cnblogs.com/ieihc0816/archive/2006/09/14/504398.html

    应该可以去除大部份的标签


    2012年4月24日 4:04
  • 大头老鼠,请给出你存放在数据库中那串带有格式化的Html……
    2012年4月24日 5:11
  • 大头老鼠,请给出你存放在数据库中那串带有格式化的Html……

    <p>
     &nbsp;&nbsp; 2月13日&mdash;15日,受通标标准技术服务有限公司(SGS)杭州分公司委派,高级审核专家郝春成来我公司进行FSC/COC&ldquo;森林产销监管链体系&rdquo;审核。本次审核内容包括太阳纸业天章公司、中天公司FSC/COC的换证审核及华茂公司监督审核。审核按照新标准的要求进行,此次审核涉及的部门主要有:大宗物资采购</font><font face="Courier New">部、原料仓储部、成品仓储部、质量处、营销</font><font face="Courier New">部、出口部、天章公司、中天公司、华茂公司,审核的内容包括:FSC原料的采购、贮存、帐目统计,FSC产品生产、贮存及帐目统计,FSC产品的销售<font face="Courier New">,FSC</font><font face="Courier New">标签</font><font face="Courier New">的使用及相关人员的培训等FSC/COC产销监管链体系标准要求的所有内容。</font></p>
    <p>
       审核前,太阳纸业做好了迎审工作,按照新的标准要求修改了《FSC运行手册》、相关程序文件及管理文件,在11月底,由质量处为三公司及成品仓储部、营销部、原料仓储部、大宗物资采购部等相关人员进行了体系知识培训,从每个部门应有的活动,到每个活动的记录,都进行了详细的讲解,并进行了实例模拟,此次培训为正式审核打下了坚实的基础。审核过程中,审核专家根据新标准要求问询相关人员,查询生产记录,审核结果和相关人员对标准的理解,得到专家的充分肯定,15日下午,审核专家在末次会议上宣布天章公司和中天公司成功换证及华茂公司顺利通过监督审核,证书有效。通过FSC/COC产销监管链体系认证,不仅满足了客户的需求,获得了首选供应商的地位,还提升了企业形象,进一步拓展了产品的国际销售渠道,又提高了产品在国际市场上的竞争力。</p>

    随便贴上一篇。。就是经常要到网上找新闻贴上来的,可能带有各种html标签


    啥都不懂

    2012年4月24日 5:15
  • 我自己是用第2个Method http://www.cnblogs.com/ieihc0816/archive/2006/09/14/504398.html

    应该可以去除大部份的标签



    我只会用asp.net做网页,很多东西都没学。。。求多说些步骤

    啥都不懂

    2012年4月24日 5:17

  • 我只会用asp.net做网页,很多东西都没学。。。求多说些步骤

    啥都不懂


    你把从数据库捞出来的字符串传到StripHtml,返回值就是你要的东西了

    2012年4月24日 6:01

  • 我只会用asp.net做网页,很多东西都没学。。。求多说些步骤

    啥都不懂


    你把从数据库捞出来的字符串传到StripHtml,返回值就是你要的东西了

    对,Shadow And Happy is right!

    补充:

    <%#StripHtml(Eval("字段"))%>

    注意——StripHtml后台方法,是public的!

    2012年4月24日 6:34

  • 我只会用asp.net做网页,很多东西都没学。。。求多说些步骤

    啥都不懂


    你把从数据库捞出来的字符串传到StripHtml,返回值就是你要的东西了

    对,Shadow And Happy is right!

    补充:

    <%#StripHtml(Eval("字段"))%>

    注意——StripHtml后台方法,是public的!


    恩。我待会儿试试。有点小忙。不会再请教你们咯

    啥都不懂

    2012年4月24日 6:36
  •  恩。我待会儿试试。有点小忙。不会再请教你们咯

    啥都不懂

    不用客气啦,欢迎反馈!!!!!!
    2012年4月24日 6:37
  • 如果要具体匹配的话,不同的网页写不同的正则会读的比较精确,如网站采集器就是这么做的
    2012年4月25日 1:40
    版主