none
xmlhttp抓取网页对应的GZIP解码问题 RRS feed

  • 问题

  •    我想抓取一些网站的页面,之前采用WebClient,WebRequest之类的。但感觉效率太低。。。

      现在想通过MSXML2.XmlHttpClass进行抓取(Microsft.Com组件)

      但怎么xmlHttpClass在取getResponseHeader("Content-Encoding"),如果一些网页响应没有设置这个"Content-Encoding",那么就会抛异常,好垃圾的底层代码啊

    那大侠们:1.该怎么取才能----如果没有Content-Encoding就为空字符串或至少不异常,不需要try ....catch进行捕捉

    2.如果对方网页是GZIP压缩编码,我接收后要如何进行解码,请不要再讨论setRequestHeader屏蔽gzip编码问题。

     

     

    2011年7月19日 10:54

答案

全部回复