我想抓取一些网站的页面,之前采用WebClient,WebRequest之类的。但感觉效率太低。。。
现在想通过MSXML2.XmlHttpClass进行抓取(Microsft.Com组件)
但怎么xmlHttpClass在取getResponseHeader("Content-Encoding"),如果一些网页响应没有设置这个"Content-Encoding",那么就会抛异常,好垃圾的底层代码啊
那大侠们:1.该怎么取才能----如果没有Content-Encoding就为空字符串或至少不异常,不需要try ....catch进行捕捉
2.如果对方网页是GZIP压缩编码,我接收后要如何进行解码,请不要再讨论setRequestHeader屏蔽gzip编码问题。