none
关于获取网页源码 编码问题 RRS feed

  • 问题

  • Url:http://www.sect.com.cn:7001/queryforwgq4/search/comm/contgoods_detail.jsp?0=WHLU2412918&1=12-04-20 16:29&2=04-26 00:37&3=出口重箱进场&4=装船出场&5=Y&6=20英尺&7=GP/干货箱&8=8英尺6英寸&9=出口重箱&10=WHL/万海航运香港股份有限公司&11=WHLX632847&12=null&13=null&14=WAN HAI 203/长春&15=S330&16=null&17=null&18=null&19=null&20=null&21=null&22=null&23=null&24=null&25=null&26=null&27=WE054E40381120001000&28=14000&29=SHA/上海&30=KEE/基隆&31=KEE/基隆&32=null&33=null&34=null&

    public static string GetHtml(string url, Encoding encoding)
            {
                HttpWebResponse response = null;
                Stream dataStream = null;
                StreamReader reader = null;
    
                try
                {
                    WebRequest request = WebRequest.Create(url);
                    request.Credentials = CredentialCache.DefaultCredentials;
                    request.Timeout = 300000;
    
                    response = (HttpWebResponse)request.GetResponse();
    
                    dataStream = response.GetResponseStream();
                    reader = new StreamReader(dataStream, encoding);
                    return reader.ReadToEnd();
                }
                catch (Exception ex)
                {
                    WriteLog(ex);
                    return "";
                }
            }

    使用上面这个方法获取网页的源码,出现中文乱码,但不是所有的中文都是乱码,只是部分出现乱码,如:

    <table width="90%" border="0" cellspacing="1" cellpadding="1" class="font" align="center">
                        <tr bgcolor="#CADBFF"> 
                          <td bgcolor="#CADBFF" width="15%" align="right" height="25">箱号:</td>
                          <td width="35%" bgcolor="#ACBEFF">
                            WHLU2412918
                          </td>
                          <td width="15%" bgcolor="#CADBFF" align="right">尺寸:</td>
                          <td width="35%" bgcolor="#ACBEFF">
                            20?卞昂
                          </td>
                        </tr>
                        <tr bgcolor="#E6EDFD" > 
                          <td bgcolor="#CADBFF" width="15%" align="right" height="25">箱型:</td>
                          <td width="35%" >
                            
                          </td>
                          <td width="15%" bgcolor="#CADBFF" align="right" >高度:</td>
                          <td width="35%" >
                            8?卞昂6?卞?
                          </td>
                        </tr>
                        <tr bgcolor="#ACBEFF" > 
                          <td bgcolor="#CADBFF" width="15%" align="right" height="25" >状态:</td>
                          <td width="35%" bgcolor="#ACBEFF" >
                            ?哄????
                          </td>

    我试过好几种获取源码的方法,都不能解决这个问题?请问如何解决这个问题呢?



    2012年5月21日 7:43

答案

全部回复