none
請問如何取得網頁的原始檔? RRS feed

  • 問題

  • 我有一大堆link
    我想做搜尋網頁內容功能
    當我輸入某些key word時 可以找出那一些link的內容符合那些key word
    例如
    我有http://www.yahoo.com和http://forums.microsoft.com這二條link
    我輸出 "微軟技術" 這keyword時 可以找出http://forums.microsoft.com這條link符合要求

    我想取得那些link的原始檔 再經由搜尋原始檔來找出那些link符合要求
    因為我有的只是link而不是html檔  所以不能直接用StreamReader來讀
    請問要怎做?
    用vb的WebBrowser可以做到嗎?
    2008年3月18日 上午 07:13

所有回覆

  • 我找到答案了
    原來只是一句
     RichTextBox1.Text = AxInet1.OpenURL()
    但現在問題是
    html原始檔中遇到中文時會變成亂碼
    例如我開www.yahoo.com.hk時
    全部都變成了亂碼
    www.yahoo.com.hk是用UTF-8

    的 請問有甚麼方法可以解決?
    謝謝各位
    2008年3月18日 上午 08:10
  • ...

    線上手冊在正規運算式那邊有範例。

     

    AxInet 是 VB6 的控制項,是你電腦同時有安裝 VB6 才會有這個控制項。到時能不能順利在 VB2005 的封裝專案再散布與註冊,可能還有問題。

     

    2008年3月18日 上午 08:14
    版主
  • 我找到vb.net對應的function了
    我想問一下useragent的問題
    我想把useragent設定成ie6.0, 7.0 或者firefox等
    請問要怎做
    我在msdn找到下面那句
    myHttpWebRequest.UserAgent=".NET Framework Test Client";
    http://web-sniffer.net/?url=http%3A%2F%2Fhk.yahoo.com%2F&submit=Submit&http=1.1&rawhtml=yes&gzip=yes&type=GET&uak=1
    我用這個取得了ie firefox的useragent名字
    但我把
    Mozilla/4.0
    這句放到上面卻沒有效果
    請問我要怎做?
    2008年3月27日 上午 06:20