none
Extrair textos de página HTML

    Question

  • Pessoal,

    Eu tenho uma pergunta um tanto cabeluda:

    Tem como extrair textos de uma página HTML e jogá-los em uma Text box no VB6?

    Por exemplo, aqui no site do MSDN eu gostaria de pegar a frase da minha pergunta "Extrair textos de página HTML" e colocá-la em uma text box. 

     

    Desculpa pessoal, mas eu precisava perguntar...

    Monday, September 19, 2011 6:54 PM

Answers

  • Para isso vc vai ter que explorar o DOM

    http://pt.wikipedia.org/wiki/Modelo_de_Objeto_de_Documentos

     

    Vc precisa saber exatamente o onde esta o texto que vc quer procurar.. Caso vc use o FireFox ou Chrome, existe a opçao de inspecionar um elemento da pagina... veja a figura abaixo onde eu exploro o texto contido nessa pagina:

     

    note que o seu texto "Extrair textos de página HTML" é um heading (ele esta usando a tag h1) que esta contido dentro de uma DIV content que fica dentro de outra DIV, etc.

     

    O que complica é que cada pagina possui uma estrutura diferente e mutavel... nem sempre o texto vai estar no mesmo lugar.

    Uma vez que vc compreenda a estrutura da pagina entao fica facil:

    http://www.ostrosoft.com/vb/projects/get_html_source.asp

     

    Mas com o VB.net isso é nativo... VB6 nao é uma linguagem criada para trabalhar com WEB.. 

     

    Att


    William John Adam Trindade
    Analyste-programmeur
    ----------------------------------------------------------

    Sogi informatique ltée

     


    Tuesday, September 20, 2011 12:47 PM

All replies

  • Para isso vc vai ter que explorar o DOM

    http://pt.wikipedia.org/wiki/Modelo_de_Objeto_de_Documentos

     

    Vc precisa saber exatamente o onde esta o texto que vc quer procurar.. Caso vc use o FireFox ou Chrome, existe a opçao de inspecionar um elemento da pagina... veja a figura abaixo onde eu exploro o texto contido nessa pagina:

     

    note que o seu texto "Extrair textos de página HTML" é um heading (ele esta usando a tag h1) que esta contido dentro de uma DIV content que fica dentro de outra DIV, etc.

     

    O que complica é que cada pagina possui uma estrutura diferente e mutavel... nem sempre o texto vai estar no mesmo lugar.

    Uma vez que vc compreenda a estrutura da pagina entao fica facil:

    http://www.ostrosoft.com/vb/projects/get_html_source.asp

     

    Mas com o VB.net isso é nativo... VB6 nao é uma linguagem criada para trabalhar com WEB.. 

     

    Att


    William John Adam Trindade
    Analyste-programmeur
    ----------------------------------------------------------

    Sogi informatique ltée

     


    Tuesday, September 20, 2011 12:47 PM
  • É, pelo visto tenho bastante estudos pela frente!

    OK Willlian, muito obrigado. Vou checar essas informações q vc me passou.

    Tuesday, September 20, 2011 3:13 PM