none
Extrair valor de arquivo html RRS feed

  • Pergunta

  • Olá Pessoal!

    Não tenho muitos conhecimentos da utilização de regular expressão ou extação de dados de um arquivo html.

    tenho um exemplo do arquivo é gerado por outra aplicação e quero importar seus dados.

    segue exemplo de uma parte do arquivo:

    <div style=";top:1404px;left:587px;font-family:Arial;font-size:9pt;color:#000000;">100,00</DIV>
    <div style=";top:1404px;left:481px;font-family:Arial;font-size:9pt;color:#000000;">2,5000</DIV>                 <div style=";top:1404px;left:244px;font-family:Arial;font-size:9pt;color:#000000;">40,000</DIV>
    <div style=";top:1404px;left:158px;font-family:Arial;font-size:9pt;color:#000000;">MÇ</DIV>
    <div style=";top:1403px;left:52px;font-family:Arial;font-size:9pt;color:#000000;">10</DIV>
    <div style=";top:1430px;left:53px;font-family:Arial;font-size:8pt;color:#000000;">HORTELÃ&nbsp;-&nbsp;1&nbsp;10&nbsp;03&nbsp;0042&nbsp;0</DIV>

    Como pode observar eu quero pegar os valores entre os </div style> valor pegar </DIV>  onde na primeira linha tem o valor de 100,00, depois outro valor 2500,00 e outro valor 40,00 assim por diante ate chegar no nome Hortelã. Não sei utilizar o regex  ou htmldocument para extrair estes dados, alguém por favor poderia mostrar um exemplo com meus dados acima.

    grato pela atenção

    João

    quarta-feira, 3 de maio de 2017 14:43

Respostas

  • Tente com a seguinte expressão regular:

    <\s*[A-Za-z_]*\w*\s*[^\>]+>(.*?)<\/[A-Za-z]*>

    Você precisa fazer um loop nos Matches e buscar o primeiro grupo retornado em cada Match.

    Veja um exemplo com o seu conteúdo: http://regexr.com/3fsnp


    Juliano Nunes - http://linkedin.com/in/julianonunes

    Lembre-se de clicar em "Votar como útil" e "Marcar como Resposta" caso tenha respondido sua dúvida.

    Remember to "Vote as Helpful" and "Mark as Answer" if your question has been answered.

    quarta-feira, 3 de maio de 2017 15:30