none
Buscar data de um pdf RRS feed

  • Pergunta

  • Boa tarde, como posso retirar dados de um ficheiro pdf por exemplo tenho o seguinte texto

    joao Marques

    joaomarques@exemplo.com;joaomarques2@exemplo.com

    como posso retirar o mail e dividi-lo em 2?

    Obrigado

    segunda-feira, 20 de abril de 2015 15:42

Respostas

  • Ler o conteudo de um PDF nao é nada trivial. O ficheiro PDF é binário com uma estrutura proprietaria (a Adobe nao tem uma documentaçao clara sobre o padrao).

    Para isso vc vai precisar usar componentes externos para transformar PDF em texto (e este nao pode nem ser criptografado e o email tem que ser texto e nao imagem, comun no pdf)

    aqui esta um artigo de como transformar o ficheiro PDf em texto:

    http://www.codeproject.com/Articles/12445/Converting-PDF-to-Text-in-C

    Uam vez transformado, fica facil fazer a manipulaçao que vc quer.. mas primeiro teste o codigo do artigo acima e verifique se é possivel integar ao seu programa.

    Att


    William John Adam Trindade
    Analyste-programmeur
    ----------------------------------------------------------

    segunda-feira, 20 de abril de 2015 16:41
    Moderador

Todas as Respostas

  • Ler o conteudo de um PDF nao é nada trivial. O ficheiro PDF é binário com uma estrutura proprietaria (a Adobe nao tem uma documentaçao clara sobre o padrao).

    Para isso vc vai precisar usar componentes externos para transformar PDF em texto (e este nao pode nem ser criptografado e o email tem que ser texto e nao imagem, comun no pdf)

    aqui esta um artigo de como transformar o ficheiro PDf em texto:

    http://www.codeproject.com/Articles/12445/Converting-PDF-to-Text-in-C

    Uam vez transformado, fica facil fazer a manipulaçao que vc quer.. mas primeiro teste o codigo do artigo acima e verifique se é possivel integar ao seu programa.

    Att


    William John Adam Trindade
    Analyste-programmeur
    ----------------------------------------------------------

    segunda-feira, 20 de abril de 2015 16:41
    Moderador
  • mas isso é para c# nao vb :/
    terça-feira, 21 de abril de 2015 08:22
  • mas isso é para c# nao vb :/

    Amigo, após ve uma solução em C# para se converter em Vb.Net não é dificil existi conversores online para quem não conhece o C#.

    Ou podemos pegar o titulo do artido que o nosso amigo William mencionou e procurar para Vb e aparecerá artigos similares.

    espero ter ajudado com os link's disponíveis.


    Uma imagem vale mais do que mil palavras, mas ocupa 3 mil vezes mais espaço em disco

    terça-feira, 21 de abril de 2015 11:51
  • mas isso é para c# nao vb :/

    Nao espere encontrar nada pronto em VB.NEt. Normalmente esse tipo de artigo é postado em C#, mas como VB e C# compartilham o mesmo framerwork, a conversao é possivel. Como disse o colega AlexSandro, existem coversores de c# para VB (http://www.developerfusion.com/tools/convert/csharp-to-vb/).

    Masi uma vez, o que vc quer nao é nada trivial e mesmo que seu codigo fosse em c# muita coisa teria que ser adaptada.

    Att


    William John Adam Trindade
    Analyste-programmeur
    ----------------------------------------------------------

    terça-feira, 21 de abril de 2015 13:00
    Moderador
  • estamos sempre aprender, eu estou a usar vb mesmo, tambem da?
    terça-feira, 21 de abril de 2015 13:11
  • sim... se funciona com c# vai funcionar com vb.net tambem.

    Mas nao espere que seja facil.. PDF é uma caixa preta e vc tem que se confiar a componentes de terceiros.

    Att


    William John Adam Trindade
    Analyste-programmeur
    ----------------------------------------------------------

    terça-feira, 21 de abril de 2015 16:55
    Moderador