none
crear un archivo texto de un pdf con itextsharp RRS feed

  • Pregunta

  • hola necesito extraer texto de archivos pdf (linea a linea) pero no me escribe en el archivo texto

       class Program
        {
            static void Main(string[] args)
            {
    
                PdfReader reader = new PdfReader(@"c:\temp\textoPDF.pdf");
                int intPageNum = reader.NumberOfPages;
                string[] words;
                string line;
                string text;
    
                for (int i = 1; i <= intPageNum; i++)
                {
                    text = PdfTextExtractor.GetTextFromPage(reader, i, new LocationTextExtractionStrategy());
    
                    words = text.Split('\n');
    
                        for (int j = 0, len = words.Length; j < len; j++)
                        {
                            line = Encoding.UTF8.GetString(Encoding.UTF8.GetBytes(words[j]));
                            File.WriteAllText(@"c:\temp\", line);
                        }
                    
                }
            }
        }
    me sale error en File.WriteAllText No se puede encontrar una parte de la ruta de acceso 'c:\temp\'.'
    porque sale el error?

    lunes, 12 de noviembre de 2018 18:51

Respuestas

  • hola

    >>me sale error en File.WriteAllText No se puede encontrar una parte de la ruta de acceso 'c:\temp\'.'

    tienes que definir el nombre de un archivo

     File.WriteAllText(@"c:\temp\archivo.txt", line);

    Ademas el WriteAllText() se supone se utiliza cuando tienes todos el texto completo, no dentro de un for

    List<string> lineas = new List<string>();
    
    for (int i = 1; i <= intPageNum; i++)
    {
    	text = PdfTextExtractor.GetTextFromPage(reader, i, new LocationTextExtractionStrategy());
    
    	words = text.Split('\n');
    
    	for (int j = 0, len = words.Length; j < len; j++)
    	{
    		string line = Encoding.UTF8.GetString(Encoding.UTF8.GetBytes(words[j]));
    		lineas.Add(line);
    	}
    	
    }
    
    File.WriteAllLines(@"c:\temp\archivo.txt", lineas);

    saludos


    Leandro Tuttini

    Blog
    MVP Profile
    Buenos Aires
    Argentina

    • Marcado como respuesta greg_dorian lunes, 12 de noviembre de 2018 22:32
    lunes, 12 de noviembre de 2018 19:43