none
Rechercher des mots dans un pdf via VB.net RRS feed

Réponses

  • Bonjour rocketter,

    en utilisant iTextSharp vous pouvez le faire. En prenant en compte ce thread de StackOverflow par exemple :

    Public Function ReadPdfFile(fileName As String, searthText As String) As List(Of Integer)
    	Dim pages As New List(Of Integer)()
    	If File.Exists(fileName) Then
    		Dim pdfReader As New PdfReader(fileName)
    		For page As Integer = 1 To pdfReader.NumberOfPages
    			Dim strategy As ITextExtractionStrategy = New SimpleTextExtractionStrategy()
    
    			Dim currentPageText As String = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy)
    			If currentPageText.Contains(searthText) Then
    				pages.Add(page)
    			End If
    		Next
    		pdfReader.Close()
    	End If
    	Return pages
    End Function

    Cordialement,

    • Marqué comme réponse rocketter lundi 10 octobre 2016 13:16
    lundi 10 octobre 2016 08:37

Toutes les réponses

  • Bonjour rocketter,

    en utilisant iTextSharp vous pouvez le faire. En prenant en compte ce thread de StackOverflow par exemple :

    Public Function ReadPdfFile(fileName As String, searthText As String) As List(Of Integer)
    	Dim pages As New List(Of Integer)()
    	If File.Exists(fileName) Then
    		Dim pdfReader As New PdfReader(fileName)
    		For page As Integer = 1 To pdfReader.NumberOfPages
    			Dim strategy As ITextExtractionStrategy = New SimpleTextExtractionStrategy()
    
    			Dim currentPageText As String = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy)
    			If currentPageText.Contains(searthText) Then
    				pages.Add(page)
    			End If
    		Next
    		pdfReader.Close()
    	End If
    	Return pages
    End Function

    Cordialement,

    • Marqué comme réponse rocketter lundi 10 octobre 2016 13:16
    lundi 10 octobre 2016 08:37
  • Niquel merci ! ça a l'air de répondre exactement à ce que je cherchais.
    lundi 10 octobre 2016 13:17