none
Leggere string con caratteri speciali

    Question

  • Ciao,

    Usando htmlagilitypack, leggo una pagina web ed il nodo che mi interessa nello specifico, solo che il suo testo a volte contiene caratteri speciali che vengono codificati, come l'accento e via dicendo.

    La pagina in questione usa l'encoding UTF-8.

    Come decodifico il testo?

    Ciao e grazie

    Sunday, July 01, 2012 3:03 PM

Answers

  • non è UFT-8, è HTML ENTITY, guarda qui: http://www.fileformat.info/info/unicode/char/27/index.htm

    using System;
    using System.Net;
    
    namespace ConsoleApplication1
    {
    	class Program
    	{
    		static void Main(string[] args)
    		{
    			Console.WriteLine(WebUtility.HtmlDecode("'"));
    			Console.ReadLine();
    		}
    	}
    }


    Saluti, Emanuele


    Monday, July 02, 2012 9:21 AM
  • Ho risolto utilizzando WebUtility.HtmlDecode del System.Net namespace.

    Come mi ha fatto notare Emanuele, l'apostrofo fa parte delle html entities che vengono decodificate dal metodo precedentemente esposto.

    Grazie ad entrambi per l'aiuto.

    Ciao

    • Marked as answer by Cracken66 Monday, July 02, 2012 10:01 AM
    Monday, July 02, 2012 10:01 AM

All replies