none
Ошибка парсинга в Html Agility Pack RRS feed

  • Вопрос

  • Добрый день!

    Как правильно сохранить страницу через WebBrowser (WPF) на жесткий диск, чтоб её потом можно было открыть для парсинга через Html agility pack?

    На данный момент делаю вот так:

    Сохраняю:

    dynamic doc = browser.Document;
    var text = doc.documentElement.InnerHtml;
    StreamWriter sw = new StreamWriter(@cPage, false, System.Text.Encoding.UTF8);
    sw.Write(text);
    sw.Close();

    Подгружаю, но срабатывает исключение ошибки парсинга:

    HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
                        htmlDoc.OptionFixNestedTags = true;
                        htmlDoc.Load(file);
    
                        if (htmlDoc.ParseErrors != null && htmlDoc.ParseErrors.Count() > 0)
                        {
                            MessageBox.Show("Ошибка парсинга","Во время выполнения парсинга файла",
                                MessageBoxButton.OK, MessageBoxImage.Error);
                        }
                        else
                        {
                            if (htmlDoc.DocumentNode != null)
                            {
                                //действие
                            }
                        }

    что я делаю не так?

    22 июня 2014 г. 14:14

Ответы

Все ответы