none
При попытке распарсить сайт используя HtmlAgilityPack вылетает эксепшн Удаленный сервер возвратил ошибку: 404 RRS feed

  • Вопрос

  • Здравствуйте, пробую распарсить страницу http://www.zakupki.gov.ru/epz/order/...ing=компьютеры .но почему то при попытке распарсить сайт используя HtmlAgilityPack вылетает эксепшн Удаленный сервер возвратил ошибку: 404 
    Делаю так 
    private void handler(object sender, RoutedEventArgs e)
            {
                WebClient wClient = new WebClient();
                wClient.Proxy = null;
                wClient.Encoding = System.Text.Encoding.GetEncoding("utf-8");
                var doc = new HtmlDocument();
                doc.LoadHtml(wClient.DownloadString("http://www.zakupki.gov.ru/epz/order/quicksearch/search.html?searchString=компьютеры"));
                
            }


    Хотя если просто через браузер заходить то он нормально на эту страницу заходит. В чем может быть дело ?
    25 июля 2014 г. 9:00

Ответы

  • там не понятно как это делать просто :( вот их rss 

    http://zakupki.gov.ru/epz/main/public/news/rss

    но там вообще вместо текста какаято абракадабра написана.

    Да и ссылок на сами заказы я там не вижу чтото:(

    Ну вы привели RSS с главной страницы - это новости сайта. По вашему же запросу будет так

    http://www.zakupki.gov.ru/epz/order/quicksearch/rss?searchString=компьютеры

    А кракозябры легко убираются, указанием нужной кодировки.


    VB.Net - WPF, WinRT, WP

    30 июля 2014 г. 7:44
    Отвечающий

Все ответы

  • Добрый день, не парсите основные страницы, разбирайте на закупках rss каналы
    25 июля 2014 г. 9:38
  • там не понятно как это делать просто :( вот их rss 

    http://zakupki.gov.ru/epz/main/public/news/rss

    но там вообще вместо текста какаято абракадабра написана.

    Да и ссылок на сами заказы я там не вижу чтото:(
    • Изменено Timur2008 25 июля 2014 г. 9:56
    25 июля 2014 г. 9:53
  • там не понятно как это делать просто :( вот их rss 

    http://zakupki.gov.ru/epz/main/public/news/rss

    но там вообще вместо текста какаято абракадабра написана.

    Да и ссылок на сами заказы я там не вижу чтото:(

    Ну вы привели RSS с главной страницы - это новости сайта. По вашему же запросу будет так

    http://www.zakupki.gov.ru/epz/order/quicksearch/rss?searchString=компьютеры

    А кракозябры легко убираются, указанием нужной кодировки.


    VB.Net - WPF, WinRT, WP

    30 июля 2014 г. 7:44
    Отвечающий