none
HTML/CSS парсер RRS feed

  • Общие обсуждения

  • Приветствую. Прошу посоветовать мне какой-нибудь браузерный движок (на C++), нужно из HTML страницы вытягивать свойства расположенных на ней элементов (слоёв, таблиц, текстов и т.д.). Скачал Gecko (движок Mozila), там со сборкой проблема на проблеме, поэтому желательно чтобы в студии всё нормально собиралось и желательно не .Net. Спасибо.
    3 ноября 2015 г. 13:01

Все ответы

  • Может вот это подойдёт.

    Сделаем содержимое сообщества лучше, вместе!

    3 ноября 2015 г. 16:52
    Модератор
  • Да,уже пробовал, NuGet не удаётся добавить расширение к проекту. 
    4 ноября 2015 г. 4:54
  • Если требуется разбирать типовые страницы только одного-двух сайтов, то есть не требуется гибкости и универсальности, могу посоветовать регулярные выражения.

    Удачи.

    9 ноября 2015 г. 23:11
  • Проблема как раз в том, что страницы каждый раз новые :)
    12 ноября 2015 г. 14:10
  • Сколько работал с Html Agility Pack проблем не было при установке пакета. Какая у вас версия .NET и что за проект у вас? Можете скачать его и установить вручную, та поддерживается достаточно широкий спектр версий .NET.

    Сделаем содержимое сообщества лучше, вместе!

    12 ноября 2015 г. 14:35
    Модератор
  • Дело в том, что парсер надо встроить в плагин (dll я пишу), и в момент показа окна со сторонними компонентами (много перепробовал) - основная программа падает.
    12 ноября 2015 г. 14:39
  • Не думаю, что это как то должно помешать, но в любом случае у программы исходники открыты. Если немного постараться можно взять и встроить их в свой код.

    Сделаем содержимое сообщества лучше, вместе!

    12 ноября 2015 г. 14:44
    Модератор
  • А  Html Agility Pack может выдать свойства элементов (например у текста: цвет, координаты, шрифт и т.д)?
    17 ноября 2015 г. 14:27
  • Те что статические, т.е. входят в разметку HTML/CSS да. А то, что получается в результате построения DOM (например координаты как вы указали) – нет, это вам не браузер.

    Сделаем содержимое сообщества лучше, вместе!

    17 ноября 2015 г. 15:28
    Модератор
  • А есть ли компонент, который всё сразу умеет? (и свойства HTML\CSS читать и координаты)
    17 ноября 2015 г. 17:04
  • Добрый день,

    Html Agility Pack парсить умеет практически все, но координаты... Вы должны представлять, что координаты движки браузеров рассчитывают по своему. У вас по сути задача не распарсить страницу, а загрузить её в свой движок и сделать рендеринг, тогда вы получите координаты.

    Вопрос - зачем? Опишите задачу (сдается мне плагин-кликер пишите).

    18 ноября 2015 г. 4:06
  • Ну задача такая: есть программа QuarkXPress (для работы с векторной графикой), нужно написать к ней плагин, который веб страничку превратит в проект сей проги. Уже некоторое время мучаюсь с Gecko (движком Mozilla), потихоньку дело идёт, но это с титаническими усилиями и кучей потраченного времени.
    19 ноября 2015 г. 11:07