[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Что есть для обработки html в командной строке?



On Sat, Apr 18, 2009 at 12:52:19PM +0300, Serhiy Storchaka wrote:
> 
> В Konqueror есть плагин, позволяющий сохранить страницу в war-файле (Web
> Archive, обычный tar.gz на самом деле). При этом он её как-то
> преобразовывает, вероятно получается корректный html или xhtml. Возможно
> удастся как-то задействовать его и в автоматическом режиме, через dcop или
> что-то в этом роде. Аналогичной функциональности в других браузерах я не
> нашёл.

Какой функциональности нет? Разбора в DOM нет, или сериализации? Можно
использовать движок мозиллы можно перл использовать. Какой-нибудь питон или
ява или libwww на С. Проблема в другом. С корректным html и у libtidy проблем
не будет. С сильно битым -- везде будет каша.



Reply to: