Re: Что есть для обработки html в командной строке?
On 2009.04.07 at 17:48:25 +0700, Mikhail Gusarov wrote:
> ТТ> Да и вообще я маловато видел html-ей, которые были бы корректны с
> ТТ> точки зрения xml-парсеров.
>
> Вообще, HTML не является XML-приложением. XHTML является, но это другой
> разговор.
HTML является SGML-приложением. Так что можно рассматривать корректность
реально существующих HTML-ей с точки зрения SGML-парсера и DTD HTML
какой-нибудь.
Но вот что забавно, многие из распространенных XML-парсеров (gnome XML
например) имеют специальный режим разбора HTML. Что при этом имеется в
виду, не особенно разбирался. Но возможно, некоторое тайное знание о DTD
там используется.
Reply to: