[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Что есть для обработки html в командной строке?



On 2009.04.07 at 17:48:25 +0700, Mikhail Gusarov wrote:

>  ТТ> Да и вообще я маловато видел html-ей, которые были бы корректны с
>  ТТ> точки зрения xml-парсеров.
> 
> Вообще, HTML не является XML-приложением. XHTML является, но это другой
> разговор.

HTML является SGML-приложением. Так что можно рассматривать корректность
реально существующих HTML-ей с точки зрения SGML-парсера и DTD HTML
какой-нибудь.

Но вот что забавно, многие из распространенных XML-парсеров (gnome XML
например) имеют специальный режим разбора HTML. Что при этом имеется в
виду, не особенно разбирался. Но возможно, некоторое тайное знание о DTD
там используется.


Reply to: