[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Что есть для обработки html в командной строке?



> Hello!

> On Tuesday 07 April 2009 16:21:09 Mikhail Gusarov wrote:
 >>  VW> Но вот что забавно, многие из распространенных XML-парсеров (gnome
 >>  VW> XML например) имеют специальный режим разбора HTML. Что при этом
 >>  VW> имеется в виду, не особенно разбирался. Но возможно, некоторое
 >>  VW> тайное знание о DTD там используется.
 >>
 >> Скорее, там tag soup-парсер, всё равно валидных HTML-ей в Интернете,
 >> считай, нет :)

> Что, до сих пор? Давно не интересовался этим вопросом, просто мне лично не 
> понятно, как можно программно генерить некорректный html.
Я лично относительно недавно генерил .html

    http://mova.org/~cheusov/pub/pkgsrc-distbb/Linux/current/logs/20090410.2105/META/report.html

и воспользовавшись

   http://validator.w3.org/

обнаружил, что html - это не совсем то, что я думал.

Сейчас эта страница соответствует 'HTML 4.01 Strict', но изначально не
соответствовала. Ой! И сейчас не соответствует :-)

-- 
Best regards, Aleksey Cheusov.


Reply to: