[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Plain text to (x)html



Mikhail Gusarov wrote:
> Twas brillig at 11:08:04 13.12.2008 UTC+02 when storchaka@gmail.com did
> gyre and gimble:
>  SS> Мы можем гарантировать, что абзац не только начинается <p>, но и
>  SS> заканчивается </p>, а не одним из десятков совершенно посторонних
>  SS> тегов.
> 
> Это проблема парсера - построить дерево, с которым удобно
> обращаться. Настоящая же проблема в том, что валидного HTML почти
> не существует.

Я имею в виду потоковый SAX-парсер. Как мы будем хранить разбираемую
информацию, и будем ли вообще хранить её всю — это наше дело.


Reply to: