Re: Plain text to (x)html
Mikhail Gusarov wrote:
> Twas brillig at 11:08:04 13.12.2008 UTC+02 when storchaka@gmail.com did
> gyre and gimble:
> SS> Мы можем гарантировать, что абзац не только начинается <p>, но и
> SS> заканчивается </p>, а не одним из десятков совершенно посторонних
> SS> тегов.
>
> Это проблема парсера - построить дерево, с которым удобно
> обращаться. Настоящая же проблема в том, что валидного HTML почти
> не существует.
Я имею в виду потоковый SAX-парсер. Как мы будем хранить разбираемую
информацию, и будем ли вообще хранить её всю — это наше дело.
Reply to: