Re: Что есть для обработки html в командной строке?
- To: debian-russian@lists.debian.org
- Subject: Re: Что есть для обработки html в командной строке?
- From: Тихон Тарнавский <tikhon@lexpr.ru>
- Date: Thu, 16 Apr 2009 09:58:41 +0300
- Message-id: <20090416065841.GA23723@localhost>
- In-reply-to: <20090415190516.GA8483@laptop.local>
- References: <20090404102357.GC15362@localhost> <8d670f910904040451m45158fb9q5da89e5d587319@mail.gmail.com> <20090404160949.GE15362@localhost> <20090407104620.GI15362@localhost> <20090407171424.GA31120@laptop.local> <20090408060928.GP15362@localhost> <20090415190516.GA8483@laptop.local>
On Wed, 15.04.2009 22:05:16 , Dmitry Nezhevenko wrote:
> On Wed, Apr 08, 2009 at 09:09:28AM +0300, Тихон Тарнавский wrote:
> >
> > > пропустить html через tidy, а дальше работать с xml
> > >
> > t:~/tmp/book/tidy$ xml_grep p/span * 2>/dev/null |
> > % grep 'error parsing file' | wc -l
> > 99
> > t:~/tmp/book/tidy$ \ls | wc -l
> > 99
> >
> > Ещё варианты будут?
>
> эээ. это tidy ругнулся? Если да, то лучше глянуть, где именно.
>
Хм.. Это ругнулся xml_grep, разве не видно? Ругнулся на файлы, которые
tidy по идее должен был "validate, correct and pretty-print". Судя по
количеству ошибочных файлов 99 из 99, xml_grep с ним в корне не
согласен. Ключи перебирал в разных комбинациях -- результат тот же.
--
С уважением,
Тихон Тарнавский.
http://linuxforum.ru
http://posix.ru
Reply to: