Re: Продолжение [вопрос с библиотекой решен]
On Tue, Feb 09, 2010 at 06:03:01PM +0300, Alexey Pechnikov wrote:
> On Tuesday 09 February 2010 17:44:46 Иван Лох wrote:
> > > Что касается электронной библиотеки, есть такой вопрос: насколько
> > > опревдана библиотека с поддержкой одного лишь формата (fb2 или epub)?
> >
> > Поддерживать fb2 IMHO не надо. Надо поддерживать XML + архиваторы и
> > компрессоры. То есть четко специфицировать промежуточный формат к
> > в который должен конвертировать написанный кем-то XSLT. Иначе
> > придется отдельно поддерживать odf docx sla svg и черта-в-ступе
>
> Да вот не хотелось бы в базу _встраивать_ xslt-процессор, который в таком
А чего та встраивать-то? Это маленькая библиотека.
> варианте необходим для парсера. А если сначала парсить, потом в базу
> складывать, получается лишняя копия данных в промежуточном (текстовом)
> формате. А для одного fb2 можно и на С парсер написать.
Ну это уж через-чур.
> > > текстового представления в базе (плюс сами индексы). Или другой вариант
> > > - в базе хранить _только_ индекс (эскулайт этого не умеет, но можно
> > > поковырять). Опять же, сжатие... по умолчанию не поддерживается, хотя
> >
> > Лучше один индекс. Сейчас быстродействие дисков такое, что открыть
> > pdf или djvu во вьюере пара секунд.
>
> Один никак не получается - сделали поиск по индексу, хотим пользователю
> показать _фрагмент_ текста с найденными словами, а для этого нужен
> исходный текст плюс хранимые в индексах смещения. Так что если нашли 100
> документов, все они нужны. А поиск без отображения найденных фрагментов
> сильно ущербен.
Ну если парсер быстрый и один и тот-же то фрагмент один и тот-же будет получаться.
Только страницу надо запоминать, чтобы все не преобразовывать.
Reply to: