[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Продолжение [вопрос с библиотекой решен]



On Tue, Feb 09, 2010 at 06:03:01PM +0300, Alexey Pechnikov wrote:
> On Tuesday 09 February 2010 17:44:46 Иван Лох wrote:
> > > Что касается электронной библиотеки, есть такой вопрос: насколько
> > > опревдана библиотека с поддержкой одного лишь формата (fb2 или epub)?
> > 
> > Поддерживать fb2 IMHO не надо. Надо поддерживать XML + архиваторы и
> > компрессоры. То есть четко специфицировать промежуточный формат к
> > в который должен конвертировать написанный кем-то XSLT. Иначе
> > придется отдельно поддерживать odf docx sla svg и черта-в-ступе
> 
> Да вот не хотелось бы в базу _встраивать_ xslt-процессор, который в таком 

А чего та встраивать-то? Это маленькая библиотека.

> варианте необходим для парсера. А если сначала парсить, потом в базу 
> складывать, получается лишняя копия данных в промежуточном (текстовом)
> формате. А для одного fb2 можно и на С парсер написать.

Ну это уж через-чур.

> > > текстового представления в базе (плюс сами индексы). Или другой вариант
> > > - в базе хранить _только_ индекс (эскулайт этого не умеет, но можно 
> > > поковырять). Опять же, сжатие... по умолчанию не поддерживается, хотя
> > 
> > Лучше один индекс. Сейчас быстродействие дисков такое, что открыть
> > pdf или djvu во вьюере пара секунд.
> 
> Один никак не получается - сделали поиск по индексу, хотим пользователю 
> показать _фрагмент_ текста с найденными словами, а для этого нужен 
> исходный текст плюс хранимые в индексах смещения. Так что если нашли 100 
> документов, все они нужны. А поиск без отображения найденных фрагментов 
> сильно ущербен.

Ну если парсер быстрый и один и тот-же то фрагмент один и тот-же будет получаться.
Только страницу надо запоминать, чтобы все не преобразовывать.


Reply to: