Re: Продолжение [вопрос с библиотекой решен]

To: debian-russian@lists.debian.org
Subject: Re: Продолжение [вопрос с библиотекой решен]
From: Иван Лох <loh@1917.com>
Date: Tue, 9 Feb 2010 21:09:59 +0300
Message-id: <[🔎] 20100209180959.GC6167@nano.ioffe.rssi.ru>
Mail-followup-to: debian-russian@lists.debian.org
In-reply-to: <[🔎] 201002091803.02010.pechnikov@mobigroup.ru>
References: <[🔎] 201002032348.34970.pechnikov@mobigroup.ru> <[🔎] 201002091719.18948.pechnikov@mobigroup.ru> <[🔎] 20100209144446.GB6167@nano.ioffe.rssi.ru> <[🔎] 201002091803.02010.pechnikov@mobigroup.ru>

On Tue, Feb 09, 2010 at 06:03:01PM +0300, Alexey Pechnikov wrote:
> On Tuesday 09 February 2010 17:44:46 Иван Лох wrote:
> > > Что касается электронной библиотеки, есть такой вопрос: насколько
> > > опревдана библиотека с поддержкой одного лишь формата (fb2 или epub)?
> > 
> > Поддерживать fb2 IMHO не надо. Надо поддерживать XML + архиваторы и
> > компрессоры. То есть четко специфицировать промежуточный формат к
> > в который должен конвертировать написанный кем-то XSLT. Иначе
> > придется отдельно поддерживать odf docx sla svg и черта-в-ступе
> 
> Да вот не хотелось бы в базу _встраивать_ xslt-процессор, который в таком 

А чего та встраивать-то? Это маленькая библиотека.

> варианте необходим для парсера. А если сначала парсить, потом в базу 
> складывать, получается лишняя копия данных в промежуточном (текстовом)
> формате. А для одного fb2 можно и на С парсер написать.

Ну это уж через-чур.

> > > текстового представления в базе (плюс сами индексы). Или другой вариант
> > > - в базе хранить _только_ индекс (эскулайт этого не умеет, но можно 
> > > поковырять). Опять же, сжатие... по умолчанию не поддерживается, хотя
> > 
> > Лучше один индекс. Сейчас быстродействие дисков такое, что открыть
> > pdf или djvu во вьюере пара секунд.
> 
> Один никак не получается - сделали поиск по индексу, хотим пользователю 
> показать _фрагмент_ текста с найденными словами, а для этого нужен 
> исходный текст плюс хранимые в индексах смещения. Так что если нашли 100 
> документов, все они нужны. А поиск без отображения найденных фрагментов 
> сильно ущербен.

Ну если парсер быстрый и один и тот-же то фрагмент один и тот-же будет получаться.
Только страницу надо запоминать, чтобы все не преобразовывать.

Reply to:

Follow-Ups:
- Re: Продолжение [вопрос с библиотекой решен]
  - From: Alexey Pechnikov <pechnikov@mobigroup.ru>

References:
- Анонс: легковесная система полнотекстового поиска
  - From: Alexey Pechnikov <pechnikov@mobigroup.ru>
- Re: Продолжение [вопрос с библиотекой решен]
  - From: Alexey Pechnikov <pechnikov@mobigroup.ru>
- Re: Продолжение [вопрос с библиотекой решен]
  - From: Иван Лох <loh@1917.com>
- Re: Продолжение [вопрос с библиотекой решен]
  - From: Alexey Pechnikov <pechnikov@mobigroup.ru>

Prev by Date: Re: OpenVZ
Next by Date: Re: OpenVZ
Previous by thread: Re: Продолжение [вопрос с библиотекой решен]
Next by thread: Re: Продолжение [вопрос с библиотекой решен]
Index(es):
- Date
- Thread