[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Продолжение



Alexey Pechnikov wrote:
> Спасибо, но сейчас у меня задача несколько иная - обеспечить
> индексирование оригинального набора документов. _Посоветовать_ исправить -
> хорошо, но уж никак не игнорировать. Если "по уму", то все не-юникодные
> документы следует тоже выбросить, но что же тогда останется... Собственно,
> написание индексатора для набора _валидных юникодных_ документов -
> тривиально, но малополезно (в этом случае не нужны цепочки фильтров, да и
> сама обработка несложная).

Тогда и wv не подходит, на битые вордовские документы рассчитан catdoc.

И в крайнем случае натравливать на документ strings — хоть что-то, да
проиндексирует.


Reply to: