[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Фильтры документов для системы полнотекстового поиска



Hello!

В фильтрах от tracker  ssindex из gnumeric преобразует в текст
файлы csv с разными разделителями и таблицы от msoffice,
abiword, gnumeric,...
Ман нашел вот здесь
http://linux.die.net/man/1/ssindex

Хотелось бы что-то без такого количества зависимостей.

И еще по теме - есть такая утилитка wvText, конвертирует
файлы ms word в текст и очень даже неплохо, но не умеет 
отдавать результат на stdout, только в файл. Как бы ее 
обмануть?

wvText(1)
NAME
       wvHtml - convert msword documents to text
SYNOPSIS
       wvText in_word_doc out_text_doc

Best regards, Alexey Pechnikov.
http://pechnikov.tel/

Reply to: