Фильтры документов для системы полнотекстового поиска
Hello!
В фильтрах от tracker ssindex из gnumeric преобразует в текст
файлы csv с разными разделителями и таблицы от msoffice,
abiword, gnumeric,...
Ман нашел вот здесь
http://linux.die.net/man/1/ssindex
Хотелось бы что-то без такого количества зависимостей.
И еще по теме - есть такая утилитка wvText, конвертирует
файлы ms word в текст и очень даже неплохо, но не умеет
отдавать результат на stdout, только в файл. Как бы ее
обмануть?
wvText(1)
NAME
wvHtml - convert msword documents to text
SYNOPSIS
wvText in_word_doc out_text_doc
Best regards, Alexey Pechnikov.
http://pechnikov.tel/
Reply to: