[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: нужна кодировка UNICODELITTLE



On 2004.06.09 at 10:47:55 +0500, Dmitry-T wrote:

> > > Стоит Debian Woody. Через iconv -l можно увидеть кодировку UNICODELITTLE
> > > которая очень нужна для поиска в вордовских и экселевских файлах
> > > grep`ом, при этом хочется чтоб неучитывался регистр букв. Пытаюсь
> > > создать локаль и получаю кучу ошибок... Кто-нибудь может объяснить как
> > > создать эту локаль - очень нужно...
> > 
> > По-моему ты подходишь к проблеме не с той стороны. Grep - утилита для
> > работы с ТЕКСТОВЫМИ файлами и для работы с вордовыми и экселовскими
> > файлами попросту не предназначен. Поэтому для поиска по этим файлам их
> > следует сначала пропустить через фильтр (catdoc, wvHtml, xls2csv,
> > xlhtml).
> 
> У меня несколько специфичная задача (экспертиза) - поиск по ключевым
> словам файлов на приносимых HDD независимо от кодировки, то есть найти
> надо буквально всё. Неужели лучше будет пропускать каждый файл через
> catdoc и потом через xls2csv? Самым удобным сейчас видиться, просто
> написать 3 варианта ключевого слова (ААА, Ааа, ааа) и по ним искать с
> учётом регистра.

Есть такая добрая программа file. Нужно сначала с её помощью определить
тип файла, потом пропустить через соответствующий конвертер, и только
потом искать. А то же может быть файл зажат, скажем gzip-ом. И хрен ты
что там найдешь. Или будет он в формате OpenOffice.

> Тут ещё один вопрос встаёт: как распознавать архивы?
> 
> > Наличие кодировки в списке iconv ещё не означает возможности создания
> > локали. Вот если бы в /usr/share/i18n/charmaps был файлик UNICODELITTLE
> > - тогда другое дело.
> 
> А его самому можно сделать?
> 
> 
> -- 
> To UNSUBSCRIBE, email to debian-russian-REQUEST@lists.debian.org
> with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
> 



Reply to: