[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: подсчет символов UTF-8



Fedir Gontsa -> debian-russian@lists.debian.org  @ Thu, 23 Apr 2009 16:29:19 +0300:

 FG> Добрый день Уважаемые!
 FG> Спешу с вопросом. Как подсчитать количество символов в текстовом файле
 FG> если файл в UTF-8,  а локаль KOI-8

 FG> даю команду вида
 FG> cat 01.txt  |  wc -m при условии что файл и локаль в одной кодировке
 FG> (koi8) все ок (данные совпадают с результатом тестовой проверки
 FG> ОпенОфисом :))

 FG> в отношении файлов в кодировке UTF-8, а локаль КОИ выдает результат не верный.
 FG> например для одного и того же текста
 FG> cat 01_UTF-8.txt  |  wc -m
 FG> 53308
 FG> cat 01_KOI-8.txt  |  wc -m
 FG> 28571

cat 01_UTF-8.txt | LANG=ru_RU.UTF-8 wc -m

Локаль - свойство процесса, а не системы.

-- 
Если в кране нет воды -
удали с винта винды.


Reply to: