Re: подсчет символов UTF-8
Fedir Gontsa -> debian-russian@lists.debian.org @ Thu, 23 Apr 2009 16:29:19 +0300:
FG> Добрый день Уважаемые!
FG> Спешу с вопросом. Как подсчитать количество символов в текстовом файле
FG> если файл в UTF-8, а локаль KOI-8
FG> даю команду вида
FG> cat 01.txt | wc -m при условии что файл и локаль в одной кодировке
FG> (koi8) все ок (данные совпадают с результатом тестовой проверки
FG> ОпенОфисом :))
FG> в отношении файлов в кодировке UTF-8, а локаль КОИ выдает результат не верный.
FG> например для одного и того же текста
FG> cat 01_UTF-8.txt | wc -m
FG> 53308
FG> cat 01_KOI-8.txt | wc -m
FG> 28571
cat 01_UTF-8.txt | LANG=ru_RU.UTF-8 wc -m
Локаль - свойство процесса, а не системы.
--
Если в кране нет воды -
удали с винта винды.
Reply to: