[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: подсчет символов UTF-8



2009/4/23 Artem Chuprina <ran@ran.pp.ru>:

> Fedir Gontsa -> debian-russian@lists.debian.org  @ Thu, 23 Apr 2009 16:29:19 +0300:
>  FG> в отношении файлов в кодировке UTF-8, а локаль КОИ выдает результат не верный.
>  FG> например для одного и того же текста
>  FG> cat 01_UTF-8.txt  |  wc -m
>  FG> 53308
>  FG> cat 01_KOI-8.txt  |  wc -m
>  FG> 28571
>
> cat 01_UTF-8.txt | LANG=ru_RU.UTF-8 wc -m
>
> Локаль - свойство процесса, а не системы.
>

cat 01 | LANG=uk_UA.UTF-8 wc -m
28947

ОпенОфис выдал 28571 я конечно не скряга... но 376 символов.... гдето пропадают
не могу понять где


-- 
Fedir Gontsa
architect, Cherkasy, Ukraine

Reply to: