Re: подсчет символов UTF-8
2009/4/23 Dmitry Fedorov <dm.fedorov@gmail.com>:
> 23 апреля 2009 г. 21:15 пользователь Mikhail A Antonov написал:
>>> iconv -f UTF-8 -t KOI8-U file.txt | wc -m
>>>
>> Натыкаемся на символ, который есть в utf8, но нет в koi8 и что дальше будет?
>
> Конвертим в utf-32, считаем и делим на 4.
>
iconv -f UTF-8 -t UTF-32 01.txt | wc -m
115792
115792/4
28948
еще другая, отдельная цифра, от прошлых вычислений. Все колеблются на
таких массивах в приделах 1%, это терпимо для меня
--
Fedir Gontsa
Reply to: