[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: подсчет символов UTF-8



2009/4/23 Dmitry Fedorov <dm.fedorov@gmail.com>:
> 23 апреля 2009 г. 21:15 пользователь Mikhail A Antonov написал:
>>> iconv -f UTF-8 -t KOI8-U file.txt | wc -m
>>>
>> Натыкаемся на символ, который есть в utf8, но нет в koi8 и что дальше будет?
>
> Конвертим в utf-32, считаем и делим на 4.
>

iconv -f UTF-8 -t UTF-32 01.txt | wc -m
115792

115792/4
28948
еще другая, отдельная цифра, от прошлых вычислений. Все колеблются на
таких массивах в приделах 1%, это терпимо для меня

-- 
Fedir Gontsa

Reply to: