[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: подсчет символов UTF-8



On Thu, Apr 23, 2009 at 05:13:48PM +0300, Fedir Gontsa wrote:
> > iconv -f UTF-8 -t KOI8-U file.txt | wc -m
> >
> iconv вешаеться на каком-то из iconv: illegal input sequence at position 2337
> 
> env LANG=uk_UA.UTF-8 wc -m 01.txt
>  а вариант со сменой локали работает... погрешность при подсчете ~1% с
> опенофисом, будем считать технологической потребностью. Все же не
> бухгалтерия....

Думаю, что если убрать пробелы всех видов, то совпадет...



Reply to: