[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: CP1251 to KOI8-R text conversion



Andrei Sosnin пишет:

Здравствуйте!

У меня такая проблема: необходимо перевести документ в кодировке cp-1251 или utf-8 в кодировку koi8-r. Обрыв результирующего текста недопустим, однако допустимыми являются либо потеря "запрещенных" символов (заменой вопросами, например), либо замена специальных символов в т.н. "entity" HTML/XML (например: §, или ä или è).

*iconv* в простом режиме, как известно обрывает текст, с опцией -c результат иногда практически тот же, иногда - "проживает" до конца... (особенно, если в промежутке перекодировать cp1251 -> utf-8). Мне же необходим простой и *эффективный* метод...

Существует ли в Дебиане программа, удовлетворяющая моим запросам? Если нет, то может ли кто-нибудь дать мне рекоммендации по тому, как мне написать соответствующую программку на С/С++ или Питоне? Именно: где можно найти таблицу символов Юникод с их кодами (которые можно использовать хотя бы в "энтити" вроде: ŗ)?

Заранее благодарен,

Здравствуйте.
А konwert не пробовали?




Reply to: