CP1251 to KOI8-R text conversion
Здравствуйте!
У меня такая проблема: необходимо перевести документ в кодировке cp-1251
или utf-8 в кодировку koi8-r. Обрыв результирующего текста недопустим,
однако допустимыми являются либо потеря "запрещенных" символов (заменой
вопросами, например), либо замена специальных символов в т.н. "entity"
HTML/XML (например: §, или ä или è).
*iconv* в простом режиме, как известно обрывает текст, с опцией -c
результат иногда практически тот же, иногда - "проживает" до конца...
(особенно, если в промежутке перекодировать cp1251 -> utf-8). Мне же
необходим простой и *эффективный* метод...
Существует ли в Дебиане программа, удовлетворяющая моим запросам? Если
нет, то может ли кто-нибудь дать мне рекоммендации по тому, как мне
написать соответствующую программку на С/С++ или Питоне? Именно: где
можно найти таблицу символов Юникод с их кодами (которые можно
использовать хотя бы в "энтити" вроде: ŗ)?
Заранее благодарен,
--
Andrei Sosnin
http://zzx.dyn.ee
<!-- : it all depends on your vision : -->
Reply to: