[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Unicode HOWTO v0.1



> > Интересует консоль или xterm? (Могу и там и там.)
> 
> Вначале консоль. Потом xterm(Eterm)

В связи с интересом общественности отвечаю и в список тоже.

КОНСОЛЬ.

1. Собираем локаль ru_RU.UTF-8.
2. Устанавливаем LANG=ru_RU.UTF_8.
3. Включаем на консоли юникод. (Самый простой способ -- сказать
console-cyrillic, что у тебя unicode.)
4. Шрифты в console-cyrillic плохие (много символов отсутствует),
поэтому можно поставить другой шрифт. Я использую LatArCyrHeb-19.psf.
5. Теперь про bash. Он думает, что один байт = один символ. Это плохо.
Слегка помогает set convert-meta off в inputrc, но при вводе
неоднобайтных символов в командной строке все плохо. Я не пробовал, но
есть патчи по адресу
http://www.li18nux.org/subgroups/utildev/dli18npatch2.html
6. vim. Версия 6.0 -- все работает.
7. mutt. В muttrc поставить set charset="utf-8" и *пересобрать mutt*.
Дело в том, что slang не умеет работать с unicode. Поэтому нужно сначала
пересобрать slang с правильными патчами, потом пересобрать mutt с
пересобранным slang. Смотреть сюда:
http://www.rano.org/mutt.html
Наверное, является хорошей идеей написать в начале send_charset koi8-r,
чтобы mutt не слал все в юникоде (отдельные товарищи в списке
debian-russian так и не обзавелись приличными MUA :))) )
8. Есть подозрение, что пересборка с пересобранным slang поможет и
другим программам, таким, как lynx (который как бы умеет UTF-8).

XTERM. (Про прочие термы ничего не знаю.)
Также еще какие-то соображения.

1. xterm в unstable уже понимает unicode. Кроме того, xfonts-base
содержит юникодные шрифты.
2. Чтобы этим пользоваться, можно либо выставить ресурсы (см. man
xterm), либо запускать его примерно так:

(Это файл ~/bin/uxterm)

LANG=ru_RU.UTF-8 xterm -u8 -fn '-misc-fixed-medium-r-normal--20-200-75-75-c-100-iso10646-1' -fw '-misc-fixed-medium-r-normal-ja-18-120-100-100-c-180-iso10646-1' $*

3. Выставлять ru_RU.UTF-8 для всех X Window не рекомендуется -- очень
много приложений (включая window managers), которые так просто не могут
работать. Поэтому LANG устанавливается перед вызовом xterm.

4. Указанные шрифты очень хороши. В частности, в них есть
катакана/хирагана/руны/грузинский алфавит/....
ВНИМАНИЕ: те же шрифты меньшего размера содержат меньший набор символов.

5. Собственно, сами шрифты взяты из
http://www.cl.cam.ac.uk/~mgk25/download/ucs-fonts.tar.gz
Рекомендуется скачать данный пакет, так как помимо шрифтов, которые есть
и в xfonts-base, он содержит и файлы примеров. Особого внимания
заслуживают quickbrown.txt и UTF-demo.txt

6. gvim я запускаю так:

(Это файл ~/bin/ugvim)

LANG=ru_RU.UTF-8 gvim -fn '-misc-fixed-medium-r-normal--20-200-75-75-c-100-iso10646-1' $*

По непонятным мне причинам при syntax on кое-где шрифты портятся.

7. В Debian есть юникодный редактор yudit. Сам редактор весьма так себе,
русский в нем из коробки писать можно только с фонетической раскладкой,
но данный пакет содержит утилиту uniprint, которая из коробки печатает
юникодные файлы, не требуя никаких шрифтов. Из файла quickbrown.txt она
не напечатала только катакану/хирагану/таи. Иврит печатает :) Русский
тоже :)

8. Если кто хочет, могу написать, как обрабатывать юникодные файлы
латехом.


Я наверняка что-то забыл, так что спрашивайте.

-- 
Алексей

Attachment: pgpbjXtFvoQqW.pgp
Description: PGP signature


Reply to: