[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Charset para traduções de templates debconf : migração para UTF-8



Olá pessoal,

Desde o beta2 do debian-installer, a processo de instalação do Debian
configura UTF-8 para o sistema instalado por padrão.

Ou seja, os usuários do etch terão um sistema que utilizará UTF-8 por
padrão, mesmo caso não optem por isso explícitamente.

Isso nos leva a um problema : atualmente, a grande maioria dos
templates debconf já traduzidos ainda estão codificados em ISO-8859-1 e
não em UTF-8.

Pessoalmente, eu já comecei a utilizat UTF-8 nas novas traduções de
templates debconf que venho fazendo (poucas) e converter as traduções para
UTF-8 quando as atualizo.

O processo de conversão é fácil e pode ser feito com o utilitário recode,
que é fornecido pelo pacote de mesmo nome, ou pelo utilitário iconv,
fornecido pelo pacote libc6, portanto, todos devem tê-lo instalado.

Particularmente, utilizo o iconv, mas o recode também pode ser usado sem
nenhum problema. A forma que uso o iconv é :

$ iconv -f iso-8859-1 -t utf-8 <arquivo_original> > <arquivo_recodificado>

Ou seja, com base no arquivo indicado por <arquivo_original>, que deve
estar codificado em ISO-8859-1, gero o arquivo indicado por
<arquivo_recodificado>, que estará convertido para UTF-8.

É importante notar que, para manipular arquivos em UTF-8 e não
"estragá-los" gravando as modificações em um ambiente que não utilizá-lo
UTF-8, você precisa configurar seu editor de textos para gravar arquivos
em UTF-8.

O gedit do GNOME já grava arquivos em UTF-8 por padrão, não precisando de
nenhuma configuração adicional (creio que todas as aplicações do GNOME se
comportem desta maneira) e o vim, meu editor de textos padrão, quando
usado em um ambiente ISO-8859-1 (meu caso), pode manipular arquivos UTF-8
sem bagunça-los usando as seguintes configurações :

set encoding=utf-8
set fileencoding=utf-8

Dicas de usuários de outros editores de texto em relação a como os mesmos
podem manipular arquivos UTF-8 sem maiores problemas são bem vindas :-)

Além de converter os arquivos para UTF-8, é importante modificar o
cabeçalho Content-type dos arquivos que contém as traduções dos templates
para indicar que o charset dos arquivos é UTF-8 e não ISO-8859-1.

Por exemplo, os cabeçalhos indicando ISO-8859-1 são :

"Content-Type: text/plain; charset=ISO-8859-1\n"

E devem ser modificados para :

"Content-Type: text/plain; charset=UTF-8\n"

É isso. Creio que assim poderemos padronizar a codificação de nossas
traduções e termos um etch mais bem localizado para nosso idioma.

Dúvidas, comentários ou qualquer coisa adicional, vamos usar a lista de
discussão. Eu a assino e não é necessário me enviar cópias das mensagens.

-- 
++----------------------------------------------------------------------++
||  André Luís Lopes                 andrelop@debian.org                ||
||                                   http://people.debian.org/~andrelop ||
||  Debian-BR Project                http://www.debian-br.org           ||
||  Public GPG KeyID                 9D1B82F6                           ||

Attachment: signature.asc
Description: Digital signature


Reply to: