[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Acentos e cedilha entre fat e ext3



2003-08-25, 03:28 -0300, Jos� de Paula:
> Em Mon, Aug 25, 2003 at 10:40:50AM -0300, Rodrigo Gruppelli escreveu:
> 
> > Mas não com o gnome2... De fato, se eu renomear um arquivo com cedilha e acentos pelo nautilus, nem com o ls eu visualizo direito. Aparece uns caracteres estranhos no lugar da letra acentuada, etc.
> > 
> > Acho que tanto faz se for vfat ou ext3 o filesystem.
> > 
> > Alguém sabe por quê?
> > 
> 
> Bom, eu tenho uma idéia. Talvez seja porque o GTK+-2.x (e por extensão,
> o GNOME 2.x (e por extensão o Nautilus)) usa UTF-8 na codificação de
> caracteres. Quando você salva um arquivo cujo nome tenha acento (cedilha
> incluso, para simplicidade), o GTK+-2.x grava no seu disco um nome
> codificado em UTF-8. Só que seus utilitários padrão do console entendem
> apenas Latin-1 (vulgo ISO-8859-1), que é diferente. Pelo que li no
> Unicode-HOWTO e alhures na Internet, caracteres acentuados, em Latin-1,
> usam apenas um byte. Já em UTF-8, eles usam dois bytes. Um texto em
> UTF-8 que use caracteres acentuados e não-acentuados tem caracteres
> codificados com quantidades diferentes de bytes. É apenas uma questão de
> convenção. A codificação de um texto em ASCII padrão (aquele de 128
> caracteres) é indistingüível da codificação desse mesmo texto em UTF-8,
> por conta da compatibilidade. Como essa compatibilidade não foi mantida
> para os bytes mais altos do conjunto ASCII, dá essa bagunça que você viu
> aí. Na verdade não é bug do Nautilus, do GNOME ou do GTK+.
> 
> Acredito que seu problema será solucionado se você conseguir seu
> transformar ambiente de modo texto em um ambiente UTF-8. Eu ainda estou
> tentando fazer isso. Quando achar um jeito, coloco na lista.

UTF-8 e console é um problem. Mas no X funciona uase tudo legal. É só
configurar o Console (no X) para mostrar UTF-8 e setar as variáveis do
locale com essa codificação. Aqui está assim:

LANG=de_DE.UTF-8
LC_CTYPE=de_DE.UTF-8
LC_NUMERIC="de_DE.UTF-8"
LC_TIME="de_DE.UTF-8"
LC_COLLATE="de_DE.UTF-8"
LC_MONETARY="de_DE.UTF-8"
LC_MESSAGES="de_DE.UTF-8"
LC_PAPER="de_DE.UTF-8"
LC_NAME="de_DE.UTF-8"
LC_ADDRESS="de_DE.UTF-8"
LC_TELEPHONE="de_DE.UTF-8"
LC_MEASUREMENT="de_DE.UTF-8"
LC_IDENTIFICATION="de_DE.UTF-8"

Imagino que com pt_BR ou pt_PT seja a mesma coisa.

depois é só tentar:
touch äöüßçźà€¤
ls

Até

Claudio

-- 
+- .''`. ---| Dipl.-Inf. Univ. Claudio Clemens |------| Sid |---------+
| : :' :       asturio at gmx.net        GNU/Linux User #79942        |
| `. `'                Now at TU-München | Informatik VI              |
|   `-             "YE GODS, I HAVE FEET??!" <- Userfriendly          |
Acelerate your Windows: 9.8 m/s²

Attachment: pgpwNVU00qNna.pgp
Description: PGP signature


Reply to: