[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: auf UTF-8 umsteigen, Folgen?



On 060711 at 21:20, Andreas Pakulat wrote:
> > Ein Problem stellen auch zB Dateinamen dar. Die sind ja auch irgendwie
> > kodiert, verfuegbare Codings sind im Kernel zu konfigurieren.
> Also damit habe ich eigentlich auch keinerlei Probleme. Wenn ein User
> mit de_DE locale eine Datei mit Umlauten auf einem *nix-Dateisystem
> ablegt kann ich die auch korrekt in UTF-8 locale sehen.

Hm. Ich hoffe mein ü kommt korrekt an, sonst wird das jetzt etwas wirr:

[pepe@goofy ~]$ echo $TERM, $LANG
rxvt-unicode, en_US.utf8
[pepe@goofy ~]$ touch tür
[pepe@goofy ~]$ ls tür
tür
[pepe@goofy ~]$ rm tür
[pepe@goofy ~]$ export LANG=en_US
[pepe@goofy ~]$ urxvt

-> touch tür;ls tür; rm tür; geht in dem terminal ebenso. Allerdings
faellt auf, dass das terminal irgendwie der Meinung ist, ein Zeichen
anzuzeigen(ü) und 2 zeichen zu editieren, xterm das selbe. :-/

-> touch tür; exit

[pepe@goofy ~]$ rm tür
rm: cannot remove `tür': No such file or directory
[pepe@goofy ~]$ ls tür
ls: tür: No such file or directory
[pepe@goofy ~]$ ls t?r
tür


-> Unter anderem locale erzeugte Dateien werden hier korrekt angezeigt,
aber wenn ich den Namen eingebe passt er nicht auf den im FS
vorhandenen.


> Default-Kodierung fuer FS im Kernel ist hier latin1. Solange der Kernel
> weiss welche Kodierung das Dateisystem nutzt ist das alles kein Problem.
> Problematisch wirds bei FAT/NTFS und evtl. SMB/CIFS, aber dort gibts
> Optionen um dem Kernel auf die Spruenge zu helfen. 

> > Mit convmv kann man die Codierungen aendern.
> 
> Wie gesagt hier unnoetig.

Von oben weiter, also mit kaputter Datei "tür"(man entschuldige
meine Kreativitaet..)

[pepe@goofy ~]$ convmv --notest -f iso-8859-1 -t utf-8 t?r
mv "./tür"	"./tür"
Ready!
[pepe@goofy ~]$ rm tür

Nachdem convmv den Dateinamen von 8859-1 nach utf-8 convertiert hat,
kann ich den Dateinamen korrekt eintippen. Vorher hats dann auf
Dateisystemebene nicht gepasst, weil die ü unterschiedlich kodiert
werden. Sieht man auch daran, dass ich so 2x die gleiche Datei
erstellen kann, einmal wird sie auf FS-Ebene mit iso-8859-1 und einmal
mit utf-8 kodiert, der Dateiname unterscheidet sich dort also.

Oda aba da is noch wat andret falsch...

> > Aber ich hab noch immer Probleme, wenn zB der p2p-Client gegenueber
> > anderen Clients Dateien fehlerhaft anzeigt(UTF wird nicht beachtet)
> > oder beim runterladen die Datei zwar "f?b?r" heist und korrekt
> > angezeigt wird, aber irgendwie trotzdem anders/falsch codiert ist.
> Dann ist irgendwas bei dir kaputt, evtl. auch einfach nur der Client.

Der p2p-Client, ja, weil er die Namen nicht entsprechend der locale
abspeichert. 

> > Nerviges Problem ist, dass man fuer unicode modifizierte terminals
> > benutzt, die dann auch anders heissen. z.B. rxvt-unicode oder uxterm.
> Bloedsinn, deine Howtos sind hoffnungslos veraltet. Solange LANG korrekt
> gesetzt ist, funktionieren xterm, gnome-terminal, konsole und
> xfce4-terminal wunderbar. Ich vermute aber das bei dir einfach LANG
> falsch gesetzt ist.

Nun, als ich "damals" die entsprechenden terminals probiert habe, wurde
halt auf die unicode-varianten verwiesen. Das is nu mind. nen Jahr her,
okay...aber "meine" Howtos erzaehlen noch immer was von Dateinamen:

http://de.gentoo-wiki.com/Utf8#Dateinamen


Oh, und rate was ich eben in der muttrc fand...

set send_charset="UTF-8:ISO-8859-15:ISO-8859-1"

Da ist wohl was schiefgelaufen.. ^^


mfg
pepe
-- 
Hi, I'm a unix-virus.
Please copy me into your .signature to help me spread!



Reply to: