[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Unstable auf UTF-8 umstellen?



#include <hallo.h>
* Christian Schult [Sat, Nov 26 2005, 02:17:55PM]:

> Mails verschiedener Mailprogramme:
> 
> http://www.snorg.de/shot1.jpg

Unter der Annahme, dass der Mail-Inhalt korrekt sei, ist es ordentliches
UTF-8 im Terminal selbst, aber kaputte Darstellung. Terminal geht von
Latin aus, IMO.

> http://www.snorg.de/shot2.jpg
> http://www.snorg.de/shot3.jpg

Das gleiche. Bring dem Terminal bitte UTF-8 bei. Ggf. mit uxterm testen
oder rxvt-unicode ("LC_CTYPE=de_DE.UTF-8 urxvt").

> > Kannst du dir die Mail mit less anschauen? Also aus mutt heraus in eine
> > Datei speichern und dann mit less anschauen. Wenn das auch kaputt
> > aussieht ists der Font, sonst koennte es tatsaechlich ein Problem in
> > mutt sein, oder aber die Mail ist kaputt. Es gibt naemlich auch Leute
> > die Mails als utf-8 deklarieren und dann tatsaechlich den Text als was
> > anderes kodieren (z.B. latin1) oder umgedreht. Im 1. Fall fehlen
> > Zeichen, im 2. haettest du statt Umlauten 2 kryptische Zeichen stehen.
> 
> Das Ergebnis ist verwirrend.
> 
> Die Mail im Bild shot3.jpg wird in einer UTF-8-Umgebung mit
> less nur teilweise korrekt dargestellt (ein ? (o-Umlaut) wird korrekt

Wo denn?

> dargestellt, ein ? (sz) als <9F>. Setze ich die Umgebungsvariable

Ein ß in Unicode, ja. Less zeigt es bei inkorrekter Konfiguration so an.

> LESSCHARSET auf utf-8 statt latin1, wird mit less in dieser Mail

LESSCHARSET-Variable ist ein böser Hack aus der Zeit, bevor es locales
unterstützte, davon würde ich die finger lassen. Sprich: weg damit, less
soll konsistent zum Rest der Programme (LC_CTYPE) arbeiten.

> alles korrekt angezeigt.

Was hast du denn erwartet? UTF-8-kodierte Mail im Latin1-Modus korrekt
angucken?

> Die Mail im Bild shot1.jpg kann ich mit less ansehen mit korrekten
> Umlauten egal ob LESSCHARSET auf latin1 oder utf-8 gesetzt ist.
> 
> Die Mail in shot2.jpg ist quoted printable kodiert und damit mit
> less eh nicht korrekt darstellbar.

Entschuldigung, was hast du davon, den Body der Mail (roh) ohne
entsprechender Konversion zu betrachten? Nichts, gar nichts -- dieser
"Test" ist vollkommen sinnlos. Dein Mail-Programm hat für die Konversion
zwischen der Kodierung des Mail-Inhaltes und der der Lokale (LC_CTYPE)
zu sorgen und dein Terminal für die Anzeige des erwarteten Zeichensatzes
mit den richtigen Buchstaben (an diesem Punkt musst _du_ ggf. etwas
einstellen, z.B. LC_CTYPE vor dem Start von rxvt-unicode).

> Ich stelle gerade fest, dass ich in einer UTF-8-Umgebung kein ?
> (sz) in konsole eintippen kann, dargestellt werden kann das
> Zeichen aber. Wenn ich ein ? (sz) eingebe erscheint nur ein
> kleiner rechteckiger Rahmen.

Deine Lokale oder Lokale-Einstellung ist kaputt. Bash akzeptiert
non-ascii sehr wohl, wenn LC_CTYPE vor oder während des Starts (.bashrc
z.B.) ordentlich gesetzt wird.

> Und nochwas ist verwirrend: Zwischendurch hat es schon beinahe
> geklappt. Da wurden UTF-8-Mails korrekt in mutt angezeigt, aber
> latin1- oder latin15-Mails nicht. Ich stelle immer nur die locales
> um, logge mich aus und ein und starte X+KDE neu. Ich sehe da keine
> Logik drin, ist eher wie Voodoo.

Wo stellst du sie um und zu welchem Zeitpunkt wird die Einstellung _wo_
übernommen? Wenn du das verstanden hast, löst du auch deine Probleme.

Eduard.
-- 
[Londo asks a visiting Technomage for a prophecy]
Elric: As I look at you, Ambasador Mollari, I see a great hand reaching out of
the stars. And I hear sounds; the sounds of billions of people calling out your
name.
Ambassador Londo Mollari: My followers?
Elric: Your victims.
                                                 -- Quotes from Babylon 5 --



Reply to: