[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: auf UTF-8 umsteigen, Folgen?



Andreas Pakulat:
> On 11.07.06 22:45:07, Jochen Schulz wrote:
> > 
> > Ich habe aufgrund des kürzlich erwähnten Datenverlustes den
> > Etch-Installer ausprobiert (mit GUI!!elf) und der stellt ja automatisch
> > UTF-8 ein.
> 
> Achja? Ich war bisher der Meinung dass er dpkg-reconfigure locales
> ausfuehrt und du dann waehlen kannst. Aber ich hab auch noch nie Etch
> installiert...

IIRC war da nur am Anfang das Menü mit der Auswahl von Sprache und
Keyboard-Layout. Ich habe Englisch mit deutschem Layout gewählt und
bekam en_US.UTF8. Ist aber natürlich im Nachhinein leicht umzustellen.

> > Ich hatte aber dann das Problem, dass eine SSH-Session auf
> > ein ISO-8859-1-System furchtbar kaputt aussah.
> 
> Kannst du das etwas genauer beschreiben?

IIRC sah es nach "UTF8 als ISO interpretiert" aus. Umlaute oder
Ähnliches wurden als zwei "merkwürdige" Zeichen dargestellt. Ich kann
das grade nicht wiederholen, weil mein Notebook noch in Holland ist (und
ich momentan an einem Windows sitze).

> > Ich vermute auch, dass
> > mein mutt auf ebendiesem System falsch kodierte Mails rausgeschickt hat
> > (UTF-8 als ISO-8859-1),
> 
> Deine Mail auf die ich geantwortet habe war UTF-8 deklariert und soweit ich
> das gesehen habe auch genauso kodiert. Nur das das eben nicht unbedingt
> immer sinnvoll ist, insbesondere wenn man mit Leuten kommuniziert die
> "kaputte" Mailclients oder Webmailer benutzen.

Hm? Wo genau war die Deklaration? Ich sehe hier nur

MIME-Version: 1.0
Content-Type: multipart/signed; micalg=pgp-sha1;
        protocol="application/pgp-signature";
        boundary="+SfteS7bOf3dGlBC"
Content-Disposition: inline

Kann sein, dass GnuPG irgendwas umkodiert. Eine unsignierte Mail sieht
bei mir so aus:

MIME-Version: 1.0
Content-Type: text/plain; charset=iso-8859-1
Content-Disposition: inline
Content-Transfer-Encoding: 8bit

Die gpg manpage ist nicht so furchtbar aufschlussreich, was das angeht.
"Some strings" werden nach UTF-8 konvertiert. Die Signatur kanns aber
eigentlich nicht sein, die ist ja US-ASCII. Vielleicht passiert das auf
Deiner Seite?

> > wenn ich die per SSH vom UTF-System geschrieben
> > habe. Muß ich da irgendwas machen, damit ich keine Probleme kriege?
> > Liegt das am Terminal, oder hätte ich screen (in dem mutt läuft) neu
> > starten müssen?
> 
> Aenderungen an Umgebungsvariablen werden erst nach einem Re-Login
> erkannt.

Ich habe ja keine Variablen geändert. Ich möchte nur eine
Terminalsession von einem UTF-System auf ein ISO-System. :)

(Hintergrund: auf dem ISO-System laufen Anwendungen, die immer noch kein
 UTF-8 können. Slrn zum Bleistift. Sonst würde ich alles umstellen.)

> Ich hab grad mal getestet: Eine mit vim erzeugte Datei auf dem Server
> (auf dem LANG=de_DE) kriegt als Kodierung trotzdem UTF-8 (auf dem Client
> ist LANG=de_DE.UTF-8). Eine in mutt verfasste Mail (mit vim als Editor)
> wird in Latin1 kodiert und verschickt.

Klingt merkwürdig. Aber das wird daran liegen, dass mutt nochmal
rekodiert. Ist ja auch vernünftig.

> Ansonsten werden Meldungen von Programmen wohl auch in Latin1
> ausgegeben, ssh scheint das hier nicht korrekt zu konvertieren (also
> sehe ich Rauten statt Umlaute und es fehlt das nachfolgende Zeichen).

Ich weiß auch nicht, ob das die Aufgabe von ssh, dem Terminal, screen
oder sonstwem ist. Zeichensätze und Kodierungen sollen bitte einfach
funktionieren. :)

J.
-- 
When standing at the top of beachy head I find the rocks below very
attractive.
[Agree]   [Disagree]
                 <http://www.slowlydownward.com/NODATA/data_enter2.html>

Attachment: signature.asc
Description: Digital signature


Reply to: