[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Charset in Mutt



On Sun, Aug 17, 2003 at 05:55:17AM +0200, Bernd Brodesser wrote:
> * Andreas Pakulat schrieb am 17.Aug.2003:
> > On 17.Aug 2003 - 00:55:04, Thorsten Haude wrote:
> > > * Andreas Pakulat <ap125@informatik.uni-rostock.de> [2003-08-17 00:28]:
> > > >On 17.Aug 2003 - 00:14:17, Thorsten Haude wrote:
> > > >> * Andreas Pakulat <ap125@informatik.uni-rostock.de> [2003-08-16 21:57]:
> > > >> >Du suchst send_charset und das sollte auf einem deutschen System so
> > > >> >aussehen: 
> > > >> >
> > > >> >set send_charset="us-ascii:iso-8859-1:iso-8859-15"
> > > >> >
> > > >> >Damit immer der kleinstmögliche Zeichensatz benutzt wird.
> > > >> 
> > > >> Warum ist iso-8859-1 kleiner als iso-8859-15? Wie soll Mutt erkennen,
> > > >> welchen Du benutzen willst?
> > > >
> > > >Nunja, nicht kleiner im Sinne einer Menge, aber du kannst mit latin9
> > > >(iso-8859-1) ein Zeichen mehr darstellen nämlich das ?.
> 
> Du meinst latin9 (iso-8859-15) iso-8859-1 entspricht doch latin1,
> oder?

Genau. Das war wohl ein Fipptehler.

> Allerdings kommt Thorstens Zitat von Deinem Zeichen immer als ?
> an.

                \ /
Andreas hat ein  O verschickt. Thorsten verwendet wahrscheinlich als
                / \
locale de_DE@euro und kann damit dieses Zeichen nicht anzeigen.
Deswegen wurde daraus dann ein Fragezeichen.

> Dein Eurozeichen bekomme ich nur, wenn ich die Orginalmail lese,

In Andreas seiner Mail war kein Euro drin, da sie als latin1 und nicht
als latin9 ausgewiesen war.

> > > >Erkennen tut mutt das einfach indem er die Mail einliest und bei dem
> > > >? sieht das es der Code des Eurozeichens ist. Das kann aber mit
> > > >iso-8859-1 nicht dargestellt werden, also nutzt mutt latin9.
> > > 
> > > Also läßt sich das ¤ mit Mutt überhaupt nicht verschicken?
                         ^
			 Im Original stand da ein Euro,
			 inzwischen ist ein Währungszeichen drauß
			 geworden.

> > Natürlich, indem du utf-8 nimmst. Bei mir ist 
> > send_charset="us-ascii:iso-8859-1:iso-8859-15:utf-8" und damit kann ich
> > eine ganze Menge mehr darstellen als einige Leute hier überhaupt lesen
> > können. Nur von diesem System per ssh leider nicht, der kriegt gradso
> > die Umlaute hin ;(
> 
> So, jetzt noch mal ganz langsam zum Verstehen: mutt liest ein
> Zeichen. Das ist erst mal kein A oder B oder so, sondern ein Byte.
> Also in diesem Fall 65 oder 66 bzw. 0x41 oder 0x42. Das
> interpretiert mutt nun als A oder B usw. Wenn da aber nun das Byte
> 164 bzw. 0xa4 ankommt, was macht mutt dann? Nach iso-8859-1 ist es
> das Währungszeichen, einen Kreis mit vier kleinen Strichen in den
> Diagonalen. Nach iso-8859-15 ist es das Eurozeichen. Was aber nimmt
> mutt nun?

Mutt weiß welche locale Du verwendest. Wenn Du de_DE@euro verwendest
ist es ein Euro und wenn Du de_DE verwendest, ist es das
Währungszeichen.

> Im Übrigen habe ich gerade durch lesen der Manpage festgestellt, daß
> in meinem xterm immer das Eurozeichen dargestellt wird, auch ohne
> ssh und screen. Auch wenn da das Währungszeichen stehen sollte.

Mit de_DE@euro und dem entsprechenden Font kannst Du das
Währungszeichen nicht anzeigen. An der Stelle im Font steht
schließlich das Euro-Zeichen. Wenn Du beides anzeigen können willst,
mußt Du unicode verwenden.

> Ich habe jetzt in meinem .muttrc folgendes eingetragen:
> 
> set   charset="us-ascii:iso-8859-1:iso-8859-15:utf-8"
> set   send_charset="us-ascii:iso-8859-1:iso-8859-15:utf-8"
> 
> Ich hoffe, daß das Sinnvoll ist. Wobei der ASCII Zeichensatz ja
> Bestandteil der drei anderen ist.

Das send_charset ist so sicher sinnvoll. Das charset aber nicht.
Charset gibt an, welcher Zeichensatz auf Deinem System verwendet wird.
Das wird bei Dir wahrscheinlich iso-8859-15 sein. Also mußt Du
entweder 'set charset="iso-8859-15"' verwenden, oder die Variable gar
nicht setzen. Mutt erkennt dann automatisch welchen Zeichensatz Du
verwendest. Die Variable ist nur für den Fall, daß das nicht
funktioniert. Das wird Dir aber auf Linux nicht passieren. Ich habe
das bisher erst einmal gesehen, und das war unter Solaris.

Mit den charset so wie oben passiert dann sowas:
| Content-Type: text/plain;
|         charset="us-ascii:iso-8859-1:iso-8859-15:utf-8"

Und das ist definitiv nicht richtig.


Daniel

Attachment: pgpscaUvjZbXk.pgp
Description: PGP signature


Reply to: