[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Wohin mit den eigenen init-Skripten?



Marc Haber <mh+debian-user-german@zugschlus.de> wrote:

> Bei mir werden Umlaute sogar bei en_US.UTF-8 richtig sortiert.

Ja, das dürfte daran liegen, dass Umlaute im Englischen wie der
entsprechende Buchstabe ohne Sonderzeichen betrachtet werden, siehe
mein Beispiel mit dänischen Umlauten, wo diese Sortierung versagt,
weil Umlaute im Dänischen am Ende des Alphabets stehen.

> Andererseits lässt sich das von Dir beobachtete Richtigeinsortieren
> der Umlaute bei de_DE bei mir nicht reproduziren, es muss schon
> de_DE.UTF-8 sein:

Zeigt locale -a bei Dir de_DE an? Vielleicht ist es gar nicht definiert.
Ich verwende noch ISO-8859-1 und da zeigt mir locale -a für de* an:

   martinkl@maurice:~$ locale -a | grep ^de
   de_DE
   de_DE@euro
   de_DE.iso88591
   de_DE.iso885915@euro
   deutsch

Das wurde von locale-gen so erzeugt.

> |[13/512]mh@swivel:~$ (LANG=C ; echo -e "a\nA\nb\nB\nä\n�??\n" | sort)
> |
> |A
> |B
> |a
> |b
> |Ã???
> |ä
> |[14/513]mh@swivel:~$ 

>> C sortiert meines Wissens nach ASCII-Order, also erst Großbuchstaben
>> ABC, usw. dann erst die Kleinbuchstaben abc,

> Nö, siehe oben.

Bezieht sich das "Nö" auf das Beispiel oben? Das ist so aber schon
richtig. In ASCII selbst gibt es ja keine Umlaute, sie folgen also
auf jeden Fall erst nach den Zeichen, die in ASCII definiert sind,
also oberhalb von Zeichen 127. Und in ASCII selbst stehen erst die
Groß- und dann die Kleinbuchstaben.

Der Begriff ASCII-Sortierung ist vielleicht unglücklich gewählt, weil
ASCII nur 7 bit hat, die Sortierung aber auch für 8-bit-Zeichen gilt.
damit ist aber nur gemeint, dass nach der Ordnungszahl der Zeichen in
der ASCII-Tabelle sortiert wird. Für Unicode gibt es m.W. eine eigene
Sortiervorschrift, bin mir aber nicht sicher und kenne sie auch nicht,
habe mich nie damit beschäftigt, da ich kein Unicode benutze.

Gerade in <https://en.wikipedia.org/wiki/ASCII#Order> gelesen:

   ASCII-code order is also called ASCIIbetical order.

;-)

Gruß, Martin


Reply to: