[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Wohin mit den eigenen init-Skripten?



Marc Haber <mh+debian-user-german@zugschlus.de> wrote:
> On Sun, 14 Feb 2016 18:18:28 +0100, Martin Klaiber <martinkl@zedat.fu-berlin.de> wrote:
>> Marc Haber <mh+debian-user-german@zugschlus.de> wrote:

>>> en_DK.utf8 hat den Vorteil, dass Datums- und Zeitformate stimmen.

>> Funktioniert damit das Sortieren deutscher Umlaute, usw?

> Ist mir jedenfalls nie anders aufgefallen. Magst mir mal eine
> Kommandozeile geben, die das testet?

Nur ein kurzer Test, sorry, bin gerade knapp bei Zeit:

   martinkl@maurice:~$ (LANG=de_DE ; echo -e "a\nA\nb\nB\nä\nÄ\n" | sort)

   a
   A
   ä
   Ä
   b
   B

   martinkl@maurice:~$ (LANG=en_DK ; echo -e "a\nA\nb\nB\nä\nÄ\n" | sort)
   
   A
   B
   a
   b
   Ä
   ä

Das sieht für mich erstmal so aus, als würden deutsche Umlaute nicht
richtig sortiert, müsste man sich aber vielleicht nochmal detaillierter
anschauen.

>> root steht bei mir aber auf LANG=C, weil die Software unterschiedlich
>> weit lokalisiert ist.

> Warum nicht en_US.utf8? Ich frage das aus ernsthaftem Interesse, weil
> ich diesen Bereich nie richtig verstanden habe.

C sortiert meines Wissens nach ASCII-Order, also erst Großbuchstaben
ABC, usw. dann erst die Kleinbuchstaben abc, usw. en_US sortiert
vermutlich alphabetisch (habe es nicht getestet, sorry, mir fehlt
gerade die Zeit), also wie im Wörterbuch: AaBbCc, usw. Das kann bei
traditionellen Programmen zu Problemen führen. Sollte es zwar nicht,
aber verlassen würde ich mich auch nicht darauf.

Siehe z.B. auch das hier (erster Treffer bei google, da gibt es sicher
noch mehr/besseres):

   <http://teaching.idallen.org/net2003/06w/notes/character_sets.txt>

Gruß, Martin


Reply to: