[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Wohin mit den eigenen init-Skripten?



Marc Haber <mh+debian-user-german@zugschlus.de> wrote:
> On Mon, 15 Feb 2016 00:25:01 +0100, Martin Klaiber <martinkl@zedat.fu-berlin.de> wrote:

>> Habe es nun korrigiert und es ist nun so, wie Du sagst, dass deutsche
>> Umlaute richtig sortiert werden. Nun frage ich mich aber, warum ist das
>> so? Deutsche Umlaute kommen in der Sprache doch gar nicht vor? Ist es
>> nur Zufall? Das wäre mir etwas zu instabil.

> Vielleicht ist es auch definiert, wo sollten Umlaute sonst woanders
> hin?

en_DK bedeutet ja: Englische Sprache in Dänemark, wenn ich die
Defintion der locale richtig verstanden habe. Im Englischen gibt es
aber keine deutschen Umlaute, im Dänischen auch nicht. Also ist die
Position der deutschen Umlaute eigentlich nicht definiert. Warum es
trotzdem funktioniert, darüber kann ich nur spekulieren.

Es gibt wohl mehrere Regelungen für das Sortieren von Strings auf
europäischer und internationaler Ebene, z.B. EOR/EN13710, vielleicht
ist es da geregelt, diese Normen kenne ich allerdings nicht.

In der englischen Wikipedia:

   https://en.wikipedia.org/wiki/Alphabetical_order#Modified_letters

fand ich folgenden Satz:

   In English, modified letters (such as those with diacritics) are
   treated the same as the base letter for alphabetical ordering
   purposes. For example, rôle comes between rock and rose, as if it
   were written role. However languages that use such letters
   systematically generally have their own ordering rules. See
   Language-specific conventions below.

Vielleicht funktioniert es also deshalb, weil die Engländer zwischen,
beispielsweise A und Ä nicht unterscheiden, und die Deutschen das Ä
nach dem A einsortieren, was zufällig kompatibel ist.
   
Im Dänischen gibt es, laut Wikipedia, drei Sonderzeichen, wovon zwei
unserem Ä und Ö ähnlich sind, nämlich das Æ und Ø, siehe:

   <https://de.wikipedia.org/wiki/D%C3%A4nische_Sprache#Das_d.C3.A4nische_Alphabet>

Die Dänen sortieren die Zeichen aber nicht hinter dem A und O ein,
sondern hinter dem Z. Führe ich den Test für das Æ (das unserem Ä
entspricht) durch, erhalte ich:

   martinkl@maurice:~$ (LANG=en_DK ; echo -e "A\nÆ\na\nB\b\n" | sort)
   
   a
   A
   Æ
   B
   martinkl@maurice:~$ (LANG=da_DK ; echo -e "A\nÆ\na\nB\b\n" | sort)
   
   A
   a
   B
   Æ

Hier sortiert en_DK also falsch, nämlich so, wie oben beschrieben. Die
Engländer behandeln das Æ also offenbar tatsächlich wie ein A.

>> Funktioniert das bei Dir tatsächlich, dass Du mit en_DK ein deutsches
>> Datum erhältst?

> Nein, Du hast Recht. Das ist mir auch ganz recht. Am liebsten hätte
> ich ja ISO-8601-kompatibles Datum, also 2016-02-16.

Ja, das fände ich auch gut. Kann man sich ja aber mit einem alias
leicht basteln. So etwas:

   martinkl@maurice:~$ date --rfc-3339=d
   2016-02-16
   martinkl@maurice:~$ date --rfc-3339=s
   2016-02-16 15:31:28+01:00

reicht vielleicht schon, ansonsten kann man sich über den FORMAT-String
von date das ja fast beliebig hinbiegen.

Gruß, Martin


Reply to: