[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: sed: Problem mit Umlauten



Am Mittwoch, 28. März 2012 schrieb Martin Eberhard Schauer:
> >> Dann kamen die Osteuropäer, die Griechen, die Chinesen oder wen auch
> >> immer Du für andere "exotische" Schriftzeichen als Schuldigen dazu
> >> nehmen willst.  Deshalb wurde "utf-8" erfunden.  In "utf-8" werden
> >> "exotische Zeichen" wie z.B. das "ä" in zwei oder mehr Bytes
> >> kodiert.
> > 
> > Ein bis vier Byte, wenn ich mich recht entsinne. Das höchste Bit gibt
> > an, ob das Zeichen noch ein weiteres Byte benötigt. Daher gehen
> > ASCII-Zeichen in einem Byte.
> > 
> > Jup:
> > 
> > martin@merkaba:~>  echo "a">  /tmp/a
> > martin@merkaba:~>  echo "ä">  /tmp/ä
> > martin@merkaba:~>  hd /tmp/a
> > 00000000  61 0a                                             |a.|
> > 00000002
> > martin@merkaba:~>  hd /tmp/ä
> > 00000000  c3 a4 0a                                          |...|
> > 00000003
> > martin@merkaba:~>
> 
> Vielleicht gibt man 7 utf-8 zusätzliche Erkenntnisse.

Ja, in der Tat. Die Manpage kannte ich noch nicht.

Macht aber bei weitem nicht so viel Spaß, wie Ausprobieren ;).

Vom Grundprinzip entsprichts vom groben Überfliegen dem, was ich 
geschrieben hab.

Danke,
-- 
Martin 'Helios' Steigerwald - http://www.Lichtvoll.de
GPG: 03B0 0D6C 0040 0710 4AFA  B82F 991B EAAC A599 84C7


Reply to: