Re: sed: Problem mit Umlauten
Am Mittwoch, 28. März 2012 schrieb Martin Eberhard Schauer:
> >> Dann kamen die Osteuropäer, die Griechen, die Chinesen oder wen auch
> >> immer Du für andere "exotische" Schriftzeichen als Schuldigen dazu
> >> nehmen willst. Deshalb wurde "utf-8" erfunden. In "utf-8" werden
> >> "exotische Zeichen" wie z.B. das "ä" in zwei oder mehr Bytes
> >> kodiert.
> >
> > Ein bis vier Byte, wenn ich mich recht entsinne. Das höchste Bit gibt
> > an, ob das Zeichen noch ein weiteres Byte benötigt. Daher gehen
> > ASCII-Zeichen in einem Byte.
> >
> > Jup:
> >
> > martin@merkaba:~> echo "a"> /tmp/a
> > martin@merkaba:~> echo "ä"> /tmp/ä
> > martin@merkaba:~> hd /tmp/a
> > 00000000 61 0a |a.|
> > 00000002
> > martin@merkaba:~> hd /tmp/ä
> > 00000000 c3 a4 0a |...|
> > 00000003
> > martin@merkaba:~>
>
> Vielleicht gibt man 7 utf-8 zusätzliche Erkenntnisse.
Ja, in der Tat. Die Manpage kannte ich noch nicht.
Macht aber bei weitem nicht so viel Spaß, wie Ausprobieren ;).
Vom Grundprinzip entsprichts vom groben Überfliegen dem, was ich
geschrieben hab.
Danke,
--
Martin 'Helios' Steigerwald - http://www.Lichtvoll.de
GPG: 03B0 0D6C 0040 0710 4AFA B82F 991B EAAC A599 84C7
Reply to: