Re: sed: Problem mit Umlauten
Am Mittwoch, 28. März 2012 schrieb Peter Funk:
> Dann kamen die Osteuropäer, die Griechen, die Chinesen oder wen auch
> immer Du für andere "exotische" Schriftzeichen als Schuldigen dazu
> nehmen willst. Deshalb wurde "utf-8" erfunden. In "utf-8" werden
> "exotische Zeichen" wie z.B. das "ä" in zwei oder mehr Bytes kodiert.
Ein bis vier Byte, wenn ich mich recht entsinne. Das höchste Bit gibt an,
ob das Zeichen noch ein weiteres Byte benötigt. Daher gehen ASCII-Zeichen
in einem Byte.
Jup:
martin@merkaba:~> echo "a" > /tmp/a
martin@merkaba:~> echo "ä" > /tmp/ä
martin@merkaba:~> hd /tmp/a
00000000 61 0a |a.|
00000002
martin@merkaba:~> hd /tmp/ä
00000000 c3 a4 0a |...|
00000003
martin@merkaba:~>
(das 0x0a ist der Zeilenvorschub)
--
Martin 'Helios' Steigerwald - http://www.Lichtvoll.de
GPG: 03B0 0D6C 0040 0710 4AFA B82F 991B EAAC A599 84C7
Reply to: