Re: sed: Problem mit Umlauten

To: debian-user-german@lists.debian.org
Subject: Re: sed: Problem mit Umlauten
From: Martin Steigerwald <Martin@lichtvoll.de>
Date: Wed, 28 Mar 2012 22:35:25 +0200
Message-id: <[🔎] 201203282235.25658.Martin@lichtvoll.de>
In-reply-to: <[🔎] 4F733989.2080803@gmx.de>
References: <[🔎] 201203280922.44293@inter.netz> <[🔎] 201203281908.48808.Martin@lichtvoll.de> <[🔎] 4F733989.2080803@gmx.de> (sfid-20120328_192743_867664_3DD426BD)

Am Mittwoch, 28. März 2012 schrieb Martin Eberhard Schauer:
> >> Dann kamen die Osteuropäer, die Griechen, die Chinesen oder wen auch
> >> immer Du für andere "exotische" Schriftzeichen als Schuldigen dazu
> >> nehmen willst.  Deshalb wurde "utf-8" erfunden.  In "utf-8" werden
> >> "exotische Zeichen" wie z.B. das "ä" in zwei oder mehr Bytes
> >> kodiert.
> > 
> > Ein bis vier Byte, wenn ich mich recht entsinne. Das höchste Bit gibt
> > an, ob das Zeichen noch ein weiteres Byte benötigt. Daher gehen
> > ASCII-Zeichen in einem Byte.
> > 
> > Jup:
> > 
> > martin@merkaba:~>  echo "a">  /tmp/a
> > martin@merkaba:~>  echo "ä">  /tmp/ä
> > martin@merkaba:~>  hd /tmp/a
> > 00000000  61 0a                                             |a.|
> > 00000002
> > martin@merkaba:~>  hd /tmp/ä
> > 00000000  c3 a4 0a                                          |...|
> > 00000003
> > martin@merkaba:~>
> 
> Vielleicht gibt man 7 utf-8 zusätzliche Erkenntnisse.

Ja, in der Tat. Die Manpage kannte ich noch nicht.

Macht aber bei weitem nicht so viel Spaß, wie Ausprobieren ;).

Vom Grundprinzip entsprichts vom groben Überfliegen dem, was ich 
geschrieben hab.

Danke,
-- 
Martin 'Helios' Steigerwald - http://www.Lichtvoll.de
GPG: 03B0 0D6C 0040 0710 4AFA  B82F 991B EAAC A599 84C7

Reply to:

References:
- sed: Problem mit Umlauten
  - From: Andre Tann <atann@alphasrv.net>
- Re: sed: Problem mit Umlauten
  - From: Martin Steigerwald <Martin@lichtvoll.de>
- Re: sed: Problem mit Umlauten
  - From: Martin Eberhard Schauer <Martin.E.Schauer@gmx.de>

Prev by Date: Re: NFS unmount, Stale NFS file handle, Nach Netzwerk trennung.
Next by Date: glib; welchen Wert hat XDG_DATA_DIRS?
Previous by thread: Re: sed: Problem mit Umlauten
Next by thread: Re: sed: Problem mit Umlauten
Index(es):
- Date
- Thread