[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [RFR] man://manpages-de/utf-8.7



Hallo Chris,

danke für den zweiten Blick.

Nebenbei bemerkt: Tobias hat heute wieder eine neue Version der
manpages losgelassen.

Gruß
  Martin

*****************************************************************************

>> #. type: Plain text
>> #: source/utf-8.7:100
>> msgid "All possible 2^31 UCS codes can be encoded using B<UTF-8>>."
>> msgstr "Alle möglichen 2^31 B<UCS>>-Zeichen können mit B<UTF-8>> kodiert werden."
>>
>> C: s/B<UCS>>/UCS/
>> M: Ist an dieser Stelle zwar anders ausgezeichnet als im Original, aber es
>> M: erscheint mir so konsistent. Und du hast diverse andere abweichende
>> M: Markups nicht bemängelt.

C: Dann habe ich diese anderen Markups sicher übersehen. Ich finde, man sollte
C: solche Formatierungen entweder dem Original anpassen oder ggf. den
C: Originalautor auf die falsche oder uneinheitliche Texthervorhebung hinweisen. M: Ich verstehe nicht ganz, warum ich die gleichen Fehler nachmachen soll. Ich
M: habe Upstream eine Mail (mit Patch) geschrieben.

>>
>> #. type: Plain text
>> #: source/utf-8.7:115
...
M: Jetzt habe ich es auch verstanden.

>>>> #. type: Plain text
>> #: source/utf-8.7:168

C: Soweit ich mich einnere, hatte ich diesen Link angegeben
C: http://de.wikipedia.org/wiki/Multibyte_Character_Set
M: Das hast du getan. Auch hier ist der Groschen jetzt gefallen.
--- utf-8.7.po.3	2011-02-26 18:41:46.000000000 +0100
+++ utf-8.7.po	2011-02-27 18:26:29.000000000 +0100
@@ -126,7 +129,7 @@
 "Die B<UCS>-Zeichen 0x00000000 bis 0x0000007f (die klassischen B<US-ASCII>-"
 "Zeichen) werden einfach als die Bytes 0x00 bis 0x7f kodiert und auf diese "
 "Weise die B<ASCII>-Kompatibilität hergestellt. Dateinamen und Zeichenketten, "
-"die nur aus 7-Bit--ASCII-Zeichen bestehen, haben darum unter B<ASCII> und "
+"die nur aus 7-Bit-B<ASCII>-Zeichen bestehen, haben darum unter B<ASCII> und "
 "B<UTF-8> dieselbe Kodierung."
 
 #. type: Plain text
@@ -169,8 +172,9 @@
 "the range 0x80 to 0xbf.  This allows easy resynchronization and makes the "
 "encoding stateless and robust against missing bytes."
 msgstr ""
-"Das erste Byte einer Folge mehrerer Bytes, die ein einzelnes Nicht-B<ASCII>-"
-"B<UCS>-Zeichen darstellen, ist grundsätzlich im Bereich 0xc0 bis 0xfd und "
+"Das erste Byte einer Multibyte-Folge, die ein einzelnes nicht in B<ASCII> "
+"enthaltenes B<UCS>-Zeichen darstellt, ist grundsätzlich im Bereich 0xc0 bis "
+"0xfd und "
 "zeigt die Länge der Folge an. Alle anderen Bytes der Folge sind im Bereich "
 "0x80 bis 0xbf. Dadurch wird eine einfache Neusynchronisierung ermöglich, da "
 "die Kodierung zustandslos und daher robust gegenüber fehlenden oder verloren "
@@ -276,8 +280,8 @@
 "sequence which can represent the code number of the character can be used."
 msgstr ""
 "Die I<xxx>-Bits werden durch den Code des Zeichens in Binärdarstellung "
-"ersetzt. Es wird die jeweils kürzeste Byte-Folge benutzt, die den Code des "
-"Zeichens darstellen kann."
+"ersetzt. Es wird die jeweils kürzeste Multibyte-Folge benutzt, die den "
+"Code des Zeichens darstellen kann."
 
 #. type: Plain text
 #: source/utf-8.7:175
@@ -286,9 +290,10 @@
 "0xfffe and 0xffff (UCS noncharacters) should not appear in conforming B<UTF-"
 "8> streams."
 msgstr ""
-"Die B<UCS>-Codewerte 0xd800\\(en0xdfff (UTF-16-Ersatzzeichen) sowie 0xfffe "
-"und 0xffff (in B<UCS> keinem Zeichen zugeordnet; B<UCS> noncharacters) "
-"sollten nicht in standardkonformen B<UTF-8>-Datenströmen enthalten sein."
+"Die B<UCS>-Codewerte 0xd800\\(en0xdfff (B<UTF-16>-Ersatzzeichen) sowie "
+"0xfffe und 0xffff (in B<UCS> keinem Zeichen zugeordnet; B<UCS> "
+"noncharacters) sollten nicht in standardkonformen B<UTF-8>-Datenströmen "
+"enthalten sein."
 
 #. type: SS
 #: source/utf-8.7:175
# German translation of manpages
# This file is distributed under the same license as the manpages-de package.
# Copyright © of this file:
# Patrick Rother <krd@gulu.net>
# Martin Eberhard Schauer <Martin.E.Schauer@gmx.de>, 2010.
msgid ""
msgstr ""
"Project-Id-Version: manpages-de\n"
"POT-Creation-Date: 2010-12-09 19:10+0100\n"
"PO-Revision-Date: 2010-12-09 19:31+0100\n"
"Last-Translator: Martin Eberhard Schauer <Martin.E.Schauer@gmx.de>\n"
"Language-Team: German <debian-l10n-german@lists.debian.org>\n"
"MIME-Version: 1.0\n"
"Content-Type: text/plain; charset=UTF-8\n"
"Content-Transfer-Encoding: 8bit\n"
"X-Generator: KBabel 1.11.4\n"

#. type: TH
#: source/utf-8.7:30
#, no-wrap
msgid "UTF-8"
msgstr "UTF-8"

#. type: TH
#: source/utf-8.7:30
#, no-wrap
msgid "2001-05-11"
msgstr "11. Mai 2001"

#. type: TH
#: source/utf-8.7:30
#, no-wrap
msgid "GNU"
msgstr "GNU"

#. type: TH
#: source/utf-8.7:30
#, no-wrap
msgid "Linux Programmer's Manual"
msgstr "Linux-Programmierhandbuch"

#. type: SH
#: source/utf-8.7:31
#, no-wrap
msgid "NAME"
msgstr "BEZEICHNUNG"

#. type: Plain text
#: source/utf-8.7:33
msgid "UTF-8 - an ASCII compatible multibyte Unicode encoding"
msgstr "UTF-8 - eine ASCII-kompatible Multibyte-Unicode-Kodierung"

#. type: SH
#: source/utf-8.7:33
#, no-wrap
msgid "DESCRIPTION"
msgstr "BESCHREIBUNG"

# FIXME: Such strings can contain as parts
# FIXME: 31-bit code space
#. type: Plain text
#: source/utf-8.7:57
msgid ""
"The B<Unicode 3.0> character set occupies a 16-bit code space.  The most "
"obvious Unicode encoding (known as B<UCS-2>)  consists of a sequence of 16-"
"bit words.  Such strings can contain as parts of many 16-bit characters bytes "
"like \\(aq\\e0\\(aq or \\(aq/\\(aq which have a special meaning in filenames "
"and other C library function arguments.  In addition, the majority of Unix "
"tools expects ASCII files and can't read 16-bit words as characters without "
"major modifications.  For these reasons, B<UCS-2> is not a suitable external "
"encoding of B<Unicode> in filenames, text files, environment variables, etc.  "
"The B<ISO 10646 Universal Character Set (UCS)>, a superset of Unicode, "
"occupies even a 31-bit code space and the obvious B<UCS-4> encoding for it (a "
"sequence of 32-bit words) has the same problems."
msgstr ""
"Der B<Unicode-3.0>-Zeichensatz ist durch 16-Bit-Wörter definiert. Die "
"einfachste Unicode-Kodierung (B<UCS-2>) besteht aus einer Folge von 16-Bit-"
"Zeichen. Solche Zeichenketten können als Bestandteile viele 16-Bit-Zeichen "
"wie \\(aq\\e0\\(aq oder \\(aq/\\(aq enthalten, die z. B. in Dateinamen und "
"anderen Argumenten von C-Bibliotheksfunktionen eine besondere Bedeutung "
"haben. AuÃ?erdem arbeiten die "
"meisten UNIX-Programme mit B<ASCII>-Dateien und können 16-Bit-Wörter nicht "
"ohne grö�ere �nderungen verarbeiten. Darum ist B<UCS-2> keine geeignete "
"externe Kodierung von B<Unicode> in Dateinamen, Text-Dateien, "
"Umgebungsvariablen usw. Der B<ISO 10646 Universal Character Set (UCS)>, eine "
"Erweiterung von B<Unicode>, wird sogar durch 31-Bit-Wörter definiert. Die "
"zugehörige B<UCS-4>-Kodierung (eine Folge von 32-Bit-Wörtern) leidet unter "
"denselben Problemen wie die B<UCS-2>-Kodierung."

#. type: Plain text
#: source/utf-8.7:67
msgid ""
"The B<UTF-8> encoding of B<Unicode> and B<UCS> does not have these problems "
"and is the common way in which B<Unicode> is used on Unix-style operating "
"systems."
msgstr ""
"Die B<UTF-8>-Kodierung von B<Unicode> und B<UCS> hat diese Probleme nicht. "
"Sie ist der gebräuchliche Anwendungsfall des B<Unicode>-Zeichensatzes auf "
"unixoiden Betriebssystemen."

#. type: SS
#: source/utf-8.7:67
#, no-wrap
msgid "Properties"
msgstr "Eigenschaften"

#. type: Plain text
#: source/utf-8.7:71
msgid "The B<UTF-8> encoding has the following nice properties:"
msgstr "Die B<UTF-8>-Kodierung hat die folgenden netten Eigenschaften:"

#. type: TP
#: source/utf-8.7:71 source/utf-8.7:83 source/utf-8.7:91 source/utf-8.7:96
#: source/utf-8.7:100 source/utf-8.7:105 source/utf-8.7:115
#, no-wrap
msgid "*"
msgstr "*"

# FIXME: rewording?
# FIXME: use of ascii (bold etc.)
#. type: Plain text
#: source/utf-8.7:83
msgid ""
"B<UCS> characters 0x00000000 to 0x0000007f (the classic B<US-ASCII> "
"characters) are encoded simply as bytes 0x00 to 0x7f (ASCII compatibility).  "
"This means that files and strings which contain only 7-bit ASCII characters "
"have the same encoding under both B<ASCII> and B<UTF-8>."
msgstr ""
"Die B<UCS>-Zeichen 0x00000000 bis 0x0000007f (die klassischen B<US-ASCII>-"
"Zeichen) werden einfach als die Bytes 0x00 bis 0x7f kodiert und auf diese "
"Weise die B<ASCII>-Kompatibilität hergestellt. Dateinamen und Zeichenketten, "
"die nur aus 7-Bit-B<ASCII>-Zeichen bestehen, haben darum unter B<ASCII> und "
"B<UTF-8> dieselbe Kodierung."

#. type: Plain text
#: source/utf-8.7:91
msgid ""
"All B<UCS> characters greater than 0x7f are encoded as a multibyte sequence "
"consisting only of bytes in the range 0x80 to 0xfd, so no ASCII byte can "
"appear as part of another character and there are no problems with, for "
"example, \\(aq\\e0\\(aq or \\(aq/\\(aq."
msgstr ""
"Alle B<UCS>-Zeichen über 0x7f werden als Folge mehrerer Bytes im Bereich 0x80 "
"bis 0xfd dargestellt, so dass kein B<ASCII>-Byte als Teil eines anderen "
"Zeichens auftritt und es keine Probleme z.B. mit \\(aq\\e0\\(aq oder \\(aq/"
"\\(aq gibt."

#. type: Plain text
#: source/utf-8.7:96
msgid "The lexicographic sorting order of B<UCS-4> strings is preserved."
msgstr ""
"Die lexikographische Sortierreihenfolge von B<UCS-4>-Zeichenketten bleibt "
"erhalten."

#. type: Plain text
#: source/utf-8.7:100
msgid "All possible 2^31 UCS codes can be encoded using B<UTF-8>."
msgstr "Alle möglichen 2^31 B<UCS>-Zeichen können mit B<UTF-8> kodiert werden."

#. type: Plain text
#: source/utf-8.7:105
msgid "The bytes 0xfe and 0xff are never used in the B<UTF-8> encoding."
msgstr ""
"Die Bytes 0xfe und 0xff werden von der B<UTF-8>-Kodierung nicht verwendet."

#. type: Plain text
#: source/utf-8.7:115
msgid ""
"The first byte of a multibyte sequence which represents a single non-ASCII "
"B<UCS> character is always in the range 0xc0 to 0xfd and indicates how long "
"this multibyte sequence is.  All further bytes in a multibyte sequence are in "
"the range 0x80 to 0xbf.  This allows easy resynchronization and makes the "
"encoding stateless and robust against missing bytes."
msgstr ""
"Das erste Byte einer Multibyte-Folge, die ein einzelnes nicht in B<ASCII> "
"enthaltenes B<UCS>-Zeichen darstellt, ist grundsätzlich im Bereich 0xc0 bis "
"0xfd und "
"zeigt die Länge der Folge an. Alle anderen Bytes der Folge sind im Bereich "
"0x80 bis 0xbf. Dadurch wird eine einfache Neusynchronisierung ermöglich, da "
"die Kodierung zustandslos und daher robust gegenüber fehlenden oder verloren "
"gegangenen Bytes ist."

#. type: Plain text
#: source/utf-8.7:125
msgid ""
"B<UTF-8> encoded B<UCS> characters may be up to six bytes long, however the "
"B<Unicode> standard specifies no characters above 0x10ffff, so Unicode "
"characters can only be up to four bytes long in B<UTF-8>."
msgstr ""
"B<UTF-8>-kodierte B<UCS>-Zeichen können bis zu sechs Byte lang sein. Da aber "
"die B<Unicode>-Norm keine Zeichen über 0x10FFFF spezifiziert, können Unicode-"
"Zeichen in B<UTF-8> nur bis zu vier Byte lang sein."

#. type: SS
#: source/utf-8.7:125
#, no-wrap
msgid "Encoding"
msgstr "Kodierung"

#. type: Plain text
#: source/utf-8.7:128
msgid ""
"The following byte sequences are used to represent a character.  The sequence "
"to be used depends on the UCS code number of the character:"
msgstr ""
"Die folgenden Byte-Folgen werden für die Darstellung eines Zeichens "
"verwendet. Die zu verwendende Folge hängt vom B<UCS>-Code des Zeichens ab:"

#. type: TP
#: source/utf-8.7:128
#, no-wrap
msgid "0x00000000 - 0x0000007F:"
msgstr "0x00000000 - 0x0000007F:"

#. type: Plain text
#: source/utf-8.7:131
msgid "0I<xxxxxxx>"
msgstr "0I<xxxxxxx>"

#. type: TP
#: source/utf-8.7:131
#, no-wrap
msgid "0x00000080 - 0x000007FF:"
msgstr "0x00000080 - 0x000007FF:"

#. type: Plain text
#: source/utf-8.7:135
msgid "110I<xxxxx> 10I<xxxxxx>"
msgstr "110I<xxxxx> 10I<xxxxxx>"

#. type: TP
#: source/utf-8.7:135
#, no-wrap
msgid "0x00000800 - 0x0000FFFF:"
msgstr "0x00000800 - 0x0000FFFF:"

#. type: Plain text
#: source/utf-8.7:140
msgid "1110I<xxxx> 10I<xxxxxx> 10I<xxxxxx>"
msgstr "1110I<xxxx> 10I<xxxxxx> 10I<xxxxxx>"

#. type: TP
#: source/utf-8.7:140
#, no-wrap
msgid "0x00010000 - 0x001FFFFF:"
msgstr "0x00010000 - 0x001FFFFF:"

#. type: Plain text
#: source/utf-8.7:146
msgid "11110I<xxx> 10I<xxxxxx> 10I<xxxxxx> 10I<xxxxxx>"
msgstr "11110I<xxx> 10I<xxxxxx> 10I<xxxxxx> 10I<xxxxxx>"

#. type: TP
#: source/utf-8.7:146
#, no-wrap
msgid "0x00200000 - 0x03FFFFFF:"
msgstr "0x00200000 - 0x03FFFFFF:"

#. type: Plain text
#: source/utf-8.7:153
msgid "111110I<xx> 10I<xxxxxx> 10I<xxxxxx> 10I<xxxxxx> 10I<xxxxxx>"
msgstr "111110I<xx> 10I<xxxxxx> 10I<xxxxxx> 10I<xxxxxx> 10I<xxxxxx>"

#. type: TP
#: source/utf-8.7:153
#, no-wrap
msgid "0x04000000 - 0x7FFFFFFF:"
msgstr "0x04000000 - 0x7FFFFFFF:"

#. type: Plain text
#: source/utf-8.7:161
msgid "1111110I<x> 10I<xxxxxx> 10I<xxxxxx> 10I<xxxxxx> 10I<xxxxxx> 10I<xxxxxx>"
msgstr "1111110I<x> 10I<xxxxxx> 10I<xxxxxx> 10I<xxxxxx> 10I<xxxxxx> 10I<xxxxxx>"

#. type: Plain text
#: source/utf-8.7:168
msgid ""
"The I<xxx> bit positions are filled with the bits of the character code "
"number in binary representation.  Only the shortest possible multibyte "
"sequence which can represent the code number of the character can be used."
msgstr ""
"Die I<xxx>-Bits werden durch den Code des Zeichens in Binärdarstellung "
"ersetzt. Es wird die jeweils kürzeste Multibyte-Folge benutzt, die den "
"Code des Zeichens darstellen kann."

#. type: Plain text
#: source/utf-8.7:175
msgid ""
"The B<UCS> code values 0xd800\\(en0xdfff (UTF-16 surrogates) as well as "
"0xfffe and 0xffff (UCS noncharacters) should not appear in conforming B<UTF-"
"8> streams."
msgstr ""
"Die B<UCS>-Codewerte 0xd800\\(en0xdfff (B<UTF-16>-Ersatzzeichen) sowie "
"0xfffe und 0xffff (in B<UCS> keinem Zeichen zugeordnet; B<UCS> "
"noncharacters) sollten nicht in standardkonformen B<UTF-8>-Datenströmen "
"enthalten sein."

#. type: SS
#: source/utf-8.7:175
#, no-wrap
msgid "Example"
msgstr "Beispiel"

#. type: Plain text
#: source/utf-8.7:180
msgid ""
"The B<Unicode> character 0xa9 = 1010 1001 (the copyright sign) is encoded in "
"UTF-8 as"
msgstr ""
"Das B<Unicode>-Zeichen 0xa9 = 1010 1001 (das Copyright-Zeichen) wird in B<UTF-"
"8> als"

#. type: Plain text
#: source/utf-8.7:183
msgid "11000010 10101001 = 0xc2 0xa9"
msgstr "11000010 10101001 = 0xc2 0xa9"

#. type: Plain text
#: source/utf-8.7:187
msgid ""
"and character 0x2260 = 0010 0010 0110 0000 (the \"not equal\" symbol) is "
"encoded as:"
msgstr ""
"dargestellt und das Zeichen 0x2260 = 0010 0010 0110 0000 (das Ungleich-"
"Symbol) als:"

#. type: Plain text
#: source/utf-8.7:190
msgid "11100010 10001001 10100000 = 0xe2 0x89 0xa0"
msgstr "11100010 10001001 10100000 = 0xe2 0x89 0xa0"

#. type: SS
#: source/utf-8.7:191
#, no-wrap
msgid "Application Notes"
msgstr "Bemerkungen zur Anwendung"

#
#. type: Plain text
#: source/utf-8.7:195
msgid "Users have to select a B<UTF-8> locale, for example with"
msgstr "Anwender müssen, z.B. mit"

#. type: Plain text
#: source/utf-8.7:198
msgid "export LANG=en_GB.UTF-8"
msgstr "export LANG=en_GB.UTF-8,"

# in order to activate the B<UTF-8> support in applications.
#. type: Plain text
#: source/utf-8.7:203
msgid "in order to activate the B<UTF-8> support in applications."
msgstr ""
"eine B<UTF-8>-Locale wählen, um die B<UTF-8>-Unterstützung in Programmen zu "
"aktivieren."

#. type: Plain text
#: source/utf-8.7:206
msgid ""
"Application software that has to be aware of the used character encoding "
"should always set the locale with for example"
msgstr ""
"Anwendungs-Software, die auf den verwendeten Zeichensatz achten muss, sollte "
"immer, z. B. mit"

#. type: Plain text
#: source/utf-8.7:209
msgid "setlocale(LC_CTYPE, \"\")"
msgstr "setlocale(LC_CTYPE, \"\"),"

#. type: Plain text
#: source/utf-8.7:212
msgid "and programmers can then test the expression"
msgstr "die Locale setzen und Programmierer anschlieÃ?end den Ausdruck"

#. type: Plain text
#: source/utf-8.7:215
msgid "strcmp(nl_langinfo(CODESET), \"UTF-8\") == 0"
msgstr "strcmp(nl_langinfo(CODESET), \"UTF-8\") == 0"

#. type: Plain text
#: source/utf-8.7:224
msgid ""
"to determine whether a B<UTF-8> locale has been selected and whether "
"therefore all plaintext standard input and output, terminal communication, "
"plaintext file content, filenames and environment variables are encoded in "
"B<UTF-8>."
msgstr ""
"auswerten, um festzustellen, ob eine B<UTF-8>-Locale ausgewählt wurde und ob "
"daher sämtliche Standard-Klartexteingaben und -ausgaben, "
"Terminalkommunikation, Klartext-Dateiinhalte, Dateinamen und "
"Umgebungsvariablen in B<UTF-8> kodiert sind."

#. type: Plain text
#: source/utf-8.7:250
msgid ""
"Programmers accustomed to single-byte encodings such as B<US-ASCII> or B<ISO "
"8859> have to be aware that two assumptions made so far are no longer valid "
"in B<UTF-8> locales.  Firstly, a single byte does not necessarily correspond "
"any more to a single character.  Secondly, since modern terminal emulators in "
"B<UTF-8> mode also support Chinese, Japanese, and Korean B<double-width "
"characters> as well as nonspacing B<combining characters>, outputting a "
"single character does not necessarily advance the cursor by one position as "
"it did in B<ASCII>.  Library functions such as B<mbsrtowcs>(3)  and "
"B<wcswidth>(3)  should be used today to count characters and cursor positions."
msgstr ""
"An Einzel-Byte-Kodierungen gewöhnte Programmierer müssen daran denken, dass "
"zwei bislang getroffene Annahmen in B<UTF-8>-Locales nicht mehr gültig sind. "
"Erstens bedeutet ein einziges Byte nicht mehr unbedingt ein einzelnes "
"Zeichen. Zweitens, da moderne Terminal-Emulatoren im B<UTF-8>-Modus auch "
"chinesische, japanische und koreanische B<Zeichen doppelter Breite> sowie "
"B<Kombinationszeichen> ohne horizontalen Vorschub unterstützen, setzt die "
"Ausgabe eines einzelnen Zeichens nicht unbedingt den Cursor um eine Position "
"weiter, wie es bei B<ASCII> der Fall war. Heutzutage sollten Sie "
"Bibliotheksfunktionen wie B<mbsrtowcs>(3) und B<wcswidth>(3) nutzen, um "
"Zeichen und Cursorpositionen zählen."

#. type: Plain text
#: source/utf-8.7:262
msgid ""
"The official ESC sequence to switch from an B<ISO 2022> encoding scheme (as "
"used for instance by VT100 terminals) to B<UTF-8> is ESC % G (\"\\ex1b%G\").  "
"The corresponding return sequence from B<UTF-8> to ISO 2022 is ESC % @ "
"(\"\\ex1b%@\").  Other ISO 2022 sequences (such as for switching the G0 and "
"G1 sets) are not applicable in UTF-8 mode."
msgstr ""
"Die offizielle Escape-Sequenz aus einem B<ISO-2022>-Kodierungsschema (wie zum "
"Beispiel von VT100-Terminals verwendet) nach B<UTF-8> ist ESC % G (\"\\ex1b%G"
"\"). Die entsprechende Sequenz für die Rückkehr von B<UTF-8> zu B<ISO 2022> "
"ist ESC % @ (\"\\ex1b%@\"). Andere B<ISO-2022>-Sequenzen (wie zum Umschalten "
"der G0- und G1-Sätze) sind im B<UTF-8>-Modus nicht anwendbar."

#. type: Plain text
#: source/utf-8.7:271
msgid ""
"It can be hoped that in the foreseeable future, B<UTF-8> will replace "
"B<ASCII> and B<ISO 8859> at all levels as the common character encoding on "
"POSIX systems, leading to a significantly richer environment for handling "
"plain text."
msgstr ""
"Es ist zu hoffen, dass in absehbarer Zeit B<UTF-8> B<ASCII> und B<ISO 8859> "
"auf allen Ebenen als gemeinsame Zeichenkodierung auf POSIX-Systemen ersetzt, "
"was diese zu einer wesentlich mächtigeren Umgebung für den Umgang mit "
"Klartext macht."

#. type: SS
#: source/utf-8.7:271
#, no-wrap
msgid "Security"
msgstr "Sicherheit"

#. type: Plain text
#: source/utf-8.7:290
msgid ""
"The B<Unicode> and B<UCS> standards require that producers of B<UTF-8> shall "
"use the shortest form possible, for example, producing a two-byte sequence "
"with first byte 0xc0 is nonconforming.  B<Unicode 3.1> has added the "
"requirement that conforming programs must not accept non-shortest forms in "
"their input.  This is for security reasons: if user input is checked for "
"possible security violations, a program might check only for the B<ASCII> "
"version of \"/../\" or \";\" or NUL and overlook that there are many non-"
"B<ASCII> ways to represent these things in a non-shortest B<UTF-8> encoding."
msgstr ""
"Die Standards B<Unicode> und B<UCS> fordern, dass Erzeuger von B<UTF-8> die "
"kürzeste mögliche Form liefern. Z. B. ist der Erzeugung einer Zwei-Byte-"
"Sequenz mit dem ersten Byte 0xc0 nicht konform. B<Unicode 3.1> fordert, dass "
"konforme Programme in ihrer Eingabe Formen, die nicht die kürzesten sind, "
"nicht akzeptieren dürfen. Dies geschieht aus Sicherheitsgründen: Wenn "
"Benutzereingaben auf mögliche Sicherheitsverletzungen überprüft werden, "
"könnte ein Programm nur nach den B<ASCII>-Versionen von \"/../\" oder \";\" "
"oder NUL suchen und übersehen, dass es viele Möglichkeiten einer Nicht-"
"B<ASCII>-Darstellung neben der kürzesten B<UFT-8>-Kodierung dieser Zeichen "
"gibt."

#. type: SS
#: source/utf-8.7:290
#, no-wrap
msgid "Standards"
msgstr "Standards"

#.  .SH AUTHOR
#.  Markus Kuhn <mgk25@cl.cam.ac.uk>
#. type: Plain text
#: source/utf-8.7:294
msgid "ISO/IEC 10646-1:2000, Unicode 3.1, RFC\\ 2279, Plan 9."
msgstr "ISO/IEC 10646-1:2000, Unicode 3.1, RFC\\ 2279, Plan 9."

#. type: SH
#: source/utf-8.7:294
#, no-wrap
msgid "SEE ALSO"
msgstr "SIEHE AUCH"

#. type: Plain text
#: source/utf-8.7:299
msgid "B<nl_langinfo>(3), B<setlocale>(3), B<charsets>(7), B<unicode>(7)"
msgstr "B<nl_langinfo>(3), B<setlocale>(3), B<charsets>(7), B<unicode>(7)"

#. type: SH
#: source/utf-8.7:299
#, no-wrap
msgid "COLOPHON"
msgstr "KOLOPHON"

#. type: Plain text
#: source/utf-8.7:306
msgid ""
"This page is part of release 3.27 of the Linux I<man-pages> project.  A "
"description of the project, and information about reporting bugs, can be "
"found at http://www.kernel.org/doc/man-pages/.";
msgstr ""
"Diese Seite ist Teil der Veröffentlichung 3.27 des Projekts Linux-I<man-"
"pages>. Eine Beschreibung des Projekts und Informationen, wie Fehler gemeldet "
"werden können, finden sich unter http://www.kernel.org/doc/man-pages/.";

Reply to: