[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

[DICO] character set (WAS: Re: [RFR] po-debconf://glibc (8 strings, 1 nieuwe))



On Tuesday 10 April 2007, Benno Schulenberg wrote:
> cobaco (aka Bart Cornelis) schreef:
> > On Monday 09 April 2007, Benno Schulenberg wrote:
> > > s/karakterset, /tekenset, /
> > > s/karaktersets /tekensets /
> >
> > hm:
> > - vandale kent ze geen van beide
> > - google geeft volgende datapunten:
> >   - 'karakterset' -> 102.000 'tekenset' -> 32.400
> >   - 'karakterset utf' -> 79.000	'tekenset utf' ->  515
> >   - 'karakterset ascii' -> 1.520 'tekenset ascii' -> 773
> > - we hebben in eerder vertalingen ook altijd karakterset gebruikt

> "Tekenset" is de standaardvertaling van "character set" in GNOME en
> KDE (zie http://www.kde.nl/helpen/woordenlijst.html), en is ook de
> standaardvertaling die gebruikt wordt op vrijschrift.org.

err, heb net wat programma's nagelopen en bovenstaande klopt niet:

KDE: 
- kate, kedit, kmail, konsole -> spreken over 'codering'
  (dus in programmavertaling waar je lijst van karaktersets hebt hebben ze
   dat blijkbaar als standaard)
- googlen op "inurl:kde.org karakterset en "inurl:kde.org tekenset" 
  levert 4 en 6 hits op respectievelijk (en 8 voor codering)

GNOME:
- gtranslator -> karakterset
- gnome-terminal -> tekenset
- gedit (geen instelling hiervoor ?!?))
- googlen op "inurl:gnome.org karakterset" en "inurl:gnome.org tekenset"
  levert 3 en 6 hits respectievelijk (en 4 voor codering)

www.vrijschrijft.org
- zoeken in hun searchbox geeft 1 hit voor karakterset en geen hits voor
  tekenset
- (zijn die uberhaupt nog bezig met vertaling hun site heeft hier niks meer
   over?)

nog wat datapunten:
- googlen op "libc karakterset" geeft 8 hits, "libc tekenset" 7
- googlen op "karakterset inurl:ac.be" geeft 42 hits, "tekenset inurl:ac.be"
  8 hits

-> beide zijn ongeveer even vaak in gebruik

> Google ook eens op site:nl.wikipedia.org naar "tekenset" en
> "karakterset".  De eerste wordt het meest gebruikt (33 tegen 14),
> en vooral in artikelen die over tekensets gaan.  De tweede wordt
> voornamelijk in andere artikelen gebruikt, en als het specifiek
> over Aziatische schrifttekens gaat.
>
> In m'n papieren Van Dale staat bij "karakter":
> 1. ingegrift, ingedrukt teken...   /magische karakters/
> 2. letter   /Chinese, gotische karakters/
>
> De tweede betekenis is deels fout (Chinese karakters zijn geen
> letters), maar het wijst in bepaalde richting: karakters zijn de
> wat ingewikkelder tekens -- tenminste voor mij -- en niet zozeer
> simpele letters als "e" en "f" of simpele tekens als "+" en "-".

maar Aziatische karakters en andere (voor ons) niet-simpele tekens zijn 
expliciet deel van de modernere karaktersets (zoals utf-8 of utf-16, 
unicode omvat zelfs cuneiform, braille, en runes [2] om een paar van de 
meer exotische karaktergroepen te noemen).

Het Nederlandse wikipedia artikel over Unicode heeft het ook over karakters 
[1] 

-> dit is dus argument voor karakterset, aangezien niet alle karaktersets 
uit de 'simpele' (latijnse) letters en tekens bestaan.

(wikipedia heeft het bij de nederlandse ingang over 'unicode' overigens ook 
over karakters)

> Bovendien wordt het woord "teken" gebruikt in de vertaling van het
> Engelse "string": "tekenreeks".  Misschien is dit nog wel de
> belangrijkste reden voor het gebruik van "tekenset".

gegeven dat string in de vandale staat en tekenreeks niet, is dat geen 
(goed) argument :)

[1] http://nl.wikipedia.org/wiki/Unicode
[2] http://en.wikipedia.org/wiki/Unicode
-- 
Cheers, cobaco (aka Bart Cornelis)

Attachment: pgptHC_fiMTeZ.pgp
Description: PGP signature


Reply to: