[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Speciale tekens in bestandsnamen van oude files



On 11-11-2014 00:57, Wouter Verhelst wrote:
On Sun, Nov 09, 2014 at 11:17:33AM +0100, Paul van der Vlis wrote:
Hallo,

Waarschijnlijk zijn jullie ze ook wel tegengekomen in een archief: van
die bestanden met speciale tekens in de bestandsnaam, die niet goed
afgebeeld worden en soms problemen geven.

Zelf zag ik problemen toen ik data naar NTFS moest kopieren, het
kopiëren lukte niet met deze foutmelding: "Invalid or incomplete
multibyte or wide character (84)".

Na enig zoeken ben ik er achter gekomen wat dit nu is en hoe je het toch
kunt converteren naar UTF8. Het blijkt om "cp850" te gaan, wat
bijvoorbeeld nog gebruikt werd in de Nederlandse Windows 98. [1]
Nooit eerder van gehoord, en echt wat anders dan Windows-1252 of ISO-8859-1.

CP850 was de standaard encoding in deze contreien vóór de uitvinding van
de euro en voor Windows 95 (met CP1252). Het "leuke" aan CP850 is dat er
heel wat box drawing characters waren, zoals ╣ en ╚, en een hoop shading
karakters, zoals ▓ en ░ en consoorten. Als je ergens tussen 1985 en 1995
een computer met DOS gebruikt hebt, dan heb je zeker en vast een UI
gezien die van die karakters gebruik maakte; maar voor Windows was dat
niet echt nodig, dus hebben ze die karakters eruit gesjot en er een paar
accented letters voor in de plaats gezet.  Dat werd dan CP1252, aka
Windows-1252.


De standaard codepage op een Windows 7 PC is nog steeds 850
(het resultaat van CHCP is "Active code page: 850")

Als ik dit wijzig, dan kan ik geen directory eer opvragen van mijn samba-server (opensuse) als daar een bestandje op staat met bijvoorbeeld de naam 'tést.txt'




Reply to: