[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Speciale tekens in bestandsnamen van oude files



Hallo,

Waarschijnlijk zijn jullie ze ook wel tegengekomen in een archief: van
die bestanden met speciale tekens in de bestandsnaam, die niet goed
afgebeeld worden en soms problemen geven.

Zelf zag ik problemen toen ik data naar NTFS moest kopieren, het
kopiëren lukte niet met deze foutmelding: "Invalid or incomplete
multibyte or wide character (84)".

Na enig zoeken ben ik er achter gekomen wat dit nu is en hoe je het toch
kunt converteren naar UTF8. Het blijkt om "cp850" te gaan, wat
bijvoorbeeld nog gebruikt werd in de Nederlandse Windows 98. [1]
Nooit eerder van gehoord, en echt wat anders dan Windows-1252 of ISO-8859-1.

Geconverteerd heb ik het uiteindelijk met rsync, zoiets:
rsync -va --iconv=cp850,utf8 /path/K*cken_brf.sxw /path/

De speciale tekens dus vervangen door een sterretje, niet helemaal
netjes, maar het functioneerde. En het ging om niet zoveel bestanden.
Uiteraard kan dit ook met iconv.

Het probleem is eigenlijk dat er vaak oude en nieuwe bestanden door
elkaar staan in een archief, waarbij die enkele bestanden met speciale
tekens in de bestandsnaam niet zo opvallen. Wat je eigenlijk zou willen
is een test met bijvoorbeeld find of het zo'n oud bestand is, en zo ja
daar een conversie op loslaten.
Dat is misschien iets voor een volgende keer...

Groet,
Paul.

[1] http://en.wikipedia.org/wiki/Code_page_850

-- 
Paul van der Vlis Linux systeembeheer, Groningen
http://www.vandervlis.nl


Reply to: