[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Speciale tekens in bestandsnamen van oude files



Hoi Jan,

Op 09-11-14 om 23:53 schreef Jan Claeys:
> Paul van der Vlis schreef op zo 09-11-2014 om 11:17 [+0100]:
>> Na enig zoeken ben ik er achter gekomen wat dit nu is en hoe je het
>> toch kunt converteren naar UTF8. Het blijkt om "cp850" te gaan, wat
>> bijvoorbeeld nog gebruikt werd in de Nederlandse Windows 98. [1]
>> Nooit eerder van gehoord, en echt wat anders dan Windows-1252 of
>> ISO-8859-1.
> 
> cp850 wordt vziw nog steeds gebruikt in veel recentere Windows'en, als
> default codepage (stdin/stdout) voor de commandline.  :)

Echt?  Dat lijkt me wel lastig.

Nu ja, in Linux zijn er ook best veel programma's die nog oude encodings
gebruiken. Eigenlijk wou ik dat nog eens gaan inventariseren.

Icedove stelt default zijn mailtjes op in Windows-1252 bijvoorbeeld. Heb
dat laatst proberen te veranderen, maar dat lukte me niet zomaar. Dit
mailtje is in UTF-8, maar dat komt omdat het een reply is op een UTF-8
bericht van jou.

Ook Apache en FTP-servers gebruiken nog vaak latin1 volgens mij.

>> Het probleem is eigenlijk dat er vaak oude en nieuwe bestanden door
>> elkaar staan in een archief, waarbij die enkele bestanden met speciale
>> tekens in de bestandsnaam niet zo opvallen. Wat je eigenlijk zou willen
>> is een test met bijvoorbeeld find of het zo'n oud bestand is, en zo ja
>> daar een conversie op loslaten.
>> Dat is misschien iets voor een volgende keer...
> 
> Dit lijkt me nuttig als je ooit daartoe komt:
> 
> https://code.google.com/p/uchardet/
> 
> (Packages beschikbaar in Debian/Ubuntu, ook voor de Python, Ruby & Java
> bindings of ports.)

Inderdaad interessant, maar ik zie jammergenoeg geen cp850 bij de
ondersteunde encodings.

Groet,
Paul.

-- 
Paul van der Vlis Linux systeembeheer, Groningen
http://www.vandervlis.nl


Reply to: