Re: conversion UTF-8 vers ISO-8859-1
antoine, lundi 12 mai 2008, 15:55:35 CEST
>
> > recode u8..h fichier.html # de UTF-8 à HTML 4.0
> > recode l1..h3 fichier.html # de latin-1 à HTML 3.2
> > recode ..h4 fichier.html # de « locale » vers HTML 4.0
> -----------
> Merci.
>
> Comment savoir si on doit recoder avec :
> "u8..h" , "l1..h3" , "..h4" ?
>
> ça dépend de l'en-tête du fichier.HTML ?
Si le charset y est indiqué, oui.
Sinon, il faut le retrouver soi-même.
Quant à h/h3/h4 (existent aussi h1, h2 et h0), ça dépend de ce
que l’on veut en sortie :
— h ou h4, c’est du HTML 4.0 (donc dernière version, avec les
entités texte, é et cie) ;
— h1, h2, h3 sont pour les versions 1.1, 2.0 et 3.2 de HTML
(cf. W3C pour les différences) ;
— h0, c’est pour les entité numériques, é → é.
'recode --list' donne la liste des charsets qu’il connaît, un
par ligne avec ses synonymes. Les noms longs sont parfois plus
explicites.
Sinon, 'info recode'.
--
Sylvain Sauvage
Reply to: