[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: conversion UTF-8 vers ISO-8859-1



antoine, lundi 12 mai 2008, 15:55:35 CEST
> 
> >   recode u8..h  fichier.html # de UTF-8 à HTML 4.0
> >   recode l1..h3 fichier.html # de latin-1 à HTML 3.2
> >   recode ..h4   fichier.html # de « locale » vers HTML 4.0
> -----------
> Merci.
> 
> Comment savoir si on doit recoder avec :
> "u8..h" ,  "l1..h3" , "..h4" ?
> 
> ça dépend de l'en-tête du fichier.HTML ?

  Si le charset y est indiqué, oui.
  Sinon, il faut le retrouver soi-même.

  Quant à h/h3/h4 (existent aussi h1, h2 et h0), ça dépend de ce
que l’on veut en sortie :
  — h ou h4, c’est du HTML 4.0 (donc dernière version, avec les
entités texte, é et cie) ;
  — h1, h2, h3 sont pour les versions 1.1, 2.0 et 3.2 de HTML
(cf. W3C pour les différences) ;
  — h0, c’est pour les entité numériques, é → é.

  'recode --list' donne la liste des charsets qu’il connaît, un
par ligne avec ses synonymes. Les noms longs sont parfois plus
explicites.
  Sinon, 'info recode'.

-- 
 Sylvain Sauvage


Reply to: