[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: HS Convertir du texte encodé UTF8 en son caractère représenté (et son inverse)



daniel huhardeaux, dimanche 18 juillet 2010, 19:33:23 CEST
> 
> Le 17/07/2010 19:06, Sylvain Sauvage a écrit :
> 
> Bonsoir

’soir,

>[…]
> >    Quoted-printable n’est pas un charset, c’est une « surface ».
> > Donc paquet recode :
> >
> >    recode u8/QP..u8
> > ou, en long :
> >    recode UTF-8/Quoted-Printable..UTF-8/
> >
> >    Ici : prend l’entrée en « UTF-8/qp » et transforme « .. » en
> > « UTF-8[/<défaut pour UTF-8>] ».
> >    
> 
> Et si je veux revenir à la représentation UTF8,

  Ce n’est pas une « représentation UTF-8 », c’est un codage (ce
que recode appelle une surface) pour représenter des octets en
n’utilisant que des octets de valeur inférieure à 128.
  Il se trouve que, dans ton exemple, les dits octets codent de
l’UTF-8, mais ça peut être n’importe quel encodage (latin-1,
windows-1252, LaTeX…).
  Et le codage peut être « rien » (ou « par défaut », qui se dit
'' ou '/'), base64 ('/b64'), octal ('/o')…

  Pour résumer les termes :
– Unicode : jeu de caractères, donne un n° à chaque caractère
  (et un peu plus) ;
— UTF-8 : [format de] codage de caractères, définit comment
  représenter Unicode avec des octets ;
– Quoted-Printable : [format de] codage de données, définit
  comment représenter des octets avec des octets de valeur
  inférieure à 128.

> soit donc après un 
> recode retrouver
> 
> <R=C3=A9sultat =C3=A0 la m=C3=AAme =C3=A9tag=C3=A8re>
> 
> quelle est la manipulation?

  C’est simplement l’inverse : 'recode u8..u8/qp' (ou simplement
'../qp' pour conserver les valeurs par défaut locales).
Les '..' sont la séparation entre la source et la cible.

-- 
 Sylvain Sauvage


Reply to: