Re: HS Convertir du texte encodé UTF8 en son caractère représenté (et son inverse)
daniel huhardeaux, dimanche 18 juillet 2010, 19:33:23 CEST
>
> Le 17/07/2010 19:06, Sylvain Sauvage a écrit :
>
> Bonsoir
’soir,
>[…]
> > Quoted-printable n’est pas un charset, c’est une « surface ».
> > Donc paquet recode :
> >
> > recode u8/QP..u8
> > ou, en long :
> > recode UTF-8/Quoted-Printable..UTF-8/
> >
> > Ici : prend l’entrée en « UTF-8/qp » et transforme « .. » en
> > « UTF-8[/<défaut pour UTF-8>] ».
> >
>
> Et si je veux revenir à la représentation UTF8,
Ce n’est pas une « représentation UTF-8 », c’est un codage (ce
que recode appelle une surface) pour représenter des octets en
n’utilisant que des octets de valeur inférieure à 128.
Il se trouve que, dans ton exemple, les dits octets codent de
l’UTF-8, mais ça peut être n’importe quel encodage (latin-1,
windows-1252, LaTeX…).
Et le codage peut être « rien » (ou « par défaut », qui se dit
'' ou '/'), base64 ('/b64'), octal ('/o')…
Pour résumer les termes :
– Unicode : jeu de caractères, donne un n° à chaque caractère
(et un peu plus) ;
— UTF-8 : [format de] codage de caractères, définit comment
représenter Unicode avec des octets ;
– Quoted-Printable : [format de] codage de données, définit
comment représenter des octets avec des octets de valeur
inférieure à 128.
> soit donc après un
> recode retrouver
>
> <R=C3=A9sultat =C3=A0 la m=C3=AAme =C3=A9tag=C3=A8re>
>
> quelle est la manipulation?
C’est simplement l’inverse : 'recode u8..u8/qp' (ou simplement
'../qp' pour conserver les valeurs par défaut locales).
Les '..' sont la séparation entre la source et la cible.
--
Sylvain Sauvage
Reply to: