[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: encodage cp437 iso8859-1 utf8 ???



20 May 2003 10:45:45 +0200, Bertrand lemaitre a écrit :
> Bonjour,

Salut,

> je n'ai pas très bien compris toutes les docs qui traitent du sujet de
> l'encodage des caractères, aussi je souhaite vous présenter mes
> questions sur ce sujet.
> 
> 
> Je dois transférer les répertoires home d'utilisateurs d'une machine A
> vers B.
> 
> J'ai pour l'instant essayé par wget ou par un tar.gz (puis ftp).
> 
> 1- Par wget, les répertoires initialement nommés "Documents favoris"
> 	sont transformés en "Documents%20favoris".

Logique : wget les récupère comme des URL. Or une URL ne peut contenir que
des caractères ASCII, mais pas d'espace (les caractères %, ?, =, ; et #
ont des significations particulières). Wget encode donc les noms de
fichier avec %code_ascii_hexa (soit %20 pour l'espace).

> 2- Par un tar-gz puis ftp, puis "détarer", "Documents favoris" reste 
> 	bien "Documents favoris".

De cette façon, les noms de fichier sont protégés par le tar.

> Mes 3 questions:
> 
> - Qu'est qui peut faire que wget réagisse ainsi, sachant que les 2
> machines sont différentes (RedHat6.2 origine, Woody destination), mais
> que les noyaux sont compilés avec CONFIG_NLS_DEFAULT = "cp437", et que
> la variable LANG est à fr_FR sur les 2.

Rien à voir avec la choucroute, cf. plus haut.

> - Comment à postériori, connaître le type d'encodage utilisé par un
> filesystem ?

Les options de montage pour les types de système de fichiers qui peuvent
(vfat, ntfs, isofs, jfs, ...). Voir la fstab et mount...

> - Quel est l'encodage habituellement utilisé et qui donne le moins de
> complication par rapport au vue des données via des applications telles
> que samba, apache,nfs...
>  Dans le noyau j'ai vu que iso8859-1 était conseillé, mais on m'avait
> conseillé UTF8 car plus universel, mais depuis j'ai crû comprendre qu'il
> fallait passer toute une série de patch
> (cf.http://www.toolinux.com/linutile/howto-html/html/Unicode-HOWTO-3.ht
> ml)

Pour ext2 (et ext3 et reiserfs), l'option n'a pas de sens : tout caractère
(à part / et \0) peut servir pour un nom de fichier. C'est son apparence
qui est modifiée par l'environnement.

Par contre, certains outils ont du mal à gérer les caractères spéciaux
(par ex. java avec les caractères accentués et LANG=C, ou apache avec les
noms de répertoire ou de fichier avec des accents).

En gros, si les fichiers sont locaux, utilise ce que tu veux, s'ils
doivent être exportés, fais attention...

> Merci pour votre aide.

On fait ce qu'on peut...

-- 
FAQ de la liste debian-user-french :
      http://savannah.nongnu.org/download/debfr-faq/html/ 
- - - - - - - - - - - - - - - - - - - - - - - - - - - - -
 Sylvain Sauvage, http://www.info.unicaen.fr/~sauvage



Reply to: