Re: commande 'sort' et la localisation...

To: debian-user-french@lists.debian.org
Subject: Re: commande 'sort' et la localisation...
From: Denis Barbier <barbier@linuxfr.org>
Date: Thu, 29 Dec 2005 15:56:25 +0100
Message-id: <[🔎] 20051229145624.GA4808@linuxfr.org>
In-reply-to: <[🔎] 20051229104140.GA23868@lhh.free.fr>
References: <[🔎] 20051220155930.5d36a701@Prem1s.calistel.com> <[🔎] 20051220170405.GA4727@linuxfr.org> <[🔎] 20051221075104.0760ce7c@Prem1s.calistel.com> <[🔎] 20051221091742.GA15063@lhh.free.fr> <[🔎] 20051228184044.GB6646@linuxfr.org> <[🔎] 20051228223426.GA21650@lhh.free.fr> <[🔎] 20051228232532.GA22922@linuxfr.org> <[🔎] 20051229092831.GA22585@lhh.free.fr> <[🔎] 20051229101326.GA22865@linuxfr.org> <[🔎] 20051229104140.GA23868@lhh.free.fr>

On Thu, Dec 29, 2005 at 11:41:40AM +0100, Jacques L'helgoualc'h wrote:
> [...]
> > > > il est très rare d'avoir besoin du tri lexicographique.
> > > 
> > > C'est tout  de même  utile de  temps en temps,  mais beaucoup  moins que
> > > ls. Il  me semble donc  que le comportement  par défaut de sort  est mal
> > > choisi.
> > 
> > Heu, ça n'a rien à voir, ls n'appelle pas sort.
> 
> Bon, ils utilisent la même définition  de l'ordre... Il me semble que ls
> ne devrait pas oublier le point,  par exemple.

Comme ls et sort utilisent tous les deux le contenu de la variable
LC_COLLATE, il est difficile d'avoir un comportement différent par
défaut.
Ce qu'on peut faire, c'est de changer la définition de fr_FR pour
tenir compte des symboles de ponctuation (et de l'espace ?), et
ajouter une autre variante, p.ex. fr_FR@dict, qui permet d'avoir
accès au tri lexicographique quand on en a besoin.

Je n'avais pas compris ce que tu disais au sujet de « sort -d » dans
tes précédents messages. Pour le français, ça n'a effectivement pas
d'effet, mais pour certaines locales (comme C), elle en a un.
Il faudrait vérifier dans les sources, mais il est probable que si
sort est utilisé avec les options -b/d/f/i, le fichier d'entrée passe
d'abord par un filtre et est stocké dans un fichier intermédiaire.
Par exemple avec -d, seuls les lettres, chiffres et blancs seront
écrits. Avec -f, tout est converti en minuscules (ou majuscules). Etc.
Ensuite, la commande sort va trier ce fichier temporaire en tenant
compte de la locale actuelle, et l'index de permutation des lignes
appliqué au fichier original fournit le résultat attendu.

> C'est ce que tu veux dire par « Possible collisions with repertoire
> maps » ?

Non. Les repertoire maps servaient à remplacer des caractères non-ASCII
par une représentation ASCII. Par exemple, « é » pouvait être représenté
par « <e'> », ce qui permettait d'avoir des fichiers de définitions
entièrement en ASCII, de la même façon qu'on peut écrire \'e en TeX.
Comme ces définitions de symboles n'étaient pas standardisées, il était
possible que 2 repertoire maps différents utilisent la même
représentation pour 2 caractères différents, c'est ce que j'appelais le
risque de collision.
L'utilisation de la notation <Uxxxx> permet d'éviter ce problème.

Denis

Reply to:

Follow-Ups:
- Re: commande 'sort' et la localisation...
  - From: Jacques L'helgoualc'h <lhh+no_spam@free.fr>

References:
- Re: commande 'sort' et la localisation...
  - From: Frédéric BOITEUX <fboiteux@calistel.com>
- Re: commande 'sort' et la localisation...
  - From: Denis Barbier <barbier@linuxfr.org>
- Re: commande 'sort' et la localisation...
  - From: Frédéric BOITEUX <fboiteux@calistel.com>
- Re: commande 'sort' et la localisation...
  - From: Jacques L'helgoualc'h <lhh+no_spam@free.fr>
- Re: commande 'sort' et la localisation...
  - From: Denis Barbier <barbier@linuxfr.org>
- Re: commande 'sort' et la localisation...
  - From: Jacques L'helgoualc'h <lhh+no_spam@free.fr>
- Re: commande 'sort' et la localisation...
  - From: Denis Barbier <barbier@linuxfr.org>
- Re: commande 'sort' et la localisation...
  - From: Jacques L'helgoualc'h <lhh+no_spam@free.fr>
- Re: commande 'sort' et la localisation...
  - From: Denis Barbier <barbier@linuxfr.org>
- Re: commande 'sort' et la localisation...
  - From: Jacques L'helgoualc'h <lhh+no_spam@free.fr>

Prev by Date: récupérer fichier binaire effacé sous linux, sur patition vfat (blague utf-8)
Next by Date: Re: récupérer fichier binaire effacé sous linux, sur patition vfat (blague utf-8)
Previous by thread: Re: commande 'sort' et la localisation...
Next by thread: Re: commande 'sort' et la localisation...
Index(es):
- Date
- Thread