[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [HS] « à » comme fin de ligne



Bonjour,

Le 19/10/2020 à 10:18, JP Guillonneau a écrit :
> Bonjour,
> 
> problème des � sur le site de Debian.
> Exemple : https://www.debian.org/vote/2012/platforms/zack.fr.html
> La commande
> grep -r -e à$ ~/traductions/git/webwml/french/* |wc -l
> donne comme résultat 1581.
> 
> Est-t’il possible de corriger cela de manière globale ?
> 
> Amicalement.
> 
> --
> Jean-Paul
> 
Je me suis fabriqué un petit fichier bash (que je mets en pièce jointe)
qui permet de déplacer les "à + fin de ligne" et les "déjà + fin de
ligne" au début de la ligne suivante. Je n'ai pas réussi à traiter
automatiquement les "jusqu'à" pour l'instant (problème du ' que je
n'arrive pas encore à protéger). Ce script est limité aux fichiers d'un
seul répertoire dans lequel il faut le copier puis après traitement le
soupprimer. Attention quand la ligne suivant le "à" débute par une ou
plusieurs espaces ou une ou plusieurs tabulations (dans les énumérations
par exemple) le "à" se retrouve en début de ligne mais détaché du texte
suivant...
Je suis bien sûr preneur de toute amélioration.
Une discussion récente sur la liste debian-www montre qu'il faudrait
régler un problème de gestion de l'Unicode entre Perl et WML lors de la
transformation des fichiers .wml en fichiers .html. Je vais essayer de
rapporter le bogue. La correction du problème (qui se produit dans
d'autres langues (italien, espagnol et aussi coréen avec d'autres
caractère) rendrait inutile le contournement de déplacement du caractère
fautif.
Amicalement,
jipege
#!/bin/bash
for i in *.wml
do
  cat "$i" | sed -z 's/ déjà\n/\ndéjà /g' > res1deja.txt
  cat res1deja.txt | sed -z 's/ à\n/\nà /g' > res2deja.txt
  cp res2deja.txt $i
rm res1deja.txt res2deja.txt
done

Reply to: