[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Amélioration du script de conversion en texte (Was: [LCFC] wml://News/2012/20120816.wml)



Le mercredi 22 août 2012 à 16:52:09 (+0200), Stéphane Blondon a écrit :
> Le 22 août 2012 16:02, Thomas Blein <tblein@tblein.eu> a écrit :
> > Le mercredi 22 août 2012 à 09:26:27 (-0400), David Prévot a écrit :
> >> Ensuite, mais c'est probablement moins gérable, les noms de paquets sont
> >> coupées en fin de ligne s'ils contiennent des traits d'union, mais c'est
> >> une fonctionnalité utile pour « Pays-Bas » par exemple, donc je propose
> >> qu'on vive avec (et ne suis pas sûr que ce soit bien grave de toute façon).
> >
> > Pas gérable : Le script n'a aucun moyen de déterminé que c'est un nom de
> > paquet et donc le traiter différemment. Il va falloir vivre avec !
> > À moins que quelqu'un est une idée.
> 
> Si le script a la liste de tous les pays, il peux en déduire que c'est
> le nom d'un paquet si la chaîne n'est pas dans la liste des pays.
> C'est peut-être pas pratique à ajouter (surtout s'il faut prendre en
> compte plein de langues), j'en sais rien.

Il faudrait mieux faire l'inverses: la liste des paquets, car tous les
mots avec un « - » commme ton « peut-être » sont à considérer. Et comme
tu l'as précisé les dictionnaires peuvent devenir horrible à gérer en
considérant toutes les langues.

Actuellement le script utilise une bibliothèque unicode pour faire les
mises à la ligne. Cela permet notamment d'avoir un formatage correct
avec les langues asiatiques (Japonais en particulier). Ajouter des
exceptions de mises à la ligne n'est pas très simple, mais il me semble
que je l'ai fait pour les emails. Donc il suffit de reconnaitre les noms
de paquets…

Après en considérant le nombre de fois où cela arrive il vaut peut être
mieux corriger à la main : que se passe-t-il si le paquet n'est pas dans
la liste ? Une solution serait de mettre les noms de paquets dans des
balises particulières pour les identifier.

Amicalement,

Thomas


Reply to: