[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: v. 0.0.1 ;) [était : script pour chasser les erreurs courantes dans les fichiers po (et autres)]



On Mon, Dec 10, 2001 at 09:14:32AM +0100, Martin Quinson wrote:
> On Mon, Dec 10, 2001 at 08:56:20AM +0100, Denis Barbier wrote:
> > On Mon, Dec 10, 2001 at 08:38:50AM +0100, Martin Quinson wrote:
> > [...]
> > > La ou je bloque, c'est pour faire des regles comme ca : 
> > > [trés]
> > > valid after="enregis" id="200"
> > > hint="Mettre un accent grave"
> > > 
> > > Ce valid after me casse la tête grâve. Y'a pas moyen de faire une expression
> > > réguliere qui récupèrerait tous les /trés/ sans prendre /enregistés/ ? Au
> > > pire, je le ferais automatiquement, mais pour l'instant, je ne vois pas du
> > > tout comment le gerer.

Groumf, pas réveillé :(

> > Salut, c'est possible en Perl, avec /enregis(?<!trés)/, et tu devrais donc

 /(?<!enregis)trés/

> > regarder du côté de PCRE. Cette librairie permet d'utiliser très simplement
                                    bibliothèque
[...]
> C'est vrai que ca serait bien d'avoir les expressions régulières perl. Mais
> je sais pas si le mainteneur de gettext sera d'accord pour ajouter une
> dépendance sur une bibliothèque extérieure pour ca. Je vais lui demander. Au
> pire, on peut dire que dans le fichier de regles, les /bla/ sont des
> expressions perl, et les [bla] sont des expressions posix. Ensuite, un
> configure.ac bien fait, et le programme ignorera les expressions perl quand
> la bibliothèqye qui va bien n'est pas dispo...

Dans les programmes où je l'utilise, j'ai choisi de l'embarquer ; en la
débarrassant des fichiers superflus, les sources non comprimés pèsent moins de
200 Ko. Il faut néanmoins faire attention à respecter sa licence, qui est
BSD-like avec clause de publicité.

Tu devrais aussi t'intéresser à un autre problème, qui est l'encodage utilisé.
Il faut que tes règles s'appliquent quel que soit l'encodage du document,
et donc certainement que tu les écrives en utf-8 et transforme l'encodage
du document avec la libiconv si nécessaire.
Les nouvelles versions de la bibliothèque PCRE ont un support de l'utf-8, qui
est expérimental, mais semble bien marcher.

Denis



Reply to: