[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: théorie mémoire de traduction



Raa, je verifiais mes mails avant d'aller dormir, moi... Bon, tant pis, en
route pour le grand blabla.

On Fri, Jul 18, 2003 at 12:52:08PM +0900, suzume@mx82.tiki.ne.jp wrote:
> >Donc, je dois confondre, et parler des usines a gaz hors de prix 
> >/intégrant
> >des tm/.
> 
> cf. le mémoire que tu as du recevoir.

Oui, faudrait que je l'ouvre, maintenant.

> à propos d'extraction/injection/édition, je compare omegaT à appleglot 
> (ok, rien à voir, je sais :) et le jour ou omegaT supportera le format 
> appleglot je suis preneur. ok, je n'ai pas eu des masses de contrats 
> pour des produits apple récemment mais bon ... ;)
> 
> appleglot te met sous forme de tag "lisibles" toutes les chaînes issues 
> des fichiers lproj. comme c'est du osx c'est basé sur xml mais c'est 
> encore pire qu'éditer du html. l'avantage c'est qu'il réinjecte tout 
> correctement dans le lproj de ta langue cible sans que tu n'ais rien à 
> faire.
> 
> il me semble que:
> 1) vérification de syntaxe
> 2) gestion des bogues
> 3) notification des changements
> 4) uniformisation des choix
> 
> correspond à l'amont/aval du tm.
> 
> si je ne me trompe pas freecats est (enfin, _sera_) basé sur une 
> structure client/serveur qui répond à 4) quand à 3 il me semble qu'il y 
> en a un prototype avec le ddtp. pour 1) et 2) je ne vois pas comment tu 
> peux automatiser ça sans intervention  humaine ?

1: acheck
2: BTS
3: a faire. le ddtp est vraiment "prototypal".
4: je voyais pas comment couper a l'intervention humaine, c'est cool que
   d'autres sachent comment faire, et que ca soit meme en cours de
   realisation :) 

> >>le format po est considere comme format a introduire sur omegaT,
> >>probleme, le developpeur est indisponible. a l'heure actuelle, le
> >>mainteneur de la page (marc prior, traducteur professionel) est en
> >>train de galerer pour apprendre java et se taper les modifs
> >>necessaires...
> >
> >J'avais cause avec le mainteneur d'omegaT a une epoque. Je lui disais 
> >que
> >traduire sans extraire ne sert a rien (forcement, je fais du lobbying 
> >pour
> >mes idees, hein), et il etait d'accord. Mais ni l'un ni l'autre 
> >n'avons fait
> >qqch pour que ca change.
> 
> je me goure peut-être mais quand tu dis "extraire" tu parle d'extraire 
> des chaînes à partir du code compilé ? ou alors tout simplement de 
> gérer correctement les fichiers à format tagés (genre xml) ? à propos 
> keith (le dvp d'omegaT) à l'air d'être très très peu dispo en ce 
> momment, mais le mainteneur (marc prior) se démène pour faire en sorte 
> que omegaT avance dans le bon sens, sauf qu'il est traducteur, pas 
> programmateur java...

En fait, l'extraction sert a plusieurs choses:
 - faire que le format po soit le pivot de toute chose
   - les traducteurs ne sont confrontes qu'a ce format
   - les autres moulinettes peuvent se contenter de fonctionner sur le po
 - faire que, etant donne :
    - le vieux fichier en anglais
    - le vieux fichier en francais, traduction du premier,
    - le nouveau fichier en anglais evolution, meme importante, du premier,
   tu arrives a produire au moindre effort le nouveau fichier en francais,
   etant la traduction du nouvel anglais.

Il se trouve que je pense savoir resoudre les deux problemes a la fois en
une seule etape avec po4a. J'arrete pas de vous saouler avec ca, mais c'est
parce que j'y crois. Il reste des pbs technologiques (bugs et autres
fonctionnalites manquantes), mais je crois que l'approche est la bonne.

Graphiquement, le service rendu est le suivant :

  fr.sgml  original.sgml ---->--------+------>----------->-------+         
     |         |                      |                          |         
     V         V           { update of original }                |         
     |         |                      |                          | 
     +--<---<--+                      V                          |
     |         |              original.new.sgml----->------->----+         
     V         V                      |                          |         
  [po4a-gettextize]      +--->---->---+                          |         
     |         |         |            V                          |         
     |         |         |     [po4a-updatepo]                   |         
     |         V         ^            |                          V         
     V    original.pot   |            V                          |         
     |         |         |          fr.po                        |         
     |         |         |         (fuzzy)                       |         
     |  { translation }  |            |                          |         
     |         |         ^            V                          V         
     |         |         |     {manual editing}                  |         
     V         V         |            |                          |         
     |         |         |            V                          V         
     |         |         +--<---    fr.po       addendum   original.sgml
     +---->----+---->------->---> (up-to-date) (optional)  (up-to-date) 
                                      |            |             |         
                                      v            v             v
                                      +------>-----+------<------+
                                                   |
                                                   v
                                           [po4a-translate]
                                                   |
                                                   V
                                                fr.sgml
                                             (up-to-date)


Et ce qui est beau dans po4a, c'est qu'il est parfaitement modulaire et peut
prendre en entree tout format, il les passe en po, mouline les po comme
d'habitude, et replace les traductions a leur place. C'est meme pas
conceptuellement dur a faire, en fait. Si tu veux plus de technique, je peux
t'en servir.


Les grosses limitations actuelles de la chose, c'est la gestion un peu
cacateuse des addenda, parties qui ne sont pas des traductions, mais des
ajouts (une section "a propos de cette traduction", typiquement) et les
formats informatiques comme les questionnaires debconf, ou le jeu n'est pas
de substituer une langue par une autre, mais d'ajouter toutes les
traductions dans le meme fichier.

Mais par exemple, si l'original passe d'un format a un autre (sgml->xml ou
man page->po ou questionnaire debconf->apt-listchange), il ne devrait rien y
avoir a changer ou presque pour le traducteur.

Oui, c'est ca, po4a se charge de garantir la perenite des traductions, quels
que soit les modifications a l'original (dans la mesure du possible,
evidement)

> >Je suis alergique au java sous toutes ses formes (langage jouet de 
> >prototypage a
> >mes yeux, comme le perl ou le python, mais en plus pedant), et le fait 
> >qu'il se
> >contente d'extraire depuis le xml de oo, traduire, reinjecte m'avait 
> >paru de
> >mauvaise augure pour la suite.
> 
> tu peux développer ?

J'avais pas envie de faire les longs mails qu'on se fait pour le persuader
qu'il y a d'autres problemes que ceux qu'il veut resoudre. S'il ne l'avait
pas vu, j'avais la flemme de me lancer dans un long blabla avec
potentiellement rien de constructif a la fin. De plus, interfacer du perl
(po4) et du java pour qu'omegaT puisse utiliser le po en pivot comme tout le
monde dans mes reves, je vois pas comment faire d'un point de vue technique.

> je crois que il y a eu une tentative récente pour clarifier les 
> procédure de participation sur le projet de traduction, est-ce qu'il 
> est possible de développer ce document pour clarifier l'ensemble du 
> processus ? c-à-d faire un "méta" document sur comment le projet 
> fonctionne globalement (ou devrait fonctionner dans l'idéal) ? je crois 
> que ce serait un plus pour des expériences similaires du monde "libre". 
> a propos, en tant que traducteur bénévole d'attac je leur avais 
> conseillé de prendre l'exemple de debian-l10n-french. problème: la 
> procédure ici manque de "modèle" clair (ou clarifié) pour être 
> applicable hors du monde de l'informatique...

Non, ce n'est pas possible. 

Demande a Attac de theoriser leur mode de fonctionnement pour qu'on s'en
inspire. Ils en sont incapables. Et nous, c'est pareil. Faire du meta, c'est
un metier. Ta seule chance, c'est d'interresser un sociologue a l'affaire,
et qu'il s'abonne a la liste pour nous voir faire. Et encore, il raterait
les messages prives, qui constituent une partie non nulle de notre mode de
fonctionnement. 

Si tu me demande un debriefing sur les deux ans passes dans le groupe, et de
chercher a theoriser pourquoi ca s'est bien passe, je sais pas trop. On
s'entendais bien, on a simplifier la tache des traducteurs, on a reussi a
reunir les conditions pour que ca roule, mais surtout, on a eu un cul
phenomenal, la mayonaise a pris. 

Si tu me demande d'exposer le principe de fonctionnement sans le theoriser,
ce n'est pas possible. On est une structure lache, chacun fait ce qu'il
veut, et presque comme il veut. Nos regles ne sont pas plus que des best
current practices (BCP pour les intimes). La regle vient apres l'habitude,
et au moment ou elle est ecrite, l'habitude evolue jusqu'a changer du tout
au tout.

Si tu me demande de te montrer les jouets en perl dont on s'est entourer
pour que les traducteurs puissent se concentrer sur leur tache, c'est
possible. Mais il reste a prouver que nos jouets soient ceux qu'il faut pour
traduire attac. Tout le monde ici utilise linux (au moins de temps en
temps). Meme les moins techniciens sont plus geek que la moyenne. Ce que je
veux dire, c'est que tous les membres de cette auguste assemblee sont
capable de faire un rapport de bogue potable, a defaut de corriger eux meme
le probleme et faire un patch.

> >Le probleme ici, il me semble, c'est que les systemes de traduction 
> >pro font
> >rever les traducteurs pro, mais pas les traducteurs amateurs du libre, 
> >car
> >leurs besoins ne sont pas exactement les memes. Je ne suis pas 
> >hermetique
> >aux charmes des TM, mais je refuse de leur donner un status superieur a
> >"piece necessaire du puzzle"...
> 
> honetement, je crois qu'il n'y a pas de rêve, juste la nécessité 
> d'utiliser des produits standardisé par l'industrie de la traduction 
> qui font que 1) tu bosses un pouielleme plus vite mais que 2) tu es 
> payé considérablement moins cher puisque la machine fait ton boulot à 
> ta place (problème de la facturation des segments déclarés identiques 
> par la machine...)

Oui, j'ai tjs tendance a oublier que vous faites ca pour crouter, et que du
coup, les problematiques sont "un peu" differentes. Le cote pro est agacant
quand on est la pour le fun, mais necessaire pour vous.

> je ne suis pas certain que la plupart des traducteurs (ie les gens qui 
> mangent grâce à leur compétence linguistique) soient hyper excités par 
> le fait que leurs outils évoluent au rythme de la volonté de Bill Gates 
> et consorts et donc que pour continuer à vivre de leur travail ils 
> doivent continuellement réinvestir dans des usines à gaz. Il me semble 
> que l'expérience débian (ie projet _hyper_ complexe avec un taux de 
> réussite/satisfaction relativement élevé) est à modéliser (aussi bien 
> en terme de procédure que d'outillage) pour fournir au monde du 
> non-libre les options nécessaires à une autonomisation de la production 
> (hahaha) translinguistique !

Gloups. pas convaincu. 
Taux de reussite de debian ? Quand sortira Sarge+1? Dans 3-4 ans ? Et la
 suivante ?  
Projet complexe? Humainement, tu veux dire? Parce que faire tourner un pays,
 eduquer les jeunes, punir ceux qui jouent pas le jeu, donner a crouter a
 tout le monde est plus dur que faire un tas de programme pour geeks
 volontaires... 
 
Ce n'est pas complexe, en fait. On est des amateurs alors on croit que, mais
on fait rire les pros par nos methodes. Pas forcement par nos resultats,
mais par nos methodes. Et pour comprendre comment ca peut marcher, et ben je
te conseille de relire "la cathedrale et le bazard" d'esr, "a la conquete de
la noosphere" du meme, et n'oublie pas "la cathedrale, le bazard et le
conseil municipal" d'Alan Cox, tres instructif quand on regarde se qui se
fait dans Debian hors traduction :)

> >Et si on voulais faire un vrai groupware de traduction, le plus dur 
[...]
> ben tu vois que tu as plein d'idées :)
> 
> et on en est où de ce truc génial ?

Il tourne tres bien dans le simulateur que constitue cette liste (Raah, faut
que j'en finisse avec ma these avant de devenir fou). Pourquoi, et comment
extraire ce qui fait que ca va bien pour le faire ailleurs, j'en suis
incapable.

Et pis d'abord, j'ai sommeil.


Bye, Mt.

-- 
Quelqu'un qui a commis des atrocités mérite la peine de mort. Ainsi, il
retiendra la leçon pour la prochaine fois.
          --- Britney Spears



Reply to: