Re: théorie mémoire de traduction

To: debian-l10n-french@lists.debian.org
Subject: Re: théorie mémoire de traduction
From: suzume@mx82.tiki.ne.jp
Date: Fri, 18 Jul 2003 12:52:08 +0900
Message-id: <[🔎] 34714356-B8D3-11D7-80A1-000A27AB5DF8@mx82.tiki.ne.jp>
In-reply-to: <[🔎] 20030717083158.GY1585@galadriel>

d'une manière générale, la tm semble s'imposer pour des textes
_techniques_ sans questionner leur format (bien que trados, le big
machin sur le marche ait ete approprie récemment par m$ et que le

format de ses mémoires: tmx, semble s'imposer comme un standard). latm

est un système qui selon les applications absorbe aussi bien du /doc
que du html ou xml (ou encore le format oo, je ne me souvient plus du
suffixe).


oo => xml :)


ouais, je sais ça, je parle du suffixe sxw (après vérification) :)

Donc, je dois confondre, et parler des usines a gaz hors de prix/intégrant
des tm/.


cf. le mémoire que tu as du recevoir.

une tm (c'est pas gros, il y a omegaT, une app java opensource quifait
autour de 400ko) qui tourne avec en mémoire l'essentiel des segments
des pages man deja traduits: ça produit une base de donnée de segments
qui te permettent de faire un sacre boulot de défrichage pour lespages
non traduites, surtout considérant la manière relativement formelle
d'écriture d'une page man...


Donc, si une TM c'est ça, ça change mon avis. Ca devient une pièce du
puzzle, aussi utile que les autres. Je m'a gouré', sorry.

pas de problème. en fait il y a même une macro de m$word développé parun français qui fonctionne comme tm. le problème c'est ce que tu dis àpropos de emacs: quand ça veut tout faire ça devient gros. les machinsgenre trados incluent tout, pas seulement le gestionnaire de tm maisaussi l'amont et l'aval.

le fichier cible est pris en charge par un système de contrôle de
version, et hop !
Mouais. Ca te donne une piece et demi du puzzle, mais tu sais toujourspascomment extraire/injecter, editer agreablement, et CVS n'est pas tresadapteau moulinage des fichiers po, ou les commentaires changent tout letemps
sans que personne n'en ait rien a faire. Et quid de la verification de
syntaxe automatique ou des gestions de bogues de traduction ? Quid delanotification des changements aux traducteurs ? Et comment uniformiserleschoix de traduction sans un dico accessible en ecriture auxtraducteurs ?

à propos d'extraction/injection/édition, je compare omegaT à appleglot(ok, rien à voir, je sais :) et le jour ou omegaT supportera le formatappleglot je suis preneur. ok, je n'ai pas eu des masses de contratspour des produits apple récemment mais bon ... ;)

appleglot te met sous forme de tag "lisibles" toutes les chaînes issuesdes fichiers lproj. comme c'est du osx c'est basé sur xml mais c'estencore pire qu'éditer du html. l'avantage c'est qu'il réinjecte toutcorrectement dans le lproj de ta langue cible sans que tu n'ais rien àfaire.


il me semble que:
1) vérification de syntaxe
2) gestion des bogues
3) notification des changements
4) uniformisation des choix

correspond à l'amont/aval du tm.

si je ne me trompe pas freecats est (enfin, _sera_) basé sur unestructure client/serveur qui répond à 4) quand à 3 il me semble qu'il yen a un prototype avec le ddtp. pour 1) et 2) je ne vois pas comment tupeux automatiser ça sans intervention humaine ?

Je persiste, les TM, c'est tres bien, mais ca ne se suffit pas en soitmeme
pour nous.


j'ai rien dit de ce genre :)

le format po est considere comme format a introduire sur omegaT,
probleme, le developpeur est indisponible. a l'heure actuelle, le
mainteneur de la page (marc prior, traducteur professionel) est en
train de galerer pour apprendre java et se taper les modifs
necessaires...
J'avais cause avec le mainteneur d'omegaT a une epoque. Je lui disaisquetraduire sans extraire ne sert a rien (forcement, je fais du lobbyingpourmes idees, hein), et il etait d'accord. Mais ni l'un ni l'autren'avons fait
qqch pour que ca change.

je me goure peut-être mais quand tu dis "extraire" tu parle d'extrairedes chaînes à partir du code compilé ? ou alors tout simplement degérer correctement les fichiers à format tagés (genre xml) ? à proposkeith (le dvp d'omegaT) à l'air d'être très très peu dispo en cemomment, mais le mainteneur (marc prior) se démène pour faire en sorteque omegaT avance dans le bon sens, sauf qu'il est traducteur, pasprogrammateur java...

Je suis alergique au java sous toutes ses formes (langage jouet deprototypage ames yeux, comme le perl ou le python, mais en plus pedant), et le faitqu'il secontente d'extraire depuis le xml de oo, traduire, reinjecte m'avaitparu de
mauvaise augure pour la suite.


tu peux développer ?

ouais tout a fait, et il me semble que debian est le lieu privilegie
pour ce genre de tentatives.
Je pense aussi. On est bien etabli comme equipe de traduction [*], onestassez nombreux [*], tres actifs [*], on a de l'experience[*], y'a desgenstechniquement performants, des linguistes et meme des gens normaux quinous
remettent les pieds sur terre au besoin.

([*]: dans le monde libre). Disons qu'on est des amateurs eclaires.

je crois que il y a eu une tentative récente pour clarifier lesprocédure de participation sur le projet de traduction, est-ce qu'ilest possible de développer ce document pour clarifier l'ensemble duprocessus ? c-à-d faire un "méta" document sur comment le projetfonctionne globalement (ou devrait fonctionner dans l'idéal) ? je croisque ce serait un plus pour des expériences similaires du monde "libre".a propos, en tant que traducteur bénévole d'attac je leur avaisconseillé de prendre l'exemple de debian-l10n-french. problème: laprocédure ici manque de "modèle" clair (ou clarifié) pour êtreapplicable hors du monde de l'informatique...

C'est le site web du projet, savannah lui meme marche tres bien, maisbon.Rien dans le CVS des sources, rien dans le CVS des pages webs, riendans les
forums, rien dans la zone de telechargement...
J'esperais au moins trouver les deux design documents dont parle Henridans
http://mail.gnu.org/archive/html/freecats-dev/2003-07/msg00001.html
Ils seraient a leur place dans la zone de telechargement, aussi.

moi aussi pour te dire la vérité :) mais apparemment ça commence toutjuste, laisse _leur_ du temps !

Le probleme ici, il me semble, c'est que les systemes de traductionpro fontrever les traducteurs pro, mais pas les traducteurs amateurs du libre,carleurs besoins ne sont pas exactement les memes. Je ne suis pashermetique
aux charmes des TM, mais je refuse de leur donner un status superieur a
"piece necessaire du puzzle"...

honetement, je crois qu'il n'y a pas de rêve, juste la nécessitéd'utiliser des produits standardisé par l'industrie de la traductionqui font que 1) tu bosses un pouielleme plus vite mais que 2) tu espayé considérablement moins cher puisque la machine fait ton boulot àta place (problème de la facturation des segments déclarés identiquespar la machine...)

je ne suis pas certain que la plupart des traducteurs (ie les gens quimangent grâce à leur compétence linguistique) soient hyper excités parle fait que leurs outils évoluent au rythme de la volonté de Bill Gateset consorts et donc que pour continuer à vivre de leur travail ilsdoivent continuellement réinvestir dans des usines à gaz. Il me sembleque l'expérience débian (ie projet _hyper_ complexe avec un taux deréussite/satisfaction relativement élevé) est à modéliser (aussi bienen terme de procédure que d'outillage) pour fournir au monde dunon-libre les options nécessaires à une autonomisation de la production(hahaha) translinguistique !

si un tm trouvait sa place dans debian le projet de traduction n'enserait que bénéficiaire. pièce du big puzzle. pas panacée.

Et si on voulais faire un vrai groupware de traduction, le plus dursera dechoisir ou se trouve son centre, quelle piece est la piece maitresse.Jepense que ca doit etre un robot a la TP (ou meme, soyons fous, a laddtp).
 Interface:
   - Type B2B avec une entree pour les traducteurs et relecteurs et une
autre pour les "clients", c'est a dire les developpeurs voulantfaire
     traduire leurs programmes et documentation, ou autre.
   - mail+HTTP+socket directe pour les clients interactifs (qui sont
     quasi indispensables pour la plupart des traducteurs).

 Service de centralisation:
   - des choses a traduire
   - des choses traduites, avec gestion des versions et notification
   - une TM
   - un dico
   - rapports de relectures et autres bogues
Et ensuite, une fois que le coeur fonctionne, on peut reflechir afaire desmoulinettes sur les serveurs debian qui injectent dans le systeme leschosesa traduire, et recuperent depuis ce systeme les traductions pretespour les
mettre dans les paquets.


ben tu vois que tu as plein d'idées :)

et on en est où de ce truc génial ?

jch

Reply to:

Follow-Ups:
- Re: théorie mémoire de traduction
  - From: Martin Quinson <martin.quinson@tuxfamily.org>

References:
- Re: théorie mémoire de traduction
  - From: Martin Quinson <martin.quinson@tuxfamily.org>

Prev by Date: Re: Développeurs amont ou amonts ?
Next by Date: Re: ITO: po://dpkg/fr.po
Previous by thread: Re: théorie mémoire de traduction
Next by thread: Re: théorie mémoire de traduction
Index(es):
- Date
- Thread