Re: théorie mémoire de traduction

To: debian-l10n-french@lists.debian.org
Subject: Re: théorie mémoire de traduction
From: suzume@mx82.tiki.ne.jp
Date: Thu, 17 Jul 2003 11:59:59 +0900
Message-id: <[🔎] C0AD8470-B802-11D7-A218-000A27AB5DF8@mx82.tiki.ne.jp>
In-reply-to: <[🔎] 20030716213110.GX1585@galadriel>

Pour des raisons personelles, je cherches des articles ou publications

sur la théorie lié aux application de mémoire de traduction. Je nesuis

ni linguiste ni programmeur mais je risque d'en avoir besoin dans mes
activités. Merci pour toute information pertinente.

Par ailleurs, ceux qui sont intéressés par le développement d'un

programme d'aide à la traduction basé sur la mémoire de traductionsont

invités à s'informer sur le projet freecats :) il semble qu'ils aient
besoin de développeurs...


On est pas des theoriciens, nous, monsieur, on fait tout en perl !


hahaha :)

Plus serieusement, ce que j'ai vu jusque la sur les memoires detraductionne m'a pas convaincu. Il me semble que le soucis principal que cessystemescherchent a resoudre (ou au moins simplifier), c'est traduire aukilometredes fichiers .doc Je caricature, bien sur, mais j'ai jamais vupersonne seposer des questions sur la maintenance des traductions, qui nous poseplusde pbs que la traduction elle meme vu que le libre est par natureevolutif,
ni meme sur la gestion du travail de relecture distribué par nature.

de fait, suite a ma requete j'ai recu un memoire de maitrise traitantdes tm (comme on dit en franglish: translation memories).

le principe c'est d'identifier des chaines de caracteres entre lesdocuments source/cible et d'etablir la probabilite qu'une chaineressemblant a une autre en source ait la meme correspondence en cible.


d'ou:
	1) probleme du decoupage de la source en segments pertinents
	2) probleme de la pertinence du decoupage pour le texte cible

3) probleme du sens que la probabilite (c-a-d la ressemblance)d'identite entre deux segments propose

d'une maniere generale, la tm semble s'imposer pour des textes_techniques_ sans questionner leur format (bien que trados, le bigmachin sur le marche ait ete approprie recemment par m$ et que leformat de ses memoires: tmx, semble s'imposer comme un standart). la tmest un systeme qui selon les applications absorbe aussi bien du /docque du html ou xml (ou encore le format oo, je ne me souvient plus dusuffixe).

par ailleurs, les systemes de maintenance de trads existent, entreautre trados, qui est adopte par l'UE pour tous les documentsofficiels. je n'utilise pas la bete vu son prix et mes besoins maisconsiderant le nombre de boites qui ne t'acceptent comme traducteur quesi tu as trados ca a l'air d'etre _tres_ important sur le marche.

Mon avis, c'est qu'il faut pas suivre l'approche windows (desbloatwarestentant de resoudre tous les pbs de la terre), mais l'approche unix(desprogrammes specialises pouvant collaborer -- je ne parle pas d'emacs,un
bloatware resolvant effectivement tous les problemes de la terre ;).


c'est une approche qui a ses points forts.

pense a ceci:

une tm (c'est pas gros, il y a omegaT, une app java opensource qui faitautour de 400ko) qui tourne avec en memoire l'essentiel des segmentsdes pages man deja traduits: ca produit une base de donnee de segmentsqui te premettent de faire un sacre boulot de defrichage pour les pagesnon traduites, surtout considerant la maniere relativement formelled'ecriture d'une page man...

le fichier cible est pris en charge par un systeme de controle deversion, et hop !

Dans le casting, je verais bien le format po en pivot a tous lesoutils,
po4a a l'extraction/re-injection des parties a traduire, kbabel et
gtranslator pour l'edition agreable des po et gestion des memoires detrad(appellees compendium ici), l10n-check (ou acheck quand il s'appelleracomme
ca) a la verification automatique de la syntaxe, le robot du TP (ou son
arriere petit fils, il a un age certain) en groupware pour gerer letravail
distribué...

le format po est considere comme format a introduire sur omegaT,probleme, le developpeur est indisponible. a l'heure actuelle, lemainteneur de la page (marc prior, traducteur professionel) est entrain de galerer pour apprendre java et se taper les modifsnecessaires...

Les pieces du puzzle murrissent, mais personne n'a encore essaye de les
assembler. Ca promet d'etre .... enrichissant.

ouais tout a fait, et il me semble que debian est le lieu privilegiepour ce genre de tentatives.

Quant a freecats, je serais bien aller voir de quoi il retournait,mais la
page web me retourne 403: Forbidden...

ouais ben y faut chercher un peu mieux. google te donne un certainnombre de pages, ils ont un site sur savanah (orthographe ?) mais leplus important c'est la liste a l'heure actuelle puisque le projetn'est pas encore prototype. la plupart des membres sembles etre enbretagne, mais la liste est en anglais :) (je crois qu'il y a eu destentatives pour la mettre en breton mais il semble que ca ait eterefuse...) le prototype va etre pris en charge par des etudiants eninfos d'un iut local (lannion ou rennes) je crois.

Ceci dit, si tu trouve des infos sur ces systemes, je suis preneuraussi.

je suis en train de lire. je vais voir si la personne qui m'a envoyeson memoire est ok pour que je te le transmette...

jc

Reply to:

Follow-Ups:
- Re: théorie mémoire de traduction
  - From: Martin Quinson <martin.quinson@tuxfamily.org>

References:
- Re: théorie mémoire de traduction
  - From: Martin Quinson <martin.quinson@tuxfamily.org>

Prev by Date: [DDR] debian-doc://ddp/manuals.sgml/developers-reference/developers-reference.fr.sgml
Next by Date: Re: Inciter le passage à po-debconf
Previous by thread: Re: théorie mémoire de traduction
Next by thread: Re: théorie mémoire de traduction
Index(es):
- Date
- Thread