[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: théorie mémoire de traduction



Pour des raisons personelles, je cherches des articles ou publications
sur la théorie lié aux application de mémoire de traduction. Je ne suis
ni linguiste ni programmeur mais je risque d'en avoir besoin dans mes
activités. Merci pour toute information pertinente.

Par ailleurs, ceux qui sont intéressés par le développement d'un
programme d'aide à la traduction basé sur la mémoire de traduction sont
invités à s'informer sur le projet freecats :) il semble qu'ils aient
besoin de développeurs...

On est pas des theoriciens, nous, monsieur, on fait tout en perl !

hahaha :)

Plus serieusement, ce que j'ai vu jusque la sur les memoires de traduction ne m'a pas convaincu. Il me semble que le soucis principal que ces systemes cherchent a resoudre (ou au moins simplifier), c'est traduire au kilometre des fichiers .doc Je caricature, bien sur, mais j'ai jamais vu personne se poser des questions sur la maintenance des traductions, qui nous pose plus de pbs que la traduction elle meme vu que le libre est par nature evolutif,
ni meme sur la gestion du travail de relecture distribué par nature.

de fait, suite a ma requete j'ai recu un memoire de maitrise traitant des tm (comme on dit en franglish: translation memories).

le principe c'est d'identifier des chaines de caracteres entre les documents source/cible et d'etablir la probabilite qu'une chaine ressemblant a une autre en source ait la meme correspondence en cible.

d'ou:
	1) probleme du decoupage de la source en segments pertinents
	2) probleme de la pertinence du decoupage pour le texte cible
3) probleme du sens que la probabilite (c-a-d la ressemblance) d'identite entre deux segments propose

d'une maniere generale, la tm semble s'imposer pour des textes _techniques_ sans questionner leur format (bien que trados, le big machin sur le marche ait ete approprie recemment par m$ et que le format de ses memoires: tmx, semble s'imposer comme un standart). la tm est un systeme qui selon les applications absorbe aussi bien du /doc que du html ou xml (ou encore le format oo, je ne me souvient plus du suffixe).

par ailleurs, les systemes de maintenance de trads existent, entre autre trados, qui est adopte par l'UE pour tous les documents officiels. je n'utilise pas la bete vu son prix et mes besoins mais considerant le nombre de boites qui ne t'acceptent comme traducteur que si tu as trados ca a l'air d'etre _tres_ important sur le marche.

Mon avis, c'est qu'il faut pas suivre l'approche windows (des bloatwares tentant de resoudre tous les pbs de la terre), mais l'approche unix (des programmes specialises pouvant collaborer -- je ne parle pas d'emacs, un
bloatware resolvant effectivement tous les problemes de la terre ;).

c'est une approche qui a ses points forts.

pense a ceci:

une tm (c'est pas gros, il y a omegaT, une app java opensource qui fait autour de 400ko) qui tourne avec en memoire l'essentiel des segments des pages man deja traduits: ca produit une base de donnee de segments qui te premettent de faire un sacre boulot de defrichage pour les pages non traduites, surtout considerant la maniere relativement formelle d'ecriture d'une page man...

le fichier cible est pris en charge par un systeme de controle de version, et hop !

Dans le casting, je verais bien le format po en pivot a tous les outils,
po4a a l'extraction/re-injection des parties a traduire, kbabel et
gtranslator pour l'edition agreable des po et gestion des memoires de trad (appellees compendium ici), l10n-check (ou acheck quand il s'appellera comme
ca) a la verification automatique de la syntaxe, le robot du TP (ou son
arriere petit fils, il a un age certain) en groupware pour gerer le travail
distribué...

le format po est considere comme format a introduire sur omegaT, probleme, le developpeur est indisponible. a l'heure actuelle, le mainteneur de la page (marc prior, traducteur professionel) est en train de galerer pour apprendre java et se taper les modifs necessaires...

Les pieces du puzzle murrissent, mais personne n'a encore essaye de les
assembler. Ca promet d'etre .... enrichissant.

ouais tout a fait, et il me semble que debian est le lieu privilegie pour ce genre de tentatives.

Quant a freecats, je serais bien aller voir de quoi il retournait, mais la
page web me retourne 403: Forbidden...

ouais ben y faut chercher un peu mieux. google te donne un certain nombre de pages, ils ont un site sur savanah (orthographe ?) mais le plus important c'est la liste a l'heure actuelle puisque le projet n'est pas encore prototype. la plupart des membres sembles etre en bretagne, mais la liste est en anglais :) (je crois qu'il y a eu des tentatives pour la mettre en breton mais il semble que ca ait ete refuse...) le prototype va etre pris en charge par des etudiants en infos d'un iut local (lannion ou rennes) je crois.


Ceci dit, si tu trouve des infos sur ces systemes, je suis preneur aussi.

je suis en train de lire. je vais voir si la personne qui m'a envoye son memoire est ok pour que je te le transmette...

jc


Reply to: