Re: théorie mémoire de traduction
Pour des raisons personelles, je cherches des articles ou publications
sur la théorie lié aux application de mémoire de traduction. Je ne
suis
ni linguiste ni programmeur mais je risque d'en avoir besoin dans mes
activités. Merci pour toute information pertinente.
Par ailleurs, ceux qui sont intéressés par le développement d'un
programme d'aide à la traduction basé sur la mémoire de traduction
sont
invités à s'informer sur le projet freecats :) il semble qu'ils aient
besoin de développeurs...
On est pas des theoriciens, nous, monsieur, on fait tout en perl !
hahaha :)
Plus serieusement, ce que j'ai vu jusque la sur les memoires de
traduction
ne m'a pas convaincu. Il me semble que le soucis principal que ces
systemes
cherchent a resoudre (ou au moins simplifier), c'est traduire au
kilometre
des fichiers .doc Je caricature, bien sur, mais j'ai jamais vu
personne se
poser des questions sur la maintenance des traductions, qui nous pose
plus
de pbs que la traduction elle meme vu que le libre est par nature
evolutif,
ni meme sur la gestion du travail de relecture distribué par nature.
de fait, suite a ma requete j'ai recu un memoire de maitrise traitant
des tm (comme on dit en franglish: translation memories).
le principe c'est d'identifier des chaines de caracteres entre les
documents source/cible et d'etablir la probabilite qu'une chaine
ressemblant a une autre en source ait la meme correspondence en cible.
d'ou:
1) probleme du decoupage de la source en segments pertinents
2) probleme de la pertinence du decoupage pour le texte cible
3) probleme du sens que la probabilite (c-a-d la ressemblance)
d'identite entre deux segments propose
d'une maniere generale, la tm semble s'imposer pour des textes
_techniques_ sans questionner leur format (bien que trados, le big
machin sur le marche ait ete approprie recemment par m$ et que le
format de ses memoires: tmx, semble s'imposer comme un standart). la tm
est un systeme qui selon les applications absorbe aussi bien du /doc
que du html ou xml (ou encore le format oo, je ne me souvient plus du
suffixe).
par ailleurs, les systemes de maintenance de trads existent, entre
autre trados, qui est adopte par l'UE pour tous les documents
officiels. je n'utilise pas la bete vu son prix et mes besoins mais
considerant le nombre de boites qui ne t'acceptent comme traducteur que
si tu as trados ca a l'air d'etre _tres_ important sur le marche.
Mon avis, c'est qu'il faut pas suivre l'approche windows (des
bloatwares
tentant de resoudre tous les pbs de la terre), mais l'approche unix
(des
programmes specialises pouvant collaborer -- je ne parle pas d'emacs,
un
bloatware resolvant effectivement tous les problemes de la terre ;).
c'est une approche qui a ses points forts.
pense a ceci:
une tm (c'est pas gros, il y a omegaT, une app java opensource qui fait
autour de 400ko) qui tourne avec en memoire l'essentiel des segments
des pages man deja traduits: ca produit une base de donnee de segments
qui te premettent de faire un sacre boulot de defrichage pour les pages
non traduites, surtout considerant la maniere relativement formelle
d'ecriture d'une page man...
le fichier cible est pris en charge par un systeme de controle de
version, et hop !
Dans le casting, je verais bien le format po en pivot a tous les
outils,
po4a a l'extraction/re-injection des parties a traduire, kbabel et
gtranslator pour l'edition agreable des po et gestion des memoires de
trad
(appellees compendium ici), l10n-check (ou acheck quand il s'appellera
comme
ca) a la verification automatique de la syntaxe, le robot du TP (ou son
arriere petit fils, il a un age certain) en groupware pour gerer le
travail
distribué...
le format po est considere comme format a introduire sur omegaT,
probleme, le developpeur est indisponible. a l'heure actuelle, le
mainteneur de la page (marc prior, traducteur professionel) est en
train de galerer pour apprendre java et se taper les modifs
necessaires...
Les pieces du puzzle murrissent, mais personne n'a encore essaye de les
assembler. Ca promet d'etre .... enrichissant.
ouais tout a fait, et il me semble que debian est le lieu privilegie
pour ce genre de tentatives.
Quant a freecats, je serais bien aller voir de quoi il retournait,
mais la
page web me retourne 403: Forbidden...
ouais ben y faut chercher un peu mieux. google te donne un certain
nombre de pages, ils ont un site sur savanah (orthographe ?) mais le
plus important c'est la liste a l'heure actuelle puisque le projet
n'est pas encore prototype. la plupart des membres sembles etre en
bretagne, mais la liste est en anglais :) (je crois qu'il y a eu des
tentatives pour la mettre en breton mais il semble que ca ait ete
refuse...) le prototype va etre pris en charge par des etudiants en
infos d'un iut local (lannion ou rennes) je crois.
Ceci dit, si tu trouve des infos sur ces systemes, je suis preneur
aussi.
je suis en train de lire. je vais voir si la personne qui m'a envoye
son memoire est ok pour que je te le transmette...
jc
Reply to: