[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: cerco aiuto x uno script



grazie a tutti (anche quelli che mi hanno risposto in privato) per i consigli dati.

farò tesoro di tutti i consigli e ne ricaverò a breve uno script molto più evoluto che passerò ai traduttori. Vedrò di fare in modo che possa gestire sia xml che semplici .po

ciao
MaX


Il giorno Dec 19, 2004, alle 11:50 PM, MaX ha scritto:

ciao a tutti,


dovrei trovare il modo per comparare parzialmente delle linee così formate:

<campo1>aaaa</campo1><campo2>iiii</campo2><campo3>1111</campo3>
<campo1>aaaa</campo1><campo2>ii44</campo2><campo3>2222</campo3>
<campo1>aaaa</campo1><campo2>ii44</campo2><campo3>3333</campo3>
<campo1>aabb</campo1><campo2>cc55</campo2><campo3>eeee</campo3>
<campo1>aabb</campo1><campo2>cc55</campo2><campo3>ffff</campo3>
<campo1>aadd</campo1><campo2>bbbb</campo2><campo3>gggg</campo3>....

parzialmente perchè le uniche cose da comparare risiedono nei campi 1 e 2 Infatti se guardate le prime tre linee noterete che il campo 1 contenie sempre delle "aaaa"
ma solo due linee hanno "ii44" mentre la prima ha "iiii"

Lo scopo di questo esempio serve per trovare delle incoerenze di traduzione allo scopo di migliorare un glossario inglese-italiano... immaginate che il file sia:


<us>hello</us><it>ciao</it><path>/lib/file1</path>
<us>hello</us><it>miao</it><path>/lib/file2</path>
<us>hello</us><it>prrr!</it><path>/lib/file3</path>
<us>hello</us><it>ciao</it><path>/lib/file4</path>
<us>hello</us><it>ciao</it><path>/lib/file5</path>

noterete che la parola "hello" ha tre traduzioni differenti: ciao, miao, prrr!
ma...purtroppo risiedono in file 5 differenti: file1, file2, file3...

quindi servirebbe uno script che faccia la comparazione fino al tag </it> e ignori quello che viene dopo, ma non lo cancelli nel report. Il path è importante che rimanga visibile per permettere al traduttore di trovare agevolmente l'incoerenza e correggerla.

Notare che non si tratta di parole semplici, ma anche di intere frasi con spazi e caratteri tipo: &^%$#@!ñãüèé.... in quanto non deve servire solo per l'italiano ma anche per altre lingue Ma a tale scopo si potrebbe sostituire i vari caratteri e simboli con string ad hoc, tipo:

" " = "SpAzIo"
"ã" = "ATiLdE"....

e poi riconvertirli nei caratteri originali dopo la comparazione.

che scopo ha questo lavoro?

semplice, rendere omogenee le traduzioni tra una applicazione e l'altra. Spesso e volentieri la stessa frase in inglese viene tradotta in 5 forme differenti in 5 programmi differenti, rendendo più difficile per un utente non inglese capirne il significato. Quindi raccogliendo in una directory vari file .po di differenti programmi/utility si può fare agevolmente questo lavoro di ricerca e contribuire a migliorare la traduzione.

...ovviamente se esiste già una utility a questo scopo, fatemelo sapere.


qualche idea?... magari in python? :)

ciao
MaX





Reply to: