[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: cerco aiuto x uno script



due o tre linee di Perl...



On Sun, 19 Dec 2004 23:50:52 +0100, MaX <max@maximumdebian.org> wrote:
> ciao a tutti,
> 
> dovrei trovare il modo per comparare parzialmente delle linee così
> formate:
> 
> <campo1>aaaa</campo1><campo2>iiii</campo2><campo3>1111</campo3>
> <campo1>aaaa</campo1><campo2>ii44</campo2><campo3>2222</campo3>
> <campo1>aaaa</campo1><campo2>ii44</campo2><campo3>3333</campo3>
> <campo1>aabb</campo1><campo2>cc55</campo2><campo3>eeee</campo3>
> <campo1>aabb</campo1><campo2>cc55</campo2><campo3>ffff</campo3>
> <campo1>aadd</campo1><campo2>bbbb</campo2><campo3>gggg</campo3>....
> 
> parzialmente perchè le uniche cose da comparare risiedono nei campi 1 e
> 2
> Infatti se guardate le prime tre linee noterete che il campo 1 contenie
> sempre delle "aaaa"
> ma solo due linee hanno "ii44" mentre la prima ha "iiii"
> 
> Lo scopo di questo esempio serve per trovare delle incoerenze di
> traduzione allo scopo di migliorare un glossario inglese-italiano...
> immaginate che il file sia:
> 
> <us>hello</us><it>ciao</it><path>/lib/file1</path>
> <us>hello</us><it>miao</it><path>/lib/file2</path>
> <us>hello</us><it>prrr!</it><path>/lib/file3</path>
> <us>hello</us><it>ciao</it><path>/lib/file4</path>
> <us>hello</us><it>ciao</it><path>/lib/file5</path>
> 
> noterete che la parola "hello" ha tre traduzioni differenti: ciao,
> miao, prrr!
> ma...purtroppo risiedono in file 5 differenti: file1, file2, file3...
> 
> quindi servirebbe uno script che faccia la comparazione fino al tag
> </it> e ignori quello che viene dopo, ma non lo cancelli nel report. Il
> path è importante che rimanga visibile per permettere al traduttore di
> trovare agevolmente l'incoerenza e correggerla.
> 
> Notare che non si tratta di parole semplici, ma anche di intere frasi
> con spazi e caratteri tipo: &^%$#@!ñãüèé.... in quanto non deve servire
> solo per l'italiano ma anche per altre lingue
> Ma a tale scopo si potrebbe sostituire i vari caratteri e simboli con
> string ad hoc, tipo:
> 
> " " = "SpAzIo"
> "ã" = "ATiLdE"....
> 
> e poi riconvertirli nei caratteri originali dopo la comparazione.
> 
> che scopo ha questo lavoro?
> 
> semplice, rendere omogenee le traduzioni tra una applicazione e l'altra.
> Spesso e volentieri la stessa frase in inglese viene tradotta in 5
> forme differenti in 5 programmi differenti, rendendo più difficile per
> un utente non inglese capirne il significato.
> Quindi raccogliendo in una directory vari file .po di differenti
> programmi/utility si può fare
> agevolmente questo lavoro di ricerca e contribuire a migliorare la
> traduzione.
> 
> ...ovviamente se esiste già una utility a questo scopo, fatemelo sapere.
> 
> qualche idea?... magari in python? :)
> 
> ciao
> MaX
> 
>



Reply to: