Re: cerco aiuto x uno script

To: MaX <max@maximumdebian.org>
Cc: Debian <debian-italian@lists.debian.org>
Subject: Re: cerco aiuto x uno script
From: MaX <max@maximumdebian.org>
Date: Wed, 22 Dec 2004 21:46:27 +0100
Message-id: <[🔎] 8D13F915-545A-11D9-8D3E-00039390CAA0@maximumdebian.org>
In-reply-to: <[🔎] 6F69495F-5210-11D9-B819-00039390CAA0@maximumdebian.org>
References: <[🔎] 6F69495F-5210-11D9-B819-00039390CAA0@maximumdebian.org>

grazie a tutti (anche quelli che mi hanno risposto in privato) per iconsigli dati.

farò tesoro di tutti i consigli e ne ricaverò a breve uno script moltopiù evoluto che passeròai traduttori. Vedrò di fare in modo che possa gestire sia xml chesemplici .po


ciao
MaX


Il giorno Dec 19, 2004, alle 11:50 PM, MaX ha scritto:

ciao a tutti,
dovrei trovare il modo per comparare parzialmente delle linee cosìformate:
<campo1>aaaa</campo1><campo2>iiii</campo2><campo3>1111</campo3>
<campo1>aaaa</campo1><campo2>ii44</campo2><campo3>2222</campo3>
<campo1>aaaa</campo1><campo2>ii44</campo2><campo3>3333</campo3>
<campo1>aabb</campo1><campo2>cc55</campo2><campo3>eeee</campo3>
<campo1>aabb</campo1><campo2>cc55</campo2><campo3>ffff</campo3>
<campo1>aadd</campo1><campo2>bbbb</campo2><campo3>gggg</campo3>....
parzialmente perchè le uniche cose da comparare risiedono nei campi 1e 2Infatti se guardate le prime tre linee noterete che il campo 1contenie sempre delle "aaaa"
ma solo due linee hanno "ii44" mentre la prima ha "iiii"
Lo scopo di questo esempio serve per trovare delle incoerenze ditraduzione allo scopo di migliorare un glossario inglese-italiano...immaginate che il file sia:
<us>hello</us><it>ciao</it><path>/lib/file1</path>
<us>hello</us><it>miao</it><path>/lib/file2</path>
<us>hello</us><it>prrr!</it><path>/lib/file3</path>
<us>hello</us><it>ciao</it><path>/lib/file4</path>
<us>hello</us><it>ciao</it><path>/lib/file5</path>
noterete che la parola "hello" ha tre traduzioni differenti: ciao,miao, prrr!
ma...purtroppo risiedono in file 5 differenti: file1, file2, file3...
quindi servirebbe uno script che faccia la comparazione fino al tag</it> e ignori quello che viene dopo, ma non lo cancelli nel report.Il path è importante che rimanga visibile per permettere al traduttoredi trovare agevolmente l'incoerenza e correggerla.
Notare che non si tratta di parole semplici, ma anche di intere frasicon spazi e caratteri tipo: &^%$#@!ñãüèé.... in quanto non deveservire solo per l'italiano ma anche per altre lingueMa a tale scopo si potrebbe sostituire i vari caratteri e simboli constring ad hoc, tipo:
" " = "SpAzIo"
"ã" = "ATiLdE"....

e poi riconvertirli nei caratteri originali dopo la comparazione.

che scopo ha questo lavoro?
semplice, rendere omogenee le traduzioni tra una applicazione el'altra.Spesso e volentieri la stessa frase in inglese viene tradotta in 5forme differenti in 5 programmi differenti, rendendo più difficile perun utente non inglese capirne il significato.Quindi raccogliendo in una directory vari file .po di differentiprogrammi/utility si può fareagevolmente questo lavoro di ricerca e contribuire a migliorare latraduzione.
...ovviamente se esiste già una utility a questo scopo, fatemelosapere.
qualche idea?... magari in python? :)

ciao
MaX

Reply to:

References:
- cerco aiuto x uno script
  - From: MaX <max@maximumdebian.org>

Prev by Date: postfix reject_unknown_hostname
Next by Date: Re: Doamnda sul kernel!
Previous by thread: Re: cerco aiuto x uno script
Next by thread: errori nella compilazione dei deb-src
Index(es):
- Date
- Thread