[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [GNU TP: ca]Re: El famós diccionari/recull



A Dimarts 05 Novembre 2002 17:23, Ivan Vilata i Balaguer va escriure:
> On Tue, Nov 05, 2002 at 12:26:54PM +0100, Jordi Mallach wrote:
> > On Tue, Nov 05, 2002 at 10:00:56AM +0100, Ivan Vilata i Balaguer wrote:
> > >     Ummm, per què ens haurien de posar problemes?
> >
> > El Leo segur que es refereix a la llicència de TermCAT.
>
>     Sí, això seria un problema per crear el dic, però afortunadament el
>   que posàrem al Wiki seria completament nostre i no sotmés a llicències
>   d'aquest tipus.  On podríem trobar uns bons termes de còpia i
>   distribució pel contingut, de forma que fora lliure?

A veure, crec que el Jordi m'ha entés bé. Actualment el TermCat, té a la seva 
pàgina web un recull de paraules traduïdes a diversos idiomes, i en té ...... 
ara ho està calculamt la meva màquina, triga una mica, a casa només tinc PII 
a 266.

Bé, continuo.

Jo crec que pot està molt bé fer un recull unificat de termes, però jo per 
exemple no sóc linguïsta, i molt menys una autoritat en el tema. Per tant les 
possibles definicions que jo faci no serveixen per a res.

El termcat té un equip de linguïstes, professionals, que es dediquen a això, i 
a sobre de forma oficial. La feina que fan, o quan decideixen la traducció 
d'un nou terme, passa a ser oficial, segons la gene. O sia, surt al DOG, 
conforme el Termcat ha decidit que tal terme sigui correcte i que vulgui dir 
....

És una llàstima que no poguessim fer servir aquesta base de dades. Fa unes 
setmanes, parlant amb en Jordi Mas, em va comentar que ells (softcatala) 
havia intentat que la gent del termcat possés el seu recull en algun tipu de 
llicènica lliure (per ex, gpl) ,però que no havien volgut.

Potser podriem pressionar nosaltres també, d'alguna manera per intentar 
aconsseguir aquest recull. Aleshores, si que tindriem molta feina feta, i 
molt bona, però ho sento, per molt que respecti a en Jordi Mallach o a tú, o 
a en Sebastià Pla, si opineu de la traducció al català de XXXX és YYYY i el 
termcat va i decideix que la traducció al català val ZZZZ aquesta serà la que 
s'imposarà.

Un altre tema, que també lligo amb aquest (mira, cadasqun té les seves 
obsesions) és el diccionari del IEC. El plantejament és el mateix.

Igualment, podriem intentar agafar les paraules de la Web, ja que estàn 
penjades i són públiques. Crec que amb un mínim d'esforç (algun perl script). 
Per exemple primer ho baxairia de forma local:

wget -k -m http://www.termcat.es/termgia/termnorm/alfabetic/indx_ca.html

el fixer de forma local. Aquest fitxer conté els enllaços a totes les pàgines 
on a cada una hi ha una definició de cada paraula.

Aquests fitxers tenen aquesta forma:

<!DOCTYPE HTML PUBLIC "-//SQ//DTD HTML 2.0 + all extensions//CA" "hmpro3.dtd">
<html>
<head>
<title>fitxer</title>
<LINK REL="stylesheet" HREF="../../../format.est" TYPE="text/css">
</head>
<body>
<p class="nomTermcat"><b>term</b>cat&nbsp;</p>
<p class="fitxa"><b>fitxer</b>&nbsp;&nbsp;<font color="black">m</font></p>
<p class="equiv">sin. compl.&nbsp;&nbsp;<font 
color="#C21D18"><b>arxiu</b></font>&nbsp;&nbsp;m</p>
<p class="equiv"><font color="#C21D18">es</font>&nbsp;&nbsp;archivo</p>
<p class="equiv"><font color="#C21D18">es</font>&nbsp;&nbsp;fichero</p>
<p class="equiv"><font color="#C21D18">fr</font>&nbsp;&nbsp;fichier</p>
<p class="equiv"><font color="#C21D18">en</font>&nbsp;&nbsp;file</p>
<p class="area">&lt;Inform&agrave;tica&gt;</p>
<p class="def">Bloc l&ograve;gic d'informaci&oacute; designat per un nom i 
configurat com una unitat per l'usuari.</p>

</body>
</html>

(Ja ha acabat, 5474 termes)

i si li treiem tots els controls html, i només ens quedem el que ens interssa:


<b>fitxer</b>&nbsp;&nbsp;<font color="black">m</font></p>
<p class="equiv">sin. compl.&nbsp;&nbsp;
<b>arxiu</b>
es</font>archivo</p>
es</font>fichero</p>
fr</font>fichier</p>
en</font>file</p>
<p class="area">&lt;Inform&agrave;tica&gt;</p>
<p class="def">Bloc l&ograve;gic d'informaci&oacute; designat per un nom i 
configurat com una unitat per l'usuari.</p>

tenim la traducció en anglés, francés i castellà, i a sobre el tema 
<Informàtica> i una definició.

Que més volem?

Això està penjat a la web, només cal fer-ho. Jo no en sé prou.

Partint d'aquí, podriem tenir un paquet deb molt maco en format dic, o fer el 
que creiem oportú.

Bé, només era un comentari.

Leo



-- 
Linux User 152692 
Catalonia



Reply to: