[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Indicizzare il contenuto dei files nell'hd



Non siamo la generazione della roba: ovvero raccogliamo un sacco di
materiale inutile. Il trasferimento informatico dell'atteggiamento e' un
proliferare di files e filetti. Con questo msg sto cercando l'eldorado,
la mia pietra filosofale.

Ho cercato in tutti i modi di trovate un modo univoco per gestire le mie
informazioni, quello che c'e' sul mio HD. Ho provato a elaborare sistemi
per convertire tutto in XML, usare per tutto un database, costruire
sistemi piu' o meno elaborati per prendere note, stendere documenti,
archiviare informazioni. E' una strada __non__ percorribile senza
elaborare delle linee guida e soprattutto impossibile da integrare con i
documenti provenienti dall'esterno, che sono 80% del totale. Almeno se
uno deve anche vivere nel frattempo...

Pero' mi sono accorto che su Google.com trovo tutto e uso un solo campo
per la ricerca.

Far indicizzare a Google il mio HD e' impossibile (o quasi :-)), ma
avere un sistema come Google sul proprio HD non e' impossibile.

La mia nuova idea e' quella di costruire uno script (Perl, bash, php,
???) che ricorsivamente indicizzi tutta la mia HOME, aprendo un certo
set di file (testo, pdf, html, rtf, MSdoc, openoffice, magari immagini)
e ne salvi il contenuto in un database MySQL, assieme al PATH assoluto e
le informazioni del file stesso (formato, peso, data, permessi). 

L'interrogazione del DATABASE dovrebbe avvenire attraverso una semplice
SQL, ma questa e' la parte facile.

C'e' qualcuno che mi aiuta?

Il risultato dovrebbe essere quello di poter interrogare una funzione
tipo LOCATE ma non limitata al nome del file e al path, ma al contenuto
del file stesso. Per l'indicizzazione, immagino, ci vorra' un po' di
tempo e un bel po' di spazio disco... ma chi se ne frega?

Ovviamente se esiste qualcosa di gia' fatto ditemelo che mi evito una
bella fatica.

Ciao!


-- 

 ,           , 
 /             \ 
((__-^^-,-^^-__))      http://www.frequenze.it
 `-_---' `---_-'      
  `--|o` 'o|--'              Debian Sarge kernel 2.4.22  
     \  `  /                    Notebook Asus A2520 CPU 2.4Ghz RAM 512MB
      ): :( 
      :o_o: 
       "-" 



Reply to: