brunetto ha scritto:
dunque, passando da pdf a testo con pdftotext ottengo un file di testo decente ma non so come spiegare al computer qual'è il titolo, perché prima ci sono scritte altre cose, per quanto riguarda gli archivi forse faccio prima a mettere gli indirizzi perché sono un po' diversi tra loro... gli articoli privati in teoria semplicemente non si possono scaricare! ad esempio http://arxiv.org/find/all/1/all:+AND+neutron+stars/0/1/0/all/0/1
Se dal tuo viewer apri la scheda proprietà, noterai un campo Title. Per il primo documento nella lista precedente, abbiamo: Title: arxiv.org:astro-ph/xxx Ti va bene questo titolo? Perchè è l'unico che si recupera molto facilmente. Ciao Manlio Perillo