[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Fwd: rinominare files pdf



brunetto wrote:
dunque, passando da pdf a testo con pdftotext ottengo un file di testo
decente ma non so come spiegare al computer qual'è il titolo, perché
prima ci sono scritte altre cose, per quanto riguarda gli archivi

ciao... ho fatto un po' di prove..

la strada di usare la rete non e' nelle mie possibilita'... questi file html sono troppo complessi per me...


pero' ho usato un'altra idea, che forse puo' essere non sciocca...

ho scritto uno script, che legge uno ad uno i file pdf, e per ognuno ti mostra, una alla volta, le prime righe (pulite dai caratteri strani...)
premendo invio passi alla successiva
dando ok salvi il file in una directory il cui nuovo nome sara' uguale alla riga vista a video...


fatti una copia di backup
poi crea, dai file pdf, i vari file txt con:

$ ( IFS=$'\n'; for file in `ls -1d *pdf`; do echo "$file"; pdftotext "$file"; done; )


quindi metti in questa directory (con i file pdf e txt) questo script


-------------

#!/bin/bash -e


mkdir newpdf 2>/dev/null || :

IFS=$'\n'

for file in `ls -1 *txt`
do
  oldtitle="${file%txt}pdf"
  clear
  echo "$oldtitle"
  echo "-----------"

  rawnumber=0
  while true
  do
    (( rawnumber++ ))

    newname="`head -n $rawnumber "$file" | \
      tail -n 1 | \
      sed 's/[^[:alnum:] ]//g'`"

    test -z "$newname" && continue

echo -en "cambiare con -${newname}.pdf- ?\n([S]i - [R]icomincia - [A]ltro - Invio=altro titolo) "
    read response rest

    case $response in
      s|S) mv "$oldtitle" "newpdf/${newname}.pdf"
           rm "$file"
           break ;;
      r|R) echo;
           rawnumber=0 ;;
      a|A) continue 2 ;;
    esac
  done

done

-----------

mettigli il permesso di esecuzione, e lancialo

fai un paio di prove...
i file col nuovo titolo li trovi dentro la nuova cartella newpdf

se questa strada ti sembra quella buona, sono a disposizione per correzioni o modifiche...

ma ho paura che non ti sara' molto d'aiuto perche'
1- non e' automatico e quindi devi lostesso perderci del tempo
2- molti dei file pdf che ho scaricato come prova erano corrotti, e non si riusciva a convertirli in txt


Reply to: