[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Fwd: rinominare files pdf



Voglio dire, magari ti ritrovi con una lista di link del tipo:

<a href="20081002qwerty.pdf">Sviluppo di sistemi open source</a>

possiamo studiare un semplice script che salvi il file come
"sviluppo_di_sistemi_open_source.pdf" invece che come
"20081002qwerty.pdf".


io avrei scritto una pipe che estrae da un file html tutti i link, e dai link il nome reale e il nome 'fittizio'

cosi' come l'ho scritto lo fa sulla pagina di google, ma ovviamente cambiando l'indirizzo, lo fa su qualunque pagina

dovresti provare a lanciarlo, e vedere se intanto le associazioni escono corrette

in pratica dovrebbe comparirti, a sinistra il nome del tuo file incasinato, e a destra il titolo che andrebbe a prendere

se ci sono cose in piu' non importa (nel rinominare tutto in automatico, i file non trovati li salta)

devi provarlo... perche' molto dipende da come e' stato fatto il file html


---------

wget -O - www.google.it/index.html | \
  sed 's#</[aA]>#</a>\n#g' | \
  grep -o "<[aA] href=.\+>.\+</a>" | \
  sed 's#<[aA] href=\(.\+\)>\(.\+\)<\/a>#\1\n\2#' | \
  while read link rest; read nome; do echo "$link" - "$nome"; done

---------



se le informazini (per culo) sono corrette... poi bastera' cambiare l'ultima riga da

'echo "$link" - "$nome"'

a

'mv "$link" "${nome}.pdf"'

(o poco altro...)


sottointeso che dovrai lanciarlo trovandoti nella directory dove ci sono i file
(E QUINDI FATTI PRIMA UNA COPIA DEI FILE... NON FIDARTI DI ME!)


Reply to: