E se invece di farlo in bash lo fai in python, perl o qualsiasi altro linguaggio che gestisca bene le strutture dati XHTML... e poi importi i risultati nel tuo bash come faresti con awk o sed?
-- Gollum1 tessssoro, dov'è il mio tessssoro...