Re: [OT] ??? Hands on Guide to the Debian GNU Operating System di Davor Ocelic
Il giorno mer, 24/06/2009 alle 22.38 +0200, Davide Prina ha scritto:
> Di sicuro sia hunspell che il mio programmino funzionano con file di
> testo, per i file XML ritorna come errore tutti i tag che non riconosce.
> Una soluzione potrebbe essere quella di crearsi un dizionario (==
> elenco) con i tag XML possibili (probabilmente esiste già) e fargli
> usare anche quello. Poi non conosco l'XML/SGML e quindi non so se ci
> sono altri problemi.
Il problema e` che i tag xml possibili sono infiniti. ;)
La caratteristica dell'XML e` proprio che ogni utente puo` crearsi i
suoi tag come preferisce.
> Un'altra soluzione di sicuro funzionante al 100% è di far convertire il
> file XML/SGML in puro testo .txt e fare il controllo su quello.
Anche questo non e` semplicissimo (in generale) perche` i tag XML
possono avere degli attributi per cui non e` possibile trovare un modo
univoco di rappresentarli in modo testo (pensa all'attributo alt delle
immagini in HTML, che non e` altro che una derivazione di XML).
Bisognerebbe adattare un parser XML al tuo codice, in modo che estragga
le parti di testo (nodi di testo, attributi di testo e CDATA) e li dia
in pasto al tuo software.
Niente di impossibile, ma ancora piu` semplice se riesci a trasformare
il tuo programma in un oggetto o in una funzione richiamabile.
Bye.
--
Alessandro Pellizzari
Reply to: