[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [OT] ??? Hands on Guide to the Debian GNU Operating System di Davor Ocelic



Il giorno mer, 24/06/2009 alle 22.38 +0200, Davide Prina ha scritto:

> Di sicuro sia hunspell che il mio programmino funzionano con file di 
> testo, per i file XML ritorna come errore tutti i tag che non riconosce. 
> Una soluzione potrebbe essere quella di crearsi un dizionario (== 
> elenco) con i tag XML possibili (probabilmente esiste già) e fargli 
> usare anche quello. Poi non conosco l'XML/SGML e quindi non so se ci 
> sono altri problemi.

Il problema e` che i tag xml possibili sono infiniti. ;)
La caratteristica dell'XML e` proprio che ogni utente puo` crearsi i
suoi tag come preferisce.

> Un'altra soluzione di sicuro funzionante al 100% è di far convertire il 
> file XML/SGML in puro testo .txt e fare il controllo su quello.

Anche questo non e` semplicissimo (in generale) perche` i tag XML
possono avere degli attributi per cui non e` possibile trovare un modo
univoco di rappresentarli in modo testo (pensa all'attributo alt delle
immagini in HTML, che non e` altro che una derivazione di XML).

Bisognerebbe adattare un parser XML al tuo codice, in modo che estragga
le parti di testo (nodi di testo, attributi di testo e CDATA) e li dia
in pasto al tuo software.

Niente di impossibile, ma ancora piu` semplice se riesci a trasformare
il tuo programma in un oggetto o in una funzione richiamabile.

Bye.

-- 
Alessandro Pellizzari



Reply to: