[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Estrazione di dati da email



Il mar, 2002-04-09 alle 12:53, Federico Di Gregorio ha scritto:

> > Io non so se qualche buonanima ha implemetato una liberia che preveda
> > queste eccezioni (nel senso XML), comunque se provi a gestire tramite
> > xslt un html 9 volte su 10 hai casini.

dimenticavo. il problema deriva dal fatto che consideri l'html come una
versione malfatta dell'xml, mentre tutto cio' e' assolutamente falso.
l'html e' sgml, descritto da un tipo ben preciso di dtd e, se conforme a
quel dtd, non c'e' alcun problema ad eseguirne il parsing in un albero
dom.

l'xml e' un linguaggio derivato dall'sgml, che ne semplifica di molto la
sintassi, per l'uso sul web. per ora, l'equivalente dell'html, in xml e'
xHTML, studiato per essere valido sia come html (nel senso di usabile da
un browser) sia com xml (nel senso che un parser solo xml riesce ad
interpretarlo correttamente.)

-- 
Federico Di Gregorio
Debian GNU/Linux Developer & Italian Press Contact        fog@debian.org
INIT.D Developer                                           fog@initd.org
   God is real. Unless declared integer. -- Anonymous FORTRAN programmer

Attachment: signature.asc
Description: PGP signature


Reply to: