[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Domanda per i GURU di SED: estrazione indirizzi mail da pagina web



Antonio Macchi scrisse:

> grep -o "[[:alnum:].-_]\+@[[:alnum:].-_]\+" nomefile.html
> 
> (se non sbaglio le mail accettano solo lettere, numeri, punto,
> trattino e sottolineatura...)

Giusto per correttezza, in realtà no.
Il formato dell'indirizzo è un po' più complicato così come la regexp
corrispondente, vedi:
http://tools.ietf.org/html/rfc5322#section-3.4.1
http://www.ex-parrot.com/~pdw/Mail-RFC822-Address.html

Poi, che comunque nel 97% dei casi valga quanto dici tu, è un'altra
storia... :)

Ciao, Luca

-- 
 .''`.  ** Debian GNU/Linux **  | Luca Bruno (kaeso)
: :'  :   The Universal O.S.    | lucab (AT) debian.org
`. `'`  			| GPG Key ID: 3BFB9FB3
  `-     http://www.debian.org 	| Debian GNU/Linux Developer

Attachment: pgpIKgVXTs_X4.pgp
Description: PGP signature


Reply to: