Re: [OT] Limpiar texto.
On Wed, Jan 21, 2009 at 10:13:03AM +0100, N0K wrote:
> N0K escribió:
>> Buenas.
>>
>> ¿ Conoceis alguna forma de limpiar un texto de caracteres que no sean
>> números o letras ?
>>
>> Es decir dado el texto "hola 'como' estas: manolo - ignacio"
>> Quedara el texto: "hola como estas manolo ignacio"
>>
>> Yo lo estoy intentando hacer con awk y gsub, pero tengo que indicar
>> caracter a caracter.
>> ¿ Alguna idea ?
> Ya lo hice con:
> awk '{gsub(/[^a-z]/,""); print}'
>
S�asi elimina todo aquello que no est�ntre a-zA-Z, pero en ello
tambi�van los, por ejemplo, espacios. Es decir, la salida ser�algo
como "holacomoestasmanoloignacio"
Para que eso no ocurra, debe ponerle un espacio en REGEXP, [^a-z ]
Tambi�puede utilizar 'sed', que har�o mismo:
sed 's/[^a-z A-Z]//g' fichero
--
Porqu�oitar e matar, se podes amar e sonhar
/"\
\ / CAMPANHA DA FITA ASCII - CONTRA MAIL HTML
X ASCII RIBBON CAMPAIGN - AGAINST HTML MAIL
/ \
Reply to: