Re: egrep en castellano vs egrep en inglés
El miércoles, 30 sep 2015 a las 15:45 UTC
Camaleón escribió:
> El Wed, 30 Sep 2015 17:13:13 +0200, Manolo Díaz escribió:
>
> > El miércoles, 30 sep 2015 a las 14:31 UTC Camaleón escribió:
> >
> >> Buscando en Google he visto que esta "característica" está documentada
> >> en la versión de grep que tienes (2.21), vamos, que ni bug ni fantasmas
> >> ni gaitas... misterio resuelto:
> >>
> >> http://savannah.gnu.org/forum/forum.php?forum_id=8152
> >>
> >> If a file contains data improperly encoded for the current locale,
> >> and this is discovered before any of the file's contents are output,
> >> grep now treats the file as binary.
> >>
> >
> > Extraño. Así que caracteres que son inválidos en utf8 pueden no serlo en
> > C. Creía que el último era un subconjunto de cualquier otro.
>
> Lo que sucede es que el archivo "passwd" está codificado en "iso-8859" y
> grep está usando utf-8 de ahí que lo interprete mal y en la nueva versión
> te lo detecta como binario.
Por lo que sé está codificado en ascii.
> Al forzar el uso del locale C (le hubiera valido también
> "LANG=es_ES.iso885915") lo interpreta como ascii y de hecho le podría dar
> error igualmente dependiendo del tipo de caracteres que contuviera el
> archivo.
Volvemos a lo miso: dime un valor ascii que sean inválido en iso-8859-*
o utf8.
> Saludos,
Saludos.
--
Manolo Díaz
Reply to: