[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: egrep en castellano vs egrep en inglés



El Wed, 30 Sep 2015 17:13:13 +0200, Manolo Díaz escribió:

> El miércoles, 30 sep 2015 a las 14:31 UTC Camaleón escribió:
> 
>> Buscando en Google he visto que esta "característica" está documentada
>> en la versión de grep que tienes (2.21), vamos, que ni bug ni fantasmas
>> ni gaitas... misterio resuelto:
>> 
>> http://savannah.gnu.org/forum/forum.php?forum_id=8152
>> 
>> If a file contains data improperly encoded for the current locale,
>> and this is discovered before any of the file's contents are output,
>> grep now treats the file as binary.
>> 
> 
> Extraño. Así que caracteres que son inválidos en utf8 pueden no serlo en
> C. Creía que el último era un subconjunto de cualquier otro.

Lo que sucede es que el archivo "passwd" está codificado en "iso-8859" y 
grep está usando utf-8 de ahí que lo interprete mal y en la nueva versión 
te lo detecta como binario. 

Al forzar el uso del locale C (le hubiera valido también 
"LANG=es_ES.iso885915") lo interpreta como ascii y de hecho le podría dar 
error igualmente dependiendo del tipo de caracteres que contuviera el 
archivo.

Saludos,

-- 
Camaleón


Reply to: