[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: conoscere il charset di un file



On 15/07/11 12:00, Dott. Giovanni Bonenti wrote:
> On Ven, Luglio 15, 2011 11:52, Piviul wrote:
>> > Dott. Giovanni Bonenti scrisse in data 15/07/2011 11:40:
>>> >> La mappa caratteri di GNOME? (credo che si chiam gnome-charmap)
>> > Non so, o non mi sono spiegato oppure non ho capito cosa intendi. Dato
>> > un file di testo avrei bisogno, tramite bash, sapere se è in UTF-8
>> > oppure in ISO8859-x oppure in ASCII.
> Non avevo capito io, scusa.
> 
> 
>> >
>> > È possibile che non esista un modo per saperlo da linea di comando?
>> >
> Su questo non ti so aiutare.
> Però rifletto su una cosa: i caratteri non "speciali" sono uguali per
> tutti i set di caratteri, ASCII, iso o UTF. Quello che varia sono i
> caratteri speciali (accenti umlaut ecc...).
> Non so se questa riflessione possa essere d'aiuto (mi viene in mente che
> un testo privo di caratteri speciali è il medesimo qualunque sia la mappa
> caratteri della macchina con cui è stato scritto).

L'unico modo è cercare nel file alcune combinazioni di byte
caratteristiche di un certo encoding ma vietate in un altro. Il comando
"file" fa esattamente questo.

-- 
Federico Di Gregorio                         federico.digregorio@dndg.it
Studio Associato Di Nunzio e Di Gregorio                  http://dndg.it
     One key. One input. One enter. All right. -- An american consultant
           (then the system crashed and took down the *entire* network)


Reply to: