[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Zeichensatz bestimmen



Am Donnerstag, den 15.06.2006, 16:30 +0200 schrieb Andreas Kretschmer:
> am  15.06.2006, um 16:24:50 +0200 mailte Frank Blendinger folgendes:
> > On Thu, Jun 15, 2006 at 04:17:12PM +0200, Andreas Kretschmer wrote:
> > > iconv ist ein nettes Tool und die Liste von 'iconv -l' sehr lang. Aber
> > > woher soll ich wissen, ich welcher Codierung ein File vorliegt? Kann mir
> > > jemand ein 'man $tool' nennen?
> > 
> > 'man 1 file' vielleicht? Aber ob das so wirklich alles erkennt... ich
> 
> Ja, hatte ich schon probiert:
> 
> Non-ISO extended-ASCII text, with very long lines

Hast du da auch die -i Option probiert? Die gibt nämlich nur 

datei: $MIME-Typ; charset=$Zeichensatz

aus. Und letzteres ist ja die gefragte Information.

> > glaube, dass ist in den meisten Faellen gar nicht möglich, da die
> > Codierung oft gar nicht mit in der Datei gespeichert wird, so dass eine
> > Heuristik angewandt werden muss.
> 
> Genau. Und sowas suche ich halt. 

Es gibt enca, aber das halte ich für wenig tauglich.

MfG Daniel



Reply to: