Re: Zeichensatz bestimmen
am 15.06.2006, um 16:24:50 +0200 mailte Frank Blendinger folgendes:
> On Thu, Jun 15, 2006 at 04:17:12PM +0200, Andreas Kretschmer wrote:
> > iconv ist ein nettes Tool und die Liste von 'iconv -l' sehr lang. Aber
> > woher soll ich wissen, ich welcher Codierung ein File vorliegt? Kann mir
> > jemand ein 'man $tool' nennen?
>
> 'man 1 file' vielleicht? Aber ob das so wirklich alles erkennt... ich
Ja, hatte ich schon probiert:
Non-ISO extended-ASCII text, with very long lines
> glaube, dass ist in den meisten Faellen gar nicht möglich, da die
> Codierung oft gar nicht mit in der Datei gespeichert wird, so dass eine
> Heuristik angewandt werden muss.
Genau. Und sowas suche ich halt.
>
> Zumindest für die Unterscheidung ISO-8859-*/UTF-* taugt file. Mehr habe
> ich (zum Glück) noch nicht gebraucht und dementsprechend leider auch
> keine Erfahrung.
Danke dennoch.
Andreas
--
Andreas Kretschmer (Kontakt: siehe Header)
Heynitz: 035242/47215, D1: 0160/7141639
GnuPG-ID 0x3FFF606C http://wwwkeys.de.pgp.net
=== Schollglas Unternehmensgruppe ===
Reply to: