Re: non ascii suchen
[...]
> Ich fürchte, du musst die Aufgabenstellung genauer klären.
>
> Wenn man den einfachsten Fall annimmt, möchtest du alle
> nicht-druckbaren ASCII-Zeichen. Dann würde so was reichen:
>
> sed 's/[^ -~]/#/g'
Das war nix. Der wandelt so ziemlich alles um :)
Ich versuche es nochmal.
Es handelt sich um sich bei den Daten um ein Datenbankexport einer
Informix Datenbank. Das sind reine ASCII-Daten. Natürlich sind da
auch umlaute drin, aber nix Kyrillisches oder so. Ist alles
deutsch. Der Zeichensatz müsste? iso-8859-1 sein.
Datensatzdelimiter ist '|'. So sachen wie $%^... kommen in den
Texten auch vor.
Beim durchsehen der Daten habe ich, zufällig, nichtdruckbare zeichen
gefunden. ^H\^I ... Die habe da nix drin zu suchen. Die muss ich
finden.
Was ich brauche ist nur die Zeilennummer der entschrechenden datei.
Alles andere mache ich von hand mit vi. Da es sich aber um mehrere
GB Daten handelt muss da ein 'Helferlein' ran. Sollte ich Zeilen
angezeigt bekommen die trotzdem richtig sind, vieleicht wegen des
Zeichensatzes, ist das nicht so schlimm. Wie gesagt, es wird
händisch durchgesehen.
So. Ich glaube es ist alles.
--
cu
Roland Kruggel mailto: rk-liste@gmx.de
System: Intel 3.2Ghz, Debian sid, 2.6.7, KDE 3.3.2
Reply to: