[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: non ascii suchen



[...]

> Ich fürchte, du musst die Aufgabenstellung genauer klären.
>
> Wenn man den einfachsten Fall annimmt, möchtest du alle
> nicht-druckbaren ASCII-Zeichen. Dann würde so was reichen:
>
>  sed 's/[^ -~]/#/g'

Das war nix. Der wandelt so ziemlich alles um :)

Ich versuche es nochmal.
Es handelt sich um sich bei den Daten um ein Datenbankexport einer 
Informix Datenbank. Das sind reine ASCII-Daten. Natürlich sind da 
auch umlaute drin, aber nix Kyrillisches oder so. Ist alles 
deutsch.  Der Zeichensatz müsste? iso-8859-1 sein. 
Datensatzdelimiter ist '|'. So sachen wie $%^... kommen in den 
Texten auch vor. 

Beim durchsehen der Daten habe ich, zufällig, nichtdruckbare zeichen 
gefunden. ^H\^I ... Die habe da nix drin zu suchen. Die muss ich 
finden.

Was ich brauche ist nur die Zeilennummer der entschrechenden datei. 
Alles andere mache ich von hand mit vi. Da es sich aber um mehrere 
GB Daten handelt muss da ein 'Helferlein' ran. Sollte ich Zeilen 
angezeigt bekommen die trotzdem richtig sind, vieleicht wegen des 
Zeichensatzes, ist das nicht so schlimm. Wie gesagt, es wird 
händisch durchgesehen.

So. Ich glaube es ist alles.

-- 
cu

Roland Kruggel  mailto: rk-liste@gmx.de
System: Intel 3.2Ghz, Debian sid, 2.6.7, KDE 3.3.2



Reply to: