[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: doppelte zeilen raussuchen



Hallo,

lars wrote:
> JA-stimmen:
> 
> test@test.de
> user@wir.lokal
> 
> NEIN-stimmen:
> 
> test5@test.de
> user@wir.lokal
> 
> ENTHALTUNGEN:
> 
> heinie@test-mail.de
> anderer-user@wir.lokal
> 
> 
> 
> diese datei soll das ergebnis einer umfrage per email aufzeigen.
> doppelte nennungen sollen herausgefiltert werden.


moritz@rena:~/tmp/neu>cat ja
foo
bar
baz
moritz@rena:~/tmp/neu>cat nein
foo
fee
qox
moritz@rena:~/tmp/neu>cat ja|while read i; do grep "^$i$" nein >
/dev/null || echo $i; done
bar
baz

sowas? die Verallgemeinerung auf drei Dateien schaffst du sicher auch
noch...

Das geht nur solange gut, wie keine Steuerzeichen für regexp in den
Dateien stehen. Wenn also Punkte drin vorkommen bekommst du false
positives (ein Punkt matched ein beliebiges Zeichen...), d.h. wenn in
einer Zeile sowas wie .* steht ist das Verfahren im Eimer. Dann kann man
ja immer noch ein kleines Perlscript für sowas schreiben...

Grüße,
Moritz

> 
> doppelte nennungen bei den maileingängen von JA, NEIN und ENTHALTUNGEN
> habe ich bereits per
> 
> cat JA-stimmen | sort | uniq > JA
> 
> aussortiert.
> 
> mit uniq geht das in der endgültigen datei aber nicht, da ich vorher mit
> sort sortieren müsste; sortieren darf ich aber nicht, weil dann die
> zuordnungen zu JA, NEIN und ENTHALTUNGEN nicht mehr passen würden.
> 
> 
> uniq -D gibt mir eine leere datei.
> 
> 
> unter windows gibt es dafür ein tool namens "dupli find" - echt klasse,
> nur leider zeigt es die doppelten einträge lediglich an ohne
> verarbeitungsmöglichkeit.
> 
> 
> hat jemand eine idee, welches linux-ttol ich dafür verwenden könnte ... ?
> 
> 
> 
> vielen dank im voraus!
> 
> 
> gruss
> 
> 
> lars behrens
> 
> 
> 


-- 
Moritz Lenz
http://moritz.faui2k3.org/

Attachment: signature.asc
Description: OpenPGP digital signature


Reply to: