Re: doppelte zeilen raussuchen

To: debian user <debian-user-german@lists.debian.org>
Subject: Re: doppelte zeilen raussuchen
From: Moritz Lenz <moritz@casella.verplant.org>
Date: Mon, 26 Jun 2006 15:46:05 +0200
Message-id: <[🔎] 449FE51D.4000803@casella.verplant.org>
In-reply-to: <[🔎] F79FB33E-E289-4406-A359-51ABA0FFD13D@hfk-bremen.de>
References: <[🔎] F79FB33E-E289-4406-A359-51ABA0FFD13D@hfk-bremen.de>

Hallo,

lars wrote:
> JA-stimmen:
> 
> test@test.de
> user@wir.lokal
> 
> NEIN-stimmen:
> 
> test5@test.de
> user@wir.lokal
> 
> ENTHALTUNGEN:
> 
> heinie@test-mail.de
> anderer-user@wir.lokal
> 
> 
> 
> diese datei soll das ergebnis einer umfrage per email aufzeigen.
> doppelte nennungen sollen herausgefiltert werden.


moritz@rena:~/tmp/neu>cat ja
foo
bar
baz
moritz@rena:~/tmp/neu>cat nein
foo
fee
qox
moritz@rena:~/tmp/neu>cat ja|while read i; do grep "^$i$" nein >
/dev/null || echo $i; done
bar
baz

sowas? die Verallgemeinerung auf drei Dateien schaffst du sicher auch
noch...

Das geht nur solange gut, wie keine Steuerzeichen für regexp in den
Dateien stehen. Wenn also Punkte drin vorkommen bekommst du false
positives (ein Punkt matched ein beliebiges Zeichen...), d.h. wenn in
einer Zeile sowas wie .* steht ist das Verfahren im Eimer. Dann kann man
ja immer noch ein kleines Perlscript für sowas schreiben...

Grüße,
Moritz

> 
> doppelte nennungen bei den maileingängen von JA, NEIN und ENTHALTUNGEN
> habe ich bereits per
> 
> cat JA-stimmen | sort | uniq > JA
> 
> aussortiert.
> 
> mit uniq geht das in der endgültigen datei aber nicht, da ich vorher mit
> sort sortieren müsste; sortieren darf ich aber nicht, weil dann die
> zuordnungen zu JA, NEIN und ENTHALTUNGEN nicht mehr passen würden.
> 
> 
> uniq -D gibt mir eine leere datei.
> 
> 
> unter windows gibt es dafür ein tool namens "dupli find" - echt klasse,
> nur leider zeigt es die doppelten einträge lediglich an ohne
> verarbeitungsmöglichkeit.
> 
> 
> hat jemand eine idee, welches linux-ttol ich dafür verwenden könnte ... ?
> 
> 
> 
> vielen dank im voraus!
> 
> 
> gruss
> 
> 
> lars behrens
> 
> 
> 


-- 
Moritz Lenz
http://moritz.faui2k3.org/

Attachment: signature.asc
Description: OpenPGP digital signature

Reply to:

References:
- doppelte zeilen raussuchen
  - From: lars <lars@hfk-bremen.de>

Prev by Date: Re: doppelte zeilen raussuchen
Next by Date: [OT] kotzen
Previous by thread: Re: doppelte zeilen raussuchen
Next by thread: Halb-OT: Weitere Schriften für OpenOffice 2.0 unter Sarge
Index(es):
- Date
- Thread