[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [HS]: Bookmark mozilla: suppression des doublons ?



Le dimanche 08 février 2004, Jean-Michel OLTRA a écrit...

	bonjour,


> Envoie un exemple du fichier de signets (un extrait), et je suis sur que
> chacun va y aller de son Perl, Python, sed, awk, bash.


#!/usr/bin/env python
#
# delbookmarks.py
# supprime les lignes a URL identiques
# usage ./delbookmark.py fichierEntree fichierSortie

import sys
import string

def main ():
    input = file (sys.argv[1], 'r')
    output = file (sys.argv[2], 'w')
    listing = []
    for line in input:
		if string.find (line, 'HREF') != -1:
			url = string.split (line, '"', 2)[1]
			if url in listing:
				continue
			listing.append (url)
		output.write (line)
	input.close ()
	output.close ()

if __name__ == '__main__':
    main ()

Je ne sais pas si c'est ce que tu souhaites, ça semble le faire, ça m'a
montré que j'avais deux doublons. Ça supprime dans le fichier de sortie
les lignes à URL identique à une ligne déjà reçue.
A condition que ton fichier de signets soit le même que le mien.

-- 
jm



Reply to: