[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [HS] Vérifier les URL externes sur le site (was: Lien mort)



Le 1 novembre 2012 20:16, David Prévot <david@tilapin.org> a écrit :
> Le 31/10/2012 21:54, Stéphane Blondon a écrit :
>> mais si on
>> utilise un outil développé en interne, ne serait-il pas plus simple de
>> le remplacer par un outil qui le fait déjà (par exemple les paquets
>> htcheck ou linkchecker me semble de bons candidats) ?
>
> Ha oui, d'autant plus que les scripts maison étaient jusqu'alors cachés
> sur une machine à accès restreint. Première étape : placer ses scripts
> sur la place publique →
> http://anonscm.debian.org/gitweb/?p=debwww/cron.git;a=tree;f=urlcheck;hb=HEAD
>
> Pour la suite, je ne sais pas trop, mais maintenant on a au moins un
> point de départ.


Je pense qu'il faut mieux définir le besoin :
 - ce que l'outil doit vérifier
 - la façon dont ça devrait fonctionner

Voici les paquets que j'ai trouvé et qui remplissent le besoin :
htcheck, linklint, linkchecker et w3c-linkchecker

Quelques caractéristiques d'après ce que j'ai vu et compris de la doc :

htcheck:
	- enregistre les résultats dans une base de données MySQL
	- analyse du HTML fourni par HTTP (pas HTTPS, FTP, etc.)
	- exécution en ligne de commande
	- codé en C++

htcheck-php:
	- fournit une interface web avec apache à partir des données en base
	- codé en PHP

linklint:
	- analyse du HTML fourni par HTTP (pas HTTPS, FTP, etc.)
	- a priori, possibilité de gérer l'authentification HTTP
	- exécution en ligne de commande
	- sortie texte ou html, en un ou plusieurs fichiers; résumé sur la
sortie standard
	- codé en Perl

linkchecker:
	- protocoles disponibles : HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:, Telnet
	- authentification utilisateur/motdepasse pour HTTP, FTP et Telnet
	- exécution en ligne de commande
	- sortie texte, html, csv, ...
	- codé en Python

w3c-linkchecker (checklink):
	- authentification utilisateur/motdepasse
	- protocole HTTP (peut-être FTP et NNTP ?)
	- utilisable en ligne de commande ou script CGI
	- authentification utilisateur/motdepasse
	- codé en Perl


J'imagine une solution assez simple avec linkchecker par exemple mais
c'est un peu prématuré pour l'instant.

Qu'en pensent les contributeurs au site ?
Peut-être qu'on devrait continuer sur debian-www@l.d.o ?


-- 
Imprimez ce message en A2 et en couleur au moins 500 fois!
Brûlez des arbres!!

-- envoyé depuis ma centrale à charbon
Stéphane


Reply to: