Re: [HS] Vérifier les URL externes sur le site (was: Lien mort)
Le 1 novembre 2012 20:16, David Prévot <david@tilapin.org> a écrit :
> Le 31/10/2012 21:54, Stéphane Blondon a écrit :
>> mais si on
>> utilise un outil développé en interne, ne serait-il pas plus simple de
>> le remplacer par un outil qui le fait déjà (par exemple les paquets
>> htcheck ou linkchecker me semble de bons candidats) ?
>
> Ha oui, d'autant plus que les scripts maison étaient jusqu'alors cachés
> sur une machine à accès restreint. Première étape : placer ses scripts
> sur la place publique →
> http://anonscm.debian.org/gitweb/?p=debwww/cron.git;a=tree;f=urlcheck;hb=HEAD
>
> Pour la suite, je ne sais pas trop, mais maintenant on a au moins un
> point de départ.
Je pense qu'il faut mieux définir le besoin :
- ce que l'outil doit vérifier
- la façon dont ça devrait fonctionner
Voici les paquets que j'ai trouvé et qui remplissent le besoin :
htcheck, linklint, linkchecker et w3c-linkchecker
Quelques caractéristiques d'après ce que j'ai vu et compris de la doc :
htcheck:
- enregistre les résultats dans une base de données MySQL
- analyse du HTML fourni par HTTP (pas HTTPS, FTP, etc.)
- exécution en ligne de commande
- codé en C++
htcheck-php:
- fournit une interface web avec apache à partir des données en base
- codé en PHP
linklint:
- analyse du HTML fourni par HTTP (pas HTTPS, FTP, etc.)
- a priori, possibilité de gérer l'authentification HTTP
- exécution en ligne de commande
- sortie texte ou html, en un ou plusieurs fichiers; résumé sur la
sortie standard
- codé en Perl
linkchecker:
- protocoles disponibles : HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:, Telnet
- authentification utilisateur/motdepasse pour HTTP, FTP et Telnet
- exécution en ligne de commande
- sortie texte, html, csv, ...
- codé en Python
w3c-linkchecker (checklink):
- authentification utilisateur/motdepasse
- protocole HTTP (peut-être FTP et NNTP ?)
- utilisable en ligne de commande ou script CGI
- authentification utilisateur/motdepasse
- codé en Perl
J'imagine une solution assez simple avec linkchecker par exemple mais
c'est un peu prématuré pour l'instant.
Qu'en pensent les contributeurs au site ?
Peut-être qu'on devrait continuer sur debian-www@l.d.o ?
--
Imprimez ce message en A2 et en couleur au moins 500 fois!
Brûlez des arbres!!
-- envoyé depuis ma centrale à charbon
Stéphane
Reply to: