[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [HS] Vérifier les URL externes sur le site (was: Lien mort)



-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256

Salut,

Le 06/11/2012 19:42, Stéphane Blondon a écrit :

> Je pense qu'il faut mieux définir le besoin :
>  - ce que l'outil doit vérifier
>  - la façon dont ça devrait fonctionner

Ce qui existe pour l'instant est une vérification des pages par section
afin de repérer les liens morts. Ça vient scanner quotidiennement les
pages HTML locales, pour les pages en anglais (*.en.html), puis en
rajoute une louche pour les autres langues (au cas où il y ait des liens
spécifiques), et ça logue les erreurs. Les scripts n'ont pas été mis à
jour pour Squeeze, donc maintenant ça déconne « un peu ».

> Voici les paquets que j'ai trouvé et qui remplissent le besoin :
> htcheck, linklint, linkchecker et w3c-linkchecker

Merci de démarrer l'étude en tout cas.

> Quelques caractéristiques d'après ce que j'ai vu et compris de la doc :
> 
> htcheck:
> 	- enregistre les résultats dans une base de données MySQL
> 	- analyse du HTML fourni par HTTP (pas HTTPS, FTP, etc.)
> 	- exécution en ligne de commande
> 	- codé en C++

> htcheck-php:
> 	- codé en PHP

On peut oublier tout de suite : pas de PHP sur le serveur, et pas
l'intention d'en mettre.

> linklint:
> 	- analyse du HTML fourni par HTTP (pas HTTPS, FTP, etc.)
> 	- a priori, possibilité de gérer l'authentification HTTP
> 	- exécution en ligne de commande
> 	- sortie texte ou html, en un ou plusieurs fichiers; résumé sur la
> sortie standard
> 	- codé en Perl
> 
> linkchecker:
> 	- protocoles disponibles : HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:, Telnet
> 	- authentification utilisateur/motdepasse pour HTTP, FTP et Telnet
> 	- exécution en ligne de commande
> 	- sortie texte, html, csv, ...
> 	- codé en Python
> 
> w3c-linkchecker (checklink):
> 	- authentification utilisateur/motdepasse
> 	- protocole HTTP (peut-être FTP et NNTP ?)
> 	- utilisable en ligne de commande ou script CGI
> 	- authentification utilisateur/motdepasse
> 	- codé en Perl
> 
> 
> J'imagine une solution assez simple avec linkchecker par exemple mais
> c'est un peu prématuré pour l'instant.
> 
> Qu'en pensent les contributeurs au site ?

Perl c'est déjà pas mal utilisé sur le serveur, donc c'est un plus,
Python est sans doute jouable aussi.

> Peut-être qu'on devrait continuer sur debian-www@l.d.o ?

Ça serait sans doute mieux, surtout si personne d'autre ne répond (je ne
suis pas très au point là dessus, mais Kåre y avait jeté un œil il y a
quelques temps par exemple).

Amicalement

David

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.12 (GNU/Linux)

iQIcBAEBCAAGBQJQmntgAAoJELgqIXr9/gnyrl0QAI+1/mGJZj9g4iHy5WoYNkna
MWGcgybMwESI02Wcj1AQDm95Zosfu/0QSTElxxruuwCbEt/MuUaWHxiT4L+TPqNV
0qq7IoGVTk2Hw1v+53blx8BcNjgFIqts//z1NIVQAWs1SHlBj/J9T1evVpMI0uOR
dNYpPC/55U0HJ0edirD2d++AwrVpvKO1NxhYiSKzx7OABTKxuO8bz/+EDA3SWxps
Y89RZM+kQ+aTQ4SjDAZPWcIPhNG0CZAx48qLM61Qi7fAfYMqg+jzU2T7l+TKVTQU
3B5IP0jXrW8q16smsDuUiLl5VvMhAvYULEocnSR9CjwFsfMy8SNkW15/6O2g3Fza
//jp5MqVC+4DJL1GfWK5byibXGwtL9C8tdHS2YAPkk2qV5WndOoO3KHmRcFXDkAU
6gM1rqHe95cG0Tm/RSGhgZl6wv8fjLXC7m+tcz3RxZGb6Hat/OMcPrPNKCT66Bxv
HKn81l7xztVORxZ3Nv4U07Yv+ZrU2t8vP8qkCUxETZ6S2/Djf41Jj6boPcFAR1Q4
3MjPubYyIdzMQSgXsopnexWwU+S9FGl0NWwPCdSabSWbgPNK9ci5QXHIKNmul7fs
+3SIOhlZlIB5sCS4NRgNcvHzLOVHAiq2Yfw9DpxfeRtFKB9GVRZbFm02Oreme4Sm
CMNLFTFR7/XTa4a/N6lX
=w4Lv
-----END PGP SIGNATURE-----


Reply to: