Vérificateur de liens Web
-
Faire un programme qui, lorsqu'on lui donne comme argument une
URL de la forme
http:
,
récupère le document correspondant et en extrait les liens.
On ne tiendra compte que des tags A HREF
et IMG
, ainsi que de la directive BASE
.
Exemple de corrigé en perl
Un début de corrigé en C
-
Améliorer ce programe pour qu'il vérifie l'existence des
documents indiqués par ces liens.
Exemple de corrigé
-
Rajouter la vérification des ancres à l'intérieur des documents
(liens de la forme
...#ancre
pointant vers A NAME
)
-
Tenir compte des codes de réponse, en particulier
3xx
.
Rajouter une option -file
qui indique le code source
du fichier HTML, de telle sorte que le programme modifie ce fichier
si la page a été déplacée de façon permanente (301
).
-
Faire une version récursive.
-
Rajouter les protocoles
ftp:
, mailto:
,
https:
, etc.
Références :
Protocoles HTTP
Voir aussi un court texte qui explique combien la fonction connect
est en réalité difficile à gérer.