Ce TP utilise les techniques des deux précédents.

Proxy HTTP

C'est un serveur/client HTTP qui sert d'intermédiaire pour l'accès au web. Le client (s'il est bien configuré pour utilisé ce proxy) enverra toutes ses requêtes HTTP à ce serveur, qui interprétera l'URL et les redirigera vers le serveur HTTP de l'URL. Il retransmettra à son client les données qu'il reçoit en réponse.

À l'ENS il y a la machine www-cache.ens.fr qui fait tourner un proxy sur le port 80. La syntaxe d'une requête proxy est par exemple :

GET http://www.di.ens.fr/~granboul/enseignement/mmfai/syst1999-2000/tp10.html HTTP/1.0

  1. Faire un proxy simple. Celui-ci se contente de faire la transmission des informations, sans aucun filtrage ni vérification.
    [corrigé]
  2. Modifier le proxy de l'exercice précédent pour qu'il n'accepte que les connexions depuis une certaine machine.
  3. Modifier le proxy pour qu'il interprète certaines réponses (3xx) en cherchant un champ "Location" et en faisant directement la requête correspondante.
  4. Rajouter le filtrage de la publicité (ad.doubleclick.net par exemple)
    Application à AltaVista