PHPCrawl : robot d'indexation en PHP

le 26/05/2007 à 16:21
PHPCrawl : robot d'indexation en PHP
PHPCrawl est un groupe de classes écrites en PHP, pour réaliser un spider de site Web. On peut appeler cela une bibliothèque de spider en PHP.

Le robot passe en revue le site Web, et retourne des informations sur chaque page, lien, fichier, trouvé. En modifiant une méthode magique dans la classe principale, on peut décider de ce qui doit arriver au contenu chargé, et diriger les évolutions du robot sur le site.

Il y a aussi PHP snoopy, qui implémente un navigateur Web en PHP. Il existe toujours, mais commence à vieillir.

- PHP Crawl
- PHP Snoopy

Commentaires

Ecrire

Ecrire un message

Votre message vient d'être créé avec succès.
LoadingChargement en cours