Controler le contenu d'une page Web

Répondre
roger
le 29/11/2008 à 02:04
roger
Bonjour,
Je souhaite réaliser un petit script, pour trouver la place de mon site chez google à partir d'un mot clé.

Mon objectif, retrouver facilement mon site pour petit à petit lui faire gagner des places sur ce moteur de recherche ;-)
Plusieurs solutions s'offrent à moi.
par exemple :
<?
$mot_cle = "roger+benoist";
$mot_cache = "surmonarbre";
for ($i=1;$i=100;$++) //je recherche dans les 1000 première pages
{
$num_page = $i * 10;
$fp = fopen("http://www.google.fr/search?q=".$mot-cle."&start=".$num_page."","r"); //lecture du fichier
while (!feof($fp)) { //on parcourt toutes les lignes
$page .= fgets($fp, 4096); // lecture du contenu de la ligne
}

if ( eregi($mot_cache,$page)); //on contrôle la présence d'un autre mot utilise sur le site
{
echo "la site est visible en page $num_page";
}
}
fclose($fp);
?>


mon problème : le script ne fonctionne qu'une fois, puis se plante systèmatiquement.
Remarque : avec un autre site le script fonctionne.

exemple similaire avec le site de phpfacile :
<?php
$mot_cache = "forums";
$fp = fopen("http://www.lephpfacile.com/","r"); //lecture du fichier
while (!feof($fp)) { //on parcourt toutes les lignes
$page .= fgets($fp, 4096); // lecture du contenu de la ligne
}

if ( eregi($mot_cache,$page)); //on contrôle la présence d'un mot utilise sur le site
{
echo "le mot $mot_cache existe sur le site";
}
fclose($fp);
?>



Ma question, pensez vous que l'on puisse réussir à passer ce petit blocage ?
D'avance merci
roger
roger
le 29/11/2008 à 02:16
roger
Oups :
sur la boucle for, corriger $i++ et non $++
évidement
roger
LA GLOBULE
le 29/11/2008 à 13:50
LA GLOBULE
Attention au fopen distant qui peut être bloqué chez de nombreux hébergeur.
Pour ce genre de truc (récupérer une page distante), curl reste la meilleure solution.
Répondre

Ecrire un message

Votre message vient d'être créé avec succès.
LoadingChargement en cours