Il est fou le GoogleBot ?

Tout ce qui concerne l'informatique en général : hardware, pilotes, logiciels...
Bien sûr ici on ne parle pas de gravure !

Il est fou le GoogleBot ?

Messagepar Roms6 » 17 Avr 2006 20:32

Avis au Webmasters, j'ai un gros problème : le GoogleBot n'arrette pas de crawler cette page sur mon site : *ttp://www.gamenews-fr.com/.html qui ne mène qu'à un 403 forbidden, et je n'arrive pas à comprendre pourquoi il tient à visiter cette page alors qu'aucun refferer n'y mène... :?

Bref, j'ai donc utilisé mon fichier robots.txt et ai rajouté dans Disallow: /.html mais là où ca coince vraiment c'est que le GoogleBot n'en a que faire et continue d'aller sur cette page... :shock:

Une solution pour ca ? :roll:
Image
Roms6
Membre permanent
Membre permanent
 
Messages: 653
Enregistré le: 01 Fév 2005
Localisation: Etampes

Messagepar CapJack » 17 Avr 2006 22:38

Ben vi : ça veut dire que, quelque part sur ton site (ou sur un autre site ?) un lien existe vers cette adresse... GoogleBot parcourt obligatoirement l'arborescence de ton site, donc le problème vient de là : vérifie toutes tes pages !
[Recompressez vos mp3 avec WinMP3Shrink] - Le port@il de CapJack
"travailler : vi. (latin populaire *trepaliare, torturer, du bas latin trepalium, instrument de torture)"
La preuve que les hommes sont tous égaux ? La bêtise humaine est uniformément répartie à la surface de la Terre...
Avatar de l’utilisateur
CapJack
Charlot promu Pierrot
Inconditionnel
 
Messages: 3877
Enregistré le: 21 Mar 2004

Messagepar gowap » 17 Avr 2006 23:17

Pour économiser la bande passante, Googlebot télécharge le fichier robots.txt une fois par jour uniquement ou après extraction d'un grand nombre de pages du serveur. Il peut donc s'écouler un certain délai avant que Googlebot soit informé des modifications apportées au fichier robots.txt. Googlebot est également réparti sur plusieurs ordinateurs, qui conservent chacun leur propre version du fichier robots.txt.
Aucune aide par mail ou Message Privé (n'insistez pas)
Prenez connaissance du règlement (à question illégale, sujet verrouillé),
commencez par faire des Recherches et décrivez clairement vos problèmes.

Lisez les articles et tutoriels
Avatar de l’utilisateur
gowap
Administrateur
Administrateur
 
Messages: 16113
Enregistré le: 01 Aoû 2002

Messagepar Roms6 » 17 Avr 2006 23:27

Merci :)

De toute façon je suis pas certain que le fait qu'il référence cette page aurait changé quelque chose mais bon autant qu'il référence une "vraie" page.

Pour ce qui est du refferrer ca m'intrigue, normalement je devrais voir tous les refferers dans mes stats... :o
Image
Roms6
Membre permanent
Membre permanent
 
Messages: 653
Enregistré le: 01 Fév 2005
Localisation: Etampes

Messagepar Roms6 » 20 Avr 2006 6:15

Bon, étant donné que tous les bots ont fait de même (ca m'énerve de voir un bot crawler une page pour rien :cobra: ), j'ai retiré le Disallow: /.html

Et j'ai fait dans l'utile pour mon .htaccess :

ErrorDocument 403 *ttp://www.gamenews-fr.com/403.html
Redirect permanent /403.html *ttp://www.gamenews-fr.com/

C'est réglé :D
Image
Roms6
Membre permanent
Membre permanent
 
Messages: 653
Enregistré le: 01 Fév 2005
Localisation: Etampes



  • Publicité

Retourner vers Le coin informatique

 


  • Articles en relation
    Réponses
    Vus
    Dernier message

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 0 invités

cron