18041 sujets
Questions générales et questions de débutants
Bonjour,
Il est vrai que pour parler de «l'utilité» il aurait mieux valu écrire sur langue-francaise.fr ou cafe-philo.com...
À priori tout ce qui n'est pas une page web, pour commencer. Les «dossiers», lorsqu'ils ne correspondent pas à une page HTML du site mais plutôt à une page de listing de fichiers générée par le serveur web, sont à priori à exclure.
Ça dépend, on peut difficilement répondre pour toi sans connaitre ton site. Que sont ces «caches» exactement? Ce sont des contenus indexables (HTML, PDF, RSS...)? Et tu souhaites les voir indexés par les moteurs de recherche ou non?
Les moteurs de recherche indexent les images utilisées dans les pages HTML (balise <img>) ou liées depuis une page HTML (lien pointant vers une image). Ils les associent à des mots-clé contenus dans le nom du fichier, le texte alternatif d'une image lorsqu'elle est utilisée, l'intitulé du lien, et le texte dans les environs immédiats de l'image.
Je ne crois pas qu'ils utilisent les sitemaps pour indexer les images, car dans ce cas la seule information donnée sur l'image serait le nom de fichier, ce qui n'aide pas à proposer une recherche d'images pertinente. Donc autant ne pas encombre un sitemap de lien vers des images.
Rappelons enfin qu'un sitemap n'interdit pas l'accès à des pages, documents ou dossiers en ne les listant pas.
laoseb a écrit :
Je ne suis pas là pour parler de l'utilité !
Il est vrai que pour parler de «l'utilité» il aurait mieux valu écrire sur langue-francaise.fr ou cafe-philo.com...
laoseb a écrit :
Je voudrais savoir ce qu'il est mieux d'exclure d'un sitemaps ?
À priori tout ce qui n'est pas une page web, pour commencer. Les «dossiers», lorsqu'ils ne correspondent pas à une page HTML du site mais plutôt à une page de listing de fichiers générée par le serveur web, sont à priori à exclure.
laoseb a écrit :
UN dossier contenant des caches (des milliers de page texte) dois-je l'exclure ?
Ça dépend, on peut difficilement répondre pour toi sans connaitre ton site. Que sont ces «caches» exactement? Ce sont des contenus indexables (HTML, PDF, RSS...)? Et tu souhaites les voir indexés par les moteurs de recherche ou non?
laoseb a écrit :
Les images ?
Les moteurs de recherche indexent les images utilisées dans les pages HTML (balise <img>) ou liées depuis une page HTML (lien pointant vers une image). Ils les associent à des mots-clé contenus dans le nom du fichier, le texte alternatif d'une image lorsqu'elle est utilisée, l'intitulé du lien, et le texte dans les environs immédiats de l'image.
Je ne crois pas qu'ils utilisent les sitemaps pour indexer les images, car dans ce cas la seule information donnée sur l'image serait le nom de fichier, ce qui n'aide pas à proposer une recherche d'images pertinente. Donc autant ne pas encombre un sitemap de lien vers des images.
Rappelons enfin qu'un sitemap n'interdit pas l'accès à des pages, documents ou dossiers en ne les listant pas.
Encore merci à toi pour cette réponse.
Le cache contient, des fichiers textes, chacun contient une recherche dans mon dico anglais/chinois ou fr/chinois. En gros à terme il n'y aura plus la moindre requête dans la base de donnée. Il contient également l'équivalent pour des listes de voc...
Utile ou pas alors ?
ps : les robots indexent ce dossier en tous cas déjà.
Merci
Le cache contient, des fichiers textes, chacun contient une recherche dans mon dico anglais/chinois ou fr/chinois. En gros à terme il n'y aura plus la moindre requête dans la base de donnée. Il contient également l'équivalent pour des listes de voc...
Utile ou pas alors ?
ps : les robots indexent ce dossier en tous cas déjà.
Merci
laoseb a écrit :
Utile ou pas alors ?
À priori non. Tu peux souhaiter que les utilisateurs atterrissent sur ta page de recherche avec un résultat affiché (dans ce cas, il faut que ton formulaire de recherche envoie les mots à chercher en GET, pour que chaque résultat de recherche ait sa propre URL), mais à priori pas qu'ils débarquent directement sur tes fichiers de cache, si?