Bonjour à tous

Chaque répertoire du site d'égyptologie sur lequel je travaille possède un sous-répertoire "photo" qui contient les images utilisées dans les pages HTML du répertoire.
Certaines de ces images sont référencées par des balises <img> qui sont dans la page, mais la plupart le sont indirectement, soit par des balises <img> générées par des scripts, soit par des appels par script à des pages spécifiques destinées à afficher les images en grand format.

Le résultat pratique, c'est que la plupart des images ne sont pas référencées par Google.
Je cherche un moyen de faire qu'elles le soient, car ces images représentent la principale richesse du site, du moins pour les personnes qui ne sont pas des spécialistes de l'égyptologie, mais peuvent être intéressées par des images magnifiques des peintures et gravures trouvées dans les tombes égyptiennes et préservées de la destructions par le climat désertique et la situation souterraine de ces tombes.

Merci pour vos recommandations.
Est-ce que les scripts alimentent les champs title et alt des balises img ?

Longdescr aussi peut servir.

Je pense que cela est pris en compte pour les indexations
Merci de ta réponse

Les scripts sont de deux types:
diapo('nom-de-l-image')

Qui génère
<img src="photo.nom-de-l-image.jpg" alt="" onclick="PopupImage('nom-de-l-image')">

et
imgView('nom-de-l-image', 'texte')

qui génère
<span onclick="PopupImage('nom-de-l-image')>texte</span>

En fait c'est un peu plus compliqué, les scripts ont des arguments supplémentaires concernant la position de l'image, un éventuel sous-titre de celle-ci, etc.
Le script PopupImage contient essentiellement
var popupWindow = open('/popupImage.php?......');

Cela ouvre une fenêtre qui lance un script php, lequel retrouve l'image et fait différents calculs avant de l'afficher dans un fenêtre popup, comme il se doit.

Les image en question ne sont pas prises ne compte par Google, y compris celles générées par le script diapo.
Par contre les quelques images qui sont directement écrites sous la forme
<img src="...." alt="">
sont bien prises en compte par Google.
Le problème est bien que Google, contrairement à ce qui est écrit dans la doc, ne prend pas vraiment en compte ce qui n'est pas écrit "en dur" dans le HTML et est généré par script.
Ajouter des alt et des title nécessiterait d'ajouter des paramètres dans les appels de script, ce que mon utilisateur unique (le propriétaire du site) ne tient pas à faire, surtout que nous parlons d'un site qui contient près de 1000 pages, 10000 appels à diapo, 30 à 50000 appels à imgView; donc pas question de tout reprendre à la main et d'ajouter des paramètres.

Ce que j'ai fait pour l'instant, c'est un programme écrit en php qui réalise les opérations suivantes:
- pour un répertoire donné, il recherche toutes les pages, analyse le contenu, trouve les balises <img> et les appels aux scripts diapo et imgView, en déduit les noms de images
- pour chaque image il crée une image réduite
- il génère ensuite une page HTML qui contient ces images réduites, lesquelles affichent les images "réelles" en popup
Regarder par exemple table des illustrations
Mais une fois cette page créée, la question devient "comment faire prendre en compte ces pages par Google"?

Note: dans cet exemple, il y a 3 pages de documentation et deux diaporamas. On peut afficher la page de doc ou le diaporama correspondant à chaque groupe d'images en cliquant sur le titre du groupe.
Modifié par PapyJP (10 Feb 2017 - 11:53)
De ce que je vois dans le source, il devrait au moins indexer toutes les images '*_th'

Je ne sais pas s'il "comprend" que cela indique une image
onclick="PopupImage('expo_bruxelles_rb_346.jpg')"


Si tu recherches "réserve du duer" tu trouveras deux de mes photos sur les douze de la page qui les contient, un diaporama , (heureusement dès le début des résultats). Après, je n'ai pas non plus renseigné Alt et Title mais j'ai du texte pour chaque photo et le texte de recherche est dans la phrase au dessus des photos.

Donc il n'y a pas de raison "évidente" pour que google images privilégie ces photos sur les autres.

Par contre, les images apparaissent "directement" dans mon texte contrairement à ton diaporama

<a class="thumb" href="album/photos/duer_011.jpg" title=""><img src="album/mini/duer_011_p.jpg" alt="" />
C'est bien parce que j'ai constaté que Google ne prenait pas en compte les images générées par script que j'ai voulu faire quelque chose et que j'ai inventé un outil qui fabrique les pages "illustrations". Je pense que s'il essaie de scanner ces pages il va prendre ces images.
Ma question, c'est plutôt: comment faire pour assurer qu'il les scanne effectivement sans mettre des liens visibles sur ces pages, ce que je voudrais éviter?
Modérateur
Bonjour PapyJP,

Plutôt que de travailler à la volée, pourquoi ne pas faire un script qui se base sur vos quelques fonctions existantes pour créer une page html dans laquelle seront regroupées toutes vos images ?

A la suite de quoi je veillerais à bien annoter le fichier robot.txt (certes les robots n'en font qu'à leur tête face à ce fichier mais sait-on jamais ?).

Enfin j'ajouterais l'url de ce fichier dans les Google developer tools (et Bing bien entendu), il me semble de mémoire qu'on puisse faire ainsi.

Ainsi au final sur le site il n'est nullement fait mention de cette page et les images restent toutefois disponibles aux banques d'image.

Et pourquoi pas pousser le vice en travaillant ensuite la seo de la page pour qu'elle se positionne correctement sur quelques mots-clés offrant ainsi au visiteur le loisir de consulter ce "recueil d'image sur l’égyptologie" mais tout en le gardant indépendant vis-à-vis du site.


Qu'en pensez-vous ?
Bonjour Greg

Je préfère faire une page par répertoire à cause du nombre énorme de photos qu'il y a dans ce site (de l'ordre de 15000) Il y a environ 120 répertoires en cause, c'est plus gérable.

Je n'ai pas encore décidé si je fairai une page HTML générée par PHP de façon automatiques (c'est à dire à chaque appel) ou manuelle par appel du gestionnaire du site à chaque modification. Il y a du pour et du contre pour chaque option. De toute façon c'est pour l'essentiel le même bout de code, qui consiste à rechercher les fichiers images référencées, à générer les miniatures si elles n'existent pas déjà et à faire du HTML pour les afficher. La principale différence, c'est de savoir si on affiche tout cela en ligne par une commande echo ou si on sauve le contenu dans un fichier, c'est peu de chose comparé au reste.

En ce qui concerne le fait d'ajouter l'url de ces fichiers dans le Google Search Console, j'ai fait un test qui ne s'est pas révélé très encourageant. Il a bien pris en compte le fichier sitemap qui les contenait, mais j'ai l'impression qu'il n'en a rien fait parce que justement il n'y avait pas de liens vers ces pages dans les autres pages du site.
Mais peut être était-ce dû au fait que ces pages d'illustrations étaient dans la partie "test" du site?
Il est clair que les "renifleurs" se méfient de tout ce qui pourrait ressembler à des tricheries dans le référencement. J'ai déjà eu le même genre de problème avec un autre site. Je m'en suis tiré en mettant des liens qui n'attirent pas trop l'attention du visiteur. C'est sur ce point surtout que j'aimerais vos avis.
Je marque le sujet comme résolu, même si on pourrait sans doute gloser un certain temps sur cette problématique.
Je peux difficilement faire des tests de référencement pour le moment, je verrai lorsque le site aura été migré au 'nouveau look" que nous préparons depuis 18 mois.
Ce que j'ai fait pour le moment sur le site de test, c'est de mettre des liens vers les pages d'illustrations dans la page qui donne la "carte" du site. Cette page est longue, les liens sont en bas et donc ne sont pas visible à l'affichage, et quand l'utilisateur fait un scroll les liens passent en display:none
Un peu bidouillesque, certes, mais ça devrait marcher.