8741 sujets

Développement web côté serveur, CMS

Bonsoir.

Après plusieurs heures de casse-tête et de recherches de partout, je m'avoue vaincu et demande de l'aide.

J'avais mon site en version http (depuis plus de 10 ans). Pour des raisons évidentes de contraintes de référencement (Google notamment estimant que même un site non marchand en http est un danger et doit disparaître à terme de tout référencement), j'ai souhaité le passer en https.

A cette fin, sachant que je suis hébergé par OVH, j'ai d'abord demandé mes certificats SSL (réponse d'OVH : SSL activé pour l'adresse du site avec www au préalable et sans www au préalable). Apparemment, j'ai LETSENCRYPT-DV.

Puis j'ai modifié mon fichier .htaccess (en suivant les consignes d'OVH sur leur page d'aide) et à présent il y a cette règle :

## transformation de toutes les adresses http en https, tout en conservant intact le reste de l'URL situé après Smiley ohwell /

RewriteEngine On
RewriteCond %{HTTPS} off
RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]


Jusqu'ici, tout va bien, puisque dans tous les cas, quand je consulte mes pages, à présent elles sont en HTTPS et mes navigateurs indiquent un cadenas fermé en toute sécurité.

MAIS .... le gros problème est celui du référencement Google.

J'ai eu la surprise de passer revoir un petit peu ce qui se passe sur mon Search Console au bout de quelques semaines, et aaaaaaaaaaaaaaaaaahh (douleur lancinante avec un besoin de zénitude car j'ai certainement perdu des années de bénéfice de référencement), Google a supprimé l'indexation de dizaines de pages en raison d'une redirection. Il me reste à peine 7 pages référencées (des vestiges qui ne sont pas vraiment des pages d'ailleurs) et plus de 100 ont été dégagées. En y réfléchissant, c'est normal, car si on redirige, ce n'est pas pour que la page non souhaitée soit encore référencée.

Et c'est là que je me dis que j'ai été stupide, car une redirection est censée conduire vers une autre page, qui doit elle-même exister. Me trompe-je ? Parce que pour l'instant, mes pages http sont uniquement transformées en https, mais avec une commande bidouillée, j'ai l'impression.

Pour donner plus d'explications :

quand je veux indexer une page, je demande à Google Search Console d'explorer une page.

Exemple de lien : http://www.exempledesite.fr/pageareferencer.html

Là, il trouve la page, mais il m'indique qu'il ne peut pas en tenir compte car il y a une redirection (une redirection 301).

Donc, j'essaye la vraie version théorique
https://www.exempledesite.fr/pageareferencer.html

Et là, Google Search Console ne trouve PAS de page.
C'est donc à mon avis qu'il n'existe PAS de page en https "nativement" selon Google (pourtant si je tape un nom de page en https sur mes navigateurs, les pages fonctionnent bel et bien).



MA QUESTION EST ALORS :
comment avoir des pages HTTPS "natives" ?

Pour mon site, je n'utilise pas WORDPRESS ou autre "nouveauté", mais Dreamweaver (bien pratique sous divers aspects, même si je n'utilise pas de nombreuses fonctions, puisque je code à présent moi-même en html et css, sans que dreamweaver ponde des codes farfelus).

Dois-je faire un réglage dans Dreamweaver pour que les pages soient https dès le départ ?
Dois-je faire un réglage dans mon serveur OVH ?
Dois-je faire un réglage à propos du FTP (sur Dreamweaver et/ou OVH) ?

Ou bien, la règle du htaccess citée plus haut est-elle la vraie transformation https normale ? (j'en doute fortement).

Ou bien, il faut présenter la chose différemment dans Google Search Console pour demander d'indexer une page ?

Ou enfin, ai-je complètement raté l'analyse du problème ??? Il faut voir différemment, voir autre chose, faire autre chose ?


TOUTES LES REMARQUES, OBSERVATIONS, ANALYSES sont les bienvenues. Je suis totalement néophyte sur cet aspect de la programmation et hébergement HTTPS. Idem pour les langages : je ne connais que HTML5 et CSS3. Pas de PHP ni Java ni autre.

Merci d'avance.
Alex
C'est NGINX qui prends du temps pour le dns je pense, est-ce que en attendant quelques heures ça c'est placé ? Smiley sweatdrop
2lwess, merci de vous pencher sur le sujet.

Je ne sais pas si c'est NGINX ou APACHE qui gère (je n'y connais rien du tout, et j'ai d'ailleurs cherché ce mot sur internet).

Concernant les pages, on ne parle pas de quelques heures, mais de plusieurs mois depuis que la modification dans .htaccess a été faite. J'avais noté la date justement en observation dans mon fichier, et c'était le 5 mars 2024 que j'ai mis les Rewrite en place.

Google Search m'indique une dernière exploration en date du 29 mai au 4 juin pour les différentes pages. Elles ont toutes été dégagées : "Page avec redirection /
Ces pages ne sont pas indexées ni diffusées sur Google".

Google Search Console a dégagé les nouvelles pages que j'ai créées (admettons, le temps que cela soit "accepté") mais également mes très anciennes pages qui sont juste passées de http à https (en théorie) avec la modification htaccess.

----

Vu votre question, peut-on penser qu'a priori la simple modification dans htaccess serait la SEULE opération à réaliser et que les pages sont censées exister en https ?
Mise à jour du problème :

Apparemment, c'était un simple problème de Google Search Console.

Mon compte analysait la version basique du site (en http)

Pour régler le problème j'ai demandé la création d'une nouvelle propriété. Cette fois-ci j'ai demandé la création d'un domaine (qui inclue http et https).

Google m'a alors demandé de confirmer que c'était bien moi : il m'a donné un long texte commençant par "google-site-verification..." à ajouter en TXT dans mes DNS sur OVH (web cloud / noms de domaine / lenomdedomainedemonsite / zone DNS / ajouter une entrée / champs étendus / TXT ).

Après enregistrement, j'ai attendu 30 secondes, puis j'ai demandé la vérification par Google qui m'a bien reconnu.

Là, j'ai testé avec trois pages en HTTPS, et Google m'a répondu "Cette URL est sur Google / La page est indexée / La page est diffusée via HTTPS", alors qu'auparavant c'était la catastrophe affichée.

Je vais attendre 24 heures pour voir l'indexation des pages (pour l'instant c'est "traitement des données en cours...") et vous dirai ce qu'il en est.

Je pense que c'était juste une fausse frayeur et que tout semble bon à 95%. Si c'est ça, c'est donc que la modification dans .htaccess était bien la SEULE chose à faire (après avoir demandé les certificats SSL sur OVH) pour avoir du HTTPS qui fonctionne.
Bonjour,

le problème semble se régler, mais ma petite contribution ne sera pas inutile.
Pour ce qui est des serveurs Ngnix ou Apache, ce sont deux serveurs open-source dominants sur le marché actuellement. Nginx est un peu plus performant, mais pour des petits sites, il doit y avoir une différence peu perceptible. Par contre, leur configuration est assez différente. Et je préfère de loin Apache et son fichier htaccess.
a écrit :
Je ne sais pas si c'est NGINX ou APACHE qui gère (je n'y connais rien du tout, et j'ai d'ailleurs cherché ce mot sur internet).

Pourtant, vous prétendez avoir manipulé le fichier htaccess, qui est celui du serveur Apache ! Vous connaissez quand même un peu...
!important
Lors d'un passage de http en https, il est très important de revoir tous les liens du site (les balises Meta telles que property="og:url" content="https://monsite.fr">, rel="alternate" hreflang="fr" href="https://monsite.fr>, le CDN s'il y en a un, etc. Et bien sûr et surtout, les données structurées en LD-JSON s'il y en a. Là ce serait une catastrophe de les laisser en http, cette balise étant justement destinée à faciliter la recherche des moteurs. Il faut penser à TOUS les liens qui sont sur la page. Ne pas oublier le sitemap.xml, qui est toujours en http. Le mieux serait de faire le changement avec un outil dédié. Si vous manipulez la console texte sous linux, c'est facile d'une seule commande. Sinon, il y a d'autres outils, parce que 100 pages à la main...
a écrit :
Et c'est là que je me dis que j'ai été stupide, car une redirection est censée conduire vers une autre page, qui doit elle-même exister. Me trompe-je ?

Non, c'est bien le cas.
a écrit :
Parce que pour l'instant, mes pages http sont uniquement transformées en https, mais avec une commande bidouillée, j'ai l'impression.

Non, la commande du htaccess est bonne, elle n'est pas "bidouillée".
Modifié par Bongota (06 Jun 2024 - 12:29)
Bongota, merci pour ces conseils supplémentaires.

Alors j'ai bien Apache, puisque j'ai changé le .htaccess (maintenant je sais ^^)

Pour le reste, j'ai toujours fait attention, même avant de réfléchir à un passage en HTTPS, à ne faire que des liens relatifs avec les signes "/" et ".." pour tout chercher en interne sans avoir l'adresse complète incluant "http://www".

Et pour le sitemap, oui, c'est vrai qu'il faut que je le fasse ! Mais pour l'instant, Google peut s'en sortir parce que j'ai un énorme plan du site pour les utilisateurs, qui renvoie vers chaque page et thématique. C'est donc un sitemap par défaut, puisque je demande à Google d'actualiser l'indexation avec cette page principalement.

Mais bon, le sitemap est important dans tous les cas (pour les autres moteurs d'ailleurs) et je vais m'en occuper encore cette semaine.

Pour les autres points cités :

- je n'ai pas de CDN (pour accélérer la vitesse)
- je n'ai pas de balise meta property
- je n'ai pas de balide meta content qui pointe sur un site (en revanche j'ai author, designer, owner, description, keywords, à l'ancienne !)
- je n'utilise pas LDJSON (traitement de données structurées avec du JavaScript)

donc les risques sont écartés.

La suite et fin demain (en principe ce sera bon).
Le sitemap, vous pouvez le laisser un mois tel qu'il est avant de le changer.
Ce serait juste une bonne idée d'avoir des balises og: Elle peuvent servir pour pas mal de choses, notamment les réseaux sociaux.
Bonne continuation.
Sujet réglé.

C'était donc bien le problème de Google lui-même.
Il fallait demander un nouveau critère d'analyse, afin d'intégrer http et https.

Pour le passage du https, il suffisait d'avoir le certificat sur son serveur, et de faire les redirections 301 permanentes pour guider tout le monde vers le https (sachant que les pages sont en doublon http et https).

Merci d'avoir aidé à trouver la solution.