a écrit :
Google sanctionne les sites qui offrent le même contenu sur deux URL distinctes (les points sont répartis), et demande à ce que l'on préfère une URL. Cela peut se faire soit par une redirection, soit par l'ajout de la balise <link rel="canonical" href=""/>, soit par l'envoi d'en-têtes HTTP => https://support.google.com/webmasters/answer/139394?hl=fr[/url]
Avec canonical je n'ai encore pas bien compris le truc. D'après ce que j'ai compris, il ne faut donner l'indication que si on est sur une « mauvaise » page, mais surtout, surtout pas si on est sur la « bonne ».
Est-ce juste ou faux ?
Ensuite, faut-il préférer la meta ou l'enn-tête HTTP ?
La chose à remarquer c'est qu'en fait j'ai l'inverse: je ne propose pas le même contenu sur deux URL différentes, mais deux contenus sur la même URL.
Dans ce cas, la solution la plus rationnelle est-elle la redirection systématique ?
L'URL sans précision de la langue peut être pratique pour les e-mails automatiques par exemple.
Vous avez perdu votre mot de passe ? allez sur machin.com/pass-perdu/ est plus facile que de checker la langue de tous les utilisateurs et de fournir l'uRL exacte.
a écrit :
Toutefois, il est très courant de réintroduire la navigation par langue dans l'URL, soit par une redirection, soit en ajoutant le bon paramètre dans les urls de la page. car avec ainsi on s'assure que: – l'historique reste consistant, je retrouverai bien la même page.
– Le copier/coller de l'URL mènera bien toujours à la même ressource. Et donc si j'envoie un lien sur un forum/media-social/mail, je m'assure qu'ils voient bien la même page. (j'ai déjà eu des déboires à cause de cela)
Bonne remarque. En fait je le faisais déjà, même si on se connecte sur monsite.com/page, tous les liens du menu par exemple sont en monsite.com/fr/xxx. Mais il n'y a pas de redirection; simplement, dès qu'on clique sur un lien interne au site alors on passe dans le dossier de la langue actuelle.
a écrit :
– Certaines ressources peuvent ne pas exister dans une langue
J'avais oublié ce fait ! Du coup ça m'amène à une autre question.
J'ai un forum où il y a une section en français et une section en anglais.
Normalement c'est bien séparé; si on navigue en français, on ne peut normalement pas arriver sur un topic anglais et inversément.
Par contre la base de donnée derrière est commune. Ce qui fait que si on tape
monsite.com/fr/forum1/topic123
et
monsite.com/en/forum1/topic123
On tombe sur la même page avec les mêmes posts; l'interface (connexion/répondre/citer/éditer/etc. est adaptée et différente, mais évidemment pas les posts eux-mêmes.
Est-ce qu'il y a risque de contenu dupliqué dans ce cas ? sachant que normalement, à moins d'un bug ou d'une saisie manuelle, on ne peut pas tomber sur le topic anglais si on était en français.
@Tropiques:
Les questions que tu poses là, hormis la question de la redirection où pas sur laquelle je suis aussi curieux, sont plus une question de cuisine interne que de référencement à proprement parler je pense.
Il faut que tu t'organises selon ce qui te paraît le plus pratique, le plus fonctionnel et le plus maintenable. Tu peux tout autant avoir un index.php général qui redispatch tout, ou des sous-dossiers ayant des arborescences à peu près parralèles.
Perso je pense que l'index.php qui dispatch tout est le mieux. Mais ça dépend de plein de choses: si le contenu offert dans les multiples langues est plutôt identique ou plutôt totalement différent, comment les données sont stockées (plusieures bases ou une seule ? plusieurs serveurs avec un par langue ?)
De mon côté je reste malgré tout un très très petit site; j'ai un seul serveur et une seule base de données pour toute les langues et ça suffit largement. Donc ça me paraît plus naturel d'avoir un seul et unique fichier index.php racine qui gère tout et qui divise le travail.
Mais si j'avais plusieurs sites et/ou plusieurs bases divisées par langue et/ou des particularités spécifiques à prendre en compte seulement pour telle ou telle langue qui ne sont pas gérables en base/fichiers, peut-être que ce serait effectivement mieux d'avoir des sous-arborescences parralèles.
A la base il me semble que c'est plutôt quelque chose à éviter, le copier-coller est l'ennemi n°1 du programmeur.