5433 sujets

Sémantique web et HTML

Bonjour,
suivant les recommandations de https://www.w3.org/Submission/ccREL/ j'ai ajouté sur la page html de mon site le code suivant, afin de rendre ma licence Creative Commons "readable" par les machines. Je suis étonné que ce code, ajouté dans le html, semble se présenter en dehors des normes html.
<div about="https://musiquenvrac.fr/" xmlns:cc="http://creativecommons.org/ns#">
    This page, by 
    <a property="cc:attributionName" rel="cc:attributionURL"
          href="https://musiquenvrac.fr/">
       Ponthus Pierre
    </a>,
    is licensed under a
    <a rel="license" href="http://creativecommons.org/licenses/by/3.0/">
      Creative Commons Attribution License
    </a>.
</div>

Contrairement au reste de la page, les balises ne sont pas colorées (ici, elles le sont mais pas sur ma page), comme si elles étaient fausses. Et l'ajout de cette div et de deux liens n'apparaissent pas dans ma page.
Est-ce normal ?
Merci de m'éclairer.
Modifié par Bongota (24 Apr 2022 - 20:27)
Rectification de mon post. J'avais mis ce code html entre les balises <script> de mon code json!!! Bien sûr qu'elles n'étaient pas prises en compte. Maintenant, elle sont colorées et perturbent ma page.
La question est autre, maintenant, que faire pour que ce code n'apparaisse pas sur ma page. Ou alors, il doit apparaître, sous forme de lien et concerner à la fois les machines et les visiteurs. Je l'ai mis tout en bas, il se comporte effectivement comme un lien vers les CC, mais il occupe pas mal de place.
Modifié par Bongota (24 Apr 2022 - 21:08)
Bonsoir Bongota,

Le code que tu nous montres est une semantique dite "RDFa". Je te laisse aller voir des articles sur le sujet, notamment wikipédia. Personnellement, alternativement à cette solution, je préfère les microdonnées (microdata), solution venue après les RDFa mais pensée comme une solution finalisée et non "bricolée" comme le RDFa. Le RDFa est reconnu par les moteurs de recherche, mais il il s'agit utiliser les IDs, attributs et classes HTML pour un usage détourné dans un but de référencement.

Édit : j'ai fais un amalgame entre RDFa et microformats, comme expliqué plus bas. Ce sont les microformats, technique pionnière dans le domaine mais désormais obsolète, auquel correspond ma description sur le "bricolage".

A l'inverse les microdata ont été créés comme tel dès le départ. Un exemple :
<div itemscope itemtype="https://schema.org/Book">
  <span itemprop="name">L'Attrape-cœurs</span>—
  <link itemprop="url" href="http://en.wikipedia.org/wiki/The_Catcher_in_the_Rye" />
  par <span itemprop="author">JD Salinger</span>
</div>

Mais maintenant, un nouveau format est apparu : json-LD. Ce dernier a l'énorme avantage de s'émanciper de la structure HTML du site. C'est sans doute le schéma à privilégier désormais, mais je n'ai pas encore testé.

Quoi qu'il en soit, ces formats sont définis, avec des exemples (mais pas toujours) sur schema.org. Le site de référence en la matière.
Modifié par Olivier C (24 Apr 2022 - 23:16)
Salut,

merci de t'être penché sur ce problème. D'une part, ma demande a un peu évolué, ayant réglé le premier problème. Ma seule question reste, ce code est-il destiné seulement aux machines ou aussi aux visiteurs. Apparemment, c'est aussi pour les visiteurs, puisqu'il y a des liens, dans une div. Pour le moment je l'ai mis dans le bas de ma page et il remplace l'ancien lien vers les CC.
Maintenant, la vraie question, c'est est-ce que mon code sera reconnu par les machines pour identifier une licence Creative Commons ? Ce qui est le seul but de ce code en ce qui me concerne. Et comment le vérifier ?
Pour ce qui est du code, j'ai pris ce qui était préconisé sur le site du W3.org. Effectivement, le lien que je donne liste aussi un grand nombre de possibilités. Pourtant, celui que j'ai mis est donné comme celui préconisé par CC. Créative Comons offre aussi un petit fichier html tout fait quand on définit une licence et qu'on le demande le code "readable" machine. Je n'aime pas leur code html, il est lourd et mal foutu.
Je connais json-LD, je l'ai mis sur mon site pour les micro-datas, mais je ne pensais pas que l'on pouvait l'utiliser aussi pour les CC. Creative Commons ne n'en parle pas.
Modifié par Bongota (24 Apr 2022 - 23:01)
Bongota a écrit :
Ma seule question reste, ce code est-il destiné seulement aux machines ou aussi aux visiteurs.

Quel que soit le format (Microdata, RDFa ou JSON-LD), ce type de code est réservé aux "machines", je veux dire par là aux moteurs de recherche. Ceux-ci s'en servent pour produire des extraits enrichis (Rich Snippets) sur les pages de résultats, mais cela n'est pas sensé améliorer le référencement.

Par contre, j'ai fais un amalgame entre les RDFa et quelque chose de plus ancien qu'étaient les microformats, c'est ces derniers qui étaient du "bricolage", comme je te le décrivais plus haut.

Sinon, j'ai trouvé sur un pdf en ligne la différence entre RDFa et microdata :
"PDF" a écrit :
RDFa est plus pratique quand :
* On utilise des vocabulaires RDF existants, possibilité de définir des préfixes, d’utiliser différents namespace
* On veut manipuler des données dans plusieurs langues
* On veut typer des littéraux (impossible en Microdata).
* Exporter des triplets RDF
* On souhaite modéliser un graphe, pas un arbre

Les Microdata sont plus pratiques quand :
* On définit des propriétés qui ont pour valeur des listes.
* On n’a pas besoin de toute l’expressivité de RDFa : les microdata sont plus simples et intégrées à HTML5.

Modifié par Olivier C (25 Apr 2022 - 07:05)
Compris.
J'ai fait d'une pierre deux coups, le lien situé dans le code sert pour aller sur le Legal code de la licence et ce code est aussi destiné aux robots d'indexation, en espérant que ce soit le cas.
Effectivement, les microformats sont plus difficiles à implanter que LD.json, ils sont mélangés avec le html et corriger les erreurs est plus difficile. Voici ce que j'ai mis sur ma page :
upload/1650873278-67790-screenshot2022-04-25.png
Bongota a écrit :
et ce code est aussi destiné aux robots d'indexation, en espérant que ce soit le cas.

Il existe des validateurs dédiés à ce type de code qui vérifient la conformité, Google a le sien. Bien sûr, ce n'est jamais une garantie pour l'indexation sous forme de données enrichies.
Modifié par Olivier C (25 Apr 2022 - 17:38)
J'avais déjà utilisé celui de Google depuis un moment pour mon code LD.JSON des micro-données, mais il ne détecte que ce code. Il ne détecte pas le nouveau que je viens de mettre et concernant les Creatives Commons.
Le mieux est d'attendre un peu et voir si mes images en CC sont indexées.