Felipe a écrit :
Bonjour,
Dublin Core> j'imagine que dans le monde de SGML, des bibliothèques au sens large (médiathèques et cie, là où on entasse, conserve, trie et expose/retrouve/prête/publie des milliers de "trucs"), de la documentation de 120 000 pages en 45 langues (un groupe pharmaceutique mondial, la NASA, ...), Dublin Core peut être intéressant pour tracer un document À condition que ce soit généré automatiquement!
D'un autre côté les balises meta ne sont pas la seule manière de "sémantiser" les données de documents web et sont somme toute très pauvres. Embarquer du Dublin Core ou autres vocabulaires structurés
dans le contenu ou des portions de contenus d'un document web (ou le lier via un un <link rel="" type="" ... />) est autre chose qui ouvre des possibilités plus intéressantes pour un
web de données. Qualifier le "conteneur" d'un document web (son enveloppe HTML) recelant des données variées en nature est très limité, sauf si on ne prend que le seul horizon du web actuel et du référencement, par contre qualifier son contenu avec des données structurées (via RDF par exemple) est autre chose.
Par exemple une page HTML ou XHTML décrit par des balises sa propre structure, mais ne qualifie pas le contenu exprimé entre les balises:
<p>Paris Web 2008 aura lieu les 13, 14 et 15 novembre à Paris</p>
ou
<p><strong>Paris Web 2008</strong> aura lieu les <em>13, 14 et 15 novembre</em> à <em>Paris</em></p>
ou encore
<h2>Paris Web 2008 :</h2>
<ul>
<li>Date : 13, 14 et 15 novembre 2008;</li>
<li>Lieu : Paris</li>
</ul>
Ces trois structures html sont différentes, mais l'information délivrée est la même (j'aurais mis des <b>, des <i> ou des <blink> le message serait le même): Paris Web 2008 aura lieu les 13, 14 et 15 novembre 2008 à Paris. A savoir: ceci est un évènement, il s'intitule Paris Web 2008, il a lieu du 13 au 15 novembre à Paris.
Dans l'état aucun outil (moteur par exemple) ne pourra moissonner cette information et qualifier un évènement en indiquer son intitulé, sa date, son lieu, faire des comparaisons de date, de disponibilité, un logiciel ne pourrait l'ajouter à un agenda etc.
Si par contre je me réfère à un vocabulaire déjà existant comme iCAL, je vais pouvoir structurer
et mon contenu HTML
et indiquer que Paris est le lieu, que 13, 14 et 15 novembre sont les dates de l'évènement, que Paris Web 2008 est le titre de ces conférences et l'exposer et le donner en pâture aux outils qui sauront l'exploiter indépendamment de la structure HTML que j'aurais choisie.
Un exemple exprimant tout cela à la fois en xHTML et
RDFa (sous réserve d'erreurs, il est tard
):
...
<html xmlns='http://www.w3.org/1999/xhtml'
xmlns:xsd='http://www.w3.org/2001/XMLSchema#'
xmlns:cal='http://www.w3.org/2002/12/cal/ical#'>
...
<div typeof='cal:Vevent'>
<h3 property='cal:summary'>Paris Web 2008</h3>
<p>Du <span property='cal:dtstart' content='2008-11-13' datatype='xsd:datetime'>13/11</span> au <span property='cal:dtend' content='2008-11-15' datatype='xsd:datetime'>15/11</span>
à <span property='cal:location'>Paris</span>.</p>
</div>
Pour reprendre ton exemple des bibliothèques et de leurs ressources, Dublin Core est très bien. Chaque livre édité est affublé d'un ISBN (numéro unique d'identification). Si un catalogue en ligne de bibliothèque indiquait que la suite de caractères constituant l'iSBN
est un ISBN, un moissonneur pourrait établir des liens (çà existe déjà
). Par exemple avec cette seule information afficher dans cette même page des informations contrôlées sur l'auteur, l'éditeur etc.
Seulement sans un vocabulaire comme Dublin Core ou autre ce n'est pas possible
<p>ISBN: 978-2212122558</p>
<p><span property="dc:identifer" content="urn:isbn:978-2212122558">ISBN: 978-2212122558</span></p>
Désolé j'ai un peu dévié des balises meta pour
la sémantique stricte et de
l'accessibilité globale