5568 sujets

Sémantique web et HTML

Pages :
Je suis tombé sur un site qui propose un petit validateur de sémantique. J'ai trouvé cela rigolo mais pas encore beaucoup tester. Mais il est clair que c'est mieux que rien.

Je me demande quand même pourquoi le W3C qui conseil de mettre en ligne de belle page web sémantique ne propose pas déjà un tel outil. C'est bizarre parce que un des intérêts principaux du XHTML (ou XML) est l'intéropérabilité entre homme - machine.
Tout simplement, parceque les questions de sémantique web sont déjà très difficiles à prendre en compte et qu'il n'est pas toujours facile de répondre dans un cas ou dans un autre, donc un robot saurait encore moins répondre.

Regarde un topic de ce forum (sémantique) tu comprendras pourquoi c'est hyper dur de faire faire ça à un robot Smiley lol
Je pense mettre mal exprimer alors...
Ce que je veux dire par là, c'est qu'un validateur de sémantique serait un super outil super bien parlant (comme le validateur de syntaxe) pour propager certaine bonnes pratiques sémantiques (le truc du "tips of the day" c'est un peu léger quand même).

Et puis, tu n'est pas le genre à t'arrêter devant quelques chose de compliquer, ElMoustiko, non ? Smiley smile
Nan, mais c'est irréalisable, il n'y a pas à tergiverser Smiley lol

Comment veux tu qu'un robot te dise que ton utilisation de <dl> est adapté ?

imagine que tu utilises des <dl> pour faire un cadre arrondi, c'est inaproprié, mais c'est valide, jusqu'ici on est d'accord, mais comment veux tu qu'un robot comprenne que ton cadre n'est pas un liste de definition ? C'est impossible.

En effet les "tips of the days" sont peu utiles voire inutiles sauf pour le débutant de chez débutant peut être, donc c'est bien de les laisser.

Si tu lis un topic sur le forum, tu te rendras compte par exemple que pour les listes de définitions utilisées pour les menus, 2 avis s'opposent et finalement, les 2 se valent. Si des humains n'arrivent pas à trancher, comment veux tu qu'un robot non conscient du contexte d'utilisation puisse faire la différence à son tour ? !!!

C'est des trucs comme opquast qui permettent ** un peu** ce genre de choses, ça joue le rôle des tips of the day mais en beaucoup mieux. Smiley cligne

Et puis :
CiD a écrit :

tu n'est pas le genre à t'arrêter devant quelques chose de compliquer, ElMoustiko, non ?


Euuhh et d'une, si j'ai tendance !!!
et de 2, ce n'est certainement pas d'un guignol comme moi que viendrait ce genre d'outil
Smiley ravi
Pour reprendre ton exemple ; une machine comprendra une liste de définition parce que c'est une liste de définition, justement. Si tu détourne la balise "dl" pour de la présentation, là, le robot va avoir des problèmes et passer à côté de ce que tu voulait exprimer. Bon, après, tu fais ce que tu veux Smiley biggrin . Mais en fin de compte, c'est toi qui crée le contexte de tes pages.

Tu me coupe l'herbe sous le pied en citant Opquast (encore lui !). peut être est ce une étape pour définir les futurs besoins et les futurs régles qui feront un web encore plus intéractif et productif en innovations ?

Ensuite, tu commence bien Smiley lol ... Moi, je ne fait pas mieux mais l'outil me propose un correctif !

ElMoustiko a écrit :
et d'une, si j'ai tendance !!!
et de 2, ce n'est certainement pas d'un guignol comme moi que viendrait ce genre d'outil
Smiley ravi

Menteur Smiley langue (c'est gentil, hein !) Smiley ola
L'exemple des DL je ne l'utilise pas, et en fait tu viens de dire exactement ce que je pensais :
CiD a écrit :

tu fais ce que tu veux biggrin . Mais en fin de compte, c'est toi qui crée le contexte de tes pages.


Oui c'est moi crée le contexte de mes pages, et justement comment un robot pourrait il connaitre ce contexte ?
Moi je n'utiliserais pas les dl pour un cadre uniquement pour faire l'arrondi, mais on peut très bien imaginer un <dl> correctement utilisé et faire un cadre arrondi avec, au final, on un <dl><dt>du texte</dt><dd>du texte</dd></dl> dans les 2 cas, mauvaise ou bonne utilisation, comment le robot peut il faire la différence ??? c'est justement là qu'est le problème.
Administrateur
Comment ce genre d'outil peut-il deviner que mon <p style="font-size: 50px"> est un titre ? Je peux utiliser un paragraphe pour faire mes titres sans qu'il puisse s'en rendre compte, non ?
Raphaël > De quoi parle tu ? Du validateur que j'ai précédemment lié ou des probables outils dont nous discutions avec ElMoustiko ?
Pour le validateur, je ne suis pas responsable des résultats... Je voulait juste en parler avec vous.

ElMoustiko > je ne sais pas Smiley biggrin

Si ça continue, je pose la question suivante : "Mais pourquoi validez vous votre page (X)HTML ?". Vous êtes prévenu ! Smiley langue
Modifié le 18 Nov 2004 - 21:10
Raphaël parlait d'un eventuel validateur de sémantique je pense.
Comment un validateur de sémantique pourrait-il savoir que <p style="font-size: 50px"> n'est pas un titre ?? parceque certains font comme ça pour faire des titre plutot que <hN>

Donc un robot est totalement incapable de faire la différence.

CiD a écrit :
"Mais pourquoi validez vous votre page (X)HTML ?"

Pourquoi remet tu la validation (x)html en cause ?
"la balise "p" représente un paragraphe, la balise "hn" un titre. Point.", dit le robot. Que veut tu... Mais après, ce robot peut faire des associations d'idée, classer des textes tout seul selon les actions de l'utilisateur... Bref analyser le contenu pour faire des trucs, quoi.

Non, non, je ne remet rien en cause, rassure toi !
En fait, je peux reformuler : "Pourquoi voulez vous avoir des pages (X)HTML conformes au recommandations (ou valide, peut importe) sur votre site ? Pour faire beau ?"
Modifié le 19 Nov 2004 - 04:37
Ton idée si elle etait envisageable (qui ne l'a pas envisagée ? ) serait tip top, mais je le redis, c'est quasiement impossible de faire l'analyse robotiquement, il y aurait trop d'approximations quelconques pour un validateur. A mon avis la bonne solution c'est les bonnes manières d'opquast, il en faudrait peut etre plus, mais pas forcément.


Pour ce qui est de faire du xhtml pour avoir une belle icone, je m'en contre fou, j'aurais tendance à ajouter 1 balise pleine de faute expres pour ne pas valider pour le monter Smiley lol d'ailleur, je n'utilise pas le validateur, je me fie à moi même, et (testez mes pages) je crois que ça marche plutot pas mal. Il faut pas contre ne pas jetter les validateurs à la poubelles, ils servent tout de même comme vérificateurs de syntaxes.

Un article de moi à ce sujet :
http://www.elmoustikoblog.net/read_article.php?id=26

Ahh tiens, je repense à un truc à propos de la sémantique web et d'une façon de vérifier... LES SPECS, il suffit de lire les specs des éléments qu'on utilise et de vérifier qu'on le fait correctement. C'est mieux qu'opquast...
<troll>Les specs, c'est nul, c'est pas interactif</troll>

Tu as encore une fois raison. Mais je suis sûr que l'on peut creuser un peu ce sujet Smiley smile . Non pas pour un meilleur référencement ou des bidules qui clignote, mais pour donner aux visiteurs de ton site une bonne expérience. Enfin, c'est ce que je pense naïvement...
Modifié le 19 Nov 2004 - 04:38
CiD a écrit :
Non pas pour un meilleur référencement ou des bidules qui clignote, mais pour donner aux visiteurs de ton site une bonne expérience.


Pas compris là....


Pour ton troll, je suis en partie d'accord à vrai dire, c'est vraiment très peu agréable à lire des SPECS, mais on va pas faire une réécriture des specs Smiley cligne
ElMoustiko a écrit :
d'ailleur, je n'utilise pas le validateur, je me fie à moi même, et (testez mes pages) je crois que ça marche plutot pas mal. Il faut pas contre ne pas jetter les validateurs à la poubelles, ils servent tout de même comme vérificateurs de syntaxes.


J'y regarderais à deux fois avant de fait "pfff... Le validateur...".

La validité est une contrainte normative de conformité.
Le validateur sert à mesurer la validité.
Ne pas utiliser le validateur est sans doute amusant, mais c'est totalement dénué de sens : tout l'enjeu de la normalisation est la validation préalable du code, qui fournit à l'agent utilisateur les moyens de traiter le code reçu en fonction du respect attendu de la norme, ou des procédures de traitement d'erreur prévues.

C'est l'une des différences majeures entre HTML/XHTML traité en HTML d'une part, et XHTML traité en XML d'autre part:
- l'invalidité du premier conduit le navigateur à un amusant pari sur ce que "ce code aurait dû être", avec des résultats totalement imprévisibles, puisque laissés à la discrétion de chaque navigateur. C'est ce que nous ne voudrions plus.
- l'invalidité du second conduit à un choix dans une liste de règles de traitement d'erreur précisément définies. En général, un beau "Erreur XML" et l'arrêt de la restitution de la page là où le parser a coincé. ça a le mérite d'être clair pour l'auteur, puisque c'est inutilisable pour l'utilisateur.

Donc, validez d'abord, après, encore, avant, pendant, en haut et en bas, de droite ou de gauche, en coin ou sur le dos, à plusieurs ou à la main, mais validez, bordel !
Sinon, tout cela n'a aucun sens.

ElMoustiko: fais du XHTML/XML. Tu apprendras vite pourquoi il faut valider Smiley cligne
Oui pour du xhtml/xml, pour du html si on sais ce que l'on écris, NON pas besoin du validateur, je vais pas perdre mon temps à passer au validateur chaque page que je fais alors que je sais qu'elle est valide...

Mais je ne disais pas "NE VALIDEZ PAS" j'ai dis, "moi je valide pas systématiquement, loin de là"

Faites ce que je dis, pas ce que je fais Smiley cligne
ElMoustiko a écrit :
Oui pour du xhtml/xml, pour du html si on sais ce que l'on écris, NON pas besoin du validateur, je vais pas perdre mon temps à passer au validateur chaque page que je fais alors que je sais qu'elle est valide...


Pourquoi ?

Parce que tu as la chance qu'en HTML, le navigateur assume tes erreurs éventuelles, en reportant sur l'utilisateur un traitement alourdi du document (recherche et rectification des erreurs).

On sait ce qu'on écrit ? J'écris du XHTML dans le texte depuis des années, et je fais chaque jour des erreurs de débutant. ça s'appelle des typos, quand on est indulgent. Mais ça peut être pire, côté résultat.

Tiens... je viens de corriger une superbe fôte d'orthographe dans le paragraphe ci-dessous... grâce à un validateur orthographique (SpellCheck). Et pourtant, je suis instit depuis quelques décennies ! lol
Bah je m'en sors pas trop mal pour l'instant Smiley lol , je suis d'accord sur le principe que valider pour effacer les fautes de frappes en tout genre c'est bien, mais bon, je trouve que c'est une perte de temps assez importante... Après c'est selon les gens j'imagine.

En XML au moins t'es sûr de pas faire de grosse boulette parceque ca fait une belle erreur, c'est pratique Smiley lol
Juste une remarque: en théorie, on pourrait se baser sur l'apparence finale (une fois que les CSS sont appliquées) des documents, et sur des modèles de présentation bien écrit (sémantiquement parlant).

Genre: si un texte est centré, en gras, et fait tant de % de plus que le texte le plus courant, alors il est probable que ce soit un titre h1.

Mais comme les modèles de présentations sont potentiellement en nombre infini, ce n'est pratiquement pas faisable.

Si je me suis décidé à répondre à ce sujet, c'est que j'ai travaillé sur un sujet proche lors de ma thèse: comment reconnaître (c'est-à-dire, accorder une sémantique) les champs des références bibliographiques dans les articles scientifiques, en se basant sur leur typographie (la présentation, quoi).

Et bien, je suis parti d'une base d'exemple, et ensuite j'ai "triché": j'ai fait générer par BibTeX les références. Puis j'ai extrait automatiquement la typographie générée, et je l'ai mise en correspondance avec la base de données (la sémantique) bibliographique.
Ca donnait des associations du genre "Les auteurs sont séparés du titre par un point et un passage en italique dans tel type de publication".

Tout ça pour dire que c'était envisageable car il existe un nombre limité de types de publications (et je me suis limité à un seul style).
Les résultats obtenus (même si le travail n'a pas été poussé vraiment jusqu'au bout) ne seraient pas dignes de créer même un validateur de références bibliographiques (même si quelquefois, la base de données était moins bien renseignée que ce que proposait le programme).

Pour ceux que ça intéresse (si je devais le refaire, je ne le ferais plus tout-à-fait comme ça), ma thèse est disponible.
Je crois que ce n'est pas encore pour moi le sémantique... Je suis déjà passé au XHTML avec du mal alors au point d'être en full-sémantique ! Smiley ravi Par contre le fait que ce petit validateur corrige les CSS et le code, c'est super. Smiley smile
Pages :