5568 sujets

Sémantique web et HTML

Bonjour à tous,

Je suis un modeste webmaster. Je viens de creer un site a caractère pornographiquet et j'avais l'intention de l'étiquetez à l'ICRA cependant ma validation bloque à la validation du W3C

a écrit :
Sorry, I am unable to validate this document because on line 4, 25, 53, 112, 117 it contained one or more bytes that I cannot interpret as utf-8 (in other words, the bytes found are not valid values in the specified Character Encoding). Please check both the content of the file and the character encoding indication.



Malheuresement je ne comprend pas du tout ce que je dois faire car je n'ai que peux de connaissances en codages.

voila les lignes en question :

Ligne 4

var msg="ATTENTION : SITE PORNOGRAPHIQUE RESERVE AUX MAJEURS DE PLUS DE 18 ANS\n"+"Ce site Internet est réservé à un public majeur et averti et est conforme\n"+"à toutes les règlementations françaises en vigueur. Il contient des textes,"+"des liens et des photos classées X qui peuvent être choquantes pour\n"+"certaines sensibilités.\n"+"Je certifie sur l'honneur à :\n"+"- être majeur selon la loi en vigueur dans mon pays et que les lois de mon état ou mon pays m'autorisent a accéder à ce site et\n"+"que ce site a le droit de me transmettre de telles données.\n"+"- être informé du caractère pornographique du serveur auquel j'accède."+"-je déclare n'être choqué par aucun type de sexualité et m'interdit de\n"+"poursuivre la société éditrice de toute action judiciaire.\n"+"- consulter ce serveur à titre personnel sans impliquer de quelque manière"+"que ce soit une société privée ou un organisme public.\n"+"Je m'engage sur l'honneur à :\n"+"- ne pas faire état de l'existence de ce serveur et à ne pas en diffuser le \n"+"contenu à des mineurs et utiliser tous les moyens permettant d'empécher l'accès de coolos.com à tout mineur.\n"+"- assumer ma responsabilité, si un mineur accède à ce serveur à cause de \n"+"négligences de ma part : absence de protection de l'ordinateur personnel, "+"absence de logiciel de censure, divulgation ou perte du mot de passe de sécurité.\n"+"- assumer ma responsabilité si une ou plusieurs de mes présentes déclarations "+"sont inexactes.\n"+"Toutes les images contenues dans ce site sont en accord avec la loi Française sur \n"+"la pornographie (aucune image de mineur n'est présente sur ce site)\n"+"J'ai lu attentivement les paragraphes ci-dessus et signe électroniquement mon accord\n"+"avec ce qui précède en cliquant sur le bouton OK\n\n"+"CLIQUEZ SUR OK POUR CONTINUER, ANNULER POUR QUITTER.\n\n"
if(!confirm(msg)){window.top.popup=0;window.top.location.replace("http://www.celibamour.com/?id=coolos");}//-->
</script>


Ligne 25

var texte="Bienvenue !!!!!!!!! Nous vous souhaitons un agréable moment en notre compagnie, n'hésitez pas à nous rejoindre ! !!!" ;


ligne 53

<!-- Sensual par hersandesign.com,  designer : Hersande Hudelot, Auteur et propriétaire des droits visuels de ce kit, copyright dans ce kit obligatoire -->


Ligne 112

&bull; <a href="vidéos.htm" target="_blank">Des videos</a><br />


Ligne 117

<b>Découvrez aussi nos partenaires :</b><br />




Si quelqu'un pouvait m'aider ce serait très gentil...
Modifié par anthrax (27 Aug 2006 - 18:07)
Bonjour,

C'est un problème de jeux de caractères.

En bref: tous les caractères de texte d'une page web sont en fait écrits sous forme d'un code numérique qui indique au navigateur de quel lettre/signe de ponctuation/chiffre/autre... il s'agit par rapport à un tableau de référence qui contient tous les caractères possibles (la table Unicode).

Comme il existe plusieurs façons différentes de coder ces caractères, chaque page doit comporter l'indication du "jeu de caractère" (charset) utilisé. C'est en particulier le rôle de :
<meta http-equiv="Content-Type" content="text/html; [b]charset=iso-8859-1[/b]" />
.

Ici :
- soit cette information est absente (sous cette forme ou sous une autre), et le validateur suppose alors que le jeu de caractère est utf-8 (jeu de caractère par défaut)... alors qu'en fait ce n'est pas le bon (c'est sans doute 8859-1 ou windows-1252)
- soit cette information est présente, mais l'éditeur HTML que tu as utilisé pour saisir les textes n'a pas, en fait, respecté l'encodage utf-8 déclaré.

Dans le premier cas, il faut simplement commencer par préciser le jeu de caractère.

Dans le second cas... il faut déterminer quel est le jeu utilisé par l'éditeur, et voir s'il peut être déclaré.
Modérateur
Salut,

La réponse de Laurent est pourtant explicite. Smiley sweatdrop

... mais comme on ne sait pas ce que tu as mis au niveau de ta meta ni quel est l'encodage de ton éditeur, tu es le seul à savoir ce que tu dois faire. Smiley cligne
La réponse de Laurent Denis est on ne peut plus précis.

Plus rapidement, les éléments à vérifier :
- L'encodage transmis par les en-têtes HTTP (champ Content-Type). En ajouter un si aucun n'est spécifié.
Exemple rapide en php : header("Content-Type:text/html; charset=iso-8859-1");

- Vérifier l'élément meta Content-Type, l'ajouter et/ou le modifier si nécessaire :
<meta name="Content-Type" content="text/html; charset=iso-8859-1" />

- Vérifier l'encodage du document et le modifier de manière à le faire correspondre au jeu indiqué dans les deux éléments ci-dessus. Ici, l'exemple était avec de l'iso-8859-1, il suffit de remplacer par utf-8 pour déclarer cette encodage.

Pour connaître l'encodage réel de ton document, le meilleur moyen est de forcer l'ouverture dans un des deux encodages et de regarder le résultat :
- Si en forçant l'ouverture en iso-8859-1, tu obtiens des caractères bizarres tels que é, ton document est en utf8.
- Si en forçant l'ouverture en utf8, tu obtiens des points d'interrogation ou des lettres qui sont parfois "mangées", alors ton document est encodé en iso-8859-1 ou windows:1252.