5568 sujets

Sémantique web et HTML

Bonjour

J’ai besoin d’afficher dans plusieurs pages Php des chaînes de caractères non européens.

Je met donc dans mon Head ceci :
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

Aussi, en éditant ces pages là, j’encode d’abord en UTF-8 sans BOM avant de copier mes chaînes de caractères non européens.

Tout s’affiche bien sauf les quelques caractères accentués européens dans les textes subsistants ; ils sont remplacés par des machouillis de 2-3 caractères.

Y a-t-il une solution autre que de les remplacer par des caractères non accentués ? Ou de tout traduire?

Par avance merci de votre aide.

Francois
Bonjour,

Si le copié-collé pouvait être la solution... Et bien non !

Je ne sais pas de quel genre de caractères il s'agit, Cyrillique, ideogramme etc...

Dans du html, tu peux chercher la correspondance en langage html (écritue de type &code;).


Autrement en Hexadecimal.

Bonne journée
bonjour et merci de ta réponse.

J'écris de l'arabe.

Comme le machouillis est produit dans Notepad++ quand j'encode en UTF, j'ai trouvé cette petite solution de corriger ensuite les caractères massacrés.

Simplement, c'est à recommencer la prochaine fois où je refais un coup d'encode.

Francois
Ca peut paraître bête comme question mais je souhaite comprendre.

Si tout le contenu de ta page est en arabe, pourquoi ne pas changer l'encodage de la page en un format plus adapté ?
De plus si tu compte traduire ce contenu en arabe vers une autre langue, tu peux tout a fait proposer une page en cette autre langue avec elle-même un encodage en UTF8 sans BOM, non ? (après relecture je constate le hors-sujet, oups)

Autrement j'imagine que tu ne peux multiplier ta page parce que tu mélange l'arabe avec une autre langue.

Je me demandais aussi si un post-traitement en php ne permettrait pas d'insérer ces fameux caractères spéciaux ?

Tant de question pour finalement n'avoir aucune solution... Il va falloir que j'étudie sérieusement le sujet. [analyse introspective].

En tout cas bon courage !
Modifié par Greg_Lumiere (27 Aug 2014 - 12:13)
Non, tout le contenu de ces pages n'est pas en arabe; une partie reste en français.

En fait, la version initiale de ces pages est totalement en français.

Une deuxième version est partiellement en arabe, j'y remplace une partie du français par sa traduction en arabe qui m'est fourni par un partenaire.

Ne te casse pas trop la tête, mon petit remède grand-mère, trouvé il y a peu, suffit.

Merci de ton aide.

Francois
Ça me trotte quand même cette histoire.

J'ai donc entrepris la même recherche que toi mais sur les caractères Cyrilliques.

D'après ce que je lis ici et là, en UTF-8 les caractères peuvent s'afficher dans une page en UTF-8. L'idéal est de les insérer en hexadécimal car chaque caractère, quelle-que soit sa page, a en UTF-8, un code hexadécimal unique.

Concernant le rendu chez l’utilisateur, il semble indispensable qu'il dispose d'une police de caractère compatible avec ton alphabet si tant est que tu ais bien déclaré FONT.

A parte...
Au passage, le copier-coller depuis un traitement de texte vers par exemple Notepad++, ou tout autre logiciel du genre, NE FONCTIONNE PAS pour les caractères spéciaux.

L'idéal étant d'utiliser, ce qui s'appelle sous Windows, la table des caractères pour ce genre de manipulation.
bonjour

Je viens juste de lire ça: "En utilisant l'UTF-8 dans nos pages, on s'affranchit de la conversion des caractères spéciaux en code HTML. Un "e" avec accent aigu pourra donc être écrit directement "é" et non "&eacute;" dans notre code source. ", ce qui correspond à ce que je constate.

Mes pages affichent bien é, è, à, .. après que j'ai corrigé les machouillis.

Le problème se situe uniquement quand je fais Encode UTF-8 sans BOM dans mon éditeur; là, plaff, tous mes caractères européens accentués se transforment en machouillis.

Eh bien, je les corrige et tout redevient comme avant.

Comme je le disais, le seul problème est que je dois refaire mes corrections à chaque fois que je fais un encode pour copier de nouveau caractères arabes.

Francois
Alors oui, il faut sélectionner l'encodage de la page AVANT d'insérer le contenu sinon s'opère une transcription des caractères spéciaux.

Quand on se fait avoir une foi, crois moi après on s'en souvient (vécu).