Bonjour à tous,

Je suis à la recherche d'un outil qui permet de convertir les caractères accentués et autres apostrophes, guillemets... au format html : "é" en "é" "l'eau" en "l’eau"...
Il me semble que Dreamweaver MX possédait ce genre d'utilitaire mais je ne parviens pas à le retrouver dans une version ultérieure. Merci pour votre aide.
Tanguy
Bonjour,

Si tu es en iso (latin 1), tu n'as pas besoin d'utiliser les entités à part pour œ, Œ, € et ÿ.

Si tu es en ut8, là tu peux taper tous les tu que tu veux (même arabes, asiatiques, etc). Si c'est possible utilise utf8. Smiley cligne

P.S. : évidemment dans tous les encodages <, > et & doivent être traduits en entités. Smiley cligne r
Merci pour ta réponse !

Tu veux dire que si la déclaration est du type :
<?xml version="1.0" encoding="ISO-8859-1" ?>


alors il n'y a aucune utilité à convertir les caractères spéciaux (mis à part pour œ, Œ, € et ÿ) ?

Je suis sur ma lancée j'en profite pour une seconde question...

Je récupère des longs fichiers textes que je dois baliser en XML et l'encodage est imposé en ISO-8859-1. Or, les fichiers que je récupère sont en UTF-8 (pas moyen de faire autrement).

Lorsque je tente une conversion en ANSI (dans Notepad++), je me retrouve avec tout un tas de "
" disséminés dans la page. Comment éviter l'apparition de ces caractères ?

Bonne soirée,

Tanguy
Hello,

Commençons par ceci: les caractères spéciaux, ça n'existe pas. Smiley smile

Bgood a écrit :
alors il n'y a aucune utilité à convertir les caractères spéciaux (mis à part pour œ, Œ, € et ÿ) ?

Disons que si tu utilises de l'ISO-8859-1 pour enregistrer tes fichiers et données, et que tu déclares de l'ISO-8859-1 pour tes pages web, il n'y a aucune nécessité de remplacer des caractères tels que «é» et «ç» par des entités HTML.

Cela peut être utile dans certains cas très précis. À priori, tu n'as pas à t'en soucier, et il serait plus intéressant pour toi d'apprendre à manier les encodages. Et pourquoi pas d'utiliser directement UTF-8, comme le suggère Patidou.

Un peu de lecture:
http://www.alsacreations.com/search/tag/encodage

Bgood a écrit :
Je récupère des longs fichiers textes que je dois baliser en XML et l'encodage est imposé en ISO-8859-1. Or, les fichiers que je récupère sont en UTF-8 (pas moyen de faire autrement).

Si les fichiers récupérés contiennent uniquement des caractères exprimables en ISO-8859-1, tu peux utiliser un outil de conversion pour convertir tes fichiers de UTF-8 à ISO-8859-1. Par exemple Kaboom.

Autrement, et si ces données sont destinées à être exploitées dans des pages web, il faudra remplacer les caractères n'existant pas en ISO-8859-1 (voire tous ceux n'existant pas en ASCII) par leur équivalent en entité HTML.

http://www.sisulizer.com/kaboom/Lorsque je tente une conversion en ANSI (dans Notepad++), je me retrouve avec tout un tas de "
" disséminés dans la page.
Qu'est-ce que «tenter une conversion» signifie au juste? Si tu changes juste le "UTF-8" dans ton code pour le remplacer par un "ISO-8859-1", tu ne convertis pas le fichier, tu te contentes de déclarer un encodage différent (et en l'occurrence un encodage différent de celui utilisé pour enregistrer les données, d'où les problèmes à l'affichage).
Si tu utilises les fonctions de Notepad++ pour réaliser une conversion, tu utilises sans doute la mauvaise option (il y en a deux à partir de la version 5.0... si tu utilises la version 4 de Notepad++, tu n'as pas la bonne option, il faut mettre à jour...).
Mille mercis, Patidou et Florent V., pour toutes ces précieuses informations.

Pour être précis, "tenter une conversion" dans Notepad++ signifiait :
- "Encoder en ANSI" mais ce n'est pas la bonne méthode...
- "Convertir en ANSI" mais je me retrouve avec des séries de "?????????"

J'ai testé Kaboom avec lequel j'ai réussi des conversion de fichiers de UTF8 vers ANSI.

Encore merci pour la qualité de vos interventions.

Tanguy
Juste pour information, «ANSI» n'est pas un nom d'encodage à proprement parler. L'ANSI est l'American National Standards Institute, et le seul encodage standardisé par l'ANSI, à ma connaissance, c'est l'ASCII, qui ne comprend pas de caractères accentués et n'est pas adapté aux langues autres que l'anglais (et même pour l'anglais, c'est limité).

On appelle souvent ANSI les encodages suivants: Windows-1252 (dit aussi CP-1252) et ISO-8859-1. À priori, quand un logiciel sous Windows déclare encoder en ANSI, c'est de Windows-1252 qu'il s'agit (mais ça reste à vérifier pour chaque logiciel).

Recommandation en passant: rester éloigné des logiciels qui n'utilisent pas les bons mots pour parler de ce qu'ils font. Smiley cligne