Bonjour à tous.
J'ai pas mal de problèmes concernant un systèmes de news sur mon site. Les utilisateurs (non initiés aux techniques internet) entrent des nouvelles dans l'administration pour qu'elles apparaissent en entête du site.
Le problème c'est que la plupart du temps il font un copier-coller d'un document Word alors pour la validité je vous raconte pas le bazard sur les accents, guillemets et autres.
Ma seule solution est elle de créer moi même une fonction qui transforme tout ces caractères ou y a t'il plus intelligent?
Bonjour,
Essaie htmlentities en php, mais c'est de loin pas garanti.
Et pour convertir en utf, utilise utf8_encode.
L'utilisation de Tidy peut être une solution, sinon, certain script d'edition de text en javascript dispose déjà de fonctions de netoyage (je pense à tinyMCE là)... tu peut t'en inspirer.
Merci de vos commentaires éclairés. Pour info le htmlentities ne résout quasiment rien mais je vais tester le utf8_encode qui m'a l'ai interessant au premier abord.
Eric a écrit :
Vu aussi sur le site de Normand Lamoureux.


Avec une grosse erreur sur windows 1252 et utf-8, qui ne sont absolument pas compatibles.

le problème des caractères encodés en windows 1252 dans la page 128 à 159 est qu'ils prennent une place réservée à des codes de contrôle par la norme Unicode / ISO-1064. Quelque-soit le jeu de caractère conforme à Unicode que l'on choisi (utf-8, utf-16, iso-8859-1, iso-8859-15, etc), le problème de ces caractères reste inchangé.
Modifié par Laurent Denis (10 Oct 2005 - 08:36)
Donc il y a de bonnes chances pour que la seule solution soit le super str_replace qui remplace caractère par entité HTML correspondante