Bonjour à tous,

La DB de mon blog a été coupée et j'ai demandé à mon hébergeur de m'en envoyer un dump.
Comme ils sont un peu incompétents, ils m'ont envoyé un fichier complètement mal encodé mais je n'avais jamais rencontré ce genre de problèmes auparavant.

En effet, les é sont remplacés par √©, è par √®, ê par √™, etc.

Quelqu'un peut me donner une meilleure solution que de faire search & replace pour nettoyer ma DB ?

Merci d'avance
Ah zut, un des caractères a été echappé... Le 8730 correspond au caractère racine (un genre de V)
Bonjour,

Hmm... à vue de nez, ça ressemble à du garbled data, c'est-à-dire des données corrompues.
Ça arrive notamment si tes données sont dans un encodage, mais tes tables marquées comme étant dans un autre encodage. Par exemple avec des données UTF-8 placées sans autre forme de procès dans des tables en ISO-8859-1 (latin1), ce qui arrive souvent avec nombre d'applications web et CMS. À l'export, mysqldump demande par défaut de l'UTF-8, et les tables marquées en latin1 sont alors converties en UTF-8... si les données étaient déjà en UTF-8, ça les corrompt.

Difficile d'en dire plus sans avoir accès à la base de données, à vrai dire.
Ah OK merci pour la réponse !

Y a t'il un moyen intelligent pour récupérer un fichier propre rapidement (en sachant que le même caractère corrompu est toujours corrompu de la même façon). Je n'ai vraiment pas envie de faire du search & replace...
vincentb a écrit :
Y a t'il un moyen intelligent pour récupérer un fichier propre rapidement

Savoir exactement ce que tu as en base (ce qui demande de bien connaitres les questions d'encodage et de faire quelques tests, en ayant accès à la base). Et refère un dump avec les bons paramètres pour l'encodage de la connexion, le cas échéant.
Ouais si c'est moi qui l'avait fait, y aurait pas de soucis car je m'y connais un peu quand même (en tout cas suffisamment pour ne pas avoir ce genre de problèmes). Là le dump a été fait par mon hébergeur nul (OVH pour ne pas le citer) et je me vois mal commencer à faire de l'essai-erreur avec eux.

En tout cas, merci Florent, j'y vois un peu plus clair !