Salut tout le monde...
Je m'occupe d'un site web gérant différentes bases de données provenant de diverses sources. Ces bases de données sont parfois plutôt grosses (plus de 1Go pour certaines tables) et leur contenu est très hétéroclite (différentes langues insérées via différents dispositifs, aspirateurs web, inject, etc).
Comme il fallait s'y attendre, je me retrouve confronté à un gros problème de charsets. Le site est en UTF-8, les tables et BDD aussi, le lien MySQL aussi... mais certaines données sont mal accentuées DANS la BDD.
Par exemple: ÄŒesky en lieu et place de Česky (essayez en forçant l'encodage de votre navigateur en ISO8859, vous aurez bien ce résultat! )
Pour certaines données, je pourrais refaire une importation, mais ce n'est aucunement le but. Je cherche à obtenir un script PHP (mais je suis aussi ouvert à tout autre programme) qui serait capable de transformer une chaine erronée en chaine valide.
Bien sûr, j'ai essayé les différentes fonctions (utf8_encode(), iconv(), mb_convert()) de PHP... sans succès. Ces fonctions ne résolvent pas la plupart des problèmes.
Si quelqu'un a un début d'info, je suis plus que preneur...
D'avance, merci beaucoup...
Je m'occupe d'un site web gérant différentes bases de données provenant de diverses sources. Ces bases de données sont parfois plutôt grosses (plus de 1Go pour certaines tables) et leur contenu est très hétéroclite (différentes langues insérées via différents dispositifs, aspirateurs web, inject, etc).
Comme il fallait s'y attendre, je me retrouve confronté à un gros problème de charsets. Le site est en UTF-8, les tables et BDD aussi, le lien MySQL aussi... mais certaines données sont mal accentuées DANS la BDD.
Par exemple: ÄŒesky en lieu et place de Česky (essayez en forçant l'encodage de votre navigateur en ISO8859, vous aurez bien ce résultat! )
Pour certaines données, je pourrais refaire une importation, mais ce n'est aucunement le but. Je cherche à obtenir un script PHP (mais je suis aussi ouvert à tout autre programme) qui serait capable de transformer une chaine erronée en chaine valide.
Bien sûr, j'ai essayé les différentes fonctions (utf8_encode(), iconv(), mb_convert()) de PHP... sans succès. Ces fonctions ne résolvent pas la plupart des problèmes.
Si quelqu'un a un début d'info, je suis plus que preneur...
D'avance, merci beaucoup...