Hello,

Je ne sais si mon post est bien placé, sinon merci à qui le déplacera. Smiley cligne

Je vais recevoir des fichiers .doc dont je devrais copier-coller le texte dans des pages HTML.

Quelle méthode préconisez-vous afin que je me débarasse facilement des caractères "exotiques" de Word ?
Bonsoir,

Je sais plus trop ou mais dans word il y'a un truc pour supprimer la mise en forme.
Sinon au pire tu copie colle dans notepad et t'auras plus de mise en forme du tout Smiley lol
Dreamweaver (dans sa dernière version au moins) est assez efficace sur ce coup là, on peut choisir de nettoyer automatiquement tout ce qui est superflu, pour ne garder que les paragraphes et les niveaux de titres par exemple.
sorry... je deterre un ancien post... Smiley cligne
mais n'existe t'il pas une méthode pour convertir directement un fichier word ou pdf vers de l'html...
ou du moins récupérer une partie...
Non seulement word est m...que lorsqu'il s'agit de convertir en HTML, mais en plus, 99% des gens l'utilisent mal (petit test : qui utilise les styles titre 1, titre 2, titre 3, ... à la place de bêtement définir une police, un alignement, etc. ? ? Je parie qu'il n'y aura pas beaucoup de oui. Je suis aussi presque sûr d'obtenir une majorité de non en demandant qui connaît simplement l'existance de ces styles.).

Non bon sérieusement : non, je n'ai encore jamais vu un convertisseur word > autre chose (donc y compris HTML) vraiment efficace.
Le plus efficace étant pour moi toujours coller dans le bloc-notes. Ce qui, au passage, ne résoud pas le problème des apostrophes &#146 et autres idioties du genre, qu'il faudra encore remplacer par un str_replace en php par exemple.
100% OK avec Quentin...
La solution la plus efficace -- à condition que le rédacteur ait correctement utilisé les styles... -- est d'enregistrer en html et de passer le texte d'abord au strip_tags pour supprimer toutes les inutilités (entêtes MS, balises html et body, etc), puis ensuite un coup de str_replace pour virer les effroyables "class=MsoNormal","class=MsoListNumber" et autres encodages particuliers. A la fin on a quelque chose d'utilisable Smiley smile