Bonjour
J'ai plusieurs centaines de pages HTML auxquelles je voudrais appliquer des modifications importante: en gros, récupérer le contenu sémantique et créer de nouvelles pages structurées différemment avec le même contenu sémantique.
L'approche est de travailler sur le DOM de la page.
Pour faire cela j'ai exploré deux voies:
1) en JavaScript, il est assez simple de travailler sur le DOM, mais cette opération est trop longue à effectuer pour qu'on puisse le faire à chaque chargement de page. Le problème est de sauvegarder le résultat dans un fichier.
2) je pensais m'en sortir en PHP, en utilisant la fonction DOMDocument::loadHTMLFile() et en travaillant sur le DOM résultant, mais je découvre que cette fonction ne génère pas de structure correcte, en particulier si le fichier HTML est déjà en HTML5 (!!!)
Avant de me lancer dans le développement d'un analyseur en local sur PC ou en PHP sur serveur, j'aimerais bien votre avis sur le sujet.
Merci de vos conseils.
J'ai plusieurs centaines de pages HTML auxquelles je voudrais appliquer des modifications importante: en gros, récupérer le contenu sémantique et créer de nouvelles pages structurées différemment avec le même contenu sémantique.
L'approche est de travailler sur le DOM de la page.
Pour faire cela j'ai exploré deux voies:
1) en JavaScript, il est assez simple de travailler sur le DOM, mais cette opération est trop longue à effectuer pour qu'on puisse le faire à chaque chargement de page. Le problème est de sauvegarder le résultat dans un fichier.
2) je pensais m'en sortir en PHP, en utilisant la fonction DOMDocument::loadHTMLFile() et en travaillant sur le DOM résultant, mais je découvre que cette fonction ne génère pas de structure correcte, en particulier si le fichier HTML est déjà en HTML5 (!!!)
Avant de me lancer dans le développement d'un analyseur en local sur PC ou en PHP sur serveur, j'aimerais bien votre avis sur le sujet.
Merci de vos conseils.