Bonjour,
Je dois parser des fichiers xml (newsml) pour insérer leur contenu dans une base de donnée mysql.
Je n'arrive pas à extraire les données html des ces fichiers mais uniquement le texte des différents nœuds.
Par exemple imaginons un fichier xml dont une partie du contenu est :
Je veux extraire le contenu des différents nœuds <p></p> inclus dans la balise <body>.
Que ce soit en ASP (classique) ou en PHP je n'arrive qu'à récupérer.
J'ai perdu les <br/> et les <b></b>.
Auriez vous des pistes de réflexion à me proposer ?
Merci d'avance.
Modifié par elric47 (13 Aug 2008 - 15:47)
Je dois parser des fichiers xml (newsml) pour insérer leur contenu dans une base de donnée mysql.
Je n'arrive pas à extraire les données html des ces fichiers mais uniquement le texte des différents nœuds.
Par exemple imaginons un fichier xml dont une partie du contenu est :
...
<datacontent>
<head>
<title>Test</title>
</head>
<body>
<p>John Smith <br/>San Francisco<br/><b>USA</b></p>
...
</body>
</datacontent>
...
Je veux extraire le contenu des différents nœuds <p></p> inclus dans la balise <body>.
Que ce soit en ASP (classique) ou en PHP je n'arrive qu'à récupérer.
John Smith San Francisco USA
au lieu de John Smith <br/>San Francisco<br/><b>USA</b>
J'ai perdu les <br/> et les <b></b>.
Auriez vous des pistes de réflexion à me proposer ?
Merci d'avance.
Modifié par elric47 (13 Aug 2008 - 15:47)