Bonjour,
Je me perds avec ce problème là:
Voici le lien de la page xml à parser: http://www.lavoixdunord.fr/Services/Fils_RSS/Locales/Lille/index.xml
Voici le charabiat que j'obtiens:
On constate des P> et des ;#224; entre autres.
Le document xml, quand on affiche le code source, il affiche bien ces hyroglifs sauf les P>!
Je cherche à convertir le document pour qu'il soit lisible dans ma page en php et bien sur encodée en UTF8!
Et enfin voici mon code simple pour parser:
Pour mieux comprendre, voici le résultat:http://www.rumegiesmeteo.fr/TESTRSS.php
Si quelqu'un pouvait m'aider à me mettre sur le chemin pour trouver la solution, ce serait sympa car j'y perd mon latin!
J'ai déjà lu pas mal de truc, mais je n'en sort pas!
Merci
Modifié par flighty (18 Jun 2009 - 22:24)
Je me perds avec ce problème là:
Voici le lien de la page xml à parser: http://www.lavoixdunord.fr/Services/Fils_RSS/Locales/Lille/index.xml
Voici le charabiat que j'obtiens:
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
<link rel="stylesheet" href="style/stylerss.css" type="text/css" />
</head>
<body>
<ul>
<li>
<a href=http://www.lavoixdunord.fr/Locales/Cambrai/actualite/Cambrai/2009/06/18/article_des-idees-pour-un-week-end-de-bien-etre.shtml?xtor=RSS-2><b>Des idées pour un week-end de bien-être et de découverte</b></a> <br />
Envie de profiter du week-end pour vous d&#233;payser&#160;? Parmi toutes les manifestations organis&#233;es ce week-end (&#224; commencer par celles destin&#233;es &#224; f&#234;ter les papas ou la musique), voici trois de celles qu&#39;il ne faudra pas manquer&#160;: l&#39;ind&#233;modable Tracto r&#233;tro, &#224; Escaudoeuvres ; le rafra&#238;chissant Salon de la bi&#232;re, &#224; Vendegies-sur-&#201;cail-lon, et les r&#233;jouissants feux de la Saint-Jean &#224; l&#39;Arch&#233;o&#39;site des Rues-des-Vignes.
</li>
<li>
<a href=http://www.lavoixdunord.fr/Locales/Cambrai/actualite/Cambrai/2009/06/18/article_communiquez-vos-infos-cambrai-lavoixduno.shtml?xtor=RSS-2><b>Communiquez vos infos cambrai@lavoixdunord.fr</b></a> <br />
<P><p>FEUX DE LA SAINT-JEAN Clary.- Action Jeunes organise samedi, les feux de la Saint-Jean, au stade, &#224; partir de 20&#160;h. Espace couvert pour le repas.
</li> etc etc etc
On constate des P> et des ;#224; entre autres.
Le document xml, quand on affiche le code source, il affiche bien ces hyroglifs sauf les P>!
Je cherche à convertir le document pour qu'il soit lisible dans ma page en php et bien sur encodée en UTF8!
Et enfin voici mon code simple pour parser:
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8 " />
<link rel="stylesheet" href="style/stylerss.css" type="text/css" />
</head>
<body>
<?php
function lire_rss($url,$nbr=10)
{
$tout.='<ul>';
$xml = simplexml_load_file($url) ;
foreach($xml->channel->item as $item) {
$i++;
if($i<=$nbr){
$txt=utf8_decode($item->description); $lien=utf8_decode($item->link); $titre=utf8_decode($item->title);
$tout.='
<li>
<a href='.htmlentities($lien).'><b>'.htmlentities($titre).'</b></a> <br />
'.htmlentities($txt).'
</li>
';
}
}
$tout.='</ul>';
return $tout;
}
?>
<?php echo lire_rss("http://www.lavoixdunord.fr/Services/Fils_RSS/Locales/Cambrai/index.xml",10) ?>
</body>
</html>
Pour mieux comprendre, voici le résultat:http://www.rumegiesmeteo.fr/TESTRSS.php
Si quelqu'un pouvait m'aider à me mettre sur le chemin pour trouver la solution, ce serait sympa car j'y perd mon latin!
J'ai déjà lu pas mal de truc, mais je n'en sort pas!
Merci
Modifié par flighty (18 Jun 2009 - 22:24)