5546 sujets

Sémantique web et HTML

Bonjour à tous,

je cherche à récupérer des valeurs contenues entre certaines balises html.
Voici un extrait du code dans lequel se trouvent les valeurs :


<h3 class="cellTitle">First item</h3>.....<span class="price">€3,59</span>......<li class="buyPrice ">€1,99</li></ul>
.
.
.
<h3 class="cellTitle">Enieme item</h3>.....<span class="price">€13,59</span>......<li class="buyPrice ">€10,99</li></ul>


Ce qui m'intéresse est situé entre les balises :
- <h3 class="cellTitle">xxxx</h3>
-<span class="price">xxxx</span>
-<li class="buyPrice ">xxxx</li>


Comment faire pour que je puisse récupérer ces valeurs sous la forme :
titre : mon_premier_item
prix : le_prix_de_mon_premier_item
promo : le_prix_en_promo_de_mon_premier_item
-------------------------------
titre : mon_deuxieme_item
prix : le_prix_de_mon_deuxieme_item
promo : le_prix_en_promo_de_mon_deuxieme_item
--------------------------------
titre : mon_enieme_item
prix : le_prix_de_mon_enieme_item
promo : le_prix_en_promo_de_mon_enieme_it

Merci à tous ceux et toutes celles qui me permettront d'avancer la dessus.
Modifié par pareto (07 Feb 2017 - 18:10)
Se serait peut-être avec du javascript mais quel est le contexte içi? Une page en html, en php, un site e-commerce? Et une fois les valeurs récupérées, comment seront-elles traitées? Faudra t-il les mettre dans un tableau, dans un objet? Il faut mieux expliquer le contexte.
Merci pour la réponse, le contexte c'est un fichier txt, l'idée c'est de faire un xml avec pour pouvoir faire une importation dans wordpress. Je cherche juste à "nettoyer" le fichier pour ne conserver que ce qui m'est utile
Modifié par pareto (07 Feb 2017 - 19:39)
C'est plus clair maintenant.

Je ne saurais pas faire ça, mais j'espère que quelqu'un d'autre, avec plus d'expériences, pourra vous aider.
Salut,
Ton fichier .txt ressemble furieusement à du html, non ?

Si c'est le cas je vois 2 solutions : un "parsing" en Javascript ou bien en PHP. Parser du code est le fait de le parcourir et d'extraire du contenu désiré.

Pour aller plus loin et t'aiguiller, il faudrait que tu colles ici le début et la fin de ton fichier .txt en ne supprimant que les lignes de contenu et en laissant 3 ou 4 par exemple.
pareto a écrit :
Bonjour à tous,

je cherche à récupérer des valeurs contenues entre certaines balises html.
Voici un extrait du code dans lequel se trouvent les valeurs :


&lt;h3 class="cellTitle"&gt;First item&lt;/h3&gt;.....&lt;span class="price"&gt;€3,59&lt;/span&gt;......&lt;li class="buyPrice "&gt;€1,99&lt;/li&gt;&lt;/ul&gt;
.
.
.
&lt;h3 class="cellTitle"&gt;Enieme item&lt;/h3&gt;.....&lt;span class="price"&gt;€13,59&lt;/span&gt;......&lt;li class="buyPrice "&gt;€10,99&lt;/li&gt;&lt;/ul&gt;


Ce qui m'intéresse est situé entre les balises :
- &lt;h3 class="cellTitle"&gt;xxxx&lt;/h3&gt;
-&lt;span class="price"&gt;xxxx&lt;/span&gt;
-&lt;li class="buyPrice "&gt;xxxx&lt;/li&gt;


Comment faire pour que je puisse récupérer ces valeurs sous la forme :
titre : mon_premier_item
prix : le_prix_de_mon_premier_item
promo : le_prix_en_promo_de_mon_premier_item
-------------------------------
titre : mon_deuxieme_item
prix : le_prix_de_mon_deuxieme_item
promo : le_prix_en_promo_de_mon_deuxieme_item
--------------------------------
titre : mon_enieme_item
prix : le_prix_de_mon_enieme_item
promo : le_prix_en_promo_de_mon_enieme_it

Merci à tous ceux et toutes celles qui me permettront d'avancer la dessus.

Si le fichier en entrée est de type balisé (ce qui semble être le cas) et "bien formé" au sens XML (1 balise ouvrante = 1 balise fermante), les données qu'il contient peuvent être transmises à une feuille XSLT qui en assurera la conversion.
La description du processus XSLT dépasse le cadre de ce forum mais les articles traitant du sujet sont légion sur le web et pourront être facilement trouvés.
Une autre solution consiste à programmer un analyseur en Java, C#, ou autre langage en utilisant des librairies existantes.
Mais là aussi, cela dépasse le cadre du forum...