8797 sujets

Développement web côté serveur, CMS

Salut à tous. Je me pose actuellement une petite question concernant un moteur de recherche avec système d'indexation des pages simples et dynamiques(générées).

Plusieurs méthodes s'offrent à moi... nous avons discutés à plusieurs mais nous n'arrivons pas à nous mettre d'accord sur une méthode.

Methode n°1 : tenter de générer grace à Apache toutes les pages dynamiques puis lire le contenu généré à la volée pour indexer (fichier ou BDD).

Méthode n°2 : Tenter de dévelloper un pseudo aspirateur de site pour pouvoir lire des pages générées (puis fichier ou BDD).

Méthode n°3 : Lancer une indexation "manuelle" qui genere les pages, puis ouvrir les fichiers grace à fopen (ou équivalent).

Méthode n°4 : Trouver autre chose.

C'est un peu vague mais nous ne savons pas trop par ou partir. J'ai trouvé beaucoup de moteurs de recherche déjà fait, plus ou moins bien. Mais j'aimerai vraiement ne pas reprendre quelque chose d'existant (peu importe sa qualitée).
La création à toujours meilleure goût personne ne me contredira je pense Smiley smile

Rude

[Digréssion]Je me suis intéréssé au sujet sur les motivations des alsanautes quant aux standards et je sais que ma question n'y est pas vraiement tournée. Néanmoins nous aimons alsa pour sa diversité et sa réactivitée (Et notre ami Florent.V.) Je n'en dit pas plus car ce n'est pas le sujet ici.[/Digréssion]
Modifié par ffwrude (03 Jun 2008 - 14:13)
Bonjour,

Alors heuuu... Vu de loin, comme ça, avec les renseignements que tu donnes, j'ai l'impression que tu prends le problème à l'envers. Alors je te réponds par deux questions :

Question N°1 : quel est le contenu à indexer ?
Question N°2 : si le contenu est dans une base de données, ne serait-il pas plus efficace et pertinent d'interroger ladite BDD ?

Ensuite, on envisage le côté technique de la chose.
Eh bien en fait le contenu à indexer sera du texte uniquement.

On peut donc penser à plusieurs cas de figures :

1. Le texte est présent en dur dans la page.
2. Le texte est généré dans la page à partir d'une base de données (des tarifs par exemples).
3. Le texte est généré à partir de PHP

Je pense avoir répondu à tes questions. en esperant que je sois clair Smiley smile

Rude