Modérateur
Bonjour,

Je me demandais s'il existait une liste de stop-words (mots vides n'ayant aucun intérêt dans une recherche) plus complète que celle que j'ai trouvé ici : http://www.ranks.nl/stopwords/french.html
J'ai réalisé un moteur de recherche maison pour faire des recherches sur un site et analyse les mots-clés entrés par l'utilisateur pour supprimer les petits mots inutiles.

Merci.
Modérateur
J'ai l'impression que non, il n'y a pas plus complet. J'en ai trouvée une sur un google code : http://code.google.com/p/stop-words/
Mais elle n'est pas plus complète...
Pour information, voici le tableau dans lequel j'ai ajouté ces mots :
$stopwords = array('alors', 'au', 'aucun', 'aussi', 'autre',  'avant', 'avec', 'avoir', 'bon', 'car', 'ce', 'cela', 'ces', 'ceux', 'chaque', 'ci', 'comme', 'comment', 'dans', 'des', 'du', 'dedans', 'dehors', 'depuis', 'deux', 'devrait', 'doit', 'donc', 'dos', 'droite', 'début', 'elle', 'elles', 'en', 'encore', 'essai', 'est', 'et', 'eu', 'fait', 'faites', 'fois', 'font', 'force', 'haut', 'hors', 'ici', 'il', 'ils', 'je', 'juste', 'la', 'le', 'les', 'leur', 'là', 'ma', 'maintenant', 'mais', 'mes', 'mien', 'moins', 'mon', 'mot', 'même', 'ni', 'nommés', 'notre', 'nous', 'nouveaux', 'ou', 'où', 'par', 'parce', 'parole', 'pas', 'personnes', 'peut', 'peu', 'pièce', 'plupart', 'pour', 'pourquoi', 'quand', 'que', 'quel', 'quelle', 'quelles', 'quels', 'qui', 'sa', 'sans', 'ses', 'seulement', 'si', 'sien', 'son', 'sont', 'sous', 'soyez', 'sujet', 'sur', 'ta', 'tandis', 'tellement', 'tels', 'tes', 'ton', 'tous', 'tout', 'trop', 'très', 'tu', 'valeur', 'voie', 'voient', 'vont', 'votre', 'vous', 'vu', 'ça', 'étaient', 'état', 'étions', 'été', 'être');

Je pense qu'on pourrait faire mieux. On pourrait y ajouter des mots invariables, tous les déterminants... D'autres conseils peut-être ?