public marks

PUBLIC MARKS from pvergain with tags google & outils

27 February 2007 20:00

Trouver des synonymes avec Google et python

Trouver des synonymes avec Google Le Mar 20 Fév 2007 Nous allons détourner l’opérateur « synonyme » de Google afin de générer une liste de synonymes proposés par le moteur de recherche pour un mot-clé déterminé. Afin de simplifier la recherche de ces mots, le tout sera automatisé par un script Python court et efficace. L’opérateur synonyme « ~ » de Google élargit votre recherche aux mots que Google considèrent comme synonymes de vos mots-clés. Google utilise également des mots apparentés mais qui ne sont pas de vrais synonymes. Ainsi, la recherche nutrition information renvoie toutes les pages contenant les mots nutrition et information. En élargissant votre recherche avec la requête ~nutrition ~information, Google utilisera également les synonymes et mots apparentés comme food, health, etc. Notez que les synonymes fonctionnent mieux en anglais. Rechercher ces synonymes peut devenir un exercice amusant. Imaginons que nous recherchons tous les synonymes du mot « car ». Nous commençons par lancer une recherche Google avec ~car pour trouver toutes les pages contenant un synonyme de ce mot. Dans la page des résultats, ces synonymes sont mis en évidence en gras, de la même manière que les mots-clés que vous utilisez d’habitude. En parcourant les résultats, la seconde page se trouve sur la copie d’écran ci-dessous, pour ~car nous pouvons trouver les mots car, cars, motor, auto, BMW et plusieurs autres synonymes en gras. ~car génère une liste de synonymes en gras dans la pages des résultats Intéressons-nous maintenant à ces synonymes plutôt qu’au mot-clé d’origine, « car ». Pour y parvenir, il nous suffit d’exclure le mot « car » de la requête : ~car -car. Cette astuce nous fait gagner du temps en nous évitant de mettre de côté les occurrences du mot « car ». Ici encore, nous devons parcourir les résultats pour trouver de nouveaux synonymes (j’ai par exemple trouvé automotive, racing, vehicle, et motor). Notez tous les nouveaux synonymes que vous trouvez et excluez-les de la requête (par exemple ~car -car -automotive -racing -vehicle -motor) jusqu’à ce que vous atteigniez la limite de 10 mots-clés imposée par Google et au-delà de laquelle les mots-clés sont ignorés. Vous finirez par rassembler une liste impressionnante de mots-clés. L’approche algorithmique de la recherche de synonyme proposée par Google permet de découvrir des synonymes que vous n’auriez pas trouvé dans un dictionnaire synonymique classique. Le code Si vous estimez que cette tâche est bien trop pénible et qu’elle conviendrait mieux à un programme informatique, vous avez tout à fait raison. Voici un petit script Python qui réalisera ce travail à votre place. En partant d’un mot-clé, ce programme génère une liste de synonymes de plus en plus grande. Vous aurez besoin de la bibliothèque PyGoogle pour interfacer ce script avec l’API Google.

pvergain's TAGS related to tag google

2007 +   django +   docs.google.com +   Google Scholar +   internet +   marissa mayer +   moteurs de recherche +   outils +   people +   platforms +   python +   rest +   video +   web +   web2.0 +