Le repérage d’information sur le Web présente des défis particuliers, en raison de la grande variété de domaines, genres et styles des documents (ce qui augmente les phénomènes de polysémie, d’homonymie et de synonymie), et des types de requêtes utilisées, en général très courtes. En conséquence, les résultats d’une recherche sont souvent très nombreux et peu pertinents. Il faut donc trouver des approches intermédiaires : nous avons étudié les résultats de cinq requêtes de base et de variantes obtenues par enrichissement morphologique et synonymique, dans le but d’identifier des pistes valables de reformulation de requêtes. Nous avons porté une attention particulière au lien syntaxique entre les termes de la requête dans les documents et à son rapport avec la pertinence de ces termes, et effectivement constaté que la prise en compte de ce lien devrait permettre d’augmenter la précision des requêtes sans trop nuire à leur rappel.
Web information retrieval presents particular challenges due to the wide range of topics, genres and styles in web pages (which increase the frequency of polysemy, homonymy and synonymy) combined with the general use of very brief search strings, resulting in the retrieval of many pages with little relevance. A new approach must thus be found. We have studied the results from five basic queries and variations derived using morphological changes and synonyms in order to identify useful strategies for query reformulation. Our study pays particular attention to syntactic link between search terms in the documents and its connection to the relevance of these terms, and finds that taking this link into account improves the precision of the search without diminishing retrieval.
