Le Web est une importante source pour l’acquisition lexicale parce qu’il est continuellement mis à jour. Des énumérations sont particulièrement fréquentes dans les pages Web, parce que ces dernières exigent une structure claire qui facilite la compréhension du lecteur. Nous considérons des énumérations d’entités nommées et nous nous focalisons sur une structure linguistique particulière : le déclencheur – la séquence qui introduit l’énumération. Ayant des fonctions précises, la structure d’un déclencheur est assez limitée. Ce travail a pour but de modéliser cette structure à partir des analyses linguistiques interprétatives et descriptives. Ces modèles contribuent au développement d’un système d’acquisition et de classification d’entités nommées à partir du Web.
The Web is an important resource for lexical acquisition, particularly for the acquisition of named entities. Enumerations are particularly prolific on the Web where economy and clarity are important to aid comprehension. Enumerations of named entities share certain characteristics, and by understanding these traits we can exploit the information that these structures hold. In this article we study one characteristic in particular, the trigger: the sequence that introduces an enumeration. Because a trigger sequence has several strict functions, its structure is limited. Our aim is to model this structure by means of an interpretative and descriptive linguistic analysis. The resulting models contribute to a system for acquiring named entities from the Web.
