Abstracts
Résumé
Les dictionnaires lisibles par machine ont fait l’objet de plusieurs recherches orientées vers leur utilisation pour la construction automatique de thésaurus et de bases de données lexicales. Le compte rendu de ces recherches fait état des méthodes utilisées pour l’extraction automatique des informations contenues dans ces dictionnaires et précise la nature des données ainsi recueillies. L’auteur présente un projet de recherche utilisant le Robert électronique sur CD-ROM et mené à l’École de bibliothéconomie et des sciences de l’information de l’Université de Montréal dans le profil « Analyse de l’information et bases de données ». Ce projet consiste à construire, à l’aide du logiciel SATO et à partir d’une liste de termes du thésaurus du Centre des Données sur les émissions du Service de l’Information de Radio-Canada, un thésaurus contenant seulement les informations fournies par le dictionnaire et à le comparer au thésaurus-source.
Abstract
Much research has been done on the use of online dictionaries in the automatic construction of thesauri and glossaries. An account of this body of research outlines the methodologies used to extract the information contained in these dictionaries and clarifies the nature of the data retreived. The author presents a research project using the CD-ROM version of the dictionary Robert, which he carried out for the course « Analyse de l'information et bases de données » at the École de bibliothéconomie et des sciences de l’information at the Université de Montréal. Using the software SATO and a list of terms from the thesaurus of the Centre des Données sur les émissions du Service de l’Information de Radio-Canada, the project's aim was to build a thesaurus using the information found in the dictionary and to compare it to the source-thesaurus.
Resumen
Los diccionarios legibles con máquinas han sido muy estudiados en investigaciones orientadas hacia su utilización para la elaboración automática del diccionario de sinónimos y base de datos léxicos. El resumen de esas investigaciones da muestra de los métodos utilizados para extraer automáticamente las informaciones de los diccionarios mencionados y precisa la naturaleza de los datos recopilados de esa manera. El autor presenta un proyecto de investigación que se vale del Robert electrónico en DC-ROM y se llevó a cabo en la Escuela de biblioteconomía y de las ciencias de la información de la Universidad de Montreal: "Análisis de información y bases de datos". Este proyecto consiste en elaborar, mediante el programa SATO y a partir de una lista de términos del diccionario de sinónimos del Centro de Datos sobre las emisiones del Servicio de Información de Radio Canadá, un diccionario de sinónimos que contenga únicamente las informaciones suministradas por el diccionario al tiempo que se compara con el diccionario de sinónimos que sirvió de fuente.
Download the article in PDF to read it.
Download