L'informatique d'oriention textuelle, domaine relativement nouveau, a beaucoup contribué à une évolution rapide de la lexicographie et de la terminologie. Depuis janvier 1991, nous organisons une base de données textuelles du portugais dans le cadre du Centre d'Études Comparées de l'Université Nouvelle de Lisbonne. Cette base est constituée surtout par des textes scientifiques et techniques, de vulgarisation, mais aussi par un nombre imponant de textes de langue courante. Dans cet article, nous mettons l'accent sur la scannérisation et les critères d'organisation de la base textuelle : la sélection de textes scientifiques concernant les différentes recherches en terminologie; l'utilisation d'hypertextes.
Textual computer science is a relatively new area which has greatly contributed to the rapid evolution of lexicography and terminology. Since January 1991 a textual data base has been set up in the Universidade nova de Lisboa. This Portuguese textual data base is made up largely of popular scientific and technical texts with some everyday language texts. Using hypertext, specific data processing operations can be carried out, which is an important phase in automating terminology and lexicography work. This article focuses on the scanning phase, and on the criteria used for structuring the terminology data base, such as the different processes for selecting scientific texts for terminological research and the use of hypertexts.
Download the article in PDF to read it.