Abstracts
Résumé
Les recherches en traitement automatique des langues nécessitent de vastes ressources de référence : corpus textuels, dictionnaires informatiques, outils de traitement. Cette contribution présente les ressources linguistiques informatisées du laboratoire atilf (Analyse et Traitement Informatique de la Langue Française) accessibles sur la toile ainsi que leur diversité d’exploitation potentielle. Regroupant un ensemble de plus de 3600 textes de langue française réunis dans frantext et divers dictionnaires, lexiques et autres bases de données, ces ressources exploitent les fonctionnalités du logiciel stella, qui correspond à un véritable moteur de recherche dédié aux bases textuelles s’appuyant sur une nouvelle théorie des objets textuels.
Abstract
Progress in linguistic research, especially in the field of automatic treatment, depends on access to a vast array of linguistic resources such as texts, dictionaries and software. This paper presents the computerized linguistic resources of the atilf Research Laboratory that are available on the Web and discusses the range of their potential uses. Consisting of a set of more than 3600 documents in French in the frantext database, as well as various dictionaries, lexicons, and other databases, these resources are accessed using the functions of stella, dedicated search engine software for textual databases based on a new theory of textual objects.
Appendices
Références
- Bernard, P., C. Bernet, J. Dendien, J.M. Pierrel, G. Souvay et Z. Tucsnak 2001 «Un serveur de ressources linguistiques informatisées via le Web», dans Actes de TALN 2001, Tours, Juillet 2001, p. 333-338.
- Bernard, P., J. Dendien, J. Lecomte et J.M. Pierrel 2002 «Un ensemble de ressources informatisées et intégrées pour l’étude du français : frantext, tlfi, dictionnaires de l’Académie et logiciel stella, présentation et apprentissage de leurs exploitations», Actes de TALN 2002, vol 2, p. 3-36, Nancy, 24-27 juin 2002 , disponible aussi à l’adresse : http://www.loria.fr/projets/TALN/TALN/index.html.
- Bernet, C. et J.M. Pierrel 2003 (à par.) «Histoire de frantext : constitution d’une base textuelle (1964-2002) et perspectives», dans J.C. Arnould et coll. L’édition électronique en littérature et dictionnairique : évaluation et bilan, Presses Universitaires de Rouen et Paris, Champion.
- Bonhomme, P. 2000 «Codage et normalisation de ressources textuelles», dans Pierrel 2000, pp. 173-192.
- cnrs 1976-1994 tlf, Dictionnaire de la langue du 19e et 20e siècle, Paris, cnrs et Gallimard.
- Dendien, J. 1991 Access to information in a textual database: access functions and optimal indexes, Oxford, Clarendon Press.
- Dendien, J. 1996 «Le projet d’informatisation du tlf», dans D. Pietrowsky et coll. Lexicographie et informatique, Paris, Didier, p. 25-34.
- Dendien, J. et J.M. Pierrel 2003 «Le Trésor de la Langue Française Informatisé : un exemple d’informatisation d’un dictionnaire de langue de référence», Traitement Automatique des Langues, 44-2 : 11-37, Paris, Hermès.
- frantext 1992 Autour d’une base de données textuelles; témoignages d’utilisateurs et voies nouvelles, Paris, Didier.
- Habert, B., A. Nazarenko et A. Salem 1997 Les linguistiques de corpus, Paris, Armand Colin.
- Martin, R. 2001 Sémantique et automate, coll. Écritures électroniques, Paris, PUF.
- Pierrel, J.M. 2000 Ingénierie des Langues, Traité Information – Commande – Communication, Paris, Hermès.
- Pruvost, J. 2002 Les dictionnaires de la langue française, coll. Que Sais-Je?, Paris, PUF.
- Véronis, J. 2000 «Annotation automatique de corpus : panorama et état de la technique», dans Pierrel 2000, pp. 111-130.