La création de corpus est une tâche longue et complexe, pour laquelle, aujourd´hui, des outils informatiques sont nécessaires. Donc, un des objectifs des outils de corpus est d’aider à les créer et à les gérer. La Fondation Elhuyar a développé l'outil Corpusgile a ce but.
D'autre part, l'Internet a ouvert des nouvelles opportunités pour la création de corpus et la linguistique de corpus. Les avantages sont clairs : un énorme dépôt de textes continûment croissant, déjà digitalisé, à la portée de tout le monde... Il y a deux points de vue concernant Internet et les corpus. L'un consiste à consulter l'Internet directement comme si c'était un corpus (web as corpus). L'outil CorpEus développé à Elhuyar est de ce type-ci. L'autre consiste à utiliser Internet comme source de textes pour créer des corpus (web for corpus). L'outil Co3 que nous sommes en train de développer maintenant est de ce type-là.
Enfin, c'est important aussi d'avoir des outils pour la consultation, exploitation et obtention d'information des corpus. Elhuyar a développé des outils automatiques pour l'extraction de lexique et de terminologie à partir de corpus.
Copyright © 2007 Elhuyar Fundazioa | Avis juridique | Plan du site | Erabiltzaile-kopurua: 856789
Diseinua: Blanco