Exploitation du corpus Democrat par apprentissage artificiel - Langues, textes, traitement informatique, cognition Accéder directement au contenu
Article Dans Une Revue Langages Année : 2021

Exploitation du corpus Democrat par apprentissage artificiel

Résumé

La détection automatique de chaînes de coréférences pour le français est encore un domaine assez peu exploré, entre autres en raison du développement tardif de ressources annotées adaptées. Le corpus Democrat, premier corpus de français écrit de grande envergure annoté en chaînes de coréférences rend possible l'utilisation de techniques d'apprentissage artificiel pour combler ce manque. Dans ce travail, nous présentons le système DeCOFre, premier système de détection des chaînes de coréférences pour le français parlé et étudions son utilisation pour le traitement de Democrat. Nos expériences montrent que ce système n'est pas robuste au changement induits par le passage de l'oral spontané à l'écrit et suggère que les particularités de Democrat pourraient être mieux prises en compte par des architectures plus riches que celles des systèmes end-to-end omniprésentes dans l'état de l'art récent. Mots-clés Apprentissage artificiel, réseaux de neurones artificiels, détection automatique des chaînes de coréférences, français
Fichier principal
Vignette du fichier
LG_article_mis_en_forme.pdf (336.98 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03475070 , version 1 (10-12-2021)

Licence

Paternité

Identifiants

  • HAL Id : hal-03475070 , version 1

Citer

Loïc Grobol. Exploitation du corpus Democrat par apprentissage artificiel. Langages, 2021, Un corpus annoté en chaînes de référence et son exploitation– le projet Democrat, 224. ⟨hal-03475070⟩
60 Consultations
36 Téléchargements

Partager

Gmail Facebook X LinkedIn More