Skip to Main content Skip to Navigation
Journal articles

Exploitation du corpus Democrat par apprentissage artificiel

Résumé : La détection automatique de chaînes de coréférences pour le français est encore un domaine assez peu exploré, entre autres en raison du développement tardif de ressources annotées adaptées. Le corpus Democrat, premier corpus de français écrit de grande envergure annoté en chaînes de coréférences rend possible l'utilisation de techniques d'apprentissage artificiel pour combler ce manque. Dans ce travail, nous présentons le système DeCOFre, premier système de détection des chaînes de coréférences pour le français parlé et étudions son utilisation pour le traitement de Democrat. Nos expériences montrent que ce système n'est pas robuste au changement induits par le passage de l'oral spontané à l'écrit et suggère que les particularités de Democrat pourraient être mieux prises en compte par des architectures plus riches que celles des systèmes end-to-end omniprésentes dans l'état de l'art récent. Mots-clés Apprentissage artificiel, réseaux de neurones artificiels, détection automatique des chaînes de coréférences, français
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-03475070
Contributor : Loïc Grobol Connect in order to contact the contributor
Submitted on : Friday, December 10, 2021 - 3:46:52 PM
Last modification on : Monday, January 10, 2022 - 5:30:15 PM

File

 Restricted access
To satisfy the distribution rights of the publisher, the document is embargoed until : 2022-12-10

Please log in to resquest access to the document

Licence


Distributed under a Creative Commons Attribution 4.0 International License

Identifiers

  • HAL Id : hal-03475070, version 1

Citation

Loïc Grobol. Exploitation du corpus Democrat par apprentissage artificiel. Langages, Armand Colin (Larousse jusqu'en 2003), 2021, Un corpus annoté en chaînes de référence et son exploitation– le projet Democrat, 224. ⟨hal-03475070⟩

Share

Metrics

Les métriques sont temporairement indisponibles