Langue de l'interface: [ fr ]   [ en ]

ScienQuest − Corpus frWaC

Corpus
Recherche
Outils
Connexion
À propos
Français Anglais
Aide
ScienQuest
Corpus

À propos: frWaC

Corpus construit automatiquement à partir des sites Web du domaine fr.

Description

Corpus analysé par Timothee Mickus avec le parseur Mind The Gap développé par Maximin Coavoux et Benoît Crabbé.
Corpus
Marco Baroni, Silvia Bernardini, Adriano Ferraresi & Eros Zanchetta. The wacky wide web: a collection of very large linguistically processedweb-crawled corpora. Language Resources and Evaluation, 2009.
Analyse
Timothee Mickus, Olivier Bonami, Denis Paperno. Distributional Effects of Gender Contrasts Across Categories. Proceedings of the Society for Computation in Linguistics, 2019.
Parseur
Maximin Coavoux & Benoît Crabbé. Multilingual Lexicalized Constituency Parsing with Word-Level Auxiliary Tasks. EACL 2017. [Git]

ScienQuest 20 − Dernière mise à jour le 2019-10-23.

Corpus frWaC − À propos du corpus − Permalien vers ce corpus dans ScienQuest.