Introduction

Cette documentation explique comment créer des bases avec ScienQuest 18.

Base d'exemples

Il faut commencer par se constituer une base d'exemples; c'est à dire effectuer des recherches dans ScienQuest 18 et les sauvegarder. On récupère ainsi un nouveau fichier SQ2 pour chaque exemple. Ces fichiers SQ2 constituent la base d'exemples.

Base Dicorpus

La base Dicorpus contient les méta-données sur les exemples (nom de l'exemple, catégorie, fréquence, etc.). Il s'agit d'un fichier CSV, que l'on peut créer et modifier avec n'importe quel logiciel de tableur. C'est toutefois assez compliqué avec Excel; il vaut mieux utiliser un tableur simple à utiliser, comme LibreOffice Calc. Le fichier CSV est codé en UTF-8, avec la virgule comme séparateur de champ et les guillemets doubles comme séparateur de texte. Dans LibreOffice Calc, lors de l'ouverture et de la sauvegarde d'un fichier CSV, il faut donc remplir le formulaire suivant:
Une base Dicorpus contient des colonnes de deux types: les colonnes obligatoires, qui doivent toujours être présentes, et les colonnes facultatives.

Colonnes obligatoires

Elles peuvent être dans n'importe quel ordre, mais doivent avoir exactement les titres ci-dessous.
expression
Le nom de l'expression.
type
Le type d'expression. Dans l'interface de Dicorpus, les expressions sont classées par type.
fichier
Le nom du fichier SQ2 de l'exemple de l'expression, téléchargé à l'étape précédente.

Colonnes facultatives

Il est possible d'ajouter n'importe quel nombre d'autres colonnes, avec n'importe quel titre. Ce titre sera affiché dans l'interface. La liste des colonnes effectivement affichées dans l'interface est indiquée pa la directive !cols (voir plus loin pour les directives). Une colonne facultative a un comportement particulier:
Synonymes #SYN
Les synonymes d'une expression. Le titre de cette colonne est particulier: on peut remplacer "synonymes" par n'importe quel texte, à condition qu'il soit suivi par #SYN. Ce texte dera affiché à la place du titre normal de ce champ dans l'interface de Dicorpus (voir schéma ci-dessous). On peut indiquer plusieurs synonymes, séparés par des caractères | . Chaque synonyme doit correspondre à une expression, et un lien sera automatiquement ajouté vers cette expression.

Postionnement du contenu des colonnes dans l'interface

Directives

Les directives sont des indications gloables, placées à la fin du fichier CSV. Il ne s'agit pas de colonnes, mais d'indications placées à la fin du fichier (une par ligne), sous la forme !nomdirective=valeurdirective. On peut utiliser les directives suivantes:
!title
Titre de la base
!corpus
Code du corpus, par exemple:
sqCorpus_sctexts-fr__sctexts-fr
Corpus de textes scientifiques français
sqCorpus_sctexts-en__sctexts-en
Corpus de textes scientifiques anglais
sqCorpus_learners-en__learners-en
Corpus d'apprenants de l'anglais
!lang
Code de la langue de l'interface. Actuellement, seul fr (français) est supporté.
!cols
La liste des colonnes facultatives à afficher, séparées par des caractères |.
!version
Le code de la version de ScienQuest à utiliser. Par défaut, il s'agit de ScienQuest 18 (code 18). On peut aussi utiliser ScienQuest 17 (déconseillé, code 17-dev)
Le fichier d'exemple ci-dessous contient un exemple d'utilisation de directives.

Exemple

Un exemple de fichier Base Dicorpus est disponible ici.

Où récupérer/déposer la base de données ?

Les bases de données peuvent être téléchargées ou déposées dans l'interface d'administration de Dicorpus (identification requise).