Cette documentation explique comment créer des bases avec ScienQuest 18.
Il faut commencer par se constituer une base d'exemples; c'est à dire effectuer des recherches dans ScienQuest 18 et les sauvegarder.

On récupère ainsi un nouveau fichier SQ2 pour chaque exemple. Ces fichiers SQ2 constituent la
base d'exemples.
La
base Dicorpus contient les méta-données sur les exemples (nom de l'exemple, catégorie, fréquence, etc.). Il s'agit d'un
fichier CSV, que l'on peut créer et modifier avec n'importe quel logiciel de tableur. C'est toutefois assez compliqué avec Excel; il vaut mieux utiliser un tableur simple à utiliser, comme
LibreOffice Calc. Le fichier CSV est codé en UTF-8, avec la virgule comme séparateur de champ et les guillemets doubles comme séparateur de texte. Dans LibreOffice Calc, lors de l'ouverture et de la sauvegarde d'un fichier CSV, il faut donc remplir le formulaire suivant:
Une base Dicorpus contient des colonnes de deux types: les colonnes obligatoires, qui doivent toujours être présentes, et les colonnes facultatives.
Colonnes obligatoires
Elles peuvent être dans n'importe quel ordre, mais doivent avoir
exactement les titres ci-dessous.
- expression
- Le nom de l'expression.
- type
- Le type d'expression. Dans l'interface de Dicorpus, les expressions sont classées par type.
- fichier
- Le nom du fichier SQ2 de l'exemple de l'expression, téléchargé à l'étape précédente.
Colonnes facultatives
Il est possible d'ajouter n'importe quel nombre d'autres colonnes, avec n'importe quel titre. Ce titre sera affiché dans l'interface. La liste des colonnes effectivement affichées dans l'interface est indiquée pa la directive
!cols (voir plus loin pour les directives). Une colonne facultative a un comportement particulier:
- Synonymes #SYN
- Les synonymes d'une expression. Le titre de cette colonne est particulier: on peut remplacer "synonymes" par n'importe quel texte, à condition qu'il soit suivi par #SYN. Ce texte dera affiché à la place du titre normal de ce champ dans l'interface de Dicorpus (voir schéma ci-dessous). On peut indiquer plusieurs synonymes, séparés par des caractères | . Chaque synonyme doit correspondre à une expression, et un lien sera automatiquement ajouté vers cette expression.
Postionnement du contenu des colonnes dans l'interface
Directives
Les directives sont des indications gloables, placées à la fin du fichier CSV. Il ne s'agit pas de colonnes, mais d'indications placées à la fin du fichier (une par ligne), sous la forme !nomdirective=valeurdirective. On peut utiliser les directives suivantes:
- !title
- Titre de la base
- !corpus
- Code du corpus, par exemple:
- sqCorpus_sctexts-fr__sctexts-fr
- Corpus de textes scientifiques français
- sqCorpus_sctexts-en__sctexts-en
- Corpus de textes scientifiques anglais
- sqCorpus_learners-en__learners-en
- Corpus d'apprenants de l'anglais
- !lang
- Code de la langue de l'interface. Actuellement, seul fr (français) est supporté.
- !cols
- La liste des colonnes facultatives à afficher, séparées par des caractères |.
- !version
- Le code de la version de ScienQuest à utiliser. Par défaut, il s'agit de ScienQuest 18 (code 18). On peut aussi utiliser ScienQuest 17 (déconseillé, code 17-dev)
Le fichier d'exemple ci-dessous contient un exemple d'utilisation de directives.
Exemple
Un exemple de fichier Base Dicorpus est disponible
ici.