E - Étiquetage à l’aide de Winbrill

Jeu d’étiquettes et exemples de textes étiquetés et lemmatisés.

Instructions préalables :

·         Télécharger le fichier w.zip

·         Décompacter l’archive dans un dossier nommé Winbrill.

·         Quitter le logiciel de décompactage

·         Se placer dans le dossier Winbrill

·         Lancer l’auto-exécutable Winbrill (Application, taille 620 Ko)

Utilisation de l’étiqueteur

 

 

 

F - UTILISATION DU CORPUS ÉtiquetÉ SOUS MONOCONC

Charger le corpus étiqueté piratage1-5pdd.txt

Dans le menu File, choisir Tag Settings et indiquer la barre oblique (slash) comme séparateur entre le mot et son étiquette.

Dans le menu File, cliquer sur Collect Tag Information

Requêtes

 

Exemples de quelques erreurs d’étiquetage :

identifiant/V*

compte/SBCsg

ferme*/SBC*

 

Élimination des étiquettes à la visualisation : Display Suppress Part-of-speech

 

Analyse des patrons Nom-Adjectif au singulier

*/SBCsg */ADJsg

Alt Q A

 

 

Quels sont les autres noms que propriété qui sont qualifiés par l’adjectif intellectuel plus d’une fois dans le corpus ?

*/SBCsg intellectuel*/ADJsg

Alt Q A

 

 

Analyse des patrons Nom-Adjectif au pluriel

*/SBCpl */ADJpl

   

 

Recherche des collocats nominaux de certains adjectifs :

 */SBC?? musica*/ADJ??

 */SBC?? numérique*/ADJ??

 

 

Recherche des collocations Verbe - Adverbe  :

*/V* *ment/ADV

 

Recherche des Collocats verbaux de l’adverbe illégalement :

illégalement/ADV Ctrl+F

Noter les différences dans la syntaxe des verbes utilisés.

 

Révision