Création et utilisation d’un corpus monolingue

A - CRÉATION DU CORPUS

·         Se connecter au site de l’Université Lyon 2

·         Cliquer sur BIBLIOTHEQUES, puis Collections

·         Cliquer sur Bibliothèque électronique

·         Choisir la base de données Factiva (lettres EF ou ACCES DIRECT)

·         Activez les options et choisir pour la période « Au cours du dernier mois »

·         Choisir les mots clés piratage et logiciel

·         Lancer la recherche (Rechercher)

·         Sélectionner les titres 1 à 100 et les télécharger (format de téléchargement : RTF, format article complet)

·         Ouvrir le fichier avec Word, et l’enregistrer au format texte sous le nom piratage_logiciel_1.txt


Optionnel  (en cas d’utilisation des seuls 100 premiers articles, passer directement à l’étape B.2) :

·         Désélectionner les titres 1 à 100, cliquer sur les 100 suivants et sélectionner les titres 101 à 200

·         Répéter l’opération jusqu’à l’enregistrement de la totalité des résultats au format texte.

 

B - PRETRAITEMENT DU CORPUS (passage au format TXT)

1)

·         Ouvrir un nouveau document dans Microsoft Word

·         Y insérer l’ensemble des fichiers enregistrés précédemment (NB : on peut choisir de compiler le corpus sous la forme de fichiers séparés).

·         Enregistrer votre document sous le nom piratage, au format Texte Brut (Codage Windows).

2)

·         Remplacer toutes les occurrences de l'apostrophe par apostrophe+espace (en l’absence de cette précaution, des suites de caractères telles que arrêter, d’arrêter, l’arrêter m’arrêter, s’arrêter, ou t’arrêter seront comptabilisées par un concordancier comme autant de mots distincts)

·         Enregistrer votre document et quitter Word

·         Exemple de corpus constitué à partir des mots-clés piratage et logiciel : piratage-1.txt

 

C - UTILISATION DU CORPUS SOUS MONOCONC

 

D - Pré-traitement préalable à l’étiquetage du corpus

On peut également utiliser l’utilitaire ReplaceText et y importer un tableau de remplacement effectuant ces opérations (menu File Import Search/Replace Table).