Exercices de révision
Utilisation
de Factiva et de Monoconc
http://perso.univ-lyon2.fr/~maniezf/c.zip
http://perso.univ-lyon2.fr/~maniezf/w.zip
Sur la base de données Factiva,
rechercher les articles publiés au cours de l’année précédente contenant
l'expression cancer du poumon et les mots tabagisme et
fumeurs.
Etiqueter le fichier obtenu à l’aide de Winbrill
Ouvrir le fichier résultat de l’étiquetage
dans Word et éliminer les deux points précédant pl et
sg dans les étiquettes des adjectifs et des noms.
Charger
le fichier résultat dans Monoconc et effectuer les requêtes permettant de
répondre aux questions suivantes :
1. nombre d’occurrences du mot maladie
2. adjectifs modifiant le mot maladie toutes
formes confondues (singulier + pluriel) plus de 3 fois
3. nombre total d’occurrences du nom risque toutes
formes confondues (singulier + pluriel)
4. noms qui sont utilisés comme complément du mot
risque(s) au moins 2 fois
5. nombre total de formes verbales du corpus.
Quels sont les trois verbes les plus utilisés à l’infinitif ?
Utilisation
d’Alinea et d’Access pour la création et
l’exploitation d’un corpus bilingue
Liens
utiles :
CR
des débats du parlement européen :
http://www.europarl.europa.eu/plenary/en/debates-video.html
Téléchargement
d’Alinea : [Format zip]
Aligner les versions anglaises et françaises du débat
du 31 mars 2004 intitulé : Safety of third countries aircraft using Community airports.
Donner la liste des diverses traductions françaises
des mots aircraft, dispute et further, et des diverses traductions anglaises du
mot problème.
Utilisation
d’Europarl
Utilisation
de PIE
http://phrasesinenglish.org/explore.html
Utilisation du Corpus of Contemporary American English
Utilisation
de Google Books par l’interface NGramViewer
1)
Trouver
l’expression binominale la plus fréquente en l’an 2008 dont le deuxième nom est le nom laser, et donner la date de sa première occurrence dans le corpus
Google Books.
2)
Trouver dans le corpus Google
Books le trigramme le plus fréquent en
2008 dont le mot central est l’adverbe ridiculement
(utiliser le corpus français de Leipzig pour en trouver les collocatifs les
plus fréquents).