MASTER
EP A : Linguistique de corpus
1. Contexte historique de la LC
Position
des structuralistes, jugements de Chomsky concernant la LC. Opposition entre LC
et « linguistique de fauteuil » (Fillmore). Premières approches
quantitatives des sociolinguistes américains (Labov).
2. Définition, constitution et
représentativité, taille des corpus
Sinclair,
Biber, EAGLES.
3. Les systèmes d’annotation
Etiquetage
morpho-syntaxique (POS), corpus arborés. Annotation sémantique, utilisation des
dictionnaires informatisés, WordNet.
4. Les collocations
Définitions
(cooccurrence vs. collocations), le BBI, survol de la littérature sur la
question. Typologie des collocations. Utilisation des corpus pour l’aide à la
compréhension.
5. Les langues de spécialité
Définition.
« Sous-langages » de Harris, spécificité syntaxique des langues de
spécialité (exemples tirés de la langue médicale).
6. Les collocations en langue de
spécialité
Repérage
automatique, problème des collocations disjointes, distinction entre
phraséologie et terminologie.
7. L’adjectif relationnel en langue
de spécialité
8. Initiation à la
terminotique : application à la langue médicale (exploitation du corpus
MED-CRTT)
EP
B : Traitement de l’information linguistique
en ligne
·
Compilation
d’un corpus bilingue aligné à l’aide du logiciel Alinea
·
Exploitation
d’un corpus bilingue sous Access
·
Constitution
d’un corpus unilingue et utilisation du concordancier Monoconc
·
Utilisation de l’étiqueteur
Winbrill
·
Première séance de contrôle
continu
·
Utilisation du
concordancier AntConc
·
Interrogation du British National Corpus
·
Deuxième séance de contrôle
continu
·
Interrogation
du Corpus of Contemporary American
English
·
Interrogation du corpus
multilingue des débats du parlement européen par Corpus Query Language
·
Epreuve terminale de contrôle
continu
·
Exercice
de lexicographie bilingue