MASTER
EP A : Linguistique de corpus
1. Contexte historique de la LC
Position
des structuralistes, jugements de Chomsky concernant la LC. Opposition entre LC
et « linguistique de fauteuil » (Fillmore). Premières approches
quantitatives des sociolinguistes américains (Labov).
2. Définition, constitution et
représentativité, taille des corpus
Sinclair,
Biber, EAGLES.
3. Les systèmes d’annotation
Etiquetage
morpho-syntaxique (POS), corpus arborés. Annotation sémantique, utilisation des
dictionnaires informatisés, WordNet.
4. Les collocations
Définitions
(cooccurrence vs. collocations), le BBI, survol de la littérature sur la
question. Typologie des collocations. Utilisation des corpus pour l’aide à la
compréhension.
5. Les langues de spécialité
Définition.
« Sous-langages » de Harris, spécificité syntaxique des langues de
spécialité (exemples tirés de la langue médicale).
6. Les collocations en langue de
spécialité
Repérage
automatique, problème des collocations disjointes, distinction entre
phraséologie et terminologie.
7. L’adjectif relationnel en langue
de spécialité
8. Initiation à la terminotique :
application à la langue médicale (exploitation du corpus MED-CRTT)
EP
B : Traitement de
l’information linguistique en ligne
·
Constitution
d’un corpus unilingue et utilisation du concordancier Monoconc
·
Utilisation de
l’étiqueteur Winbrill
·
Compilation
d’un corpus bilingue aligné à l’aide du logiciel Alinea
·
Exploitation
d’un corpus bilingue sous Access
·
Utilisation du
concordancier AntConc
·
Epreuve
intermédiaire de contrôle continu