Révisions
1) Alignement
enregistrer au format texte
les versions anglaise et française du compte rendu du débat du parlement
européen "Women in the New Information Society".
aligner sous Word et importer
sous Access les versions anglaise et française de la première intervention de
Mme Karamanou.
|
|
Trouver les traductions employées pour le mot parallèlement. |
|
|
Trouver les traductions employées pour les expressions
contenant l'adjectif digital. |
|
|
Trouver l'occurrence du mot sector à laquelle
correspond un autre mot que secteur. |
2)
Etiquetage par Winbrill
Faire subir le prétraitement
nécessaire aux deux fichiers (séparation des mots des signes de ponctuation) et
étiqueter les deux versions à l'aide de Winbrill.
Rappels :
a) N'utiliser que les deux premiers volets du menu Options (Données et Catégorisation)
b) Vérifier que les fichiers choisis correspondent bien à la langue du document à étiqueter (inalf-lb5 pour le français, et Brill pour l'anglais). Le cas échéant, modifier le jeu de données dans l'onglet Catégorisation, puis cliquer sur Appliquer ET sur OK
b) Faire les choix suivants :
Catégorisation : état initial seulement
Lemmatisation : pas de lemmatisation
c) Ne pas oublier de mentionner l'extension (txt) des fichiers source et résultat.
3) Trouver dans le texte
anglais :
|
|
l'expression de patron syntaxique adjectif-nom la plus
employée |
|
|
les expressions de patron syntaxique nom-nom de fréquence 4 |
|
|
les occurrences de prétérite incorrectement étiquetées en
participe passé |
4) Trouver dans
le texte français :
|
|
l'expression de patron syntaxique nom-adjectif la plus
employée |
|
|
les occurrences de verbes à l'infinitif de fréquence 4 |
|
|
l'expression la plus employée contenant le patron
syntaxique nom-préposition-nom |
Trouver dans le texte anglais la traduction de cette expression