Révisions

1) Alignement

enregistrer au format texte les versions anglaise et française du compte rendu du débat du parlement européen "Women in the New Information Society".

aligner sous Word et importer sous Access les versions anglaise et française de la première intervention de Mme Karamanou.

Trouver les traductions employées pour le mot parallèlement.

Trouver les traductions employées pour les expressions contenant l'adjectif digital.

Trouver l'occurrence du mot sector à laquelle correspond un autre mot que secteur.

2) Etiquetage par Winbrill

Faire subir le prétraitement nécessaire aux deux fichiers (séparation des mots des signes de ponctuation) et étiqueter les deux versions à l'aide de Winbrill.

Rappels :

a) N'utiliser que les deux premiers volets du menu Options (Données et Catégorisation)

b) Vérifier que les fichiers choisis correspondent bien à la langue du document à étiqueter (inalf-lb5 pour le français, et Brill pour l'anglais). Le cas échéant, modifier le jeu de données dans l'onglet Catégorisation, puis cliquer sur Appliquer ET sur OK

b) Faire les choix suivants :

Catégorisation : état initial seulement

Lemmatisation : pas de lemmatisation

c) Ne pas oublier de mentionner l'extension (txt) des fichiers source et résultat.

3) Trouver dans le texte anglais :

l'expression de patron syntaxique adjectif-nom la plus employée

les expressions de patron syntaxique nom-nom de fréquence 4

les occurrences de prétérite incorrectement étiquetées en participe passé

4) Trouver dans le texte français :

l'expression de patron syntaxique nom-adjectif la plus employée

les occurrences de verbes à l'infinitif de fréquence 4

l'expression la plus employée contenant le patron syntaxique nom-préposition-nom

    Trouver dans le texte anglais la traduction de cette expression