Constitution d’un corpus bilingue aligné

 

1. Enregistrement des textes des débats du parlement européen

 

1.1. Accès aux transcriptions des sessions plénières

http://www.europarl.europa.eu/activities/archives/cre.do?language=EN

Cliquer sur Advanced Search, ce qui mène vers :

http://www.europarl.europa.eu/activities/archives/cre/search.do?language=EN

 

Le site subissant des modifications régulières, les liens ci-dessus peuvent à terme devenir caducs.

Dans ce cas :

-      Accéder au site par la requête « Europarl » sur un moteur de recherche (http://www.europarl.europa.eu/)

-     Cliquer successivement sur les onglets suivants : English, Plenary, Debates and Videos

 

1.2. Choix et copie du contenu du fichier de la langue source

Date range :  1999-2004

Words in title : SARS

Cliquer sur Search

Choisir le premier débat (Tuesday 13 May 2003) en cliquant sur l'icone qui se trouve en dessous du numéro P5_CRE(2003)05-13.

Copier l’ensemble du compte-rendu (depuis le titre « Severe acute respiratory syndrome (SARS) » jusqu’à « The debate is closed. »).

Coller le contenu du presse-papier dans un nouveau document Word.

A la fin du fichier, dans un nouveau paragraphe, taper trois fois le signe £, et l’enregistrer sous le nom SARS_13_05_03_EN.

Dans votre navigateur, cliquer sur le lien « fr » dans la barre contenant les abréviations des langues disponibles.

Copier l’ensemble du compte-rendu (depuis le titre « Syndrome respiratoire aigu sévère (SRAS) » jusqu’à « Le débat est clos.. ») à la fin du fichier Word qui contient la version anglaise, immédiatement après £££ sans sauter de paragraphe, et l’enregistrer au format Texte Brut.

Fermer le fichier et l’ouvrir de nouveau, puis l’enregistrer au format Document Word sous le nom SARS_13_05_03_EN_FR.

 

2. Formatage du corpus en deux colonnes

 

2.1. Création de la macro CODE_corpus_bilingue (raccourci clavier : Alt+Ctrl+*)

Remplacer toutes les occurrences de «M. » (M majuscule, point, espace) par M_ (en respectant la casse).

Remplacer toutes les occurrences d’un point suivi d’un espace par un point suivi d’un saut de paragraphe (.^p)

Procéder de la même manière pour les points d’interrogation et d’exclamation :

! + espace DEVIENT !+ paragraphe

? + espace DEVIENT? + paragraphe

Sélectionner l’ensemble du texte (Ctrl A) et le convertir en tableau (Tableau - Convertir - Texte en tableau).

Remplacer toutes les occurrences de «M_» par « M. » (M majuscule, point, espace).

 

Rechercher la suite de caractères « £££ » et l’effacer.

Fractionner le tableau ((Tableau - Fractionner) puis taper « Flèche vers le bas » pour se positionner dans le tableau de la version française.

Sélectionner la totalité de la colonne (Alt B O C) et la couper (Ctrl X).

 

Se positionner en début de fichier (Ctrl Début ou Ctrl Home ou Ctrl Orig, la touche en question ayant parfois la forme d’une flèche dirigée vers le haut à gauche).

Tableau – Insérer – Colonne à droite.

Tabulation

Coller (Ctrl V)

Tabulation

Tabulation

Alt B O C (sélectionner la colonne excédentaire)

Ctrl X (la supprimer)

Arrêter l’enregistrement de la macro

 

Les opérations précédentes sont intégralement reprises dans la macro CODE_corpus_bilingue, qui transforme en tableau préaligné un document à l'intérieur duquel deux versions du compte-rendu ont été insérées consécutivement en suivant la méthode décrite en 1.2. (version anglaise, puis version française).

 

Version préalignée du tableau

 

2.5. Correction manuelle des défauts d’alignment :

p. 3 : déplacer vers le haut « Ainsi… »  et effacer une cellule

p. 3 : déplacer vers le haut « They are summarised… in the spread of SARS,”

p. 6 : déplacer vers le haut « En effet… foyer initial »  

etc.

 

      2.6. Macro-commandes  (optionnelles)

     

Sub CRE_DeleteCell()

' CRE_DeleteCell Macro

' Objet : La macro efface une cellule d'un tableau en décalant les cellules vers le haut.

 

    Selection.Cells.Delete ShiftCells:=wdDeleteCellsShiftUp

End Sub

 

 

 

Sub CRE_Move1CellUp()

' Objet : Dans les cas où une phrase est traduite par plusieurs phrases dans l'autre langue,

'         la macro copie le contenu d'une cellule du tableau d'un alignement bilingue à la

'         suite de la cellule supérieure, et efface la cellule de départ.

 

' Passage à la cellule précédente

Selection.MoveLeft Unit:=wdCell

' Retour à la cellule de départ avec sélection

Selection.MoveRight Unit:=wdCell

' Couper

Selection.Cut

' Effacement de la cellule de départ

Selection.Cells.Delete ShiftCells:=wdDeleteCellsShiftUp

' Passage à la cellule supérieure

Selection.MoveLeft Unit:=wdCell

Selection.MoveLeft Unit:=wdCell

' Positionnement en fin de cellule

Selection.EndKey Unit:=wdLine

' Copier

Selection.PasteAndFormat (wdFormatOriginalFormatting)

End Sub

 

 

Version alignée du tableau

 

 

2.7. Transformation du tableau en un fichier texte délimité par des tabulations

Une fois l’alignement terminé, enregistrer le document, puis l’enregistrer de nouveau sous un autre nom (ajouter « deli » au nom de fichier)

Sélectionner le tableau et le transformer en texte (choisir les tabulations comme séparateur de colonnes)

Enregistrer le document sous le même nom, mais au format Texte brut (.txt).

 

3. Traitement du corpus dans le SGBD Access

 

3.1. Importation du fichier dans Access

Ouvrir Access 2003, et créer une nouvelle base de données vide appelée corpus_bilingue.

Choisir dans le menu Fichier : Données Externes-Importer (ou faire un clic droit et choisir Importer)

 

Choisir « Fichiers Texte » et importer le fichier texte récemment créé.

Choisir « délimité » et cliquer sur « Avancé ».

Choisir Tabulation comme séparateur de champ

Remplacer Champ1 par « English » (Type de données : Memo)

Remplacer Champ2 par « French » (Type de données : Memo)

Enregistrer sous : Spécification d'importation corpus bilingue et cliquer sur OK

 

Cliquer sur « suivant » jusqu’à l’obtention de la boîte de dialogue « Assistant Importation de Texte »

Choisir « Dans une nouvelle table»

Cliquer trois fois sur Suivant, et accepter le nom de table suggéré par le logiciel.

 

3.2. Création d’un formulaire

Ouvrir la table

Créer un formulaire (Formulaires - Créer un formulaire à l’aide de l’assistant)

Sélectionner les deux champs (English and French)

Choisir le format d’affichage tabulaire

Modifier la taille des champs (le champ French sera légèrement plus long que le champ English)

 

3.3. Création d’un filtre

Les filtres sélectionnent certains enregistrements en fonction de critères choisis par l’utilisateur.

Enregistrements - Filtrer - Filtre Tri avancé (Alt S F T, symbole affichant un entonnoir et un crayon)

Exemple :

Champ : English

Critère : Comme "*monitor*" 

Filtre - Appliquer le filtre/tri (touche à bascule)

Vérifier les traductions françaises

 

3.4. Autres filtres visant à rechercher des équivalents de traduction

Choisir d’autres mots (spread, regard)

 

a) sélection des occurrences de spread auxquelles correspondent d’autres équivalents de traduction que « propagation » ou « propager » :

Champ : English

Critère: Comme "*spread*"

Champ: French

Critère: Pas Comme "*propag*"  

 

b) sélection des occurrences de regard auxquelles correspondent d’autres équivalents de traduction que « matière » :

Champ : English

Critère: Comme "*regard*"

Champ: French

Critère: Pas Comme "*matière*"  

Mais cette dernière restriction supprime un enregistrement contenant la traduction "En ce qui concerne" pour "As regards", car le mot "matière" est utilisé dans la même phrase (joint programmes and advice on hygiene measures --> des programmes et conseils communs en matière de mesures sanitaires)

 

c) sélection des occurrences de "matière" auxquelles correspondent d’autres équivalents de traduction que regard :

Champ : English

Critère: Pas Comme "*regard*"

Champ: French

Critère: Comme "*matière*"

 

Exercice 

Dans le débat du 13 mars 2002 intitulé Tax Policy, rechercher les équivalents de traduction en français de toutes les expressions anglaises de type <tax N> (tax policy, tax evasion, etc.)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Correction de l’exercice 3.4. (partie C)

 

17 occurrences de "matière", dont 12 sans regard

Ces cas correspondent tous à une utilisation de la locution prépositionnelle "en matière de".

Un grand nombre de cas d'emploi de "en matière de" correspondent à la traduction des prépositions with, for, on ou in.

It is high time that there was a Community competence for health policy -->    Il est grand temps que la Communauté soit compétente en matière de politique sanitaire.

We cannot talk of prevention, control and timely intervention with communicable or other diseases --> Il ne saurait être question de prévention, de contrôle et d’intervention opportune en matière de maladies contagieuses ou autres.

There are some people in my country who say that Europe should not have any competence for health protection. --> D’aucuns, dans mon pays, disent que l’Europe ne doit pas disposer de compétences en matière de protection sanitaire.

It is right, as Mr Maaten pointed out, to issue uniform recommendations on travel into and out of the EU. --> Il serait judicieux, comme l’a signalé M. Maaten, de donner des recommandations uniques en matière d’entrée et de sortie de l’Union européenne.

The added value of working together is what the EU is all about in public health policy --> La valeur ajoutée du travail commun est tout ce que l’UE préconise en matière de politique sur la santé publique

On trouve également les expressions in the area of et when it comes to :

That the Commission points out to us for the first time actually to have done something in the area of health, even though it is not within its competence. --> Que la Commission nous dit avoir entrepris quelque chose pour la première fois en matière de santé, alors que ce domaine ne fait pas partie de ses compétences.

But, Mr President, consider also the competences in the area of public health. --> Néanmoins, Monsieur le Président, réfléchissez aussi aux compétences en matière de santé publique.

The EU needs more powers when it comes to infectious diseases. --> En matière de maladies contagieuses, l’Union a besoin de plus de pouvoirs.

Dans un cas, "en matière de" est utilisé pour expliciter la relation entre deux noms (travel advice) :

At the moment, however, we are still seeing different Member States giving conflicting travel advice about the so-called infected areas. --> Il n’en reste pas moins que, pour l’instant, certains États membres continuent de donner des conseils contradictoires en matière de voyage, sur les régions prétendument contaminées.

 

Dans certains cas, on observe des transpositions du nom au verbe ou la non traduction d'un verbe support :

to coordinate prevention, control and timely intervention to deal with diseases --> la coordination en matière de prévention, de contrôle et d’intervention opportune dans le cadre de la lutte contre les maladies

I should like to make another unpopular statement: why are we not talking about restricting travel? --> Et maintenant, une autre déclaration impopulaire: pourquoi ne pas évoquer des restrictions en matière de voyages?

responsible for taking preventive measures --> compétents en matière de mesures préventives

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Tax Policy (version pré-alignée)

Tax Policy (version alignée)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Tax treatment of losses in cross-border situations (version alignée)