Phrases in English

 

Recherche de N-Grams

Application lexicographique.

1. Recherche des collocations faisant intervenir le verbe « come »

Choose : 4-grams

Minimum Frequency : 10

Data Chunk Size : 100

came to the N ?? (catégorie : all nouns)  

Cliquer sur Query

Distinguer les collocations des expressions idiomatiques, et les expressions complètes de celles qui requièrent une complémentation. 

1.1. Etude de l'expression idiomatique "come to the crunch"

Pour trouver l'ensemble des formes verbales correspondant aux usages de l'expression :

V* to the crunch (verbs all)

Minimum frequency 5

comes to the crunch

19

VVZ PRP AT0 NN1

came to the crunch

11

VVD PRP AT0 NN1

  Cliquer sur l’expression pour consulter les contextes.

Recherche de la forme la plus fréquente :

When it V* to the crunch

 

when it comes to the crunch

14

CJS PNP VVZ PRP AT0 NN1

when it came to the crunch

8

CJS PNP VVD PRP AT0 NN1

Utiliser « Clear Filter » entre les recherches

1.2. Recherche des occurrences de l'expression "come to the fore"

V* to the fore

Minimum frequency 2

Décocher “Display POS tags”

came to the fore

45

come to the fore

29

comes to the fore

20

brought to the fore

16

come to the fore

15

coming to the fore

14

been to the fore

6

come to the fore

6

are to the fore

5

was to the fore

4

brings to the fore

3

bring to the fore

3

were to the fore

3

Cet affichage fait apparaître l'utilisation de trois verbes.

come to the fore

bring to the fore

be to the fore

Vérification de la possibilité d’une autre préposition avec le verbe to be (verbs:BE)

VB ? (prepositions:all) the fore

 

been to the fore

6

are to the fore

5

was to the fore

4

were to the fore

3

   

AHD : idiom. to the fore. In, into, or toward a position of prominence: A new virtuoso has come to the fore.

 

2. Recherche des collocants du verbe settle. 

settle the N??

Fréquence minimale = 3

donne la liste des objets typiques du verbe.

 

settle the dispute

27

settle the matter

26

settle the issue

17

settle the claim

11

settle the case

8

settle the conflict

7

settle the question

7

settle the terms

7

settle the bill

4

settle the affairs

3

settle the argument

3

settle the disputes

3

settle the problem

3

settle the row

3

Recherche des sujets typiques (nouns:common) 

N?? settl*

POS 2 : V* (verbs:all)

 

eyes settled

9

family settled

7

dust settled

6

family settled

6

things settled

5

house settled

4

oak settle

4

particles settle

4

people settle

4

things settle

4

claim settled

3

crystal settling

3

dust settle

3

dust settled

3

dust settling

3

mother settled

3

party settled

3

people settled

3

people settled

3

silence settled

3

snow settled

3

thing settled

3

woman settled

3

Repérer parmi ces contextes :

a) L'expression idiomatique la plus fréquente (le recours à l'ordre alphabétique n'est pas nécessaire ici, mais peut s'avérer utile pour regrouper les formes conjuguées d'un même verbe)

b) Une erreur d'étiquetage

NB: L’étiquetage en parties du discours est différent de celui de WinBrill :

  Trouver les contextes d'utilisation du verbe settle avec un complément prépositionnel. Diviser les utilisations de settle on et settle for en fonction de leur sens.

3) Exercices d'application

A) Etudier les combinaisons les plus fréquentes du patron syntaxique ADJ N AND N dans le BNC de fréquence minimale 30 et repérer les expressions dans lesquelles l'adjectif modifie uniquement le premier nom.

En formulant des requêtes de n-grams de taille supérieure qui contiennent la séquence ADJ N AND N, déterminez quelles sont les expressions incomplètes dans lesquelles un constituant manque à droite et/ou à gauche.

Quelle est l'expression complète contenant la séquence "economic cooperation and development"?

B) Donner la liste des 3 expressions les plus fréquentes correspondant au patron syntaxique : verbe + particule adverbiale + adjectif, de fréquence minimale 5 et dans lesquelles l’adjectif n’est pas new (lemmatiser).

Que peut-on dire de l'étiquetage des occurrences de « reported in early » ?

Établir la liste des adjectifs dont l’emploi peut être considéré comme adverbial.

 

C) Donner la liste des expressions correspondant au patron syntaxique : adjectif + adjectif + nom + nom de fréquence supérieure à 18 dont le premier nom n'est pas minister et déterminer le découpage syntaxique le plus fréquent à l'intérieur de ce groupe.

 

D) Donner la liste des expressions correspondant au patron syntaxique : adjectif + adjectif + nom de fréquence supérieure à 100 et inférieure à 500 dont le premier adjectif n'est pas other. Séparer les collocations des termes.

 

E) Donner la liste des expressions correspondant au patron syntaxique : verbe à la forme en -ing + nom de fréquence supérieure à 100. 

Quelles sont les formes que l'on peut globalement analyser comme correspondant à des groupes nominaux? 

Quelle étiquette pourrait-on substituer à l'étiquette VVG?

Trouver la requête permettant d'afficher la liste des expressions de type  forme en -ing + nom de fréquence supérieure à 300, quelle que soit l'étiquette attribuée à la forme en -ing. Séparer les collocations des termes ou expressions lexicalisables.

 

F) Donner la liste des expressions correspondant au patron syntaxique : nom + forme en -ing + nom de fréquence supérieure à 50. Trouver l'expression contenant une erreur d'étiquetage. 

 

G) Donner la liste des expressions correspondant au patron syntaxique : adjectif + forme en -ing + nom de fréquence supérieure à 50. Trouver sur le web la traduction française des termes de cette liste.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Réponse aux questions