Utilisation du Google Ngram Viewer

https://books.google.com/ngrams/

 

 

Fonctions avancées (https://books.google.com/ngrams/info)

 

On peut faire varier les dates et les langues, lisser les courbes (smoothing).

 

Les graphiques font apparaitre l’évolution de l’usage dans le cas des synonymes :

1960-2008

mongolisme,trisomie 21,syndrome de Down

 

English (1900-2000)

run of the mine, run of the mill

that's swell,that's cool,

Blacks,Negroes,African Americans

 

La comparaison d’expressions concurrentes met en évidence les phénomènes de télescopage (greffes collocationnelles)

French (1900-2000)

loin de ,tant s'en faut,loin s'en faut

relever le défi, relever le gant, accepter le défi (1800-1900 puis 1900-2000)

pas prêt d'être,pas près d'être,pas prêts de,pas prêt de,pas prête de (1880-2000)

 

Mesure de l’adoption des termes recommandés par la DGLFLF en remplacement des emprunts à l’anglais

1990-2008

par courriel, par email

Il est important de tenir compte de l’ensemble des variations lexicales et orthographiques :

par courriel, par email, par mail, par e-mail, par mél

 

L’astérisque peut être utilisé pour remplacer un mot entier

1800-2008

poste de *

 

1960-2008

meute de *

 

L’astérisque peut être inclus dans l’expression choisie :

patients * de maladies

 

L’astérisque ne peut pas remplacer une terminaison quelconque, mais il est possible de récupérer l’ensemble des formes fléchies d’un mot avec _INF (lemmatisation) :

ouvrir_INF un compte

 

Pour certaines formes figurant souvent en début de phrase, on peut cocher « case-insensitive »

Pourtant,pourtant,Néanmoins,néanmoins,Cependant,cependant

 

On peut séparer les affichages des homonymes en fonction des parties du discours :

court_ADJ,court_VERB

 

L’astérisque peut être associé à une interrogation sur les parties du discours de plusieurs lexèmes (spécifiés ou non) :

court_VERB _DET_ *

Mais on ne peut pas combiner l’astérisque et la lemmatisation pour l’étude des collocations.

courir_INF _DET_ * (pas de résultats)

courir _DET_ *,court _DET_ *,courent _DET_ *

 

L’astérisque peut être ajouté à la partie du discours si l’on souhaite obtenir les courbes correspondant aux formes distinctes :

faire _DET_ *_NOUN

feront _DET_ *_NOUN

porte_VERB _DET_ *_NOUN

 

Pour obtenir l’ensemble des parties du discours correspondant à une forme donnée, on fait suivre le mot de _* :

offre_*,demande_*

 

On peut demander l’affichage de toutes les formes d’un homonyme en fonction de sa partie du discours :

porte_VERB_INF

 

On peut interroger le corpus sur les mots figurant en début ou fin de phrase :

_START_ *_ADV

 

On peut utiliser => comme opérateur de dépendance syntaxique pour l’étude des collocations :

*_NOUN=>fort

*_NOUN=>forte

 

boire=>*_NOUN

 

On peut comparer entre elles les fréquences d’emploi dans les corpus de diverses langues :

1990-2008

internet:fre_2012,internet:eng_2012 (case-insensitive)

 

2000-2008

Twitter:fre_2012,Twitter:eng_2012,Facebook:fre_2012,Facebook:eng_2012

Décocher case-insensitive

 

1950-2008

ordinateurs:fre_2012,computers:eng_2012

 

Localisation des premières occurrences des emprunts :

Break TILF

BREAK1, subst. masc.
Vx. Voiture découverte, à quatre roues :

Toute la famille, accompagnée d'un domestique et d'une nourrice, occupait un break superbe, attelé d'une paire de grands chevaux blancs.
ZOLALa Joie de vivre, 1884, p. 1064.

 AUTOMOB. Voiture carrossée de façon à pouvoir servir de fourgonnette.

 

BREAK2, subst. masc.
A.
 MUS. ,,Court passage improvisé par un instrumentiste en dehors de la ligne principale d'un morceau`` (TÉNOT 1967) :

1. Sur un break de batterie, introduction du piano; ...
M. BUTORPassage de Milan, 1954, p. 104.

B. SP. (boxe, catch). Ordre de l'arbitre enjoignant aux adversaires de cesser le combat :

2. Le cinquième round [du match de boxe] est interrompu par des « Break » continuels de l'arbitre.
L'Œuvre, 24 févr. 1941.

 

*_VERB un break (1980-2008)

faire un break, faire le break (ou encore : faire * break)

 

Exercices d’application

1) Emprunts à l’anglais dans le domaine de l’informatique

a) Trouver la première occurrence de laptop en français, puis en anglais. Comparer les fréquences d’utilisation de bogue et de bug ; de CD-ROM et de cédérom ; de digital et de numérique.

b) Afficher simultanément les graphiques correspondant à l’usage des mots suivants en français et en anglais entre 1950 et 2008 :

ordinateur / computer

processeur / processor

traitement de texte / word processor

digital/digital

 

2) Repérage des collocations en lexicographie

Voici une partie de l’article consacré à l’adverbe savamment dans le TLFi :

A. − 1. D'une manière savante; avec science, avec érudition. Synon. (fam.) comme un livre, doctement.Parler, discourir, disserter savamment; parler savamment sur une question; expliquer qqc. savamment. […]

B. − D'une manière habile, avec adresse et compétence; en appliquant les règles. Synonadroitement, habilement, ingénieusement.Qqc. de savamment calculé, combiné, composé, concerté, dosé, noué, ordonné. […]

 

a) Dresser la liste des principaux collocats verbaux de l’adverbe savamment qui ne sont pas mentionnés dans l’entrée du TLFi.

b) Afficher les résultats correspondant à quelques trigrammes de type <NOM savamment PARTICIPE PASSÉ>, et repérer la première occurrence de l’un d’entre eux.

c) Comparer les résultats obtenus avec ceux que donne le corpus français de Leipzig (http://wortschatz.uni-leipzig.de/ws_fra/) et vérifier la présence dans le corpus Google Books de certains trigrammes formés à partir des voisins de droite et de gauche de savamment.