Use of the Ngram Viewer interface (Google Books corpus)

https://books.google.com/ngrams/

 

 

Advanced functions (https://books.google.com/ngrams/info)

 

Choose a language, a time range and a smoothing value for the graphs.

 

The graphs show evolution of usage for synonyms (up to four words, use commas to separate ngrams) :

1960-2019

mongolisme, trisomie 21, syndrome de Down

 

English (1900-2000)

run of the mine, run of the mill

that's swell, that's cool,

Blacks, Negroes, African Americans

 

Comparing synonymous expressions shows how they occasionally give birth to new collocations through interference :

French (1900-2000)

loin de là, tant s'en faut, loin s'en faut

relever le défi, relever le gant, accepter le défi (1800-1900, 1900-2000)

 

Variation may also concern spelling :

pas prêt d'être, pas près d'être, pas prêts de, pas prêt de, pas prête de (1880-2000)

 

Use of French equivalents for English borrowings can be observed:

1990-2019

par courriel, par email

It is however crucial to take into account all lexical and spelling variations:

par courriel, par email, par mail, par e-mail, par mél

 

Use of abbreviated forms

phone, telephone

bus, omnibus

 

The wildcard (*) may be used to replace a whole word, but not part of a word (not a truncation operator):

took * efforts

experienced * difficulties

to * a meeting

 

While the wildcard (*) cannot be used to replace part of a word, the inflection operator (_INF) may be used to retrieve inflected forms of verbs :

open_INF an account

FR : ouvrir_INF un compte

 

Homonyms may be displayed separately by using POS (part-of-speech) tags :

daily_ADJ, daily_ADV, daily_NOUN

 

List of tags:

_NOUN_

noun

_VERB_

verb

_ADJ_

adjective

_ADV_

adverb

_PRON_

pronoun

_DET_

determiner or article

_ADP_

an adposition: either a preposition or a postposition

_NUM_

numeral

_CONJ_

conjunction

_PRT_

particle

 

 

Dating of the first conversion (zero derivation) cases

guesstimate, guesstimate_NOUN, guesstimate_VERB

Excluding ngrams with part-of-speech tags from search links. à ADD to guesstimate

https://www.merriam-webster.com/dictionary/guesstimate

https://www.merriam-webster.com/dictionary/daily

 

The wildcard (*) may be used in combination with another word designated by a POS tag:

past_ADJ *_NOUN

 

 

Collocations :

Search for noun objects for the verb raise :

raise_VERB _DET_ *, raise_VERB *_NOUN

raise_VERB _DET_ *_NOUN, raise_VERB *_NOUN

Adjectives that modify the noun reviews :

received * reviews, got * reviews, opened to * reviews

Other verbs that may have rewiews as an object:

* rave reviews

https://www.merriam-webster.com/dictionary/review

https://www.etymonline.com/search?q=review

 

Right-click on any graph to expand / contract wildcard ngrams.

 

But the wildcard (*) cannot used in combination with the inflection operator (_INF)

raise_INF *_NOUN

 

In order to retrieve all the homonyms for a given word with their POS, _* may be used right after the word (no intervening spaces) :

demand_*, supply_*

 

In order to retrieve all the homonyms for a given word with a specific POS, the inflection operator (_INF) may be combined with a POS tag:

offer_VERB_INF

 

The corpus may be queried for words that start sentences with _START_:

_START_ *_ADV

 

The character combination => may be used for studying collocations :

drink=>*_NOUN

 

Corpora with various languages may also be compared by adding the colon (:)and the English three-letter abbreviation for a given language followed by the underscore character (_) and 2019:

1950-2019

internet:fre_2019,internet:eng_2019,internet:spa_2019,internet:ita_2019

internet:fre_2019,internet,internet:spa_2019,internet:ita_2019,web:fre_2019,web,web:spa_2019,web:ita_2019

 

Implantation of English calques in other languages may thus be measured and compared:

plafond de verre:fre_2019,glass ceiling:eng_2019,techo de cristal:spa_2019,soffitto di vetro:ita_2019

 

Comparison of GB/US usage

to the cinema:eng_gb_2019, to the movies: eng_gb_2019, to the cinema:eng_us_2019, to the movies: eng_us_2019

 

In the new NGV interface, it is no longer possible to disable the Case-Insensitive operator. Consequently, homonyms starting with lower/upper case characters must be entered separately:

2000-2019

Twitter:fre_2019,Twitter,twitter_INF

 

Terminological uses

persecution *_NOUN, *_NOUN of persecution

persecutory *_NOUN

 

Translation revision

Texte original :With the planned planets exploration (Moon, Mars), the development of efficient countermeasures is top priority.”

Texte relu : “With the planned exploration of celestial bodies such as the Moon and Mars, the development of efficient countermeasures is a top priority.”

 

is a top priority, is top priority

 

is top priority, are top priority, was top priority, were top priority

 

top priority *_NOUN

 

is top *_NOUN

 

 

 

Dating first uses of borrowings from English in French:

Break TILF

BREAK1, subst. masc.
Vx. Voiture découverte, à quatre roues :

Toute la famille, accompagnée d'un domestique et d'une nourrice, occupait un break superbe, attelé d'une paire de grands chevaux blancs.
ZOLALa Joie de vivre, 1884, p. 1064.

 AUTOMOB. Voiture carrossée de façon à pouvoir servir de fourgonnette.

 

BREAK2, subst. masc.
A.
 MUS. ,,Court passage improvisé par un instrumentiste en dehors de la ligne principale d'un morceau`` (TÉNOT 1967) :

1. Sur un break de batterie, introduction du piano; ...
M. BUTORPassage de Milan, 1954, p. 104.

B. SP. (boxe, catch). Ordre de l'arbitre enjoignant aux adversaires de cesser le combat :

2. Le cinquième round [du match de boxe] est interrompu par des « Break » continuels de l'arbitre.
L'Œuvre, 24 févr. 1941.

 

*_VERB un break (1980-2019)

faire un break, faire le break (ou encore : faire * break)

 

 

Exercices d’application

 

1) Emprunts à l’anglais dans le domaine de l’informatique

a) Trouver la première occurrence de laptop en français, puis en anglais. Comparer les fréquences d’utilisation de bogue et de bug ; de CD-ROM et de cédérom ; de digital et de numérique.

b) Afficher simultanément les graphiques correspondant à l’usage des mots suivants en français et en anglais entre 1950 et 2019 :

ordinateur / computer

processeur / processor

traitement de texte / word processor

digital / digital

 

2) Repérage des collocations en lexicographie

Voici une partie de l’article consacré à l’adverbe savamment dans le TLFi :

A. − 1. D'une manière savante; avec science, avec érudition. Synon. (fam.) comme un livre, doctement. Parler, discourir, disserter savamment; parler savamment sur une question; expliquer qqc. savamment. […]

B. − D'une manière habile, avec adresse et compétence; en appliquant les règles. Synonadroitement, habilement, ingénieusement. Qqc. de savamment calculé, combiné, composé, concerté, dosé, noué, ordonné. […]

 

a) Dresser la liste des principaux collocats verbaux de l’adverbe savamment qui ne sont pas mentionnés dans l’entrée du TLFi.

b) Afficher les résultats correspondant à quelques trigrammes de type <NOM savamment PARTICIPE PASSÉ>, et repérer la première occurrence de l’un d’entre eux.

c) Comparer les résultats obtenus avec ceux que donne le corpus français de Leipzig (https://corpora.uni-leipzig.de/fr?corpusId=fra_mixed_2012) et vérifier la présence dans le corpus Google Books de certains trigrammes formés à partir des voisins de droite et de gauche de savamment.