Use of the Ngram Viewer interface (Google Books
corpus)
https://books.google.com/ngrams/
Advanced functions (https://books.google.com/ngrams/info)
Choose a language,
a time range and a smoothing value for the graphs.
The graphs show evolution of usage for
synonyms (up to four words, use commas to separate ngrams) :
1960-2019
mongolisme, trisomie
21, syndrome de Down
English (1900-2000)
run of
the mine, run of the mill
that's
swell, that's cool,
Blacks, Negroes, African Americans
Comparing synonymous expressions
shows how they occasionally
give birth to new
collocations through interference :
French (1900-2000)
loin de là,
tant s'en faut, loin s'en faut
relever le défi,
relever le gant, accepter le défi (1800-1900, 1900-2000)
Variation may also concern
spelling :
pas prêt
d'être, pas près d'être, pas prêts de, pas prêt de, pas prête de (1880-2000)
Use of
French equivalents for English borrowings
can be observed:
1990-2019
par courriel,
par email
It is however crucial to take into account
all lexical and spelling variations:
par courriel,
par email, par mail, par e-mail, par mél
Use of abbreviated forms
phone, telephone
bus, omnibus
The wildcard (*) may be used to replace a whole word, but not part of a word (not a truncation operator):
took * efforts
experienced * difficulties
to * a
meeting
While the wildcard (*) cannot be used
to replace part of a word, the inflection
operator (_INF) may be used to retrieve
inflected forms of verbs :
open_INF an account
FR : ouvrir_INF
un compte
Homonyms may be
displayed separately by using POS (part-of-speech) tags :
daily_ADJ, daily_ADV, daily_NOUN
List of tags:
_NOUN_ |
noun |
_VERB_ |
verb |
_ADJ_ |
adjective |
_ADV_ |
adverb |
_PRON_ |
pronoun |
_DET_ |
determiner or article |
_ADP_ |
an adposition: either a preposition or a postposition |
_NUM_ |
numeral |
_CONJ_ |
conjunction |
_PRT_ |
particle |
Dating of the first conversion (zero
derivation) cases
guesstimate, guesstimate_NOUN, guesstimate_VERB
Excluding ngrams with
part-of-speech tags from search
links. à ADD to guesstimate
https://www.merriam-webster.com/dictionary/guesstimate
https://www.merriam-webster.com/dictionary/daily
The wildcard (*) may be used in combination
with another word designated by a POS tag:
past_ADJ *_NOUN
Collocations :
Search for noun objects for the verb raise :
raise_VERB _DET_ *, raise_VERB *_NOUN
raise_VERB _DET_ *_NOUN, raise_VERB
*_NOUN
Adjectives that modify the noun reviews :
received * reviews, got * reviews, opened to * reviews
Other verbs that may have rewiews as an object:
* rave reviews
https://www.merriam-webster.com/dictionary/review
https://www.etymonline.com/search?q=review
Right-click
on any graph to expand / contract wildcard ngrams.
But the wildcard (*) cannot used in combination with the inflection operator (_INF)
raise_INF *_NOUN
In order to retrieve all the homonyms for a given word with their
POS, _* may be used right after the word (no intervening spaces) :
demand_*, supply_*
In order to retrieve all the homonyms for a given word with a specific
POS, the inflection operator
(_INF) may be combined with a POS tag:
offer_VERB_INF
The corpus may be queried
for words that start sentences with _START_:
_START_ *_ADV
The character combination => may be used
for studying collocations :
drink=>*_NOUN
Corpora with various
languages may also be compared
by adding the colon (:)and the English three-letter abbreviation for a given language followed by the underscore character (_) and 2019:
1950-2019
internet:fre_2019,internet:eng_2019,internet:spa_2019,internet:ita_2019
internet:fre_2019,internet,internet:spa_2019,internet:ita_2019,web:fre_2019,web,web:spa_2019,web:ita_2019
Implantation of English calques in other languages may
thus be measured and compared:
plafond de verre:fre_2019,glass ceiling:eng_2019,techo de
cristal:spa_2019,soffitto di vetro:ita_2019
Comparison of GB/US usage
to
the cinema:eng_gb_2019, to the movies: eng_gb_2019, to the cinema:eng_us_2019,
to the movies: eng_us_2019
In the new
NGV interface, it is no
longer possible to disable the Case-Insensitive operator. Consequently, homonyms starting with lower/upper case characters must be entered separately:
2000-2019
Twitter:fre_2019,Twitter,twitter_INF
Terminological uses
persecution *_NOUN, *_NOUN of persecution
persecutory *_NOUN
Translation
revision
Texte original : “With the planned planets
exploration (Moon, Mars), the development of efficient countermeasures is
top priority.”
Texte relu
: “With the planned exploration of celestial bodies such as the Moon and
Mars, the development of efficient countermeasures is a top priority.”
is a top priority, is top
priority
is top priority, are top priority,
was top priority, were top priority
top priority *_NOUN
is top *_NOUN
Dating first uses of borrowings from English in French:
Break TILF
BREAK1, subst. masc.
Vx. Voiture découverte, à quatre roues :
Toute la famille, accompagnée d'un domestique et d'une nourrice, occupait
un break superbe, attelé d'une paire de grands chevaux blancs.
ZOLA, La Joie de vivre, 1884,
p. 1064.
AUTOMOB. Voiture carrossée de
façon à pouvoir servir de fourgonnette.
BREAK2, subst. masc.
A. MUS. ,,Court passage improvisé par un instrumentiste en dehors de la ligne
principale d'un morceau`` (TÉNOT 1967) :
1. Sur un break de batterie, introduction du piano; ...
M. BUTOR, Passage de Milan, 1954,
p. 104.
B. SP. (boxe,
catch). Ordre de l'arbitre enjoignant aux
adversaires de cesser le combat :
2. Le cinquième round [du match de boxe] est interrompu par des « Break »
continuels de l'arbitre.
L'Œuvre, 24 févr. 1941.
*_VERB un break (1980-2019)
faire un break, faire le break (ou
encore : faire * break)
Exercices
d’application
1) Emprunts
à l’anglais dans le domaine de l’informatique
a) Trouver la première occurrence
de laptop en français, puis en
anglais. Comparer les fréquences d’utilisation de bogue et de bug ; de
CD-ROM et de cédérom ; de digital
et de numérique.
b) Afficher simultanément les
graphiques correspondant à l’usage des mots suivants en français et en anglais
entre 1950 et 2019 :
ordinateur / computer
processeur /
processor
traitement de texte /
word processor
digital / digital
2) Repérage des collocations en lexicographie
Voici une partie de l’article consacré à l’adverbe savamment dans le TLFi :
A. − 1. D'une manière
savante; avec science, avec érudition. Synon.
(fam.) comme un livre, doctement. Parler, discourir, disserter savamment; parler
savamment sur une question; expliquer qqc. savamment. […]
B. − D'une
manière habile, avec adresse et compétence; en appliquant les règles. Synon. adroitement,
habilement, ingénieusement. Qqc. de savamment
calculé, combiné, composé, concerté, dosé, noué, ordonné. […]
a) Dresser la liste des principaux
collocats verbaux de l’adverbe savamment
qui ne sont pas mentionnés dans l’entrée du TLFi.
b) Afficher les résultats
correspondant à quelques trigrammes de type <NOM savamment PARTICIPE PASSÉ>, et repérer la première occurrence de
l’un d’entre eux.
c) Comparer les résultats obtenus
avec ceux que donne le corpus français de Leipzig (https://corpora.uni-leipzig.de/fr?corpusId=fra_mixed_2012)
et vérifier la présence dans le corpus Google
Books de certains trigrammes formés à partir des voisins de droite et de
gauche de savamment.