ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

Ce que nous avons appris de 5 millions de livres.

Filmed:
2,049,453 views

Avez-vous joué avec Google Lab’sNgram Viewer ? C’est un outil qui est comme une drogue qui vous permet de chercher des mots et des idées dans une base de données de 5 millions de livres sur plusieurs siècles. Erez Lieberman Aiden et Jean-Baptiste Michel nous montrent comment ça marche, et quelques-unes des choses surprenantes que nous pouvons apprendre de 500 milliards de mots.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
ErezErez LiebermanLieberman AidenAiden: EveryoneTout le monde knowssait
0
0
2000
Erez Lieberman Aiden: Tout le monde sait
00:17
that a picturephoto is worthvaut a thousandmille wordsmots.
1
2000
3000
qu’une image vaut un millier de mots.
00:22
But we at HarvardHarvard
2
7000
2000
Mais à Harvard
00:24
were wonderingme demandant if this was really truevrai.
3
9000
3000
nous nous sommes demandé si c’était vrai.
00:27
(LaughterRires)
4
12000
2000
(Rires)
00:29
So we assembledassemblé a teaméquipe of expertsexperts,
5
14000
4000
Nous avons donc rassemblé un groupe d’experts,
00:33
spanningenjambant HarvardHarvard, MITMIT,
6
18000
2000
qui viennent d’Harvard, du MIT,
00:35
The AmericanAméricain HeritagePatrimoine DictionaryDictionnaire, The EncyclopediaMetalship BritannicaBritannica
7
20000
3000
de The American Heritage Dictionary, The Encyclopedia Britannica
00:38
and even our proudfier sponsorssponsors,
8
23000
2000
et même notre heureux sponsor,
00:40
the GoogleGoogle.
9
25000
3000
Google.
00:43
And we cogitatedaccouchaient about this
10
28000
2000
Et nous y avons réfléchi
00:45
for about fourquatre yearsannées.
11
30000
2000
pendant quatre ans.
00:47
And we camevenu to a startlingsurprenante conclusionconclusion.
12
32000
5000
Et nous sommes arrivés à une conclusion surprenante.
00:52
LadiesMesdames and gentlemenmessieurs, a picturephoto is not worthvaut a thousandmille wordsmots.
13
37000
3000
Mesdames et messieurs, une image ne vaut pas un millier de mots.
00:55
In factfait, we founda trouvé some picturesdes photos
14
40000
2000
En fait, nous avons trouvé des images
00:57
that are worthvaut 500 billionmilliard wordsmots.
15
42000
5000
qui valent 500 milliards de mots.
01:02
Jean-BaptisteJean-Baptiste MichelMichel: So how did we get to this conclusionconclusion?
16
47000
2000
Jean-Baptiste Michel : Comment sommes-nous arrivés à cette conclusion ?
01:04
So ErezErez and I were thinkingen pensant about waysfaçons
17
49000
2000
Donc Erez et moi nous étions en train de penser à des moyens
01:06
to get a biggros picturephoto of humanHumain cultureCulture
18
51000
2000
d’avoir une image complète de la culture humaine
01:08
and humanHumain historyhistoire: changechangement over time.
19
53000
3000
et de l‘histoire humaine : les changements dans le temps.
01:11
So manybeaucoup bookslivres actuallyréellement have been writtenécrit over the yearsannées.
20
56000
2000
Beaucoup de livres ont été écrits au fil des ans.
01:13
So we were thinkingen pensant, well the bestmeilleur way to learnapprendre from them
21
58000
2000
Nous avons donc pensé, le meilleur moyen d’apprendre des livres
01:15
is to readlis all of these millionsdes millions of bookslivres.
22
60000
2000
est de lire tous ces millions de livres.
01:17
Now of coursecours, if there's a scaleéchelle for how awesomeimpressionnant that is,
23
62000
3000
Bien sur, s’il existe une échelle pour voir à quel point c’est impressionnant,
01:20
that has to rankrang extremelyextrêmement, extremelyextrêmement highhaute.
24
65000
3000
ça doit être classé très très haut.
01:23
Now the problemproblème is there's an X-axisAxe des abscisses for that,
25
68000
2000
Le problème est qu’il y a un axe X pour cela,
01:25
whichlequel is the practicalpratique axisaxe.
26
70000
2000
qui est l’axe de la praticité.
01:27
This is very, very lowfaible.
27
72000
2000
Ce qui le classe très très bas.
01:29
(ApplauseApplaudissements)
28
74000
3000
(Applaudissements)
01:32
Now people tendtendre to use an alternativealternative approachapproche,
29
77000
3000
Les gens ont tendance à utiliser une approche alternative,
01:35
whichlequel is to take a fewpeu sourcessources and readlis them very carefullysoigneusement.
30
80000
2000
qui est de prendre quelques sources et les lire très attentivement.
01:37
This is extremelyextrêmement practicalpratique, but not so awesomeimpressionnant.
31
82000
2000
Ce qui est extrêmement pratique, mais pas si impressionnant.
01:39
What you really want to do
32
84000
3000
Ce que vous voulez vraiment faire
01:42
is to get to the awesomeimpressionnant yetencore practicalpratique partpartie of this spaceespace.
33
87000
3000
c’est arriver à l’impressionnant et pratique en même temps de ce côté-là.
01:45
So it turnsse tourne out there was a companycompagnie acrossà travers the riverrivière calledappelé GoogleGoogle
34
90000
3000
Il s’avère qu’il y avait une compagnie au-delà du fleuve qui s’appelle Google
01:48
who had startedcommencé a digitizationnumérisation projectprojet a fewpeu yearsannées back
35
93000
2000
qui avait commencé un projet de numérisation quelques années auparavant
01:50
that mightpourrait just enableactiver this approachapproche.
36
95000
2000
qui aurait pu faciliter cette approche.
01:52
They have digitizednumérisés millionsdes millions of bookslivres.
37
97000
2000
Ils ont numérisé des millions de livres.
01:54
So what that meansveux dire is, one could use computationalcalcul methodsméthodes
38
99000
3000
Cela signifie qu’on peut utiliser des méthodes de calcul
01:57
to readlis all of the bookslivres in a clickCliquez of a buttonbouton.
39
102000
2000
pour lire tous les livres avec un clic.
01:59
That's very practicalpratique and extremelyextrêmement awesomeimpressionnant.
40
104000
3000
C’est très pratique et extrêmement impressionnant.
02:03
ELAELA: Let me tell you a little bitbit about where bookslivres come from.
41
108000
2000
ELA : Laissez-moi vous raconter d’où viennent les livres.
02:05
SinceDepuis time immemorialimmémorial, there have been authorsauteurs.
42
110000
3000
Depuis des temps immémoriaux il y a eu des auteurs.
02:08
These authorsauteurs have been strivings'efforcer to writeécrire bookslivres.
43
113000
3000
Ces auteurs se sont efforcé d’écrire des livres.
02:11
And this becamedevenu considerablyconsidérablement easierPlus facile
44
116000
2000
Et c’est devenu considérablement plus facile
02:13
with the developmentdéveloppement of the printingimpression presspresse some centuriesdes siècles agodepuis.
45
118000
2000
avec le développement de l’imprimerie il y a quelques siècles.
02:15
SinceDepuis then, the authorsauteurs have wona gagné
46
120000
3000
Depuis, les auteurs ont eu
02:18
on 129 millionmillion distinctdistinct occasionsoccasions,
47
123000
2000
129 millions différentes occasions,
02:20
publishingédition bookslivres.
48
125000
2000
de publier des livres.
02:22
Now if those bookslivres are not lostperdu to historyhistoire,
49
127000
2000
Si ces livres ne sont pas perdus dans l’histoire,
02:24
then they are somewherequelque part in a librarybibliothèque,
50
129000
2000
alors ils sont quelque part dans une bibliothèque,
02:26
and manybeaucoup of those bookslivres have been gettingobtenir retrievedRécupérée from the librariesbibliothèques
51
131000
3000
et beaucoup de ces livres ont été récupérés des bibliothèques
02:29
and digitizednumérisés by GoogleGoogle,
52
134000
2000
et numérisés par Google,
02:31
whichlequel has scannedscanné 15 millionmillion bookslivres to daterendez-vous amoureux.
53
136000
2000
qui a scanné 15 millions de livres à ce jour.
02:33
Now when GoogleGoogle digitizesnumérise a booklivre, they put it into a really niceagréable formatformat.
54
138000
3000
Quand Google numérise un livre, il le transforme en un très beau format.
02:36
Now we'venous avons got the dataLes données, plusplus we have metadatamétadonnées.
55
141000
2000
Nous avons maintenant les données, et nous avons les métadonnées.
02:38
We have informationinformation about things like where was it publishedpublié,
56
143000
3000
Nous avons les informations sur des choses comme où il a été publié,
02:41
who was the authorauteur, when was it publishedpublié.
57
146000
2000
qui était l’auteur, la date de publication.
02:43
And what we do is go throughpar all of those recordsEnregistrements
58
148000
3000
Ce que nous faisons c’est parcourir tous ces archives
02:46
and excludeexclure les everything that's not the highestle plus élevé qualityqualité dataLes données.
59
151000
4000
et exclure tout ce qui n’est pas de très haute qualité.
02:50
What we're left with
60
155000
2000
Ce qui nous reste
02:52
is a collectioncollection of fivecinq millionmillion bookslivres,
61
157000
3000
c’est une collection de cinq millions de livres,
02:55
500 billionmilliard wordsmots,
62
160000
3000
500 milliards de mots,
02:58
a stringchaîne of characterspersonnages a thousandmille timesfois longerplus long
63
163000
2000
une série de caractères mille fois plus longs
03:00
than the humanHumain genomegénome --
64
165000
3000
que le génome humain --
03:03
a texttexte whichlequel, when writtenécrit out,
65
168000
2000
un texte qui, écrit,
03:05
would stretchétendue from here to the MoonLune and back
66
170000
2000
un aller et un retour d'ici jusqu'à la lune
03:07
10 timesfois over --
67
172000
2000
plus de 10 fois --
03:09
a veritablevéritable shardtesson of our culturalculturel genomegénome.
68
174000
4000
un véritable fragment de notre génome culturel.
03:13
Of coursecours what we did
69
178000
2000
Bien sur ce que nous avons fait
03:15
when facedface à with suchtel outrageousscandaleux hyperbolehyperbole ...
70
180000
3000
en faisant face à cette hyperbole outrageuse…
03:18
(LaughterRires)
71
183000
2000
(Rires)
03:20
was what any self-respectingqui se respecte researchersdes chercheurs
72
185000
3000
est ce que n’importe quel chercheur respectable
03:23
would have doneterminé.
73
188000
3000
aurait fait.
03:26
We tooka pris a pagepage out of XKCDXKCD,
74
191000
2000
Nous avons pris une page de XKCD,
03:28
and we said, "StandStand back.
75
193000
2000
et nous avons dit, « Marche arrière.
03:30
We're going to try sciencescience."
76
195000
2000
Nous allons essayer la science. »
03:32
(LaughterRires)
77
197000
2000
(Rires)
03:34
JMJM: Now of coursecours, we were thinkingen pensant,
78
199000
2000
JM : Bien sur, nous avons pensé,
03:36
well let's just first put the dataLes données out there
79
201000
2000
commençons par sortir les données
03:38
for people to do sciencescience to it.
80
203000
2000
pour que les gens puissent faire de la science.
03:40
Now we're thinkingen pensant, what dataLes données can we releaseLibération?
81
205000
2000
Nous avons réfléchi, quelles données pouvons-nous sortir?
03:42
Well of coursecours, you want to take the bookslivres
82
207000
2000
Bien sûr, on veut prendre les livres
03:44
and releaseLibération the fullplein texttexte of these fivecinq millionmillion bookslivres.
83
209000
2000
et sortir le texte complet de ces cinq millions de livres.
03:46
Now GoogleGoogle, and JonJon OrwantOrwant in particularparticulier,
84
211000
2000
Google, et en particulier Jon Orwant,
03:48
told us a little equationéquation that we should learnapprendre.
85
213000
2000
nous a expliqué une équation qu’il nous faudrait apprendre.
03:50
So you have fivecinq millionmillion, that is, fivecinq millionmillion authorsauteurs
86
215000
3000
Vous avez cinq millions, ce qui représente, cinq millions d’auteurs
03:53
and fivecinq millionmillion plaintiffsdemandeurs is a massivemassif lawsuitprocès.
87
218000
3000
et cinq millions de plaintes judiciaires c’est un procès énorme.
03:56
So, althoughbien que that would be really, really awesomeimpressionnant,
88
221000
2000
Donc, malgré cela puisse être vraiment redoutable,
03:58
again, that's extremelyextrêmement, extremelyextrêmement impracticalpas pratique.
89
223000
3000
encore une fois, c’est extrêmement, extrêmement peu pratique.
04:01
(LaughterRires)
90
226000
2000
(Rires)
04:03
Now again, we kindgentil of cavedcédé in,
91
228000
2000
Encore une fois, nous avons cédé,
04:05
and we did the very practicalpratique approachapproche, whichlequel was a bitbit lessMoins awesomeimpressionnant.
92
230000
3000
et nous avons suivi l’approche pratique, qui était un peu moins redoutable.
04:08
We said, well insteadau lieu of releasingrelâchant the fullplein texttexte,
93
233000
2000
On s’est dit, plutôt que de faire sortir le texte complet,
04:10
we're going to releaseLibération statisticsstatistiques about the bookslivres.
94
235000
2000
nous allons faire sortir des statistiques sur les livres.
04:12
So take for instanceexemple "A gleamlueur of happinessbonheur."
95
237000
2000
Prenez par exemple, « Une étincelle de bonheur ».
04:14
It's fourquatre wordsmots; we call that a four-gramquatre grammes.
96
239000
2000
Quatre mots ; on l’appelle quadri-gramme.
04:16
We're going to tell you how manybeaucoup timesfois a particularparticulier four-gramquatre grammes
97
241000
2000
Nous allons vous dire combien de fois un quadri-gramme en particulier
04:18
appearedest apparu in bookslivres in 1801, 1802, 1803,
98
243000
2000
est apparu dans les livres en 1801, 1802, 1803,
04:20
all the way up to 2008.
99
245000
2000
jusqu’à 2008.
04:22
That givesdonne us a time seriesséries
100
247000
2000
Cela nous donne une série temporelle
04:24
of how frequentlyfréquemment this particularparticulier sentencephrase was used over time.
101
249000
2000
sur la fréquence avec laquelle cette phrase en particulier a été utilisée dans le temps.
04:26
We do that for all the wordsmots and phrasesphrases that appearapparaître in those bookslivres,
102
251000
3000
Nous le faisons pour tous les mots et les phrases qui apparaissent dans ces livres,
04:29
and that givesdonne us a biggros tabletable of two billionmilliard lineslignes
103
254000
3000
ce qui nous donne un tableau de deux milliards de lignes
04:32
that tell us about the way cultureCulture has been changingen changeant.
104
257000
2000
qui nous raconte les changements culturels.
04:34
ELAELA: So those two billionmilliard lineslignes,
105
259000
2000
ELA : Donc ces deux milliards de lignes,
04:36
we call them two billionmilliard n-gramsn-grammes.
106
261000
2000
nous les appelons les deux milliards d’n-grammes.
04:38
What do they tell us?
107
263000
2000
Qu’est ce qu’ils nous disent?
04:40
Well the individualindividuel n-gramsn-grammes measuremesure culturalculturel trendsles tendances.
108
265000
2000
L’n-gramme individuel mesure les tendances culturelles.
04:42
Let me give you an exampleExemple.
109
267000
2000
Prenons un exemple.
04:44
Let's supposesupposer that I am thrivingen plein essor,
110
269000
2000
Supposez que je sois épanoui,
04:46
then tomorrowdemain I want to tell you about how well I did.
111
271000
2000
et demain matin je veux vous raconter comme j’étais bien.
04:48
And so I mightpourrait say, "YesterdayHier, I throveproliféraient."
112
273000
3000
Je pourrai donc dire, « Yesterday, I throve. » [Hier j’étais épanoui]
04:51
AlternativelyVous pouvez également, I could say, "YesterdayHier, I thriveda prospéré."
113
276000
3000
Sinon, je pourrai dire, « Yesterday, I thrived.»
04:54
Well whichlequel one should I use?
114
279000
3000
Laquelle devrais-je utiliser ?
04:57
How to know?
115
282000
2000
Comment savoir ?
04:59
As of about sixsix monthsmois agodepuis,
116
284000
2000
Pour ce qui est d’il y a six mois,
05:01
the stateEtat of the artart in this fieldchamp
117
286000
2000
le dernier cri dans le domaine
05:03
is that you would, for instanceexemple,
118
288000
2000
est que, par exemple,
05:05
go up to the followingSuivant psychologistpsychologue with fabulousfabuleux haircheveux,
119
290000
2000
vous iriez chez le premier psychologue avec une coiffure fabuleuse,
05:07
and you'dtu aurais say,
120
292000
2000
et vous diriez,
05:09
"SteveSteve, you're an expertexpert on the irregularirrégulier verbsverbes.
121
294000
3000
« Steve, tu es un expert en verbes irréguliers.
05:12
What should I do?"
122
297000
2000
qu’est ce que je devrais faire ? »
05:14
And he'dil aurait tell you, "Well mostles plus people say thriveda prospéré,
123
299000
2000
Et il dirait, « La plupart des gens disent ‘thrived’,
05:16
but some people say throveproliféraient."
124
301000
3000
mais certains disent ‘throve’»
05:19
And you alsoaussi knewa connu, more or lessMoins,
125
304000
2000
Et vous sauriez également que,
05:21
that if you were to go back in time 200 yearsannées
126
306000
3000
si vous deviez revenir en arrière de 200 ans
05:24
and askdemander the followingSuivant statesmanhomme d’État with equallyégalement fabulousfabuleux haircheveux,
127
309000
3000
et demander la même chose à un homme d’état avec la même coiffure,
05:27
(LaughterRires)
128
312000
3000
(Rires)
05:30
"TomTom, what should I say?"
129
315000
2000
« Tom, qu’est que je devrais dire ? »
05:32
He'dIl serait say, "Well, in my day, mostles plus people throveproliféraient,
130
317000
2000
Il dirait, « De nos jours, beaucoup disent ‘throve’,
05:34
but some thriveda prospéré."
131
319000
3000
certains disent ‘thrived’»
05:37
So now what I'm just going to showmontrer you is rawbrut dataLes données.
132
322000
2000
Maintenant ce que je vais vous montrer c’est des données bruts.
05:39
Two rowslignes from this tabletable of two billionmilliard entriesentrées.
133
324000
4000
Deux lignes de cette tableau de deux milliards d’entrées.
05:43
What you're seeingvoyant is yearan by yearan frequencyla fréquence
134
328000
2000
Ce que vous voyez c’est la fréquence année par année
05:45
of "thriveda prospéré" and "throveproliféraient" over time.
135
330000
3000
de « thrived » et « throve » dans le temps.
05:49
Now this is just two
136
334000
2000
Voici deux
05:51
out of two billionmilliard rowslignes.
137
336000
3000
des deux milliards de lignes.
05:54
So the entiretout dataLes données setensemble
138
339000
2000
L’entière série de données
05:56
is a billionmilliard timesfois more awesomeimpressionnant than this slidefaire glisser.
139
341000
3000
est un milliard de fois plus impressionnante que cette diapo.
05:59
(LaughterRires)
140
344000
2000
(Rires)
06:01
(ApplauseApplaudissements)
141
346000
4000
(Applaudissements)
06:05
JMJM: Now there are manybeaucoup other picturesdes photos that are worthvaut 500 billionmilliard wordsmots.
142
350000
2000
JM : Il y a plein d’autres photos qui valent 500 milliards de mots.
06:07
For instanceexemple, this one.
143
352000
2000
Une par exemple.
06:09
If you just take influenzagrippe,
144
354000
2000
Si vous prenez la grippe,
06:11
you will see peakspics at the time where you knewa connu
145
356000
2000
vous voyez des pics dans les périodes pendant lesquelles vous saviez
06:13
biggros flugrippe epidemicsépidémies were killingmeurtre people around the globeglobe.
146
358000
3000
que les grandes grippes épidémiques tuaient les gens partout dans le monde.
06:16
ELAELA: If you were not yetencore convincedconvaincu,
147
361000
3000
ELA : si vous n’êtes pas encore convaincu,
06:19
seamer levelsles niveaux are risingen hausse,
148
364000
2000
le niveau des océans monte,
06:21
so is atmosphericatmosphérique COCO2 and globalglobal temperaturetempérature.
149
366000
3000
ainsi que le CO2 et la température globale.
06:24
JMJM: You mightpourrait alsoaussi want to have a look at this particularparticulier n-gramn-gram,
150
369000
3000
JM : Vous pourriez également jeter un coup d’œil à cet n-gramme,
06:27
and that's to tell NietzscheNietzsche that God is not deadmort,
151
372000
3000
et c’est pour dire à Nietzche que Dieu n’est pas mort,
06:30
althoughbien que you mightpourrait agreese mettre d'accord that he mightpourrait need a better publicistpubliciste.
152
375000
3000
bien que vous pourriez convenir qu’il ait besoin d’un meilleur attaché de presse.
06:33
(LaughterRires)
153
378000
2000
(Rires)
06:35
ELAELA: You can get at some prettyjoli abstractabstrait conceptsconcepts with this sortTrier of thing.
154
380000
3000
ELA : Vous pouvez obtenir des concepts assez abstrait avec ce genre de chose.
06:38
For instanceexemple, let me tell you the historyhistoire
155
383000
2000
Par exemple, je vais vous raconter l’histoire
06:40
of the yearan 1950.
156
385000
2000
de l’année 1950.
06:42
PrettyAssez much for the vastvaste majoritymajorité of historyhistoire,
157
387000
2000
Pendant la majeure partie de l’histoire,
06:44
no one gavea donné a damnZut about 1950.
158
389000
2000
tout le monde s’est fiché de 1950.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
En 1700, en 1800, en 1900,
06:48
no one caredsoigné.
160
393000
3000
personne ne s’en intéresse.
06:52
ThroughPar le biais the 30s and 40s,
161
397000
2000
Pendant les années 30 et 40,
06:54
no one caredsoigné.
162
399000
2000
personne ne s’y intéresse.
06:56
SuddenlyTout d’un coup, in the mid-milieu-40s,
163
401000
2000
Tout à coup, au milieu des années 40,
06:58
there startedcommencé to be a buzzBuzz.
164
403000
2000
une agitation débute.
07:00
People realizedréalisé that 1950 was going to happense produire,
165
405000
2000
Les gens se rendent compte que 1950 approche,
07:02
and it could be biggros.
166
407000
2000
et ça peut être énorme.
07:04
(LaughterRires)
167
409000
3000
(Rires)
07:07
But nothing got people interestedintéressé in 1950
168
412000
3000
Mais rien n’a intéressé personne à 1950
07:10
like the yearan 1950.
169
415000
3000
jusqu’à 1950.
07:13
(LaughterRires)
170
418000
3000
(Rires)
07:16
People were walkingen marchant around obsessedobsédé.
171
421000
2000
Les gens se promenaient de touts les côtés obsédés.
07:18
They couldn'tne pouvait pas stop talkingparlant
172
423000
2000
Ils n’arrêtaient pas de parler
07:20
about all the things they did in 1950,
173
425000
3000
de tout ce qu’ils avaient fait en 1950,
07:23
all the things they were planningPlanification to do in 1950,
174
428000
3000
tout ce qu’ils prévoyaient de faire en 1950,
07:26
all the dreamsrêves of what they wanted to accomplishaccomplir in 1950.
175
431000
5000
tous les rêves qu’ils voulaient accomplir en 1950.
07:31
In factfait, 1950 was so fascinatingfascinant
176
436000
2000
En fait, 1950 était si fascinant
07:33
that for yearsannées thereafterpar la suite,
177
438000
2000
que dans les années qui ont suivi,
07:35
people just keptconservé talkingparlant about all the amazingincroyable things that happenedarrivé,
178
440000
3000
les gens n’arrêtaient pas de parler de toutes les choses extraordinaires qui étaient arrivées
07:38
in '51, '52, '53.
179
443000
2000
en 51, 52, 53.
07:40
FinallyEnfin in 1954,
180
445000
2000
Finalement en 1954,
07:42
someoneQuelqu'un wokeréveillé up and realizedréalisé
181
447000
2000
quelqu’un s’est levé et s’est rendu compte
07:44
that 1950 had gottenobtenu somewhatquelque peu passpasseré.
182
449000
4000
que 1950 en quelque sorte était passé.
07:48
(LaughterRires)
183
453000
2000
(Rires)
07:50
And just like that, the bubblebulle burstéclater.
184
455000
2000
Et tout d’un coup, la bulle a éclaté.
07:52
(LaughterRires)
185
457000
2000
(Rires)
07:54
And the storyrécit of 1950
186
459000
2000
Et l’histoire de 1950
07:56
is the storyrécit of everychaque yearan that we have on recordrecord,
187
461000
2000
est l’histoire de chaque année pour laquelle nous avons un passé,
07:58
with a little twistTwist, because now we'venous avons got these niceagréable chartsgraphiques.
188
463000
3000
avec un petit zest, puisque nous avons maintenant ces beaux diagrammes.
08:01
And because we have these niceagréable chartsgraphiques, we can measuremesure things.
189
466000
3000
Et vu que nous avons ces beaux diagrammes, nous pouvons mesurer les choses.
08:04
We can say, "Well how fastvite does the bubblebulle burstéclater?"
190
469000
2000
Nous sommes en mesure de dire, « A quelle vitesse la bulle a éclaté »
08:06
And it turnsse tourne out that we can measuremesure that very preciselyprécisément.
191
471000
3000
Et il s’avère que nous pouvons la mesurer avec précision.
08:09
EquationsÉquations were deriveddérivé, graphsgraphiques were producedproduit,
192
474000
3000
Nous en avons dérivé des équations et des représentations graphiques,
08:12
and the netnet resultrésultat
193
477000
2000
et le résultat final
08:14
is that we find that the bubblebulle burstssalves fasterPlus vite and fasterPlus vite
194
479000
3000
est que nous découvrons que la bulle a éclaté de plus en plus vite
08:17
with eachchaque passingqui passe yearan.
195
482000
2000
à chaque année qui passait.
08:19
We are losingperdant interestintérêt in the pastpassé more rapidlyrapidement.
196
484000
5000
Nous perdons intérêt pour le passé rapidement.
08:24
JMJM: Now a little piecepièce of careercarrière adviceConseil.
197
489000
2000
JM : Maintenant un tout petit conseil pour la carrière.
08:26
So for those of you who seekchercher to be famouscélèbre,
198
491000
2000
Pour ceux parmi vous qui cherchent à devenir célèbres,
08:28
we can learnapprendre from the 25 mostles plus famouscélèbre politicalpolitique figureschiffres,
199
493000
2000
nous pouvons apprendre des 35 personnages politiques les plus célèbres,
08:30
authorsauteurs, actorsacteurs and so on.
200
495000
2000
écrivains, acteurs et ainsi de suite.
08:32
So if you want to becomedevenir famouscélèbre earlyde bonne heure on, you should be an actoracteur,
201
497000
3000
Si vous voulez devenir célèbre très tôt, vous devriez vous faire acteur,
08:35
because then famecélébrité startsdéparts risingen hausse by the endfin of your 20s --
202
500000
2000
parce que la célébrité commence à monter vers la fin de la vingtaine --
08:37
you're still youngJeune, it's really great.
203
502000
2000
vous êtes encore jeunes, c’est fabuleux.
08:39
Now if you can wait a little bitbit, you should be an authorauteur,
204
504000
2000
Si vous pouvez attendre un peu, vous devriez vous faire écrivain,
08:41
because then you riseaugmenter to very great heightshauteurs,
205
506000
2000
parce qu’ensuite vous montez très haut,
08:43
like MarkMark TwainTWAIN, for instanceexemple: extremelyextrêmement famouscélèbre.
206
508000
2000
comme Mark Twain, par exemple : très célèbre.
08:45
But if you want to reachatteindre the very topHaut,
207
510000
2000
Mais si vous voulez atteindre le sommet,
08:47
you should delayretard gratificationgratification
208
512000
2000
vous devriez retarder la gratification
08:49
and, of coursecours, becomedevenir a politicianhomme politique.
209
514000
2000
et, bien sûr, devenir un personnage politique.
08:51
So here you will becomedevenir famouscélèbre by the endfin of your 50s,
210
516000
2000
Et là vous devenez célèbre à la fin de la cinquantaine,
08:53
and becomedevenir very, very famouscélèbre afterwardaprès.
211
518000
2000
et vous devenez très, très célèbre plus tard.
08:55
So scientistsscientifiques alsoaussi tendtendre to get famouscélèbre when they're much olderplus âgée.
212
520000
3000
Les scientifiques ont tendance à devenir célèbres quand ils sont plus âgés.
08:58
Like for instanceexemple, biologistsbiologistes and physicsla physique
213
523000
2000
Comme par exemple, les biologistes et les physicistes
09:00
tendtendre to be almostpresque as famouscélèbre as actorsacteurs.
214
525000
2000
ont tendance à être célèbre autant que les acteurs.
09:02
One mistakeerreur you should not do is becomedevenir a mathematicianmathématicien.
215
527000
3000
Une erreur à ne pas faire est de devenir mathématicien.
09:05
(LaughterRires)
216
530000
2000
(Rires)
09:07
If you do that,
217
532000
2000
En faisant ça,
09:09
you mightpourrait think, "Oh great. I'm going to do my bestmeilleur work when I'm in my 20s."
218
534000
3000
vous pourriez penser, « Super. Je vais faire mon meilleur travail à vingt ans. »
09:12
But guessdeviner what, nobodypersonne will really carese soucier.
219
537000
2000
Mais devinez, personne ne s’y intéresse vraiment.
09:14
(LaughterRires)
220
539000
3000
(Rires)
09:17
ELAELA: There are more soberingqui donne à réfléchir notesRemarques
221
542000
2000
ELA : Il y a encore des notes qui donnent à penser
09:19
amongparmi the n-gramsn-grammes.
222
544000
2000
parmi les n-grammes.
09:21
For instanceexemple, here'svoici the trajectorytrajectoire of MarcMarc ChagallChagall,
223
546000
2000
Par exemple, voici la trajectoire de Marc Chagall,
09:23
an artistartiste bornnée in 1887.
224
548000
2000
un artiste né en 1887.
09:25
And this looksregards like the normalnormal trajectorytrajectoire of a famouscélèbre personla personne.
225
550000
3000
Et ça ressemble à une normale trajectoire d’une personne célèbre.
09:28
He getsobtient more and more and more famouscélèbre,
226
553000
4000
Il devient de plus en plus célèbre,
09:32
exceptsauf if you look in GermanAllemand.
227
557000
2000
sauf si vous regardez l’allemand.
09:34
If you look in GermanAllemand, you see something completelycomplètement bizarrebizarre,
228
559000
2000
Si vous regardez l’allemand, vous voyez quelque chose de bizarre,
09:36
something you prettyjoli much never see,
229
561000
2000
quelque chose que normalement vous ne voyez pas,
09:38
whichlequel is he becomesdevient extremelyextrêmement famouscélèbre
230
563000
2000
qui est qu’il devient extrêmement célèbre
09:40
and then all of a suddensoudain plummetspesons,
231
565000
2000
et tout à coup il s’effondre,
09:42
going throughpar a nadirnadir betweenentre 1933 and 1945,
232
567000
3000
en passant par un nadir entre 1933 et 1945,
09:45
before reboundingrebondissement afterwardaprès.
233
570000
3000
avant de rebondir tout de suite après.
09:48
And of coursecours, what we're seeingvoyant
234
573000
2000
Et bien sur, ce que nous voyons
09:50
is the factfait MarcMarc ChagallChagall was a JewishJuif artistartiste
235
575000
3000
est que Marc Chagall était un artiste juif
09:53
in NaziNazi GermanyAllemagne.
236
578000
2000
dans l’Allemagne des Nazis.
09:55
Now these signalssignaux
237
580000
2000
Ces signaux
09:57
are actuallyréellement so strongfort
238
582000
2000
sont tellement forts
09:59
that we don't need to know that someoneQuelqu'un was censoredcensuré.
239
584000
3000
que nous n’avons pas besoin de savoir que quelqu’un a été censuré.
10:02
We can actuallyréellement figurefigure it out
240
587000
2000
On peut s’en apercevoir
10:04
usingen utilisant really basicde base signalsignal processingEn traitement.
241
589000
2000
en utilisant un traitement des signaux élémentaires.
10:06
Here'sVoici a simplesimple way to do it.
242
591000
2000
Voici une manière simple de le faire.
10:08
Well, a reasonableraisonnable expectationattente
243
593000
2000
Une prévision raisonnable
10:10
is that somebody'squelqu'un est famecélébrité in a givendonné periodpériode of time
244
595000
2000
est que la célébrité de quelqu’un sur une période donnée de temps
10:12
should be roughlygrossièrement the averagemoyenne of theirleur famecélébrité before
245
597000
2000
devrait être à peu près la moyenne de sa célébrité avant
10:14
and theirleur famecélébrité after.
246
599000
2000
et de sa célébrité après.
10:16
So that's sortTrier of what we expectattendre.
247
601000
2000
Voici à peu près ce à quoi l’on s’attend.
10:18
And we comparecomparer that to the famecélébrité that we observeobserver.
248
603000
3000
Et nous comparons ceci avec la célébrité que nous observons.
10:21
And we just dividediviser one by the other
249
606000
2000
Et nous divisions l’un par l’autre
10:23
to produceproduire something we call a suppressionsuppression indexindice.
250
608000
2000
pour obtenir une chose que nous appelons un index de suppression.
10:25
If the suppressionsuppression indexindice is very, very, very smallpetit,
251
610000
3000
Si l’index de suppression est très, très, très petit,
10:28
then you very well mightpourrait be beingétant suppressedsupprimée.
252
613000
2000
alors vous avez très probablement été supprimé.
10:30
If it's very largegrand, maybe you're benefitingbénéficiant from propagandapropagande.
253
615000
3000
S’il est très grand, vous avez peut-être bénéficié de la propagande.
10:34
JMJM: Now you can actuallyréellement look at
254
619000
2000
JM : En fait vous pouvez regarder
10:36
the distributionDistribution of suppressionsuppression indexesindex over wholeentier populationspopulations.
255
621000
3000
la distribution des index de suppression sur toutes les populations.
10:39
So for instanceexemple, here --
256
624000
2000
Donc par exemple, ici --
10:41
this suppressionsuppression indexindice is for 5,000 people
257
626000
2000
cet index de suppression est de 5000 personnes
10:43
pickedchoisi in EnglishAnglais bookslivres where there's no knownconnu suppressionsuppression --
258
628000
2000
prises dans des livres anglais où il n’y a pas de suppression --
10:45
it would be like this, basicallyen gros tightlyfermement centeredcentré on one.
259
630000
2000
ce serait comme ça, en fait très centré sur une.
10:47
What you expectattendre is basicallyen gros what you observeobserver.
260
632000
2000
Ce que vous vous attendez c’est ce que vous voyez.
10:49
This is distributionDistribution as seenvu in GermanyAllemagne --
261
634000
2000
Voila la distribution vue en Allemagne --
10:51
very differentdifférent, it's shifteddécalé to the left.
262
636000
2000
très différente, déplacée sur la gauche.
10:53
People talkeda parlé about it twicedeux fois lessMoins as it should have been.
263
638000
3000
Les gens en parlaient deux fois moins que ce qu’ils auraient dû.
10:56
But much more importantlyimportant, the distributionDistribution is much widerplus large.
264
641000
2000
Mais encore plus important, la distribution est plus large.
10:58
There are manybeaucoup people who endfin up on the farloin left on this distributionDistribution
265
643000
3000
Il y a plus de personnes qui tombent à l’extrême gauche de cette distribution
11:01
who are talkeda parlé about 10 timesfois fewermoins than they should have been.
266
646000
3000
de qui on a parlé 10 fois moins de ce qu’on aurait dû.
11:04
But then alsoaussi manybeaucoup people on the farloin right
267
649000
2000
Mai également beaucoup de personnes à l’extrême droite
11:06
who seemsembler to benefitavantage from propagandapropagande.
268
651000
2000
qui paraissent bénéficier de la propagande.
11:08
This picturephoto is the hallmarkHallmark of censorshipcensure in the booklivre recordrecord.
269
653000
3000
Cette image est la marque de la censure dans les archives des livres.
11:11
ELAELA: So culturomicsculturomics
270
656000
2000
ELA : Donc « culturomique »
11:13
is what we call this methodméthode.
271
658000
2000
c’est le mot que nous employons pour définir cette méthode.
11:15
It's kindgentil of like genomicsla génomique.
272
660000
2000
C’est un peu comme la génomique.
11:17
ExceptSauf genomicsla génomique is a lenslentille on biologyla biologie
273
662000
2000
Sauf que la génomique est une lentille sur la biologie
11:19
throughpar the windowfenêtre of the sequenceséquence of basesbases in the humanHumain genomegénome.
274
664000
3000
à travers la fenêtre de la séquence des bases dans le génome humain.
11:22
CulturomicsCulturomics is similarsimilaire.
275
667000
2000
La culturomique est similaire.
11:24
It's the applicationapplication of massive-scalegrande-échelle dataLes données collectioncollection analysisune analyse
276
669000
3000
C’est l’application sur grande échelle de l’analyse du recueil de données
11:27
to the studyétude of humanHumain cultureCulture.
277
672000
2000
à l’étude de la culture humaine.
11:29
Here, insteadau lieu of throughpar the lenslentille of a genomegénome,
278
674000
2000
Ici, plutôt qu’à travers la lentille d’un génome,
11:31
throughpar the lenslentille of digitizednumérisés piecesdes morceaux of the historicalhistorique recordrecord.
279
676000
3000
à travers la lentille d’un morceau des archives numérisées.
11:34
The great thing about culturomicsculturomics
280
679000
2000
Ce qui est génial à propos de la culturomique
11:36
is that everyonetoutes les personnes can do it.
281
681000
2000
c’est que tout le monde peut le faire.
11:38
Why can everyonetoutes les personnes do it?
282
683000
2000
Pourquoi tout le monde peut le faire ?
11:40
EveryoneTout le monde can do it because threeTrois guys,
283
685000
2000
Tout le monde peut le faire parce que trois gars,
11:42
JonJon OrwantOrwant, MattMatt GrayGray and Will BrockmanBrockman over at GoogleGoogle,
284
687000
3000
Jon Orwant, Matt Gray et Will Brockman de chez Google,
11:45
saw the prototypeprototype of the NgramNgram ViewerSpectateur,
285
690000
2000
ont vu le prototype du Ngram Viewer,
11:47
and they said, "This is so funamusement.
286
692000
2000
et ils ont dit, « C’est marrant.
11:49
We have to make this availabledisponible for people."
287
694000
3000
Nous devons le rendre disponible à tout le monde. »
11:52
So in two weekssemaines flatappartement -- the two weekssemaines before our paperpapier camevenu out --
288
697000
2000
En deux semaines – les deux semaines qui ont précédé la sortie de notre article --
11:54
they codedcodé up a versionversion of the NgramNgram ViewerSpectateur for the generalgénéral publicpublic.
289
699000
3000
ils ont codé une version du Ngram Viewer tout public.
11:57
And so you too can typetype in any wordmot or phrasephrase that you're interestedintéressé in
290
702000
3000
Donc vous aussi vous pouvez taper n’importe quel mot ou phrase qui vous intéresse
12:00
and see its n-gramn-gram immediatelyimmédiatement --
291
705000
2000
et voir son n-grammes immédiatement --
12:02
alsoaussi browseParcourir examplesexemples of all the variousdivers bookslivres
292
707000
2000
vous pouvez aussi feuilleter tous les livres
12:04
in whichlequel your n-gramn-gram appearsapparaît.
293
709000
2000
dans lesquelles votre n-gramme apparaît.
12:06
JMJM: Now this was used over a millionmillion timesfois on the first day,
294
711000
2000
JM : Il a été utilisé plus d’un million de fois le premier jour,
12:08
and this is really the bestmeilleur of all the queriesrequêtes.
295
713000
2000
et c’est vraiment la meilleure de toutes les interrogations.
12:10
So people want to be theirleur bestmeilleur, put theirleur bestmeilleur footpied forwardvers l'avant.
296
715000
3000
Les gens veulent faire de leurs mieux [best], ils mettent leur meilleur [best] pied avant.
12:13
But it turnsse tourne out in the 18thth centurysiècle, people didn't really carese soucier about that at all.
297
718000
3000
Mais il s’avère qu’au 18° siècle, les gens ne s’y intéressaient pas du tout.
12:16
They didn't want to be theirleur bestmeilleur, they wanted to be theirleur beftbeft.
298
721000
3000
Ils ne voulaient pas faire de leur « best », ils voulaient faire de leur « beft ».
12:19
So what happenedarrivé is, of coursecours, this is just a mistakeerreur.
299
724000
3000
Ce qui est arrivé, bien sur, c’est que c’est une erreur.
12:22
It's not that stroves’est efforcé for mediocritymédiocrité,
300
727000
2000
Ils n’étaient pas à la recherche de la médiocrité.
12:24
it's just that the S used to be writtenécrit differentlydifféremment, kindgentil of like an F.
301
729000
3000
c’est que le S s’écrivait différemment, un peu comme un F.
12:27
Now of coursecours, GoogleGoogle didn't pickchoisir this up at the time,
302
732000
3000
Bien sur, Google ne s’en est pas aperçu,
12:30
so we reportedsignalé this in the sciencescience articlearticle that we wrotea écrit.
303
735000
3000
nous avons donc rapporté ceci dans l’article scientifique que nous avons écrit.
12:33
But it turnsse tourne out this is just a reminderrappel
304
738000
2000
Mais il s’avère que c’est juste un rappel
12:35
that, althoughbien que this is a lot of funamusement,
305
740000
2000
sur le fait que malgré tout ceci soit amusant,
12:37
when you interpretinterpréter these graphsgraphiques, you have to be very carefulprudent,
306
742000
2000
en interprétant ces graphes, il faut faire très attention,
12:39
and you have to adoptadopter the basebase standardsnormes in the sciencesles sciences.
307
744000
3000
et il faut adopter les standards de base de la science.
12:42
ELAELA: People have been usingen utilisant this for all kindssortes of funamusement purposesfins.
308
747000
3000
ELA : Les gens l’ont utilisé pour toutes sortes de raisons amusantes.
12:45
(LaughterRires)
309
750000
7000
(Rires)
12:52
ActuallyEn fait, we're not going to have to talk,
310
757000
2000
En fait, nous n'allons pas parler,
12:54
we're just going to showmontrer you all the slidesglisse and remainrester silentsilencieux.
311
759000
3000
nous allons juste vous montrer toutes les diapos et nous taire.
12:57
This personla personne was interestedintéressé in the historyhistoire of frustrationfrustration.
312
762000
3000
Cette personne s'est intéressée à l’histoire de la frustration.
13:00
There's variousdivers typesles types of frustrationfrustration.
313
765000
3000
Il y a différents types de frustration.
13:03
If you stubstub your toeorteil, that's a one A "arghArgh."
314
768000
3000
Si vous vous cognez l’orteil, en voilà une avec 1 A « argh ».
13:06
If the planetplanète EarthTerre is annihilatedanéantis by the VogonsVogons
315
771000
2000
Si la terre est anéantie par les Vogons
13:08
to make roomchambre for an interstellarinterstellaire bypassBypass,
316
773000
2000
pour faire de la place à un voyageur intergalactique,
13:10
that's an eighthuit A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
c’est avec 8 A « aaaaaaaargh ».
13:12
This personla personne studiesétudes all the "arghsarghs,"
318
777000
2000
Cette personne étudie tous les « argh »,
13:14
from one throughpar eighthuit A'sA..
319
779000
2000
de 1 à 8 A.
13:16
And it turnsse tourne out
320
781000
2000
Et il s’avère
13:18
that the less-frequentmoins fréquents "arghsarghs"
321
783000
2000
que les « argh » moins fréquents
13:20
are, of coursecours, the onesceux that correspondcorrespondent to things that are more frustratingfrustrant --
322
785000
3000
sont, bien sûr, ceux qui correspondent aux choses les plus frustrantes --
13:23
exceptsauf, oddlybizarrement, in the earlyde bonne heure 80s.
323
788000
3000
sauf, curieusement, au début des années 80.
13:26
We think that mightpourrait have something to do with ReaganReagan.
324
791000
2000
Nous pensons que ça pourrait avoir à faire avec Reagan,
13:28
(LaughterRires)
325
793000
2000
(Rires)
13:30
JMJM: There are manybeaucoup usagesusages of this dataLes données,
326
795000
3000
JM : Il y a plusieurs utilisations de ces données,
13:33
but the bottombas lineligne is that the historicalhistorique recordrecord is beingétant digitizednumérisés.
327
798000
3000
mais la vérité est que nous sommes en train de numériser les archives historiques.
13:36
GoogleGoogle has startedcommencé to digitizenumériser 15 millionmillion bookslivres.
328
801000
2000
Google a commencé à numériser 15 millions de livres.
13:38
That's 12 percentpour cent of all the bookslivres that have ever been publishedpublié.
329
803000
2000
C’est 12 pour cent de tous les livres qui aient jamais été publiés.
13:40
It's a sizableimportante chunktronçon of humanHumain cultureCulture.
330
805000
3000
C’est un gros morceau de la culture humaine.
13:43
There's much more in cultureCulture: there's manuscriptsdes manuscrits, there newspapersjournaux,
331
808000
3000
Il y a beaucoup plus dans la culture : il y a les manuscrits, il y a les journaux,
13:46
there's things that are not texttexte, like artart and paintingspeintures.
332
811000
2000
il y a tout ce qui n’est pas texte, comme l’art et les tableaux.
13:48
These all happense produire to be on our computersdes ordinateurs,
333
813000
2000
Tout ceci est dans nos ordinateurs,
13:50
on computersdes ordinateurs acrossà travers the worldmonde.
334
815000
2000
dans les ordinateurs du monde entier.
13:52
And when that happensarrive, that will transformtransformer the way we have
335
817000
3000
Et dans le temps, ça transformera la manière dont
13:55
to understandcomprendre our pastpassé, our presentprésent and humanHumain cultureCulture.
336
820000
2000
nous comprenons notre passé, notre culture humaine du présent.
13:57
Thank you very much.
337
822000
2000
Merci beaucoup.
13:59
(ApplauseApplaudissements)
338
824000
3000
(Applaudissements)
Translated by Anna Cristiana Minoli
Reviewed by Shadia Ramsahye

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com