ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

Wat we leerden uit 5 miljoen boeken

Filmed:
2,049,453 views

Heb je wel eens gespeeld met Ngram Viewer van Google Labs? Het is een verslavende tool die je in staat stelt woorden en ideeën te zoeken in een databank van 5 miljoen boeken uit diverse eeuwen. Erez Lieberman Aiden en Jean-Baptiste Michel laten zien hoe het werkt, en tonen enkele verrassende dingen die we kunnen leren van 500 miljard woorden.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
ErezErez LiebermanLieberman AidenAiden: EveryoneIedereen knowsweet
0
0
2000
Erez Lieberman Aiden: Iedereen weet
00:17
that a pictureafbeelding is worthwaard a thousandduizend wordstekst.
1
2000
3000
dat één beeld meer zegt dan 1000 woorden.
00:22
But we at HarvardHarvard
2
7000
2000
Maar wij in Harvard
00:24
were wonderingafvragen if this was really truewaar.
3
9000
3000
vroegen ons af of dit wel echt klopte.
00:27
(LaughterGelach)
4
12000
2000
(Gelach)
00:29
So we assembledgeassembleerd a teamteam of expertsexperts,
5
14000
4000
Dus verzamelden we een team van experts,
00:33
spanningoverspannen HarvardHarvard, MITMIT,
6
18000
2000
van Harvard, MIT,
00:35
The AmericanAmerikaanse HeritageErfgoed DictionaryWoordenboek, The EncyclopediaEncyclopedie BritannicaBritannica
7
20000
3000
The American Heritage Dictionary, The Encyclopedia Britannica
00:38
and even our proudtrots sponsorssponsors,
8
23000
2000
en zelfs onze trotse sponsors,
00:40
the GoogleGoogle.
9
25000
3000
The Google.
00:43
And we cogitatedcogitated about this
10
28000
2000
We overpeinsden dit
00:45
for about fourvier yearsjaar.
11
30000
2000
gedurende vier jaar.
00:47
And we camekwam to a startlingverrassende conclusionconclusie.
12
32000
5000
We kwamen tot een verrassende conclusie.
00:52
LadiesDames and gentlemenmijne heren, a pictureafbeelding is not worthwaard a thousandduizend wordstekst.
13
37000
3000
Dames en heren, een beeld is niet alleen meer waard dan 1000 woorden.
00:55
In factfeit, we foundgevonden some picturesafbeeldingen
14
40000
2000
Wij hebben beelden gevonden
00:57
that are worthwaard 500 billionmiljard wordstekst.
15
42000
5000
die 500 miljard woorden waard zijn.
01:02
Jean-BaptisteJean-Baptiste MichelMichel: So how did we get to this conclusionconclusie?
16
47000
2000
Jean-Baptiste Michel: Hoe kwamen we tot deze conclusie?
01:04
So ErezErez and I were thinkinghet denken about waysmanieren
17
49000
2000
Erez en ik dachten na hoe we een overzicht
01:06
to get a biggroot pictureafbeelding of humanmenselijk culturecultuur
18
51000
2000
konden krijgen van onze cultuur
01:08
and humanmenselijk historygeschiedenis: changeverandering over time.
19
53000
3000
en geschiedenis: de verandering door de tijd.
01:11
So manyveel booksboeken actuallywerkelijk have been writtengeschreven over the yearsjaar.
20
56000
2000
Er zijn vele boeken geschreven over de jaren.
01:13
So we were thinkinghet denken, well the bestbeste way to learnleren from them
21
58000
2000
Dus dachten we: de beste manier om ervan te leren
01:15
is to readlezen all of these millionsmiljoenen of booksboeken.
22
60000
2000
is die miljoenen boeken allemaal te lezen.
01:17
Now of courseCursus, if there's a scaleschaal for how awesomegeweldig that is,
23
62000
3000
Op de schaal van hoe vet dat is,
01:20
that has to rankrang extremelyuiterst, extremelyuiterst highhoog.
24
65000
3000
zou dit extreem hoog scoren.
01:23
Now the problemprobleem is there's an X-axisX-as for that,
25
68000
2000
Het probleem is de X-as hiervan,
01:25
whichwelke is the practicalpraktisch axisas.
26
70000
2000
hetgeen de praktische as is.
01:27
This is very, very lowlaag.
27
72000
2000
Die is bijzonder laag.
01:29
(ApplauseApplaus)
28
74000
3000
(Applaus)
01:32
Now people tendde neiging hebben to use an alternativealternatief approachnadering,
29
77000
3000
Mensen kiezen meestal voor een alternatieve aanpak,
01:35
whichwelke is to take a fewweinig sourcesbronnen and readlezen them very carefullyvoorzichtig.
30
80000
2000
namelijk: enkele bronnen zeer grondig lezen.
01:37
This is extremelyuiterst practicalpraktisch, but not so awesomegeweldig.
31
82000
2000
Dat is zeer praktisch, maar niet zo vet.
01:39
What you really want to do
32
84000
3000
Wat je zou willen, is in het
01:42
is to get to the awesomegeweldig yetnog practicalpraktisch partdeel of this spaceruimte.
33
87000
3000
vette en toch praktische deel van dit vlak belanden.
01:45
So it turnsbochten out there was a companybedrijf acrossaan de overkant the riverrivier- calledriep GoogleGoogle
34
90000
3000
Nu zat er vlakbij een bedrijf genaamd Google
01:48
who had startedbegonnen a digitizationdigitalisering projectproject a fewweinig yearsjaar back
35
93000
2000
dat een digitalisatieproject was begonnen
01:50
that mightmacht just enablein staat stellen this approachnadering.
36
95000
2000
dat dit wellicht mogelijk kon maken.
01:52
They have digitizedgedigitaliseerd millionsmiljoenen of booksboeken.
37
97000
2000
Ze hebben miljoenen boeken gedigitaliseerd.
01:54
So what that meansmiddelen is, one could use computationalcomputational methodsmethoden
38
99000
3000
Dit betekent dat je rekenkundige methoden kunt gebruiken
01:57
to readlezen all of the booksboeken in a clickKlik of a buttonknop.
39
102000
2000
om al deze boeken te lezen met één muisklik.
01:59
That's very practicalpraktisch and extremelyuiterst awesomegeweldig.
40
104000
3000
Dat is zeer praktisch en extreem vet.
02:03
ELAELA: Let me tell you a little bitbeetje about where booksboeken come from.
41
108000
2000
ELA: Ik zal even vertellen waar boeken vandaan komen.
02:05
SinceSinds time immemorialeeuwenoud, there have been authorsauteurs.
42
110000
3000
Sinds mensenheugenis zijn er schrijvers geweest.
02:08
These authorsauteurs have been strivingstreven to writeschrijven booksboeken.
43
113000
3000
Deze schrijvers streefden ernaar boeken te schrijven.
02:11
And this becamewerd considerablyaanzienlijk easiergemakkelijker
44
116000
2000
Dit werd aanzienlijk vergemakkelijkt
02:13
with the developmentontwikkeling of the printinghet drukken presspers some centurieseeuwen agogeleden.
45
118000
2000
door de komst van drukpers, enkele eeuwen geleden.
02:15
SinceSinds then, the authorsauteurs have wonwon
46
120000
3000
Sindsdien is het deze schrijvers
02:18
on 129 millionmiljoen distinctonderscheiden occasionsgelegenheden,
47
123000
2000
129 miljoen maal gelukt
02:20
publishingpublishing booksboeken.
48
125000
2000
een boek te publiceren.
02:22
Now if those booksboeken are not lostde weg kwijt to historygeschiedenis,
49
127000
2000
Als deze boeken niet verloren zijn gegaan,
02:24
then they are somewhereergens in a librarybibliotheek,
50
129000
2000
staan ze ergens in een bibliotheek,
02:26
and manyveel of those booksboeken have been gettingkrijgen retrievedOntvangen from the librariesbibliotheken
51
131000
3000
en veel van die boeken zijn uit bibliotheken gehaald
02:29
and digitizedgedigitaliseerd by GoogleGoogle,
52
134000
2000
en gedigitaliseerd door Google,
02:31
whichwelke has scannedgescand 15 millionmiljoen booksboeken to datedatum.
53
136000
2000
dat tot op heden 15 miljoen boeken heeft gescand.
02:33
Now when GoogleGoogle digitizesDigitaliseert a bookboek, they put it into a really niceleuk formatformaat.
54
138000
3000
Google digitaliseert boeken tot een heel mooi formaat.
02:36
Now we'vewij hebben got the datagegevens, plusplus we have metadatametagegevens.
55
141000
2000
We hebben de data, plus meta-data.
02:38
We have informationinformatie about things like where was it publishedgepubliceerd,
56
143000
3000
We hebben informatie over waar het gepubliceerd was,
02:41
who was the authorauteur, when was it publishedgepubliceerd.
57
146000
2000
wie de auteur was, wanneer het uitkwam.
02:43
And what we do is go throughdoor all of those recordsarchief
58
148000
3000
Wij gaan door al die documenten heen
02:46
and excludeuitsluiten everything that's not the highesthoogst qualitykwaliteit datagegevens.
59
151000
4000
en sluiten alles uit wat niet van de hoogste kwaliteit is.
02:50
What we're left with
60
155000
2000
Wat we dan overhouden,
02:52
is a collectionverzameling of fivevijf millionmiljoen booksboeken,
61
157000
3000
is een collectie van 5 miljoen boeken,
02:55
500 billionmiljard wordstekst,
62
160000
3000
500 miljard woorden,
02:58
a stringdraad of characterstekens a thousandduizend timestijden longerlanger
63
163000
2000
een rij letters duizend maal langer
03:00
than the humanmenselijk genomegenoom --
64
165000
3000
dan het menselijk genoom --
03:03
a texttekst whichwelke, when writtengeschreven out,
65
168000
2000
een tekst die, uitgeschreven,
03:05
would stretchrekken from here to the MoonMaan and back
66
170000
2000
10 maal tot de maan
03:07
10 timestijden over --
67
172000
2000
en terug zou reiken --
03:09
a veritableware shardScherf of our culturalcultureel genomegenoom.
68
174000
4000
een waarachtige scherf van ons culturele genoom.
03:13
Of courseCursus what we did
69
178000
2000
Wat we uiteraard deden
03:15
when facedgeconfronteerd with suchzodanig outrageousschandelijk hyperbolehyperbool ...
70
180000
3000
ten overstaan van zulk buitensporig hyperbool ...
03:18
(LaughterGelach)
71
183000
2000
(Gelach)
03:20
was what any self-respectingzichzelf respecterende researchersonderzoekers
72
185000
3000
was wat ieder zichzelf respecterend onderzoeker
03:23
would have donegedaan.
73
188000
3000
gedaan zou hebben.
03:26
We tooknam a pagepagina out of XKCDXKCD,
74
191000
2000
We namen een pagina uit XKDC,
03:28
and we said, "StandStand back.
75
193000
2000
en zeiden: "Pas op!
03:30
We're going to try sciencewetenschap."
76
195000
2000
We gaan een poging tot wetenschap doen."
03:32
(LaughterGelach)
77
197000
2000
(Gelach)
03:34
JMJM: Now of courseCursus, we were thinkinghet denken,
78
199000
2000
JM: Natuurlijk dachten we:
03:36
well let's just first put the datagegevens out there
79
201000
2000
laten we eerst de data produceren
03:38
for people to do sciencewetenschap to it.
80
203000
2000
waarop mensen wetenschap kunnen loslaten.
03:40
Now we're thinkinghet denken, what datagegevens can we releasevrijlating?
81
205000
2000
We dachten: welke data kunnen we produceren?
03:42
Well of courseCursus, you want to take the booksboeken
82
207000
2000
Natuurlijk wil je de volledige tekst
03:44
and releasevrijlating the fullvol texttekst of these fivevijf millionmiljoen booksboeken.
83
209000
2000
van deze 5 miljoen boeken publiceren.
03:46
Now GoogleGoogle, and JonJon OrwantOrwant in particularbijzonder,
84
211000
2000
Google, en Jon Orwant in het bijzonder,
03:48
told us a little equationvergelijking that we should learnleren.
85
213000
2000
hielden ons het volgende sommetje voor.
03:50
So you have fivevijf millionmiljoen, that is, fivevijf millionmiljoen authorsauteurs
86
215000
3000
Je hebt 5 miljoen boeken; dat is 5 miljoen auteurs...
03:53
and fivevijf millionmiljoen plaintiffseisers is a massivemassief lawsuitrechtszaak.
87
218000
3000
...en 5 miljoen eisers is een gigantische rechtszaak.
03:56
So, althoughhoewel that would be really, really awesomegeweldig,
88
221000
2000
Ook al zou dat uitermate vet zijn,
03:58
again, that's extremelyuiterst, extremelyuiterst impracticalonuitvoerbaar.
89
223000
3000
het is, nogmaals, extreem onpraktisch.
04:01
(LaughterGelach)
90
226000
2000
(Gelach)
04:03
Now again, we kindsoort of cavedingestort in,
91
228000
2000
Dus we gingen overstag,
04:05
and we did the very practicalpraktisch approachnadering, whichwelke was a bitbeetje lessminder awesomegeweldig.
92
230000
3000
en we kozen de praktische aanpak, die iets minder vet was.
04:08
We said, well insteadin plaats daarvan of releasingvrijgeven the fullvol texttekst,
93
233000
2000
We zeiden, in plaats van de hele tekst uitgeven,
04:10
we're going to releasevrijlating statisticsstatistieken about the booksboeken.
94
235000
2000
gaan we statistieken uitgeven over de boeken.
04:12
So take for instanceaanleg "A gleamglans of happinessgeluk."
95
237000
2000
Neem bijvoorbeeld "A gleam of happiness".
04:14
It's fourvier wordstekst; we call that a four-gramvier-gram.
96
239000
2000
Vier woorden; we noemen dat een four-gram.
04:16
We're going to tell you how manyveel timestijden a particularbijzonder four-gramvier-gram
97
241000
2000
We gaan laten zien hoe vaak een specifiek four-gram
04:18
appearedverschenen in booksboeken in 1801, 1802, 1803,
98
243000
2000
verscheen in boeken in 1801, 1802, 1803,
04:20
all the way up to 2008.
99
245000
2000
tot en met 2008.
04:22
That givesgeeft us a time seriesserie
100
247000
2000
Dat levert een tijdverloop op
04:24
of how frequentlyvaak this particularbijzonder sentencezin was used over time.
101
249000
2000
van hoe frequent deze specifieke zin gebruikt werd.
04:26
We do that for all the wordstekst and phraseszinnen that appearverschijnen in those booksboeken,
102
251000
3000
We doen dat met alle woorden en zinnen die in die boeken voorkomen,
04:29
and that givesgeeft us a biggroot tabletafel of two billionmiljard lineslijnen
103
254000
3000
wat een lijst van twee miljard zinnen oplevert
04:32
that tell us about the way culturecultuur has been changingveranderen.
104
257000
2000
die laat zien hoe onze cultuur veranderd is.
04:34
ELAELA: So those two billionmiljard lineslijnen,
105
259000
2000
ELA: Die 2 miljard zinnen
04:36
we call them two billionmiljard n-gramsn-gram.
106
261000
2000
noemen we 2 miljard n-grams.
04:38
What do they tell us?
107
263000
2000
Wat vertellen ze ons?
04:40
Well the individualindividu n-gramsn-gram measuremaatregel culturalcultureel trendstrends.
108
265000
2000
De individuele n-grams meten culturele trends.
04:42
Let me give you an examplevoorbeeld.
109
267000
2000
Ik zal een voorbeeld geven.
04:44
Let's supposeveronderstellen that I am thrivingbloeiende,
110
269000
2000
Stel dat ik geluk ervaar,
04:46
then tomorrowmorgen I want to tell you about how well I did.
111
271000
2000
en morgen vertel ik je daarover.
04:48
And so I mightmacht say, "YesterdayGisteren, I throvethrove."
112
273000
3000
Dan kan ik zeggen: "Gisteren ervoer ik geluk."
04:51
AlternativelyU kunt ook, I could say, "YesterdayGisteren, I thrivedbloeide."
113
276000
3000
Of: "Gisteren ervaarde ik geluk."
04:54
Well whichwelke one should I use?
114
279000
3000
Wat moet ik gebruiken?
04:57
How to know?
115
282000
2000
Hoe kom je daar achter?
04:59
As of about sixzes monthsmaanden agogeleden,
116
284000
2000
Sinds een maand of zes,
05:01
the statestaat of the artkunst in this fieldveld-
117
286000
2000
is de meest vooruitstrevende manier
05:03
is that you would, for instanceaanleg,
118
288000
2000
om hier achter te komen, bijvoorbeeld,
05:05
go up to the followingvolgend psychologistpsycholoog with fabulousfabelachtig hairhaar-,
119
290000
2000
het benaderen van de volgende psycholoog met geweldig haar,
05:07
and you'dje zou say,
120
292000
2000
en je zegt:
05:09
"SteveSteve, you're an expertdeskundige on the irregularonregelmatig verbswerkwoorden.
121
294000
3000
"Steve, jij weet alles van onregelmatige werkwoorden.
05:12
What should I do?"
122
297000
2000
Wat moet ik doen?"
05:14
And he'dhij zou tell you, "Well mostmeest people say thrivedbloeide,
123
299000
2000
Dan zegt hij: "Nou, de meeste mensen zeggen 'ervaarde',
05:16
but some people say throvethrove."
124
301000
3000
maar sommige mensen zeggen 'ervaarde'."
05:19
And you alsoook knewwist, more or lessminder,
125
304000
2000
Je weet ook, min of meer,
05:21
that if you were to go back in time 200 yearsjaar
126
306000
3000
dat als je 200 jaar teruggaat in de tijd
05:24
and askvragen the followingvolgend statesmanstaatsman with equallyeven fabulousfabelachtig hairhaar-,
127
309000
3000
en deze staatsman met even geweldig haar, vraagt:
05:27
(LaughterGelach)
128
312000
3000
(Gelach)
05:30
"TomTom, what should I say?"
129
315000
2000
"Tom, wat moet ik zeggen?'"
05:32
He'dHij zou say, "Well, in my day, mostmeest people throvethrove,
130
317000
2000
Dan zou hij zeggen: "Nou, in mijn tijd ervoeren
05:34
but some thrivedbloeide."
131
319000
3000
de meeste mensen, maar sommigen ervaarden."
05:37
So now what I'm just going to showtonen you is rawrauw datagegevens.
132
322000
2000
Nu ga ik wat rauwe data laten zien.
05:39
Two rowsrijen from this tabletafel of two billionmiljard entriesentries.
133
324000
4000
Twee kolommen uit de lijst met 2 miljard gegevens.
05:43
What you're seeingziend is yearjaar by yearjaar frequencyfrequentie
134
328000
2000
Wat je ziet, is de jaarlijkse frequentie
05:45
of "thrivedbloeide" and "throvethrove" over time.
135
330000
3000
van 'ervoeren' en 'ervaarden' doorheen de tijd.
05:49
Now this is just two
136
334000
2000
Dit zijn slechts twee
05:51
out of two billionmiljard rowsrijen.
137
336000
3000
van de twee miljard kolommen.
05:54
So the entiregeheel datagegevens setreeks
138
339000
2000
Dus de hele dataset
05:56
is a billionmiljard timestijden more awesomegeweldig than this slideglijbaan.
139
341000
3000
is een miljard maal vetter dan deze dia.
05:59
(LaughterGelach)
140
344000
2000
(Gelach)
06:01
(ApplauseApplaus)
141
346000
4000
(Applaus)
06:05
JMJM: Now there are manyveel other picturesafbeeldingen that are worthwaard 500 billionmiljard wordstekst.
142
350000
2000
JM: Er zijn veel andere beelden die 500 miljard woorden waard zijn.
06:07
For instanceaanleg, this one.
143
352000
2000
Bijvoorbeeld dit beeld.
06:09
If you just take influenzainfluenza,
144
354000
2000
Als je enkel griep neemt,
06:11
you will see peakspieken at the time where you knewwist
145
356000
2000
zie je pieken op tijdstippen waarvan je weet dat
06:13
biggroot flugriep epidemicsepidemieën were killingdoden people around the globewereldbol.
146
358000
3000
grote griepepidemieën wereldwijd levens kostten.
06:16
ELAELA: If you were not yetnog convincedovertuigd,
147
361000
3000
ELA: Mocht je nog niet overtuigd zijn:
06:19
seazee levelslevels are risingstijgende lijn,
148
364000
2000
zeewaterniveaus stijgen,
06:21
so is atmosphericatmosferisch COCO2 and globalglobaal temperaturetemperatuur-.
149
366000
3000
evenals CO2 in de lucht, en de globale temperatuur.
06:24
JMJM: You mightmacht alsoook want to have a look at this particularbijzonder n-gramn-gram,
150
369000
3000
JM: Kijk ook even naar dit n-gram,
06:27
and that's to tell NietzscheNietzsche that God is not deaddood,
151
372000
3000
dat Nietzsche vertelt dat God niet dood is,
06:30
althoughhoewel you mightmacht agreemee eens that he mightmacht need a better publicistpublicist.
152
375000
3000
hoewel je kunt zeggen dat hij betere pr nodig heeft.
06:33
(LaughterGelach)
153
378000
2000
(Gelach)
06:35
ELAELA: You can get at some prettymooi abstractabstract conceptsconcepten with this sortsoort of thing.
154
380000
3000
ELA: Je komt bij behoorlijk abstracte concepten met dit soort dingen.
06:38
For instanceaanleg, let me tell you the historygeschiedenis
155
383000
2000
Ik zal je bijvoorbeeld de geschiedenis laten zien
06:40
of the yearjaar 1950.
156
385000
2000
van het jaar 1950.
06:42
PrettyVrij much for the vastgroot majoritymeerderheid of historygeschiedenis,
157
387000
2000
Tijdens het grootste deel van de geschiedenis,
06:44
no one gavegaf a damnvloek about 1950.
158
389000
2000
kon 1950 niemand iets schelen.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
In 1700, 1800, en 1900
06:48
no one caredverzorgd.
160
393000
3000
interesseerde het niemand.
06:52
ThroughDoor middel van the 30s and 40s,
161
397000
2000
In de jaren '30 en '40,
06:54
no one caredverzorgd.
162
399000
2000
interesseerde het niemand.
06:56
SuddenlyPlotseling, in the mid-mid-40s,
163
401000
2000
Opeens, midden jaren '40,
06:58
there startedbegonnen to be a buzzBuzz.
164
403000
2000
ontstond er rumoer.
07:00
People realizedrealiseerde that 1950 was going to happengebeuren,
165
405000
2000
Mensen beseften dat 1950 er aan ging komen,
07:02
and it could be biggroot.
166
407000
2000
en het zou belangrijk kunnen zijn.
07:04
(LaughterGelach)
167
409000
3000
(Gelach)
07:07
But nothing got people interestedgeïnteresseerd in 1950
168
412000
3000
Maar niets liet mensen zo warmlopen voor 1950
07:10
like the yearjaar 1950.
169
415000
3000
als het jaar 1950.
07:13
(LaughterGelach)
170
418000
3000
(Gelach)
07:16
People were walkingwandelen around obsessedbezeten.
171
421000
2000
Mensen liepen geobsedeerd rond.
07:18
They couldn'tkon het niet stop talkingpratend
172
423000
2000
Ze bleven maar praten
07:20
about all the things they did in 1950,
173
425000
3000
over alle dingen die ze deden in 1950,
07:23
all the things they were planningplanning to do in 1950,
174
428000
3000
alle dingen die ze van plan waren in 1950,
07:26
all the dreamsdromen of what they wanted to accomplishbereiken in 1950.
175
431000
5000
alle dromen die ze wilden verwezenlijken in 1950.
07:31
In factfeit, 1950 was so fascinatingfascinerend
176
436000
2000
In feite was 1950 zo fascinerend
07:33
that for yearsjaar thereafterdaarna,
177
438000
2000
dat mensen jaren later
07:35
people just keptgehouden talkingpratend about all the amazingverbazingwekkend things that happenedgebeurd,
178
440000
3000
nog steeds praatten over alle verbazingwekkends dat gebeurd was,
07:38
in '51, '52, '53.
179
443000
2000
in '51, '52, '53.
07:40
FinallyTot slot in 1954,
180
445000
2000
Uiteindelijk in 1954,
07:42
someoneiemand wokewakker up and realizedrealiseerde
181
447000
2000
werd er iemand wakker die zich realiseerde
07:44
that 1950 had gottengekregen somewhatenigszins passslagen vooré.
182
449000
4000
dat 1950 nu wat achterhaald was.
07:48
(LaughterGelach)
183
453000
2000
(Gelach)
07:50
And just like that, the bubblebubbel burstuitbarsting.
184
455000
2000
Opeens was de zeepbel gebarsten.
07:52
(LaughterGelach)
185
457000
2000
(Gelach)
07:54
And the storyverhaal of 1950
186
459000
2000
Het verhaal van 1950
07:56
is the storyverhaal of everyelk yearjaar that we have on recordrecord,
187
461000
2000
is het verhaal van elk jaar dat gemeten is,
07:58
with a little twisttwist, because now we'vewij hebben got these niceleuk chartsgrafieken.
188
463000
3000
met een kleine draai, want nu hebben we deze mooie grafieken.
08:01
And because we have these niceleuk chartsgrafieken, we can measuremaatregel things.
189
466000
3000
Omdat we die hebben, kunnen we dingen meten.
08:04
We can say, "Well how fastsnel does the bubblebubbel burstuitbarsting?"
190
469000
2000
We kunnen vragen: "Hoe snel is de zeepbel gebarsten?"
08:06
And it turnsbochten out that we can measuremaatregel that very preciselyprecies.
191
471000
3000
Dat blijken we zeer precies te kunnen meten.
08:09
EquationsVergelijkingen were derivedafgeleide, graphsgrafieken were producedgeproduceerd,
192
474000
3000
Vergelijkingen en grafieken werden gemaakt,
08:12
and the netnetto- resultresultaat
193
477000
2000
en het netto resultaat
08:14
is that we find that the bubblebubbel burstsuitbarstingen fastersneller and fastersneller
194
479000
3000
is dat we zien dat de bel steeds sneller barst
08:17
with eachelk passingvoorbijgaand yearjaar.
195
482000
2000
naarmate de tijd vordert.
08:19
We are losingverliezen interestinteresseren in the pastverleden more rapidlysnel.
196
484000
5000
We raken sneller uitgekeken op het verleden.
08:24
JMJM: Now a little piecestuk of careercarrière adviceadvies.
197
489000
2000
JM: Nu wat carrière-advies.
08:26
So for those of you who seekzoeken to be famousberoemd,
198
491000
2000
Diegenen van jullie die beroemd willen worden,
08:28
we can learnleren from the 25 mostmeest famousberoemd politicalpolitiek figuresfiguren,
199
493000
2000
kunnen leren van de 25 beroemdste politieke figuren,
08:30
authorsauteurs, actorsacteurs and so on.
200
495000
2000
schrijvers, acteurs enzovoort.
08:32
So if you want to becomeworden famousberoemd earlyvroeg on, you should be an actoracteur,
201
497000
3000
Om snel beroemd te worden, zou je acteur moeten zijn,
08:35
because then fameroem startsstarts risingstijgende lijn by the endeinde of your 20s --
202
500000
2000
want dan stijgt je bekendheid nog vóór je dertigste --
08:37
you're still youngjong, it's really great.
203
502000
2000
je bent nog jong, helemaal geweldig.
08:39
Now if you can wait a little bitbeetje, you should be an authorauteur,
204
504000
2000
Als je wat langer kunt wachten, zou je schrijver moeten zijn,
08:41
because then you risestijgen to very great heightshoogten,
205
506000
2000
want dan stijg je tot grote hoogten,
08:43
like MarkMark TwainTwain, for instanceaanleg: extremelyuiterst famousberoemd.
206
508000
2000
zoals Mark Twain, bijvoorbeeld: extreem beroemd.
08:45
But if you want to reachberijk the very toptop,
207
510000
2000
Maar als je de absolute top wilt bereiken,
08:47
you should delayvertraging gratificationbevrediging
208
512000
2000
moet je kunnen wachten,
08:49
and, of courseCursus, becomeworden a politicianpoliticus.
209
514000
2000
en, uiteraard, politicus worden.
08:51
So here you will becomeworden famousberoemd by the endeinde of your 50s,
210
516000
2000
Hier word je beroemd vlak voor je zestigste,
08:53
and becomeworden very, very famousberoemd afterwardnadien.
211
518000
2000
en daarna word je nog veel beroemder.
08:55
So scientistswetenschappers alsoook tendde neiging hebben to get famousberoemd when they're much olderouder.
212
520000
3000
Wetenschappers worden doorgaans ook beroemd op hogere leeftijd.
08:58
Like for instanceaanleg, biologistsbiologen and physicsfysica
213
523000
2000
Bijvoorbeeld, biologen en natuurkundigen
09:00
tendde neiging hebben to be almostbijna as famousberoemd as actorsacteurs.
214
525000
2000
zijn vaak bijna zo beroemd als acteurs.
09:02
One mistakevergissing you should not do is becomeworden a mathematicianwiskundige.
215
527000
3000
Een fout die je niet moet maken, is wiskundige worden.
09:05
(LaughterGelach)
216
530000
2000
(Gelach)
09:07
If you do that,
217
532000
2000
Als je dat doet,
09:09
you mightmacht think, "Oh great. I'm going to do my bestbeste work when I'm in my 20s."
218
534000
3000
denk je wellicht: "Mooi, ik ga mijn beste werk doen als begin twintiger."
09:12
But guessraden what, nobodyniemand will really carezorg.
219
537000
2000
Maar dat kan niemand wat schelen.
09:14
(LaughterGelach)
220
539000
3000
(Gelach)
09:17
ELAELA: There are more soberingontnuchterende notesaantekeningen
221
542000
2000
ELA: Er zijn meer ontnuchterende aspecten
09:19
amongtussen the n-gramsn-gram.
222
544000
2000
aan de n-grams.
09:21
For instanceaanleg, here'shier is the trajectorytraject of MarcMarc ChagallChagall,
223
546000
2000
Hier is bijvoorbeeld het traject van Marc Chagall,
09:23
an artistartiest borngeboren in 1887.
224
548000
2000
een kunstenaar geboren in 1887.
09:25
And this lookslooks like the normalnormaal trajectorytraject of a famousberoemd personpersoon.
225
550000
3000
Het lijkt het normale traject van een beroemd persoon.
09:28
He getskrijgt more and more and more famousberoemd,
226
553000
4000
Hij wordt steeds beroemder,
09:32
exceptbehalve if you look in GermanDuits.
227
557000
2000
behalve als je in het Duits kijkt.
09:34
If you look in GermanDuits, you see something completelyhelemaal bizarreBizarre,
228
559000
2000
Daar zie je iets volledig bizars,
09:36
something you prettymooi much never see,
229
561000
2000
wat je bijna nooit ziet, namelijk
09:38
whichwelke is he becomeswordt extremelyuiterst famousberoemd
230
563000
2000
dat hij eerst heel beroemd wordt,
09:40
and then all of a suddenplotseling plummetskeldert,
231
565000
2000
en dan opeens sterk daalt,
09:42
going throughdoor a nadirNadir betweentussen 1933 and 1945,
232
567000
3000
met een dieptepunt tussen 1933 en 1945,
09:45
before reboundingaantrekkende afterwardnadien.
233
570000
3000
voordat hij weer stijgt.
09:48
And of courseCursus, what we're seeingziend
234
573000
2000
Wat we hier uiteraard zien,
09:50
is the factfeit MarcMarc ChagallChagall was a JewishJoodse artistartiest
235
575000
3000
is het feit dat Marc Chagall een Joodse kunstenaar was
09:53
in NaziNazi GermanyDuitsland.
236
578000
2000
in Nazi-Duitsland.
09:55
Now these signalssignalen
237
580000
2000
Deze signalen
09:57
are actuallywerkelijk so strongsterk
238
582000
2000
zijn zo sterk
09:59
that we don't need to know that someoneiemand was censoredgecensureerd.
239
584000
3000
dat we niet hoeven te weten dat iemand werd gecensureerd.
10:02
We can actuallywerkelijk figurefiguur it out
240
587000
2000
We kunnen het uitvissen
10:04
usinggebruik makend van really basicbasis- signalsignaal processingverwerken.
241
589000
2000
met wat simpele signaalverwerking.
10:06
Here'sHier is a simpleeenvoudig way to do it.
242
591000
2000
Hier is een eenvoudige methode.
10:08
Well, a reasonableredelijk expectationverwachting
243
593000
2000
Een redelijke aanname is
10:10
is that somebody'ssomebody is fameroem in a givengegeven periodperiode of time
244
595000
2000
dat iemands roem in een bepaalde periode
10:12
should be roughlyongeveer the averagegemiddelde of theirhun fameroem before
245
597000
2000
ruwweg het gemiddelde moet zijn van zijn roem
10:14
and theirhun fameroem after.
246
599000
2000
ervoor en erna.
10:16
So that's sortsoort of what we expectverwachten.
247
601000
2000
Dat is wat we zouden verwachten.
10:18
And we comparevergelijken that to the fameroem that we observeobserveren.
248
603000
3000
Dat vergelijken we met de roem die we observeren.
10:21
And we just divideverdelen one by the other
249
606000
2000
Dan delen we het één door het ander,
10:23
to produceproduceren something we call a suppressiononderdrukking indexinhoudsopgave.
250
608000
2000
om iets te produceren dat we een suppressie-index noemen.
10:25
If the suppressiononderdrukking indexinhoudsopgave is very, very, very smallklein,
251
610000
3000
Als de suppressie-index heel, heel, heel klein is,
10:28
then you very well mightmacht be beingwezen suppressedonderdrukt.
252
613000
2000
dan kon het zijn dat je tegengewerkt wordt.
10:30
If it's very largegroot, maybe you're benefitingdie in aanmerking komen from propagandapropaganda.
253
615000
3000
Als hij erg groot is, zou er propaganda in het spel kunnen zijn.
10:34
JMJM: Now you can actuallywerkelijk look at
254
619000
2000
JM: Je kunt ook kijken naar
10:36
the distributiondistributie of suppressiononderdrukking indexesindexen over wholegeheel populationspopulaties.
255
621000
3000
de distributie van suppressie-indexen over hele populaties.
10:39
So for instanceaanleg, here --
256
624000
2000
Dus bijvoorbeeld, hier:
10:41
this suppressiononderdrukking indexinhoudsopgave is for 5,000 people
257
626000
2000
deze suppressie-index is voor 5000 mensen
10:43
pickeduitgekozen in EnglishEngels booksboeken where there's no knownbekend suppressiononderdrukking --
258
628000
2000
genomen uit Engelse boeken zonder suppressie --
10:45
it would be like this, basicallyeigenlijk tightlystrak centeredgecentreerd on one.
259
630000
2000
dat is mooi gecentreerd rond 1.
10:47
What you expectverwachten is basicallyeigenlijk what you observeobserveren.
260
632000
2000
Wat je verwacht, observeer je ook.
10:49
This is distributiondistributie as seengezien in GermanyDuitsland --
261
634000
2000
Dit is de distributie in Duitsland --
10:51
very differentverschillend, it's shiftedverschoven to the left.
262
636000
2000
heel anders, het is verschoven naar links.
10:53
People talkedgesproken about it twicetweemaal lessminder as it should have been.
263
638000
3000
Mensen praatten er tweemaal minder over dan normaal.
10:56
But much more importantlybelangrijker, the distributiondistributie is much widerbreder.
264
641000
2000
Maar veel belangrijker: de distributie is veel breder.
10:58
There are manyveel people who endeinde up on the farver left on this distributiondistributie
265
643000
3000
Er zijn veel mensen in de linkerkant van de distributie,
11:01
who are talkedgesproken about 10 timestijden fewerminder than they should have been.
266
646000
3000
waarover tienmaal minder gepraat wordt dan normaal.
11:04
But then alsoook manyveel people on the farver right
267
649000
2000
Maar ook mensen helemaal rechts,
11:06
who seemlijken to benefitvoordeel from propagandapropaganda.
268
651000
2000
die schijnen te profiteren van propaganda.
11:08
This pictureafbeelding is the hallmarkHallmark of censorshipcensuur in the bookboek recordrecord.
269
653000
3000
Dit beeld is het kenmerk van censuur in boeken.
11:11
ELAELA: So culturomicsculturomics
270
656000
2000
ELA: Culturomica
11:13
is what we call this methodmethode.
271
658000
2000
noemen we deze methode.
11:15
It's kindsoort of like genomicsgenomics.
272
660000
2000
Het lijkt op genomica.
11:17
ExceptBehalve genomicsgenomics is a lenslens on biologybiologie
273
662000
2000
Maar genomica is een lens op biologie
11:19
throughdoor the windowvenster of the sequencevolgorde of basesbases in the humanmenselijk genomegenoom.
274
664000
3000
door het raam van de opeenvolging van basen in het menselijk genoom.
11:22
CulturomicsCulturomics is similarsoortgelijk.
275
667000
2000
Culturomica lijkt hierop.
11:24
It's the applicationtoepassing of massive-scalemassaal datagegevens collectionverzameling analysisanalyse
276
669000
3000
Het is de toepassing van massale datacollectie-analyse
11:27
to the studystudie of humanmenselijk culturecultuur.
277
672000
2000
op de studie van de menselijke cultuur.
11:29
Here, insteadin plaats daarvan of throughdoor the lenslens of a genomegenoom,
278
674000
2000
In plaats van door de lens van een genoom,
11:31
throughdoor the lenslens of digitizedgedigitaliseerd piecesstukken of the historicalhistorisch recordrecord.
279
676000
3000
hier door de lens van gedigitaliseerde stukjes historische data.
11:34
The great thing about culturomicsculturomics
280
679000
2000
Het mooie aan culturomica
11:36
is that everyoneiedereen can do it.
281
681000
2000
is dat iedereen het kan doen.
11:38
Why can everyoneiedereen do it?
282
683000
2000
Waarom kan iedereen het?
11:40
EveryoneIedereen can do it because threedrie guys,
283
685000
2000
Iedereen kan het omdat drie kerels,
11:42
JonJon OrwantOrwant, MattMatt GrayGray and Will BrockmanBrockman over at GoogleGoogle,
284
687000
3000
Jon Orwant, Matt Gray en Will Brockman bij Google,
11:45
saw the prototypeprototype of the NgramNgram ViewerViewer,
285
690000
2000
het prototype zagen van de Ngram Viewer,
11:47
and they said, "This is so funpret.
286
692000
2000
en zeiden: "Dit is zo leuk.
11:49
We have to make this availablebeschikbaar for people."
287
694000
3000
We moeten dit beschikbaar maken voor de mensen."
11:52
So in two weeksweken flatvlak -- the two weeksweken before our paperpapier camekwam out --
288
697000
2000
In de twee weken voordat onze publicatie uitkwam,
11:54
they codedgecodeerd up a versionversie of the NgramNgram ViewerViewer for the generalalgemeen publicopenbaar.
289
699000
3000
codeerden ze een versie van de Ngram Viewer voor het grote publiek.
11:57
And so you too can typetype in any wordwoord or phraseuitdrukking that you're interestedgeïnteresseerd in
290
702000
3000
Dus ook jij kunt ieder woord of iedere zin intoetsen
12:00
and see its n-gramn-gram immediatelyper direct --
291
705000
2000
en diens Ngram meteen zien --
12:02
alsoook browseBladeren examplesvoorbeelden of all the variousdivers booksboeken
292
707000
2000
en tevens voorbeelden inkijken van de boeken
12:04
in whichwelke your n-gramn-gram appearskomt naar voren.
293
709000
2000
waarin je Ngram voorkomt.
12:06
JMJM: Now this was used over a millionmiljoen timestijden on the first day,
294
711000
2000
JM: De eerste dag is het meer dan een miljoen maal gebruikt.
12:08
and this is really the bestbeste of all the queriesquery 's.
295
713000
2000
en het is echt de beste van alle zoekopdrachten.
12:10
So people want to be theirhun bestbeste, put theirhun bestbeste footvoet forwardvooruit.
296
715000
3000
Mensen willen op hun best zijn, hun beste voetje voor zetten.
12:13
But it turnsbochten out in the 18thth centuryeeuw, people didn't really carezorg about that at all.
297
718000
3000
Maar in de 18e eeuw gaven mensen daar niet om.
12:16
They didn't want to be theirhun bestbeste, they wanted to be theirhun beftbeft.
298
721000
3000
Ze wilden niet op hun best zijn, maar op hun beft.
12:19
So what happenedgebeurd is, of courseCursus, this is just a mistakevergissing.
299
724000
3000
Dit is uiteraard een vergissing.
12:22
It's not that strovestreefde for mediocritymiddelmatigheid,
300
727000
2000
Ze streefden niet naar middelmatigheid,
12:24
it's just that the S used to be writtengeschreven differentlyanders, kindsoort of like an F.
301
729000
3000
maar de S werd toen anders geschreven, als een F.
12:27
Now of courseCursus, GoogleGoogle didn't pickplukken this up at the time,
302
732000
3000
Dit heeft Google destijds niet opgepikt,
12:30
so we reportedgerapporteerd this in the sciencewetenschap articleartikel that we wroteschreef.
303
735000
3000
dus we gaven dit aan in het wetenschapsartikel.
12:33
But it turnsbochten out this is just a reminderherinnering
304
738000
2000
Maar het is dus een herinnering
12:35
that, althoughhoewel this is a lot of funpret,
305
740000
2000
dat, ook al is dit allemaal erg leuk,
12:37
when you interpretinterpreteren these graphsgrafieken, you have to be very carefulvoorzichtig,
306
742000
2000
wanneer je deze grafieken interpreteert, je erg moet oppassen,
12:39
and you have to adoptadopteren the basebaseren standardsstandaarden in the scienceswetenschappen.
307
744000
3000
en de wetenschappelijke basisprincipes moet toepassen.
12:42
ELAELA: People have been usinggebruik makend van this for all kindssoorten of funpret purposesdoeleinden.
308
747000
3000
ELA: Mensen hebben dit voor allerlei leuke dingen gebruikt.
12:45
(LaughterGelach)
309
750000
7000
(Gelach)
12:52
ActuallyEigenlijk, we're not going to have to talk,
310
757000
2000
We hoeven eigenlijk niet te praten,
12:54
we're just going to showtonen you all the slidesslides and remainblijven silentstil.
311
759000
3000
we laten gewoon alle dia's zien en houden onze mond.
12:57
This personpersoon was interestedgeïnteresseerd in the historygeschiedenis of frustrationfrustratie.
312
762000
3000
Deze persoon was geïnteresseerd in de geschiedenis van frustratie.
13:00
There's variousdivers typestypes of frustrationfrustratie.
313
765000
3000
Er zijn verschillende soorten frustratie.
13:03
If you stubstub your toeTeen, that's a one A "arghArgh."
314
768000
3000
Als je je teen stoot, is dat "argh" met één A.
13:06
If the planetplaneet EarthAarde is annihilatedvernietigd by the VogonsVogons
315
771000
2000
Als de Aarde wordt verwoest door Vogons
13:08
to make roomkamer for an interstellarinterstellair bypassBypass,
316
773000
2000
om plaats te maken voor een galactische omleiding,
13:10
that's an eightacht A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
is dat een "aaaaaaaargh" met acht A's.
13:12
This personpersoon studiesstudies all the "arghsarghs,"
318
777000
2000
Deze persoon bestudeerde alle "arghs",
13:14
from one throughdoor eightacht A'sA's.
319
779000
2000
van één tot en met acht A's.
13:16
And it turnsbochten out
320
781000
2000
Nu blijkt
13:18
that the less-frequentminder frequente "arghsarghs"
321
783000
2000
dat de minder frequente "arghs"
13:20
are, of courseCursus, the onesdegenen that correspondovereenkomen met to things that are more frustratingfrustrerend --
322
785000
3000
corresponderen met meer frustrerende dingen --
13:23
exceptbehalve, oddlyvreemd, in the earlyvroeg 80s.
323
788000
3000
behalve, vreemd genoeg, begin jaren '80.
13:26
We think that mightmacht have something to do with ReaganReagan.
324
791000
2000
We denken dat dit iets te maken heeft met Reagan.
13:28
(LaughterGelach)
325
793000
2000
(Gelach)
13:30
JMJM: There are manyveel usagestoepassingen of this datagegevens,
326
795000
3000
JM: Er zijn vele toepassingen voor deze data,
13:33
but the bottombodem linelijn is that the historicalhistorisch recordrecord is beingwezen digitizedgedigitaliseerd.
327
798000
3000
maar het belangrijkste is dat historische data worden gedigitaliseerd.
13:36
GoogleGoogle has startedbegonnen to digitizedigitaliseren 15 millionmiljoen booksboeken.
328
801000
2000
Google heeft nu 15 miljoen boeken gedigitaliseerd.
13:38
That's 12 percentprocent of all the booksboeken that have ever been publishedgepubliceerd.
329
803000
2000
Dat is 12% van alle boeken die ooit uitgegeven zijn.
13:40
It's a sizableomvangrijke chunkbrok of humanmenselijk culturecultuur.
330
805000
3000
Dat is een behoorlijk deel van onze cultuur.
13:43
There's much more in culturecultuur: there's manuscriptsmanuscripten, there newspaperskranten,
331
808000
3000
Er is nog veel meer in de cultuur: er zijn manuscripten, kranten,
13:46
there's things that are not texttekst, like artkunst and paintingsschilderijen.
332
811000
2000
er zijn dingen zonder tekst, zoals kunst en schilderijen.
13:48
These all happengebeuren to be on our computerscomputers,
333
813000
2000
Deze staan allemaal op onze computers,
13:50
on computerscomputers acrossaan de overkant the worldwereld-.
334
815000
2000
op computers over de wereld.
13:52
And when that happensgebeurt, that will transformtransformeren the way we have
335
817000
3000
Wanneer dat gebeurt, zal het ons begrip van ons verleden,
13:55
to understandbegrijpen our pastverleden, our presentaanwezig and humanmenselijk culturecultuur.
336
820000
2000
ons heden, en onze cultuur transformeren.
13:57
Thank you very much.
337
822000
2000
Dank je wel.
13:59
(ApplauseApplaus)
338
824000
3000
(Applaus)
Translated by Axel Saffran
Reviewed by Els De Keyser

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com