ABOUT THE SPEAKER
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
TED2012

Jean-Baptiste Michel: The mathematics of history

Jean-Baptiste Michel: De wiskunde van de geschiedenis

Filmed:
1,279,350 views

Wat kan de wiskunde zeggen over de geschiedenis? Volgens TED Fellow Jean-Baptiste Michel behoorlijk veel. In kwesties variërend van taalkundige veranderingen tot de dodelijkheid van oorlogen, laat hij zien hoe gedigitaliseerde geschiedenis diepe onderliggende patronen begint te onthullen.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio

Double-click the English transcript below to play the video.

00:15
So it turnsbochten out that mathematicswiskunde is a very powerfulkrachtig languagetaal.
0
0
3671
Wiskunde blijkt een zeer krachtige taal te zijn.
00:19
It has generatedgegenereerd considerableaanzienlijke insightin zicht in physicsfysica,
1
3671
2312
Ze heeft grote inzichten opgeleverd in de natuurkunde,
00:21
in biologybiologie and economicseconomie,
2
5983
2100
biologie en economie,
00:23
but not that much in the humanitiesgeesteswetenschappen and in historygeschiedenis.
3
8083
2817
maar niet zoveel in de geesteswetenschappen en geschiedenis.
00:26
I think there's a beliefgeloof that it's just impossibleonmogelijk,
4
10900
2283
Ik denk dat men dit onmogelijk acht,
00:29
that you cannotkan niet quantifykwantificeren the doingsdaden of mankindmensheid,
5
13183
2646
dat je de daden van de mensheid niet kan kwantificeren
00:31
that you cannotkan niet measuremaatregel historygeschiedenis.
6
15829
2519
en de geschiedenis niet kan meten.
00:34
But I don't think that's right.
7
18348
1527
Maar volgens mij klopt dat niet.
00:35
I want to showtonen you a couplepaar of examplesvoorbeelden why.
8
19875
2042
Ik wil met een paar voorbeelden laten zien waarom.
00:37
So my collaboratormedewerker ErezErez and I were consideringgezien het feit the followingvolgend factfeit:
9
21917
2958
Mijn collega Erez en ik beschouwden het volgende feit:
00:40
that two kingskoningen separatedgescheiden by centurieseeuwen
10
24875
2729
twee koningen uit verschillende eeuwen
00:43
will speakspreken a very differentverschillend languagetaal.
11
27604
1767
spreken zeer verschillende talen.
00:45
That's a powerfulkrachtig historicalhistorisch forcedwingen.
12
29371
2304
Dat is een grote historische kracht.
00:47
So the kingkoning of EnglandEngeland, AlfredAlfred the Great,
13
31675
1773
De koning van Engeland, Alfred de Grote,
00:49
will use a vocabularywoordenschat and grammargrammatica
14
33448
1640
heeft een heel andere woordenschat en grammatica
00:50
that is quiteheel differentverschillend from the kingkoning of hipheup hophop, Jay-ZJay-Z.
15
35088
3700
dan de koning van hip hop, Jay-Z.
00:54
(LaughterGelach)
16
38788
1666
(Gelach)
00:56
Now it's just the way it is.
17
40454
2171
Zo is dat nu eenmaal.
00:58
LanguageTaal changesveranderingen over time, and it's a powerfulkrachtig forcedwingen.
18
42625
2292
Taal verandert met de tijd. Dat is een krachtig fenomeen.
01:00
So ErezErez and I wanted to know more about that.
19
44917
2287
Erez en ik wilden hier meer over weten.
01:03
So we paidbetaald attentionaandacht to a particularbijzonder grammaticalgrammaticaal ruleregel, past-tenseverleden-tijd conjugationWoordherkomst en-opbouw.
20
47204
3657
We bestudeerden een bepaalde grammaticale regel: de verleden tijd van werkwoorden.
01:06
So you just addtoevoegen "edEd" to a verbwerkwoord at the endeinde to signifybetekenen the pastverleden.
21
50861
3264
Je plakt gewoon 'te' of 'de' achter een werkwoord om de verleden tijd aan te geven.
01:10
"TodayVandaag I walklopen. YesterdayGisteren I walkedwandelde."
22
54125
1927
"Vandaag maak ik. Gisteren maakte ik."
01:11
But some verbswerkwoorden are irregularonregelmatig.
23
56052
1344
Maar sommige werkwoorden zijn onregelmatig.
01:13
"YesterdayGisteren I thought."
24
57396
1396
"Gisteren dacht ik."
01:14
Now what's interestinginteressant about that
25
58792
1666
Interessant hieraan is
01:16
is irregularonregelmatig verbswerkwoorden betweentussen AlfredAlfred and Jay-ZJay-Z have becomeworden more regularregelmatig.
26
60458
3830
dat onregelmatige werkwoorden tussen Alfred en Jay-Z regelmatiger zijn geworden.
01:20
Like the verbwerkwoord "to wedwo" that you see here has becomeworden regularregelmatig.
27
64288
2735
Zoals het werkwoord "to wed", dat is regelmatig geworden.
01:22
So ErezErez and I followedgevolgd the fatelot of over 100 irregularonregelmatig verbswerkwoorden
28
67023
4022
Erez en ik volgden het lot van ruim 100 onregelmatige werkwoorden
01:26
throughdoor 12 centurieseeuwen of EnglishEngels languagetaal,
29
71045
1919
door 12 eeuwen Engelse taal heen,
01:28
and we saw that there's actuallywerkelijk a very simpleeenvoudig mathematicalwiskundig patternpatroon
30
72964
2911
en we ontdekten een heel eenvoudig wiskundig patroon
01:31
that capturescaptures this complexcomplex historicalhistorisch changeverandering,
31
75875
2542
dat deze ingewikkelde historische verandering weergeeft.
01:34
namelynamelijk, if a verbwerkwoord is 100 timestijden more frequentveel voorkomend than anothereen ander,
32
78417
3660
Als een werkwoord 100 maal frequenter is dan een ander,
01:37
it regularizesregularizes 10 timestijden slowertragere.
33
82077
2665
wordt het 10x langzamer regelmatig.
01:40
That's a piecestuk of historygeschiedenis, but it comeskomt in a mathematicalwiskundig wrappingTekstterugloop.
34
84742
3935
Dat is een stukje geschiedenis verpakt in wiskunde.
01:44
Now in some casesgevallen mathwiskunde can even help explainuitleg geven,
35
88677
3654
Soms kan wiskunde zelfs verklaringen aandragen
01:48
or proposevoorstellen explanationstoelichtingen for, historicalhistorisch forceskrachten.
36
92331
2879
voor historische krachten.
01:51
So here SteveSteve PinkerPinker and I
37
95210
1832
Hier bekeken Steve Pinker en ik
01:52
were consideringgezien het feit the magnitudeomvang of warsoorlogen duringgedurende the last two centurieseeuwen.
38
97042
3852
de grootte van oorlogen gedurende de laatste twee decennia.
01:56
There's actuallywerkelijk a well-knownbekende regularityregelmatigheid to them
39
100894
2495
Ze vertonen in feite een welbekende regelmaat.
01:59
where the numberaantal of warsoorlogen that are 100 timestijden deadlierdodelijker
40
103389
3422
Het aantal oorlogen dat 100 maal dodelijker is,
02:02
is 10 timestijden smallerkleiner.
41
106811
1952
is tien maal kleiner.
02:04
So there are 30 warsoorlogen that are about as deadlydodelijk as the SixZes DaysDagen WarOorlog,
42
108763
3344
Dus er zijn 30 oorlogen ongeveer zo dodelijk als de Zesdaagse Oorlog,
02:08
but there's only fourvier warsoorlogen that are 100 timestijden deadlierdodelijker --
43
112107
2820
maar er zijn slechts vier oorlogen die 100 maal dodelijker zijn --
02:10
like WorldWereld WarOorlog I.
44
114927
1977
zoals de Eerste Wereldoorlog.
02:12
So what kindsoort of historicalhistorisch mechanismmechanisme can produceproduceren that?
45
116904
2923
Welk historisch mechanisme kan zoiets veroorzaken?
02:15
What's the originoorsprong of this?
46
119827
2000
Wat is de oorsprong hiervan?
02:17
So SteveSteve and I, throughdoor mathematicalwiskundig analysisanalyse,
47
121827
2265
Via wiskundige analyse stelden Steve en ik
02:19
proposevoorstellen that there's actuallywerkelijk a very simpleeenvoudig phenomenonfenomeen at the rootwortel of this,
48
124092
4241
dat er een heel eenvoudig fenomeen aan ten grondslag ligt,
02:24
whichwelke liesleugens in our brainshersenen.
49
128333
1690
dat in onze hersenen zetelt.
02:25
This is a very well-knownbekende featurekenmerk
50
130023
2019
Het is het welbekende gegeven
02:27
in whichwelke we perceivewaarnemen quantitieshoeveelheden in relativefamilielid waysmanieren --
51
132042
2975
dat we hoeveelheden op relatieve wijze waarnemen --
02:30
quantitieshoeveelheden like the intensityintensiteit of lightlicht or the loudnessLoudness of a soundgeluid.
52
135017
3716
hoeveelheden als lichtintensiteit of geluidssterkte.
02:34
For instanceaanleg, committingplegen 10,000 soldierssoldaten to the nextvolgende battlestrijd soundsklanken like a lot.
53
138733
5309
Bijvoorbeeld, 10.000 soldaten ten strijde sturen lijkt veel.
02:39
It's relativelynaar verhouding enormousenorm if you've alreadynu al committedtoegewijd 1,000 soldierssoldaten previouslyeerder.
54
144042
3444
Het is relatief enorm als je daarvóór 1000 soldaten stuurde.
02:43
But it doesn't soundgeluid so much,
55
147486
1827
Maar het lijkt niet zo veel,
02:45
it's not relativelynaar verhouding enoughgenoeg, it won'tzal niet make a differenceverschil
56
149313
3020
het is relatief onvoldoende en ontoereikend
02:48
if you've alreadynu al committedtoegewijd 100,000 soldierssoldaten previouslyeerder.
57
152333
2952
als je alreeds 100.000 soldaten hebt gestuurd.
02:51
So you see that because of the way we perceivewaarnemen quantitieshoeveelheden,
58
155285
3613
Dus je ziet dat door de manier waarop we hoeveelheden waarnemen,
02:54
as the waroorlog dragssleept on,
59
158898
1767
terwijl de oorlog voortduurt,
02:56
the numberaantal of soldierssoldaten committedtoegewijd to it and the casualtiesdoden en gewonden
60
160665
3085
het aantal gestuurde soldaten en gesneuvelden
02:59
will increasetoename not linearlylineair --
61
163750
1683
niet rechtlijnig toeneemt :
03:01
like 10,000, 11,000, 12,000 --
62
165433
1888
dus 10.000 ... 11.000 ... 12.000 --
03:03
but exponentiallyexponentieel -- 10,000, laterlater 20,000, laterlater 40,000.
63
167321
4275
maar exponentieel: 10.000 ... 20.000 ... 40.000.
03:07
And so that explainslegt uit this patternpatroon that we'vewij hebben seengezien before.
64
171596
3085
Dat verklaart het patroon dat we eerder zagen.
03:10
So here mathematicswiskunde is ablein staat to linklink a well-knownbekende featurekenmerk of the individualindividu mindgeest
65
174681
5498
Hier verbindt de wiskunde een welbekende eigenschap van de individuele geest
03:16
with a long-termlangetermijn historicalhistorisch patternpatroon
66
180179
2989
met een langlopend historisch patroon,
03:19
that unfoldsontvouwt zich over centurieseeuwen and acrossaan de overkant continentscontinenten.
67
183168
2857
dat zich ontvouwt gedurende eeuwen en over continenten.
03:21
So these typestypes of examplesvoorbeelden, todayvandaag there are just a fewweinig of them,
68
186025
4017
Dit soort voorbeelden zijn er nu nog niet veel, maar
03:25
but I think in the nextvolgende decadedecennium they will becomeworden commonplacealledaags.
69
190042
2689
ik denk dat ze de komende 10 jaar heel gewoon gaan worden.
03:28
The reasonreden for that is that the historicalhistorisch recordrecord
70
192731
2392
De reden daarvoor is dat de historische bronnen
03:31
is becomingworden digitizedgedigitaliseerd at a very fastsnel pacetempo.
71
195123
2460
in rap tempo worden gedigitaliseerd.
03:33
So there's about 130 millionmiljoen booksboeken
72
197583
2610
Er zijn ongeveer 130 miljoen boeken
03:36
that have been writtengeschreven sincesinds the dawndageraad of time.
73
200193
2311
geschreven sinds mensenheugenis.
03:38
CompaniesBedrijven like GoogleGoogle have digitizedgedigitaliseerd manyveel of them --
74
202504
2454
Bedrijven als Google hebben vele daarvan gedigitaliseerd.
03:40
abovebovenstaand 20 millionmiljoen actuallywerkelijk.
75
204958
1584
Ruim 20 miljoen in feite.
03:42
And when the stuffspul of historygeschiedenis is availablebeschikbaar in digitaldigitaal formformulier,
76
206542
3578
De beschikbaarheid van historische bronnen in digitale vorm
03:46
it makesmerken it possiblemogelijk for a mathematicalwiskundig analysisanalyse
77
210120
2380
maakt het mogelijk om via wiskundige analyse
03:48
to very quicklysnel and very convenientlygunstig
78
212500
2375
zeer snel en gemakkelijk
03:50
reviewbeoordeling trendstrends in our historygeschiedenis and our culturecultuur.
79
214875
2725
trends in onze geschiedenis en cultuur te bekijken.
03:53
So I think in the nextvolgende decadedecennium,
80
217600
2721
Ik denk dat in de komende 10 jaar
03:56
the scienceswetenschappen and the humanitiesgeesteswetenschappen will come closerdichterbij togethersamen
81
220321
2750
de natuurwetenschappen en de geesteswetenschappen elkaar nader zullen komen
03:58
to be ablein staat to answerantwoord deepdiep questionsvragen about mankindmensheid.
82
223071
3329
om diepe vragen over de mensheid te kunnen beantwoorden.
04:02
And I think that mathematicswiskunde will be a very powerfulkrachtig languagetaal to do that.
83
226400
4121
Wiskunde zal volgens mij een zeer krachtige taal zijn om dat te doen.
04:06
It will be ablein staat to revealonthullen newnieuwe trendstrends in our historygeschiedenis,
84
230521
3146
Ze zal nieuwe trends in onze geschiedenis kunnen blootleggen,
04:09
sometimessoms to explainuitleg geven them,
85
233667
1750
deze soms kunnen verklaren
04:11
and maybe even in the futuretoekomst to predictvoorspellen what's going to happengebeuren.
86
235417
3306
en misschien in de toekomst zelfs voorspellingen kunnen doen.
04:14
Thank you very much.
87
238723
1491
Dank je wel.
04:16
(ApplauseApplaus)
88
240214
3678
(Applaus)
Translated by Axel Saffran
Reviewed by Els De Keyser

▲Back to top

ABOUT THE SPEAKER
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com