ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

Što smo naučili iz 5 milijuna knjiga

Filmed:
2,049,453 views

Jeste li se igrali preglednikom Ngram na Google Labs? Navući ćete se na taj alat pomoću kojega možete tražiti riječi i ideje u bazi podataka od pet milijuna knjiga nastalih kroz više stoljeća. Erez Lieberman Aiden i Jean-Baptiste Michel pokazuju nam kako to funkcionira te predstavljaju nekoliko iznenađujućih stvari koje možemo naučiti iz 5 milijardi riječi.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
ErezErez LiebermanLiberman AidenAiden: EveryoneSvi knowszna
0
0
2000
Erez Lieberman Aiden: Svi znaju
00:17
that a pictureslika is worthvrijedan a thousandtisuću wordsriječi.
1
2000
3000
da slika vrijedi tisuću riječi.
00:22
But we at HarvardHarvard
2
7000
2000
No, mi smo se na Harvardu
00:24
were wonderingpitate if this was really truepravi.
3
9000
3000
zapitali je li to stvarno istina.
00:27
(LaughterSmijeh)
4
12000
2000
(Smijeh)
00:29
So we assembledsklopljen a teamtim of expertsstručnjaci,
5
14000
4000
Tako smo okupili tim stručnjaka,
00:33
spanningrasponu HarvardHarvard, MITMIT,
6
18000
2000
koji obuhvaća ljude na Harvardu i MIT-u,
00:35
The AmericanAmerički HeritageBaština DictionaryRječnik, The EncyclopediaEnciklopedija BritannicaBritannica
7
20000
3000
one koji rade na rječniku American Heritage i Encyclopediji Britannici,
00:38
and even our proudponos sponsorssponzori,
8
23000
2000
čak i naše ponosne sponzore,
00:40
the GoogleGoogle.
9
25000
3000
Google.
00:43
And we cogitatedcogitated about this
10
28000
2000
Razmišljali smo o tome
00:45
for about fourčetiri yearsgodina.
11
30000
2000
oko četiri godine
00:47
And we camedošao to a startlingzapanjujuće conclusionzaključak.
12
32000
5000
i došli smo do začuđujućeg zaključka.
00:52
LadiesDame and gentlemengospoda, a pictureslika is not worthvrijedan a thousandtisuću wordsriječi.
13
37000
3000
Dame i gospodo, slika ne vrijedi tisuću riječi.
00:55
In factčinjenica, we foundpronađeno some picturesSlike
14
40000
2000
Čak smo pronašli neke slike
00:57
that are worthvrijedan 500 billionmilijardi wordsriječi.
15
42000
5000
koje vrijede 500 milijardi riječi.
01:02
Jean-BaptisteJean-Baptiste MichelMichel: So how did we get to this conclusionzaključak?
16
47000
2000
Jean-Baptiste Michel: Kako smo došlo do tog zaključka?
01:04
So ErezErez and I were thinkingmišljenje about waysnačine
17
49000
2000
Erez i ja razmišljali smo o načinima
01:06
to get a bigvelika pictureslika of humanljudski cultureKultura
18
51000
2000
na koje bismo mogli steći općenitu sliku ljudske kulture
01:08
and humanljudski historypovijest: changepromijeniti over time.
19
53000
3000
i ljudske povijesti: promjene kroz vrijeme.
01:11
So manymnogi booksknjige actuallyzapravo have been writtennapisan over the yearsgodina.
20
56000
2000
Kroz vrijeme je zapravo napisano mnogo knjiga.
01:13
So we were thinkingmišljenje, well the bestnajbolje way to learnnaučiti from them
21
58000
2000
Stoga smo mislili kako je najbolji način da nešto naučimo iz njih
01:15
is to readčitati all of these millionsmilijuni of booksknjige.
22
60000
2000
taj da pročitamo sve te milijune knjiga.
01:17
Now of coursenaravno, if there's a scaleljestvica for how awesomesuper that is,
23
62000
3000
Naravno, ako postoji ljestvica za mjerenje koliko je to fenomenalno,
01:20
that has to rankčin extremelykrajnje, extremelykrajnje highvisok.
24
65000
3000
tako nešto mora biti rangirano vrlo, vrlo visoko.
01:23
Now the problemproblem is there's an X-axisX-osi for that,
25
68000
2000
Problem je što za to postoji os x
01:25
whichkoji is the practicalpraktičan axisos.
26
70000
2000
ili praktična os.
01:27
This is very, very lownizak.
27
72000
2000
Na njoj se to nalazi vrlo, vrlo nisko.
01:29
(ApplausePljesak)
28
74000
3000
(Pljesak)
01:32
Now people tendskloni to use an alternativealternativa approachpristup,
29
77000
3000
Ljudi su skloni primjenjivanju alternativnog pristupa,
01:35
whichkoji is to take a fewnekoliko sourcesizvori and readčitati them very carefullypažljivo.
30
80000
2000
a to je da izaberu nekoliko izvora i njih pročitaju vrlo pažljivo.
01:37
This is extremelykrajnje practicalpraktičan, but not so awesomesuper.
31
82000
2000
To je vrlo praktično, ali nije baš fenomenalno.
01:39
What you really want to do
32
84000
3000
Ono što zapravo želite
01:42
is to get to the awesomesuper yetjoš practicalpraktičan partdio of this spaceprostor.
33
87000
3000
jest doći do dijela koji je i fenomenalan i praktičan.
01:45
So it turnsokreti out there was a companydruštvo acrosspreko the riverRijeka calledzvao GoogleGoogle
34
90000
3000
Ispada da s druge strane rijeke postoji tvrtka koja se zove Google,
01:48
who had startedpočeo a digitizationdigitalizacija projectprojekt a fewnekoliko yearsgodina back
35
93000
2000
koja je prije nekoliko godina počela s projektom digitalizacije
01:50
that mightmoć just enableomogućiti this approachpristup.
36
95000
2000
koji bi mogao omogućiti upravo ovaj pristup.
01:52
They have digitizedDigitalizirani millionsmilijuni of booksknjige.
37
97000
2000
Digitalizirali su milijune knjiga.
01:54
So what that meanssredstva is, one could use computationalračunalna methodsmetode
38
99000
3000
A to znači da se možemo služiti računalnim metodama
01:57
to readčitati all of the booksknjige in a clickklik of a buttondugme.
39
102000
2000
kako bismo sve knjige pročitali pritiskom na tipku.
01:59
That's very practicalpraktičan and extremelykrajnje awesomesuper.
40
104000
3000
To je vrlo praktično i poprilično fenomenalno.
02:03
ELAELA: Let me tell you a little bitbit about where booksknjige come from.
41
108000
2000
ELA: Ispričat ću vam malo o tome odakle dolaze knjige.
02:05
SinceOd time immemorialnezapamćen, there have been authorsautori.
42
110000
3000
Od pamtivijeka postoje autori.
02:08
These authorsautori have been strivingnastoji to writepisati booksknjige.
43
113000
3000
Oni teže tome da pišu knjige.
02:11
And this becamepostao considerablyznatno easierlakše
44
116000
2000
To je postalo znatno lakše
02:13
with the developmentrazvoj of the printingtiskanje presstisak some centuriesstoljeća agoprije.
45
118000
2000
s razvojem tehnike tiskanja prije nekoliko stoljeća.
02:15
SinceOd then, the authorsautori have wonwon
46
120000
3000
Od tada su autori pobijedili
02:18
on 129 millionmilijuna distinctizrazit occasionsprilike,
47
123000
2000
129 milijuna puta
02:20
publishingobjavljivanje booksknjige.
48
125000
2000
i objavili su knjige.
02:22
Now if those booksknjige are not lostizgubljen to historypovijest,
49
127000
2000
Ako se te knjige s vremenom nisu izgubile,
02:24
then they are somewherenegdje in a libraryknjižnica,
50
129000
2000
znači da su negdje u nekoj knjižnici.
02:26
and manymnogi of those booksknjige have been gettinguzimajući retrievedpopravljanje from the librariesknjižnice
51
131000
3000
Mnoge od tih knjiga izvučene su iz knjižnica
02:29
and digitizedDigitalizirani by GoogleGoogle,
52
134000
2000
i Google ih je digitalizirao.
02:31
whichkoji has scannedskeniran 15 millionmilijuna booksknjige to datedatum.
53
136000
2000
Do danas je skenirano 15 milijuna knjiga.
02:33
Now when GoogleGoogle digitizesdigitalizira a bookrezervirati, they put it into a really nicelijepo formatformat.
54
138000
3000
Kad Google digitalizira knjigu, stavlja ju u zaista zgodan format.
02:36
Now we'veimamo got the datapodaci, plusplus we have metadatametapodataka.
55
141000
2000
Imamo podatke, a imamo i metapodatke.
02:38
We have informationinformacija about things like where was it publishedObjavljeno,
56
143000
3000
Imamo informacije o stvarima kao što su mjesto izdavanja,
02:41
who was the authorAutor, when was it publishedObjavljeno.
57
146000
2000
ime autora, datum izdavanja.
02:43
And what we do is go throughkroz all of those recordsploče
58
148000
3000
I mi tada prolazimo kroz sve te zapise
02:46
and excludeisključiti everything that's not the highestnajviši qualitykvaliteta datapodaci.
59
151000
4000
i izostavljamo sve što nisu podaci najviše kvalitete.
02:50
What we're left with
60
155000
2000
Ono što nam ostaje
02:52
is a collectionkolekcija of fivepet millionmilijuna booksknjige,
61
157000
3000
zbirka je od pet milijuna knjiga,
02:55
500 billionmilijardi wordsriječi,
62
160000
3000
500 milijardi riječi,
02:58
a stringniz of characterslikovi a thousandtisuću timesputa longerviše
63
163000
2000
niz likova koji je tisuću puta dulji
03:00
than the humanljudski genomegenom --
64
165000
3000
od ljudskog genoma --
03:03
a texttekst whichkoji, when writtennapisan out,
65
168000
2000
tekst koji bi, kad bi se ispisao,
03:05
would stretchrastezanje from here to the MoonMjesec and back
66
170000
2000
protezao 10 puta odavde do Mjeseca
03:07
10 timesputa over --
67
172000
2000
i natrag --
03:09
a veritablepravi shardkrhotina of our culturalkulturni genomegenom.
68
174000
4000
zaista tek djelić našeg kulturnog genoma.
03:13
Of coursenaravno what we did
69
178000
2000
Naravno, ono što smo učinili,
03:15
when facedsuočeni with suchtakav outrageouspretjeran hyperbolehiperbola ...
70
180000
3000
kad smo se suočili s tako skandaloznom hiperbolom...
03:18
(LaughterSmijeh)
71
183000
2000
(Smijeh)
03:20
was what any self-respectingself-poštujući researchersistraživači
72
185000
3000
bilo je isto što bi učinili bilo koji istraživači
03:23
would have doneučinio.
73
188000
3000
koji drže do sebe.
03:26
We tookuzeo a pagestranica out of XKCDXKCD,
74
191000
2000
Uzeli smo jednu stranicu s XKCD-a
03:28
and we said, "StandStajati back.
75
193000
2000
i rekli: "Odmaknite se!
03:30
We're going to try scienceznanost."
76
195000
2000
Pokušat ćemo nešto znanstveno!"
03:32
(LaughterSmijeh)
77
197000
2000
(Smijeh)
03:34
JMJM: Now of coursenaravno, we were thinkingmišljenje,
78
199000
2000
JM: Naravno, mislili smo,
03:36
well let's just first put the datapodaci out there
79
201000
2000
hajdemo prvo omogućiti pristup podacima
03:38
for people to do scienceznanost to it.
80
203000
2000
kako bi ih ljudi mogli znanstveno promotriti.
03:40
Now we're thinkingmišljenje, what datapodaci can we releasepuštanje?
81
205000
2000
Razmišljali smo kojim podacima možemo omogućiti pristup?
03:42
Well of coursenaravno, you want to take the booksknjige
82
207000
2000
Naravno, želite uzeti te knjige
03:44
and releasepuštanje the fullpuni texttekst of these fivepet millionmilijuna booksknjige.
83
209000
2000
i omogućiti pristup kompletnom tekstu tih pet milijuna knjiga.
03:46
Now GoogleGoogle, and JonJon OrwantOrwant in particularposebno,
84
211000
2000
Google, a pogotovo Jon Orwant,
03:48
told us a little equationjednadžba that we should learnnaučiti.
85
213000
2000
pokazali su nam malu jednadžbu koju smo morali naučiti.
03:50
So you have fivepet millionmilijuna, that is, fivepet millionmilijuna authorsautori
86
215000
3000
Imate pet milijuna knjiga, odnosno pet miljuna autora
03:53
and fivepet millionmilijuna plaintiffsTužitelji is a massivemasivan lawsuitparnica.
87
218000
3000
i pet milijuna tužitelja u masovnoj tužbi.
03:56
So, althoughiako that would be really, really awesomesuper,
88
221000
2000
Dakle, iako bi to bilo stvarno, stvarno fenomenalno,
03:58
again, that's extremelykrajnje, extremelykrajnje impracticalnepraktičan.
89
223000
3000
to je opet vrlo, vrlo nepraktično.
04:01
(LaughterSmijeh)
90
226000
2000
(Smijeh)
04:03
Now again, we kindljubazan of cavedpokleknuo in,
91
228000
2000
Opet smo popustilli
04:05
and we did the very practicalpraktičan approachpristup, whichkoji was a bitbit lessmanje awesomesuper.
92
230000
3000
i primijenili vrlo praktičan pristup, koji je bio nešto manje fenomenalan.
04:08
We said, well insteadumjesto of releasingispuštanje the fullpuni texttekst,
93
233000
2000
Rekli smo, umjesto da omogućimo pristup kompletnom tekstu,
04:10
we're going to releasepuštanje statisticsstatistika about the booksknjige.
94
235000
2000
omogućit ćemo pristup statistikama o knjigama.
04:12
So take for instanceprimjer "A gleamsjaj of happinesssreća."
95
237000
2000
Uzmite primjerice "tračak sreće" (a gleam of happiness).
04:14
It's fourčetiri wordsriječi; we call that a four-gramčetiri grama.
96
239000
2000
To su četiri riječi i to zovemo četverogram.
04:16
We're going to tell you how manymnogi timesputa a particularposebno four-gramčetiri grama
97
241000
2000
Reći ćemo vam koliko se puta određeni četverogram
04:18
appearedpojavio se in booksknjige in 1801, 1802, 1803,
98
243000
2000
pojavio u knjigama 1801., 1802., 1803. godine,
04:20
all the way up to 2008.
99
245000
2000
i tako sve do 2008.
04:22
That givesdaje us a time seriesniz
100
247000
2000
Tako dobivamo vremenski niz
04:24
of how frequentlyčesto this particularposebno sentencekazna was used over time.
101
249000
2000
učestalosti korištenja određene rečenice kroz vrijeme,
04:26
We do that for all the wordsriječi and phrasesfraze that appearpojaviti in those booksknjige,
102
251000
3000
To smo napravili za sve riječi i izraze koji se pojavljuju u tim knjigama,
04:29
and that givesdaje us a bigvelika tablestol of two billionmilijardi lineslinije
103
254000
3000
što nam daje veliku tablicu od dvije milijarde redaka
04:32
that tell us about the way cultureKultura has been changingmijenjanje.
104
257000
2000
koji nam prikazuju način na koji se kultura mijenja.
04:34
ELAELA: So those two billionmilijardi lineslinije,
105
259000
2000
ELA: Te dvije milijarde redaka
04:36
we call them two billionmilijardi n-gramsn-grama.
106
261000
2000
zovemo dvije milijarde n-grama.
04:38
What do they tell us?
107
263000
2000
Što nam oni govore?
04:40
Well the individualpojedinac n-gramsn-grama measuremjera culturalkulturni trendstrendovi.
108
265000
2000
Pojedinačni n-grami mjere kulturne trendove.
04:42
Let me give you an exampleprimjer.
109
267000
2000
Dat ću vam primjer.
04:44
Let's supposepretpostaviti that I am thrivinguspješan,
110
269000
2000
Pretpostavimo da ja težim nečemu (thrive),
04:46
then tomorrowsutra I want to tell you about how well I did.
111
271000
2000
a sutra vam želim ispričati koliko sam bio uspješan.
04:48
And so I mightmoć say, "YesterdayJučer, I throvethrove."
112
273000
3000
Mogao bih koristiti oblik za prošlo vrijeme "throve",
04:51
AlternativelyAlternativno, I could say, "YesterdayJučer, I thrivedrazvijalo."
113
276000
3000
a mogao koristiti i oblike "thrived".
04:54
Well whichkoji one should I use?
114
279000
3000
Koji bih trebao koristiti?
04:57
How to know?
115
282000
2000
Kako to znati?
04:59
As of about sixšest monthsmjeseci agoprije,
116
284000
2000
Prije otprilike šest mjeseci,
05:01
the statedržava of the artumjetnost in this fieldpolje
117
286000
2000
najsuvremeniji podaci u tom polju
05:03
is that you would, for instanceprimjer,
118
288000
2000
kažu da biste, primjerice,
05:05
go up to the followingsljedeći psychologistpsiholog with fabulousnevjerojatan hairdlaka,
119
290000
2000
otišli do ovog psihologa fantastične kose
05:07
and you'dti bi say,
120
292000
2000
i rekli biste:
05:09
"SteveSteve, you're an expertstručnjak on the irregularneregularan verbsglagoli.
121
294000
3000
"Steve, ti si stručnjak za nepravilne glagole.
05:12
What should I do?"
122
297000
2000
Što da radim?"
05:14
And he'don bi tell you, "Well mostnajviše people say thrivedrazvijalo,
123
299000
2000
A on bi vam rekao: "Pa, većina ljudi koristi "thrived",
05:16
but some people say throvethrove."
124
301000
3000
ali neki ljudi kažu "throve".
05:19
And you alsotakođer knewznao, more or lessmanje,
125
304000
2000
A znali biste i, više-manje,
05:21
that if you were to go back in time 200 yearsgodina
126
306000
3000
da kad biste se vratili 200 godina u prošlost
05:24
and askpitati the followingsljedeći statesmandržavnik with equallyjednako fabulousnevjerojatan hairdlaka,
127
309000
3000
i pitali ovog državnika jednako fantastične kose,
05:27
(LaughterSmijeh)
128
312000
3000
(Smijeh)
05:30
"TomTom, what should I say?"
129
315000
2000
"Tome, kako bih trebao govoriti?"
05:32
He'dOn bi say, "Well, in my day, mostnajviše people throvethrove,
130
317000
2000
On bi vam rekao: "Pa, u moje vrijeme većina je ljudi koristila "throve",
05:34
but some thrivedrazvijalo."
131
319000
3000
ali neki su koristili "thrived".
05:37
So now what I'm just going to showpokazati you is rawsirov datapodaci.
132
322000
2000
Sad ću vam pokazati samo sirove podatke.
05:39
Two rowsredaka from this tablestol of two billionmilijardi entriesunosi.
133
324000
4000
Dva reda iz ove tablice od dvije milijarde unosa.
05:43
What you're seeingvidim is yeargodina by yeargodina frequencyfrekvencija
134
328000
2000
Sada gledate učestalost godinu za godinom
05:45
of "thrivedrazvijalo" and "throvethrove" over time.
135
330000
3000
korištenja "thrived" i "throve" kroz vrijeme.
05:49
Now this is just two
136
334000
2000
Dakle, to su samo dva reda
05:51
out of two billionmilijardi rowsredaka.
137
336000
3000
od dvije milijarde redova.
05:54
So the entirečitav datapodaci setset
138
339000
2000
Ukupan skup podataka
05:56
is a billionmilijardi timesputa more awesomesuper than this slideklizanje.
139
341000
3000
milijardu je puta fenomenalniji od ovog slajda.
05:59
(LaughterSmijeh)
140
344000
2000
(Smijeh)
06:01
(ApplausePljesak)
141
346000
4000
(Pljesak)
06:05
JMJM: Now there are manymnogi other picturesSlike that are worthvrijedan 500 billionmilijardi wordsriječi.
142
350000
2000
JM: Postoji mnogo drugih slika koje vrijede 500 milijardi riječi.
06:07
For instanceprimjer, this one.
143
352000
2000
Na primjer, ova ovdje.
06:09
If you just take influenzainfluenca,
144
354000
2000
Ako uzmete samo gripu,
06:11
you will see peaksvrhova at the time where you knewznao
145
356000
2000
vidjet ćete vrhove u vrijeme za koje znate
06:13
bigvelika flugripa epidemicsepidemije were killingubijanje people around the globeGlobus.
146
358000
3000
da su velike epidemije tada ubijale ljude u cijelom svijetu.
06:16
ELAELA: If you were not yetjoš convinceduvjeren,
147
361000
3000
ELA: Ako vam treba još dokaza,
06:19
seamore levelsrazina are risingrastući,
148
364000
2000
diže se razina mora,
06:21
so is atmosphericatmosferski COCO2 and globalglobalno temperaturetemperatura.
149
366000
3000
kao i CO2 i temperatura u svijetu.
06:24
JMJM: You mightmoć alsotakođer want to have a look at this particularposebno n-gramn-gram,
150
369000
3000
JM: Možda ne bi bilo loše da pogledate i ovaj konkretni n-gram,
06:27
and that's to tell NietzscheNietzsche that God is not deadmrtav,
151
372000
3000
koji govori Nietzscheu da Bog nije mrtav,
06:30
althoughiako you mightmoć agreesložiti that he mightmoć need a better publicistpublicista.
152
375000
3000
iako se možda slažete da bi mu trebao bolji izdavač.
06:33
(LaughterSmijeh)
153
378000
2000
(Smijeh)
06:35
ELAELA: You can get at some prettyprilično abstractsažetak conceptspojmovi with this sortvrsta of thing.
154
380000
3000
ELA: Na ovaj način možete dobiti prilično apstraktne koncepte.
06:38
For instanceprimjer, let me tell you the historypovijest
155
383000
2000
Na primjer, ispričat ću vam priču
06:40
of the yeargodina 1950.
156
385000
2000
o 1950. godini.
06:42
Prettylijep much for the vastogroman majorityvećina of historypovijest,
157
387000
2000
Veliki dio povijesti,
06:44
no one gavedali a damnproklet about 1950.
158
389000
2000
nikoga nije bilo briga za 1950. godinu.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
1700. godine, 1800., 1900.,
06:48
no one caredmario.
160
393000
3000
nikoga nije bilo briga.
06:52
ThroughKroz the 30s and 40s,
161
397000
2000
30-ih i 40-ih godina,
06:54
no one caredmario.
162
399000
2000
nikoga nije bilo briga.
06:56
SuddenlyOdjednom, in the mid-sredina40s,
163
401000
2000
Odjednom, sredinom 40-ih,
06:58
there startedpočeo to be a buzzBuzz.
164
403000
2000
počelo se brujati o tome.
07:00
People realizedshvatio that 1950 was going to happendogoditi se,
165
405000
2000
Ljudi su shvatili da će doći 1950. godina
07:02
and it could be bigvelika.
166
407000
2000
i da bi mogla biti važna.
07:04
(LaughterSmijeh)
167
409000
3000
(Smijeh)
07:07
But nothing got people interestedzainteresiran in 1950
168
412000
3000
Ali ništa nije ljude zainteresiralo za 1950. godinu
07:10
like the yeargodina 1950.
169
415000
3000
kao 1950. godina.
07:13
(LaughterSmijeh)
170
418000
3000
(Smijeh)
07:16
People were walkinghodanje around obsessedopsjednut.
171
421000
2000
Ljudi su hodali uokolo opsjednuti.
07:18
They couldn'tne mogu stop talkingkoji govori
172
423000
2000
Nisu mogli prestati govoriti
07:20
about all the things they did in 1950,
173
425000
3000
o svim stvarima koje su učinili 1950. godine,
07:23
all the things they were planningplaniranje to do in 1950,
174
428000
3000
o svim stvarima koje planiraju učiniti 1950. godine,
07:26
all the dreamssnovi of what they wanted to accomplishostvariti in 1950.
175
431000
5000
o svim snovima koje žele ostvariti 1950. godine.
07:31
In factčinjenica, 1950 was so fascinatingfascinantan
176
436000
2000
Zapravo, 1950. godina bila je toliko fascinantna
07:33
that for yearsgodina thereafterNakon toga,
177
438000
2000
da su i godinama kasnije
07:35
people just keptčuva talkingkoji govori about all the amazingnevjerojatan things that happeneddogodilo,
178
440000
3000
ljudi i dalje govorili o fantastičnim stvarima koje su se dogodile,
07:38
in '51, '52, '53.
179
443000
2000
'51., '52., '53.
07:40
FinallyKonačno in 1954,
180
445000
2000
Na kraju, 1954. godine,
07:42
someonenetko wokeprobudio up and realizedshvatio
181
447000
2000
netko se otrijeznio i shvatio
07:44
that 1950 had gottendobivši somewhatnešto passproćié.
182
449000
4000
da je 1950. godina postala passé.
07:48
(LaughterSmijeh)
183
453000
2000
(Smijeh)
07:50
And just like that, the bubblemjehurić burstprasak.
184
455000
2000
I tako se iznenada mjehurić rasprsnuo.
07:52
(LaughterSmijeh)
185
457000
2000
(Smijeh)
07:54
And the storypriča of 1950
186
459000
2000
Priča o 1950. godini
07:56
is the storypriča of everysvaki yeargodina that we have on recordsnimiti,
187
461000
2000
priča je o svakoj godini koju smo zabilježili,
07:58
with a little twisttwist, because now we'veimamo got these nicelijepo chartsljestvice.
188
463000
3000
s malom razlikom, jer sad imamo ove krasne grafove.
08:01
And because we have these nicelijepo chartsljestvice, we can measuremjera things.
189
466000
3000
A budući da imamo te krasne grafove, možemo mjeriti razne stvari.
08:04
We can say, "Well how fastbrzo does the bubblemjehurić burstprasak?"
190
469000
2000
Možemo pitati: "Koliko će se brzo mjehurić rasprsnuti?"
08:06
And it turnsokreti out that we can measuremjera that very preciselyprecizno.
191
471000
3000
Ispada da to možemo vrlo precizno izmjeriti.
08:09
EquationsJednadžbe were derivedizveden, graphsgrafikoni were producedizrađen,
192
474000
3000
Jednadžbe su se derivirale, grafovi su se crtali,
08:12
and the netneto resultproizlaziti
193
477000
2000
a ukupni rezultat
08:14
is that we find that the bubblemjehurić burstsizboji fasterbrže and fasterbrže
194
479000
3000
jest taj da smo otkrili da se mjehurić rasprsne sve brže
08:17
with eachsvaki passingpretjecanje yeargodina.
195
482000
2000
sa svakom godinom koja prođe.
08:19
We are losinggubljenje interestinteres in the pastprošlost more rapidlybrzo.
196
484000
5000
Sve brže gubimo zanimanje za prošlost.
08:24
JMJM: Now a little piecekomad of careerkarijera advicesavjet.
197
489000
2000
JM: A sad mali savjet o odabiru karijere.
08:26
So for those of you who seektražiti to be famouspoznat,
198
491000
2000
Oni među vama koji žele biti slavni
08:28
we can learnnaučiti from the 25 mostnajviše famouspoznat politicalpolitički figuresfigure,
199
493000
2000
mogu ponešto naučiti od 25 najpoznatijih političkih ličnosti,
08:30
authorsautori, actorsglumci and so on.
200
495000
2000
pisaca, glumaca i drugih.
08:32
So if you want to becomepostati famouspoznat earlyrano on, you should be an actorglumac,
201
497000
3000
Dakle, ako želite rano postati slavni, trebate postati glumac
08:35
because then fameslava startspočinje risingrastući by the endkraj of your 20s --
202
500000
2000
jer tada postajete slavni do kraja svojih 20-ih godina --
08:37
you're still youngmladi, it's really great.
203
502000
2000
još uvijek ste mladi i to je odlično.
08:39
Now if you can wait a little bitbit, you should be an authorAutor,
204
504000
2000
Ako možete malo čekati, trebali biste biti pisac
08:41
because then you riseustati to very great heightsvisine,
205
506000
2000
jer tada se možete vrlo visoko uzdignuti,
08:43
like MarkMark TwainTwain, for instanceprimjer: extremelykrajnje famouspoznat.
206
508000
2000
poput primjerice Marka Twaina, on je bio zaista slavan.
08:45
But if you want to reachdohvatiti the very topvrh,
207
510000
2000
Ali ako želite dosegnuti sam vrh,
08:47
you should delayodgoditi gratificationzadovoljenje
208
512000
2000
trebali biste odgoditi zadovoljstvo
08:49
and, of coursenaravno, becomepostati a politicianpolitičar.
209
514000
2000
i, naravno, postati političar.
08:51
So here you will becomepostati famouspoznat by the endkraj of your 50s,
210
516000
2000
U tom ćete slučaju postati poznati do kraja svojih 50-ih godina,
08:53
and becomepostati very, very famouspoznat afterwardposlije.
211
518000
2000
i ostati vrlo, vrlo poznati nakon toga.
08:55
So scientistsznanstvenici alsotakođer tendskloni to get famouspoznat when they're much olderstariji.
212
520000
3000
Znanstvenici uglavnom, isto tako, postaju poznati kad ostare.
08:58
Like for instanceprimjer, biologistsbiolozi and physicsfizika
213
523000
2000
Biolozi i fizičari, primjerice,
09:00
tendskloni to be almostskoro as famouspoznat as actorsglumci.
214
525000
2000
znaju biti gotovo jednako slavni kao i glumci.
09:02
One mistakepogreška you should not do is becomepostati a mathematicianmatematičar.
215
527000
3000
Trebate izbjeći samo jednu pogrešku - da postanete matematičar.
09:05
(LaughterSmijeh)
216
530000
2000
(Smijeh)
09:07
If you do that,
217
532000
2000
Ako to učinite,
09:09
you mightmoć think, "Oh great. I'm going to do my bestnajbolje work when I'm in my 20s."
218
534000
3000
možda ćete pomisliti: "Odlično, u 20-ima ću napraviti napraviti svoje najbolje radove."
09:12
But guessnagađati what, nobodynitko will really carebriga.
219
537000
2000
No, znate što, nikoga neće biti briga.
09:14
(LaughterSmijeh)
220
539000
3000
(Smijeh)
09:17
ELAELA: There are more soberingtrežnjenje notesbilješke
221
542000
2000
ELA: Postoje i neke ozbiljnije činjenice
09:19
amongmeđu the n-gramsn-grama.
222
544000
2000
među n-gramima.
09:21
For instanceprimjer, here'sevo the trajectoryputanja of MarcMarc ChagallChagall,
223
546000
2000
Primjerice, evo putanje Marca Chagalla,
09:23
an artistumjetnik bornrođen in 1887.
224
548000
2000
umjetnika rođenog 1887. godine.
09:25
And this looksizgled like the normalnormalan trajectoryputanja of a famouspoznat personosoba.
225
550000
3000
Ovo izgleda kao normalna putanja poznate osobe.
09:28
He getsdobiva more and more and more famouspoznat,
226
553000
4000
Postaje sve poznatiji i poznatiji,
09:32
exceptosim if you look in Germannjemački.
227
557000
2000
osim ako gledate za njemački jezik.
09:34
If you look in Germannjemački, you see something completelypotpuno bizarrebizarno,
228
559000
2000
Ako gledate za njemački, vidjet ćete nešto vrlo bizarno,
09:36
something you prettyprilično much never see,
229
561000
2000
nešto što gotovo nikad ne vidite,
09:38
whichkoji is he becomespostaje extremelykrajnje famouspoznat
230
563000
2000
a to je da postaje iznimno poznat,
09:40
and then all of a suddennaglo plummetsolova,
231
565000
2000
a nakon toga mu popularnost iznenada padne,
09:42
going throughkroz a nadirNadir betweenizmeđu 1933 and 1945,
232
567000
3000
pri čemu su najniže točke bile između 1933. i 1945. godine,
09:45
before reboundingskokova afterwardposlije.
233
570000
3000
nakon čega mu se opet vratila popularnost.
09:48
And of coursenaravno, what we're seeingvidim
234
573000
2000
Naravno, on što zapravo vidimo
09:50
is the factčinjenica MarcMarc ChagallChagall was a JewishŽidovski artistumjetnik
235
575000
3000
jest činjenica da je Marc Chagall bio židovski umjetnik
09:53
in NaziNacističke GermanyNjemačka.
236
578000
2000
u nacističkoj Njemačkoj.
09:55
Now these signalssignali
237
580000
2000
Ovi su signali
09:57
are actuallyzapravo so strongjak
238
582000
2000
zapravo toliko jaki
09:59
that we don't need to know that someonenetko was censoredcenzurirani.
239
584000
3000
da ne trebamo ni znati da su nekoga cenzurirali.
10:02
We can actuallyzapravo figurelik it out
240
587000
2000
Zapravo to možemo zaključiti
10:04
usingkoristeći really basicosnovni signalsignal processingobrada.
241
589000
2000
koristeći osnovnu obradu znakova.
10:06
Here'sOvdje je a simplejednostavan way to do it.
242
591000
2000
Evo jednostavnog načina kako to učiniti.
10:08
Well, a reasonablerazuman expectationočekivanja
243
593000
2000
Razumno je za očekivati
10:10
is that somebody'snetko je fameslava in a givendan periodrazdoblje of time
244
595000
2000
da će nečija slava u određenom razdoblju
10:12
should be roughlygrubo the averageprosječan of theirnjihov fameslava before
245
597000
2000
biti otprilike prosjek slave te osobe
10:14
and theirnjihov fameslava after.
246
599000
2000
prije i nakon tog razdoblja.
10:16
So that's sortvrsta of what we expectočekivati.
247
601000
2000
To je otprilike ono što mi očekujemo.
10:18
And we compareusporediti that to the fameslava that we observepromatrati.
248
603000
3000
I to uspoređujemo sa slavom koju promatramo.
10:21
And we just dividepodijeliti one by the other
249
606000
2000
Samo podijelimo jedno drugim
10:23
to produceproizvoditi something we call a suppressionsuzbijanje indexindeks.
250
608000
2000
kako bismo dobili takozvani indeks zabrane.
10:25
If the suppressionsuzbijanje indexindeks is very, very, very smallmali,
251
610000
3000
Ako je indeks zabrane vrlo, vrlo, vrlo malen,
10:28
then you very well mightmoć be beingbiće suppressedpotisnut.
252
613000
2000
onda ste vrlo vjerojatno bili zabranjeni.
10:30
If it's very largeveliki, maybe you're benefitingkorist from propagandapropagande.
253
615000
3000
Ako je vrlo velik, možda profitirate od propagande.
10:34
JMJM: Now you can actuallyzapravo look at
254
619000
2000
JM: Zapravo možete promatrati
10:36
the distributiondistribucija of suppressionsuzbijanje indexesindeksi over wholečitav populationspopulacije.
255
621000
3000
raspored indeksa zabrane unutar populacija.
10:39
So for instanceprimjer, here --
256
624000
2000
Na primjer, ovdje --
10:41
this suppressionsuzbijanje indexindeks is for 5,000 people
257
626000
2000
ovo je indeks zabrane za 5.000 ljudi
10:43
pickedizabran in Englishengleski booksknjige where there's no knownznan suppressionsuzbijanje --
258
628000
2000
odabranih u engleskim knjigama u kojima nije zabilježeno zabranjivanje --
10:45
it would be like this, basicallyu osnovi tightlyčvrsto centeredcentrirano on one.
259
630000
2000
bilo bi ovako, usko centrirano oko jednog.
10:47
What you expectočekivati is basicallyu osnovi what you observepromatrati.
260
632000
2000
Ono što očekujete u biti je ono što i vidite.
10:49
This is distributiondistribucija as seenvidio in GermanyNjemačka --
261
634000
2000
Ovo je raspored za Njemačku --
10:51
very differentdrugačiji, it's shiftedpomaknut to the left.
262
636000
2000
vrlo različito, pomaknuto je ulijevo.
10:53
People talkedRazgovarao about it twicedvaput lessmanje as it should have been.
263
638000
3000
Ljudi su o tome razgovarali upola manje nego što su trebali.
10:56
But much more importantlyvažnije, the distributiondistribucija is much wideršire.
264
641000
2000
No, mnogo je važnije da je raspored širi.
10:58
There are manymnogi people who endkraj up on the fardaleko left on this distributiondistribucija
265
643000
3000
Ima mnogo ljudi koji su sasvim na lijevoj strani rasporeda
11:01
who are talkedRazgovarao about 10 timesputa fewermanje than they should have been.
266
646000
3000
i o kojima se govori 10 puta manje nego što bi se trebalo.
11:04
But then alsotakođer manymnogi people on the fardaleko right
267
649000
2000
Ali isto tako ima mnogo ljudi na sasvim desnoj strani
11:06
who seemčiniti se to benefitkorist from propagandapropagande.
268
651000
2000
koji, izgleda, profitiraju od propagande.
11:08
This pictureslika is the hallmarkzaštitni znak of censorshipcenzura in the bookrezervirati recordsnimiti.
269
653000
3000
Ova je slika glavni simbol cenzure u knjigama.
11:11
ELAELA: So culturomicsculturomics
270
656000
2000
ELA: Dakle, kulturomika
11:13
is what we call this methodnačin.
271
658000
2000
jest ime koje smo dali ovoj metodi.
11:15
It's kindljubazan of like genomicsgenomika.
272
660000
2000
Nalikuje na genomiku.
11:17
ExceptOsim genomicsgenomika is a lensleće on biologybiologija
273
662000
2000
Osim što je genomika pogled na biologiju,
11:19
throughkroz the windowprozor of the sequenceslijed of basesbaze in the humanljudski genomegenom.
274
664000
3000
pogled na slijed baza u ljudskom genomu.
11:22
CulturomicsCulturomics is similarsličan.
275
667000
2000
Kulturomika je slična tome.
11:24
It's the applicationprimjena of massive-scalemasovno datapodaci collectionkolekcija analysisanaliza
276
669000
3000
To je primjena analize ogromnog skupa podataka
11:27
to the studystudija of humanljudski cultureKultura.
277
672000
2000
na proučavanje ljudske kulture.
11:29
Here, insteadumjesto of throughkroz the lensleće of a genomegenom,
278
674000
2000
Ovdje, umjesto da promatramo genom,
11:31
throughkroz the lensleće of digitizedDigitalizirani pieceskomada of the historicalpovijesni recordsnimiti.
279
676000
3000
promatramo digitalizirane dijelove povijesnih zapisa.
11:34
The great thing about culturomicsculturomics
280
679000
2000
Ono što je odlično kod kulturomike
11:36
is that everyonesvatko can do it.
281
681000
2000
jest to da se svi mogu njome baviti.
11:38
Why can everyonesvatko do it?
282
683000
2000
Zašto se svi mogu njome baviti?
11:40
EveryoneSvi can do it because threetri guys,
283
685000
2000
Svi se mogu njome baviti jer su tri tipa,
11:42
JonJon OrwantOrwant, MattMatt GraySiva and Will BrockmanBrockman over at GoogleGoogle,
284
687000
3000
Jon Orwant, Matt Gray i Will Brockman iz Googlea
11:45
saw the prototypeprototip of the NgramNgram ViewerPreglednik,
285
690000
2000
vidjeli prototip preglednika Ngram
11:47
and they said, "This is so funzabava.
286
692000
2000
i rekli: "Ovo je tako zabavno.
11:49
We have to make this availabledostupno for people."
287
694000
3000
Moramo ljudima omogućiti pristup tome."
11:52
So in two weeksTjedni flatravan -- the two weeksTjedni before our paperpapir camedošao out --
288
697000
2000
Za samo dva tjedna -- dva tjedna prije nego nam je objavljen članak --
11:54
they codedkodirani up a versionverzija of the NgramNgram ViewerPreglednik for the generalgeneral publicjavnost.
289
699000
3000
iskodirali su verziju pregledika Ngram za javnost.
11:57
And so you too can typetip in any wordriječ or phrasefraza that you're interestedzainteresiran in
290
702000
3000
Tako da i vi možete unijeti bilo koju riječ ili izraz koji vas zanima
12:00
and see its n-gramn-gram immediatelyodmah --
291
705000
2000
i odmah vidjeti njegove n-grame --
12:02
alsotakođer browsePregledaj examplesprimjeri of all the variousraznovrstan booksknjige
292
707000
2000
isto tako možete pregledavati primjere iz svih knjiga
12:04
in whichkoji your n-gramn-gram appearsČini.
293
709000
2000
u kojima se pojavljuje vaš n-gram.
12:06
JMJM: Now this was used over a millionmilijuna timesputa on the first day,
294
711000
2000
JM: Ovaj je preglednik korišten više od milijun puta prvog dana,
12:08
and this is really the bestnajbolje of all the queriesupiti.
295
713000
2000
i ovo je zapravo najbolji od svih upita.
12:10
So people want to be theirnjihov bestnajbolje, put theirnjihov bestnajbolje footnoga forwardnaprijed.
296
715000
3000
Ljudi žele dati sve od sebe, pokazati se u najboljem svijetlu.
12:13
But it turnsokreti out in the 18thth centurystoljeće, people didn't really carebriga about that at all.
297
718000
3000
Ali ispada da u 18. stoljeću ljudima uopće nije bilo stalo do toga.
12:16
They didn't want to be theirnjihov bestnajbolje, they wanted to be theirnjihov beftbeft.
298
721000
3000
Nisu željeli dati sve od sebe, željeli su dati fve od sebe.
12:19
So what happeneddogodilo is, of coursenaravno, this is just a mistakepogreška.
299
724000
3000
Naravno, ovdje se radi samo o pogrešci.
12:22
It's not that strovetrudio for mediocrityosrednjost,
300
727000
2000
Nije da su težili osrednjosti,
12:24
it's just that the S used to be writtennapisan differentlyrazličito, kindljubazan of like an F.
301
729000
3000
već se S prije pisao drugačije, pomalo nalik na F.
12:27
Now of coursenaravno, GoogleGoogle didn't pickodabrati this up at the time,
302
732000
3000
Naravno, Google to nije prepoznao
12:30
so we reportedizvijestio this in the scienceznanost articlečlanak that we wrotenapisao.
303
735000
3000
i to smo napomenuli u znanstvenom članku koji smo napisali.
12:33
But it turnsokreti out this is just a reminderpodsjetnik
304
738000
2000
No, ispada da je ovo samo podsjetnik da,
12:35
that, althoughiako this is a lot of funzabava,
305
740000
2000
iako je ovo vrlo zabavno,
12:37
when you interpretinterpretirati these graphsgrafikoni, you have to be very carefulpažljiv,
306
742000
2000
kad tumačite ove grafove, morate biti vrlo oprezni
12:39
and you have to adoptposvojiti the basebaza standardsstandardi in the sciencesznanosti.
307
744000
3000
i morate usvojiti ove temeljne znastvene standarde.
12:42
ELAELA: People have been usingkoristeći this for all kindsvrste of funzabava purposessvrhe.
308
747000
3000
ELA: Ljudi ovo koriste za razne zabavne namjene.
12:45
(LaughterSmijeh)
309
750000
7000
(Smijeh)
12:52
ActuallyZapravo, we're not going to have to talk,
310
757000
2000
Zapravo, ne moramo ni govoriti,
12:54
we're just going to showpokazati you all the slidesslajdova and remainostati silentnijem.
311
759000
3000
samo ćemo vam pokazati sve slajdove i šutjeti.
12:57
This personosoba was interestedzainteresiran in the historypovijest of frustrationfrustracija.
312
762000
3000
Ovu osobu je zanimala povijest frustracije.
13:00
There's variousraznovrstan typesvrste of frustrationfrustracija.
313
765000
3000
Postoje različite vrste frustracija.
13:03
If you stubkućanstava your toenožni prst, that's a one A "arghArgh."
314
768000
3000
Kad se udarite u nožni prst, to je "argh" s jednim A.
13:06
If the planetplaneta EarthZemlja is annihilatedviše ne postoji by the VogonsVolgoni
315
771000
2000
Ako plant Zemlju unište Vogonci
13:08
to make roomsoba for an interstellarmeđuzvjezdani bypasszaobići,
316
773000
2000
kako bi napravili mjesta za međuzvjezdanu zaobilaznicu,
13:10
that's an eightosam A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
to je "aaaaaaaargh" s 8 A-ova.
13:12
This personosoba studiesstudije all the "arghsarghs,"
318
777000
2000
Ova osoba proučava sve "arghove",
13:14
from one throughkroz eightosam A'sČlana.
319
779000
2000
od jednog do 8 A-ova.
13:16
And it turnsokreti out
320
781000
2000
Ispada da su
13:18
that the less-frequentmanje često "arghsarghs"
321
783000
2000
manje učestali "arghovi"
13:20
are, of coursenaravno, the onesone that correspondodgovaraju to things that are more frustratingfrustrirajuće --
322
785000
3000
naravno, oni koji odgovaraju stvarima koje izazivaju veću frustraciju --
13:23
exceptosim, oddlyneobično, in the earlyrano 80s.
323
788000
3000
osim, čudno, početkom 80-ih.
13:26
We think that mightmoć have something to do with ReaganReagan.
324
791000
2000
Mislimo da to možda ima veze s Reaganom.
13:28
(LaughterSmijeh)
325
793000
2000
(Smijeh)
13:30
JMJM: There are manymnogi usagesuzance of this datapodaci,
326
795000
3000
JM: Ovi se podaci mogu koristiti za razne namjene,
13:33
but the bottomdno linecrta is that the historicalpovijesni recordsnimiti is beingbiće digitizedDigitalizirani.
327
798000
3000
ali ono što je bitno jest da se povijesni zapisi digitaliziraju.
13:36
GoogleGoogle has startedpočeo to digitizedigitalizirati 15 millionmilijuna booksknjige.
328
801000
2000
Google je počeo digitalizirati 15 milijuna knjiga.
13:38
That's 12 percentposto of all the booksknjige that have ever been publishedObjavljeno.
329
803000
2000
To je 12 posto svih knjiga koje su ikad izdane.
13:40
It's a sizableznatan chunkkomad of humanljudski cultureKultura.
330
805000
3000
To je povelik dio ljudske kulture.
13:43
There's much more in cultureKultura: there's manuscriptsrukopisi, there newspapersnovine,
331
808000
3000
U kulturi ima još mnogo toga: rukopisi, novine,
13:46
there's things that are not texttekst, like artumjetnost and paintingsslike.
332
811000
2000
postoje stvari koje nisu tekst, poput umjetnosti i slika.
13:48
These all happendogoditi se to be on our computersračunala,
333
813000
2000
To će sve biti na našim računalima,
13:50
on computersračunala acrosspreko the worldsvijet.
334
815000
2000
na računalima u cijelome svijetu.
13:52
And when that happensdogađa se, that will transformtransformirati the way we have
335
817000
3000
A kad se to dogodi, promijenit će se način na koji smo
13:55
to understandrazumjeti our pastprošlost, our presentpredstaviti and humanljudski cultureKultura.
336
820000
2000
shvaćali svoju prošlost, svoju sadašnjost i ljudsku kulturu.
13:57
Thank you very much.
337
822000
2000
Hvala vam puno.
13:59
(ApplausePljesak)
338
824000
3000
(Pljesak)
Translated by Katarina Smetko
Reviewed by Zlatko Smetisko

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com