ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

Čo sme sa naučili z 5 miliónov kníh

Filmed:
2,049,453 views

Hrali ste sa už s Ngram Viewer od Google Labs? Je to návykový nástroj, ktorý Vám umožňuje vyhľadávať slová a idei v databáze 5 miliónov kníh z rôznych storočí. Erez LIeberman Aiden a Jean-Baptiste Michel ukazujú, ako funguje, a tiež niekoľko z prekvapujúcich vecí, ktoré sa možno naučiť z 500 miliárd slov.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
ErezErez LiebermanLieberman AidenAiden: EveryoneVšetci knowsvie
0
0
2000
Erez Lieberman Aiden: Každý vie,
00:17
that a pictureobrázok is worthhodnota a thousandtisíc wordsslová.
1
2000
3000
že obrázok je hoden tisíc slov.
00:22
But we at HarvardHarvard
2
7000
2000
Ale my na Harvarde
00:24
were wonderingpremýšľal if this was really truepravdivý.
3
9000
3000
sme sa zamysleli, či je to naozaj pravda.
00:27
(LaughterSmiech)
4
12000
2000
(Smiech)
00:29
So we assembledzmontovaný a teamtím of expertsodborníci,
5
14000
4000
Zhromaždili sme teda tím odborníkov
00:33
spanningklenout HarvardHarvard, MITMIT,
6
18000
2000
z Harvardu, MIT,
00:35
The AmericanAmerický HeritageDedičstvo DictionarySlovník, The EncyclopediaEncyklopédia BritannicaBritannica
7
20000
3000
The American Heritage Dictionary, Encyklopédie Britannica
00:38
and even our proudhrdý sponsorssponzori,
8
23000
2000
a aj od našich hrdých sponzorov
00:40
the GoogleGoogle.
9
25000
3000
z Googlu.
00:43
And we cogitatedcogitated about this
10
28000
2000
A uvažovali sme o tom
00:45
for about fourštyri yearsleta.
11
30000
2000
asi štyri roky.
00:47
And we cameprišiel to a startlingprekvapujúce conclusionzáver.
12
32000
5000
A došli sme k prekvapujúcemu záveru.
00:52
LadiesDámy and gentlemenpáni, a pictureobrázok is not worthhodnota a thousandtisíc wordsslová.
13
37000
3000
Dámy a páni, obrázok nie je hoden tísíc slov.
00:55
In factskutočnosť, we foundnájdených some picturesfotografie
14
40000
2000
V skutočnosti sme našli obrázky
00:57
that are worthhodnota 500 billionmiliardy wordsslová.
15
42000
5000
hodné 500 miliárd slov.
01:02
Jean-BaptisteJean-Baptiste MichelMichel: So how did we get to this conclusionzáver?
16
47000
2000
Jean-Baptiste Michel: Takže, ako sme dospeli k tomuto záveru?
01:04
So ErezErez and I were thinkingpremýšľanie about waysspôsoby
17
49000
2000
Erez a ja sme premýšľali o cestách
01:06
to get a bigveľký pictureobrázok of humančlovek culturekultúra
18
51000
2000
k získaniu celistvého obrazu o ľudskej kultúre
01:08
and humančlovek historyhistórie: changezmena over time.
19
53000
3000
a ľudskej histórii: ich zmenách v priebehu času.
01:11
So manyveľa booksknihy actuallyvlastne have been writtenpísaný over the yearsleta.
20
56000
2000
Tak veľa kníh bolo napísaných za všetky tie roky.
01:13
So we were thinkingpremýšľanie, well the bestnajlepší way to learnučiť sa from them
21
58000
2000
Takže sme si pomysleli: najlepší spôsob, ako sa z nich poučiť,
01:15
is to readprečítať all of these millionsmilióny of booksknihy.
22
60000
2000
je prečítať všetky tieto milióny kníh.
01:17
Now of coursekurz, if there's a scalemierka for how awesomeúžasné that is,
23
62000
3000
Samozrejme, ak si predstavíme mieru úžasnosti niečoho takého,
01:20
that has to rankhodnosť extremelynesmierne, extremelynesmierne highvysoký.
24
65000
3000
toto musí bodovať veľmi, veľmi vysoko.
01:23
Now the problemproblém is there's an X-axisOsi x for that,
25
68000
2000
Problém je, že k tomu prislúcha aj X-ová os -
01:25
whichktorý is the practicalpraktický axisos.
26
70000
2000
os praktičnosti.
01:27
This is very, very lownízky.
27
72000
2000
Toto je veľmi, veľmi nízko.
01:29
(ApplausePotlesk)
28
74000
3000
(Potlesk)
01:32
Now people tendsklon to use an alternativealternatívne approachprístup,
29
77000
3000
Ľudia zvyknú používať alternatívny prístup,
01:35
whichktorý is to take a fewmálo sourceszdroje and readprečítať them very carefullyopatrne.
30
80000
2000
vyberú zopár prameňov a prečítajú ich veľmi pozorne.
01:37
This is extremelynesmierne practicalpraktický, but not so awesomeúžasné.
31
82000
2000
Toto je veľmi praktické, ale nie až také úžasné.
01:39
What you really want to do
32
84000
3000
Čo naozaj chcete dosiahnuť,
01:42
is to get to the awesomeúžasné yetešte practicalpraktický partčasť of this spacepriestor.
33
87000
3000
je umiestniť sa do úžasnej, ešte však praktickej časti tohto priestoru.
01:45
So it turnszákruty out there was a companyspoločnosť acrossnaprieč the riverrieka calledvolal GoogleGoogle
34
90000
3000
Tak sa stalo, že kúsok cez rieku bola spoločnosť nazývaná Google,
01:48
who had startedzahájená a digitizationdigitalizácie projectprojekt a fewmálo yearsleta back
35
93000
2000
ktorá pred pár rokmi začala digitalizačný projekt,
01:50
that mightsila just enableumožniť this approachprístup.
36
95000
2000
ktorý by akurát mohol umožniť takýto prístup.
01:52
They have digitizedDigitalizovaná millionsmilióny of booksknihy.
37
97000
2000
Digitalizovali milióny kníh.
01:54
So what that meansprostriedky is, one could use computationalvýpočtovej methodsmetódy
38
99000
3000
To znamená, že je možné použiť výpočtové metódy
01:57
to readprečítať all of the booksknihy in a clickcvaknutie of a buttongombík.
39
102000
2000
na čítanie všetkých týchto kníh stlačením klávesy.
01:59
That's very practicalpraktický and extremelynesmierne awesomeúžasné.
40
104000
3000
To je veľmi praktické a extrémne úžasné.
02:03
ELAELA: Let me tell you a little bittrocha about where booksknihy come from.
41
108000
2000
ELA: Dovoľte mi rozpovedať vám o tom, odkiaľ knihy prichádzajú.
02:05
SinceOd time immemorialprastarý, there have been authorsautori.
42
110000
3000
Od nepamäti existovali spisovatelia.
02:08
These authorsautori have been strivingusilovania to writezapísať booksknihy.
43
113000
3000
Títo spisovatelia sa snažili písať kníhy.
02:11
And this becamesa stal considerablyznačne easierľahšie
44
116000
2000
A to sa im významne zjednodušilo
02:13
with the developmentvývoj of the printingtlač presslis some centuriesstoročia agopred.
45
118000
2000
s rozvojom kníhtlače pred niekoľkými storočiami.
02:15
SinceOd then, the authorsautori have wonwon
46
120000
3000
Odvtedy sa spisovateľom podarilo,
02:18
on 129 millionmilión distinctzreteľný occasionsudalosti,
47
123000
2000
pri 129 miliónoch rôznych príležitostiach,
02:20
publishingpublikovanie booksknihy.
48
125000
2000
vydať knihu.
02:22
Now if those booksknihy are not loststratený to historyhistórie,
49
127000
2000
Ak sa tieto knihy nestratili v prúde času,
02:24
then they are somewhereniekam in a libraryknižnica,
50
129000
2000
potom sú niekde v nejakej knižnici,
02:26
and manyveľa of those booksknihy have been gettingzískavanie retrievedobnovený from the librariesknižnice
51
131000
3000
a mnoho z týchto kníh bolo získaných z týchto knižníc
02:29
and digitizedDigitalizovaná by GoogleGoogle,
52
134000
2000
a digitalizovaných v Google,
02:31
whichktorý has scannednaskenované 15 millionmilión booksknihy to datedátum.
53
136000
2000
ktorý doteraz oskenoval 15 miliónov kníh.
02:33
Now when GoogleGoogle digitizesdigitalizuje a bookkniha, they put it into a really nicepekný formatformát.
54
138000
3000
Keď Google digitalizuje knihu, uložia ju do ozaj pekného formátu.
02:36
Now we'vemy máme got the datadáta, plusplus we have metadatametadáta.
55
141000
2000
Máme dáta a navyše máme aj metadáta.
02:38
We have informationinformácie about things like where was it publishedpublikovaný,
56
143000
3000
Máme informácie o veciach ako je miesto vydania,
02:41
who was the authorautor, when was it publishedpublikovaný.
57
146000
2000
autor, obdobie vydania.
02:43
And what we do is go throughskrz all of those recordszáznamy
58
148000
3000
A naša činnosť potom spočíva v prehliadaní týchto záznamov
02:46
and excludevylúčiť everything that's not the highestnajvyššiu qualitykvalita datadáta.
59
151000
4000
a vylúčení všetkého, okrem dát najvyššej kvality.
02:50
What we're left with
60
155000
2000
Čo nám zostane,
02:52
is a collectionzbierka of fivepäť millionmilión booksknihy,
61
157000
3000
je súbor piatich miliónov kníh,
02:55
500 billionmiliardy wordsslová,
62
160000
3000
500 miliárd slov,
02:58
a stringpovrázok of charactersznaky a thousandtisíc timesdoba longerdlhšie
63
163000
2000
reťazec znakov tisíckrát dlhší
03:00
than the humančlovek genomegenóm --
64
165000
3000
než ľudský genóm --
03:03
a texttext whichktorý, when writtenpísaný out,
65
168000
2000
text, ktorý, ak by sme ho napísali,
03:05
would stretchnatiahnuť from here to the MoonMesiac and back
66
170000
2000
by sa tiahol odtiaľ na Mesiac a späť
03:07
10 timesdoba over --
67
172000
2000
10 krát --
03:09
a veritablenaozajstnú shardShard of our culturalkultúrne genomegenóm.
68
174000
4000
ozajstný úlomok nášho kultúrneho genómu.
03:13
Of coursekurz what we did
69
178000
2000
Samozrejme, čo sme urobili,
03:15
when facedtvárou v tvár with suchtaký outrageouspoburujúce hyperbolenadsázka ...
70
180000
3000
čeliac takejto hroznej hyperbole ...
03:18
(LaughterSmiech)
71
183000
2000
(Smiech)
03:20
was what any self-respectingself-rešpektovať researchersvedci
72
185000
3000
sme urobili to, čo
03:23
would have donehotový.
73
188000
3000
by býval urobil každý výskumník so štipkou sebaúcty.
03:26
We tookzobral a pagestrana out of XKCDXKCD,
74
191000
2000
Vybrali sme stránku z XKCD,
03:28
and we said, "StandStojan back.
75
193000
2000
a riekli, "Ustúp.
03:30
We're going to try scienceveda."
76
195000
2000
Ideme vyskúšať vedu."
03:32
(LaughterSmiech)
77
197000
2000
(Smiech)
03:34
JMJM: Now of coursekurz, we were thinkingpremýšľanie,
78
199000
2000
JM: Samozrejme, uvažovali sme,
03:36
well let's just first put the datadáta out there
79
201000
2000
skúsme my len najprv zverejniť dáta,
03:38
for people to do scienceveda to it.
80
203000
2000
pre ostatných nech si na tom robia vedu.
03:40
Now we're thinkingpremýšľanie, what datadáta can we releaseuvoľnenie?
81
205000
2000
A tak uvažujeme, ktoré dáta môžeme zverejniť?
03:42
Well of coursekurz, you want to take the booksknihy
82
207000
2000
Samozrejme, chcete vziať knihy
03:44
and releaseuvoľnenie the fullplne texttext of these fivepäť millionmilión booksknihy.
83
209000
2000
a vydať plný text týchto piatich miliónov kníh.
03:46
Now GoogleGoogle, and JonJon OrwantOrwant in particularkonkrétny,
84
211000
2000
Google a osobitne Jon Orwant,
03:48
told us a little equationrovnice that we should learnučiť sa.
85
213000
2000
nám ukázali malú rovnicu, ktorú sme sa museli naučiť.
03:50
So you have fivepäť millionmilión, that is, fivepäť millionmilión authorsautori
86
215000
3000
Vezmite päť miliónov kníh, to znamená päť miliónov autorov
03:53
and fivepäť millionmilión plaintiffsŽalobcovia is a massivemasívny lawsuitsúdny proces.
87
218000
3000
a päť miliónov žalobcov a máte masívny súdny proces.
03:56
So, althoughhoci that would be really, really awesomeúžasné,
88
221000
2000
Takže, aj keď by to bolo veľmi, veľmi úžasné,
03:58
again, that's extremelynesmierne, extremelynesmierne impracticalnepraktický.
89
223000
3000
opäť, extrémne, extrémne nepraktické.
04:01
(LaughterSmiech)
90
226000
2000
(Smiech)
04:03
Now again, we kinddruh of cavedustúpila in,
91
228000
2000
Opäť sme to svojim spôsobom vyriešili
04:05
and we did the very practicalpraktický approachprístup, whichktorý was a bittrocha lessmenej awesomeúžasné.
92
230000
3000
a zvolili sme veľmi praktický prístup, ktorý bol o kúsok menej úžasný.
04:08
We said, well insteadnamiesto of releasinguvoľnenie the fullplne texttext,
93
233000
2000
Povedali sme si, namiesto zverejnenia plného textu
04:10
we're going to releaseuvoľnenie statisticsštatistika about the booksknihy.
94
235000
2000
zverejníme štatistické informácie o knihách.
04:12
So take for instanceinštancie "A gleamzáblesk of happinessšťastie."
95
237000
2000
Napríklad "A gleam of happiness" ("Záblesk šťastia").
04:14
It's fourštyri wordsslová; we call that a four-gramštyri-gram.
96
239000
2000
To sú štyri slová: nazývame to štyr-gram.
04:16
We're going to tell you how manyveľa timesdoba a particularkonkrétny four-gramštyri-gram
97
241000
2000
Povieme vám, koľkokrát sa určitý štyr-gram
04:18
appearedobjavil in booksknihy in 1801, 1802, 1803,
98
243000
2000
objavuje v knihách v rokoch 1801, 1802, 1803,
04:20
all the way up to 2008.
99
245000
2000
až do roku 2008.
04:22
That givesposkytuje us a time seriesséria
100
247000
2000
To nám dáva časovú závislosť
04:24
of how frequentlyčasto this particularkonkrétny sentenceveta was used over time.
101
249000
2000
frekvencie použitia určitej vety v priebehu času.
04:26
We do that for all the wordsslová and phrasesfrázy that appearjaví in those booksknihy,
102
251000
3000
Urobíme to pre všetky slová a frázy, ktoré sa objavujú v týchto knihách
04:29
and that givesposkytuje us a bigveľký tablestôl of two billionmiliardy linesčiary
103
254000
3000
a to nám dáva veľkú tabuľku s dvoma miliardami riadkov,
04:32
that tell us about the way culturekultúra has been changingmeniace sa.
104
257000
2000
ktorá nám hovorí a cestách kultúrnych zmien.
04:34
ELAELA: So those two billionmiliardy linesčiary,
105
259000
2000
ELA: Teda tie dve miliardy riadkov,
04:36
we call them two billionmiliardy n-gramsn-gramov.
106
261000
2000
nazývame ich dve miliardy n-gramov.
04:38
What do they tell us?
107
263000
2000
Čo nám hovoria?
04:40
Well the individualjednotlivec n-gramsn-gramov measurezmerať culturalkultúrne trendstrendy.
108
265000
2000
Individuálne n-gramy sú mierou kultúrnych trendov.
04:42
Let me give you an examplepríklad.
109
267000
2000
Dovoľte mi uviesť vám jeden príklad.
04:44
Let's supposepredpokladať that I am thrivingprosperujúce,
110
269000
2000
Predpokladajme, že je mi skvele,
04:46
then tomorrowzajtra I want to tell you about how well I did.
111
271000
2000
a potom zajtra vám chcem povedať, ako dobre mi bolo.
04:48
And so I mightsila say, "YesterdayVčera, I throvethrove."
112
273000
3000
A teda by som mohol povedať "Včera som si voľkal."
04:51
AlternativelyAlternatívne, I could say, "YesterdayVčera, I thriveddarilo."
113
276000
3000
Alternatívne by som mohol povedať "Včara som sa tešil."
04:54
Well whichktorý one should I use?
114
279000
3000
Ktorý z nich by som mal použiť?
04:57
How to know?
115
282000
2000
Ako sa rozhodnúť?
04:59
As of about sixšesť monthsmesiaca agopred,
116
284000
2000
Už približne šesť mesiacov
05:01
the statestáť of the artumenie in this fieldlúka
117
286000
2000
špičkový prístup v tejto oblasti
05:03
is that you would, for instanceinštancie,
118
288000
2000
je, že by ste, napríklad,
05:05
go up to the followingnasledujúce psychologistpsychológ with fabulousbáječný hairvlasy,
119
290000
2000
navštívili nasledujúceho psychológa s úžasným účesom,
05:07
and you'dby si say,
120
292000
2000
a riekli by ste,
05:09
"SteveSteve, you're an expertexpert on the irregularnepravidelný verbsslovesá.
121
294000
3000
"Steve, vy ste expert na nepravidelné slovesá.
05:12
What should I do?"
122
297000
2000
Čo by som mal robiť?"
05:14
And he'dmal tell you, "Well mostväčšina people say thriveddarilo,
123
299000
2000
A on by vám povedal, "Väčšina ľudí hovorí tešiť sa,
05:16
but some people say throvethrove."
124
301000
3000
ale niektorí ľudia hovoria voľkať si."
05:19
And you alsotaktiež knewvedel, more or lessmenej,
125
304000
2000
A tiež ste vedeli, viac-menej,
05:21
that if you were to go back in time 200 yearsleta
126
306000
3000
že, ak by ste sa presunuli späť v čase o 200 rokov
05:24
and askopýtať sa the followingnasledujúce statesmanštátnik with equallyrovnako fabulousbáječný hairvlasy,
127
309000
3000
a opýtali sa nasledujúceho štátnika s rovnako úžasným účesom:
05:27
(LaughterSmiech)
128
312000
3000
(Smiech)
05:30
"TomTom, what should I say?"
129
315000
2000
"Tom, čo by som mal povedať?"
05:32
He'dOn by say, "Well, in my day, mostväčšina people throvethrove,
130
317000
2000
On by odpovedal, "Za mojich čias, väčšina ľudí používala voľkať si,
05:34
but some thriveddarilo."
131
319000
3000
no niektorí používali tešiť sa."
05:37
So now what I'm just going to showšou you is rawsurový datadáta.
132
322000
2000
Takže to, čo vám teraz ukážem sú iba holé dáta.
05:39
Two rowsriadky from this tablestôl of two billionmiliardy entrieszápisy.
133
324000
4000
Dva riadky z tabuľky s dvoma miliardami záznamov.
05:43
What you're seeingvidenie is yearrok by yearrok frequencykmitočet
134
328000
2000
To, čo vidíte je frekvencia výskytu, rok za rokom,
05:45
of "thriveddarilo" and "throvethrove" over time.
135
330000
3000
"tešiť sa" a "voľkať si" v priebehu času.
05:49
Now this is just two
136
334000
2000
Toto sú iba dva
05:51
out of two billionmiliardy rowsriadky.
137
336000
3000
z dvoch miliárd riadkov.
05:54
So the entirecelý datadáta setsada
138
339000
2000
Takže, celý set dát
05:56
is a billionmiliardy timesdoba more awesomeúžasné than this slidešmykľavka.
139
341000
3000
je miliardukrát úžasnejší než tento obrázok.
05:59
(LaughterSmiech)
140
344000
2000
(Smiech)
06:01
(ApplausePotlesk)
141
346000
4000
(Potlesk)
06:05
JMJM: Now there are manyveľa other picturesfotografie that are worthhodnota 500 billionmiliardy wordsslová.
142
350000
2000
JM: Je mnoho ďalších obrázkov, ktoré sú hodné 500 miliárd slov.
06:07
For instanceinštancie, this one.
143
352000
2000
Napríklad tento.
06:09
If you just take influenzachrípka,
144
354000
2000
Ak vezmete slovo influenza,
06:11
you will see peaksvrcholy at the time where you knewvedel
145
356000
2000
spozorujete zvýšený výskyt v časoch, o ktorých je známe,
06:13
bigveľký fluchrípka epidemicsepidémie were killingzabitie people around the globesvet.
146
358000
3000
že chrípkové epidémie práve zabíjali ľudí po svete.
06:16
ELAELA: If you were not yetešte convincedpresvedčený,
147
361000
3000
ELA: Ak ešte nie ste presvedčení,
06:19
seamore levelsúrovne are risingstúpajúca,
148
364000
2000
hladiny morí stúpajú,
06:21
so is atmosphericatmosférický COCO2 and globalglobálnej temperatureteplota.
149
366000
3000
rovnako aj atmosférický CO2 a globálna teplota.
06:24
JMJM: You mightsila alsotaktiež want to have a look at this particularkonkrétny n-gramn-gram,
150
369000
3000
JM: Mohol by vás zaujímať aj tento partikulárny n-gram,
06:27
and that's to tell NietzscheNietzsche that God is not deadmŕtvi,
151
372000
3000
ktorý Nietzschemu hovorí, že Boh nie je mŕtvy,
06:30
althoughhoci you mightsila agreesúhlasiť that he mightsila need a better publicistpublicista.
152
375000
3000
aj keď by ste mohli súhlasiť, že by sa mu hodil lepší PR manažér.
06:33
(LaughterSmiech)
153
378000
2000
(Smiech)
06:35
ELAELA: You can get at some prettypekný abstractabstraktné conceptskoncepty with this sortdruh of thing.
154
380000
3000
ELA: S touto vecičkou môžete dospieť k pekne abstraktným konceptom.
06:38
For instanceinštancie, let me tell you the historyhistórie
155
383000
2000
Napríklad, dovoľte mi rozpovedať vám históriu
06:40
of the yearrok 1950.
156
385000
2000
roku 1950.
06:42
Prettykrásna much for the vastnesmierny majorityväčšina of historyhistórie,
157
387000
2000
Podstatnú väčšinu dejín,
06:44
no one gavedal a damnsakramentsky about 1950.
158
389000
2000
nikto na rok 1950 ani nekýchol
06:46
In 1700, in 1800, in 1900,
159
391000
2000
v rokoch 1700, 1800, 1900,
06:48
no one caredzáležalo.
160
393000
3000
nik sa nezaujímal.
06:52
ThroughProstredníctvom the 30s and 40s,
161
397000
2000
V priebehu 30-tych a 40-tych,
06:54
no one caredzáležalo.
162
399000
2000
sa nik nezaujímal.
06:56
SuddenlyZrazu, in the mid-stredne-40s,
163
401000
2000
Zrazu, v polovici 40-tych
06:58
there startedzahájená to be a buzzBuzz.
164
403000
2000
nastal šum.
07:00
People realizedsi uvedomil, that 1950 was going to happenstať sa,
165
405000
2000
Ľudia si uvedomili, že rok 1950 prichádza
07:02
and it could be bigveľký.
166
407000
2000
a mohol by byť veľkolepý.
07:04
(LaughterSmiech)
167
409000
3000
(Smiech)
07:07
But nothing got people interestedzáujem in 1950
168
412000
3000
Avšak nič ľudí nezaujalo počas roku 1950,
07:10
like the yearrok 1950.
169
415000
3000
tak, ako rok 1950.
07:13
(LaughterSmiech)
170
418000
3000
(Smiech)
07:16
People were walkingchôdza around obsessedposadnutý.
171
421000
2000
Ľudia chodili ako posadnutí.
07:18
They couldn'tnemohol stop talkingrozprávanie
172
423000
2000
Nemohli prestať hovoriť
07:20
about all the things they did in 1950,
173
425000
3000
o všetkom, čo robili počas roku 1950,
07:23
all the things they were planningplánovanie to do in 1950,
174
428000
3000
všetkom, čo plánovali robiť v roku 1950,
07:26
all the dreamssny of what they wanted to accomplishdokončiť in 1950.
175
431000
5000
všetkých snoch, ktoré si chceli splniť v roku 1950.
07:31
In factskutočnosť, 1950 was so fascinatingfascinujúce
176
436000
2000
Fakticky, rok 1950 bol taký fascinujúci,
07:33
that for yearsleta thereafternásledne,
177
438000
2000
že celé roky potom
07:35
people just keptuchovávané talkingrozprávanie about all the amazingúžasný things that happenedStalo,
178
440000
3000
ľudia jednoducho ďalej hovorili o všetkých úžasných veciach, ktoré sa udiali.
07:38
in '51, '52, '53.
179
443000
2000
v rokoch 51, 52, 53.
07:40
FinallyNakoniec in 1954,
180
445000
2000
Konečne, v roku 1954
07:42
someoneniekto wokezobudil up and realizedsi uvedomil,
181
447000
2000
sa ktosi prebral a nahliadol,
07:44
that 1950 had gottendostali somewhattrochu passmíňaťé.
182
449000
4000
že rok 1950 je akosi passé.
07:48
(LaughterSmiech)
183
453000
2000
(Smiech)
07:50
And just like that, the bubblebublina burstvýbuch.
184
455000
2000
A takto bublina spľasla.
07:52
(LaughterSmiech)
185
457000
2000
(Smiech)
07:54
And the storypríbeh of 1950
186
459000
2000
A príbeh roku 1950,
07:56
is the storypríbeh of everykaždý yearrok that we have on recordrekord,
187
461000
2000
je príbehom každého roku, o ktorom máme záznamy.
07:58
with a little twisttwist, because now we'vemy máme got these nicepekný chartsgrafy.
188
463000
3000
s malým háčikom, pretože teraz máme tieto pekné tabuľky.
08:01
And because we have these nicepekný chartsgrafy, we can measurezmerať things.
189
466000
3000
A pretože máme tieto pekné tabuľky, môžeme veci merať.
08:04
We can say, "Well how fastrýchly does the bubblebublina burstvýbuch?"
190
469000
2000
Môžeme sa opýtať: "Hm, ako rýchlo bublina spľasne?"
08:06
And it turnszákruty out that we can measurezmerať that very preciselypresne.
191
471000
3000
A ukazuje sa, že to môžeme merať veľmi presne.
08:09
EquationsRovnice were derivedodvodený, graphsgrafy were producedprodukoval,
192
474000
3000
Rovnice boli odvodené, grafy vytvorené,
08:12
and the netnetto resultvýsledok
193
477000
2000
a výsledok je,
08:14
is that we find that the bubblebublina burstspraskne fasterrýchlejšie and fasterrýchlejšie
194
479000
3000
že bubliny spľasnú rýchlejšie a rýchlejšie
08:17
with eachkaždý passingpominuteľný yearrok.
195
482000
2000
každým odchádzajúcim rokom.
08:19
We are losingstráca interestzáujem in the pastminulosť more rapidlyrýchlo.
196
484000
5000
Záujem o minulosť strácame rýchlejšie.
08:24
JMJM: Now a little piecekus of careerkariéra advicerada.
197
489000
2000
JM: Teraz malá rada ku kariérnemu rastu.
08:26
So for those of you who seekusilovať to be famouspreslávený,
198
491000
2000
Takže pre tých z vás, ktorí chcú byť slávni,
08:28
we can learnučiť sa from the 25 mostväčšina famouspreslávený politicalpolitický figuresčísla,
199
493000
2000
sa môžeme poučiť od 25 najznámejších politikov,
08:30
authorsautori, actorsherci and so on.
200
495000
2000
spisovateľov, hercov a tak ďalej.
08:32
So if you want to becomestať sa famouspreslávený earlyzavčas on, you should be an actorherec,
201
497000
3000
Takže ak sa chcete stať slávnym čo najskôr, mali by ste byť hercom,
08:35
because then famesláva startszačína risingstúpajúca by the endkoniec of your 20s --
202
500000
2000
pretože potom vaša sláva začne rásť ešte pred tridsiatkou --
08:37
you're still youngmladý, it's really great.
203
502000
2000
ste ešte mladý, je to ozaj super.
08:39
Now if you can wait a little bittrocha, you should be an authorautor,
204
504000
2000
Ak môžete chvíľu počkať, staňte sa spisovateľom,
08:41
because then you risestúpať to very great heightsvýšky,
205
506000
2000
pretože potom môžete dosiahnuť k výšinám,
08:43
like MarkMark TwainTWAIN, for instanceinštancie: extremelynesmierne famouspreslávený.
206
508000
2000
ako Mark Twain, napríklad: extrémne slávny.
08:45
But if you want to reachdosah the very toptop,
207
510000
2000
Ale ak chcete naozaj na vrchol,
08:47
you should delayoneskorenie gratificationuspokojenie
208
512000
2000
mali by ste odložiť príjemnosti
08:49
and, of coursekurz, becomestať sa a politicianpolitik.
209
514000
2000
a samozrejme, stať sa politikom.
08:51
So here you will becomestať sa famouspreslávený by the endkoniec of your 50s,
210
516000
2000
Takže tu sa stávate slávnym pred vašou šesťdesiatkou,
08:53
and becomestať sa very, very famouspreslávený afterwardnato.
211
518000
2000
a následne sa stávate veľmi, veľmi slávnym.
08:55
So scientistsvedci alsotaktiež tendsklon to get famouspreslávený when they're much olderstaršie.
212
520000
3000
Vedci sa k sláve dostávajú ako omnoho starší.
08:58
Like for instanceinštancie, biologistsbiológovia and physicsfyzika
213
523000
2000
Tak napríklad, biológovia a fyzici
09:00
tendsklon to be almosttakmer as famouspreslávený as actorsherci.
214
525000
2000
sú takmer takí slávni ako herci.
09:02
One mistakechyba you should not do is becomestať sa a mathematicianmatematik.
215
527000
3000
Chyby, ktorej by ste sa mali vyvarovať je stať sa matematikom.
09:05
(LaughterSmiech)
216
530000
2000
(Smiech)
09:07
If you do that,
217
532000
2000
Ak to urobíte,
09:09
you mightsila think, "Oh great. I'm going to do my bestnajlepší work when I'm in my 20s."
218
534000
3000
môžete si myslieť: "Ó, skvelé, do tridsiatky urobím svoju najlepšiu prácu."
09:12
But guesshádať what, nobodynikto will really carestarostlivosť.
219
537000
2000
Ale hádajte čo? Nikoho to nebude naozaj zaujímať.
09:14
(LaughterSmiech)
220
539000
3000
(Smiech)
09:17
ELAELA: There are more soberingvedúce k triezvosti notespoznámky
221
542000
2000
ELA: N-gramy prinášajú
09:19
amongmedzi the n-gramsn-gramov.
222
544000
2000
ešte viac vytriezvujúcich poznatkov.
09:21
For instanceinštancie, here'stady the trajectorytrajektórie of MarcMarc ChagallChagall,
223
546000
2000
Napríklad tu je trajektória Marca Chagalla,
09:23
an artistumelec bornnarodený in 1887.
224
548000
2000
umelca narodeného v roku 1887.
09:25
And this looksvzhľad like the normalnormálne trajectorytrajektórie of a famouspreslávený persončlovek.
225
550000
3000
A toto vyzerá ako normálna trajektória slávnej osoby.
09:28
He getsdostane more and more and more famouspreslávený,
226
553000
4000
Stáva sa slávnejším a slávnejším,
09:32
exceptokrem if you look in Germannemčina.
227
557000
2000
s výnimkou, ak hľadáte v nemčine.
09:34
If you look in Germannemčina, you see something completelyúplne bizarrebizarné,
228
559000
2000
Ak hľadáte v nemčine, uvidíte niečo úplne zvláštne,
09:36
something you prettypekný much never see,
229
561000
2000
niečo, čo sa takmer nikdy neobjaví,
09:38
whichktorý is he becomesstáva extremelynesmierne famouspreslávený
230
563000
2000
teda, že sa stáva extrémne slávnym
09:40
and then all of a suddennáhly plummetsklesne,
231
565000
2000
a potom z ničoho nič zmizne,
09:42
going throughskrz a nadirNadir betweenmedzi 1933 and 1945,
232
567000
3000
prechádzajúc úplným minimom medzi rokmi 1933 a 1945,
09:45
before reboundingoživením afterwardnato.
233
570000
3000
a následne opätovne narastajúc.
09:48
And of coursekurz, what we're seeingvidenie
234
573000
2000
Samozrejme, to, čo vidíme,
09:50
is the factskutočnosť MarcMarc ChagallChagall was a JewishŽidovské artistumelec
235
575000
3000
je skutočnosť, že Marc Chagall bol židovským umelcom
09:53
in NaziNacistickej GermanyNemecko.
236
578000
2000
v nacistickom Nemecku.
09:55
Now these signalssignály
237
580000
2000
Tieto signály
09:57
are actuallyvlastne so strongsilný
238
582000
2000
sú v skutočnosti také silné,
09:59
that we don't need to know that someoneniekto was censoredliečby antihypertenzívom.
239
584000
3000
že nepotrebujeme vedieť, či bol niekto cenzúrovaný.
10:02
We can actuallyvlastne figurefigúra it out
240
587000
2000
Môžeme na to jednoducho prísť
10:04
usingpoužitím really basicbasic signalsignál processingspracovanie.
241
589000
2000
použitím naozaj základného spracovania signálov.
10:06
Here'sTu je a simpleprostý way to do it.
242
591000
2000
Tu je jednoduchý spôsob, ako to urobiť.
10:08
Well, a reasonablerozumný expectationočakávania
243
593000
2000
Je rozumné predpokladať,
10:10
is that somebody'sniekto to famesláva in a givendaný periodperióda of time
244
595000
2000
že sláva danej osoby počas istého časového úseku,
10:12
should be roughlyhrubo the averagepriemerný of theirich famesláva before
245
597000
2000
by mala byť približne priemerom jej slávy pred
10:14
and theirich famesláva after.
246
599000
2000
a slávy po ňom.
10:16
So that's sortdruh of what we expectočakávať.
247
601000
2000
Takže očakávame takéto niečo.
10:18
And we compareporovnať that to the famesláva that we observeDodržiavajte.
248
603000
3000
A porovnáme to so slávou, ktorú pozorujeme.
10:21
And we just dividerozdeliť one by the other
249
606000
2000
A jednoducho vydelíme jednu druhou,
10:23
to producevyrobiť something we call a suppressionpotlačenie indexindex.
250
608000
2000
aby sme dostali niečo, čo nazývame index supresie.
10:25
If the suppressionpotlačenie indexindex is very, very, very smallmalý,
251
610000
3000
Ak je index supresie veľmi, veľmi, veľmi malý,
10:28
then you very well mightsila be beingbytia suppressedpotlačená.
252
613000
2000
potom je dosť možné, že ste potláčaný.
10:30
If it's very largeveľký, maybe you're benefitingprospech from propagandapropaganda.
253
615000
3000
Ak je veľmi veľký, je možné, že si pomáhate propagandou.
10:34
JMJM: Now you can actuallyvlastne look at
254
619000
2000
JM: Vskutku sa môžete pozrieť na
10:36
the distributiondistribúcia of suppressionpotlačenie indexesindexy over wholecelý populationspopulácie.
255
621000
3000
distribúciu indexov supresie cez celé populácie.
10:39
So for instanceinštancie, here --
256
624000
2000
Napríklad, tu --
10:41
this suppressionpotlačenie indexindex is for 5,000 people
257
626000
2000
tento index supresie je vyrátaný pre 5000 ľudí
10:43
pickedvyzdvihnúť in Englishangličtina booksknihy where there's no knownznámy suppressionpotlačenie --
258
628000
2000
vybraných v anglických knihách. Kde nie je žiadna supresia --
10:45
it would be like this, basicallyv podstate tightlytesne centeredstred on one.
259
630000
2000
vyzeralo by to takto, tesne centrované okolo jednotky.
10:47
What you expectočakávať is basicallyv podstate what you observeDodržiavajte.
260
632000
2000
Čo očakávate, je, v podstate, to, čo pozorujete.
10:49
This is distributiondistribúcia as seenvidieť in GermanyNemecko --
261
634000
2000
Toto je distribúcia pozorovaná v Nemecku --
10:51
very differentrozdielny, it's shiftedpresunula to the left.
262
636000
2000
veľmi rozdielna, je posunutá doľava.
10:53
People talkedhovorili about it twicedvakrát lessmenej as it should have been.
263
638000
3000
Ľudia o tom hovorili asi dvakrát menej ako by sa dalo očakávať,
10:56
But much more importantlydôležitejšie, the distributiondistribúcia is much widerširšie.
264
641000
2000
ale čo je ešte dôležitejšie, distribúcia je oveľa širšia.
10:58
There are manyveľa people who endkoniec up on the farďaleko left on this distributiondistribúcia
265
643000
3000
Je mnoho ľudí, ktorý skončia na ľavom konci tejto distribúcie,
11:01
who are talkedhovorili about 10 timesdoba fewermenej than they should have been.
266
646000
3000
o ktorých sa hovorí asi 10 ráz menej, než by sa malo.
11:04
But then alsotaktiež manyveľa people on the farďaleko right
267
649000
2000
Ale tiež mnoho ľudí na pravom konci,
11:06
who seempripadať to benefitvýhoda from propagandapropaganda.
268
651000
2000
ktorým, zdá sa, pomáha propaganda.
11:08
This pictureobrázok is the hallmarkHallmark of censorshipcenzúra in the bookkniha recordrekord.
269
653000
3000
Tento obrázok predstavuje etalón cenzorstva v knižných záznamoch.
11:11
ELAELA: So culturomicsculturomics
270
656000
2000
ELA: Takže kulturonómia
11:13
is what we call this methodmetóda.
271
658000
2000
je termín, ktorý používame pre túto metódu.
11:15
It's kinddruh of like genomicsgenomika.
272
660000
2000
Je podobná genomike.
11:17
ExceptOkrem toho genomicsgenomika is a lensšošovka on biologybiológie
273
662000
2000
Zatiaľ, čo genomika je objektívom biológie
11:19
throughskrz the windowokno of the sequencesekvencie of basesbáza in the humančlovek genomegenóm.
274
664000
3000
cez okno sekvencie ľudského genómu,
11:22
CulturomicsCulturomics is similarpodobný.
275
667000
2000
kulturonómia je podobná.
11:24
It's the applicationprihláška of massive-scalemasívna-meradle datadáta collectionzbierka analysisanalýza
276
669000
3000
Je to aplikácia analýzy dát masívneho rozsahu
11:27
to the studyštudovať of humančlovek culturekultúra.
277
672000
2000
pre štúdium ľudskej kultúry.
11:29
Here, insteadnamiesto of throughskrz the lensšošovka of a genomegenóm,
278
674000
2000
Tu je genóm nahradený
11:31
throughskrz the lensšošovka of digitizedDigitalizovaná pieceskúsky of the historicalhistorický recordrekord.
279
676000
3000
objektívom digitalizovaných historických záznamov.
11:34
The great thing about culturomicsculturomics
280
679000
2000
Skvelé na kulturonómii
11:36
is that everyonekaždý can do it.
281
681000
2000
je, že ju môže robiť každý.
11:38
Why can everyonekaždý do it?
282
683000
2000
Prečo každý?
11:40
EveryoneVšetci can do it because threetri guys,
283
685000
2000
Môže ju robiť ktokoľvek, pretože traja chlapíci,
11:42
JonJon OrwantOrwant, MattMatt GraySivá and Will BrockmanBrockman over at GoogleGoogle,
284
687000
3000
Jon Orwant, Matt Gray a Will Brockman z Google
11:45
saw the prototypeprototyp of the NgramNgram ViewerViewer,
285
690000
2000
sa pozreli na prototyp Ngram Viewer
11:47
and they said, "This is so funzábava.
286
692000
2000
a povedali si, "Toto je taká zábava,
11:49
We have to make this availablek dispozícii for people."
287
694000
3000
musíme ju sprístupniť ľuďom!"
11:52
So in two weekstýždne flatplochý -- the two weekstýždne before our paperpapier cameprišiel out --
288
697000
2000
Takže za dva týždne - dva týždne pred vydaním nášho článku -
11:54
they codedkódované up a versionverzia of the NgramNgram ViewerViewer for the generalvšeobecný publicverejnosť.
289
699000
3000
naprogramovali verziu Ngram Viewer-u pre verejnosť.
11:57
And so you too can typetyp in any wordslovo or phrasefrázy that you're interestedzáujem in
290
702000
3000
Takže teraz môžete vpísať akékoľvek slovo alebo frázu, ktorá vás zaujíma
12:00
and see its n-gramn-gram immediatelyokamžite --
291
705000
2000
a okamžite vidieť príslušný N-gram,
12:02
alsotaktiež browsePrehľadávať examplespríklady of all the variousrôzny booksknihy
292
707000
2000
a tiež prezerať príklady všetkých rôznych kníh,
12:04
in whichktorý your n-gramn-gram appearsobjavia.
293
709000
2000
v ktorých sa objavuje váš N-gram.
12:06
JMJM: Now this was used over a millionmilión timesdoba on the first day,
294
711000
2000
JM: Aplikácia bola použitá viac ako miliónkrát počas prvého dňa,
12:08
and this is really the bestnajlepší of all the queriesdotazy.
295
713000
2000
a toto je naozaj najlepší zo všetkých dotazov.
12:10
So people want to be theirich bestnajlepší, put theirich bestnajlepší footnoha forwardvpred.
296
715000
3000
Takže ľudia sa snažia robiť všetko najlepšie ("their best") v službách pokroku.
12:13
But it turnszákruty out in the 18thth centurystoročia, people didn't really carestarostlivosť about that at all.
297
718000
3000
Ale ukazuje sa, že v 18-tom storočí, sa o to nestarali vôbec.
12:16
They didn't want to be theirich bestnajlepší, they wanted to be theirich beftbeft.
298
721000
3000
Nechceli robiť "their best", robili "their beft".
12:19
So what happenedStalo is, of coursekurz, this is just a mistakechyba.
299
724000
3000
Čo sa stalo, je, samozrejme, iba chyba.
12:22
It's not that stroveusiloval for mediocrityprostřednost,
300
727000
2000
Nebola to snaha po priemernosti,
12:24
it's just that the S used to be writtenpísaný differentlyodlišne, kinddruh of like an F.
301
729000
3000
išlo len o to, že "s" sa písalo odlišne, podobne ako "f."
12:27
Now of coursekurz, GoogleGoogle didn't pickvyzdvihnúť this up at the time,
302
732000
3000
Samozrejme, Google o tom vtedy ešte nevedel,
12:30
so we reportedhlásených this in the scienceveda articlečlánok that we wrotenapísal.
303
735000
3000
takže sme to reportovali v našom odbornom článku.
12:33
But it turnszákruty out this is just a reminderpripomenutie
304
738000
2000
Ale to je iba pripomienka,
12:35
that, althoughhoci this is a lot of funzábava,
305
740000
2000
že aj keď je toto veľká zábava,
12:37
when you interpretinterpretovať these graphsgrafy, you have to be very carefulopatrný,
306
742000
2000
pri interpretácii grafov musíte byť veľmi opatrní
12:39
and you have to adoptprijať the basezákladňa standardsštandardy in the sciencesvedy.
307
744000
3000
a používať základné vedecké pravidlá.
12:42
ELAELA: People have been usingpoužitím this for all kindsdruhy of funzábava purposesúčely.
308
747000
3000
ELA: Ľudia to používajú na všetky možné srandovné účely.
12:45
(LaughterSmiech)
309
750000
7000
(Smiech)
12:52
ActuallyVlastne, we're not going to have to talk,
310
757000
2000
Vskutku, nemusíme ani rozprávať,
12:54
we're just going to showšou you all the slidesšmykľavky and remainzostať silenttichý.
311
759000
3000
iba vám mlčky ukážeme všetky zostávajúce obrázky
12:57
This persončlovek was interestedzáujem in the historyhistórie of frustrationfrustrácie.
312
762000
3000
Túto osobu zaujímala história frustrácie.
13:00
There's variousrôzny typestypy of frustrationfrustrácie.
313
765000
3000
Existujú rôzne druhy frustrácie.
13:03
If you stubblok your toeToe, that's a one A "arghArgh."
314
768000
3000
Ak si prepichnete prst je to "argh" (ach) s jedným "a"
13:06
If the planetplanéta EarthZem is annihilatedzničená by the VogonsVogons
315
771000
2000
Ak je planéta Zem anihilovaná Vogónmi
13:08
to make roomizba for an interstellarmedzihviezdny bypassbypass,
316
773000
2000
za účelom uvoľnenia priestoru pre vesmírnu diaľnicu,
13:10
that's an eightosem A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
je to "aaaaaaaargh" o ôsmich "a."
13:12
This persončlovek studiesštúdie all the "arghsarghs,"
318
777000
2000
Táto osoba skúmala všetky "argh",
13:14
from one throughskrz eightosem A'sA to.
319
779000
2000
s jedným až ôsmimi "a"
13:16
And it turnszákruty out
320
781000
2000
A ukazuje sa
13:18
that the less-frequentmenej časté "arghsarghs"
321
783000
2000
že menej frekventované "arghs"
13:20
are, of coursekurz, the onesones that correspondzodpovedajú to things that are more frustratingfrustrujúce --
322
785000
3000
sú, samozrejme, tie, ktoré zodpovedajú veciam, ktoré sú frustrujúcejšie --
13:23
exceptokrem, oddlypodivne, in the earlyzavčas 80s.
323
788000
3000
s výnimkou, prekvapujúco, začiatku 80-tych.
13:26
We think that mightsila have something to do with ReaganReagan.
324
791000
2000
Myslíme, že by to mohlo mať dočinenia s Reaganom.
13:28
(LaughterSmiech)
325
793000
2000
(Smiech)
13:30
JMJM: There are manyveľa usageszvyklostiam of this datadáta,
326
795000
3000
JM: Je veľa použití pre tieto dáta,
13:33
but the bottomdno lineriadok is that the historicalhistorický recordrekord is beingbytia digitizedDigitalizovaná.
327
798000
3000
ale najpodstatnejšie je, že historické záznamy sú digitalizované.
13:36
GoogleGoogle has startedzahájená to digitizedigitalizovať 15 millionmilión booksknihy.
328
801000
2000
Google začal s digitalizáciou 15 miliónov kníh.
13:38
That's 12 percentpercento of all the booksknihy that have ever been publishedpublikovaný.
329
803000
2000
To je 12 percent všetkých kníh, ktoré kedy boli vydané.
13:40
It's a sizableznačné chunkkus of humančlovek culturekultúra.
330
805000
3000
To predstavuje veľkú časť ľudskej kultúry.
13:43
There's much more in culturekultúra: there's manuscriptsrukopisy, there newspapersnoviny,
331
808000
3000
Kultúra je oveľa širšia: spadajú tam rukopisy, noviny,
13:46
there's things that are not texttext, like artumenie and paintingsobrazy.
332
811000
2000
patria tam veci, ktoré nie sú textom, ako výtvarné umenie a maľby.
13:48
These all happenstať sa to be on our computerspočítače,
333
813000
2000
Toto všetko bude na našich počítačoch,
13:50
on computerspočítače acrossnaprieč the worldsvet.
334
815000
2000
na počítačoch po celom svete.
13:52
And when that happensdeje, that will transformpremeniť the way we have
335
817000
3000
Až sa toto stane, transformuje to náš prístup
13:55
to understandrozumieť our pastminulosť, our presentprítomný and humančlovek culturekultúra.
336
820000
2000
k porozumeniu našej minulosti, prítomnosti a ľudstvu.
13:57
Thank you very much.
337
822000
2000
Ďakujeme veľmi pekne.
13:59
(ApplausePotlesk)
338
824000
3000
(Potlesk)

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com