ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

Amit 5 millió könyvből tanultunk

Filmed:
2,049,453 views

Játszottál már a Google Labs Ngram Viewerével? Ez egy olyan addiktív eszköz, melynek segítségével szavakra és ötletekre kereshetsz rá az elmúlt évszázad 5 millió könyvét tartalmazó adatbázisban. Erez Lieberman Aiden és Jean-Baptiste Michel bemutatja nekünk, hogyan működik, valamint mutat néhány érdekes példát arra, mit tanulhatunk 500 milliárd szóból.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
ErezErez LiebermanLieberman AidenAiden: EveryoneMindenki knowstudja
0
0
2000
Erez Lieberman Aiden: Mindenki tudja,
00:17
that a picturekép is worthérdemes a thousandezer wordsszavak.
1
2000
3000
hogy egy kép felér ezer szóval.
00:22
But we at HarvardHarvard
2
7000
2000
De mi a Harvardon
00:24
were wonderingcsodálkozó if this was really trueigaz.
3
9000
3000
elgondolkoztunk, hogy ez tényleg így van-e.
00:27
(LaughterNevetés)
4
12000
2000
(Nevetés)
00:29
So we assembledösszeszerelt a teamcsapat of expertsszakértők,
5
14000
4000
Így összeraktunk egy szakértőkből álló csapatot,
00:33
spanningátívelő HarvardHarvard, MITMIT,
6
18000
2000
Harvardról, MIT-ről
00:35
The AmericanAmerikai HeritageÖrökség DictionarySzótár, The EncyclopediaEnciklopédia BritannicaBritannica
7
20000
3000
az American Heritage Dictionarytől, az Encyclopedia Britannicától
00:38
and even our proudbüszke sponsorstámogatók,
8
23000
2000
és még a büszke szponzorunktól is,
00:40
the GoogleGoogle.
9
25000
3000
a Google-től.
00:43
And we cogitatedcogitated about this
10
28000
2000
És rágódtunk rajta
00:45
for about fournégy yearsévek.
11
30000
2000
nagyjából négy évig.
00:47
And we camejött to a startlingmegdöbbentő conclusionkövetkeztetés.
12
32000
5000
És egy ijesztő megállapításra jutottunk.
00:52
LadiesHölgyek and gentlemenUrak, a picturekép is not worthérdemes a thousandezer wordsszavak.
13
37000
3000
Hölgyeim és uraim, egy kép nem ér fel ezer szóval.
00:55
In facttény, we foundtalál some picturesképek
14
40000
2000
Valójában, találtunk néhány képet
00:57
that are worthérdemes 500 billionmilliárd, ezermillió wordsszavak.
15
42000
5000
amely 500 milliárd szót ér.
01:02
Jean-BaptisteJean-Baptiste MichelMichel: So how did we get to this conclusionkövetkeztetés?
16
47000
2000
Jean-Baptiste Michel: De hogyan jutottunk erre a következtetésre?
01:04
So ErezErez and I were thinkinggondolkodás about waysmódokon
17
49000
2000
Erez és én olyan módszereket kerestünk,
01:06
to get a bignagy picturekép of humanemberi culturekultúra
18
51000
2000
amelyekből egy áttekintő képet kaphatunk az emberi kultúráról
01:08
and humanemberi historytörténelem: changeváltozás over time.
19
53000
3000
és az emberi történelemről, időbeli változásáról.
01:11
So manysok bookskönyvek actuallytulajdonképpen have been writtenírott over the yearsévek.
20
56000
2000
Rengeteg könyvet írtak az évek során.
01:13
So we were thinkinggondolkodás, well the bestlegjobb way to learntanul from them
21
58000
2000
Így mi arra gondoltunk, legjobban úgy tanulhatunk belőlük,
01:15
is to readolvas all of these millionsTöbb millió of bookskönyvek.
22
60000
2000
ha ezt a több millió könyvet elolvassuk.
01:17
Now of coursetanfolyam, if there's a scaleskála for how awesomefantasztikus that is,
23
62000
3000
Természetesen, ha lenne arra egy skála, ez mennyire döbbenetes,
01:20
that has to rankRank extremelyrendkívüli módon, extremelyrendkívüli módon highmagas.
24
65000
3000
akkor ez extrém, extrém módon magas lenne.
01:23
Now the problemprobléma is there's an X-axisX-tengely for that,
25
68000
2000
A probléma viszont az, hogy van egy X tengelye is,
01:25
whichmelyik is the practicalgyakorlati axistengely.
26
70000
2000
ami a praktikusság tengelye.
01:27
This is very, very lowalacsony.
27
72000
2000
Ez nagyon, nagyon alacsony.
01:29
(ApplauseTaps)
28
74000
3000
(Taps)
01:32
Now people tendhajlamosak to use an alternativealternatív approachmegközelítés,
29
77000
3000
Manapság hajlamosak az emberek egy másfajta megközelítést használni:
01:35
whichmelyik is to take a fewkevés sourcesforrás and readolvas them very carefullygondosan.
30
80000
2000
vesznek néhány forrást és nagyon alaposan elolvassák.
01:37
This is extremelyrendkívüli módon practicalgyakorlati, but not so awesomefantasztikus.
31
82000
2000
Ez rendkívül hasznos, de nem annyira döbbenetes.
01:39
What you really want to do
32
84000
3000
Amit igazán szeretnél
01:42
is to get to the awesomefantasztikus yetmég practicalgyakorlati partrész of this spacehely.
33
87000
3000
az az, hogy eljuss az ábra döbbenetes, mégis hasznos részére.
01:45
So it turnsmenetek out there was a companyvállalat acrossát the riverfolyó calledhívott GoogleGoogle
34
90000
3000
Kiderült, van egy vállalat, amely tudja a megoldást: a Google,
01:48
who had startedindult a digitizationdigitalizálás projectprogram a fewkevés yearsévek back
35
93000
2000
mely néhány évvel korábban elkezdett egy digitalizálási projektet,
01:50
that mightesetleg just enableengedélyezze this approachmegközelítés.
36
95000
2000
ami lehetővé teheti ezt a megközelítést.
01:52
They have digitizeddigitalizált millionsTöbb millió of bookskönyvek.
37
97000
2000
Könyvek millióit digitalizálták.
01:54
So what that meanseszközök is, one could use computationalszámítási methodsmód
38
99000
3000
Mindez azt jelenti, hogy számítási metódusokkal
01:57
to readolvas all of the bookskönyvek in a clickkettyenés of a buttongomb.
39
102000
2000
egy gombnyomásra elolvashatóak ezek a könyvek.
01:59
That's very practicalgyakorlati and extremelyrendkívüli módon awesomefantasztikus.
40
104000
3000
Ez nagyon hasznos és igazán döbbenetes.
02:03
ELAELA: Let me tell you a little bitbit about where bookskönyvek come from.
41
108000
2000
ELA: Hadd beszéljek egy kicsit arról, honnan is jönnek ezek a könyvek.
02:05
SinceÓta time immemorialidőtlen, there have been authorsszerzői.
42
110000
3000
Emberi emlékezet óta vannak szerzők.
02:08
These authorsszerzői have been strivingtörekvés to writeír bookskönyvek.
43
113000
3000
Ezek a szerzők arra törekedtek, hogy könyveket írjanak.
02:11
And this becamelett considerablyjelentősen easierkönnyebb
44
116000
2000
És mindez nagyságrendekkel könnyebbé vált
02:13
with the developmentfejlődés of the printingnyomtatás pressnyomja meg some centuriesszázadok agoezelőtt.
45
118000
2000
a nyomtatott sajtó néhány századdal ezelőtti fejlődésével.
02:15
SinceÓta then, the authorsszerzői have wonnyerte
46
120000
3000
A szerzők azóta sikeresen,
02:18
on 129 millionmillió distinctkülönböző occasionsalkalmak,
47
123000
2000
129 millió különböző alkalommal
02:20
publishingkiadás bookskönyvek.
48
125000
2000
publikáltak könyvet.
02:22
Now if those bookskönyvek are not lostelveszett to historytörténelem,
49
127000
2000
Ha ezek a könyvek nem tűntek el a történelemben,
02:24
then they are somewherevalahol in a librarykönyvtár,
50
129000
2000
akkor valahol megtalálhatóak egy könyvtárban,
02:26
and manysok of those bookskönyvek have been gettingszerzés retrieveda lap from the librarieskönyvtárak
51
131000
3000
és a legtöbbjüket a Google kikölcsönözte
02:29
and digitizeddigitalizált by GoogleGoogle,
52
134000
2000
és digitalizálta --
02:31
whichmelyik has scannedszkennelt 15 millionmillió bookskönyvek to datedátum.
53
136000
2000
a mai napig 15 millió könyvet.
02:33
Now when GoogleGoogle digitizesdigitalizálja a bookkönyv, they put it into a really niceszép formatformátum.
54
138000
3000
Amikor a Google bedigitalizál egy könyvet, egy elég szép formátumba rakja.
02:36
Now we'vevoltunk got the dataadat, plusplusz we have metadatametaadat.
55
141000
2000
Szóval megvan az adat és megvan a metaadat.
02:38
We have informationinformáció about things like where was it publishedközzétett,
56
143000
3000
Van információnk arról, hol publikálták,
02:41
who was the authorszerző, when was it publishedközzétett.
57
146000
2000
ki volt a szerző, mikor publikálták.
02:43
And what we do is go throughkeresztül all of those recordsfeljegyzések
58
148000
3000
Mi azt csináljuk, hogy átnézzük ezeket a rekordokat,
02:46
and excludekizárása everything that's not the highestlegmagasabb qualityminőség dataadat.
59
151000
4000
és kizárjuk azokat, amelyek nem a legjobb minőségűek.
02:50
What we're left with
60
155000
2000
A végén maradt egy
02:52
is a collectionGyűjtemény of fiveöt millionmillió bookskönyvek,
61
157000
3000
ötmillió könyvből álló kollekciónk,
02:55
500 billionmilliárd, ezermillió wordsszavak,
62
160000
3000
500 milliárd szó,
02:58
a stringhúr of characterskarakterek a thousandezer timesalkalommal longerhosszabb
63
163000
2000
egy ezerszer hosszabb karakterlánc,
03:00
than the humanemberi genomegenom --
64
165000
3000
mint az emberi genom --
03:03
a textszöveg whichmelyik, when writtenírott out,
65
168000
2000
egy szöveg, mely leírva
03:05
would stretchkitágít from here to the MoonHold and back
66
170000
2000
elérne a Holdig és vissza
03:07
10 timesalkalommal over --
67
172000
2000
10-szer --
03:09
a veritablevalóságos shardSzilánk of our culturalkulturális genomegenom.
68
174000
4000
a kulturális genom egy igazi darabja.
03:13
Of coursetanfolyam what we did
69
178000
2000
Természetesen, amikor
03:15
when facedszembe with suchilyen outrageousfelháborító hyperboletúlzás ...
70
180000
3000
egy ilyen elképesztő túlzással találkozunk...
03:18
(LaughterNevetés)
71
183000
2000
(Nevetés)
03:20
was what any self-respectingmagára researcherskutatók
72
185000
3000
ugyanazt tesszük, mint bármely magára valamit is adó
03:23
would have doneKész.
73
188000
3000
kutató tenne.
03:26
We tookvett a pageoldal out of XKCDXKCD,
74
191000
2000
Vettünk egy oldalt az XKCD-ről,
03:28
and we said, "StandÁllvány back.
75
193000
2000
és azt mondtuk, "Egy kis helyet!
03:30
We're going to try sciencetudomány."
76
195000
2000
Kipróbáljuk a tudományt."
03:32
(LaughterNevetés)
77
197000
2000
(Nevetés)
03:34
JMJM: Now of coursetanfolyam, we were thinkinggondolkodás,
78
199000
2000
JM: Természetesen, gondoltuk mi,
03:36
well let's just first put the dataadat out there
79
201000
2000
elsőként adjuk oda az adatokat embereknek,
03:38
for people to do sciencetudomány to it.
80
203000
2000
akik tanulmányozzák.
03:40
Now we're thinkinggondolkodás, what dataadat can we releasekiadás?
81
205000
2000
Arra gondoltunk, milyen adatot adhatunk oda?
03:42
Well of coursetanfolyam, you want to take the bookskönyvek
82
207000
2000
Természetesen, veheted a könyveket
03:44
and releasekiadás the fullteljes textszöveg of these fiveöt millionmillió bookskönyvek.
83
209000
2000
és kiadhatod mind az ötmillió könyv teljes szövegét.
03:46
Now GoogleGoogle, and JonJon OrwantOrwant in particularkülönös,
84
211000
2000
Nos, a Google és különösképpen Jon Orwant
03:48
told us a little equationegyenlet that we should learntanul.
85
213000
2000
elmagyarázott nekünk egy kis egyenletet, amelyet meg kellene tanulnunk.
03:50
So you have fiveöt millionmillió, that is, fiveöt millionmillió authorsszerzői
86
215000
3000
Ha van 5 millió, azaz 5 millió szerződ
03:53
and fiveöt millionmillió plaintiffsfelperesek is a massivetömeges lawsuitper.
87
218000
3000
és 5 millió felperes, az egy egész szép peres eljárás.
03:56
So, althoughhabár that would be really, really awesomefantasztikus,
88
221000
2000
Így, annak ellenére, hogy az igazán, igazán döbbenetes lenne,
03:58
again, that's extremelyrendkívüli módon, extremelyrendkívüli módon impracticalkivihetetlen.
89
223000
3000
ismét csak, hihetetlenül, hihetetlenül haszontalan lenne.
04:01
(LaughterNevetés)
90
226000
2000
(Nevetés)
04:03
Now again, we kindkedves of cavedbeszakadt in,
91
228000
2000
Mi eléggé korlátoltak vagyunk,
04:05
and we did the very practicalgyakorlati approachmegközelítés, whichmelyik was a bitbit lessKevésbé awesomefantasztikus.
92
230000
3000
és vettük az elég praktikus megközelítést, amely valamivel kevésbé döbbenetes.
04:08
We said, well insteadhelyette of releasingfelszabadító the fullteljes textszöveg,
93
233000
2000
Azt mondtuk, ahelyett, hogy kiadnánk a teljes szöveget,
04:10
we're going to releasekiadás statisticsstatisztika about the bookskönyvek.
94
235000
2000
statisztikákat fogunk kiadni a könyvekről.
04:12
So take for instancepélda "A gleamcsillog of happinessboldogság."
95
237000
2000
Vegyünk egy példát: "A boldogság egy fénysugara."
04:14
It's fournégy wordsszavak; we call that a four-gramnégy gramm.
96
239000
2000
Négy szó. Négy-gramnak hívjuk.
04:16
We're going to tell you how manysok timesalkalommal a particularkülönös four-gramnégy gramm
97
241000
2000
Meg fogjuk mondani, hogy egy bizonyos négy-gram hányszor
04:18
appearedmegjelent in bookskönyvek in 1801, 1802, 1803,
98
243000
2000
bukkant fel a könyvekben 1801-ben, 1802-ben, 1803-ban,
04:20
all the way up to 2008.
99
245000
2000
egészen 2008-ig.
04:22
That givesad us a time seriessorozat
100
247000
2000
Kapunk egy idősort arról, hogy
04:24
of how frequentlygyakran this particularkülönös sentencemondat was used over time.
101
249000
2000
milyen gyakran használták ezt a bizonyos mondatot az idők során.
04:26
We do that for all the wordsszavak and phrasesmondatok that appearmegjelenik in those bookskönyvek,
102
251000
3000
Megcsináljuk ezt minden szóra és kifejezésre, amely azokban a könyvekben előfordul,
04:29
and that givesad us a bignagy tableasztal of two billionmilliárd, ezermillió linesvonalak
103
254000
3000
amely egy 2 milliárd sorból álló halmazt ad,
04:32
that tell us about the way culturekultúra has been changingváltozó.
104
257000
2000
amely elmondja, miként változott a kultúra.
04:34
ELAELA: So those two billionmilliárd, ezermillió linesvonalak,
105
259000
2000
ELA: Ezt a kétmilliárd sort
04:36
we call them two billionmilliárd, ezermillió n-gramsn-gramm.
106
261000
2000
2 milliárd n-gramnak hívjuk.
04:38
What do they tell us?
107
263000
2000
Mit mondanak nekünk?
04:40
Well the individualEgyedi n-gramsn-gramm measuremérték culturalkulturális trendstrendek.
108
265000
2000
Nos, az egyes n-gramok a kulturális trendeket mérik.
04:42
Let me give you an examplepélda.
109
267000
2000
Hadd mondjak egy példát!
04:44
Let's supposetegyük fel that I am thrivingvirágzó,
110
269000
2000
Tegyük fel, hogy jómódban élek,
04:46
then tomorrowholnap I want to tell you about how well I did.
111
271000
2000
aztán holnap el akarom mondani, milyen jól éltem.
04:48
And so I mightesetleg say, "YesterdayTegnap, I throvethrove."
112
273000
3000
És azt mondhatom, "Tegnap jól éltem (throve)."
04:51
AlternativelyAlternatív megoldásként, I could say, "YesterdayTegnap, I thrivedvirágzott."
113
276000
3000
Másféleképpen, azt mondhatom, "Tegnap jól éltem (thrived)."
04:54
Well whichmelyik one should I use?
114
279000
3000
Nos, melyiket kellene használnom?
04:57
How to know?
115
282000
2000
Honnan lehet tudni?
04:59
As of about sixhat monthshónap agoezelőtt,
116
284000
2000
Nagyjából 6 hónappal ezelőtt,
05:01
the stateállapot of the artművészet in this fieldmező
117
286000
2000
a tudomány akkori állása szerint
05:03
is that you would, for instancepélda,
118
288000
2000
megtehetted volna például,
05:05
go up to the followingkövetkező psychologistpszichológus with fabulousmesés hairhaj,
119
290000
2000
hogy felkeresed az alábbi furcsa hajú pszichológust,
05:07
and you'djobb lenne, ha say,
120
292000
2000
és azt mondod,
05:09
"SteveSteve, you're an expertszakértő on the irregularszabálytalan verbsigék.
121
294000
3000
"Steve, a rendhagyó igék szakértője vagy.
05:12
What should I do?"
122
297000
2000
Mit kéne tennem?"
05:14
And he'dő lenne tell you, "Well mosta legtöbb people say thrivedvirágzott,
123
299000
2000
És azt mondta volna, "Nos, a legtöbb ember a 'thrived'-ot használja,
05:16
but some people say throvethrove."
124
301000
3000
de néhányan a 'throve'-ot."
05:19
And you alsois knewtudta, more or lessKevésbé,
125
304000
2000
És többé-kevésbé azt is tudnád,
05:21
that if you were to go back in time 200 yearsévek
126
306000
3000
ha 200 évet visszamész az időben,
05:24
and askkérdez the followingkövetkező statesmanállamférfi with equallyegyaránt fabulousmesés hairhaj,
127
309000
3000
és megkérdezed az alábbi, szintén furcsa hajú államférfit,
05:27
(LaughterNevetés)
128
312000
3000
(Nevetés)
05:30
"TomTom, what should I say?"
129
315000
2000
"Tom, melyiket kellene használnom?"
05:32
He'dŐ say, "Well, in my day, mosta legtöbb people throvethrove,
130
317000
2000
Azt mondaná, "Nos, az én időmben a legtöbb ember a 'throve'-ot,
05:34
but some thrivedvirágzott."
131
319000
3000
de néhányan a 'thrived'-ot."
05:37
So now what I'm just going to showelőadás you is rawnyers dataadat.
132
322000
2000
Amit most meg fogok mutatni azok nyers adatok.
05:39
Two rowssorok from this tableasztal of two billionmilliárd, ezermillió entriesbejegyzés.
133
324000
4000
Két sort ebből a kétmilliárdos halmazból.
05:43
What you're seeinglátás is yearév by yearév frequencyfrekvencia
134
328000
2000
Az ábrán a "thrive" és a "throve"
05:45
of "thrivedvirágzott" and "throvethrove" over time.
135
330000
3000
előfordulási gyakorisága látható az évek során.
05:49
Now this is just two
136
334000
2000
Nos, ez csak kettő
05:51
out of two billionmilliárd, ezermillió rowssorok.
137
336000
3000
a kétmilliárd sorból.
05:54
So the entireteljes dataadat setkészlet
138
339000
2000
Az egész adathalmaz
05:56
is a billionmilliárd, ezermillió timesalkalommal more awesomefantasztikus than this slidecsúszik.
139
341000
3000
kétmilliárdszor döbbenetesebb, mint ez a dia.
05:59
(LaughterNevetés)
140
344000
2000
(Nevetés)
06:01
(ApplauseTaps)
141
346000
4000
(Taps)
06:05
JMJM: Now there are manysok other picturesképek that are worthérdemes 500 billionmilliárd, ezermillió wordsszavak.
142
350000
2000
JM: Számtalan más kép van, amely felér 500 milliárd szóval.
06:07
For instancepélda, this one.
143
352000
2000
Például ez.
06:09
If you just take influenzainfluenza,
144
354000
2000
Ha csupán az influenzát vesszük,
06:11
you will see peakscsúcsok at the time where you knewtudta
145
356000
2000
kiugrásokat fogunk látni azokra az időszakokra, ahol tudjuk, hogy
06:13
bignagy fluinfluenza epidemicsjárványok were killinggyilkolás people around the globeföldgolyó.
146
358000
3000
nagy influenza fertőzésekben haltak meg az emberek világszerte.
06:16
ELAELA: If you were not yetmég convincedmeggyőződéses,
147
361000
3000
ELA: Ha még mindig nem lennének meggyőzve,
06:19
seatenger levelsszintek are risingemelkedő,
148
364000
2000
a tengerszint emelkedik,
06:21
so is atmosphericlégköri COCO2 and globalglobális temperaturehőmérséklet.
149
366000
3000
akárcsak a légkör CO2 tartalma és a globális hőmérséklet.
06:24
JMJM: You mightesetleg alsois want to have a look at this particularkülönös n-gramn-gram,
150
369000
3000
JM: Vagy akár megnézhetitek ezt a bizonyos n-gramot,
06:27
and that's to tell NietzscheNietzsche that God is not deadhalott,
151
372000
3000
melyben Nietzsche szerint Isten nem halott,
06:30
althoughhabár you mightesetleg agreeegyetért that he mightesetleg need a better publicistpublicista.
152
375000
3000
habár azzal egyetértenének, hogy jobb publicistára lenne szüksége.
06:33
(LaughterNevetés)
153
378000
2000
(Nevetés)
06:35
ELAELA: You can get at some prettyszép abstractabsztrakt conceptsfogalmak with this sortfajta of thing.
154
380000
3000
ELA: Egészen szép absztrakt koncepciókat kaphatsz ilyen dolgokkal.
06:38
For instancepélda, let me tell you the historytörténelem
155
383000
2000
Például, hadd meséljek az 1950. év
06:40
of the yearév 1950.
156
385000
2000
történelméről!
06:42
Prettycsinos much for the vasthatalmas majoritytöbbség of historytörténelem,
157
387000
2000
Nagy valószínűséggel a történelem túlnyomó részében
06:44
no one gaveadott a damnátkozott about 1950.
158
389000
2000
senkit sem érdekelt 1950.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
1700-ban, 1800-ban, 1900-ban
06:48
no one caredgondozott.
160
393000
3000
senkit sem érdekelt.
06:52
ThroughKeresztül the 30s and 40s,
161
397000
2000
A 30-as és a 40-es években
06:54
no one caredgondozott.
162
399000
2000
senkit sem érdekelt.
06:56
SuddenlyHirtelen, in the mid-középső-40s,
163
401000
2000
A 40-es évek közepén hirtelen
06:58
there startedindult to be a buzzBuzz.
164
403000
2000
elkezdődött a mozgolódás.
07:00
People realizedrealizált that 1950 was going to happentörténik,
165
405000
2000
Rájöttek az emberek, hogy hamarosan 1950 lesz,
07:02
and it could be bignagy.
166
407000
2000
és nagy lehet.
07:04
(LaughterNevetés)
167
409000
3000
(Nevetés)
07:07
But nothing got people interestedérdekelt in 1950
168
412000
3000
1950-ben azonban semmi más nem érdekelte úgy az embereket,
07:10
like the yearév 1950.
169
415000
3000
mint az 1950. év.
07:13
(LaughterNevetés)
170
418000
3000
(Nevetés)
07:16
People were walkinggyalogló around obsessedmegszállott.
171
421000
2000
Az emberek megszállottan járkáltak.
07:18
They couldn'tnem tudott stop talkingbeszél
172
423000
2000
Egyfolytában azokról a dolgokról beszéltek,
07:20
about all the things they did in 1950,
173
425000
3000
mit csináltak 1950-ben,
07:23
all the things they were planningtervezés to do in 1950,
174
428000
3000
mit fognak csinálni 1950-ben,
07:26
all the dreamsálmok of what they wanted to accomplishmegvalósítani, végrahajt in 1950.
175
431000
5000
az álmokról, amelyeket meg szeretnének valósítani 1950-ben.
07:31
In facttény, 1950 was so fascinatingelbűvölő
176
436000
2000
1950 valójában annyira szenzációs volt,
07:33
that for yearsévek thereafterezt követően,
177
438000
2000
hogy évekkel utána is,
07:35
people just kepttartotta talkingbeszél about all the amazingelképesztő things that happenedtörtént,
178
440000
3000
az emberek egyfolytában az akkor történt csodálatos dolgokról beszéltek,
07:38
in '51, '52, '53.
179
443000
2000
'51-ben, '52-ben, '53-ban.
07:40
FinallyVégül in 1954,
180
445000
2000
Végül 1954-ben,
07:42
someonevalaki wokefelébredt up and realizedrealizált
181
447000
2000
felébred valaki és rájött, hogy
07:44
that 1950 had gottenütött somewhatnémileg passelhaladé.
182
449000
4000
1950 valahogyan... elmúlt.
07:48
(LaughterNevetés)
183
453000
2000
(Nevetés)
07:50
And just like that, the bubblebuborék burstrobbanás.
184
455000
2000
És egy csapásra a buborék kipukkant.
07:52
(LaughterNevetés)
185
457000
2000
(Nevetés)
07:54
And the storysztori of 1950
186
459000
2000
És 1950 története
07:56
is the storysztori of everyminden yearév that we have on recordrekord,
187
461000
2000
megegyezik valamennyi rendelkezésünkre álló év történetével,
07:58
with a little twistcsavar, because now we'vevoltunk got these niceszép chartstáblázatok.
188
463000
3000
egy kis csavarral, hiszen megvannak ezek a szép ábráink.
08:01
And because we have these niceszép chartstáblázatok, we can measuremérték things.
189
466000
3000
És mivel megvannak ezek a szép ábrák, meg tudunk mérni dolgokat.
08:04
We can say, "Well how fastgyors does the bubblebuborék burstrobbanás?"
190
469000
2000
Azt mondhatjuk, "Nézzük, milyen gyorsan pukkant ki a buborék?"
08:06
And it turnsmenetek out that we can measuremérték that very preciselypontosan.
191
471000
3000
És kiderül, ezt egészen pontosan meg tudjuk mérni.
08:09
EquationsEgyenletek were derivedszármaztatott, graphsgrafikonok were producedelőállított,
192
474000
3000
Egyenleteket írtunk, grafikonokat állítottunk fel,
08:12
and the netháló resulteredmény
193
477000
2000
és a végső eredmény az, hogy
08:14
is that we find that the bubblebuborék burststör fastergyorsabb and fastergyorsabb
194
479000
3000
a buborék egyre gyorsabban és gyorsabban pukkan ki,
08:17
with eachminden egyes passingelhaladó yearév.
195
482000
2000
ahogy telnek az egyes évek.
08:19
We are losingvesztes interestérdeklődés in the pastmúlt more rapidlygyorsan.
196
484000
5000
Egyre gyorsabban veszítjük el a múlttal kapcsolatos érdeklődésünket.
08:24
JMJM: Now a little piecedarab of careerkarrier advicetanács.
197
489000
2000
JM: Most pedig egy kis karrier tanács.
08:26
So for those of you who seektörekszik to be famoushíres,
198
491000
2000
Mindazok, akik híresek akarnak lenni,
08:28
we can learntanul from the 25 mosta legtöbb famoushíres politicalpolitikai figuresszámadatok,
199
493000
2000
tanulhatnak a 25 leghíresebb politikai szereplőtől,
08:30
authorsszerzői, actorsszereplők and so on.
200
495000
2000
szerzőtől, színésztől és így tovább.
08:32
So if you want to becomeválik famoushíres earlykorai on, you should be an actorszínész,
201
497000
3000
Szóval ha idejekorán híres akarsz lenni, színésznek kell menned,
08:35
because then famehírnév startskezdődik risingemelkedő by the endvég of your 20s --
202
500000
2000
mert a hírnév a 20-as éveid végén kezd el növekedni --
08:37
you're still youngfiatal, it's really great.
203
502000
2000
még fiatal vagy, ez igazán nagyszerű.
08:39
Now if you can wait a little bitbit, you should be an authorszerző,
204
504000
2000
Ha tudsz egy kicsit tovább várni, szerzőnek kell menned,
08:41
because then you riseemelkedik to very great heightsmagasságok,
205
506000
2000
mivel akkor igen nagy magasságokba emelkedhetsz,
08:43
like MarkMark TwainTWAIN, for instancepélda: extremelyrendkívüli módon famoushíres.
206
508000
2000
mint Mark Twain például: elképesztően híres.
08:45
But if you want to reachelér the very topfelső,
207
510000
2000
Ha viszont a legmagasabbra akarsz jutni,
08:47
you should delaykésleltetés gratificationkielégítés
208
512000
2000
késleltetned kell az önmegvalósítást, és
08:49
and, of coursetanfolyam, becomeválik a politicianpolitikus.
209
514000
2000
természetesen, politikusnak kell állnod.
08:51
So here you will becomeválik famoushíres by the endvég of your 50s,
210
516000
2000
Így az 50-es éveid végére kezdesz híres lenni,
08:53
and becomeválik very, very famoushíres afterwardutána.
211
518000
2000
és csak aztán leszel nagyon, nagyon híres.
08:55
So scientiststudósok alsois tendhajlamosak to get famoushíres when they're much olderidősebb.
212
520000
3000
A tudósok is akkor kezdenek híressé válni, amikor idősebbek lesznek.
08:58
Like for instancepélda, biologistsbiológusok and physicsfizika
213
523000
2000
Mint például a biológusok és fizikusok,
09:00
tendhajlamosak to be almostmajdnem as famoushíres as actorsszereplők.
214
525000
2000
akik csaknem olyan híressé válhatnak, mint a színészek.
09:02
One mistakehiba you should not do is becomeválik a mathematicianmatematikus.
215
527000
3000
Egy hibát nem szabad elkövetned: matematikusnak menned.
09:05
(LaughterNevetés)
216
530000
2000
(Nevetés)
09:07
If you do that,
217
532000
2000
Ha így döntesz,
09:09
you mightesetleg think, "Oh great. I'm going to do my bestlegjobb work when I'm in my 20s."
218
534000
3000
azt gondolhatod, "Oh, remek. A legjobbat fogom teljesíteni, amikor a 20-as éveimben járok."
09:12
But guessTaláld ki what, nobodysenki will really caregondoskodás.
219
537000
2000
De tudod mit? Senkit nem fog érdekelni.
09:14
(LaughterNevetés)
220
539000
3000
(Nevetés)
09:17
ELAELA: There are more soberingkijózanítás notesjegyzetek
221
542000
2000
ELA: Vannak még jobban kijózanító megjegyzések
09:19
amongközött the n-gramsn-gramm.
222
544000
2000
az n-gramok között.
09:21
For instancepélda, here'sitt the trajectoryröppálya of MarcMarc ChagallChagall,
223
546000
2000
Itt van például Marc Chagall pályája,
09:23
an artistművész bornszületett in 1887.
224
548000
2000
egy 1887-ben született művészé.
09:25
And this looksúgy néz ki, like the normalnormál trajectoryröppálya of a famoushíres personszemély.
225
550000
3000
Ez úgy néz ki, mint egy híres ember átlagos pályája.
09:28
He getsjelentkeznek more and more and more famoushíres,
226
553000
4000
Egyre jobban és jobban híres lett,
09:32
exceptkivéve if you look in Germannémet.
227
557000
2000
kivéve, ha Németországban nézed.
09:34
If you look in Germannémet, you see something completelyteljesen bizarrebizarr,
228
559000
2000
Ha Németországban nézed, valami egészen bizarr dolgot láthatsz,
09:36
something you prettyszép much never see,
229
561000
2000
valamit, amit szinte még sosem láttál,
09:38
whichmelyik is he becomesválik extremelyrendkívüli módon famoushíres
230
563000
2000
nevezetesen, hogy hihetetlen híres lesz,
09:40
and then all of a suddenhirtelen plummetsplummets,
231
565000
2000
aztán egyszercsak bezuhan,
09:42
going throughkeresztül a nadirNémeth Gábor betweenközött 1933 and 1945,
232
567000
3000
egy mélypontra érve 1933 és 1945 között,
09:45
before reboundingújjáéledő afterwardutána.
233
570000
3000
mielőtt ismét visszapattanna.
09:48
And of coursetanfolyam, what we're seeinglátás
234
573000
2000
Természetesen, amit látunk
09:50
is the facttény MarcMarc ChagallChagall was a JewishZsidó artistművész
235
575000
3000
az az a tény, hogy Marc Chagall egy zsidó művész volt
09:53
in NaziNáci GermanyNémetország.
236
578000
2000
a náci Németországban.
09:55
Now these signalsjelek
237
580000
2000
Ezek a jelek
09:57
are actuallytulajdonképpen so strongerős
238
582000
2000
igazából annyira erősek, hogy
09:59
that we don't need to know that someonevalaki was censoredcenzúrázott.
239
584000
3000
nem kell tudnunk, hogy valaki cenzorálva volt.
10:02
We can actuallytulajdonképpen figureábra it out
240
587000
2000
Valójában ki tudjuk találni,
10:04
usinghasználva really basicalapvető signaljel processingfeldolgozás.
241
589000
2000
egészen egyszerű jelzőrendszer segítségével.
10:06
Here'sItt van a simpleegyszerű way to do it.
242
591000
2000
Itt egy egyszerű módszer minderre.
10:08
Well, a reasonableésszerű expectationelvárás
243
593000
2000
Egy ésszerű várakozás, hogy
10:10
is that somebody'svalakinek a famehírnév in a givenadott periodidőszak of time
244
595000
2000
egy adott időszakban valakinek a hírneve
10:12
should be roughlynagyjából the averageátlagos of theirazok famehírnév before
245
597000
2000
a korábbi és a későbbi hírnevének
10:14
and theirazok famehírnév after.
246
599000
2000
az átlaga.
10:16
So that's sortfajta of what we expectelvár.
247
601000
2000
Ez az amit várnánk.
10:18
And we comparehasonlítsa össze that to the famehírnév that we observemegfigyelése.
248
603000
3000
És ezt összehasonlítjuk az általunk megfigyelt hírnévvel.
10:21
And we just dividefeloszt one by the other
249
606000
2000
Aztán elosztjuk egyiket a másikkal, hogy
10:23
to producegyárt something we call a suppressionelnyomása indexindex.
250
608000
2000
előállítsunk valamit, amit elnyomási indexnek hívunk.
10:25
If the suppressionelnyomása indexindex is very, very, very smallkicsi,
251
610000
3000
Ha az elnyomási index nagyon, nagyon, nagyon alacsony,
10:28
then you very well mightesetleg be beinglény suppressedelfojtott.
252
613000
2000
akkor nagyon el lehetsz nyomva.
10:30
If it's very largenagy, maybe you're benefitingrészesülő from propagandapropaganda.
253
615000
3000
Ha nagyon nagy, akkor lehet, hogy propaganda áldozata vagy.
10:34
JMJM: Now you can actuallytulajdonképpen look at
254
619000
2000
Igazából meg tudod nézni
10:36
the distributionterjesztés of suppressionelnyomása indexesindexek over wholeegész populationspopulációk.
255
621000
3000
az elnyomási index eloszlását a teljes populáción.
10:39
So for instancepélda, here --
256
624000
2000
Így például, itt --
10:41
this suppressionelnyomása indexindex is for 5,000 people
257
626000
2000
ez 5000 ember elnyomási indexe, melyet
10:43
pickedválogatott in Englishangol bookskönyvek where there's no knownismert suppressionelnyomása --
258
628000
2000
olyan angol nyelvű könyvekből választottunk ki, ahol nincs tudomásunk elnyomásról --
10:45
it would be like this, basicallyalapvetően tightlyszorosan centeredközépre on one.
259
630000
2000
így kellene kinéznie, nagyjából az egy körül csoportosulva.
10:47
What you expectelvár is basicallyalapvetően what you observemegfigyelése.
260
632000
2000
Amire számítasz az az általad megfigyelt.
10:49
This is distributionterjesztés as seenlátott in GermanyNémetország --
261
634000
2000
Ez a Németországban megfigyelhető eloszlás --
10:51
very differentkülönböző, it's shiftedeltolódott to the left.
262
636000
2000
nagyon különböző, a baloldalra tolódott.
10:53
People talkedbeszélt about it twicekétszer lessKevésbé as it should have been.
263
638000
3000
Az emberek kétszer kevesebbszer beszéltek róla, mint kellett volna.
10:56
But much more importantlyfontosabb, the distributionterjesztés is much widerszélesebb.
264
641000
2000
De sokkal fontosabb, hogy az eloszlás sokkal szélesebb.
10:58
There are manysok people who endvég up on the farmessze left on this distributionterjesztés
265
643000
3000
Sokan vannak, akik az eloszlás bal szélén helyezkednek el,
11:01
who are talkedbeszélt about 10 timesalkalommal fewerkevesebb than they should have been.
266
646000
3000
akikről 10-szer kevesebbszer beszéltek, mint ahogy kellett volna.
11:04
But then alsois manysok people on the farmessze right
267
649000
2000
De aztán sokan vannak a jobb szélén,
11:06
who seemlátszik to benefithaszon from propagandapropaganda.
268
651000
2000
akik feltehetően propaganda áldozatai.
11:08
This picturekép is the hallmarkHallmark of censorshipcenzúra in the bookkönyv recordrekord.
269
653000
3000
Ez a kép jól illusztrálja a könyvekben megjelenő cenzúrát.
11:11
ELAELA: So culturomicsculturomics
270
656000
2000
ELA: Kulturonómia,
11:13
is what we call this methodmódszer.
271
658000
2000
így hívjuk ezt a módszert.
11:15
It's kindkedves of like genomicsgenomika.
272
660000
2000
Olyan, mint a genomika.
11:17
ExceptKivéve genomicsgenomika is a lenslencse on biologybiológia
273
662000
2000
Azt leszámítva, hogy a genomika a biológia egyik lencséje,
11:19
throughkeresztül the windowablak of the sequencesorrend of basesbázisok in the humanemberi genomegenom.
274
664000
3000
melyen keresztül az emberi genom alapvető szekvenciáit vizsgáljuk.
11:22
CulturomicsCulturomics is similarhasonló.
275
667000
2000
A kulturonómia hasonló.
11:24
It's the applicationAlkalmazás of massive-scalehatalmas méretű dataadat collectionGyűjtemény analysiselemzés
276
669000
3000
Egy hatalmas méretű adatgyűjtemény analizálásának eszköze,
11:27
to the studytanulmány of humanemberi culturekultúra.
277
672000
2000
amellyel az emberi kultúrát tanulmányozhatjuk.
11:29
Here, insteadhelyette of throughkeresztül the lenslencse of a genomegenom,
278
674000
2000
Itt nem a genom lencséjén keresztül, hanem
11:31
throughkeresztül the lenslencse of digitizeddigitalizált piecesdarabok of the historicaltörténelmi recordrekord.
279
676000
3000
a történelmi emlékek digitalizált darabjain keresztül.
11:34
The great thing about culturomicsculturomics
280
679000
2000
A kulturonómia nagy előnye, hogy
11:36
is that everyonemindenki can do it.
281
681000
2000
bárki művelheti.
11:38
Why can everyonemindenki do it?
282
683000
2000
Miért teheti meg bárki?
11:40
EveryoneMindenki can do it because threehárom guys,
283
685000
2000
Azért teheti, mivel három srác,
11:42
JonJon OrwantOrwant, MattMatt GraySzürke and Will BrockmanBrockman over at GoogleGoogle,
284
687000
3000
Jon Orwant, Matt Gray és Will Brockman a Google-nél
11:45
saw the prototypeprototípus of the NgramNgram ViewerViewer,
285
690000
2000
meglátta az Ngram Viewer prototípusát,
11:47
and they said, "This is so funmóka.
286
692000
2000
és azt mondta, "Ez vicces.
11:49
We have to make this availableelérhető for people."
287
694000
3000
Az emberek számára elérhetővé kell tenni."
11:52
So in two weekshetes flatlakás -- the two weekshetes before our paperpapír camejött out --
288
697000
2000
Így nagyjából 2 hét alatt -- a tanulmányunk megjelenése előtti 2 hétben --
11:54
they codedkódolt up a versionváltozat of the NgramNgram ViewerViewer for the generalTábornok publicnyilvános.
289
699000
3000
összerakták az Ngram Viewer publikus verziójának kódját.
11:57
And so you too can typetípus in any wordszó or phrasekifejezés that you're interestedérdekelt in
290
702000
3000
És így bármilyen szót vagy kifejezést be tudsz táplálni, ami érdekel
12:00
and see its n-gramn-gram immediatelyazonnal --
291
705000
2000
és azonnal láthatod az n-gramját --
12:02
alsois browseTallózás examplespéldák of all the variouskülönféle bookskönyvek
292
707000
2000
még példákat is mutat a különféle könyvekből,
12:04
in whichmelyik your n-gramn-gram appearsMegjelenik.
293
709000
2000
melyekben az n-gramod megtalálható.
12:06
JMJM: Now this was used over a millionmillió timesalkalommal on the first day,
294
711000
2000
JM: Az első napon több mint egymilliószor használták,
12:08
and this is really the bestlegjobb of all the querieslekérdezések.
295
713000
2000
és ez a legjobb az összes keresés közül.
12:10
So people want to be theirazok bestlegjobb, put theirazok bestlegjobb footláb forwardelőre.
296
715000
3000
Az emberek a legjobbak akarnak lenni, a legjobban előre haladni.
12:13
But it turnsmenetek out in the 18thth centuryszázad, people didn't really caregondoskodás about that at all.
297
718000
3000
De kiderült, hogy a 18. században az emberek egyáltalán nem törődtek ezzel.
12:16
They didn't want to be theirazok bestlegjobb, they wanted to be theirazok beftBEFT.
298
721000
3000
Nem a legjobbak (best) akartak lenni, hanem a legjobbak (beft).
12:19
So what happenedtörtént is, of coursetanfolyam, this is just a mistakehiba.
299
724000
3000
Természetesen ami történt az csak egy hiba.
12:22
It's not that stroveigyekezett for mediocrityközépszerűség,
300
727000
2000
Nem egy szándékos középszerűség,
12:24
it's just that the S used to be writtenírott differentlyeltérően, kindkedves of like an F.
301
729000
3000
hanem csak az, hogy az S betűt régen másképp írták, kicsit hasonlóan, mint az F-et.
12:27
Now of coursetanfolyam, GoogleGoogle didn't pickszed this up at the time,
302
732000
3000
A Google természetesen nem jött rá időben,
12:30
so we reportedjelentett this in the sciencetudomány articlecikk that we wroteírt.
303
735000
3000
így ezt jeleztük is az általunk írt tudományos cikkünkben.
12:33
But it turnsmenetek out this is just a reminderemlékeztető
304
738000
2000
De igazából ez csak egy figyelmeztetés, hogy
12:35
that, althoughhabár this is a lot of funmóka,
305
740000
2000
habár igen szórakoztató amikor ezeket
12:37
when you interpretértelmezése these graphsgrafikonok, you have to be very carefulóvatos,
306
742000
2000
a grafikonokat értelmezed, nagyon óvatosnak kell lenned,
12:39
and you have to adoptelfogad the basebázis standardsszabványok in the sciencestudományok.
307
744000
3000
és el kell fogadnod a tudomány alapfeltételeit.
12:42
ELAELA: People have been usinghasználva this for all kindsféle of funmóka purposescélokra.
308
747000
3000
ELA: Az emberek a legkülönfélébb célokra használják.
12:45
(LaughterNevetés)
309
750000
7000
(Nevetés)
12:52
ActuallyValójában, we're not going to have to talk,
310
757000
2000
Igazából, nem is kell beszélnünk,
12:54
we're just going to showelőadás you all the slidesdiák and remainmarad silentcsendes.
311
759000
3000
csak megmutatjuk az összes diát és csendben maradunk.
12:57
This personszemély was interestedérdekelt in the historytörténelem of frustrationcsalódottság.
312
762000
3000
Ez a személy a frusztráció történelmére volt kíváncsi.
13:00
There's variouskülönféle typestípusok of frustrationcsalódottság.
313
765000
3000
Különféle frusztrációk vannak.
13:03
If you stubhelyettes your toetoe, that's a one A "arghargh."
314
768000
3000
Ha levágod a lábujjad, az egy A-s "argh".
13:06
If the planetbolygó EarthFöld is annihilatedmegsemmisült by the VogonsVogons
315
771000
2000
Ha a Földet elpusztítják a Vogonok,
13:08
to make roomszoba for an interstellarcsillagközi bypasskitérő,
316
773000
2000
hogy helyet adjanak egy csillagközi kerülőútnak,
13:10
that's an eightnyolc A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
az egy 8 A-s "aaaaaaaargh".
13:12
This personszemély studiestanulmányok all the "arghsarghs,"
318
777000
2000
Ez a személy valamennyi "argh"-ot tanulmányozza,
13:14
from one throughkeresztül eightnyolc A'sA's.
319
779000
2000
egytől nyolc A-ig.
13:16
And it turnsmenetek out
320
781000
2000
És kiderül, hogy
13:18
that the less-frequentkevésbé gyakori "arghsarghs"
321
783000
2000
a legkevésbé gyakori "argh"
13:20
are, of coursetanfolyam, the onesazok that correspondfelel meg to things that are more frustratingfrusztráló --
322
785000
3000
természetesen a legjobban frusztráló dolgokhoz kapcsolódik --
13:23
exceptkivéve, oddlyfurcsán, in the earlykorai 80s.
323
788000
3000
leszámítva, furcsán, a 80-as évek elejét.
13:26
We think that mightesetleg have something to do with ReaganReagan.
324
791000
2000
Szerintünk ez valahogy összefügg Reagennel.
13:28
(LaughterNevetés)
325
793000
2000
(Nevetés)
13:30
JMJM: There are manysok usageshasználat of this dataadat,
326
795000
3000
JM: Sokféle felhasználási módja van ezeknek az adatoknak,
13:33
but the bottomalsó linevonal is that the historicaltörténelmi recordrekord is beinglény digitizeddigitalizált.
327
798000
3000
de a lényeg, hogy a történelmi emlékek digitalizálva lettek.
13:36
GoogleGoogle has startedindult to digitizedigitalizálása 15 millionmillió bookskönyvek.
328
801000
2000
A Google elkezdett 15 millió könyvet bedigitalizálni.
13:38
That's 12 percentszázalék of all the bookskönyvek that have ever been publishedközzétett.
329
803000
2000
Ez 12 százaléka a valaha megjelent összes könyvnek.
13:40
It's a sizablejókora chunknagy darab of humanemberi culturekultúra.
330
805000
3000
Az emberi kultúra egy méretes darabja.
13:43
There's much more in culturekultúra: there's manuscriptskézirat, there newspapersújságok,
331
808000
3000
Sokkal több van a kultúrában: kéziratok, újságok,
13:46
there's things that are not textszöveg, like artművészet and paintingsfestmények.
332
811000
2000
vannak dolgok, amelyek nem szövegek, mint a műalkotások és festmények.
13:48
These all happentörténik to be on our computersszámítógépek,
333
813000
2000
Hamarosan mindezek a számítógépünkön lesznek,
13:50
on computersszámítógépek acrossát the worldvilág.
334
815000
2000
számítógépeken világszerte.
13:52
And when that happensmegtörténik, that will transformátalakít the way we have
335
817000
3000
És amikor ez megtörténik, megváltozik a módszer,
13:55
to understandmegért our pastmúlt, our presentajándék and humanemberi culturekultúra.
336
820000
2000
ahogy korábban a múltunkat, a jelenünket és emberi kultúránkat vizsgáltuk.
13:57
Thank you very much.
337
822000
2000
Köszönjük szépen.
13:59
(ApplauseTaps)
338
824000
3000
(Taps)
Translated by Krisztian Lukacs
Reviewed by Krisztian Stancz

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com