ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

Apa yang kami pelajari dari 5 juta buku

Filmed:
2,049,453 views

Pernahkah Anda bermain-main dengan Ngram Viewer dari Google Labs? Ini alat menarik yang memungkinkan kita mencari kata dan ide dari basis data yang terdiri dari 5 juta buku dari beberapa abad. Erez Lieberman Aiden dan Jean-Baptiste Michel menunjukkan cara kerjanya, dan beberapa hal mengejutkan yang bisa kita pelajari dari 500 miliar kata.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
ErezErez LiebermanLieberman AidenAiden: EveryoneSemua orang knowstahu
0
0
2000
Erez Lieberman Aiden: Semua orang tahu
00:17
that a picturegambar is worthbernilai a thousandribu wordskata-kata.
1
2000
3000
sebuah gambar mengandung seribu kata.
00:22
But we at HarvardHarvard
2
7000
2000
Tapi kami di Harvard
00:24
were wonderingbertanya-tanya if this was really truebenar.
3
9000
3000
ingin tahu apakah itu memang benar.
00:27
(LaughterTawa)
4
12000
2000
(Suara tawa)
00:29
So we assembleddirakit a teamtim of expertsahli,
5
14000
4000
Jadi kami mengumpulkan tim ahli,
00:33
spanningmembentang HarvardHarvard, MITMIT,
6
18000
2000
mulai dari Harvard, MIT,
00:35
The AmericanAmerika Serikat HeritageWarisan DictionaryKamus, The EncyclopediaEnsiklopedia BritannicaBritannica
7
20000
3000
The American Heritage Dictionary, The Encyclopedia Britannica
00:38
and even our proudbangga sponsorssponsor,
8
23000
2000
hingga sponsor kami,
00:40
the GoogleGoogle.
9
25000
3000
Google.
00:43
And we cogitatedcogitated about this
10
28000
2000
Kami memikirkan hal ini
00:45
for about fourempat yearstahun.
11
30000
2000
selama empat tahun.
00:47
And we camedatang to a startlingmengejutkan conclusionkesimpulan.
12
32000
5000
Kami sampai pada kesimpulan yang mengejutkan.
00:52
LadiesWanita and gentlemenTuan-tuan, a picturegambar is not worthbernilai a thousandribu wordskata-kata.
13
37000
3000
Hadirin yang terhormat, sebuah gambar tidak mengandung seribu kata.
00:55
In factfakta, we foundditemukan some picturesfoto-foto
14
40000
2000
Bahkan, kami menemukan beberapa gambar
00:57
that are worthbernilai 500 billionmilyar wordskata-kata.
15
42000
5000
yang mengandung 500 miliar kata.
01:02
Jean-BaptisteJean-Baptiste MichelMichel: So how did we get to this conclusionkesimpulan?
16
47000
2000
Jean-Baptiste Michel: Bagaimana kami bisa sampai pada kesimpulan ini?
01:04
So ErezErez and I were thinkingberpikir about wayscara
17
49000
2000
Saya dan Erez berpikir tentang cara
01:06
to get a bigbesar picturegambar of humanmanusia culturebudaya
18
51000
2000
mendapatkan gambaran besar budaya manusia
01:08
and humanmanusia historysejarah: changeperubahan over time.
19
53000
3000
dan sejarah manusia: berubah seiring waktu.
01:11
So manybanyak booksbuku actuallysebenarnya have been writtentertulis over the yearstahun.
20
56000
2000
Ada banyak buku yang telah ditulis selama bertahun-tahun ini.
01:13
So we were thinkingberpikir, well the bestterbaik way to learnbelajar from them
21
58000
2000
Jadi kami berpikir, cara terbaik untuk belajar
01:15
is to readBaca baca all of these millionsjutaan of booksbuku.
22
60000
2000
adalah dengan membaca semua jutaan buku ini.
01:17
Now of courseTentu saja, if there's a scaleskala for how awesomemengagumkan that is,
23
62000
3000
Tentu saja, kalau ada ukuran seberapa keren hal ini,
01:20
that has to rankperingkat extremelysangat, extremelysangat hightinggi.
24
65000
3000
rankingnya pasti sangat tinggi.
01:23
Now the problemmasalah is there's an X-axisSumbu x for that,
25
68000
2000
Masalahnya ada sumbu-X untuk itu,
01:25
whichyang is the practicalpraktis axissumbu.
26
70000
2000
yaitu sumbu kepraktisan,
01:27
This is very, very lowrendah.
27
72000
2000
yang sangat-sangat rendah.
01:29
(ApplauseTepuk tangan)
28
74000
3000
(Tepuk tangan)
01:32
Now people tendcenderung to use an alternativealternatif approachpendekatan,
29
77000
3000
Orang-orang cenderung menggunakan pendekatan alternatif,
01:35
whichyang is to take a fewbeberapa sourcessumber and readBaca baca them very carefullyhati-hati.
30
80000
2000
mengambil beberapa buku dan membacanya dengan teliti.
01:37
This is extremelysangat practicalpraktis, but not so awesomemengagumkan.
31
82000
2000
Ini sangat praktis tapi tidak keren.
01:39
What you really want to do
32
84000
3000
Yang ingin kita lakukan adalah
01:42
is to get to the awesomemengagumkan yetnamun practicalpraktis partbagian of this spaceruang.
33
87000
3000
masuk ke sisi yang keren tapi juga praktis.
01:45
So it turnsberubah out there was a companyperusahaan acrossmenyeberang the riversungai calledbernama GoogleGoogle
34
90000
3000
Ternyata ada sebuah perusahaan di seberang sungai yang bernama Google
01:48
who had starteddimulai a digitizationdigitalisasi projectproyek a fewbeberapa yearstahun back
35
93000
2000
yang memulai proyek digitalisasinya beberapa tahun lalu
01:50
that mightmungkin just enablememungkinkan this approachpendekatan.
36
95000
2000
yang mungkin bisa mewujudkan pendekatan ini.
01:52
They have digitizedDigital millionsjutaan of booksbuku.
37
97000
2000
Mereka mendigitalkan jutaan buku.
01:54
So what that meanscara is, one could use computationalkomputasi methodsmetode
38
99000
3000
Jadi artinya, seseorang bisa menggunakan metode komputasional
01:57
to readBaca baca all of the booksbuku in a clickklik of a buttontombol.
39
102000
2000
untuk membaca semua buku dengan satu klik.
01:59
That's very practicalpraktis and extremelysangat awesomemengagumkan.
40
104000
3000
Itu sangat praktis dan mengagumkan.
02:03
ELAELA: Let me tell you a little bitsedikit about where booksbuku come from.
41
108000
2000
ELA: Mari kita bahas sedikit dari mana asal buku-buku itu.
02:05
SinceSejak time immemorialAsli dalam Inggris, there have been authorspenulis.
42
110000
3000
Sejak dulu, selalu ada yang namanya penulis.
02:08
These authorspenulis have been strivingberjuang to writemenulis booksbuku.
43
113000
3000
Penulis-penulis ini berjuang menulis buku.
02:11
And this becamemenjadi considerablysangat easierlebih mudah
44
116000
2000
Ini menjadi jauh lebih mudah
02:13
with the developmentpengembangan of the printingpencetakan presstekan some centuriesabad agolalu.
45
118000
2000
ketika mesin cetak muncul beberapa abad yang lalu.
02:15
SinceSejak then, the authorspenulis have wonwon
46
120000
3000
Sejak itu, penulis telah melalui
02:18
on 129 millionjuta distinctberbeda occasionskesempatan,
47
123000
2000
dalam 129 juta kesempatan berbeda
02:20
publishingpenerbitan booksbuku.
48
125000
2000
untuk menerbitkan buku.
02:22
Now if those booksbuku are not lostkalah to historysejarah,
49
127000
2000
Kalau buku-buku itu tidak hilang ditelan waktu,
02:24
then they are somewhereentah di mana in a libraryPerpustakaan,
50
129000
2000
kemungkinan mereka ada di perpustakaan,
02:26
and manybanyak of those booksbuku have been gettingmendapatkan retrievedDiperoleh from the librariesperpustakaan
51
131000
3000
dan ada banyak buku itu yang diambil dari perpustakaan
02:29
and digitizedDigital by GoogleGoogle,
52
134000
2000
dan didigitalkan oleh Google,
02:31
whichyang has scanneddipindai 15 millionjuta booksbuku to datetanggal.
53
136000
2000
yang telah memindai 15 juta buku sampai hari ini.
02:33
Now when GoogleGoogle digitizesdigitizes a bookBook, they put it into a really nicebagus formatformat.
54
138000
3000
Saat Google mendigitalkan buku, mereka memasukkannya ke dalam format yang rapi.
02:36
Now we'vekita sudah got the datadata, plusplus we have metadatametadata.
55
141000
2000
Kita sekarang punya data dan juga metadatanya.
02:38
We have informationinformasi about things like where was it publishedditerbitkan,
56
143000
3000
Kita punya informasi seperti di mana buku itu diterbitkan,
02:41
who was the authorpenulis, when was it publishedditerbitkan.
57
146000
2000
siapa penulisnya, kapan diterbitkan.
02:43
And what we do is go throughmelalui all of those recordscatatan
58
148000
3000
Yang kita lakukan adalah menelusuri catatan-catatan itu
02:46
and excludemengecualikan everything that's not the highestpaling tinggi qualitykualitas datadata.
59
151000
4000
dan mengecualikan semua yang kualitas datanya tidak baik.
02:50
What we're left with
60
155000
2000
Akhirnya yang tersisa adalah
02:52
is a collectionkoleksi of fivelima millionjuta booksbuku,
61
157000
3000
sekumpulan buku sebanyak lima juta,
02:55
500 billionmilyar wordskata-kata,
62
160000
3000
500 miliar kata,
02:58
a stringtali of characterskarakter a thousandribu timeswaktu longerlebih lama
63
163000
2000
serangkaian karakter yang seribu kali lebih panjang
03:00
than the humanmanusia genomegenom --
64
165000
3000
daripada genom manusia --
03:03
a textteks whichyang, when writtentertulis out,
65
168000
2000
teks yang jika dituliskan
03:05
would stretchmeregang from here to the MoonBulan and back
66
170000
2000
panjangnya adalah jarak dari sini ke Bulan dan
03:07
10 timeswaktu over --
67
172000
2000
kembali 10 kali --
03:09
a veritablebenar-benar shardpecahan of our culturalkultural genomegenom.
68
174000
4000
potongan penting genom budaya kita.
03:13
Of courseTentu saja what we did
69
178000
2000
Tentu saja itu yang kami lakukan
03:15
when faceddihadapkan with suchseperti itu outrageousmemalukan hyperbolehiperbola ...
70
180000
3000
ketika dihadapkan dengan hiperbola semacam itu ...
03:18
(LaughterTawa)
71
183000
2000
(Suara tawa)
03:20
was what any self-respectingmenghormati diri researcherspeneliti
72
185000
3000
sama seperti yang akan dilakukan oleh
03:23
would have doneselesai.
73
188000
3000
peneliti sejati mana pun.
03:26
We tookmengambil a pagehalaman out of XKCDXKCD,
74
191000
2000
Kami ambil satu halaman dari XKCD,
03:28
and we said, "StandBerdiri back.
75
193000
2000
dan berkata, "Minggir.
03:30
We're going to try scienceilmu."
76
195000
2000
Kami akan menggunakan ilmu pengetahuan."
03:32
(LaughterTawa)
77
197000
2000
(Suara tawa)
03:34
JMJM: Now of courseTentu saja, we were thinkingberpikir,
78
199000
2000
JM: Tentu saja, kami berpikir,
03:36
well let's just first put the datadata out there
79
201000
2000
mari pertama-tama kita gelar data ini di luar sana
03:38
for people to do scienceilmu to it.
80
203000
2000
agar orang-orang bisa menerapkan ilmu pengetahuan sendiri.
03:40
Now we're thinkingberpikir, what datadata can we releasemelepaskan?
81
205000
2000
Kami berpikir, apakah data ini boleh kami buka?
03:42
Well of courseTentu saja, you want to take the booksbuku
82
207000
2000
Tentu saja kita ingin mengambil semua buku itu
03:44
and releasemelepaskan the fullpenuh textteks of these fivelima millionjuta booksbuku.
83
209000
2000
dan membuka seluruh teks dari lima juta buku ini.
03:46
Now GoogleGoogle, and JonJon OrwantOrwant in particulartertentu,
84
211000
2000
Google, dan terutama Jon Orwant,
03:48
told us a little equationpersamaan that we should learnbelajar.
85
213000
2000
memberi tahu kami hitungan yang harus kami ketahui.
03:50
So you have fivelima millionjuta, that is, fivelima millionjuta authorspenulis
86
215000
3000
Jadi ada lima juta buku, itu artinya lima juta penulis
03:53
and fivelima millionjuta plaintiffspenggugat is a massivebesar lawsuitgugatan.
87
218000
3000
dan lima juta pengacara dengan setumpuk tuntutan.
03:56
So, althoughmeskipun that would be really, really awesomemengagumkan,
88
221000
2000
Jadi meskipun itu akan sangat keren,
03:58
again, that's extremelysangat, extremelysangat impracticaltidak praktis.
89
223000
3000
kembali, itu sangat tidak praktis.
04:01
(LaughterTawa)
90
226000
2000
(Suara tawa)
04:03
Now again, we kindjenis of cavedmenyerah in,
91
228000
2000
Sekali lagi, kami terjebak,
04:05
and we did the very practicalpraktis approachpendekatan, whichyang was a bitsedikit lesskurang awesomemengagumkan.
92
230000
3000
dan kami mengambil pendekatan yang sangat praktis, yang kurang keren.
04:08
We said, well insteadsebagai gantinya of releasingmelepaskan the fullpenuh textteks,
93
233000
2000
Kami berkata, ketimbang membuka seluruh teks,
04:10
we're going to releasemelepaskan statisticsstatistik about the booksbuku.
94
235000
2000
kami akan membuka statistik tentang buku-buku itu saja.
04:12
So take for instancecontoh "A gleamkilauan of happinesskebahagiaan."
95
237000
2000
Jadi misalnya "A gleam of happiness."
04:14
It's fourempat wordskata-kata; we call that a four-gramempat-gram.
96
239000
2000
Terdiri dari empat kata; kita menyebutnya empat-gram.
04:16
We're going to tell you how manybanyak timeswaktu a particulartertentu four-gramempat-gram
97
241000
2000
Kami akan memberitahu berapa kali empat-gram tertentu
04:18
appearedmuncul in booksbuku in 1801, 1802, 1803,
98
243000
2000
muncul dalam buku di tahun 1801, 1802, 1803,
04:20
all the way up to 2008.
99
245000
2000
sampai 2008.
04:22
That givesmemberi us a time seriesseri
100
247000
2000
Itu akan menghasilkan rangkaian waktu
04:24
of how frequentlysering this particulartertentu sentencekalimat was used over time.
101
249000
2000
seberapa sering frasa tertentu ini digunakan dalam periode tertentu.
04:26
We do that for all the wordskata-kata and phrasesfrase that appearmuncul in those booksbuku,
102
251000
3000
Kami melakukan itu pada semua kata dan frasa yang muncul dalam buku-buku itu,
04:29
and that givesmemberi us a bigbesar tablemeja of two billionmilyar linesgaris
103
254000
3000
dan itu menghasilkan segepok dua miliar baris
04:32
that tell us about the way culturebudaya has been changingberubah.
104
257000
2000
yang menunjukkan bagaimana budaya berubah.
04:34
ELAELA: So those two billionmilyar linesgaris,
105
259000
2000
ELA: Jadi dua miliar baris itu,
04:36
we call them two billionmilyar n-gramsn-gram.
106
261000
2000
kami menyebutkan dua miliar n-gram.
04:38
What do they tell us?
107
263000
2000
Apa yang ditunjukkan?
04:40
Well the individualindividu n-gramsn-gram measuremengukur culturalkultural trendstren.
108
265000
2000
Masing-masing n-gram menunjukkan perkembangan tren budaya.
04:42
Let me give you an examplecontoh.
109
267000
2000
Mari saya perlihatkan contohnya.
04:44
Let's supposeseharusnya that I am thrivingberkembang,
110
269000
2000
Misalkan kata "thriving" dalam Bahasa Inggris
04:46
then tomorrowbesok I want to tell you about how well I did.
111
271000
2000
kalau saya ingin menggunakan bentuk lampau kata itu.
04:48
And so I mightmungkin say, "YesterdayKemarin, I throvethrove."
112
273000
3000
Saya mungkin menggunakan, "throve."
04:51
AlternativelyAtau, I could say, "YesterdayKemarin, I thrivedberkembang."
113
276000
3000
Selain itu saya juga bisa menggunakan, "thrived."
04:54
Well whichyang one should I use?
114
279000
3000
Mana yang harus saya gunakan?
04:57
How to know?
115
282000
2000
Bagaimana kita bisa tahu?
04:59
As of about sixenam monthsbulan agolalu,
116
284000
2000
Sekitar enam bulan lalu,
05:01
the statenegara of the artseni in this fieldbidang
117
286000
2000
cara terbaik dalam bidang ini
05:03
is that you would, for instancecontoh,
118
288000
2000
yang bisa kita lakukan, misalnya,
05:05
go up to the followingberikut psychologistpsikolog with fabulousmenakjubkan hairrambut,
119
290000
2000
mengunjungi psikolog dengan rambut indah ini,
05:07
and you'dAnda akan say,
120
292000
2000
dan berkata,
05:09
"SteveSteve, you're an expertahli on the irregulartidak beraturan verbskata kerja.
121
294000
3000
"Steve, Anda ahli dalam kata kerja tidak beraturan.
05:12
What should I do?"
122
297000
2000
Apa yang harus saya gunakan?"
05:14
And he'ddia akan tell you, "Well mostpaling people say thrivedberkembang,
123
299000
2000
Dia akan menjawab, "Kebanyakan orang menggunakan "thrived",
05:16
but some people say throvethrove."
124
301000
3000
tapi ada beberapa yang mengatakan "throve."
05:19
And you alsojuga knewtahu, more or lesskurang,
125
304000
2000
Kurang lebih Anda pasti tahu
05:21
that if you were to go back in time 200 yearstahun
126
306000
3000
kalau kita kembali ke masa 200 tahun lalu
05:24
and askmeminta the followingberikut statesmannegarawan with equallysama fabulousmenakjubkan hairrambut,
127
309000
3000
dan bertanya ke pejabat yang juga punya rambut indah ini,
05:27
(LaughterTawa)
128
312000
3000
(Suara tawa)
05:30
"TomTom, what should I say?"
129
315000
2000
"Tom, apa yang harus saya gunakan?"
05:32
He'dIa akan say, "Well, in my day, mostpaling people throvethrove,
130
317000
2000
Dia akan menjawab, "Yang saya tahu, kebanyakan orang menggunakan 'throve',
05:34
but some thrivedberkembang."
131
319000
3000
tapi ada beberapa yang mengatakan 'thrived".
05:37
So now what I'm just going to showmenunjukkan you is rawmentah datadata.
132
322000
2000
Yang akan saya tunjukkan hanyalah data mentah.
05:39
Two rowsbaris from this tablemeja of two billionmilyar entriesentri.
133
324000
4000
Dua baris dari tabel berisi dua miliar catatan ini.
05:43
What you're seeingmelihat is yeartahun by yeartahun frequencyfrekuensi
134
328000
2000
Yang Anda lihat adalah frekuensi tahun demi tahun
05:45
of "thrivedberkembang" and "throvethrove" over time.
135
330000
3000
kata "thrived" dan "throve".
05:49
Now this is just two
136
334000
2000
Ini baru dua dari
05:51
out of two billionmilyar rowsbaris.
137
336000
3000
dua miliar baris.
05:54
So the entireseluruh datadata setset
138
339000
2000
Jadi keseluruhan data yang ada
05:56
is a billionmilyar timeswaktu more awesomemengagumkan than this slidemeluncur.
139
341000
3000
miliaran kali lebih keren dari ini.
05:59
(LaughterTawa)
140
344000
2000
(Suara tawa)
06:01
(ApplauseTepuk tangan)
141
346000
4000
(Tepuk tangan)
06:05
JMJM: Now there are manybanyak other picturesfoto-foto that are worthbernilai 500 billionmilyar wordskata-kata.
142
350000
2000
JM: Ada banyak gambar yang bernilai lebih dari 500 miliar kata.
06:07
For instancecontoh, this one.
143
352000
2000
Yang ini misalnya.
06:09
If you just take influenzainfluensa,
144
354000
2000
Kalau kita gunakan kata "influenza",
06:11
you will see peakspuncak at the time where you knewtahu
145
356000
2000
bisa kita lihat puncaknya di saat
06:13
bigbesar fluflu epidemicsepidemi were killingpembunuhan people around the globedunia.
146
358000
3000
epidemi flu membunuh orang-orang dunia.
06:16
ELAELA: If you were not yetnamun convincedyakin,
147
361000
3000
ELA: Kalau Anda belum yakin bahwa
06:19
sealaut levelstingkat are risingkenaikan,
148
364000
2000
tingkat permukaan laut meningkat,
06:21
so is atmosphericatmosfer COCO2 and globalglobal temperaturesuhu.
149
366000
3000
begitu juga dengan CO2 di atmosfer dan suhu global.
06:24
JMJM: You mightmungkin alsojuga want to have a look at this particulartertentu n-gramn-gram,
150
369000
3000
JM: Anda mungkin juga ingin melihat n-gram yang ini,
06:27
and that's to tell NietzscheNietzsche that God is not deadmati,
151
372000
3000
dan ini untuk memberitahu Nietzsche bahwa Tuhan belum mati,
06:30
althoughmeskipun you mightmungkin agreesetuju that he mightmungkin need a better publicistHumas.
152
375000
3000
meski Anda mungkin setuju yang dia butuhkan sebenarnya penerbit yang lebih baik.
06:33
(LaughterTawa)
153
378000
2000
(Suara tawa)
06:35
ELAELA: You can get at some prettycantik abstractabstrak conceptskonsep with this sortmenyortir of thing.
154
380000
3000
ELA: Anda bisa mendapatkan konsep yang sangat abstrak dengan ini.
06:38
For instancecontoh, let me tell you the historysejarah
155
383000
2000
Misalnya, mari saya ceritakan sejarah
06:40
of the yeartahun 1950.
156
385000
2000
dari tahun 1950.
06:42
PrettyAyu much for the vastluas majoritymayoritas of historysejarah,
157
387000
2000
Seperti kebanyakan periode dalam sejarah,
06:44
no one gavememberi a damnmengutuk about 1950.
158
389000
2000
tidak ada yang peduli dengan tahun 1950.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
Di tahun 1700, 1800, 1900,
06:48
no one caredpeduli.
160
393000
3000
tidak ada yang peduli.
06:52
ThroughMelalui the 30s and 40s,
161
397000
2000
Sepanjang tahun 30-an dan 40-an,
06:54
no one caredpeduli.
162
399000
2000
tidak ada yang peduli.
06:56
SuddenlyTiba-tiba, in the mid-pertengahan-40s,
163
401000
2000
Tiba-tiba, di pertengahan tahun 40-an,
06:58
there starteddimulai to be a buzzBuzz.
164
403000
2000
mulai ramai.
07:00
People realizedmenyadari that 1950 was going to happenterjadi,
165
405000
2000
Orang-orang sadar bahwa tahun 1950 akan segera tiba,
07:02
and it could be bigbesar.
166
407000
2000
dan bisa jadi sesuatu yang besar.
07:04
(LaughterTawa)
167
409000
3000
(Suara tawa)
07:07
But nothing got people interestedtertarik in 1950
168
412000
3000
Tapi puncak ketertarikan orang-orang akan tahun 1950
07:10
like the yeartahun 1950.
169
415000
3000
adalah di tahun 1950.
07:13
(LaughterTawa)
170
418000
3000
(Suara tawa)
07:16
People were walkingberjalan around obsessedterobsesi.
171
421000
2000
Orang-orang semua terobsesi.
07:18
They couldn'ttidak bisa stop talkingpembicaraan
172
423000
2000
Mereka tidak bisa berhenti bicara
07:20
about all the things they did in 1950,
173
425000
3000
tentang hal-hal yang mereka lakukan di tahun 1950,
07:23
all the things they were planningperencanaan to do in 1950,
174
428000
3000
semua yang akan mereka lakukan di tahun 1950,
07:26
all the dreamsmimpi of what they wanted to accomplishmenyelesaikan in 1950.
175
431000
5000
semua mimpi yang ingin mereka capai di tahun 1950.
07:31
In factfakta, 1950 was so fascinatingmenarik
176
436000
2000
Bahkan, tahun 1950 begitu menariknya
07:33
that for yearstahun thereafterkemudian,
177
438000
2000
hingga beberapa tahun kemudian,
07:35
people just keptterus talkingpembicaraan about all the amazingmenakjubkan things that happenedterjadi,
178
440000
3000
orang-orang masih terus berbicara tentang hal-hal yang terjadi,
07:38
in '51, '52, '53.
179
443000
2000
di tahun 1951, 1952, 1953.
07:40
FinallyAkhirnya in 1954,
180
445000
2000
Akhirnya di tahun 1954,
07:42
someonesome one woketerbangun up and realizedmenyadari
181
447000
2000
seseorang bangun dan menyadari
07:44
that 1950 had gottensudah somewhatagak passlulusé.
182
449000
4000
bahwa tahun 1950 sudah lewat.
07:48
(LaughterTawa)
183
453000
2000
(Suara tawa)
07:50
And just like that, the bubblegelembung burstledakan.
184
455000
2000
Seperti itu saja, gelembungnya pun meledak.
07:52
(LaughterTawa)
185
457000
2000
(Suara tawa)
07:54
And the storycerita of 1950
186
459000
2000
Cerita tentang tahun 1950
07:56
is the storycerita of everysetiap yeartahun that we have on recordmerekam,
187
461000
2000
adalah cerita tahunan yang kita catat,
07:58
with a little twisttwist, because now we'vekita sudah got these nicebagus chartsgrafik.
188
463000
3000
dengan sedikit variasi karena sekarang kita punya grafik yang keren ini.
08:01
And because we have these nicebagus chartsgrafik, we can measuremengukur things.
189
466000
3000
Karena kita punya grafik keren ini, kita bisa mengukur.
08:04
We can say, "Well how fastcepat does the bubblegelembung burstledakan?"
190
469000
2000
Kita bisa berkata, "Seberapa cepat gelembung ini meledak?"
08:06
And it turnsberubah out that we can measuremengukur that very preciselytepat.
191
471000
3000
Ternyata kita bisa mengukurnya dengan sangat tepat.
08:09
EquationsPersamaan were derivedditurunkan, graphsgrafik were produceddiproduksi,
192
474000
3000
Menghasilkan persamaan, menciptakan grafik,
08:12
and the netbersih resulthasil
193
477000
2000
dan hasil bersihnya
08:14
is that we find that the bubblegelembung burstssemburan fasterlebih cepat and fasterlebih cepat
194
479000
3000
adalah kita menemukan gelembung ini meledak semakin cepat
08:17
with eachsetiap passinglewat yeartahun.
195
482000
2000
setiap tahunnya.
08:19
We are losingkekalahan interestbunga in the pastlalu more rapidlycepat.
196
484000
5000
Kita kehilangan minat terhadap masa lalu dengan lebih cepat.
08:24
JMJM: Now a little piecebagian of careerkarier advicenasihat.
197
489000
2000
JM: Sedikit nasihat karir.
08:26
So for those of you who seekmencari to be famousterkenal,
198
491000
2000
Bagi Anda yang ingin menjadi terkenal,
08:28
we can learnbelajar from the 25 mostpaling famousterkenal politicalpolitik figuresangka,
199
493000
2000
kita bisa belajar dari 25 tokoh politik yang paling terkenal,
08:30
authorspenulis, actorsaktor and so on.
200
495000
2000
penulis, aktor, dan sebagainya.
08:32
So if you want to becomemenjadi famousterkenal earlyawal on, you should be an actoraktor,
201
497000
3000
Kalau Anda ingin cepat terkenal, Anda harus menjadi aktor,
08:35
because then fameketenaran startsdimulai risingkenaikan by the endakhir of your 20s --
202
500000
2000
karena ketenaran mulai naik di akhir usia 20-an --
08:37
you're still youngmuda, it's really great.
203
502000
2000
Anda masih muda, benar-benar bagus.
08:39
Now if you can wait a little bitsedikit, you should be an authorpenulis,
204
504000
2000
Kalau Anda mau menunggu, Anda harus menjadi penulis,
08:41
because then you risenaik to very great heightsketinggian,
205
506000
2000
karena Anda bisa naik sangat tinggi,
08:43
like MarkMark TwainKembar, for instancecontoh: extremelysangat famousterkenal.
206
508000
2000
seperti Mark Twain, misalnya: sangat terkenal.
08:45
But if you want to reachmencapai the very toppuncak,
207
510000
2000
Tapi kalau Anda ingin mencapai puncak,
08:47
you should delaymenunda gratificationkepuasan
208
512000
2000
Anda harus mau menunggu lebih lama
08:49
and, of courseTentu saja, becomemenjadi a politicianpolitikus.
209
514000
2000
dan, tentu saja, menjadi politikus.
08:51
So here you will becomemenjadi famousterkenal by the endakhir of your 50s,
210
516000
2000
Di sini Anda akan menjadi terkenal di akhir usia 50-an,
08:53
and becomemenjadi very, very famousterkenal afterwardkemudian.
211
518000
2000
dan menjadi sangat terkenal sesudahnya.
08:55
So scientistsilmuwan alsojuga tendcenderung to get famousterkenal when they're much olderlebih tua.
212
520000
3000
Ilmuwan juga cenderung menjadi terkenal di usia tua.
08:58
Like for instancecontoh, biologistsahli biologi and physicsfisika
213
523000
2000
Misalnya, ahli biologi dan fisika
09:00
tendcenderung to be almosthampir as famousterkenal as actorsaktor.
214
525000
2000
cenderung hampir sama terkenalnya dengan aktor.
09:02
One mistakekesalahan you should not do is becomemenjadi a mathematicianahli matematika.
215
527000
3000
Yang tidak boleh Anda lakukan adalah menjadi ahli matematika.
09:05
(LaughterTawa)
216
530000
2000
(Suara tawa)
09:07
If you do that,
217
532000
2000
Kalau Anda melakukan itu,
09:09
you mightmungkin think, "Oh great. I'm going to do my bestterbaik work when I'm in my 20s."
218
534000
3000
Anda mungkin berpikir, "Baiklah. Saya akan menghasilkan karya terbaik di usia 20-an."
09:12
But guesskira what, nobodytak seorangpun will really carepeduli.
219
537000
2000
Tapi coba tebak, tidak ada yang peduli.
09:14
(LaughterTawa)
220
539000
3000
(Suara tawa)
09:17
ELAELA: There are more soberingserius notescatatan
221
542000
2000
ELA: Ada catatan yang lebih serius
09:19
amongantara the n-gramsn-gram.
222
544000
2000
tentang n-gram.
09:21
For instancecontoh, here'sini the trajectorylintasan of MarcMarc ChagallChagall,
223
546000
2000
Misalnya, inilah lintasan Marc Chagall,
09:23
an artistartis bornlahir in 1887.
224
548000
2000
seniman yang lahir di tahun 1887.
09:25
And this looksterlihat like the normalnormal trajectorylintasan of a famousterkenal personorang.
225
550000
3000
Ini tampak seperti lintasan normal orang terkenal.
09:28
He getsmendapat more and more and more famousterkenal,
226
553000
4000
Dia menjadi semakin terkenal,
09:32
exceptkecuali if you look in GermanJerman.
227
557000
2000
kecuali kalau Anda melihat dalam data bahasa Jerman.
09:34
If you look in GermanJerman, you see something completelysama sekali bizarreaneh,
228
559000
2000
Dalam bahasa Jerman, ada sesuatu yang sangat aneh,
09:36
something you prettycantik much never see,
229
561000
2000
sesuatu yang jarang Anda lihat,
09:38
whichyang is he becomesmenjadi extremelysangat famousterkenal
230
563000
2000
dia menjadi sangat terkenal
09:40
and then all of a suddentiba-tiba plummetsmerosot,
231
565000
2000
dan tiba-tiba anjlok,
09:42
going throughmelalui a nadirNadir betweenantara 1933 and 1945,
232
567000
3000
mencapai titik dasar antara 1933 dan 1945,
09:45
before reboundingrebound afterwardkemudian.
233
570000
3000
sebelum naik lagi setelahnya.
09:48
And of courseTentu saja, what we're seeingmelihat
234
573000
2000
Tentu saja, yang kita lihat adalah
09:50
is the factfakta MarcMarc ChagallChagall was a JewishYahudi artistartis
235
575000
3000
kenyataan bahwa Marc Chagall adalah artis Yahudi
09:53
in NaziNazi GermanyJerman.
236
578000
2000
di negara Nazi Jerman.
09:55
Now these signalssinyal
237
580000
2000
Sinyal ini
09:57
are actuallysebenarnya so strongkuat
238
582000
2000
sangat kuat
09:59
that we don't need to know that someonesome one was censoreddisensor.
239
584000
3000
kita tidak perlu tahu bahwa seseorang disensor.
10:02
We can actuallysebenarnya figureangka it out
240
587000
2000
Kita bisa melihatnya
10:04
usingmenggunakan really basicdasar signalsinyal processingpengolahan.
241
589000
2000
menggunakan pengolahan sinyal yang paling dasar.
10:06
Here'sBerikut adalah a simplesederhana way to do it.
242
591000
2000
Inilah cara sederhana untuk melakukannya.
10:08
Well, a reasonablemasuk akal expectationharapan
243
593000
2000
Harapan yang masuk akal
10:10
is that somebody'sseseorang fameketenaran in a givendiberikan periodperiode of time
244
595000
2000
seseorang terkenal dalam periode waktu tertentu
10:12
should be roughlykurang lebih the averagerata-rata of theirmereka fameketenaran before
245
597000
2000
seharusnya kurang lebih sama dengan ketenaran mereka
10:14
and theirmereka fameketenaran after.
246
599000
2000
sebelum dan sesudahnya.
10:16
So that's sortmenyortir of what we expectmengharapkan.
247
601000
2000
Jadi itulah yang kita harapkan.
10:18
And we comparemembandingkan that to the fameketenaran that we observemengamati.
248
603000
3000
Kita membandingkan itu dengan ketenaran yang kita amati.
10:21
And we just dividemembagi one by the other
249
606000
2000
Kita cukup membagi satu hal dengan yang lainnya
10:23
to producemenghasilkan something we call a suppressionpenindasan indexindeks.
250
608000
2000
untuk mendapatkan apa yang kita sebut indeks tekanan.
10:25
If the suppressionpenindasan indexindeks is very, very, very smallkecil,
251
610000
3000
Kalau indeks tekanan sangat kecil,
10:28
then you very well mightmungkin be beingmakhluk suppressedditekan.
252
613000
2000
kemungkinan Anda sedang ditekan.
10:30
If it's very largebesar, maybe you're benefitingmanfaat from propagandapropaganda.
253
615000
3000
Kalau sangat besar, mungkin Anda diuntungkan oleh propaganda.
10:34
JMJM: Now you can actuallysebenarnya look at
254
619000
2000
JM: Anda bisa melihat
10:36
the distributiondistribusi of suppressionpenindasan indexesIndeks over wholeseluruh populationspopulasi.
255
621000
3000
distribusi indeks tekanan di seluruh populasi.
10:39
So for instancecontoh, here --
256
624000
2000
Misalnya, di sini --
10:41
this suppressionpenindasan indexindeks is for 5,000 people
257
626000
2000
indeks tekanan untuk 5000 orang
10:43
pickeddipetik in EnglishInggris booksbuku where there's no knowndikenal suppressionpenindasan --
258
628000
2000
dipilih dalam buku bahasa Inggris yang diketahui tidak ada tekanan --
10:45
it would be like this, basicallypada dasarnya tightlyrapat centeredberpusat on one.
259
630000
2000
akan seperti ini, intinya berpusat pada satu titik.
10:47
What you expectmengharapkan is basicallypada dasarnya what you observemengamati.
260
632000
2000
Yang Anda harapkan adalah yang Anda lihat.
10:49
This is distributiondistribusi as seenterlihat in GermanyJerman --
261
634000
2000
Ini distribusi seperti yang tampak di Jerman --
10:51
very differentberbeda, it's shiftedbergeser to the left.
262
636000
2000
sangat berbeda, bergeser ke kiri.
10:53
People talkedberbicara about it twicedua kali lesskurang as it should have been.
263
638000
3000
Orang-orang membicarakannya dua kali lebih sedikit dari yang seharusnya.
10:56
But much more importantlypenting, the distributiondistribusi is much widerlebih luas.
264
641000
2000
Tapi yang jauh lebih penting, distribusinya sangat lebar.
10:58
There are manybanyak people who endakhir up on the farjauh left on this distributiondistribusi
265
643000
3000
Ada banyak orang yang akhirnya ada di pojok kiri distribusi ini
11:01
who are talkedberbicara about 10 timeswaktu fewerlebih sedikit than they should have been.
266
646000
3000
yang berbicara sekitar 10 kali lebih sedikit dari yang seharusnya.
11:04
But then alsojuga manybanyak people on the farjauh right
267
649000
2000
Tapi ada banyak juga orang di pojok kanan
11:06
who seemterlihat to benefitmanfaat from propagandapropaganda.
268
651000
2000
yang diuntungkan oleh propaganda ini.
11:08
This picturegambar is the hallmarkciri khas of censorshipsensor in the bookBook recordmerekam.
269
653000
3000
Gambar ini adalah rekaman penyensoran dalam sejarah buku.
11:11
ELAELA: So culturomicsculturomics
270
656000
2000
ELA: Jadi kulturomika
11:13
is what we call this methodmetode.
271
658000
2000
itulah sebutan untuk metode ini.
11:15
It's kindjenis of like genomicsgenomik.
272
660000
2000
Seperti genomika.
11:17
ExceptKecuali genomicsgenomik is a lenslensa on biologybiologi
273
662000
2000
Hanya saja genomika menggunakan kacamata biologi
11:19
throughmelalui the windowjendela of the sequenceurutan of basesdasar in the humanmanusia genomegenom.
274
664000
3000
melalui jendela rangkaian basa dalam genom manusia.
11:22
CulturomicsCulturomics is similarserupa.
275
667000
2000
Kulturomika hampir mirip.
11:24
It's the applicationaplikasi of massive-scaleskala besar datadata collectionkoleksi analysisanalisis
276
669000
3000
Ini adalah aplikasi analisis pengumpulan data skala besar
11:27
to the studybelajar of humanmanusia culturebudaya.
277
672000
2000
untuk penelitian budaya manusia.
11:29
Here, insteadsebagai gantinya of throughmelalui the lenslensa of a genomegenom,
278
674000
2000
Di sini, alih-alih melalui kacamata genom,
11:31
throughmelalui the lenslensa of digitizedDigital piecespotongan of the historicalhistoris recordmerekam.
279
676000
3000
kami melalui kacamata potongan digital catatan sejarah.
11:34
The great thing about culturomicsculturomics
280
679000
2000
Yang menarik tentang kulturomika ini
11:36
is that everyonesemua orang can do it.
281
681000
2000
semua orang bisa melakukannya.
11:38
Why can everyonesemua orang do it?
282
683000
2000
Mengapa semua orang bisa melakukannya?
11:40
EveryoneSemua orang can do it because threetiga guys,
283
685000
2000
Semua orang bisa melakukannya berkat tiga orang ini,
11:42
JonJon OrwantOrwant, MattMatt GrayAbu-abu and Will BrockmanBrockman over at GoogleGoogle,
284
687000
3000
Jon Orwant, Matt Gray, dan Will Brockman di Google,
11:45
saw the prototypeprototipe of the NgramNgram ViewerPenampil,
285
690000
2000
melihat prototip Ngram Viewer,
11:47
and they said, "This is so funmenyenangkan.
286
692000
2000
dan berkata, "Ini asyik.
11:49
We have to make this availabletersedia for people."
287
694000
3000
Kita harus membuatnya untuk umum."
11:52
So in two weeksminggu flatdatar -- the two weeksminggu before our paperkertas camedatang out --
288
697000
2000
Jadi tepat dalam dua minggu - sebelum makalah kami terbit --
11:54
they codedKode up a versionversi of the NgramNgram ViewerPenampil for the generalumum publicpublik.
289
699000
3000
mereka membuat versi Ngram Viewer untuk khalayak umum.
11:57
And so you too can typemengetik in any wordkata or phrasefrasa that you're interestedtertarik in
290
702000
3000
Jadi Anda bisa mengetikkan kata atau frasa yang menarik minat Anda
12:00
and see its n-gramn-gram immediatelysegera --
291
705000
2000
dan langsung melihat n-gramnya --
12:02
alsojuga browseJelajahi examplescontoh of all the variousberbagai booksbuku
292
707000
2000
juga menelusuri contoh-contoh berbagai buku
12:04
in whichyang your n-gramn-gram appearsmuncul.
293
709000
2000
yang memuat n-gram Anda tadi.
12:06
JMJM: Now this was used over a millionjuta timeswaktu on the first day,
294
711000
2000
JM: Perangkat ini digunakan lebih dari satu juta kali dalam hari pertama,
12:08
and this is really the bestterbaik of all the queriespertanyaan.
295
713000
2000
dan ini yang terbaik dari semua permintaan yang ada.
12:10
So people want to be theirmereka bestterbaik, put theirmereka bestterbaik footkaki forwardmeneruskan.
296
715000
3000
orang-orang selalu ingin melakukan yang terbaik.
12:13
But it turnsberubah out in the 18thth centuryabad, people didn't really carepeduli about that at all.
297
718000
3000
Tapi ternyata di abad ke-18, orang-orang tidak peduli dengan hal itu.
12:16
They didn't want to be theirmereka bestterbaik, they wanted to be theirmereka beftbeft.
298
721000
3000
Mereka tidak ingin melakukan yang terbaik, "best", tapi "beft".
12:19
So what happenedterjadi is, of courseTentu saja, this is just a mistakekesalahan.
299
724000
3000
Tentu saja, ini hanya kesalahan.
12:22
It's not that stroveberjuang for mediocritybiasa-biasa saja,
300
727000
2000
Bukan orang-orang saat itu ingin menjadi biasa saja,
12:24
it's just that the S used to be writtentertulis differentlyberbeda, kindjenis of like an F.
301
729000
3000
tapi karena saat itu huruf S ditulis berbeda, seperti huruf F.
12:27
Now of courseTentu saja, GoogleGoogle didn't pickmemilih this up at the time,
302
732000
3000
Google tidak mengetahui ini saat itu,
12:30
so we reporteddilaporkan this in the scienceilmu articleartikel that we wrotemenulis.
303
735000
3000
jadi kami melaporkan ini dalam artikel ilmiah yang kami tulis.
12:33
But it turnsberubah out this is just a reminderpengingat
304
738000
2000
Tapi ini ternyata menjadi sebuah peringatan
12:35
that, althoughmeskipun this is a lot of funmenyenangkan,
305
740000
2000
bahwa meskipun menyenangkan,
12:37
when you interpretmenafsirkan these graphsgrafik, you have to be very carefulcermat,
306
742000
2000
saat menginterpretasikan grafik ini, Anda harus hati-hati,
12:39
and you have to adoptmengambil the basemendasarkan standardsstandar in the sciencesilmu.
307
744000
3000
dan Anda harus mengadopsi standar dasar dalam ilmu pengetahuan.
12:42
ELAELA: People have been usingmenggunakan this for all kindsmacam of funmenyenangkan purposestujuan.
308
747000
3000
ELA: Orang-orang menggunakannya untuk bermain-main.
12:45
(LaughterTawa)
309
750000
7000
(Suara tawa)
12:52
ActuallyBenar-benar, we're not going to have to talk,
310
757000
2000
Sebenarnya, kami bahkan tidak perlu bicara,
12:54
we're just going to showmenunjukkan you all the slidesslide and remaintetap silentdiam.
311
759000
3000
hanya perlu menunjukkan semua slide yang ada dan diam.
12:57
This personorang was interestedtertarik in the historysejarah of frustrationfrustrasi.
312
762000
3000
Orang ini tertarik pada sejarah frustrasi.
13:00
There's variousberbagai typesjenis of frustrationfrustrasi.
313
765000
3000
Ada banyak jenis frustrasi.
13:03
If you stubRintisan your toekaki, that's a one A "arghArgh."
314
768000
3000
Kalau Anda tersandung, itu "argh" dengan satu A.
13:06
If the planetplanet EarthBumi is annihilatedseluruhnya binasa by the VogonsVogons
315
771000
2000
Kalau planet Bumi dimusnahkan oleh Vogon
13:08
to make roomkamar for an interstellarantar bintang bypassBypass,
316
773000
2000
yang datang melalui jalan pintas antargalaksi,
13:10
that's an eightdelapan A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
itu "aaaaaaaargh" dengan delapan A.
13:12
This personorang studiesstudi all the "arghsarghs,"
318
777000
2000
Orang ini menyelidiki semua "argh,"
13:14
from one throughmelalui eightdelapan A'sA.
319
779000
2000
mulai dari satu sampai delapan A.
13:16
And it turnsberubah out
320
781000
2000
Ternyata
13:18
that the less-frequentterlalu sering "arghsarghs"
321
783000
2000
semakin sedikit "argh"
13:20
are, of courseTentu saja, the onesyang that correspondsesuai to things that are more frustratingfrustrasi --
322
785000
3000
tentu saja menyatakan hal-hal yang lebih membuat frustrasi --
13:23
exceptkecuali, oddlyaneh, in the earlyawal 80s.
323
788000
3000
kecuali, anehnya, di awal tahun 80-an.
13:26
We think that mightmungkin have something to do with ReaganReagan.
324
791000
2000
Kami pikir ini berhubungan dengan Reagan.
13:28
(LaughterTawa)
325
793000
2000
(Suara tawa)
13:30
JMJM: There are manybanyak usagespenggunaan of this datadata,
326
795000
3000
JM: Ada banyak kegunaan data ini,
13:33
but the bottombawah linegaris is that the historicalhistoris recordmerekam is beingmakhluk digitizedDigital.
327
798000
3000
tapi pada dasarnya catatan sejarah sedang didigitalkan.
13:36
GoogleGoogle has starteddimulai to digitizemendigitalkan 15 millionjuta booksbuku.
328
801000
2000
Google sudah mulai mendigitalkan 15 juta buku.
13:38
That's 12 percentpersen of all the booksbuku that have ever been publishedditerbitkan.
329
803000
2000
Itu 12 persen dari semua buku yang pernah diterbitkan.
13:40
It's a sizablecukup besar chunkbingkah of humanmanusia culturebudaya.
330
805000
3000
Itu bagian yang cukup besar dari budaya manusia.
13:43
There's much more in culturebudaya: there's manuscriptsmanuskrip, there newspaperskoran,
331
808000
3000
Ada banyak budaya: naskah, koran,
13:46
there's things that are not textteks, like artseni and paintingslukisan.
332
811000
2000
ada yang bukan berupa teks, seperti seni dan lukisan.
13:48
These all happenterjadi to be on our computerskomputer,
333
813000
2000
Semua ini ada dalam komputer kita,
13:50
on computerskomputer acrossmenyeberang the worlddunia.
334
815000
2000
komputer di seluruh dunia.
13:52
And when that happensterjadi, that will transformmengubah the way we have
335
817000
3000
Dan ketika itu terjadi, itu akan mengubah cara kita
13:55
to understandmemahami our pastlalu, our presentmenyajikan and humanmanusia culturebudaya.
336
820000
2000
memahami masa lalu, masa kini, dan budaya manusia.
13:57
Thank you very much.
337
822000
2000
Terima kasih banyak.
13:59
(ApplauseTepuk tangan)
338
824000
3000
(Tepuk tangan)
Translated by Ade Indarta
Reviewed by Antonius Yudi Sendjaja

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com