ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

Ce am învățat din 5 milioane de cărți

Filmed:
2,049,453 views

V-ați jucat vreodată cu aplicația Google Ngram Viewer? Este un instrument care dă dependență și care permite căutarea unor cuvinte și idei într-o bază de date de 5 milioane de cărți din toate timpurile. Erez Lieberman Aiden și Jean-Baptiste Michel ne arată cum funcționează și câteva dintre lucrurile uimitoare pe care le putem învăța din 500 de miliarde de cuvinte.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
ErezErez LiebermanLieberman AidenAiden: EveryoneToată lumea knowsștie
0
0
2000
Erez Lieberman Aiden: Toată lumea știe
00:17
that a pictureimagine is worthin valoare de a thousandmie wordscuvinte.
1
2000
3000
că o poză valorează cât o mie de cuvinte.
00:22
But we at HarvardHarvard
2
7000
2000
Dar noi cei de la Harvard,
00:24
were wonderingîntrebându- if this was really trueAdevărat.
3
9000
3000
ne gândeam cât de adevărat este.
00:27
(LaughterRâs)
4
12000
2000
(Râsete)
00:29
So we assembledasamblate a teamechipă of expertsexperți,
5
14000
4000
Așa că am adunat o echipă de experți,
00:33
spanningse întinde HarvardHarvard, MITMIT,
6
18000
2000
de la Harvard, MIT (Institutul Tehnologic din Massachusetts),
00:35
The AmericanAmerican HeritagePatrimoniu DictionaryDicţionar, The EncyclopediaEnciclopedia BritannicaBritannica
7
20000
3000
American Heritage Dictionary, Encyclopedia Britannica
00:38
and even our proudmândru sponsorssponsori,
8
23000
2000
și chiar și pe mândrii noștri sponsori,
00:40
the GoogleGoogle.
9
25000
3000
Google.
00:43
And we cogitatedcogitated about this
10
28000
2000
Și am dezbătut această problemă
00:45
for about fourpatru yearsani.
11
30000
2000
timp de aproape patru ani.
00:47
And we camea venit to a startlingsurprinzatoare conclusionconcluzie.
12
32000
5000
Și am ajuns la o concluzie surprinzătoare.
00:52
LadiesDoamnelor and gentlemendomnilor, a pictureimagine is not worthin valoare de a thousandmie wordscuvinte.
13
37000
3000
Doamnelor și domnilor, o poză nu valorează cât o mie de cuvinte.
00:55
In factfapt, we foundgăsite some picturespoze
14
40000
2000
Chiar am găsit unele poze,
00:57
that are worthin valoare de 500 billionmiliard wordscuvinte.
15
42000
5000
care valorează 500 de miliarde de cuvinte.
01:02
Jean-BaptisteJean-Baptiste MichelMichel: So how did we get to this conclusionconcluzie?
16
47000
2000
Jean-Baptiste Michel: Cum am ajuns la această concluzie?
01:04
So ErezErez and I were thinkinggândire about waysmoduri
17
49000
2000
Eu și Erez ne gândeam la modalități
01:06
to get a bigmare pictureimagine of humanuman culturecultură
18
51000
2000
de a cuprinde într-o mare poză cultura umană
01:08
and humanuman historyistorie: changeSchimbare over time.
19
53000
3000
și istoria umanității: schimbarea de-a lungul timpului.
01:11
So manymulți bookscărți actuallyde fapt have been writtenscris over the yearsani.
20
56000
2000
În toți acești ani au fost scrise foarte multe cărți.
01:13
So we were thinkinggândire, well the bestCel mai bun way to learnînvăța from them
21
58000
2000
Așa că ne gândeam că cea mai bună metodă să învățăm din ele,
01:15
is to readcitit all of these millionsmilioane of bookscărți.
22
60000
2000
este să citim toate aceste milioane de cărți.
01:17
Now of coursecurs, if there's a scalescară for how awesomeminunat that is,
23
62000
3000
Bineînțeles că dacă ar exista o scală pentru cât de grozavă e ideea,
01:20
that has to rankrang extremelyextrem, extremelyextrem highînalt.
24
65000
3000
s-ar afla undeva foarte, foarte sus.
01:23
Now the problemproblemă is there's an X-axisAxa x for that,
25
68000
2000
Problema este că există și o axă X pentru asta,
01:25
whichcare is the practicalpractic axisaxă.
26
70000
2000
care este axa practică.
01:27
This is very, very lowscăzut.
27
72000
2000
Aceasta este foarte, foarte jos.
01:29
(ApplauseAplauze)
28
74000
3000
(Aplauze)
01:32
Now people tendtind to use an alternativealternativă approachabordare,
29
77000
3000
Oamenii au tendința unei alte abordări,
01:35
whichcare is to take a fewpuțini sourcessurse and readcitit them very carefullycu grija.
30
80000
2000
care este să ia câteva surse și să le citească cu atenție.
01:37
This is extremelyextrem practicalpractic, but not so awesomeminunat.
31
82000
2000
Ceea ce este foarte practic, dar nu foarte grozav.
01:39
What you really want to do
32
84000
3000
Ceea ce se vrea de fapt este,
01:42
is to get to the awesomeminunat yetinca practicalpractic partparte of this spacespaţiu.
33
87000
3000
să avem și partea grozavă și partea practică a acestui spațiu.
01:45
So it turnstransformă out there was a companycompanie acrosspeste the riverrâu calleddenumit GoogleGoogle
34
90000
3000
Așa că am aflat că mai există o companie numită Google
01:48
who had starteda început a digitizationdigitizare projectproiect a fewpuțini yearsani back
35
93000
2000
care începuse cu câțiva ani în urmă un proiect de digitizare,
01:50
that mightar putea just enablepermite this approachabordare.
36
95000
2000
care ar putea să atingă această abordare.
01:52
They have digitizeddigitalizate millionsmilioane of bookscărți.
37
97000
2000
Ei au digitizat milioane de cărți.
01:54
So what that meansmijloace is, one could use computationalcomputațională methodsmetode
38
99000
3000
Ceea ce înseamnă, că prin metode computaționale,
01:57
to readcitit all of the bookscărți in a clickclic of a buttonbuton.
39
102000
2000
cu un singur click, pot fi citite toate cărțile.
01:59
That's very practicalpractic and extremelyextrem awesomeminunat.
40
104000
3000
Ceea ce este foarte practic si foarte grozav.
02:03
ELAELA: Let me tell you a little bitpic about where bookscărți come from.
41
108000
2000
ELA: Permiteți-mi să vă povestesc un pic despre originea cărților.
02:05
SinceDeoarece time immemorialimemorial, there have been authorsautori.
42
110000
3000
Încă din cele mai vechi timpuri, au existat autori.
02:08
These authorsautori have been strivingluptă to writescrie bookscărți.
43
113000
3000
Acești autori s-au străduit să scrie cărți.
02:11
And this becamea devenit considerablyconsiderabil easierMai uşor
44
116000
2000
Proces ce a devenit deosebit de facil
02:13
with the developmentdezvoltare of the printingtipărire presspresa some centuriessecole agoîn urmă.
45
118000
2000
o dată cu dezvoltarea presei de tipar în urmă cu câteva secole.
02:15
SinceDeoarece then, the authorsautori have woncastigat
46
120000
3000
De atunci, autorii au câștigat
02:18
on 129 millionmilion distinctdistinct occasionsocazii,
47
123000
2000
în 129 de milioane de ocazii diferite,
02:20
publishingeditare bookscărți.
48
125000
2000
publicarea cărților.
02:22
Now if those bookscărți are not lostpierdut to historyistorie,
49
127000
2000
Dacă acele cărți nu s-au pierdut în istorie,
02:24
then they are somewhereundeva in a librarybibliotecă,
50
129000
2000
atunci se află undeva într-o bibliotecă,
02:26
and manymulți of those bookscărți have been gettingobtinerea retrievedAdus de from the librariesbiblioteci
51
131000
3000
și multe dintre acele cărți au fost scoase din biblioteci
02:29
and digitizeddigitalizate by GoogleGoogle,
52
134000
2000
și digitizate de către Google,
02:31
whichcare has scannedscanate 15 millionmilion bookscărți to dateData.
53
136000
2000
care până în ziua de azi a scanat 15 milioane de cărți.
02:33
Now when GoogleGoogle digitizesdigitizes a bookcarte, they put it into a really nicefrumos formatformat.
54
138000
3000
Când Google digitizează o carte, o și așează într-un format frumos.
02:36
Now we'vene-am got the datadate, plusla care se adauga we have metadatametadate.
55
141000
2000
Acum avem datele și în plus avem și metadatele.
02:38
We have informationinformație about things like where was it publishedpublicat,
56
143000
3000
Avem informații despre locul de publicare,
02:41
who was the authorautor, when was it publishedpublicat.
57
146000
2000
despre autor, când a fost publicată.
02:43
And what we do is go throughprin all of those recordsînregistrări
58
148000
3000
Ceea ce facem noi este să filtrăm aceste informații
02:46
and excludeexclude everything that's not the highestcel mai inalt qualitycalitate datadate.
59
151000
4000
și să ștergem tot ce nu este de cea mai mare calitate.
02:50
What we're left with
60
155000
2000
Așa că ce avem acum
02:52
is a collectionColectie of fivecinci millionmilion bookscărți,
61
157000
3000
este o colecție de 5 milioane de cărți,
02:55
500 billionmiliard wordscuvinte,
62
160000
3000
500 miliarde de cuvinte,
02:58
a stringşir of characterscaractere a thousandmie timesori longermai lung
63
163000
2000
un șir de caractere de o mie de ori mai lung
03:00
than the humanuman genomegenomului --
64
165000
3000
decât un genom uman --
03:03
a texttext whichcare, when writtenscris out,
65
168000
2000
un text care, dacă ar fi scris,
03:05
would stretchîntinde from here to the MoonLuna and back
66
170000
2000
s-ar întinde de aici, la lună și înapoi
03:07
10 timesori over --
67
172000
2000
de 10 ori --
03:09
a veritableveritabil shardciob of our culturalcultural genomegenomului.
68
174000
4000
o adevărată bucată din genomul nostru cultural.
03:13
Of coursecurs what we did
69
178000
2000
Bineînțeles că ceea ce am făcut
03:15
when facedcu care se confruntă with suchastfel de outrageousscandalos hyperbolehiperbolă ...
70
180000
3000
când ne-am lovit de o asemenea hiperbolă...
03:18
(LaughterRâs)
71
183000
2000
(Râsete)
03:20
was what any self-respectingauto-respectând researcherscercetători
72
185000
3000
a fost ceea ce ar face orice cercetător
03:23
would have doneTerminat.
73
188000
3000
care se respectă.
03:26
We tooka luat a pagepagină out of XKCDXKCD,
74
191000
2000
Am luat o pagină din XKCD,
03:28
and we said, "StandStand back.
75
193000
2000
și am spus, „Dați-vă înapoi.
03:30
We're going to try scienceştiinţă."
76
195000
2000
O să încercăm prin știință.”
03:32
(LaughterRâs)
77
197000
2000
(Râsete)
03:34
JMJM: Now of coursecurs, we were thinkinggândire,
78
199000
2000
JM: Acum noi ne gândeam,
03:36
well let's just first put the datadate out there
79
201000
2000
să punem datele acolo
03:38
for people to do scienceştiinţă to it.
80
203000
2000
și să lăsăm oamenii să experimenteze.
03:40
Now we're thinkinggândire, what datadate can we releaseeliberare?
81
205000
2000
Apoi ne-am întrebat, ce informații să lansăm?
03:42
Well of coursecurs, you want to take the bookscărți
82
207000
2000
Normal că vrei să iei cărțile
03:44
and releaseeliberare the fulldeplin texttext of these fivecinci millionmilion bookscărți.
83
209000
2000
și să vezi tot textul acestor cinci milioane de cărți.
03:46
Now GoogleGoogle, and JonJon OrwantOrwant in particularspecial,
84
211000
2000
Google-ul și în special Jon Orwant,
03:48
told us a little equationecuaţie that we should learnînvăța.
85
213000
2000
ne-au arătat o mică ecuație pe care ar trebui să o învățăm.
03:50
So you have fivecinci millionmilion, that is, fivecinci millionmilion authorsautori
86
215000
3000
Așadar, ai cinci milioane, adică cinci milioane de autori
03:53
and fivecinci millionmilion plaintiffsreclamanţii is a massivemasiv lawsuitproces.
87
218000
3000
și cinci milioane de reclamanți într-un imens proces.
03:56
So, althoughcu toate ca that would be really, really awesomeminunat,
88
221000
2000
Și deși ar fi foarte foarte grozav,
03:58
again, that's extremelyextrem, extremelyextrem impracticalnepractic.
89
223000
3000
din nou, este foarte, foarte ineficace.
04:01
(LaughterRâs)
90
226000
2000
(Râsete)
04:03
Now again, we kinddrăguț of cavedcedat in,
91
228000
2000
Atunci din nou ne-am cam prăbușit,
04:05
and we did the very practicalpractic approachabordare, whichcare was a bitpic lessMai puțin awesomeminunat.
92
230000
3000
și am făcut ceea ce părea mai practic, dar mai puțin grozav.
04:08
We said, well insteadin schimb of releasingeliberarea the fulldeplin texttext,
93
233000
2000
Ne-am hotărât ca, în loc să punem întregul text,
04:10
we're going to releaseeliberare statisticsstatistici about the bookscărți.
94
235000
2000
vom publica statistici despre cărți.
04:12
So take for instanceinstanță "A gleamsclipire of happinessfericire."
95
237000
2000
Spre exemplu „Un strop de fericire.”
04:14
It's fourpatru wordscuvinte; we call that a four-grampatru grame.
96
239000
2000
Sunt patru cuvinte; este ceea ce numim tetragramă.
04:16
We're going to tell you how manymulți timesori a particularspecial four-grampatru grame
97
241000
2000
Vă vom spune de câte ori apare o anumită tetragramă
04:18
appeareda apărut in bookscărți in 1801, 1802, 1803,
98
243000
2000
în cărți, în 1801, 1802, 1803,
04:20
all the way up to 2008.
99
245000
2000
și până în anul 2008.
04:22
That gives us a time seriesserie
100
247000
2000
Ceea ce ne va oferi o serie temporală
04:24
of how frequentlydes this particularspecial sentenceteză was used over time.
101
249000
2000
cu frecvența de utilizare a acestei secvențe de-a lungul timpului.
04:26
We do that for all the wordscuvinte and phrasesexpresii that appearapărea in those bookscărți,
102
251000
3000
Facem asta pentru toate cuvintele și expresiile care apar în acele cărți,
04:29
and that gives us a bigmare tablemasa of two billionmiliard lineslinii
103
254000
3000
și acest lucru ne oferă un mare tabel de două miliarde de linii
04:32
that tell us about the way culturecultură has been changingschimbare.
104
257000
2000
care ne explică cum s-a schimbat cultura.
04:34
ELAELA: So those two billionmiliard lineslinii,
105
259000
2000
ELA: Așadar acele două miliarde de linii,
04:36
we call them two billionmiliard n-gramsn-grame.
106
261000
2000
noi le numim două miliarde de n-grame.
04:38
What do they tell us?
107
263000
2000
Ce ne spun ele?
04:40
Well the individualindividual n-gramsn-grame measuremăsura culturalcultural trendstendințe.
108
265000
2000
N-gramele individuale măsoară trendul cultural.
04:42
Let me give you an exampleexemplu.
109
267000
2000
Să vă dau un exemplu.
04:44
Let's supposepresupune that I am thrivingînfloritoare,
110
269000
2000
Să presupunem că eu acum mă aflu într-o stare de prosperitate,
04:46
then tomorrowMâine I want to tell you about how well I did.
111
271000
2000
iar mâine aș vrea să vă spun dvs. cum mă descurc.
04:48
And so I mightar putea say, "YesterdayIeri, I throvethrove."
112
273000
3000
Așa că aș putea spune, „Ieri, am înflorit.”
04:51
AlternativelyAlternativ, I could say, "YesterdayIeri, I thrivedau inflorit."
113
276000
3000
Sau o altă variantă, aș putea spune, „Ieri, am prosperat.”
04:54
Well whichcare one should I use?
114
279000
3000
Pe care ar trebui să o folosesc?
04:57
How to know?
115
282000
2000
De unde știi?
04:59
As of about sixşase monthsluni agoîn urmă,
116
284000
2000
De cam șase luni încoace,
05:01
the statestat of the artartă in this fieldcamp
117
286000
2000
cel mai bun lucru pe care-l puteai face în acest domeniu,
05:03
is that you would, for instanceinstanță,
118
288000
2000
ar fi ca, spre exemplu,
05:05
go up to the followingca urmare a psychologistpsiholog with fabulousfabulos hairpăr,
119
290000
2000
să mergi la un psiholog specializat cu coafură fabuloasă,
05:07
and you'dte-ai say,
120
292000
2000
și să-i spui,
05:09
"SteveSteve, you're an expertexpert on the irregularneregulat verbsVerbe.
121
294000
3000
„Steve, tu ești expert în verbe.
05:12
What should I do?"
122
297000
2000
Ce ar trebui să fac?”
05:14
And he'dHed tell you, "Well mostcel mai people say thrivedau inflorit,
123
299000
2000
Iar el ți-ar spune, „Păi, cei mai mulți oameni spun „a prospera”,
05:16
but some people say throvethrove."
124
301000
3000
dar unii spun „a înflori”.
05:19
And you alsode asemenea knewștiut, more or lessMai puțin,
125
304000
2000
Și mai mult sau mai puțin știai și că,
05:21
that if you were to go back in time 200 yearsani
126
306000
3000
dacă te-ai întoarce în timp cu 200 de ani
05:24
and askcere the followingca urmare a statesmanom de stat with equallyin aceeasi masura fabulousfabulos hairpăr,
127
309000
3000
și ai întreba un politician cu coafură la fel de fabuloasă,
05:27
(LaughterRâs)
128
312000
3000
(Râsete)
05:30
"TomTom, what should I say?"
129
315000
2000
„Tom, cum ar trebui să spun?”
05:32
He'dEl ar say, "Well, in my day, mostcel mai people throvethrove,
130
317000
2000
El ar spune, „Păi, în vremea mea, cei mai mulți spuneau „a înflori”,
05:34
but some thrivedau inflorit."
131
319000
3000
dar unii spuneau „a prospera.”
05:37
So now what I'm just going to showspectacol you is rawbrut datadate.
132
322000
2000
Ce vă voi arăta în continuare sunt date brute.
05:39
Two rowsrânduri from this tablemasa of two billionmiliard entriesintrări.
133
324000
4000
Două rânduri din acest tabel cu două miliarde de intrări.
05:43
What you're seeingvedere is yearan by yearan frequencyfrecvență
134
328000
2000
Aici vedeți frecvența înregistrată an de an
05:45
of "thrivedau inflorit" and "throvethrove" over time.
135
330000
3000
de-a lungul timpului pentru „a prospera” și „a înflori”.
05:49
Now this is just two
136
334000
2000
Acestea sunt doar două
05:51
out of two billionmiliard rowsrânduri.
137
336000
3000
dintre cele două miliarde de rânduri.
05:54
So the entireîntreg datadate seta stabilit
138
339000
2000
Așa că întreaga bază de date
05:56
is a billionmiliard timesori more awesomeminunat than this slidealuneca.
139
341000
3000
este de un miliard de ori mai grozavă decât acest slide.
05:59
(LaughterRâs)
140
344000
2000
(Râsete)
06:01
(ApplauseAplauze)
141
346000
4000
(Aplauze)
06:05
JMJM: Now there are manymulți other picturespoze that are worthin valoare de 500 billionmiliard wordscuvinte.
142
350000
2000
JM: Sunt multe alte poze care valorează 500 de miliarde de cuvinte.
06:07
For instanceinstanță, this one.
143
352000
2000
Aceasta spre exemplu.
06:09
If you just take influenzagripă,
144
354000
2000
Dacă alegi răceală,
06:11
you will see peaksvârfuri at the time where you knewștiut
145
356000
2000
veți vedea extreme în perioadele în care știați
06:13
bigmare flugripă epidemicsepidemii were killingucidere people around the globeglob.
146
358000
3000
că mari epidemii de gripă au ucis pe tot globul.
06:16
ELAELA: If you were not yetinca convincedconvins,
147
361000
3000
ELA: Dacă nu erați încă convinși,
06:19
seamare levelsniveluri are risingîn creștere,
148
364000
2000
nivelurile mării se ridică,
06:21
so is atmosphericatmosferic COCO2 and globalglobal temperaturetemperatura.
149
366000
3000
ceea ce înseamnă CO2 atmosferic și temperatura globală.
06:24
JMJM: You mightar putea alsode asemenea want to have a look at this particularspecial n-gramn-gram,
150
369000
3000
JM: Poate ați vrea să vă uitați mai atent la această n-gramă,
06:27
and that's to tell NietzscheNietzsche that God is not deadmort,
151
372000
3000
iar asta este pentru a-i spune lui Nietzsche că Dumnezeu nu este mort,
06:30
althoughcu toate ca you mightar putea agreede acord that he mightar putea need a better publicistpublicistul.
152
375000
3000
și poate credeți că ar avea nevoie de un editor mai bun.
06:33
(LaughterRâs)
153
378000
2000
(Râsete)
06:35
ELAELA: You can get at some prettyfrumos abstractabstract conceptsconcepte with this sortfel of thing.
154
380000
3000
ELA: Poți ajunge la niște concepte destul de abstracte cu aceste lucruri.
06:38
For instanceinstanță, let me tell you the historyistorie
155
383000
2000
Spre exemplu, permiteți-mi să vă spun istoria
06:40
of the yearan 1950.
156
385000
2000
anului 1950.
06:42
Prettyfrumos much for the vastvast majoritymajoritate of historyistorie,
157
387000
2000
În cea mai mare parte a istoriei,
06:44
no one gavea dat a damnLa naiba about 1950.
158
389000
2000
nimănui nu-i păsa de 1950.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
În 1700, în 1800, în 1900,
06:48
no one caredîngrijit.
160
393000
3000
nimănui nu-i păsa.
06:52
ThroughPrin the 30s and 40s,
161
397000
2000
În anii 30 și 40,
06:54
no one caredîngrijit.
162
399000
2000
nimănui nu-i păsa.
06:56
SuddenlyDintr-o data, in the mid-la mijlocul40s,
163
401000
2000
Dintr-o dată, pe la mijlocul anilor 40,
06:58
there starteda început to be a buzzBuzz.
164
403000
2000
a început un zumzet.
07:00
People realizedrealizat that 1950 was going to happenîntâmpla,
165
405000
2000
Oamenii și-au dat seama că 1950 urma să se petreacă,
07:02
and it could be bigmare.
166
407000
2000
și putea să fie măreț.
07:04
(LaughterRâs)
167
409000
3000
(Râsete)
07:07
But nothing got people interestedinteresat in 1950
168
412000
3000
Dar în 1950, nimic nu i-a interesat mai mult pe oameni,
07:10
like the yearan 1950.
169
415000
3000
ca anul 1950.
07:13
(LaughterRâs)
170
418000
3000
(Râsete)
07:16
People were walkingmers around obsessedobsedat.
171
421000
2000
Oamenii erau absolut obsedați.
07:18
They couldn'tnu a putut stop talkingvorbind
172
423000
2000
Nu mai încetau să vorbească
07:20
about all the things they did in 1950,
173
425000
3000
despre ce au făcut ei în 1950,
07:23
all the things they were planningplanificare to do in 1950,
174
428000
3000
tot ce plănuiau să facă în 1950,
07:26
all the dreamsvise of what they wanted to accomplishrealiza in 1950.
175
431000
5000
tot ce visau să îndeplinească în 1950.
07:31
In factfapt, 1950 was so fascinatingfascinant
176
436000
2000
1950 a fost așa de fascinant
07:33
that for yearsani thereafterdupă aceea,
177
438000
2000
încât la ani după,
07:35
people just keptținut talkingvorbind about all the amazinguimitor things that happeneds-a întâmplat,
178
440000
3000
oamenii încă mai vorbeau despre lucrurile minunate petrecute atunci,
07:38
in '51, '52, '53.
179
443000
2000
în '51, '52, '53.
07:40
FinallyÎn cele din urmă in 1954,
180
445000
2000
În 1954, într-un final,
07:42
someonecineva woketrezit up and realizedrealizat
181
447000
2000
cineva s-a trezit şi şi-a dat seama
07:44
that 1950 had gottenajuns somewhatoarecum passtreceé.
182
449000
4000
că anul 1950 a cam trecut.
07:48
(LaughterRâs)
183
453000
2000
(Râsete)
07:50
And just like that, the bubblebalon burstizbucni.
184
455000
2000
Şi uite-aşa, balonul s-a spart.
07:52
(LaughterRâs)
185
457000
2000
(Râsete)
07:54
And the storypoveste of 1950
186
459000
2000
Şi povestea anului 1950
07:56
is the storypoveste of everyfiecare yearan that we have on recordrecord,
187
461000
2000
este povestea fiecărui an pe care l-am înregistrat,
07:58
with a little twistTwist, because now we'vene-am got these nicefrumos chartsdiagrame.
188
463000
3000
cu o mică schimbare, pentru că acum avem aceste diagrame drăguţe.
08:01
And because we have these nicefrumos chartsdiagrame, we can measuremăsura things.
189
466000
3000
Şi pentru că avem aceste diagrame drăguţe, putem să măsurăm anumite lucruri.
08:04
We can say, "Well how fastrapid does the bubblebalon burstizbucni?"
190
469000
2000
Putem întreba, "Cât de repede se sparge acest balon?"
08:06
And it turnstransformă out that we can measuremăsura that very preciselyexact.
191
471000
3000
Şi ne-am dat seama că putem măsura asta cu precizie mare.
08:09
EquationsEcuatii were derivedderivat, graphsgrafice were producedprodus,
192
474000
3000
Au reieşit ecuaţii, au fost produse grafice
08:12
and the netnet resultrezultat
193
477000
2000
iar rezultatul final
08:14
is that we find that the bubblebalon burstsexploziile fastermai repede and fastermai repede
194
479000
3000
este că aceste baloane se sparg din ce în ce mai repede
08:17
with eachfiecare passingtrecere yearan.
195
482000
2000
cu fiecare an.
08:19
We are losingpierzând interestinteres in the pasttrecut more rapidlyrapid.
196
484000
5000
Ne pierdem interesul pentru istorie mai repede.
08:24
JMJM: Now a little piecebucată of careerCarieră advicesfat.
197
489000
2000
JM: Un mic sfat despre cariere.
08:26
So for those of you who seekcăuta to be famouscelebru,
198
491000
2000
Pentru aceia dintre voi care vor să fie faimoşi,
08:28
we can learnînvăța from the 25 mostcel mai famouscelebru politicalpolitic figurescifrele,
199
493000
2000
putem învăţa de la cele mai cunoscute 25 de personalităţi politice,
08:30
authorsautori, actorsactori and so on.
200
495000
2000
scriitori, actori şi aşa mai departe.
08:32
So if you want to becomedeveni famouscelebru earlydin timp on, you should be an actoractor,
201
497000
3000
Aşa că dacă vreţi să fiţi cunoscuţi de tineri, ar trebui să fiţi actori,
08:35
because then famefaimă startsîncepe risingîn creștere by the endSfârşit of your 20s --
202
500000
2000
pentru că devii faimos când te apropii de 30 de ani --
08:37
you're still youngtineri, it's really great.
203
502000
2000
eşti încă tânăr, e minunat.
08:39
Now if you can wait a little bitpic, you should be an authorautor,
204
504000
2000
Dacă poţi să mai aştepţi puţin, poţi să fii scriitor,
08:41
because then you risecreştere to very great heightsînălțimi,
205
506000
2000
pentru că atunci te ridic la culmi foarte înalte,
08:43
like MarkMark TwainTwain, for instanceinstanță: extremelyextrem famouscelebru.
206
508000
2000
spre exemplu ca Mark Twain: foarte cunoscut.
08:45
But if you want to reacha ajunge the very toptop,
207
510000
2000
Dar dacă vrei să ajungi în vârful piramidei,
08:47
you should delayîntârziere gratificationmulțumire
208
512000
2000
ar trebui să întârzii recompensa,
08:49
and, of coursecurs, becomedeveni a politicianom politic.
209
514000
2000
şi bineînţeles, să devii politician.
08:51
So here you will becomedeveni famouscelebru by the endSfârşit of your 50s,
210
516000
2000
Aici vei ajunge cunoscut când deja ai trecut de 50 de ani
08:53
and becomedeveni very, very famouscelebru afterwarddupă aceea.
211
518000
2000
şi foarte foarte cunoscut după vârsta asta.
08:55
So scientistsoamenii de știință alsode asemenea tendtind to get famouscelebru when they're much oldermai batran.
212
520000
3000
Şi oamenii de ştiinţă devin cunoscuţi când sunt mult mai în vârstă.
08:58
Like for instanceinstanță, biologistsbiologi and physicsfizică
213
523000
2000
Spre exemplu, biologii şi fizicienii
09:00
tendtind to be almostaproape as famouscelebru as actorsactori.
214
525000
2000
ajung la fel de faimoşi ca actorii.
09:02
One mistakegreşeală you should not do is becomedeveni a mathematicianmatematician.
215
527000
3000
O greşeală pe care nu trebuie să o faceţi, este să deveniţi matematicieni.
09:05
(LaughterRâs)
216
530000
2000
(Râsete)
09:07
If you do that,
217
532000
2000
Dacă faceţi asta,
09:09
you mightar putea think, "Oh great. I'm going to do my bestCel mai bun work when I'm in my 20s."
218
534000
3000
o să vă gândiţi, "O, ce bine, o să-mi ating apogeul pe la 20 de ani."
09:12
But guessghici what, nobodynimeni will really careîngrijire.
219
537000
2000
Dar ghiciţi ce, nimănui nu-i pasă.
09:14
(LaughterRâs)
220
539000
3000
(Râsete)
09:17
ELAELA: There are more soberingsobering notesnotițe
221
542000
2000
ELA: Există şi note mai vesele
09:19
amongprintre the n-gramsn-grame.
222
544000
2000
printre n-grame.
09:21
For instanceinstanță, here'saici e the trajectorytraiectorie of MarcMarc ChagallChagall,
223
546000
2000
Spre exemplu, iată traiectoria lui Marc Chagall,
09:23
an artistartist bornnăscut in 1887.
224
548000
2000
un artist născut în 1887.
09:25
And this looksarată like the normalnormal trajectorytraiectorie of a famouscelebru personpersoană.
225
550000
3000
Aşa arată traiectoria normală a unui om faimos.
09:28
He getsdevine more and more and more famouscelebru,
226
553000
4000
Devine din ce în ce mai cunoscut,
09:32
exceptcu exceptia if you look in GermanGermană.
227
557000
2000
doar dacă nu te uiţi în germană.
09:34
If you look in GermanGermană, you see something completelycomplet bizarrebizar,
228
559000
2000
Dacă te uiţi în germană, se observă ceva foarte ciudat,
09:36
something you prettyfrumos much never see,
229
561000
2000
ceva ce se observă foarte rar,
09:38
whichcare is he becomesdevine extremelyextrem famouscelebru
230
563000
2000
adică devine extrem de faimos
09:40
and then all of a suddenbrusc plummetsscăzut,
231
565000
2000
şi apoi decade dintr-o dată,
09:42
going throughprin a nadirnicolae betweenîntre 1933 and 1945,
232
567000
3000
trece printr-un nadir între 1933 şi 1945
09:45
before reboundingelastic afterwarddupă aceea.
233
570000
3000
înainte de a-şi reveni.
09:48
And of coursecurs, what we're seeingvedere
234
573000
2000
Ceea ce vedem este, bineînţeles,
09:50
is the factfapt MarcMarc ChagallChagall was a JewishEvrei artistartist
235
575000
3000
că Marc Chagall este un artist evreu
09:53
in NaziNazist GermanyGermania.
236
578000
2000
într-o Germanie nazistă.
09:55
Now these signalssemnalele
237
580000
2000
Aceste semnalmente
09:57
are actuallyde fapt so strongputernic
238
582000
2000
sunt atât de puternice
09:59
that we don't need to know that someonecineva was censoredcenzurat.
239
584000
3000
încât nu avem nevoie să ştim că acea persoană a fost cenzurată.
10:02
We can actuallyde fapt figurefigura it out
240
587000
2000
Ne putem da seama
10:04
usingutilizând really basicde bază signalsemnal processingprelucrare.
241
589000
2000
folosind procese de semnalare de bază.
10:06
Here'sAici este a simplesimplu way to do it.
242
591000
2000
Iată o metodă de simplă de a o face.
10:08
Well, a reasonablerezonabil expectationaşteptări
243
593000
2000
Un rezultat așteptat
10:10
is that somebody'se cineva famefaimă in a givendat periodperioadă of time
244
595000
2000
este ca faima cuiva într-o perioadă de timp
10:12
should be roughlyaproximativ the averagein medie of theiral lor famefaimă before
245
597000
2000
să fie calculată ca faima anterioară
10:14
and theiral lor famefaimă after.
246
599000
2000
și faima ulterioară.
10:16
So that's sortfel of what we expectaştepta.
247
601000
2000
Cam asta așteptăm noi.
10:18
And we comparecomparaţie that to the famefaimă that we observeobserva.
248
603000
3000
Și comparăm rezultatul cu faima obeservată de noi.
10:21
And we just dividedivide one by the other
249
606000
2000
Și am împărțit un rezultat la celălalt
10:23
to producelegume şi fructe something we call a suppressionsuprimarea indexindex.
250
608000
2000
pentru a reieși ceva ce noi numim index reprimat.
10:25
If the suppressionsuprimarea indexindex is very, very, very smallmic,
251
610000
3000
Dacă indexul de reprimare este foarte, foarte, foarte mic,
10:28
then you very well mightar putea be beingfiind suppressedsuprimat.
252
613000
2000
atunci este foarte posibil ca și tu să fii reprimat.
10:30
If it's very largemare, maybe you're benefitingcare beneficiază from propagandapropagandă.
253
615000
3000
Dacă este foarte mare, atunci poate beneficiezi de propagandă.
10:34
JMJM: Now you can actuallyde fapt look at
254
619000
2000
JM: Acum puteți privi
10:36
the distributiondistribuire of suppressionsuprimarea indexesindexuri over wholeîntreg populationspopulații.
255
621000
3000
distribuția indexului de reprimare pentru toate populațiile.
10:39
So for instanceinstanță, here --
256
624000
2000
Așa că spre exemplu, aici --
10:41
this suppressionsuprimarea indexindex is for 5,000 people
257
626000
2000
indexul de reprimare este pentru 5.000 de persoane
10:43
pickedales in EnglishEngleză bookscărți where there's no knowncunoscut suppressionsuprimarea --
258
628000
2000
alese din cărți engleze, unde nu se cunoaște vreo reprimare --
10:45
it would be like this, basicallype scurt tightlystrans centeredcentrat on one.
259
630000
2000
ar arăta cam așa, în principiu centrat pe una.
10:47
What you expectaştepta is basicallype scurt what you observeobserva.
260
632000
2000
Ceea ce aștepți este în principiu ceea ce observi.
10:49
This is distributiondistribuire as seenvăzut in GermanyGermania --
261
634000
2000
Așa arată distribuția în Germania --
10:51
very differentdiferit, it's shiftedmutat to the left.
262
636000
2000
total diferită, este mutată către stânga.
10:53
People talkeda vorbit about it twicede două ori lessMai puțin as it should have been.
263
638000
3000
Oamenii au vorbit despre asta de două ori mai puțin decât ar fi trebuit.
10:56
But much more importantlyimportant, the distributiondistribuire is much widermai larg.
264
641000
2000
Dar mai important este că distribuția este mult mai întinsă.
10:58
There are manymulți people who endSfârşit up on the fardeparte left on this distributiondistribuire
265
643000
3000
Sunt oameni care ajung în extrema stângă a distribuției
11:01
who are talkeda vorbit about 10 timesori fewermai putine than they should have been.
266
646000
3000
despre care se vorbește de 10 ori mai puțin decât ar trebui.
11:04
But then alsode asemenea manymulți people on the fardeparte right
267
649000
2000
De asemenea, mulți oameni din extrema dreaptă
11:06
who seempărea to benefitbeneficiu from propagandapropagandă.
268
651000
2000
par să beneficieze de propagandă.
11:08
This pictureimagine is the hallmarkHallmark of censorshipcenzura in the bookcarte recordrecord.
269
653000
3000
Această imagine este marca cenzurilor în arhiva cărții.
11:11
ELAELA: So culturomicsculturomics
270
656000
2000
ELA: Așa că noi numim această metodă,
11:13
is what we call this methodmetodă.
271
658000
2000
culturomică.
11:15
It's kinddrăguț of like genomicsgenomica.
272
660000
2000
Se aseamană cu genomica.
11:17
ExceptCu excepţia genomicsgenomica is a lensobiectiv on biologybiologie
273
662000
2000
Doar că genomica este o lupă asupra biologiei
11:19
throughprin the windowfereastră of the sequencesecvenţă of basesbaze in the humanuman genomegenomului.
274
664000
3000
prin fereastra de secvențe de bază din genomul uman.
11:22
CulturomicsCulturomics is similarasemănător.
275
667000
2000
Culturomica este similară.
11:24
It's the applicationcerere of massive-scalescară masivă datadate collectionColectie analysisanaliză
276
669000
3000
Este o analiză realizată pe o colecție de date imensă aplicată
11:27
to the studystudiu of humanuman culturecultură.
277
672000
2000
la studiul culturii umane.
11:29
Here, insteadin schimb of throughprin the lensobiectiv of a genomegenomului,
278
674000
2000
Aici, nu privim prin lentilele unui genom
11:31
throughprin the lensobiectiv of digitizeddigitalizate piecesbucăți of the historicalistoric recordrecord.
279
676000
3000
ci prin lentilele unor piese digitale din istorie.
11:34
The great thing about culturomicsculturomics
280
679000
2000
Partea grozavă despre culturomică
11:36
is that everyonetoata lumea can do it.
281
681000
2000
este că oricine o poate face.
11:38
Why can everyonetoata lumea do it?
282
683000
2000
De ce o poate face oricine?
11:40
EveryoneToată lumea can do it because threeTrei guys,
283
685000
2000
Toată lumea poate datorită a trei bărbați.
11:42
JonJon OrwantOrwant, MattMatt GrayGri and Will BrockmanCiprian over at GoogleGoogle,
284
687000
3000
Jon Orwant, Matt Gray și Will Brockman de la Google
11:45
saw the prototypeprototip of the NgramNgram ViewerViewer,
285
690000
2000
au văzut prototipul lui Ngram Viewer,
11:47
and they said, "This is so fundistracţie.
286
692000
2000
și au spus, „Este foarte distractiv.
11:49
We have to make this availabledisponibil for people."
287
694000
3000
Trebuie să-l facem accesibil tuturor.”
11:52
So in two weekssăptămâni flatapartament -- the two weekssăptămâni before our paperhârtie camea venit out --
288
697000
2000
Așa că în fix două săptămâni -- cele două săptămâni dinainte să ne iasă actele --
11:54
they codedcodificate up a versionversiune of the NgramNgram ViewerViewer for the generalgeneral publicpublic.
289
699000
3000
au dezvoltat o versiune a Ngram Viewer pentru publicul larg.
11:57
And so you too can typetip in any wordcuvânt or phrasefraza that you're interestedinteresat in
290
702000
3000
Așa că și voi puteți să tastați orice cuvânt sau frază doriți
12:00
and see its n-gramn-gram immediatelyimediat --
291
705000
2000
și imediat să-i vedeți n-grama --
12:02
alsode asemenea browseRăsfoire examplesexemple of all the variousvariat bookscărți
292
707000
2000
și să explorați exemple din toate cărțile
12:04
in whichcare your n-gramn-gram appearsapare.
293
709000
2000
în care apare n-grama voastră.
12:06
JMJM: Now this was used over a millionmilion timesori on the first day,
294
711000
2000
JM: În prima zi a fost folosit de peste un milion de ori,
12:08
and this is really the bestCel mai bun of all the queriesinterogări.
295
713000
2000
iar asta este cea mai bună dintre toate interogările.
12:10
So people want to be theiral lor bestCel mai bun, put theiral lor bestCel mai bun footpicior forwardredirecţiona.
296
715000
3000
Așa că oamenii își dau silința, fac tot posibilul.
12:13
But it turnstransformă out in the 18thlea centurysecol, people didn't really careîngrijire about that at all.
297
718000
3000
Se pare că în secolul 18, oamenilor nu le păsa deloc.
12:16
They didn't want to be theiral lor bestCel mai bun, they wanted to be theiral lor beftBeFT.
298
721000
3000
Nu doreau să fie cei mai buni, vroiau să fie cei mai buli.
12:19
So what happeneds-a întâmplat is, of coursecurs, this is just a mistakegreşeală.
299
724000
3000
Ceea ce s-a întâmplat este, bineînțeles, doar o greșeală.
12:22
It's not that strovesa străduit for mediocritymediocritate,
300
727000
2000
Nu tindeau către mediocritate,
12:24
it's just that the S used to be writtenscris differentlydiferit, kinddrăguț of like an F.
301
729000
3000
doar N-ul era scris diferit, se apropia de un L.
12:27
Now of coursecurs, GoogleGoogle didn't pickalege this up at the time,
302
732000
3000
Bineînțeles, Google nu a ales asta atunci,
12:30
so we reportedraportat this in the scienceştiinţă articlearticol that we wrotea scris.
303
735000
3000
așa că am raportat acestă situație într-un articol științific pe care l-am scris.
12:33
But it turnstransformă out this is just a remindermemento
304
738000
2000
Dar acesta a fost doar ca să ne amintească de faptul că,
12:35
that, althoughcu toate ca this is a lot of fundistracţie,
305
740000
2000
deși este foarte distractiv,
12:37
when you interpretinterpreta these graphsgrafice, you have to be very carefulatent,
306
742000
2000
atunci când interpretezi aceste grafice, trebuie să fii foarte atent,
12:39
and you have to adoptadopta the basebaza standardsstandarde in the sciencesștiințe.
307
744000
3000
și trebuie să adopți standardele de bază în aceste științe.
12:42
ELAELA: People have been usingutilizând this for all kindstipuri of fundistracţie purposesscopuri.
308
747000
3000
ELA: Oamenii le-au folosit în diferite scopuri distractive.
12:45
(LaughterRâs)
309
750000
7000
(Râsete)
12:52
ActuallyDe fapt, we're not going to have to talk,
310
757000
2000
De fapt, nu o să mai vorbim,
12:54
we're just going to showspectacol you all the slidesslide-uri and remainrămâne silenttăcut.
311
759000
3000
ci doar o să vă arătăm slide-urile și o să păstrăm liniștea.
12:57
This personpersoană was interestedinteresat in the historyistorie of frustrationfrustrare.
312
762000
3000
Această persoană a fost interesată de istoria frustrării.
13:00
There's variousvariat typestipuri of frustrationfrustrare.
313
765000
3000
Există diferite tipuri de frustrare.
13:03
If you stubciot your toedeget de la picior, that's a one A "arghArgh."
314
768000
3000
Dacă îți rupi tocul, este un singur „A”.
13:06
If the planetplanetă EarthPământ is annihilatedanihilate by the VogonsVogonii
315
771000
2000
Dacă planeta Pământ este anihilată de Vogoni
13:08
to make roomcameră for an interstellarinterstelar bypassBypass,
316
773000
2000
pentru a permite un zbor interstelar,
13:10
that's an eightopt A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
este un A spus de opt ori „Aaaaaaaa”.
13:12
This personpersoană studiesstudiu all the "arghsarghs,"
318
777000
2000
Această persoană studiază toate „a-urile”,
13:14
from one throughprin eightopt A'sAdrian.
319
779000
2000
de la unu la opt A.
13:16
And it turnstransformă out
320
781000
2000
Și reiese
13:18
that the less-frequentmai puţin frecvente "arghsarghs"
321
783000
2000
că cele mai rare „a-uri”
13:20
are, of coursecurs, the onescele that correspondcorespundă to things that are more frustratingfrustrant --
322
785000
3000
sunt, evident, cu evenimentele cele mai puțin frustrante --
13:23
exceptcu exceptia, oddlyciudat, in the earlydin timp 80s.
323
788000
3000
cu excepția, ciudat, de la începutul anilor '80.
13:26
We think that mightar putea have something to do with ReaganReagan.
324
791000
2000
Noi credem că ar putea avea legătură cu Reagan.
13:28
(LaughterRâs)
325
793000
2000
(Râsete)
13:30
JMJM: There are manymulți usagesuzanţele of this datadate,
326
795000
3000
JM: Sunt multe utilizări ale acestei informații,
13:33
but the bottomfund linelinia is that the historicalistoric recordrecord is beingfiind digitizeddigitalizate.
327
798000
3000
dar concluzia este că istoricul ei este digitizat.
13:36
GoogleGoogle has starteda început to digitizedigitiza 15 millionmilion bookscărți.
328
801000
2000
Google a început să digitizeze 15 milioane de cărți.
13:38
That's 12 percentla sută of all the bookscărți that have ever been publishedpublicat.
329
803000
2000
Ceea ce înseamnă 12% din totalul de cărți vreodată publicat.
13:40
It's a sizablebarosan chunkbucată mare of humanuman culturecultură.
330
805000
3000
Este o parte considerabilă din cultura umană.
13:43
There's much more in culturecultură: there's manuscriptsmanuscrise, there newspaperspresă,
331
808000
3000
În cultură există mult mai multe lucruri: manuscripte, ziare,
13:46
there's things that are not texttext, like artartă and paintingspicturi.
332
811000
2000
există non-texte, ca arta și picturile.
13:48
These all happenîntâmpla to be on our computerscalculatoare,
333
813000
2000
Toate acestea se întâmplă să fie în calculatoarele noastre,
13:50
on computerscalculatoare acrosspeste the worldlume.
334
815000
2000
în calculatoare din întreaga lume.
13:52
And when that happensse întâmplă, that will transformtransforma the way we have
335
817000
3000
Și când asta se întâmplă, va schimba felul în care noi
13:55
to understanda intelege our pasttrecut, our presentprezent and humanuman culturecultură.
336
820000
2000
ne înțelegem trecutul, prezentul și cultura umană.
13:57
Thank you very much.
337
822000
2000
Vă mulțumesc foarte mult.
13:59
(ApplauseAplauze)
338
824000
3000
(Aplauze)
Translated by Mihaela - Patricia Vadan
Reviewed by Antoniu Gugu

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com