ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

Cosa abbiamo imparato da 5 milioni di libri

Filmed:
2,049,453 views

Avete giocato con l'Ngram Viewer dei Google Labs? E' un'avvincente strumento che permette di cercare parole e idee in un database di 5 milioni di libri che attraversano diversi secoli. Erez Lieberman Aiden e Jean-Baptiste Michel ci mostrano some funziona, e alcune delle cose sorprendenti che si possono imparare da 500 miliardi di parole.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
ErezErez LiebermanLieberman AidenAiden: EveryoneTutti knowsconosce
0
0
2000
Erez Lieberman Aiden: Tutti sanno
00:17
that a pictureimmagine is worthdi valore a thousandmille wordsparole.
1
2000
3000
che un'immagine vale mille parole.
00:22
But we at HarvardHarvard
2
7000
2000
ma noi di Harward
00:24
were wonderingchiedendosi if this was really truevero.
3
9000
3000
ci stavamo chiedendo se fosse davvero così.
00:27
(LaughterRisate)
4
12000
2000
(Risate)
00:29
So we assembledassemblato a teamsquadra of expertsesperti,
5
14000
4000
Perciò abbiamo messo insieme un gruppo di esperti,
00:33
spanningspanning HarvardHarvard, MITMIT,
6
18000
2000
provenienti da Harvard, dall'MIT,
00:35
The AmericanAmericano HeritagePatrimonio DictionaryDizionario, The EncyclopediaEnciclopedia BritannicaBritannica
7
20000
3000
dall'American Heritage Dictionary, dall'Encyclopedia Britannica
00:38
and even our proudorgoglioso sponsorssponsor,
8
23000
2000
e persino dal nostro gentile sponsor,
00:40
the GoogleGoogle.
9
25000
3000
Google.
00:43
And we cogitatedcogitated about this
10
28000
2000
E ci abbiamo rimuginato sopra
00:45
for about fourquattro yearsanni.
11
30000
2000
per circa quattro anni.
00:47
And we cameè venuto to a startlingsorprendente conclusionconclusione.
12
32000
5000
E siamo giunti ad una conclusione sorprendente.
00:52
LadiesLadies and gentlemengentiluomini, a pictureimmagine is not worthdi valore a thousandmille wordsparole.
13
37000
3000
Signore e signori, un'immagine non vale mille parole.
00:55
In factfatto, we foundtrovato some picturesimmagini
14
40000
2000
In effetti abbiamo scoperto alcune immagini
00:57
that are worthdi valore 500 billionmiliardo wordsparole.
15
42000
5000
che valgono 500 miliardi di parole.
01:02
Jean-BaptisteJean-Baptiste MichelMichel: So how did we get to this conclusionconclusione?
16
47000
2000
Jean-Baptiste Michel: Come siamo giunti a questa conclusione?
01:04
So ErezErez and I were thinkingpensiero about waysmodi
17
49000
2000
Erez e io stavamo pensando ai diversi modi
01:06
to get a biggrande pictureimmagine of humanumano culturecultura
18
51000
2000
di ottenere una grande rappresentazione visiva della cultura umana,
01:08
and humanumano historystoria: changemodificare over time.
19
53000
3000
della sua storia e dei loro cambiamenti nel corso del tempo.
01:11
So manymolti bookslibri actuallyin realtà have been writtenscritto over the yearsanni.
20
56000
2000
Col passare degli anni sono stati scritti tantissimi libri,
01:13
So we were thinkingpensiero, well the bestmigliore way to learnimparare from them
21
58000
2000
così abbiamo pensato:
01:15
is to readleggere all of these millionsmilioni of bookslibri.
22
60000
2000
da questi milioni di libri é leggerli tutti.>.
01:17
Now of coursecorso, if there's a scalescala for how awesomeeccezionale that is,
23
62000
3000
Se esiste una scala per misurare il grado di grandiosità delle cose,
01:20
that has to rankrango extremelyestremamente, extremelyestremamente highalto.
24
65000
3000
leggere tutti quei libri si piazza molto, molto in alto.
01:23
Now the problemproblema is there's an X-axisAsse x for that,
25
68000
2000
Il problema è che c'è anche un asse X di cui tenere conto,
01:25
whichquale is the practicalpratico axisasse.
26
70000
2000
l'asse della praticità.
01:27
This is very, very lowBasso.
27
72000
2000
Sul quale si piazza molto, molto in basso
01:29
(ApplauseApplausi)
28
74000
3000
(Applauso)
01:32
Now people tendtendere to use an alternativealternativa approachapproccio,
29
77000
3000
Molte persone tendono ad usare un approccio alternativo,
01:35
whichquale is to take a fewpochi sourcesfonti and readleggere them very carefullyaccuratamente.
30
80000
2000
che consiste nel prendere solo alcune fonti e leggerle molto attentamente.
01:37
This is extremelyestremamente practicalpratico, but not so awesomeeccezionale.
31
82000
2000
Estremamente pratico, ma non altrettanto grandioso.
01:39
What you really want to do
32
84000
3000
La cosa ideale da fare
01:42
is to get to the awesomeeccezionale yetancora practicalpratico partparte of this spacespazio.
33
87000
3000
é riuscire ad arrivare nella parte grandiosa ma al contempo pratica di questo grafico.
01:45
So it turnsgiri out there was a companyazienda acrossattraverso the riverfiume calledchiamato GoogleGoogle
34
90000
3000
Si scopre che c'è un'azienda dall'altra parte del fiume chiamata Google,
01:48
who had startediniziato a digitizationdigitalizzazione projectprogetto a fewpochi yearsanni back
35
93000
2000
che alcuni anni prima aveva avviato un progetto di digitalizzazione
01:50
that mightpotrebbe just enableabilitare this approachapproccio.
36
95000
2000
che avrebbe potuto rendere quest'ultimo approccio possibile.
01:52
They have digitizeddigitalizzati millionsmilioni of bookslibri.
37
97000
2000
Per questo progetto hanno digitalizzato milioni di libri.
01:54
So what that meanssi intende is, one could use computationalcomputazionale methodsmetodi
38
99000
3000
Ciò significa che una persona può utilizzare metodi computazionali
01:57
to readleggere all of the bookslibri in a clickclic of a buttonpulsante.
39
102000
2000
per leggere tutti questi libri solo cliccando su un pulsante.
01:59
That's very practicalpratico and extremelyestremamente awesomeeccezionale.
40
104000
3000
-Questo- é sia molto pratico che assolutamente grandioso.
02:03
ELAELA: Let me tell you a little bitpo about where bookslibri come from.
41
108000
2000
ELA: Lasciate che vi racconti qualcosa sulla provenienza dei libri.
02:05
SinceDal time immemorialimmemorabile, there have been authorsautori.
42
110000
3000
Da tempo immemore sono esistiti gli autori.
02:08
These authorsautori have been strivingsforzandosi to writeScrivi bookslibri.
43
113000
3000
Questi autori hanno sempre avuto l'ardente desiderio di scrivere libri,
02:11
And this becamedivenne considerablyconsiderevolmente easierPiù facile
44
116000
2000
Cosa che divenne considerevolmente più facile
02:13
with the developmentsviluppo of the printingstampa pressstampa some centuriessecoli agofa.
45
118000
2000
con lo sviluppo della macchina tipografica alcuni secoli fa.
02:15
SinceDal then, the authorsautori have wonha vinto
46
120000
3000
Da allora, gli autori sono riusciti
02:18
on 129 millionmilione distinctdistinto occasionsoccasioni,
47
123000
2000
in 129 milioni distinte occasioni,
02:20
publishingeditoriale bookslibri.
48
125000
2000
a pubblicare libri.
02:22
Now if those bookslibri are not lostperduto to historystoria,
49
127000
2000
Ora, se quei libri non sono andati persi nel corso della storia,
02:24
then they are somewhereda qualche parte in a librarybiblioteca,
50
129000
2000
allora si trovano da qualche parte in una qualche libreria,
02:26
and manymolti of those bookslibri have been gettingottenere retrievedEstratto from the librarieslibrerie
51
131000
3000
e molti di quei libri sono stati reperiti dalle biblioteche
02:29
and digitizeddigitalizzati by GoogleGoogle,
52
134000
2000
e digitalizzati da Google,
02:31
whichquale has scanneddigitalizzata 15 millionmilione bookslibri to dateData.
53
136000
2000
che ad oggi ha scansionato 15 milioni di libri.
02:33
Now when GoogleGoogle digitizesDigitalizza a booklibro, they put it into a really nicesimpatico formatformato.
54
138000
3000
Ora, quando Google digitalizza un libro, lo converte in un formato digitale molto pratico.
02:36
Now we'venoi abbiamo got the datadati, pluspiù we have metadatametadati.
55
141000
2000
Ora oltre ad avere i dati abbiamo anche i metadati.
02:38
We have informationinformazione about things like where was it publishedpubblicato,
56
143000
3000
Abbiamo informazioni su cose come dove il libro fu pubblicato,
02:41
who was the authorautore, when was it publishedpubblicato.
57
146000
2000
chi era l'autore, quando venne pubblicato.
02:43
And what we do is go throughattraverso all of those recordsrecord
58
148000
3000
E quel che facciamo è esaminare tutte quelle informazioni
02:46
and excludeEscludi everything that's not the highestmassimo qualityqualità datadati.
59
151000
4000
ed escludere tutto all'infuori dei dati della miglior qualità.
02:50
What we're left with
60
155000
2000
Quello che resta
02:52
is a collectioncollezione of fivecinque millionmilione bookslibri,
61
157000
3000
è una selezione di cinque milioni di libri,
02:55
500 billionmiliardo wordsparole,
62
160000
3000
500 miliardi di parole,
02:58
a stringstringa of characterspersonaggi a thousandmille timesvolte longerpiù a lungo
63
163000
2000
una riga di caratteri mille volte più lunga
03:00
than the humanumano genomegenoma --
64
165000
3000
del genoma umano --
03:03
a texttesto whichquale, when writtenscritto out,
65
168000
2000
un testo che, se venisse trascritto,
03:05
would stretchallungare from here to the MoonLuna and back
66
170000
2000
coprirebbe la distanza tra qui e la luna, andata e ritorno
03:07
10 timesvolte over --
67
172000
2000
per 10 volte --
03:09
a veritablevero e proprio shardShard of our culturalculturale genomegenoma.
68
174000
4000
un autentico frammento del nostro genoma culturale.
03:13
Of coursecorso what we did
69
178000
2000
Ovviamente ciò che abbiamo fatto
03:15
when facedaffrontato with suchcome outrageousoltraggioso hyperboleiperbole ...
70
180000
3000
una volta messi di fronte ad una cosa così spaventosamente esagerata...
03:18
(LaughterRisate)
71
183000
2000
(Risate)
03:20
was what any self-respectingrispetti researchersricercatori
72
185000
3000
è stato ciò che qualunque ricercatore con un po' di amor proprio
03:23
would have donefatto.
73
188000
3000
avrebbe fatto.
03:26
We tookha preso a pagepagina out of XKCDXKCD,
74
191000
2000
Abbiamo preso una pagina di XKCD
03:28
and we said, "StandStand back.
75
193000
2000
e abbiamo detto: "Fatevi da parte.
03:30
We're going to try sciencescienza."
76
195000
2000
Qui stiamo per fare la scienza."
03:32
(LaughterRisate)
77
197000
2000
(Risate)
03:34
JMJM: Now of coursecorso, we were thinkingpensiero,
78
199000
2000
JM: Ovviamente stavamo pensando:
03:36
well let's just first put the datadati out there
79
201000
2000
limitiamoci a mettere questi dati a disposizione
03:38
for people to do sciencescienza to it.
80
203000
2000
di chiunque e lasciamo loro a "fare la scienza".
03:40
Now we're thinkingpensiero, what datadati can we releaseliberare?
81
205000
2000
Ora stiamo pensando: "Quali dati possiamo divulgare?"
03:42
Well of coursecorso, you want to take the bookslibri
82
207000
2000
Quello che vorremmo fare é prendere i libri
03:44
and releaseliberare the fullpieno texttesto of these fivecinque millionmilione bookslibri.
83
209000
2000
e divulgare il testo integrale di questi cinque milioni di tomi.
03:46
Now GoogleGoogle, and JonJon OrwantOrwant in particularparticolare,
84
211000
2000
Google, e Jon Orwant in particolare,
03:48
told us a little equationequazione that we should learnimparare.
85
213000
2000
ci rivelarono una piccola equazione che dovremmo imparare.
03:50
So you have fivecinque millionmilione, that is, fivecinque millionmilione authorsautori
86
215000
3000
Se hai cinque milioni di libri hai anche cinque milioni di autori,
03:53
and fivecinque millionmilione plaintiffsquerelanti is a massivemassiccio lawsuitcausa.
87
218000
3000
e cinque milioni di querelanti fanno un'enorme causa legale.
03:56
So, althoughsebbene that would be really, really awesomeeccezionale,
88
221000
2000
Perciò, anche se sarebbe stato davvero davvero grandioso,
03:58
again, that's extremelyestremamente, extremelyestremamente impracticalnon pratico.
89
223000
3000
di nuovo, sarebbe stato anche molto molto poco fattibile.
04:01
(LaughterRisate)
90
226000
2000
(Risate)
04:03
Now again, we kindgenere of cavedha ceduto in,
91
228000
2000
E così cedemmo di nuovo
04:05
and we did the very practicalpratico approachapproccio, whichquale was a bitpo lessDi meno awesomeeccezionale.
92
230000
3000
e ripiegammo sull'approccio più fattibile e un po' meno grandioso.
04:08
We said, well insteadanziché of releasingrilasciando the fullpieno texttesto,
93
233000
2000
Ci dicemmo:" Ok, invece di divulgare il testo integrale
04:10
we're going to releaseliberare statisticsstatistica about the bookslibri.
94
235000
2000
divulgheremo le statistiche sui libri".
04:12
So take for instanceesempio "A gleambarlume of happinessfelicità."
95
237000
2000
Prendete per esempio "Un barlume di felicità".
04:14
It's fourquattro wordsparole; we call that a four-gramquattro grammi.
96
239000
2000
Sono quattro parole, noi lo chiamiamo un "quattro grammi".
04:16
We're going to tell you how manymolti timesvolte a particularparticolare four-gramquattro grammi
97
241000
2000
Riveleremo quante volte uno specifico "quattro grammi"
04:18
appearedè apparso in bookslibri in 1801, 1802, 1803,
98
243000
2000
è apparso nei libri nel 1801, 1802, 1803,
04:20
all the way up to 2008.
99
245000
2000
fino al 2008.
04:22
That gives us a time seriesserie
100
247000
2000
Questo ci dà una serie temporale
04:24
of how frequentlyfrequentemente this particularparticolare sentencefrase was used over time.
101
249000
2000
di quanto frequentemente questa particolare frase è stata usata nel tempo.
04:26
We do that for all the wordsparole and phrasesfrasi that appearapparire in those bookslibri,
102
251000
3000
Lo facciamo con tutte le parole e frasi che appaiono in quei libri,
04:29
and that gives us a biggrande tabletavolo of two billionmiliardo linesLinee
103
254000
3000
ottenendo così una grande tabella con due miliardi di righe
04:32
that tell us about the way culturecultura has been changingmutevole.
104
257000
2000
che ci raccontano il modo in cui la cultura è cambiata.
04:34
ELAELA: So those two billionmiliardo linesLinee,
105
259000
2000
ELA: Questi due miliardi di righe
04:36
we call them two billionmiliardo n-gramsn-grammi.
106
261000
2000
noi le chiamiamo due miliardi di n-grammi.
04:38
What do they tell us?
107
263000
2000
Cosa ci raccontano?
04:40
Well the individualindividuale n-gramsn-grammi measuremisurare culturalculturale trendstendenze.
108
265000
2000
Gli n-grammi individuali misurano le tendenze culturali.
04:42
Let me give you an exampleesempio.
109
267000
2000
Lasciate che vi faccia un esempio.
04:44
Let's supposesupporre that I am thrivingfiorente,
110
269000
2000
Prendiamo il verbo irregolare "to thrive", prosperare
04:46
then tomorrowDomani I want to tell you about how well I did.
111
271000
2000
e immaginiamo che vi voglia dire che ieri ho prosperato.
04:48
And so I mightpotrebbe say, "YesterdayIeri, I throveprosperava."
112
273000
3000
Potrei usare questa forma regolare.
04:51
AlternativelyIn alternativa, I could say, "YesterdayIeri, I thrivedprosperato."
113
276000
3000
O, in alternativa, potrei usare questa forma irregolare.
04:54
Well whichquale one should I use?
114
279000
3000
Hanno lo stesso significato, quale dovrei usare?
04:57
How to know?
115
282000
2000
Come scoprirlo?
04:59
As of about sixsei monthsmesi agofa,
116
284000
2000
All'inirca sei mesi fa
05:01
the statestato of the artarte in this fieldcampo
117
286000
2000
l'approccio migliore in casi come questo
05:03
is that you would, for instanceesempio,
118
288000
2000
era rivolgersi, ad esempio,
05:05
go up to the followinga seguire psychologistpsicologo with fabulousfavoloso haircapelli,
119
290000
2000
a questo psicologo dalla favolosa capigliatura
05:07
and you'dfaresti say,
120
292000
2000
e chiedergli:
05:09
"SteveSteve, you're an expertesperto on the irregularirregolare verbsverbi.
121
294000
3000
"Steve, tu sei un esperto di verbi irregolari.
05:12
What should I do?"
122
297000
2000
Cosa dovrei fare secondo te?"
05:14
And he'daveva tell you, "Well mostmaggior parte people say thrivedprosperato,
123
299000
2000
E lui avrebbe detto: "Be' la maggioranza delle persone usa thrived,
05:16
but some people say throveprosperava."
124
301000
3000
ma alcune persone usano throve".
05:19
And you alsoanche knewconosceva, more or lessDi meno,
125
304000
2000
E tu sapevi anche, più o meno,
05:21
that if you were to go back in time 200 yearsanni
126
306000
3000
che se fossi dovuto tornare indietro nel tempo di 200 anni
05:24
and askChiedere the followinga seguire statesmanstatista with equallyugualmente fabulousfavoloso haircapelli,
127
309000
3000
e domandare al seguente luminare dalla capigliatura ugualmente favolosa,
05:27
(LaughterRisate)
128
312000
3000
(Risate)
05:30
"TomTom, what should I say?"
129
315000
2000
"Tom, secondo te cosa dovrei dire?"
05:32
He'dEgli avrebbe say, "Well, in my day, mostmaggior parte people throveprosperava,
130
317000
2000
Lui avrebbe detto: "Be', di questi tempi la maggioranza della gente usa throve,
05:34
but some thrivedprosperato."
131
319000
3000
ma alcuni usano thrived".
05:37
So now what I'm just going to showmostrare you is rawcrudo datadati.
132
322000
2000
Quelli che intendo mostrarvi ora sono dati grezzi.
05:39
Two rowsrighe from this tabletavolo of two billionmiliardo entriesinserimenti.
133
324000
4000
Due righe da questa tabella di due miliardi di voci.
05:43
What you're seeingvedendo is yearanno by yearanno frequencyfrequenza
134
328000
2000
Ciò che state vedendo è la frequenza anno dopo anno
05:45
of "thrivedprosperato" and "throveprosperava" over time.
135
330000
3000
nell'uso di "thrived" e "throve" nella storia.
05:49
Now this is just two
136
334000
2000
Ora queste sono solo due righe
05:51
out of two billionmiliardo rowsrighe.
137
336000
3000
fra due miliardi.
05:54
So the entireintero datadati setimpostato
138
339000
2000
Perciò l'intera collezione di dati
05:56
is a billionmiliardo timesvolte more awesomeeccezionale than this slidediapositiva.
139
341000
3000
è un miliardo di volte più grandiosa di questa diapositiva.
05:59
(LaughterRisate)
140
344000
2000
(Risate)
06:01
(ApplauseApplausi)
141
346000
4000
(Applausi)
06:05
JMJM: Now there are manymolti other picturesimmagini that are worthdi valore 500 billionmiliardo wordsparole.
142
350000
2000
JM: Ora, ci sono molte altre immagini che valgono 500 miliardi di parole.
06:07
For instanceesempio, this one.
143
352000
2000
Questa, ad esempio.
06:09
If you just take influenzainfluenza,
144
354000
2000
Se semplicemente prendete la parola influenza,
06:11
you will see peakspicchi at the time where you knewconosceva
145
356000
2000
vedrete i picchi nel momento in cui sapevate
06:13
biggrande fluinfluenza epidemicsepidemie were killinguccisione people around the globeglobo.
146
358000
3000
che c'erano grandi epidemie di influenza che stavano mietendo vittime in tutto il mondo.
06:16
ELAELA: If you were not yetancora convincedconvinto,
147
361000
3000
ELA: Se ancora non foste convinti,
06:19
seamare levelslivelli are risingcrescente,
148
364000
2000
il livello del mare si sta innalzando,
06:21
so is atmosphericatmosferico COCO2 and globalglobale temperaturetemperatura.
149
366000
3000
così come i livelli di anidride carbonica nell'atmosfera e la temperatura globale.
06:24
JMJM: You mightpotrebbe alsoanche want to have a look at this particularparticolare n-gramn-grammo,
150
369000
3000
JM: Potreste inoltre voler dare un'occhiata a questo particolare n-grammo,
06:27
and that's to tell NietzscheNietzsche that God is not deadmorto,
151
372000
3000
giusto per poter dire a Nietzsche che Dio non è morto,
06:30
althoughsebbene you mightpotrebbe agreeessere d'accordo that he mightpotrebbe need a better publicistpubblicista.
152
375000
3000
anche se forse sarete d'accordo nel dire che avrebbe bisogno di un migliore agente.
06:33
(LaughterRisate)
153
378000
2000
(Risate)
06:35
ELAELA: You can get at some prettybella abstractastratto conceptsconcetti with this sortordinare of thing.
154
380000
3000
ELA: Si può arrivare anche a concetti abbastanza astratti con questo metodo.
06:38
For instanceesempio, let me tell you the historystoria
155
383000
2000
Ad esempio, lasciate che vi racconti la storia
06:40
of the yearanno 1950.
156
385000
2000
dell'anno 1950.
06:42
PrettyPiuttosto much for the vastvasto majoritymaggioranza of historystoria,
157
387000
2000
Durante buona parte della storia,
06:44
no one gaveha dato a damnDannazione about 1950.
158
389000
2000
a nessuno gliene fregava nulla del 1950.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
Nel 1700, nel 1800, nel 1900,
06:48
no one caredcurato.
160
393000
3000
a nessuno importava.
06:52
ThroughAttraverso the 30s and 40s,
161
397000
2000
Negli anni Trenta e Quaranta
06:54
no one caredcurato.
162
399000
2000
a nessuno importava
06:56
SuddenlyImprovvisamente, in the mid-metà40s,
163
401000
2000
Improvvisamente, a metà degli anni Quaranta,
06:58
there startediniziato to be a buzzBuzz.
164
403000
2000
cominciò ad esserci del fermento.
07:00
People realizedrealizzato that 1950 was going to happenaccadere,
165
405000
2000
La gente si rese conto che il 1950 stava per arrivare,
07:02
and it could be biggrande.
166
407000
2000
e poteva essere grandioso.
07:04
(LaughterRisate)
167
409000
3000
(Risate)
07:07
But nothing got people interestedinteressato in 1950
168
412000
3000
Ma nulla fece interessare la gente al 1950
07:10
like the yearanno 1950.
169
415000
3000
come l'anno 1950.
07:13
(LaughterRisate)
170
418000
3000
(Risate)
07:16
People were walkinga passeggio around obsessedossessionato.
171
421000
2000
La gente se ne andava in giro ossessionata.
07:18
They couldn'tnon poteva stop talkingparlando
172
423000
2000
Non riuscivano a smettere di parlare
07:20
about all the things they did in 1950,
173
425000
3000
di tutte le cose che fecero nel 1950,
07:23
all the things they were planningpianificazione to do in 1950,
174
428000
3000
di tutte le cose che stavano pianificando di fare nel 1950,
07:26
all the dreamssogni of what they wanted to accomplishrealizzare in 1950.
175
431000
5000
di tutti i sogni di cose che che volevano realizzare nel 1950.
07:31
In factfatto, 1950 was so fascinatingaffascinante
176
436000
2000
A conti fatti il 1950 fu così affascinante
07:33
that for yearsanni thereafterda allora in poi,
177
438000
2000
che negli anni a seguire
07:35
people just kepttenere talkingparlando about all the amazingStupefacente things that happenedè accaduto,
178
440000
3000
la gente continuò a parlare di tutte le cose stupefacenti che accaddero,
07:38
in '51, '52, '53.
179
443000
2000
nel '51, nel '52 e nel '53.
07:40
FinallyInfine in 1954,
180
445000
2000
Alla fine nel 1954
07:42
someonequalcuno wokesvegliato up and realizedrealizzato
181
447000
2000
qualcuno si svegliò e si rese conto
07:44
that 1950 had gottenottenuto somewhatpiuttosto passpassaggioé.
182
449000
4000
che il 1950 era in qualche modo passato di moda.
07:48
(LaughterRisate)
183
453000
2000
(Risate)
07:50
And just like that, the bubblebolla burstscoppiare.
184
455000
2000
E improvvisamente la bolla esplose.
07:52
(LaughterRisate)
185
457000
2000
(Risate)
07:54
And the storystoria of 1950
186
459000
2000
E la storia del 1950
07:56
is the storystoria of everyogni yearanno that we have on recorddisco,
187
461000
2000
è la storia di ogni anno che abbiamo in archivio,
07:58
with a little twisttorsione, because now we'venoi abbiamo got these nicesimpatico chartsgrafici.
188
463000
3000
con una piccola variante, perché ora abbiamo questi bei diagrammi.
08:01
And because we have these nicesimpatico chartsgrafici, we can measuremisurare things.
189
466000
3000
E dato che abbiamo questi bei diagrammi, possiamo misurare le cose.
08:04
We can say, "Well how fastveloce does the bubblebolla burstscoppiare?"
190
469000
2000
Possiamo dire: "Quanto velocemente la bolla esplode?".
08:06
And it turnsgiri out that we can measuremisurare that very preciselyprecisamente.
191
471000
3000
E si scopre che possiamo misurarla in maniera precisissima.
08:09
EquationsEquazioni were derivedderivato, graphsgrafici were producedprodotta,
192
474000
3000
Equazioni vennero dedotte, grafici furono realizzati
08:12
and the netnetto resultrisultato
193
477000
2000
ed il risultato definitivo
08:14
is that we find that the bubblebolla burstsscoppia fasterPiù veloce and fasterPiù veloce
194
479000
3000
é che scopriamo che la bolla esplode sempre più velocemente
08:17
with eachogni passingpassaggio yearanno.
195
482000
2000
col passare di ciascun anno.
08:19
We are losingperdere interestinteresse in the pastpassato more rapidlyrapidamente.
196
484000
5000
Stiamo perdendo interesse nel passato più rapidamente.
08:24
JMJM: Now a little piecepezzo of careercarriera adviceconsigli.
197
489000
2000
JM: Ora un piccolissimo consiglio sulla carriera.
08:26
So for those of you who seekricercare to be famousfamoso,
198
491000
2000
Per quanti di voi che desiderano essere famosi,
08:28
we can learnimparare from the 25 mostmaggior parte famousfamoso politicalpolitico figuresfigure,
199
493000
2000
possiamo imparare dalle 25 figure politiche più famose,
08:30
authorsautori, actorsattori and so on.
200
495000
2000
autori, attori e così via.
08:32
So if you want to becomediventare famousfamoso earlypresto on, you should be an actorattore,
201
497000
3000
Ad esempio, se volete diventare famosi da giovani, dovreste fare gli attori
08:35
because then famefama startsinizia risingcrescente by the endfine of your 20s --
202
500000
2000
perché in quel caso la fama inizia a crescere con l'avvicinarsi dei trent'anni
08:37
you're still younggiovane, it's really great.
203
502000
2000
siete ancora giovani, è davvero meraviglioso.
08:39
Now if you can wait a little bitpo, you should be an authorautore,
204
504000
2000
Se invece potete attendere un po', potreste diventare degli autori,
08:41
because then you risesalire to very great heightsaltezza,
205
506000
2000
perché in quel caso raggiungerete vette altissime,
08:43
like MarkMark TwainTWAIN, for instanceesempio: extremelyestremamente famousfamoso.
206
508000
2000
come Mark Twain, ad esempio. Estremamente famoso.
08:45
But if you want to reachraggiungere the very topsuperiore,
207
510000
2000
Ma se volete raggiungere il massimo
08:47
you should delayritardo gratificationgratificazione
208
512000
2000
dovreste rinviare le gratificazioni
08:49
and, of coursecorso, becomediventare a politicianpolitico.
209
514000
2000
e, ovviamente, diventare un politico.
08:51
So here you will becomediventare famousfamoso by the endfine of your 50s,
210
516000
2000
In questo caso diventereste famosi verso la fine dei cinquant'anni,
08:53
and becomediventare very, very famousfamoso afterwardpoi.
211
518000
2000
e molto molto famosi da andando avanti con l'età.
08:55
So scientistsscienziati alsoanche tendtendere to get famousfamoso when they're much olderpiù vecchio.
212
520000
3000
Anche gli scienziati tendono a diventare famosi in età molto più avanzata.
08:58
Like for instanceesempio, biologistsbiologi and physicsfisica
213
523000
2000
Biologi e fisici, ad esempio,
09:00
tendtendere to be almostquasi as famousfamoso as actorsattori.
214
525000
2000
tendono ad essere quasi tanto famosi quanto gli attori.
09:02
One mistakesbaglio you should not do is becomediventare a mathematicianmatematico.
215
527000
3000
Un errore che non dovreste commettere è quello di diventare dei matematici.
09:05
(LaughterRisate)
216
530000
2000
(Risate)
09:07
If you do that,
217
532000
2000
Se lo faceste
09:09
you mightpotrebbe think, "Oh great. I'm going to do my bestmigliore work when I'm in my 20s."
218
534000
3000
potreste pensare: "Oh, fantastico! Realizzerò il mio miglior lavoro tra i venti e i trent'anni."
09:12
But guessindovina what, nobodynessuno will really carecura.
219
537000
2000
Ma, indovinate un po'? A nessuno importerà nulla.
09:14
(LaughterRisate)
220
539000
3000
(Risate)
09:17
ELAELA: There are more soberingche fa riflettere notesgli appunti
221
542000
2000
ELA: Ci sono annotazioni più serie
09:19
amongtra the n-gramsn-grammi.
222
544000
2000
tra gli n-grammi.
09:21
For instanceesempio, here'secco the trajectorytraiettoria of MarcMarc ChagallChagall,
223
546000
2000
Ad esempio, ecco la traiettoria di Marc Chagall,
09:23
an artistartista bornNato in 1887.
224
548000
2000
un artista nato nel 1887.
09:25
And this lookssembra like the normalnormale trajectorytraiettoria of a famousfamoso personpersona.
225
550000
3000
Questa sembra essere la normale traiettoria di una persona famosa.
09:28
He getsprende more and more and more famousfamoso,
226
553000
4000
Diventa sempre più famoso,
09:32
excepttranne if you look in GermanTedesco.
227
557000
2000
tranne quando si considerano gli n-grammi tedeschi.
09:34
If you look in GermanTedesco, you see something completelycompletamente bizarrebizzarro,
228
559000
2000
Se date uno sguardo in Germania, vedrete qualcosa di assolutamente bizzarro,
09:36
something you prettybella much never see,
229
561000
2000
qualcosa che non si vede praticamente mai,
09:38
whichquale is he becomesdiventa extremelyestremamente famousfamoso
230
563000
2000
ovvero il fatto che diventa estremamente famoso
09:40
and then all of a suddenimprovviso plummetsprecipita,
231
565000
2000
e poi tutto a un tratto la sua fama precipita
09:42
going throughattraverso a nadirNadir betweenfra 1933 and 1945,
232
567000
3000
raggiungendo il punto più basso tra il 1933 e il 45,
09:45
before reboundingrimbalzo afterwardpoi.
233
570000
3000
prima di recuperare terreno in seguito.
09:48
And of coursecorso, what we're seeingvedendo
234
573000
2000
Ovviamente quello che stiamo guardando
09:50
is the factfatto MarcMarc ChagallChagall was a JewishEbraico artistartista
235
575000
3000
è il fatto che Marc Chagall era un artista ebreo
09:53
in NaziNazista GermanyGermania.
236
578000
2000
nella Germania nazista.
09:55
Now these signalssegnali
237
580000
2000
Ora questi segnali
09:57
are actuallyin realtà so strongforte
238
582000
2000
sono davvero tanto evidenti
09:59
that we don't need to know that someonequalcuno was censoredcensurato.
239
584000
3000
da non rendere necessario il sapere che qualcuno è stato censurato.
10:02
We can actuallyin realtà figurefigura it out
240
587000
2000
Possiamo arrivarci tranquillamente
10:04
usingutilizzando really basicdi base signalsegnale processinglavorazione.
241
589000
2000
usando teorie dei segnali davvero elementari.
10:06
Here'sQui è a simplesemplice way to do it.
242
591000
2000
Ecco un modo facile per farlo.
10:08
Well, a reasonableragionevole expectationaspettativa
243
593000
2000
Ci si può ragionevolmente aspettare
10:10
is that somebody'sdi qualcuno famefama in a givendato periodperiodo of time
244
595000
2000
che la fama di una persona in un dato periodo di tempo
10:12
should be roughlyapprossimativamente the averagemedia of theirloro famefama before
245
597000
2000
sia approssimativamente la media della sua precedente fama
10:14
and theirloro famefama after.
246
599000
2000
e di quella successiva.
10:16
So that's sortordinare of what we expectaspettarsi.
247
601000
2000
Questo è un po' quello che ci attendiamo.
10:18
And we compareconfrontare that to the famefama that we observeosservare.
248
603000
3000
Ora, confrontiamo questo con la fama che osserviamo.
10:21
And we just dividedividere one by the other
249
606000
2000
E semplicemente dividiamo l'una per l'altra
10:23
to produceprodurre something we call a suppressionsoppressione indexindice.
250
608000
2000
per produrre qualcosa che noi chiamiamo indice di repressione.
10:25
If the suppressionsoppressione indexindice is very, very, very smallpiccolo,
251
610000
3000
Se l'indice di repressione di una persona è molto, molto, molto piccolo
10:28
then you very well mightpotrebbe be beingessere suppressedsoppresso.
252
613000
2000
quella persona potrebbe benissimo star venendo censurata.
10:30
If it's very largegrande, maybe you're benefitingche beneficiano from propagandapropaganda.
253
615000
3000
Se è molto ampio, forse sta traendo beneficio dalla propaganda.
10:34
JMJM: Now you can actuallyin realtà look at
254
619000
2000
JM: Adesso potete dare un'occhiata
10:36
the distributiondistribuzione of suppressionsoppressione indexesindici over wholetotale populationspopolazioni.
255
621000
3000
alla distribuzione degli indici di repressione sull'intera popolazione
10:39
So for instanceesempio, here --
256
624000
2000
Ad esempio, in questo caso:
10:41
this suppressionsoppressione indexindice is for 5,000 people
257
626000
2000
questo indice di repressione è quello di 5.000 persone
10:43
pickedraccolto in EnglishInglese bookslibri where there's no knownconosciuto suppressionsoppressione --
258
628000
2000
estratte da libri inglesi in cui non risulta alcuna repressione.
10:45
it would be like this, basicallyfondamentalmente tightlystrettamente centeredcentrato on one.
259
630000
2000
La distribuzione sarebbe questa, fondamentalmente distribuito attorno all'1.
10:47
What you expectaspettarsi is basicallyfondamentalmente what you observeosservare.
260
632000
2000
Ciò che si osserva è sostanzialmente identico alle aspettative.
10:49
This is distributiondistribuzione as seenvisto in GermanyGermania --
261
634000
2000
Questa è la distribuzione come vista in Germania;
10:51
very differentdiverso, it's shiftedspostato to the left.
262
636000
2000
é molto diversa, spostata più a sinistra.
10:53
People talkedparlato about it twicedue volte lessDi meno as it should have been.
263
638000
3000
La gente ne parlava due volte meno di quanto avrebbe teoricamente dovuto.
10:56
But much more importantlyimportante, the distributiondistribuzione is much widerpiù ampia.
264
641000
2000
Ma, cosa molto più importante, la distribuzione è molto più larga.
10:58
There are manymolti people who endfine up on the farlontano left on this distributiondistribuzione
265
643000
3000
Ci sono molte persone che finiscono nella parte più a sinistra della distribuzione
11:01
who are talkedparlato about 10 timesvolte fewermeno than they should have been.
266
646000
3000
di cui si parla circa 10 volte meno di quanto si sarebbe dovuto.
11:04
But then alsoanche manymolti people on the farlontano right
267
649000
2000
Ma al contempo molte persone sulla parte più a destra
11:06
who seemsembrare to benefitvantaggio from propagandapropaganda.
268
651000
2000
che sembrano beneficiare della propaganda.
11:08
This pictureimmagine is the hallmarksegno distintivo of censorshipcensura in the booklibro recorddisco.
269
653000
3000
Questa immagine è il marchio della censura nella storia dell'editoria.
11:11
ELAELA: So culturomicsculturomics
270
656000
2000
ELA: Culturomica;
11:13
is what we call this methodmetodo.
271
658000
2000
è così che chiamiamo questo metodo.
11:15
It's kindgenere of like genomicsgenomica.
272
660000
2000
E' un po' come la genomica.
11:17
ExceptTranne per il fatto genomicsgenomica is a lenslente on biologybiologia
273
662000
2000
Eccetto per il fatto che la genomica è uno spiraglio sulla biologia
11:19
throughattraverso the windowfinestra of the sequencesequenza of basesbasi in the humanumano genomegenoma.
274
664000
3000
attraverso la finestra della sequenza di basi nel genoma umano.
11:22
CulturomicsCulturomics is similarsimile.
275
667000
2000
La culturomica è simile.
11:24
It's the applicationapplicazione of massive-scalemassiccia scala datadati collectioncollezione analysisanalisi
276
669000
3000
E' l'applicazione dell'analisi su larga scala di una raccolta di dati
11:27
to the studystudia of humanumano culturecultura.
277
672000
2000
allo studio della cultura umana.
11:29
Here, insteadanziché of throughattraverso the lenslente of a genomegenoma,
278
674000
2000
Qui, invece che attraverso la lente di un genoma,
11:31
throughattraverso the lenslente of digitizeddigitalizzati piecespezzi of the historicalstorico recorddisco.
279
676000
3000
è attraverso la lente di frammenti digitalizzati di registrazioni di carattere storico.
11:34
The great thing about culturomicsculturomics
280
679000
2000
La cosa esaltante della culturonomica
11:36
is that everyonetutti can do it.
281
681000
2000
è che chiunque può praticarla.
11:38
Why can everyonetutti do it?
282
683000
2000
Perché chiunque può praticarla?
11:40
EveryoneTutti can do it because threetre guys,
283
685000
2000
Chiunque può perché queste tre persone,
11:42
JonJon OrwantOrwant, MattMatt GrayGrigio and Will BrockmanBrockman over at GoogleGoogle,
284
687000
3000
Jon Orwant, Matt Gray e Will Brockman di Google
11:45
saw the prototypeprototipo of the NgramNgram ViewerVisualizzatore,
285
690000
2000
videro il prototipo dell'Ngram Viewer.
11:47
and they said, "This is so fundivertimento.
286
692000
2000
e dissero: "E' così divertente.
11:49
We have to make this availablea disposizione for people."
287
694000
3000
Dobbiamo renderlo disponibile al pubblico".
11:52
So in two weekssettimane flatpiatto -- the two weekssettimane before our papercarta cameè venuto out --
288
697000
2000
Quindi in due settimane giuste giuste, le due settimane precedenti alla pubblicazione del nostro saggio
11:54
they codedcodificato up a versionversione of the NgramNgram ViewerVisualizzatore for the generalgenerale publicpubblico.
289
699000
3000
programmarono una versione dell'Ngram Viewer per il vasto pubblico.
11:57
And so you too can typetipo in any wordparola or phrasefrase that you're interestedinteressato in
290
702000
3000
Così anche voi potete digitare una qualsiasi parola o frase alla quale siete interessati
12:00
and see its n-gramn-grammo immediatelysubito --
291
705000
2000
e vedere il suo n-grammo immediatamente;
12:02
alsoanche browseSfoglia examplesesempi of all the variousvario bookslibri
292
707000
2000
oltre a spulciare esempi di tutti i vari libri
12:04
in whichquale your n-gramn-grammo appearsappare.
293
709000
2000
in cui appare il vostro n-grammo .
12:06
JMJM: Now this was used over a millionmilione timesvolte on the first day,
294
711000
2000
JM: Questo programma venne utilizzato un milione di volte durante il primo giorno di rilascio,
12:08
and this is really the bestmigliore of all the queriesquery.
295
713000
2000
e questa è la migliore di tutte le interrogazioni.
12:10
So people want to be theirloro bestmigliore, put theirloro bestmigliore footpiede forwardinoltrare.
296
715000
3000
Tutti vogliono essere best-qualcosa: best seller, best player...
12:13
But it turnsgiri out in the 18thesimo centurysecolo, people didn't really carecura about that at all.
297
718000
3000
Ma si scopre che nel 18esimo secolo, alla gente non importava assolutamente nulla.
12:16
They didn't want to be theirloro bestmigliore, they wanted to be theirloro beftbeft.
298
721000
3000
Non volevano affatto essere "best-qualcosa", volevano essere "beft-qualcosa".
12:19
So what happenedè accaduto is, of coursecorso, this is just a mistakesbaglio.
299
724000
3000
Quello che è successo è, ovviamente, solamente un errore.
12:22
It's not that strovesi è sforzato for mediocritymediocrità,
300
727000
2000
Non è che si sforzassero di essere mediocri.
12:24
it's just that the S used to be writtenscritto differentlydiversamente, kindgenere of like an F.
301
729000
3000
Semplicemente un tempo si usava scrivere la S in maniera differente, un po' come la F.
12:27
Now of coursecorso, GoogleGoogle didn't pickraccogliere this up at the time,
302
732000
3000
Questa cosa Google al momento non la capì,
12:30
so we reportedsegnalati this in the sciencescienza articlearticolo that we wroteha scritto.
303
735000
3000
quindi lo riferimmo nell'articolo scientifico che abbiamo scritto.
12:33
But it turnsgiri out this is just a reminderpromemoria
304
738000
2000
Ma alla fine questo è solo un avvertimento
12:35
that, althoughsebbene this is a lot of fundivertimento,
305
740000
2000
sul fatto che, pur essendo molto divertente,
12:37
when you interpretinterpretare these graphsgrafici, you have to be very carefulattento,
306
742000
2000
interpretare questi grafici richiede molta cautela
12:39
and you have to adoptadottare the basebase standardsnorme in the sciencesscienze.
307
744000
3000
e bisogna farlo seguendo le regole base della scienza.
12:42
ELAELA: People have been usingutilizzando this for all kindstipi of fundivertimento purposesscopi.
308
747000
3000
ELA: Le persone hanno usato questo strumento in un sacco di modi spassosi.
12:45
(LaughterRisate)
309
750000
7000
(Risate)
12:52
ActuallyIn realtà, we're not going to have to talk,
310
757000
2000
In realtà, non avremo nemmeno bisogno di parlare,
12:54
we're just going to showmostrare you all the slidesscivoli and remainrimanere silentsilenzioso.
311
759000
3000
ci limiteremo a mostrarvi tutte le diapositive restando in silenzio.
12:57
This personpersona was interestedinteressato in the historystoria of frustrationfrustrazione.
312
762000
3000
Questa persona era interessata alla storia della frustrazione.
13:00
There's variousvario typestipi of frustrationfrustrazione.
313
765000
3000
Ci sono diversi tipi di frustrazione.
13:03
If you stubalbero mozzo your toePunta, that's a one A "arghArgh."
314
768000
3000
Se sbatti un dito del piede, è un "argh" con una A.
13:06
If the planetpianeta EarthTerra is annihilatedannichilito by the VogonsVogon
315
771000
2000
Se il pianeta Terra viene annientato dai Vogon
13:08
to make roomcamera for an interstellarinterstellare bypassbypass,
316
773000
2000
per fare spazio a un passaggio interstellare,
13:10
that's an eightotto A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
quello è un aaaaaaaargh" con otto A.
13:12
This personpersona studiesstudi all the "arghsArgh,"
318
777000
2000
Questa persona studia tutti gli "argh"
13:14
from one throughattraverso eightotto A'sDi A.
319
779000
2000
composti da uno fino a otto A.
13:16
And it turnsgiri out
320
781000
2000
E si scopre
13:18
that the less-frequentmeno frequenti "arghsArgh"
321
783000
2000
che meno frequenti "argh"
13:20
are, of coursecorso, the onesquelli that correspondcorrispondono to things that are more frustratingfrustrante --
322
785000
3000
sono, ovviamente, quelli che corrispondono a cose che sono più frustranti;
13:23
excepttranne, oddlystranamente, in the earlypresto 80s.
323
788000
3000
tranne che, stranamente, all'inizio degli anni 80.
13:26
We think that mightpotrebbe have something to do with ReaganRonald Reagan.
324
791000
2000
Noi pensiamo che possa avere qualcosa a che fare con Reagan.
13:28
(LaughterRisate)
325
793000
2000
(Risate)
13:30
JMJM: There are manymolti usagesutilizzi of this datadati,
326
795000
3000
JM: ci sono molti utilizzi per questi dati,
13:33
but the bottomparte inferiore linelinea is that the historicalstorico recorddisco is beingessere digitizeddigitalizzati.
327
798000
3000
ma la cosa che più importa è che la registrazione storica stia venendo digitalizzata.
13:36
GoogleGoogle has startediniziato to digitizedigitalizzare 15 millionmilione bookslibri.
328
801000
2000
Google ha iniziato a digitalizzare 15 milioni di libri.
13:38
That's 12 percentper cento of all the bookslibri that have ever been publishedpubblicato.
329
803000
2000
E' il 12% di tutti i libri che siano mai stati pubblicati.
13:40
It's a sizableconsiderevole chunkpezzo of humanumano culturecultura.
330
805000
3000
E' una porzione enorme della cultura umana.
13:43
There's much more in culturecultura: there's manuscriptsmanoscritti, there newspapersgiornali,
331
808000
3000
C'è molto di più nella cultura: ci sono i manoscritti, ci sono le riviste,
13:46
there's things that are not texttesto, like artarte and paintingsdipinti.
332
811000
2000
ci sono cose che non sono testo, come l'arte e la pittura.
13:48
These all happenaccadere to be on our computerscomputer,
333
813000
2000
Tutte cose che, casualmente, si trovano nei nostri computer,
13:50
on computerscomputer acrossattraverso the worldmondo.
334
815000
2000
nei computer di tutto il mondo;
13:52
And when that happensaccade, that will transformtrasformare the way we have
335
817000
3000
E quando la digitalizzazione sarà completa, trasformerà il modo che abbiamo
13:55
to understandcapire our pastpassato, our presentpresente and humanumano culturecultura.
336
820000
2000
di comprendere il nostro passato, il nostro presente e la cultura umana.
13:57
Thank you very much.
337
822000
2000
Grazie infinite a tutti.
13:59
(ApplauseApplausi)
338
824000
3000
(Applausi)
Translated by Claudio Dinapoli
Reviewed by Emanuele Caccia

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com