ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

Was wir von 5 Millionen Büchern gelernt haben

Filmed:
2,049,453 views

Hast du schon mit dem Google Labs Ngram Viewer gespielt? Es ist ein süchtig machendes Tool, das dich nach Worten und Ideen in einer Datenbank von 5 Millionen Büchern suchen lässt. Erez Lieberman Aiden und Jean-Baptiste Michel zeigen uns wie es funktioniert, und auch ein paar überraschende Sachen, die wir von 500 Milliarden Worten lernen können.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
ErezErez LiebermanLieberman AidenAiden: EveryoneAlle knowsweiß
0
0
2000
Erez Lieberman Aiden: Jeder weiß,
00:17
that a pictureBild is worthwert a thousandtausend wordsWörter.
1
2000
3000
dass ein Bild mehr als tausend Worte sagt.
00:22
But we at HarvardHarvard
2
7000
2000
Aber wir in Harvard
00:24
were wonderingwundernd if this was really truewahr.
3
9000
3000
haben uns gefragt, ob das wirklich stimmt.
00:27
(LaughterLachen)
4
12000
2000
(Gelächter)
00:29
So we assembledgebaut a teamMannschaft of expertsExperten,
5
14000
4000
Also haben wir ein Team von Experten versammelt
00:33
spanningüberspannend HarvardHarvard, MITMIT,
6
18000
2000
aus Harvard, dem MIT,
00:35
The AmericanAmerikanische HeritageErbe DictionaryWörterbuch, The EncyclopediaEnzyklopädie BritannicaBritannica
7
20000
3000
vom American Heritage Dictionary, der Encyclopedia Britannica
00:38
and even our proudstolz sponsorsSponsoren,
8
23000
2000
und sogar unserem stolzen Sponsor,
00:40
the GoogleGoogle.
9
25000
3000
dem Google.
00:43
And we cogitatedzusammen about this
10
28000
2000
Darüber haben wir
00:45
for about fourvier yearsJahre.
11
30000
2000
ungefähr vier Jahre lang gegrübelt.
00:47
And we camekam to a startlingüberraschende conclusionSchlussfolgerung.
12
32000
5000
Und wir sind zu einem überraschenden Ergebnis gekommen.
00:52
LadiesDamen and gentlemenHerren, a pictureBild is not worthwert a thousandtausend wordsWörter.
13
37000
3000
Meine Damen und Herren, ein Bild sagt nicht mehr als tausend Worte.
00:55
In factTatsache, we foundgefunden some picturesBilder
14
40000
2000
In Wahrheit haben wir Bilder gefunden,
00:57
that are worthwert 500 billionMilliarde wordsWörter.
15
42000
5000
die mehr als 500 Milliarden Worte sagen.
01:02
Jean-BaptisteJean-Baptiste MichelMichel: So how did we get to this conclusionSchlussfolgerung?
16
47000
2000
Jean-Baptiste Michel: Wie sind wir zu diesem Ergebnis gekommen?
01:04
So ErezErez and I were thinkingDenken about waysWege
17
49000
2000
Erez und ich haben uns Wege überlegt
01:06
to get a biggroß pictureBild of humanMensch cultureKultur
18
51000
2000
wie wir ein Gesamtbild der menschlichen Kultur
01:08
and humanMensch historyGeschichte: changeVeränderung over time.
19
53000
3000
und Geschichte erzeugen können: Veränderung im Lauf der Zeit.
01:11
So manyviele booksBücher actuallytatsächlich have been writtengeschrieben over the yearsJahre.
20
56000
2000
Über die Jahre wurden so viele Bücher geschrieben.
01:13
So we were thinkingDenken, well the bestBeste way to learnlernen from them
21
58000
2000
Also haben wir uns gedacht, der beste Weg von ihnen zu lernen,
01:15
is to readlesen all of these millionsMillionen of booksBücher.
22
60000
2000
sei all diese Millionen Bücher zu lesen.
01:17
Now of courseKurs, if there's a scaleRahmen for how awesomegenial that is,
23
62000
3000
Wenn es ein Maß dafür gäbe wie toll das ist,
01:20
that has to rankRang extremelyäußerst, extremelyäußerst highhoch.
24
65000
3000
wäre dieses sehr, sehr hoch.
01:23
Now the problemProblem is there's an X-axisX-Achse for that,
25
68000
2000
Das Problem dabei ist, es gibt auch eine X-Achse,
01:25
whichwelche is the practicalpraktisch axisAchse.
26
70000
2000
die praktische Achse.
01:27
This is very, very lowniedrig.
27
72000
2000
Die wäre sehr, sehr niedrig.
01:29
(ApplauseApplaus)
28
74000
3000
(Applaus)
01:32
Now people tendneigen to use an alternativeAlternative approachAnsatz,
29
77000
3000
Eine Alternative wäre stattdessen
01:35
whichwelche is to take a fewwenige sourcesQuellen and readlesen them very carefullyvorsichtig.
30
80000
2000
nur ein paar Quellen zu nehmen und diese sehr genau zu lesen.
01:37
This is extremelyäußerst practicalpraktisch, but not so awesomegenial.
31
82000
2000
Das ist extrem praktisch, aber weniger toll.
01:39
What you really want to do
32
84000
3000
Was man wirklich machen will,
01:42
is to get to the awesomegenial yetnoch practicalpraktisch partTeil of this spacePlatz.
33
87000
3000
ist das Tolle und das Praktische zu verbinden.
01:45
So it turnswendet sich out there was a companyUnternehmen acrossüber the riverFluss callednamens GoogleGoogle
34
90000
3000
Es stellte sich heraus, dass es auf der anderen Seite des Flusses eine Firma gab, Google,
01:48
who had startedhat angefangen a digitizationDigitalisierung projectProjekt a fewwenige yearsJahre back
35
93000
2000
die vor ein paar Jahren ein Digitalisierungsprojekt startete,
01:50
that mightMacht just enableaktivieren this approachAnsatz.
36
95000
2000
das genau diese Herangehensweise ermöglichen könnte.
01:52
They have digitizeddigitalisiert millionsMillionen of booksBücher.
37
97000
2000
Sie haben Millionen Bücher digitalisiert.
01:54
So what that meansmeint is, one could use computationalrechnerisch methodsMethoden
38
99000
3000
Das bedeutet, dass man am Computer
01:57
to readlesen all of the booksBücher in a clickklicken of a buttonTaste.
39
102000
2000
diese ganzen Bücher auf Knopfdruck lesen kann.
01:59
That's very practicalpraktisch and extremelyäußerst awesomegenial.
40
104000
3000
Das ist sehr praktisch und extrem toll.
02:03
ELAELA: Let me tell you a little bitBit about where booksBücher come from.
41
108000
2000
ELA: Lasst mich also ein bisschen über den Ursprung von Büchern erzählen.
02:05
SinceSeit time immemorialunvordenklich, there have been authorsAutoren.
42
110000
3000
Seit Urzeiten gibt es Autoren.
02:08
These authorsAutoren have been strivingStreben to writeschreiben booksBücher.
43
113000
3000
Sie strebten danach Bücher zu schreiben.
02:11
And this becamewurde considerablywesentlich easiereinfacher
44
116000
2000
Dies wurde mit der Erfindung
02:13
with the developmentEntwicklung of the printingDrucken pressDrücken Sie some centuriesJahrhunderte agovor.
45
118000
2000
der Druckerpresse vor einigen Jahrhunderten deutlich einfacher.
02:15
SinceSeit then, the authorsAutoren have wongewonnen
46
120000
3000
Seither haben Autoren es
02:18
on 129 millionMillion distinctdeutlich occasionsGelegenheiten,
47
123000
2000
129 Millionen Mal geschafft Bücher
02:20
publishingVeröffentlichung booksBücher.
48
125000
2000
zu veröffentlichen.
02:22
Now if those booksBücher are not losthat verloren to historyGeschichte,
49
127000
2000
Wenn diese Bücher nicht im Laufe der Geschichte
02:24
then they are somewhereirgendwo in a libraryBibliothek,
50
129000
2000
verloren gegangen sind, stehen sie
02:26
and manyviele of those booksBücher have been gettingbekommen retrievedabgerufen from the librariesBibliotheken
51
131000
3000
in irgendeiner Bibliothek, und viele dieser Bücher wurden von Google
02:29
and digitizeddigitalisiert by GoogleGoogle,
52
134000
2000
erfasst und digitalisiert,
02:31
whichwelche has scannedgescannt 15 millionMillion booksBücher to dateDatum.
53
136000
2000
die bis heute 15 Millionen Bücher gescannt haben.
02:33
Now when GoogleGoogle digitizesdigitalisiert a bookBuch, they put it into a really nicenett formatFormat.
54
138000
3000
Wenn Google ein Buch digitalisiert, bringen sie es in ein sehr schönes Format.
02:36
Now we'vewir haben got the dataDaten, plusPlus we have metadataMetadaten.
55
141000
2000
Nun haben wir die Daten, und außerdem Metadaten.
02:38
We have informationInformation about things like where was it publishedveröffentlicht,
56
143000
3000
Wir haben Informationen wie wo es verlegt wurde,
02:41
who was the authorAutor, when was it publishedveröffentlicht.
57
146000
2000
wer der Autor war und wann es veröffentlicht wurde.
02:43
And what we do is go throughdurch all of those recordsAufzeichnungen
58
148000
3000
Wir gehen dann durch all diese Daten
02:46
and excludeausschließen everything that's not the highesthöchste qualityQualität dataDaten.
59
151000
4000
und schließen alles aus was nicht von höchster Qualität ist.
02:50
What we're left with
60
155000
2000
Was übrig bleibt
02:52
is a collectionSammlung of fivefünf millionMillion booksBücher,
61
157000
3000
sind 5 Millionen Bücher,
02:55
500 billionMilliarde wordsWörter,
62
160000
3000
500 Milliarden Wörter,
02:58
a stringZeichenfolge of charactersFiguren a thousandtausend timesmal longerlänger
63
163000
2000
eine Reihe von Buchstaben eintausendmal so lang
03:00
than the humanMensch genomeGenom --
64
165000
3000
wie das menschliche Genom --
03:03
a textText whichwelche, when writtengeschrieben out,
65
168000
2000
wenn man ihn ausschreiben würde,
03:05
would stretchstrecken from here to the MoonMond and back
66
170000
2000
reichte dieser Text zehn Mal bis zum Mond
03:07
10 timesmal over --
67
172000
2000
und zurück --
03:09
a veritablewahres shardShard of our culturalkulturell genomeGenom.
68
174000
4000
ein beachtlicher Teil unseres kulturellen Genoms.
03:13
Of courseKurs what we did
69
178000
2000
Natürlich haben wir,
03:15
when facedkonfrontiert with sucheine solche outrageousempörend hyperboleÜbertreibung ...
70
180000
3000
konfrontiert mit einer solch unverschämten Übertreibung ...
03:18
(LaughterLachen)
71
183000
2000
(Gelächter)
03:20
was what any self-respectingSelbst-Achtung researchersForscher
72
185000
3000
das getan, was jeder anständige Forscher
03:23
would have doneerledigt.
73
188000
3000
getan hätte.
03:26
We tookdauerte a pageSeite out of XKCDXKCD,
74
191000
2000
Wir haben uns etwas bei dem Online-Comic XKDC abgeschaut
03:28
and we said, "StandStand back.
75
193000
2000
und gesagt: „Vorsicht!
03:30
We're going to try scienceWissenschaft."
76
195000
2000
Wir versuchen es mit Wissenschaft.“
03:32
(LaughterLachen)
77
197000
2000
(Gelächter)
03:34
JMJM: Now of courseKurs, we were thinkingDenken,
78
199000
2000
JM: Zuerst haben wir uns selbstverständlich gedacht,
03:36
well let's just first put the dataDaten out there
79
201000
2000
veröffentlichen wir einfach die Daten,
03:38
for people to do scienceWissenschaft to it.
80
203000
2000
so dass Wissenschaft damit betrieben werden kann.
03:40
Now we're thinkingDenken, what dataDaten can we releaseFreisetzung?
81
205000
2000
Jetzt fragen wir uns aber, welche Daten können wir veröffentlichen?
03:42
Well of courseKurs, you want to take the booksBücher
82
207000
2000
Natürlich will man alle 5 Millionen Bücher
03:44
and releaseFreisetzung the fullvoll textText of these fivefünf millionMillion booksBücher.
83
209000
2000
im Volltext veröffentlichen.
03:46
Now GoogleGoogle, and JonJon OrwantOrwant in particularinsbesondere,
84
211000
2000
Google allerdings, und vor allem Jon Orwant,
03:48
told us a little equationGleichung that we should learnlernen.
85
213000
2000
haben uns eine kleine Gleichung vermittelt.
03:50
So you have fivefünf millionMillion, that is, fivefünf millionMillion authorsAutoren
86
215000
3000
Man hat also 5 Millionen Bücher, das heißt 5 Millionen Autoren,
03:53
and fivefünf millionMillion plaintiffsKläger is a massivemassiv lawsuitKlage.
87
218000
3000
5 Millionen Kläger und einen gewaltigen Prozess.
03:56
So, althoughobwohl that would be really, really awesomegenial,
88
221000
2000
Daher wäre dies, obwohl sehr, sehr toll,
03:58
again, that's extremelyäußerst, extremelyäußerst impracticalunpraktisch.
89
223000
3000
wieder sehr, sehr unpraktisch.
04:01
(LaughterLachen)
90
226000
2000
(Gelächter)
04:03
Now again, we kindArt of cavedeingestürzt in,
91
228000
2000
Nochmal haben wir ein bisschen nachgegeben
04:05
and we did the very practicalpraktisch approachAnsatz, whichwelche was a bitBit lessWeniger awesomegenial.
92
230000
3000
und haben das Praktische gemacht, das jedoch weniger toll war.
04:08
We said, well insteadstattdessen of releasingdie Freigabe the fullvoll textText,
93
233000
2000
Wir haben uns entschieden, dass wir statt der Volltexte
04:10
we're going to releaseFreisetzung statisticsStatistiken about the booksBücher.
94
235000
2000
Statistiken über die Bücher veröffentlichen.
04:12
So take for instanceBeispiel "A gleamSchimmer of happinessGlück."
95
237000
2000
Nehmen wir zum Beispiel „A gleam of happiness“.
04:14
It's fourvier wordsWörter; we call that a four-gramvier-Gramm.
96
239000
2000
Das sind vier Wörter; das nennen wir ein Viergramm.
04:16
We're going to tell you how manyviele timesmal a particularinsbesondere four-gramvier-Gramm
97
241000
2000
Wir sagen euch wie oft ein bestimmtes Viergramm
04:18
appearederschienen in booksBücher in 1801, 1802, 1803,
98
243000
2000
in Büchern in den Jahren 1801, 1802, 1803,
04:20
all the way up to 2008.
99
245000
2000
bis 2008 auftaucht.
04:22
That givesgibt us a time seriesSerie
100
247000
2000
Wir bekommen eine Zeitfolge,
04:24
of how frequentlyhäufig this particularinsbesondere sentenceSatz was used over time.
101
249000
2000
die zeigt, wie oft dieser bestimmte Satz im Laufe der Zeit benutzt wurde.
04:26
We do that for all the wordsWörter and phrasesPhrasen that appearerscheinen in those booksBücher,
102
251000
3000
Das machen wir für alle Wörter und Sätze, die in diesen Büchern auftauchen,
04:29
and that givesgibt us a biggroß tableTabelle of two billionMilliarde linesLinien
103
254000
3000
und daher haben wir eine große Tabelle mit zwei Milliarden Sätzen,
04:32
that tell us about the way cultureKultur has been changingÄndern.
104
257000
2000
die uns etwas über die Veränderung der Kultur erzählen.
04:34
ELAELA: So those two billionMilliarde linesLinien,
105
259000
2000
ELA: Also diese zwei Milliarden Sätze,
04:36
we call them two billionMilliarde n-gramsn-Gramme.
106
261000
2000
die nennen wir zwei Milliarden Ngramme.
04:38
What do they tell us?
107
263000
2000
Was sagen sie aus?
04:40
Well the individualPerson n-gramsn-Gramme measuremessen culturalkulturell trendsTrends.
108
265000
2000
Die individuellen Ngramme messen kulturelle Trends.
04:42
Let me give you an exampleBeispiel.
109
267000
2000
Ich gebe euch ein Beispiel.
04:44
Let's supposeannehmen that I am thrivingblühende,
110
269000
2000
Sagen wir, dass ich Erfolg habe („thriving“),
04:46
then tomorrowMorgen I want to tell you about how well I did.
111
271000
2000
und morgen will ich dir sagen wie viel Erfolg ich gehabt habe.
04:48
And so I mightMacht say, "YesterdayGestern, I throve' throve '."
112
273000
3000
Also sage ich vielleicht: „Gestern ‚throve’ ich“.
04:51
AlternativelyAlternativ, I could say, "YesterdayGestern, I thrivedgediehen."
113
276000
3000
Auf andere Weise könnte ich auch sagen: „Gestern ‚thrived’ ich“.
04:54
Well whichwelche one should I use?
114
279000
3000
Welches soll ich denn jetzt benutzen?
04:57
How to know?
115
282000
2000
Wie kann ich das wissen?
04:59
As of about sixsechs monthsMonate agovor,
116
284000
2000
Bis vor ungefähr sechs Monaten
05:01
the stateBundesland of the artKunst in this fieldFeld
117
286000
2000
war der Stand der Technik in diesem Bereich,
05:03
is that you would, for instanceBeispiel,
118
288000
2000
dass man zum folgenden Psychologen
05:05
go up to the followinges folgen psychologistPsychologe with fabulousfabelhaft hairHaar,
119
290000
2000
mit fantastischen Haaren geht
05:07
and you'ddu würdest say,
120
292000
2000
und ihn fragt:
05:09
"SteveSteve, you're an expertExperte on the irregularirregulär verbsVerben.
121
294000
3000
„Steve, Sie sind ein Experte der unregelmäßigen Verben.
05:12
What should I do?"
122
297000
2000
Was soll ich sagen?“
05:14
And he'der würde tell you, "Well mostdie meisten people say thrivedgediehen,
123
299000
2000
Und er würde sagen: „Naja, die meisten Leute sagen ‚thrived’,
05:16
but some people say throve' throve '."
124
301000
3000
aber manche Leute sagen ‚throve’“.
05:19
And you alsoebenfalls knewwusste, more or lessWeniger,
125
304000
2000
Und man wusste auch, mehr oder weniger,
05:21
that if you were to go back in time 200 yearsJahre
126
306000
3000
dass wenn man 200 Jahre in die Vergangenheit reist
05:24
and askFragen the followinges folgen statesmanStaatsmann with equallygleichermaßen fabulousfabelhaft hairHaar,
127
309000
3000
und den folgenden Staatsmann mit genauso fantastischen Haaren fragt:
05:27
(LaughterLachen)
128
312000
3000
(Gelächter)
05:30
"TomTom, what should I say?"
129
315000
2000
„Tom, was soll ich sagen?“
05:32
He'dEr würde say, "Well, in my day, mostdie meisten people throve' throve ',
130
317000
2000
Er würde sagen: „Naja, zu meiner Zeit sagten die meisten ‚throve’,
05:34
but some thrivedgediehen."
131
319000
3000
aber manche ‚thrived’“.
05:37
So now what I'm just going to showShow you is rawroh dataDaten.
132
322000
2000
Was ich euch hier zeige sind die Rohdaten.
05:39
Two rowsZeilen from this tableTabelle of two billionMilliarde entriesEinträge.
133
324000
4000
Zwei Reihen aus dieser Tabelle mit zwei Milliarden Einträgen.
05:43
What you're seeingSehen is yearJahr by yearJahr frequencyFrequenz
134
328000
2000
Was ihr seht ist die jährliche Häufigkeit
05:45
of "thrivedgediehen" and "throve' throve '" over time.
135
330000
3000
von „thrived“ und „throve“ im Laufe der Zeit.
05:49
Now this is just two
136
334000
2000
Doch dies sind nur zwei
05:51
out of two billionMilliarde rowsZeilen.
137
336000
3000
von zwei Milliarden Reihen.
05:54
So the entireganz dataDaten setSet
138
339000
2000
Die ganze Datenmenge
05:56
is a billionMilliarde timesmal more awesomegenial than this slidegleiten.
139
341000
3000
ist also eine Milliarde Mal so toll wie diese Folie.
05:59
(LaughterLachen)
140
344000
2000
(Gelächter)
06:01
(ApplauseApplaus)
141
346000
4000
(Applaus)
06:05
JMJM: Now there are manyviele other picturesBilder that are worthwert 500 billionMilliarde wordsWörter.
142
350000
2000
JM: Es gibt noch viele andere Bilder, die mehr als 500 Milliarden Wörter sagen.
06:07
For instanceBeispiel, this one.
143
352000
2000
Zum Beispiel dieses.
06:09
If you just take influenzaGrippe,
144
354000
2000
Wenn man „influenza“ eingibt,
06:11
you will see peaksSpitzen at the time where you knewwusste
145
356000
2000
sieht man Hochpunkte an Stellen von denen man weiß,
06:13
biggroß fluGrippe epidemicsEpidemien were killingTötung people around the globeGlobus.
146
358000
3000
dass große Grippeepidemien Menschen in der ganzen Welt töteten.
06:16
ELAELA: If you were not yetnoch convincedüberzeugt,
147
361000
3000
ELA: Wenn du noch nicht überzeugt bist,
06:19
seaMeer levelsEbenen are risingsteigend,
148
364000
2000
der Meeresspiegel steigt an,
06:21
so is atmosphericAtmosphäre COCO2 and globalglobal temperatureTemperatur.
149
366000
3000
genauso wie atmosphärisches CO2 und die globale Temperatur.
06:24
JMJM: You mightMacht alsoebenfalls want to have a look at this particularinsbesondere n-gramn-Gramm,
150
369000
3000
JM: Schauen wir uns auch dieses Ngramm an,
06:27
and that's to tell NietzscheNietzsche that God is not deadtot,
151
372000
3000
um Nietzsche sagen zu können, dass Gott doch nicht tot ist,
06:30
althoughobwohl you mightMacht agreezustimmen that he mightMacht need a better publicistPublizist.
152
375000
3000
obwohl ihr vielleicht auch der Meinung seid, dass er einen besseren Publizist braucht.
06:33
(LaughterLachen)
153
378000
2000
(Gelächter)
06:35
ELAELA: You can get at some prettyziemlich abstractabstrakt conceptsKonzepte with this sortSortieren of thing.
154
380000
3000
ELA: Hiermit kann man ziemlich abstrakte Konzepte ableiten.
06:38
For instanceBeispiel, let me tell you the historyGeschichte
155
383000
2000
Lasst mich zum Beispiel die Geschichte
06:40
of the yearJahr 1950.
156
385000
2000
des Jahres 1950 erzählen.
06:42
PrettyZiemlich much for the vastriesig majorityMehrheit of historyGeschichte,
157
387000
2000
Für den größten Teil der Geschichte
06:44
no one gavegab a damnVerdammt about 1950.
158
389000
2000
war 1950 allen scheißegal.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
In den Jahren 1700, 1800, 1900,
06:48
no one caredgepflegt.
160
393000
3000
war es allen egal.
06:52
ThroughDurch the 30s and 40s,
161
397000
2000
In den 30ern und 40ern,
06:54
no one caredgepflegt.
162
399000
2000
war es allen egal.
06:56
SuddenlyPlötzlich, in the mid-Mitte40s,
163
401000
2000
Plötzlich, mitten in den 40ern,
06:58
there startedhat angefangen to be a buzzBuzz.
164
403000
2000
wurde jeder aufgeregt.
07:00
People realizedrealisiert that 1950 was going to happengeschehen,
165
405000
2000
Es wurde erkannt, dass 1950 kommen würde und,
07:02
and it could be biggroß.
166
407000
2000
dass es etwas Großes sein könnte.
07:04
(LaughterLachen)
167
409000
3000
(Gelächter)
07:07
But nothing got people interestedinteressiert in 1950
168
412000
3000
Aber nichts hat solches Interesse an 1950 erzeugt,
07:10
like the yearJahr 1950.
169
415000
3000
wie das Jahr 1950.
07:13
(LaughterLachen)
170
418000
3000
(Gelächter)
07:16
People were walkingGehen around obsessedbesessen.
171
421000
2000
Die Leute waren besessen.
07:18
They couldn'tkonnte nicht stop talkingim Gespräch
172
423000
2000
Sie konnten nicht aufhören
07:20
about all the things they did in 1950,
173
425000
3000
über all die Sachen zu reden, die sie in 1950 gemacht hatten,
07:23
all the things they were planningPlanung to do in 1950,
174
428000
3000
in 1950 machen wollten,
07:26
all the dreamsTräume of what they wanted to accomplisherreichen in 1950.
175
431000
5000
die ganzen Träume, die sie in 1950 verwirklichen wollten.
07:31
In factTatsache, 1950 was so fascinatingfaszinierend
176
436000
2000
1950 war sogar so faszinierend,
07:33
that for yearsJahre thereafterDanach,
177
438000
2000
dass noch Jahre danach
07:35
people just keptgehalten talkingim Gespräch about all the amazingtolle things that happenedpassiert,
178
440000
3000
über die fantastischen Sachen geredet wurde, die sich ereigneten,
07:38
in '51, '52, '53.
179
443000
2000
in den Jahren ’51, ’52, ’53.
07:40
FinallySchließlich in 1954,
180
445000
2000
Endlich in 1954
07:42
someonejemand wokeerwachte up and realizedrealisiert
181
447000
2000
wachte jemand auf und merkte,
07:44
that 1950 had gottenbekommen somewhatetwas passbestehené.
182
449000
4000
dass 1950 nun passé sei.
07:48
(LaughterLachen)
183
453000
2000
(Gelächter)
07:50
And just like that, the bubbleBlase burstplatzen.
184
455000
2000
Und so einfach zerplatzte die Blase.
07:52
(LaughterLachen)
185
457000
2000
(Gelächter)
07:54
And the storyGeschichte of 1950
186
459000
2000
Und die Geschichte von 1950
07:56
is the storyGeschichte of everyjeden yearJahr that we have on recordAufzeichnung,
187
461000
2000
ist die Geschichte von jedem aufgezeichneten Jahr,
07:58
with a little twistTwist, because now we'vewir haben got these nicenett chartsDiagramme.
188
463000
3000
mit einer kleinen Wende, denn jetzt wir haben diese schönen Grafiken.
08:01
And because we have these nicenett chartsDiagramme, we can measuremessen things.
189
466000
3000
Und weil wir diese schönen Grafiken haben, können wir Dinge messen.
08:04
We can say, "Well how fastschnell does the bubbleBlase burstplatzen?"
190
469000
2000
Wir können sagen: „Na, wie schnell zerplatzt denn die Blase?“
08:06
And it turnswendet sich out that we can measuremessen that very preciselygenau.
191
471000
3000
Und wir haben herausgefunden, dass wir das sehr genau messen können.
08:09
EquationsGleichungen were derivedabgeleitet, graphsDiagramme were producedhergestellt,
192
474000
3000
Gleichungen wurden hergeleitet, Graphen wurden erzeugt,
08:12
and the netNetz resultErgebnis
193
477000
2000
und das Endergebnis
08:14
is that we find that the bubbleBlase burstsplatzt fasterschneller and fasterschneller
194
479000
3000
zeigt uns, dass die Blasen mit jedem Jahr
08:17
with eachjede einzelne passingVorbeigehen yearJahr.
195
482000
2000
schneller und schneller zerplatzen.
08:19
We are losingverlieren interestinteressieren in the pastVergangenheit more rapidlyschnell.
196
484000
5000
Wir verlieren schneller unser Interesse an der Vergangenheit.
08:24
JMJM: Now a little pieceStück of careerKarriere adviceRat.
197
489000
2000
JM: Ein kleiner Karrieretip.
08:26
So for those of you who seeksuchen to be famousberühmt,
198
491000
2000
Für diejenigen von euch die berühmt werden wollen,
08:28
we can learnlernen from the 25 mostdie meisten famousberühmt politicalpolitisch figuresZahlen,
199
493000
2000
können wir von den 25 berühmtesten Politikern,
08:30
authorsAutoren, actorsSchauspieler and so on.
200
495000
2000
Autoren, Schauspielern usw. lernen.
08:32
So if you want to becomewerden famousberühmt earlyfrüh on, you should be an actorDarsteller,
201
497000
3000
Also wenn du früh berühmt werden willst, solltest du Schauspieler werden,
08:35
because then fameRuhm startsbeginnt risingsteigend by the endEnde of your 20s --
202
500000
2000
weil die Berühmtheit dann gegen Ende deiner 20er kommt -
08:37
you're still youngjung, it's really great.
203
502000
2000
du bist noch jung, es ist wirklich großartig.
08:39
Now if you can wait a little bitBit, you should be an authorAutor,
204
504000
2000
Wenn du aber ein bisschen warten kannst, solltest du Autor werden,
08:41
because then you riseerhebt euch to very great heightsHöhen,
205
506000
2000
weil du dann sehr große Höhen erreichst,
08:43
like MarkMark TwainTWAIN, for instanceBeispiel: extremelyäußerst famousberühmt.
206
508000
2000
wie zum Beispiel Mark Twain: extrem berühmt.
08:45
But if you want to reacherreichen the very topoben,
207
510000
2000
Aber wenn du den Gipfel erreichen willst,
08:47
you should delayverzögern gratificationBefriedigung
208
512000
2000
solltest du deinen Erfolg verschieben
08:49
and, of courseKurs, becomewerden a politicianPolitiker.
209
514000
2000
und natürlich Politiker werden.
08:51
So here you will becomewerden famousberühmt by the endEnde of your 50s,
210
516000
2000
Damit wird man gegen Ende seiner 50er berühmt,
08:53
and becomewerden very, very famousberühmt afterwardnachher.
211
518000
2000
und nachher sehr, sehr berühmt.
08:55
So scientistsWissenschaftler alsoebenfalls tendneigen to get famousberühmt when they're much olderälter.
212
520000
3000
Wissenschaftler werden häufig auch erst berühmt wenn sie älter sind.
08:58
Like for instanceBeispiel, biologistsBiologen and physicsPhysik
213
523000
2000
Zum Beispiel, Biologen und Physiker
09:00
tendneigen to be almostfast as famousberühmt as actorsSchauspieler.
214
525000
2000
werden oft fast so berühmt wie Schauspieler.
09:02
One mistakeFehler you should not do is becomewerden a mathematicianMathematiker.
215
527000
3000
Einen Fehler den du aber vermeiden solltest, ist Mathematiker zu werden.
09:05
(LaughterLachen)
216
530000
2000
(Gelächter)
09:07
If you do that,
217
532000
2000
Wenn du das machst,
09:09
you mightMacht think, "Oh great. I'm going to do my bestBeste work when I'm in my 20s."
218
534000
3000
denkst du dir: „Genial! Ich mache meine beste Arbeit in meinen 20ern“.
09:12
But guessvermuten what, nobodyniemand will really carePflege.
219
537000
2000
Aber stelle dir vor, es wird sich keiner interessieren.
09:14
(LaughterLachen)
220
539000
3000
(Gelächter)
09:17
ELAELA: There are more soberingernüchternd notesNotizen
221
542000
2000
ELA: Es gibt auch ernüchterndere Seiten
09:19
amongunter the n-gramsn-Gramme.
222
544000
2000
der Ngramme.
09:21
For instanceBeispiel, here'shier ist the trajectoryFlugbahn of MarcMarc ChagallChagall,
223
546000
2000
Zum Beispiel, hier ist die Kurve von Marc Chagall,
09:23
an artistKünstler borngeboren in 1887.
224
548000
2000
ein 1887 geborener Künstler.
09:25
And this lookssieht aus like the normalnormal trajectoryFlugbahn of a famousberühmt personPerson.
225
550000
3000
Die Kurve verläuft normal für eine berühmte Person.
09:28
He getsbekommt more and more and more famousberühmt,
226
553000
4000
Er wird berühmter und berühmter,
09:32
exceptaußer if you look in GermanDeutsch.
227
557000
2000
außer wenn man auf Deutsch sucht.
09:34
If you look in GermanDeutsch, you see something completelyvollständig bizarreBizarre,
228
559000
2000
Wenn man im Deutschen sucht, sieht man etwas sehr Bizarres,
09:36
something you prettyziemlich much never see,
229
561000
2000
etwas was man fast nie sieht.
09:38
whichwelche is he becomeswird extremelyäußerst famousberühmt
230
563000
2000
Er wird extrem berühmt
09:40
and then all of a suddenplötzlich plummetsstürzt,
231
565000
2000
und stürzt dann auf einmal
09:42
going throughdurch a nadirNadir betweenzwischen 1933 and 1945,
232
567000
3000
zwischen 1933 und 1945 bis zum Tiefpunkt
09:45
before reboundingRebounds afterwardnachher.
233
570000
3000
und erholt sich nachher wieder.
09:48
And of courseKurs, what we're seeingSehen
234
573000
2000
Was wir hier natürlich sehen ist,
09:50
is the factTatsache MarcMarc ChagallChagall was a JewishJüdische artistKünstler
235
575000
3000
dass Marc Chagall ein jüdischer Künstler
09:53
in NaziNazi GermanyDeutschland.
236
578000
2000
in Nazi-Deutschland war.
09:55
Now these signalsSignale
237
580000
2000
Diese Zeichen
09:57
are actuallytatsächlich so strongstark
238
582000
2000
sind tatsächlich so stark,
09:59
that we don't need to know that someonejemand was censoredzensiert.
239
584000
3000
dass wir gar nicht wissen müssen, dass jemand zensiert wurde.
10:02
We can actuallytatsächlich figureZahl it out
240
587000
2000
Wir können es durch ganz elementare
10:04
usingmit really basicBasic signalSignal processingwird bearbeitet.
241
589000
2000
Datenverarbeitung herausfinden.
10:06
Here'sHier ist a simpleeinfach way to do it.
242
591000
2000
Hier ist eine einfache Methode dafür.
10:08
Well, a reasonablevernünftig expectationErwartung
243
593000
2000
Eine sinnvolle Erwartung wäre,
10:10
is that somebody'sjemandes fameRuhm in a givengegeben periodPeriode of time
244
595000
2000
dass Berühmtheit in einer bestimmten Zeitspanne
10:12
should be roughlygrob the averagedurchschnittlich of theirihr fameRuhm before
245
597000
2000
ungefähr gleich dem Durchschnitt der Berühmtheit vorher
10:14
and theirihr fameRuhm after.
246
599000
2000
und dem nachher ist.
10:16
So that's sortSortieren of what we expecterwarten von.
247
601000
2000
Das ist also mehr oder weniger was wir erwarten.
10:18
And we comparevergleichen that to the fameRuhm that we observebeobachten.
248
603000
3000
Und dies vergleichen wir mit der beobachtbaren Berühmtheit.
10:21
And we just divideTeilen one by the other
249
606000
2000
Und wir dividieren halt das Eine durch das Andere,
10:23
to produceproduzieren something we call a suppressionUnterdrückung indexIndex.
250
608000
2000
um einen sogenannten Unterdrückungsindex zu erzeugen.
10:25
If the suppressionUnterdrückung indexIndex is very, very, very smallklein,
251
610000
3000
Wenn dieser Unterdrückungsindex sehr, sehr, sehr klein ist,
10:28
then you very well mightMacht be beingSein suppressedunterdrückt.
252
613000
2000
dann kann es gut sein, dass du unterdrückt wirst.
10:30
If it's very largegroß, maybe you're benefitingprofitieren from propagandaPropaganda.
253
615000
3000
Wenn es sehr groß ist, dann profitierst du vielleicht von Propaganda.
10:34
JMJM: Now you can actuallytatsächlich look at
254
619000
2000
JM: Man kann sich tatsächlich
10:36
the distributionVerteilung of suppressionUnterdrückung indexesIndizes over wholeganze populationsPopulationen.
255
621000
3000
die Verteilung von Unterdrückungsindizes ganzer Populationen ansehen.
10:39
So for instanceBeispiel, here --
256
624000
2000
Wie hier zum Beispiel -
10:41
this suppressionUnterdrückung indexIndex is for 5,000 people
257
626000
2000
dieser Unterdrückungsindex ist für 5.000 Menschen
10:43
pickedabgeholt in EnglishEnglisch booksBücher where there's no knownbekannt suppressionUnterdrückung --
258
628000
2000
aus englischen Büchern, für die es keine bekannte Unterdrückung gibt.
10:45
it would be like this, basicallyGrundsätzlich gilt tightlydicht centeredzentriert on one.
259
630000
2000
Es sähe dann so aus, ziemlich genau eins.
10:47
What you expecterwarten von is basicallyGrundsätzlich gilt what you observebeobachten.
260
632000
2000
Was man erwartet ist im Grunde das, was man beobachtet.
10:49
This is distributionVerteilung as seengesehen in GermanyDeutschland --
261
634000
2000
Dies ist die Verteilung in Deutschland -
10:51
very differentanders, it's shiftedverschoben to the left.
262
636000
2000
sehr anders, nach links verschoben.
10:53
People talkedsprach about it twicezweimal lessWeniger as it should have been.
263
638000
3000
Darüber wurde zweimal weniger gesprochen als zu erwarten wäre.
10:56
But much more importantlywichtig, the distributionVerteilung is much widerbreiter.
264
641000
2000
Aber viel wichtiger ist, dass die Verteilung viel breiter ist.
10:58
There are manyviele people who endEnde up on the farweit left on this distributionVerteilung
265
643000
3000
Es gibt viele Leute, die am ganz linken Rand dieser Verteilung sind,
11:01
who are talkedsprach about 10 timesmal fewerweniger than they should have been.
266
646000
3000
von denen zehnmal weniger gesprochen wurde als erwartet.
11:04
But then alsoebenfalls manyviele people on the farweit right
267
649000
2000
Aber außerdem viele ganz rechts,
11:06
who seemscheinen to benefitVorteil from propagandaPropaganda.
268
651000
2000
die anscheinend von Propaganda profitiert haben.
11:08
This pictureBild is the hallmarkHallmark of censorshipZensur in the bookBuch recordAufzeichnung.
269
653000
3000
Dies ist das typische Bild der Zensur in literarischen Aufzeichnungen.
11:11
ELAELA: So culturomicsculturomics
270
656000
2000
ELA: Kulturomik
11:13
is what we call this methodMethode.
271
658000
2000
nennen wir diese Methode.
11:15
It's kindArt of like genomicsGenomik.
272
660000
2000
Es ist ungefähr wie Genomik.
11:17
ExceptAußer genomicsGenomik is a lensLinse on biologyBiologie
273
662000
2000
Doch Genomik ist mehr oder weniger ein Blick auf Biologie
11:19
throughdurch the windowFenster of the sequenceSequenz of basesBasen in the humanMensch genomeGenom.
274
664000
3000
durch das Fenster der Sequenzen der Basen im menschlichen Genom.
11:22
CulturomicsCulturomics is similarähnlich.
275
667000
2000
Kulturomik ist so ähnlich.
11:24
It's the applicationAnwendung of massive-scalemassiv dataDaten collectionSammlung analysisAnalyse
276
669000
3000
Sie ist die Anwendungsanalyse einer Massendatensammlung
11:27
to the studyStudie of humanMensch cultureKultur.
277
672000
2000
auf die Erforschung der menschlichen Kultur.
11:29
Here, insteadstattdessen of throughdurch the lensLinse of a genomeGenom,
278
674000
2000
Hier blickt man, statt durch das Genom,
11:31
throughdurch the lensLinse of digitizeddigitalisiert piecesStücke of the historicalhistorisch recordAufzeichnung.
279
676000
3000
durch digitalisierte Stücke der historischen Aufzeichnungen.
11:34
The great thing about culturomicsculturomics
280
679000
2000
Das Großartige an Kulturomik ist,
11:36
is that everyonejeder can do it.
281
681000
2000
dass es jeder machen kann.
11:38
Why can everyonejeder do it?
282
683000
2000
Warum kann es jeder machen?
11:40
EveryoneAlle can do it because threedrei guys,
283
685000
2000
Jeder kann es machen, weil drei Typen von Google,
11:42
JonJon OrwantOrwant, MattMatt GrayGray and Will BrockmanBrockman over at GoogleGoogle,
284
687000
3000
Jon Orwant, Matt Gray und Will Brockman
11:45
saw the prototypePrototyp of the NgramNgram ViewerViewer,
285
690000
2000
den Prototyp des Ngram Viewers sahen
11:47
and they said, "This is so funSpaß.
286
692000
2000
und sagten: „Das ist so ein Spaß.
11:49
We have to make this availableverfügbar for people."
287
694000
3000
Dies müssen wir allen zugänglich machen.“
11:52
So in two weeksWochen flateben -- the two weeksWochen before our paperPapier- camekam out --
288
697000
2000
Und innerhalb von zwei Wochen - genau bevor unser Artikel erschienen ist -
11:54
they codedcodiert up a versionVersion of the NgramNgram ViewerViewer for the generalGeneral publicÖffentlichkeit.
289
699000
3000
haben sie eine öffentliche Version des Ngram Viewers programmiert.
11:57
And so you too can typeArt in any wordWort or phrasePhrase that you're interestedinteressiert in
290
702000
3000
Und jetzt kannst du auch irgendein interessantes Wort oder Redewendung eingeben
12:00
and see its n-gramn-Gramm immediatelysofort --
291
705000
2000
und sofort das Ngram davon sehen -
12:02
alsoebenfalls browseDurchsuchen examplesBeispiele of all the variousverschiedene booksBücher
292
707000
2000
und auch Beispiele der ganzen verschiedenen Bücher,
12:04
in whichwelche your n-gramn-Gramm appearserscheint.
293
709000
2000
in denen dein Ngram auftaucht, durchsuchen.
12:06
JMJM: Now this was used over a millionMillion timesmal on the first day,
294
711000
2000
JM: Dies wurde am ersten Tag über eine Million Mal genutzt,
12:08
and this is really the bestBeste of all the queriesAbfragen.
295
713000
2000
und das ist wirklich die beste aller Suchanfragen.
12:10
So people want to be theirihr bestBeste, put theirihr bestBeste footFuß forwardVorwärts-.
296
715000
3000
Leute wollen ihr Bestes geben, sich hervortun.
12:13
But it turnswendet sich out in the 18thth centuryJahrhundert, people didn't really carePflege about that at all.
297
718000
3000
Aber es scheint, dass im 18. Jahrhundert das ziemlich egal war.
12:16
They didn't want to be theirihr bestBeste, they wanted to be theirihr beftbeft.
298
721000
3000
Damals wollten sie nicht ihr Bestes geben, sondern ihr Beftes.
12:19
So what happenedpassiert is, of courseKurs, this is just a mistakeFehler.
299
724000
3000
Was hier natürlich passiert ist, ist nur ein Fehler.
12:22
It's not that strovebemühte sich for mediocrityMittelmäßigkeit,
300
727000
2000
Es ist nicht, dass sie nach Mittelmäßigkeit strebten,
12:24
it's just that the S used to be writtengeschrieben differentlyanders, kindArt of like an F.
301
729000
3000
sondern nur, dass das S früher anders geschrieben wurde, eher so wie ein F.
12:27
Now of courseKurs, GoogleGoogle didn't pickwähle this up at the time,
302
732000
3000
Das hat Google anfangs natürlich nicht gemerkt,
12:30
so we reportedberichtet this in the scienceWissenschaft articleArtikel that we wroteschrieb.
303
735000
3000
also haben wir das in unserem wissenschaftlichen Artikel berichtet.
12:33
But it turnswendet sich out this is just a reminderErinnerung
304
738000
2000
Das soll nur als Erinnerung dienen,
12:35
that, althoughobwohl this is a lot of funSpaß,
305
740000
2000
dass man, obwohl es Spaß macht,
12:37
when you interpretinterpretieren these graphsDiagramme, you have to be very carefulvorsichtig,
306
742000
2000
diese Graphen mit Vorsicht interpretieren muss,
12:39
and you have to adoptadoptieren the baseBase standardsStandards in the sciencesWissenschaften.
307
744000
3000
und die Grundnormen der Wissenschaft anwendet.
12:42
ELAELA: People have been usingmit this for all kindsArten of funSpaß purposesZwecke.
308
747000
3000
ELA: Bisher ist es für viele lustige Zwecke genutzt worden.
12:45
(LaughterLachen)
309
750000
7000
(Gelächter)
12:52
ActuallyTatsächlich, we're not going to have to talk,
310
757000
2000
Eigentlich müssen wir gar nicht reden,
12:54
we're just going to showShow you all the slidesFolien and remainbleiben übrig silentLeise.
311
759000
3000
wir zeigen euch einfach diese Folien und schweigen.
12:57
This personPerson was interestedinteressiert in the historyGeschichte of frustrationFrustration.
312
762000
3000
Diese Person hat sich für die Geschichte der Frustration interessiert.
13:00
There's variousverschiedene typesTypen of frustrationFrustration.
313
765000
3000
Es gibt verschiedene Arten von Frustration.
13:03
If you stubStub your toeZehe, that's a one A "arghArgh."
314
768000
3000
Wenn man sich den Zeh stößt, bedeutet das ein „argh“ mit einem A.
13:06
If the planetPlanet EarthErde is annihilatedvernichtet by the VogonsVogonen
315
771000
2000
Wenn die Erde von den Vogonen vernichtet wird,
13:08
to make roomZimmer for an interstellarinterstellar bypassumgehen,
316
773000
2000
um Platz für eine interstellare Umgehungsstraße zu machen,
13:10
that's an eightacht A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
bedeutet das ein „aaaaaaaargh“ mit acht A.
13:12
This personPerson studiesStudien all the "arghsarghs,"
318
777000
2000
Diese Person beobachtet die ganzen „arghs“
13:14
from one throughdurch eightacht A'sA es.
319
779000
2000
von einem A bis acht A.
13:16
And it turnswendet sich out
320
781000
2000
Und es stellte sich heraus,
13:18
that the less-frequentweniger häufige "arghsarghs"
321
783000
2000
dass die weniger häufigen „arghs“
13:20
are, of courseKurs, the onesEinsen that correspondentsprechen to things that are more frustratingfrustrierend --
322
785000
3000
selbstverständlich die sind, die sich auf frustrierendere Sachen beziehen -
13:23
exceptaußer, oddlyseltsam, in the earlyfrüh 80s.
323
788000
3000
außer, seltsamerweise, in den früheren 80ern.
13:26
We think that mightMacht have something to do with ReaganReagan.
324
791000
2000
Wir glauben, das hat vielleicht etwas mit Reagan zu tun.
13:28
(LaughterLachen)
325
793000
2000
(Gelächter)
13:30
JMJM: There are manyviele usagesVerwendungen of this dataDaten,
326
795000
3000
JM: Es gibt viele Verwendungen dieser Daten,
13:33
but the bottomBoden lineLinie is that the historicalhistorisch recordAufzeichnung is beingSein digitizeddigitalisiert.
327
798000
3000
aber im Endeffekt werden die historischen Aufzeichnungen digitalisiert.
13:36
GoogleGoogle has startedhat angefangen to digitizedigitalisieren 15 millionMillion booksBücher.
328
801000
2000
Google hat angefangen 15 Millionen Bücher zu digitalisieren.
13:38
That's 12 percentProzent of all the booksBücher that have ever been publishedveröffentlicht.
329
803000
2000
Das sind 12 Prozent aller Bücher, die je verlegt wurden.
13:40
It's a sizablebeträchtliche chunkStück of humanMensch cultureKultur.
330
805000
3000
Ein beträchtlicher Teil der menschlichen Kultur.
13:43
There's much more in cultureKultur: there's manuscriptsManuskripte, there newspapersZeitungen,
331
808000
3000
Es gibt viel mehr in der Kultur: es gibt Manuskripte, Zeitungen,
13:46
there's things that are not textText, like artKunst and paintingsGemälde.
332
811000
2000
es gibt Sachen die nicht Text sind, wie Kunst und Gemälde.
13:48
These all happengeschehen to be on our computersComputer,
333
813000
2000
All dies ist zufälligerweise auf unseren Computern,
13:50
on computersComputer acrossüber the worldWelt.
334
815000
2000
auf Computern auf der ganzen Welt.
13:52
And when that happensdas passiert, that will transformverwandeln the way we have
335
817000
3000
Und wenn das passiert, muss das unser Verständnis für unsere Vergangenheit,
13:55
to understandverstehen our pastVergangenheit, our presentGeschenk and humanMensch cultureKultur.
336
820000
2000
unsere Gegenwart und die menschliche Kultur verändern.
13:57
Thank you very much.
337
822000
2000
Vielen Dank.
13:59
(ApplauseApplaus)
338
824000
3000
(Applaus)
Translated by Liam Burmester
Reviewed by Linda Geschwandtner

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com