ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

Τι μάθαμε από 5 εκατομμύρια βιβλία.

Filmed:
2,049,453 views

Παίξατε ποτέ με τον "προβολέα ν-ακολουθιών" (n-gram viewer) της Google? Είναι ένα εθιστικό εργαλείο που σου επιτρέπει να ψάχνεις για λέξεις και ιδέες σε μία βάση δεδομένων 5 εκατομμυρίων βιβλίων ανά τους αιώνες. Ο Έρεζ Λίμπερμαν Έιντεν και ο Ζαν-Μπατίστ Μισέλ δείχνουν πώς δουλεύει και παρουσιάζουν μερικά εκπληκτικά πράγματα που μπορούμε να μάθουμε από 500 δις λέξεις.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
ErezErez LiebermanΛίμπερμαν AidenAiden: EveryoneΟ καθένας knowsξέρει
0
0
2000
Έρεζ Λίμπερμαν Έιντεν: Είναι γνωστό...
00:17
that a pictureεικόνα is worthαξία a thousandχίλια wordsλόγια.
1
2000
3000
ότι μια εικόνα αξίζει χίλιες λέξεις.
00:22
But we at HarvardΧάρβαρντ
2
7000
2000
Αλλά εμείς στο Χάρβαρντ
00:24
were wonderingαναρωτιούνται if this was really trueαληθής.
3
9000
3000
αναρωτιόμασταν αν αυτό αληθεύει.
00:27
(LaughterΤο γέλιο)
4
12000
2000
(Γέλια)
00:29
So we assembledσυναρμολογημένο a teamομάδα of expertsειδικοί,
5
14000
4000
Έτσι, μαζέψαμε μια ομάδα ειδικών
00:33
spanningσύνδεση HarvardΧάρβαρντ, MITMIT,
6
18000
2000
από το Χαρβαρντ, το ΜΙΤ,
00:35
The AmericanΑμερικανική HeritageΚληρονομιά DictionaryΛεξικό, The EncyclopediaΕγκυκλοπαίδεια BritannicaBritannica
7
20000
3000
το Λεξικό Αμερικανικής Κληρονομιάς, την εγκυκλοπαίδεια Μπριτάνικα
00:38
and even our proudυπερήφανος sponsorsχορηγούς,
8
23000
2000
και τους περήφανους χορηγούς μας,
00:40
the GoogleGoogle.
9
25000
3000
τη Google.
00:43
And we cogitatedcogitated about this
10
28000
2000
Και πέσαμε σε βαθιά περισυλλογή
00:45
for about fourτέσσερα yearsχρόνια.
11
30000
2000
για περίπου τέσσερα χρόνια.
00:47
And we cameήρθε to a startlingτρομάζοντας conclusionσυμπέρασμα.
12
32000
5000
Και καταλήξαμε σε ένα τρομακτικό συμπέρασμα.
00:52
LadiesΚυρίες and gentlemenΑντρών, a pictureεικόνα is not worthαξία a thousandχίλια wordsλόγια.
13
37000
3000
Κυρίες και κύριοι, μια εικόνα δεν αξίζει 1000 λέξεις.
00:55
In factγεγονός, we foundβρέθηκαν some picturesεικόνες
14
40000
2000
Πράγματι, βρήκαμε εικόνες
00:57
that are worthαξία 500 billionδισεκατομμύριο wordsλόγια.
15
42000
5000
που αξίζουν 500 δις λέξεις.
01:02
Jean-BaptisteΖαν-Μπατίστ MichelΜισέλ: So how did we get to this conclusionσυμπέρασμα?
16
47000
2000
Ζαν-Μπατίστ Μισέλ: Μα πώς καταλήξαμε σε αυτό το συμπέρασμα;
01:04
So ErezErez and I were thinkingσκέψη about waysτρόπους
17
49000
2000
Ο Έρεζ και εγώ σκεφτόμασταν τρόπους
01:06
to get a bigμεγάλο pictureεικόνα of humanο άνθρωπος cultureΠολιτισμός
18
51000
2000
για να δούμε μία συνολική εικόνα του ανθρώπινου πολιτισμού
01:08
and humanο άνθρωπος historyιστορία: changeαλλαγή over time.
19
53000
3000
και της ανθρώπινης ιστορίας: αλλαγή μέσα στο χρόνο.
01:11
So manyΠολλά booksβιβλία actuallyπράγματι have been writtenγραπτός over the yearsχρόνια.
20
56000
2000
Πάρα πολλά βιβλία γράφτηκαν στη διάρκεια των χρόνων
01:13
So we were thinkingσκέψη, well the bestκαλύτερος way to learnμαθαίνω from them
21
58000
2000
Έτσι σκεφτήκαμε ότι ο καλύτερος τρόπος να μάθουμε κάτι από αυτά
01:15
is to readανάγνωση all of these millionsεκατομμύρια of booksβιβλία.
22
60000
2000
είναι να τα διαβάσουμε όλα.
01:17
Now of courseσειρά μαθημάτων, if there's a scaleκλίμακα for how awesomeφοβερός that is,
23
62000
3000
Τώρα βέβαια, αν υπάρχει μια κλίμακα για το πόσο "φανταστικό" είναι αυτό
01:20
that has to rankκατάταξη extremelyεπακρώς, extremelyεπακρώς highυψηλός.
24
65000
3000
τότε πρέπει να φιγουράρει πολύ ψηλά
01:23
Now the problemπρόβλημα is there's an X-axisΆξονας x for that,
25
68000
2000
Τώρα το πρόβλημα εδώ είναι ότι υπάρχει ο άξονας του χ,
01:25
whichοι οποίες is the practicalπρακτικός axisάξονας.
26
70000
2000
ο οποίος είναι ο άξονας της πρακτικότητας.
01:27
This is very, very lowχαμηλός.
27
72000
2000
Αυτή βρίσκεται πολύ, πολύ χαμηλά.
01:29
(ApplauseΧειροκροτήματα)
28
74000
3000
(Χειροκρότημα)
01:32
Now people tendτείνω to use an alternativeεναλλακτική λύση approachπλησιάζω,
29
77000
3000
Τώρα ο κόσμος τείνει να έχει μια διαφορετική προσέγγιση,
01:35
whichοι οποίες is to take a fewλίγοι sourcesπηγές and readανάγνωση them very carefullyπροσεκτικά.
30
80000
2000
η οποία είναι να παίρνεις μόνο μερικές πηγές και να τις διαβάζεις πολύ προσεκτικά.
01:37
This is extremelyεπακρώς practicalπρακτικός, but not so awesomeφοβερός.
31
82000
2000
Αυτό είναι πολύ πρακτικό αλλά όχι "φανταστικό"
01:39
What you really want to do
32
84000
3000
Αυτό που πραγματικά θέλουμε να κάνουμε
01:42
is to get to the awesomeφοβερός yetΑκόμη practicalπρακτικός partμέρος of this spaceχώρος.
33
87000
3000
είναι να φτάσουμε στο πρακτικό και "φανταστικό" κομμάτι αυτού του μέρους.
01:45
So it turnsστροφές out there was a companyΕταιρία acrossαπέναντι the riverποτάμι calledπου ονομάζεται GoogleGoogle
34
90000
3000
Λοιπόν, υπάρχει μια εταιρεία στην άλλη μεριά του ποταμού που λέγεται Google™
01:48
who had startedξεκίνησε a digitizationψηφιοποίηση projectέργο a fewλίγοι yearsχρόνια back
35
93000
2000
η οποία πριν από μερικά χρόνια ξεκίνησε ένα έργο ψηφιοποίησης
01:50
that mightθα μπορούσε just enableεπιτρέπω this approachπλησιάζω.
36
95000
2000
το οποιό θα επέτρεπε αυτή την προσέγγιση.
01:52
They have digitizedψηφιοποιημένο millionsεκατομμύρια of booksβιβλία.
37
97000
2000
Ψηφιοποίησαν εκατομμύρια βιβλία.
01:54
So what that meansπου σημαίνει is, one could use computationalυπολογιστική methodsμεθόδων
38
99000
3000
Αυτό σημαίνει ότι κάποιος θα μπορούσε να χρησιμοποιήσει υπολογιστικές μεθόδους
01:57
to readανάγνωση all of the booksβιβλία in a clickΚάντε κλικ of a buttonκουμπί.
39
102000
2000
για να διαβάσει όλα τα βιβλία με το πάτημα ενός κουμπιού.
01:59
That's very practicalπρακτικός and extremelyεπακρώς awesomeφοβερός.
40
104000
3000
Αυτό είναι πολύ πρακτικό και πάρα πολύ "φανταστικό".
02:03
ELAΕΛΑ: Let me tell you a little bitκομμάτι about where booksβιβλία come from.
41
108000
2000
ΕΛΕ: Επιτρέψτε μου να σας μιλήσω λίγο για την προέλευση των βιβλίων.
02:05
SinceΑπό το time immemorialαμνημόνευτος, there have been authorsσυγγραφείς.
42
110000
3000
Οι συγγραφείς υπάρχουν από αμνημονεύτων χρόνων.
02:08
These authorsσυγγραφείς have been strivingπροσπάθεια to writeγράφω booksβιβλία.
43
113000
3000
Αυτοί οι συγγραφείς προσπαθούσαν να γράψουν βιβλία.
02:11
And this becameέγινε considerablyπολύ easierευκολότερη
44
116000
2000
Αυτό έγινε πολύ ευκολότερο
02:13
with the developmentανάπτυξη of the printingεκτύπωση pressτύπος some centuriesαιώνες agoπριν.
45
118000
2000
με την ανακάλυψη της τυπογραφίας πριν από μερικους αιώνες.
02:15
SinceΑπό το then, the authorsσυγγραφείς have wonΚέρδισε
46
120000
3000
Από τότε οι συγγραφείς κατάφεραν,
02:18
on 129 millionεκατομμύριο distinctδιακριτή occasionsπεριστασεις,
47
123000
2000
σε 129 εκ. ξεχωριστές περιπτώσεις,
02:20
publishingδημοσίευση booksβιβλία.
48
125000
2000
να εκδώσουν βιβλία
02:22
Now if those booksβιβλία are not lostχαμένος to historyιστορία,
49
127000
2000
Αν τώρα, αυτά τα βιβλία δεν χάθηκαν κάπου μέσα στην ιστορία,
02:24
then they are somewhereκάπου in a libraryβιβλιοθήκη,
50
129000
2000
τότε είναι σε κάποια βιβλιοθήκη
02:26
and manyΠολλά of those booksβιβλία have been gettingνα πάρει retrievedΑνακτήθηκαν from the librariesβιβλιοθήκες
51
131000
3000
και πολλά από αυτά τα βιβλία η Google τα πήρε από τη βιβλιοθήκη
02:29
and digitizedψηφιοποιημένο by GoogleGoogle,
52
134000
2000
και τα ψηφιοποίησε,
02:31
whichοι οποίες has scannedσάρωση 15 millionεκατομμύριο booksβιβλία to dateημερομηνία.
53
136000
2000
σαρώνοντας μέχρι σήμερα 15 εκατομμύρια βιβλία.
02:33
Now when GoogleGoogle digitizesψηφιοποιεί a bookΒιβλίο, they put it into a really niceόμορφη formatμορφή.
54
138000
3000
Όταν η Google ψηφιοποιεί ένα βιβλίο, το μετατρέπει σε μια πολύ όμορφη μορφή.
02:36
Now we'veέχουμε got the dataδεδομένα, plusσυν we have metadataμετα-δεδομένα.
55
141000
2000
Έχουμε τα δεδομένα (data) και τα μεταδεδομένα (metadata)
02:38
We have informationπληροφορίες about things like where was it publishedδημοσίευσε,
56
143000
3000
Έχουμε πληροφορίες για πράγματα όπως, τον τόπο έκδοσης,
02:41
who was the authorσυγγραφέας, when was it publishedδημοσίευσε.
57
146000
2000
το συγγραφέα, την ημερομηνία έκδοσης.
02:43
And what we do is go throughδιά μέσου all of those recordsαρχεία
58
148000
3000
Και αυτό που κάνουμε είναι να περνάμε από όλα αυτα τα αρχεία
02:46
and excludeαποκλείουν everything that's not the highestύψιστος qualityποιότητα dataδεδομένα.
59
151000
4000
και να αποκλείουμε οποιοδήποτε δεδομένο δεν είναι υψηλής ποιότητας.
02:50
What we're left with
60
155000
2000
Στο τέλος μας μένει
02:52
is a collectionσυλλογή of fiveπέντε millionεκατομμύριο booksβιβλία,
61
157000
3000
μια συλλογή από 5 εκατομμύρια βιβλία,
02:55
500 billionδισεκατομμύριο wordsλόγια,
62
160000
3000
500 δισεκατομμύρια λέξεις,
02:58
a stringσειρά of charactersχαρακτήρες a thousandχίλια timesφορές longerμακρύτερα
63
163000
2000
μια αλυσίδα χαρακτήρων χίλιες φορές μεγαλύτερη
03:00
than the humanο άνθρωπος genomeγονιδίωμα --
64
165000
3000
από το ανθρώπινο γονιδίωμα.
03:03
a textκείμενο whichοι οποίες, when writtenγραπτός out,
65
168000
2000
Ένα κείμενο το οποίο γραμμένο
03:05
would stretchτέντωμα from here to the MoonΦεγγάρι and back
66
170000
2000
θα έφτανε από εδώ μέχρι το φεγγάρι και πάλι πίσω
03:07
10 timesφορές over --
67
172000
2000
πάνω από 10 φορές --
03:09
a veritableπραγματικό shardθραύσμα of our culturalπολιτιστικός genomeγονιδίωμα.
68
174000
4000
ένα αληθινό κομμάτι του πολιτιστικού μας γονιδιώματος
03:13
Of courseσειρά μαθημάτων what we did
69
178000
2000
Βέβαια αυτό που κάναμε,
03:15
when facedαντιμετωπίζουν with suchτέτοιος outrageousαποτρόπαιος hyperboleυπερβολή ...
70
180000
3000
όταν βρεθήκαμε αντιμέτωποι με μια τέτοια υπερβολή...
03:18
(LaughterΤο γέλιο)
71
183000
2000
(Γέλια)
03:20
was what any self-respectingσεβόμενος researchersερευνητές
72
185000
3000
ήταν αυτό που θα έκανε
03:23
would have doneΈγινε.
73
188000
3000
οποιοσδήποτε ερευνητής σέβεται τον εαυτό του
03:26
We tookπήρε a pageσελίδα out of XKCDXKCD,
74
191000
2000
Διαλέξαμε μια σελιδα απο το XKCD,
03:28
and we said, "StandΠερίπτερο back.
75
193000
2000
και είπαμε, "Σταθείτε.
03:30
We're going to try scienceεπιστήμη."
76
195000
2000
Θα εφαρμόσουμε επιστήμη."
03:32
(LaughterΤο γέλιο)
77
197000
2000
(Γέλια)
03:34
JMJM: Now of courseσειρά μαθημάτων, we were thinkingσκέψη,
78
199000
2000
ΖΜ: Βέβαια, σκεφτήκαμε,
03:36
well let's just first put the dataδεδομένα out there
79
201000
2000
ας διαθέσουμε πρώτα τα δεδομένα σε όλους
03:38
for people to do scienceεπιστήμη to it.
80
203000
2000
για να μπορέσουν να τα επεξεργαστούν επιστημονικά.
03:40
Now we're thinkingσκέψη, what dataδεδομένα can we releaseελευθέρωση?
81
205000
2000
Μετά σκεφτήκαμε, τι δεδομένα μπορούμε να διαθέσουμε;
03:42
Well of courseσειρά μαθημάτων, you want to take the booksβιβλία
82
207000
2000
Αυτό που θέλεις να κάνεις, είναι να πάρεις τα βιβλία½
03:44
and releaseελευθέρωση the fullγεμάτος textκείμενο of these fiveπέντε millionεκατομμύριο booksβιβλία.
83
209000
2000
και να διαθέσεις το πλήρες κείμενο και των 5 εκ. βιβλίων
03:46
Now GoogleGoogle, and JonJon OrwantOrwant in particularιδιαιτερος,
84
211000
2000
Τώρα η Google, και συγκεκριμένα ο Τζον Όργουαντ,
03:48
told us a little equationεξίσωση that we should learnμαθαίνω.
85
213000
2000
μας είπαν μια εξίσωση που έπρεπε να μάθουμε.
03:50
So you have fiveπέντε millionεκατομμύριο, that is, fiveπέντε millionεκατομμύριο authorsσυγγραφείς
86
215000
3000
Έχεις 5 εκατομμύρια βιβλία, δηλαδή 5 εκατομμύρια συγγραφείς
03:53
and fiveπέντε millionεκατομμύριο plaintiffsενάγοντες is a massiveογκώδης lawsuitαγωγή.
87
218000
3000
και 5 εκατομμύρια ενάγοντες που σημαίνει μια τεράστια αγωγή.
03:56
So, althoughαν και that would be really, really awesomeφοβερός,
88
221000
2000
Έτσι, παρ' ότι αυτό θα ήταν πολύ, μα πολύ "φανταστικό"
03:58
again, that's extremelyεπακρώς, extremelyεπακρώς impracticalμη πρακτικός.
89
223000
3000
δεν θα ήταν καθόλου μα καθόλου πρακτικό.
04:01
(LaughterΤο γέλιο)
90
226000
2000
(Γέλια)
04:03
Now again, we kindείδος of cavedυπέκυψε in,
91
228000
2000
Για άλλη μια φορά βεβαια, σχεδόν υποκύψαμε,
04:05
and we did the very practicalπρακτικός approachπλησιάζω, whichοι οποίες was a bitκομμάτι lessπιο λιγο awesomeφοβερός.
92
230000
3000
και διαλέξαμε την πολύ πρακτική προσέγγιση, που ήταν λίγο λιγότερο "φανταστική".
04:08
We said, well insteadαντι αυτου of releasingαπελευθερώνοντας the fullγεμάτος textκείμενο,
93
233000
2000
Είπαμε ότι αντί να διαθέσουμε το πλήρες κείμενο,
04:10
we're going to releaseελευθέρωση statisticsστατιστική about the booksβιβλία.
94
235000
2000
θα διαθέσουμε στατιστικά για τα βιβλία.
04:12
So take for instanceπαράδειγμα "A gleamλάμψη of happinessευτυχία."
95
237000
2000
Έτσι για παράδειγμα, η φράση "A gleam of happiness."
04:14
It's fourτέσσερα wordsλόγια; we call that a four-gramτέσσερις-γραμμαρίων.
96
239000
2000
Έχει τέσσερεις λέξεις; το ονομάζουμε τετρ-ακολουθία.
04:16
We're going to tell you how manyΠολλά timesφορές a particularιδιαιτερος four-gramτέσσερις-γραμμαρίων
97
241000
2000
Θα σας πούμε πόσες φορές εμφανίστηκε μια συγκεκριμένη
04:18
appearedεμφανίστηκε in booksβιβλία in 1801, 1802, 1803,
98
243000
2000
τετρ-ακολουθία σε βιβλία το 1801, 1802, 1803,
04:20
all the way up to 2008.
99
245000
2000
μέχρι το 2008.
04:22
That givesδίνει us a time seriesσειρά
100
247000
2000
Αυτό μας δίνει ένα χρονικό διάγραμμα
04:24
of how frequentlyσυχνά this particularιδιαιτερος sentenceπερίοδος was used over time.
101
249000
2000
για το πόσο συχνά χρησιμοποιήθηκε η συγκεκριμένη πρόταση μέσα στο χρόνο.
04:26
We do that for all the wordsλόγια and phrasesφράσεις that appearεμφανίζομαι in those booksβιβλία,
102
251000
3000
Αυτό το κάνουμε για όλες τις λέξεις και προτάσεις που εμφανίζονταν σε αυτά τα βιβλία,
04:29
and that givesδίνει us a bigμεγάλο tableτραπέζι of two billionδισεκατομμύριο linesγραμμές
103
254000
3000
και αυτό μας δίνει έναν μεγάλο πίνακα 2 δισεκατομμυρίων γραμμών
04:32
that tell us about the way cultureΠολιτισμός has been changingαλλάζοντας.
104
257000
2000
που μας λέει τον τρόπο που μεταβάλλεται ο πολιτισμός μας.
04:34
ELAΕΛΑ: So those two billionδισεκατομμύριο linesγραμμές,
105
259000
2000
EΛΕ: Έτσι αυτές τις 2 δισεκατομμύρια γραμμές,
04:36
we call them two billionδισεκατομμύριο n-gramsn-γραμμαρίων.
106
261000
2000
τις ονομάζουμε 2 δις. ν-ακολουθίες.
04:38
What do they tell us?
107
263000
2000
Τι μας λένε;
04:40
Well the individualάτομο n-gramsn-γραμμαρίων measureμετρήσει culturalπολιτιστικός trendsτάσεις.
108
265000
2000
Οι μεμονωμένες ν-ακολουθίες μετράνε πολιτιστικές τάσεις.
04:42
Let me give you an exampleπαράδειγμα.
109
267000
2000
Ας σας δώσω ένα παράδειγμα.
04:44
Let's supposeυποθέτω that I am thrivingακμάζουσα,
110
269000
2000
Ας υποθέσουμε ότι σήμερα επιτυγχάνω,
04:46
then tomorrowαύριο I want to tell you about how well I did.
111
271000
2000
και αύριο θέλω να σας πω πόσο καλά τα πήγα.
04:48
And so I mightθα μπορούσε say, "YesterdayΧθες, I throvethrove."
112
273000
3000
Έτσι μπορώ να πω, "Εχθές, πέτυχα"
04:51
AlternativelyΕναλλακτικά, I could say, "YesterdayΧθες, I thrivedάνθισε."
113
276000
3000
Ή εναλλακτικά μπορώ να πω, "Εχθές, επέτυχα"
04:54
Well whichοι οποίες one should I use?
114
279000
3000
Ποιο πρέπει να χρησιμοποιήσω;
04:57
How to know?
115
282000
2000
Πώς να το ξέρω;
04:59
As of about sixέξι monthsμήνες agoπριν,
116
284000
2000
Μέχρι πριν από έξι μήνες
05:01
the stateκατάσταση of the artτέχνη in this fieldπεδίο
117
286000
2000
το καλύτερο που θα μπορούσες να κάνεις
05:03
is that you would, for instanceπαράδειγμα,
118
288000
2000
θα ήταν, για παράδειγμα,
05:05
go up to the followingΕΠΟΜΕΝΟ psychologistψυχολόγος with fabulousυπέροχο hairμαλλιά,
119
290000
2000
να πας στο συγκεκριμένο ψυχολόγο με τα καταπληκτικά μαλλιά,
05:07
and you'dεσείς say,
120
292000
2000
και να του πεις,
05:09
"SteveSteve, you're an expertειδικός on the irregularακανόνιστος verbsΡήματα.
121
294000
3000
"Στιβ, μιας και είσαι ειδήμων στα ανώμαλα ρήματα.
05:12
What should I do?"
122
297000
2000
τι πρέπει να κάνω;"
05:14
And he'dΕίχε tell you, "Well mostπλέον people say thrivedάνθισε,
123
299000
2000
Και αυτός θα σου έλεγε, "Οι περισσότεροι λένε πέτυχα,
05:16
but some people say throvethrove."
124
301000
3000
αλλά μερικοί λένε και επέτυχα."
05:19
And you alsoεπίσης knewήξερε, more or lessπιο λιγο,
125
304000
2000
Και επίσης ήξερες, λίγο ή πολύ,
05:21
that if you were to go back in time 200 yearsχρόνια
126
306000
3000
ότι αν πας 200 χρόνια πίσω στο χρόνο,
05:24
and askπαρακαλώ the followingΕΠΟΜΕΝΟ statesmanπολιτικός with equallyεξίσου fabulousυπέροχο hairμαλλιά,
127
309000
3000
και ρωτήσεις το συγκεκριμένο πολιτικό με εξίσου καταπληκτικά μαλλιά
05:27
(LaughterΤο γέλιο)
128
312000
3000
(Γέλια)
05:30
"TomΤομ, what should I say?"
129
315000
2000
"Τομ, τι πρέπει να πω;"
05:32
He'dΑυτός θα say, "Well, in my day, mostπλέον people throvethrove,
130
317000
2000
Θα έλεγε, "Στις μέρες μου, οι περισσότεροι επέτυχαν,
05:34
but some thrivedάνθισε."
131
319000
3000
αλλά κάποιοι πέτυχαν."
05:37
So now what I'm just going to showπροβολή you is rawακατέργαστος dataδεδομένα.
132
322000
2000
Οπότε τώρα θα σας δείξω τα ακατέργαστα δεδομένα.
05:39
Two rowsσειρές from this tableτραπέζι of two billionδισεκατομμύριο entriesκαταχωρήσεις.
133
324000
4000
Δύο γραμμές από τον πίνακα των 2 δις. γραμμών.
05:43
What you're seeingβλέπων is yearέτος by yearέτος frequencyσυχνότητα
134
328000
2000
Αυτό που βλέπετε είναι η συχνότητα ανά χρόνο που εμφανίζεται
05:45
of "thrivedάνθισε" and "throvethrove" over time.
135
330000
3000
το "πέτυχα" (thrived) και το "επέτυχα" (throve)
05:49
Now this is just two
136
334000
2000
Αυτές είναι μόνο δύο
05:51
out of two billionδισεκατομμύριο rowsσειρές.
137
336000
3000
από τις 2 δις. γραμμές.
05:54
So the entireολόκληρος dataδεδομένα setσειρά
138
339000
2000
Έτσι το σύνολο των δεδομένων
05:56
is a billionδισεκατομμύριο timesφορές more awesomeφοβερός than this slideολίσθηση.
139
341000
3000
είναι ένα δις. φορές πιο "φανταστικό" από αυτό το γράφημα.
05:59
(LaughterΤο γέλιο)
140
344000
2000
(Γέλια)
06:01
(ApplauseΧειροκροτήματα)
141
346000
4000
(Χειροκρότημα)
06:05
JMJM: Now there are manyΠολλά other picturesεικόνες that are worthαξία 500 billionδισεκατομμύριο wordsλόγια.
142
350000
2000
ΖΜ: Τώρα, υπάρχουν πολλές άλλες φωτογραφίες που αξίζουν 500 δις. λέξεις.
06:07
For instanceπαράδειγμα, this one.
143
352000
2000
Για παράδειγμα, αυτή.
06:09
If you just take influenzaγρίπη,
144
354000
2000
Αν για παράδειγμα δείτε τη λέξη "γρίπη",
06:11
you will see peaksκορυφές at the time where you knewήξερε
145
356000
2000
θα δείτε ότι κορυφώνεται την περίοδο
06:13
bigμεγάλο fluγρίπη epidemicsεπιδημίες were killingφόνος people around the globeΣφαίρα.
146
358000
3000
όπου οι μεγάλες επιδημίες της γρίπης, σκότωναν ανθρώπους ανά τον κόσμο
06:16
ELAΕΛΑ: If you were not yetΑκόμη convincedπεπεισμένοι,
147
361000
3000
EΛΕ: Αν δεν έχετε πεισθεί ακόμα,
06:19
seaθάλασσα levelsεπίπεδα are risingαυξανόμενες,
148
364000
2000
η στάθμη της θάλασσας ανεβαίνει,
06:21
so is atmosphericατμοσφαιρικός COCO2 and globalπαγκόσμια temperatureθερμοκρασία.
149
366000
3000
όπως και το ατμοσφαιρικό διοξείδιο του άνθρακα και η παγκόσμια θερμοκρασία.
06:24
JMJM: You mightθα μπορούσε alsoεπίσης want to have a look at this particularιδιαιτερος n-gramn-γραμμάριο,
150
369000
3000
ΖΜ: Ίσως θα θέλατε να κοιτάξετε και αυτή τη συγκεκριμένη ν-ακολουθία,
06:27
and that's to tell NietzscheΝίτσε that God is not deadνεκρός,
151
372000
3000
και αυτό για να πείτε στο Νίτσε ότι ο Θεός δεν έχει πεθάνει,
06:30
althoughαν και you mightθα μπορούσε agreeσυμφωνώ that he mightθα μπορούσε need a better publicistαρθρογράφος.
152
375000
3000
παρ' ότι μπορεί να συμφωνήσετε ότι θα χρειαζόταν έναν καλύτερο εκδότη.
06:33
(LaughterΤο γέλιο)
153
378000
2000
(Γέλια)
06:35
ELAΕΛΑ: You can get at some prettyαρκετά abstractαφηρημένη conceptsέννοιες with this sortείδος of thing.
154
380000
3000
EΛΕ: Μπορείς να καταλήξεις σε πολύ αφηρημένες έννοιες με αυτή τη μέθοδο.
06:38
For instanceπαράδειγμα, let me tell you the historyιστορία
155
383000
2000
Για παράδειγμα, να σας διηγηθώ την ιστορία
06:40
of the yearέτος 1950.
156
385000
2000
του έτους 1950.
06:42
PrettyΌμορφο much for the vastαπέραντος majorityη πλειοψηφία of historyιστορία,
157
387000
2000
Για το μεγαλύτερο διάστημα της παγκόσμιας ιστορίας,
06:44
no one gaveέδωσε a damnδεκάρα about 1950.
158
389000
2000
κανείς δεν νοιάστηκε για το 1950.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
Το 1700, το 1800, το 1900,
06:48
no one caredφροντίδα.
160
393000
3000
κανείς δεν νοιάστηκε.
06:52
ThroughΜέσω the 30s and 40s,
161
397000
2000
Τις δεκαετίες του '30 και του '40
06:54
no one caredφροντίδα.
162
399000
2000
κανείς δεν νοιάστηκε.
06:56
SuddenlyΞαφνικά, in the mid-στα μέσα-40s,
163
401000
2000
Ξαφνικά, στα μέσα της δεκαετίας του '40
06:58
there startedξεκίνησε to be a buzzBuzz.
164
403000
2000
άρχισε να δημιουργείται ένας θόρυβος.
07:00
People realizedσυνειδητοποίησα that 1950 was going to happenσυμβεί,
165
405000
2000
Οι άνθρωποι άρχισαν να πιστεύουν ότι το 1950 θα ερχόταν,
07:02
and it could be bigμεγάλο.
166
407000
2000
και θα μπορούσε να είναι σημαντικό.
07:04
(LaughterΤο γέλιο)
167
409000
3000
(Γέλια)
07:07
But nothing got people interestedενδιαφερόμενος in 1950
168
412000
3000
Αλλά τίποτα δεν απασχόλησε τους ανθρώπους για το 1950
07:10
like the yearέτος 1950.
169
415000
3000
περισσότερο απο το έτος 1950.
07:13
(LaughterΤο γέλιο)
170
418000
3000
(Γέλια)
07:16
People were walkingτο περπάτημα around obsessedέμμονως.
171
421000
2000
Είχε γίνει πλέον εμμονή.
07:18
They couldn'tδεν μπορούσε stop talkingομιλία
172
423000
2000
Δεν μπορούσαν να σταματήσουν να μιλάνε
07:20
about all the things they did in 1950,
173
425000
3000
για όλα τα πράγματα που έκαναν το 1950,
07:23
all the things they were planningσχεδίαση to do in 1950,
174
428000
3000
όλα τα πράγματα που σκόπευαν να κάνουν το 1950,
07:26
all the dreamsόνειρα of what they wanted to accomplishολοκληρώσει in 1950.
175
431000
5000
όλα τα όνειρα που ήθελαν να πραγματοποιήσουν το 1950.
07:31
In factγεγονός, 1950 was so fascinatingγοητευτικός
176
436000
2000
Στην πραγματικότητα το έτος 1950 ήταν τόσο συναρπαστικό,
07:33
that for yearsχρόνια thereafterεν συνεχεία,
177
438000
2000
που για χρόνια αργότερα,
07:35
people just keptδιατηρούνται talkingομιλία about all the amazingφοβερο things that happenedσυνέβη,
178
440000
3000
οι άνθρωποι συνέχισαν να μιλάνε για τα εκπληκτικά πράγματα που συνέβησαν,
07:38
in '51, '52, '53.
179
443000
2000
το '51, '52, '53.
07:40
FinallyΤέλος in 1954,
180
445000
2000
Ξαφνικά το 1954,
07:42
someoneκάποιος wokeξύπνησα up and realizedσυνειδητοποίησα
181
447000
2000
κάποιος ξύπνησε και συνειδητοποίησε
07:44
that 1950 had gottenπήρε somewhatκάπως passπέρασμαé.
182
449000
4000
ότι το 1950 με κάποιο τρόπο... είχε ξεπεραστεί.
07:48
(LaughterΤο γέλιο)
183
453000
2000
(Γέλια)
07:50
And just like that, the bubbleφυσαλλίδα burstέκρηξη.
184
455000
2000
Και κάπως έτσι, έσκασε η φούσκα.
07:52
(LaughterΤο γέλιο)
185
457000
2000
(Γέλια)
07:54
And the storyιστορία of 1950
186
459000
2000
Και η ιστορία του 1950,
07:56
is the storyιστορία of everyκάθε yearέτος that we have on recordΡεκόρ,
187
461000
2000
είναι η ιστορία κάθε χρόνου που έχουμε καταγράψει,
07:58
with a little twistσυστροφή, because now we'veέχουμε got these niceόμορφη chartsδιαγράμματα.
188
463000
3000
με μικρές αλλαγές, αφού πλέον έχουμε αυτά τα όμορφα γραφήματα.
08:01
And because we have these niceόμορφη chartsδιαγράμματα, we can measureμετρήσει things.
189
466000
3000
Και επειδή έχουμε αυτά τα όμορφα γραφήματα, μπορούμε πλέον να μετρήσουμε.
08:04
We can say, "Well how fastγρήγορα does the bubbleφυσαλλίδα burstέκρηξη?"
190
469000
2000
Μπορούμε να αναρωτηθούμε, "Πόσο γρήγορα σκάει η φούσκα?"
08:06
And it turnsστροφές out that we can measureμετρήσει that very preciselyακριβώς.
191
471000
3000
Και φαίνεται ότι μπορούμε να το μετρήσουμε με μεγάλη ακρίβεια.
08:09
EquationsΕξισώσεις were derivedσυμπληρωματικός, graphsγραφικές παραστάσεις were producedπαράγεται,
192
474000
3000
Ανακαλύψαμε εξισώσεις, παρήγαμε γραφήματα,
08:12
and the netκαθαρά resultαποτέλεσμα
193
477000
2000
και το καθαρό αποτέλεσμα ήταν
08:14
is that we find that the bubbleφυσαλλίδα burstsεκρήξεις fasterγρηγορότερα and fasterγρηγορότερα
194
479000
3000
ότι η φούσκα σκάει όλο και γρηγορότερα
08:17
with eachκαθε passingπέρασμα yearέτος.
195
482000
2000
χρόνο με τον χρόνο.
08:19
We are losingχάνοντας interestενδιαφέρον in the pastτο παρελθόν more rapidlyταχέως.
196
484000
5000
Χάνουμε το ενδιαφέρον μας για το παρελθόν όλο και πιο γρήγορα.
08:24
JMJM: Now a little pieceκομμάτι of careerκαριέρα adviceσυμβουλή.
197
489000
2000
JM: Και τώρα μια μικρή επαγγελματική συμβουλή.
08:26
So for those of you who seekψάχνω to be famousπερίφημος,
198
491000
2000
Για εσάς που θέλετε να γίνεται διάσημοι,
08:28
we can learnμαθαίνω from the 25 mostπλέον famousπερίφημος politicalπολιτικός figuresαριθμούς,
199
493000
2000
μπορείτε να συμβουλευθείτε τους 25 πιο διάσημους πολιτικούς,
08:30
authorsσυγγραφείς, actorsηθοποιούς and so on.
200
495000
2000
συγγραφείς, ηθοποιούς, κλπ.
08:32
So if you want to becomeγίνομαι famousπερίφημος earlyνωρίς on, you should be an actorηθοποιός,
201
497000
3000
Έτσι αν θέλετε να γίνετε γρήγορα διάσημος, θα πρέπει να γίνετε ηθοποιός
08:35
because then fameφήμη startsξεκινά risingαυξανόμενες by the endτέλος of your 20s --
202
500000
2000
γιατί η φήμη αρχίζει να ανεβαίνει μέχρι το τέλος των 20 --
08:37
you're still youngνεαρός, it's really great.
203
502000
2000
είστε ακόμα νέος και είναι καταπληκτικά.
08:39
Now if you can wait a little bitκομμάτι, you should be an authorσυγγραφέας,
204
504000
2000
Τώρα, αν μπορείτε να περιμένετε λίγο, θα πρεπει να γίνετε συγγραφέας,
08:41
because then you riseαύξηση to very great heightsύψη,
205
506000
2000
γιατί μετά γίνεστε πολύ διάσημος,
08:43
like MarkMark TwainTWAIN, for instanceπαράδειγμα: extremelyεπακρώς famousπερίφημος.
206
508000
2000
σαν τον Μαρκ Τουέϊν, για παράδειγμα, πολύ διάσημος.
08:45
But if you want to reachφθάνω the very topμπλουζα,
207
510000
2000
Αλλά αν θέλετε να φτάσετε στην κορυφή
08:47
you should delayκαθυστέρηση gratificationικανοποίηση
208
512000
2000
θα πρέπει να καθυστερήσετε την ικανοποίηση
08:49
and, of courseσειρά μαθημάτων, becomeγίνομαι a politicianπολιτικός.
209
514000
2000
και φυσικά να γίνετε πολιτικός.
08:51
So here you will becomeγίνομαι famousπερίφημος by the endτέλος of your 50s,
210
516000
2000
Έτσι θα γίνετε διάσημος μέχρι το τέλος των 50,
08:53
and becomeγίνομαι very, very famousπερίφημος afterwardΜετά.
211
518000
2000
και θα γίνετε πολύ, πολύ διάσημος αργότερα.
08:55
So scientistsΕπιστήμονες alsoεπίσης tendτείνω to get famousπερίφημος when they're much olderΠαλαιότερα.
212
520000
3000
Επίσης οι επιστήμονες τείνουν να γίνονται διάσημοι όταν είναι πολύ μεγαλύτεροι.
08:58
Like for instanceπαράδειγμα, biologistsβιολόγους and physicsη φυσικη
213
523000
2000
Για παράδειγμα οι βιολόγοι και οι φυσικοί,
09:00
tendτείνω to be almostσχεδόν as famousπερίφημος as actorsηθοποιούς.
214
525000
2000
τείνουν να γίνονται σχεδόν όσο διασημοι και οι ηθοποιοί.
09:02
One mistakeλάθος you should not do is becomeγίνομαι a mathematicianμαθηματικός.
215
527000
3000
Ένα λάθος που δεν πρέπει να κάνετε είναι να γίνετε μαθηματικός.
09:05
(LaughterΤο γέλιο)
216
530000
2000
(Γέλια)
09:07
If you do that,
217
532000
2000
Αν το κάνετε αυτό,
09:09
you mightθα μπορούσε think, "Oh great. I'm going to do my bestκαλύτερος work when I'm in my 20s."
218
534000
3000
θα πρέπει να σκεφθείτε, "Ωραία, θα κάνω την καλύτερή μου δουλειά στα 20 μου."
09:12
But guessεικασία what, nobodyκανείς will really careΦροντίδα.
219
537000
2000
Αλλά μαντέψτε! Δεν θα νοιάζει κανέναν.
09:14
(LaughterΤο γέλιο)
220
539000
3000
(Γέλια)
09:17
ELAΕΛΑ: There are more soberingαπογοητευτικό notesσημειώσεις
221
542000
2000
ELA: Υπάρχουν, όμως και πιο απογοητευτικά στοιχεία
09:19
amongαναμεταξύ the n-gramsn-γραμμαρίων.
222
544000
2000
στις n-ακολουθίες (n-grams).
09:21
For instanceπαράδειγμα, here'sεδώ είναι the trajectoryτροχιά of MarcMarc ChagallΣαγκάλ,
223
546000
2000
Για παράδειγμα αυτό είναι το γράφημα του Μαρκ Σαγκάλ,
09:23
an artistκαλλιτέχνης bornγεννημένος in 1887.
224
548000
2000
ενός καλλιτέχνη γεννημένου το 1887.
09:25
And this looksφαίνεται like the normalκανονικός trajectoryτροχιά of a famousπερίφημος personπρόσωπο.
225
550000
3000
Και φαίνεται σαν ένα συνηθισμένο γράφημα διάσημου ανθρώπου.
09:28
He getsπαίρνει more and more and more famousπερίφημος,
226
553000
4000
Γίνετε όλο και όλο πιο διάσημος,
09:32
exceptεκτός if you look in GermanΓερμανικά.
227
557000
2000
εκτός αν κοιτάξεις τα Γερμανικά.
09:34
If you look in GermanΓερμανικά, you see something completelyεντελώς bizarreΠαράξενα σεξ,
228
559000
2000
Αν κοιτάξεις τα Γερμανικά, βλεπεις κάτι πολύ περίεργο,
09:36
something you prettyαρκετά much never see,
229
561000
2000
κάτι που δεν βλέπεις σχεδόν ποτέ,
09:38
whichοι οποίες is he becomesγίνεται extremelyεπακρώς famousπερίφημος
230
563000
2000
το οποίο είναι ότι γίνεται υπερβολικά διάσημος,
09:40
and then all of a suddenαιφνίδιος plummetsμειώνεται κατακόρυφα,
231
565000
2000
και μετά ξαφνικά πέφτει,
09:42
going throughδιά μέσου a nadirναδίρ betweenμεταξύ 1933 and 1945,
232
567000
3000
βρισκόμενος στο ναδίρ μεταξύ 1933 και 1945,
09:45
before reboundingανακάμπτοντας afterwardΜετά.
233
570000
3000
λίγο πριν ανακάμψει αμέσως μετά.
09:48
And of courseσειρά μαθημάτων, what we're seeingβλέπων
234
573000
2000
Και φυσικά, αυτο που βλεπουμε,
09:50
is the factγεγονός MarcMarc ChagallΣαγκάλ was a JewishΕβραϊκή artistκαλλιτέχνης
235
575000
3000
είναι ότι ο Μαρκ Σαγκάλ ήταν ένας Εβραίος καλλιτέχνης
09:53
in NaziΝαζί GermanyΓερμανία.
236
578000
2000
στην ναζιστική Γερμανία.
09:55
Now these signalsσήματα
237
580000
2000
Αυτά τα τρία σημάδια
09:57
are actuallyπράγματι so strongισχυρός
238
582000
2000
είναι τόσο δυνατά
09:59
that we don't need to know that someoneκάποιος was censoredλογοκρίνονται.
239
584000
3000
που δεν χρειάζεται καν να ξέρουμε οτι κάποιος λογοκρίθηκε.
10:02
We can actuallyπράγματι figureεικόνα it out
240
587000
2000
Μπορούμε να το συμπεράνουμε
10:04
usingχρησιμοποιώντας really basicβασικός signalσήμα processingεπεξεργασία.
241
589000
2000
επεξεργαζόμενοι πολύ βασικα σήματα.
10:06
Here'sΕδώ είναι a simpleαπλός way to do it.
242
591000
2000
Να ένας απλός τρόπος.
10:08
Well, a reasonableλογικός expectationπροσδοκία
243
593000
2000
Μια λογική προσδοκία είναι ότι
10:10
is that somebody'sκάποιου fameφήμη in a givenδεδομένος periodπερίοδος of time
244
595000
2000
η φήμη κάποιου σε μια δεδομένη στιγμή
10:12
should be roughlyχονδρικά the averageμέση τιμή of theirδικα τους fameφήμη before
245
597000
2000
πρέπει να είναι ο μέσος όρος της φήμης του πριν
10:14
and theirδικα τους fameφήμη after.
246
599000
2000
και της φήμης του μετά.
10:16
So that's sortείδος of what we expectαναμένω.
247
601000
2000
Οπότε περιμένουμε περίπου αυτό.
10:18
And we compareσυγκρίνω that to the fameφήμη that we observeπαρατηρούν.
248
603000
3000
Και το συγκρίνουμε με την φήμη που παρατηρούμε.
10:21
And we just divideδιαιρέστε one by the other
249
606000
2000
Και απλά διαιρούμε το ένα με το άλλο
10:23
to produceπαράγω something we call a suppressionκαταστολή indexδείκτης.
250
608000
2000
για να πάρουμε κάτι που το αποκαλούμε συντελεστή καταστολής.
10:25
If the suppressionκαταστολή indexδείκτης is very, very, very smallμικρό,
251
610000
3000
Αν ο συντελεστής καταστολής είναι πολύ, πολύ μικρος
10:28
then you very well mightθα μπορούσε be beingνα εισαι suppressedκαταστέλλεται.
252
613000
2000
τότε πιθανότατα έχετε δεχθεί καταστολή.
10:30
If it's very largeμεγάλο, maybe you're benefitingεπωφελούνται from propagandaπροπαγάνδα.
253
615000
3000
Αν είναι πολύ μεγάλος, τότε μάλλον έχετε επωφεληθεί από προπαγάνδα.
10:34
JMJM: Now you can actuallyπράγματι look at
254
619000
2000
JM: Τώρα μπορείτε να δείτε
10:36
the distributionδιανομή of suppressionκαταστολή indexesευρετήρια over wholeολόκληρος populationsπληθυσμών.
255
621000
3000
την κατανομή συντελεστών καταστολής σε ολόκληρους πληθυσμούς.
10:39
So for instanceπαράδειγμα, here --
256
624000
2000
Για παράδειγμα, εδώ --
10:41
this suppressionκαταστολή indexδείκτης is for 5,000 people
257
626000
2000
αυτός ο συντελεστής καταστολής είναι για 5000 ανθρώπους
10:43
pickedεκλεκτός in EnglishΑγγλικά booksβιβλία where there's no knownγνωστός suppressionκαταστολή --
258
628000
2000
που διαλέχθηκαν από Αγγλικά βιβλία όπου δεν υπάρχει κάποιου είδους καταστολή --
10:45
it would be like this, basicallyβασικα tightlyσφικτά centeredστο κέντρο on one.
259
630000
2000
θα ήταν έτσι, βασικά πιο επικεντρωμένο στο ένα.
10:47
What you expectαναμένω is basicallyβασικα what you observeπαρατηρούν.
260
632000
2000
Αυτό που περιμένεις βασικά, είναι αυτό που παρατηρείς.
10:49
This is distributionδιανομή as seenείδα in GermanyΓερμανία --
261
634000
2000
Αυτή είναι η κατανομή στην Γερμανία --
10:51
very differentδιαφορετικός, it's shiftedμετατοπίστηκε to the left.
262
636000
2000
πολύ διαφορετική, εχει μετακινηθεί αριστερά.
10:53
People talkedμίλησε about it twiceεις διπλούν lessπιο λιγο as it should have been.
263
638000
3000
Οι ανθρωποι μιλάνε δύο φορες λιγότερο γι' αυτό απ' ότι θα έπρεπε.
10:56
But much more importantlyείναι σημαντικό, the distributionδιανομή is much widerευρύτερο.
264
641000
2000
Αλλά ακόμα πιο σημαντικό είναι οτι η κατανομή είναι πολύ πλατύτερη.
10:58
There are manyΠολλά people who endτέλος up on the farμακριά left on this distributionδιανομή
265
643000
3000
Υπάρχουν πολλοί άνθρωποι που καταλήγουν τέρμα αριστερά στην κατανομή
11:01
who are talkedμίλησε about 10 timesφορές fewerλιγότεροι than they should have been.
266
646000
3000
που αναφέρονται 10 φορές λιγότερο απ' ότι θα έπρεπε.
11:04
But then alsoεπίσης manyΠολλά people on the farμακριά right
267
649000
2000
Αλλά επίσης και πολύ άνθρωποι τέρμα δεξιά
11:06
who seemφαίνομαι to benefitόφελος from propagandaπροπαγάνδα.
268
651000
2000
που φαίνεται να ευνοούνται από την προπαγάνδα.
11:08
This pictureεικόνα is the hallmarkσήμα κατατεθέν of censorshipλογοκρισία in the bookΒιβλίο recordΡεκόρ.
269
653000
3000
Αυτή η εικόνα είναι το σήμα κατατεθέν της λογοκρισίας στα βιβλία.
11:11
ELAΕΛΑ: So culturomicsculturomics
270
656000
2000
ELA: Οπότε, ονομάζουμε αυτή τη μέθοδο
11:13
is what we call this methodμέθοδος.
271
658000
2000
"πολιτιστικο-ματική" (culturomics).
11:15
It's kindείδος of like genomicsγονιδιωματική.
272
660000
2000
Είναι σαν την γονιδιωματική.
11:17
ExceptΕκτός από genomicsγονιδιωματική is a lensφακός on biologyβιολογία
273
662000
2000
Εκτός του ότι η γονιδιωματική είναι μια ματιά στην βιολογία
11:19
throughδιά μέσου the windowπαράθυρο of the sequenceαλληλουχία of basesβάσεις in the humanο άνθρωπος genomeγονιδίωμα.
274
664000
3000
μέσα από το φακό της συχνότητας βάσης στο ανθρώπινο γονιδίωμα.
11:22
CulturomicsCulturomics is similarπαρόμοιος.
275
667000
2000
Η "Πολιτιστικο-ματική" (culturomics) είναι παρόμοια.
11:24
It's the applicationεφαρμογή of massive-scaleμαζικά dataδεδομένα collectionσυλλογή analysisανάλυση
276
669000
3000
Είναι η εφαρμογή ανάλυσης σε συλλογές δεδομένων τεραστίων διαστάσεων
11:27
to the studyμελέτη of humanο άνθρωπος cultureΠολιτισμός.
277
672000
2000
για τη μελέτη του ανθρώπινου πολιτισμού.
11:29
Here, insteadαντι αυτου of throughδιά μέσου the lensφακός of a genomeγονιδίωμα,
278
674000
2000
Εδώ αντί να κοιτάμε μέσα απο τον φακό του γονιδιώματος
11:31
throughδιά μέσου the lensφακός of digitizedψηφιοποιημένο piecesκομμάτια of the historicalιστορικός recordΡεκόρ.
279
676000
3000
κοιτάμε μέσα απο τον φακό ψηφιοποιημένων κομματιών των καταγραφών της ιστορίας.
11:34
The great thing about culturomicsculturomics
280
679000
2000
Το καλό με την "Πολιτιστικο-ματική" (culturomics)
11:36
is that everyoneΟλοι can do it.
281
681000
2000
είναι οτι όλοι μπορούν να το κάνουν.
11:38
Why can everyoneΟλοι do it?
282
683000
2000
Γιατί μπορούν όλοι να το κάνουν;
11:40
EveryoneΟ καθένας can do it because threeτρία guys,
283
685000
2000
Όλοι μπορουν να το κάνουν, επειδή αυτοί οι τρείς τύποι,
11:42
JonJon OrwantOrwant, MattΜατ GrayΓκρι and Will BrockmanBrockman over at GoogleGoogle,
284
687000
3000
ο Jon Orwant, ο Matt Gray και ο Will Brockman στην Google,
11:45
saw the prototypeπρωτότυπο of the NgramNgram ViewerΠρόγραμμα προβολής,
285
690000
2000
είδαν το πρωτότυπο του "προβολέα ν-ακολουθιών" (n-gram Viewer)
11:47
and they said, "This is so funδιασκέδαση.
286
692000
2000
και είπαν. "Αυτό είναι πολύ διασκεδαστικό.
11:49
We have to make this availableδιαθέσιμος for people."
287
694000
3000
Πρέπει να το κάνουμε διαθέσιμο σε όλους."
11:52
So in two weeksεβδομάδες flatδιαμέρισμα -- the two weeksεβδομάδες before our paperχαρτί cameήρθε out --
288
697000
2000
Έτσι μέσα σε μόλις δύο εβδομάδες -- δυο εβδομάδες πριν δημοσιευθεί η εργασία μας --
11:54
they codedκωδικοποιημένες up a versionεκδοχή of the NgramNgram ViewerΠρόγραμμα προβολής for the generalγενικός publicδημόσιο.
289
699000
3000
κατάφεραν να κρυπτογραφήσουν μια έκδοση του "προβολέα ν-ακολουθιών" (n-gram Viewer) για το κοινό.
11:57
And so you too can typeτύπος in any wordλέξη or phraseφράση that you're interestedενδιαφερόμενος in
290
702000
3000
Κι έτσι μπορείτε να γράψετε οποιαδήποτε λέξη ή πρόταση θέλετε
12:00
and see its n-gramn-γραμμάριο immediatelyαμέσως --
291
705000
2000
και να δείτε την ν-ακολουθία της (n-gram) αμέσως --
12:02
alsoεπίσης browseΑναζήτηση examplesπαραδείγματα of all the variousδιάφορος booksβιβλία
292
707000
2000
Επίσης μπορείτε να αναζητήσετε παραδείγματα από τα διάφορα βιβλία
12:04
in whichοι οποίες your n-gramn-γραμμάριο appearsεμφανίζεται.
293
709000
2000
οπού η ν-ακολουθιά σας (n-gram) εμφανίζεται.
12:06
JMJM: Now this was used over a millionεκατομμύριο timesφορές on the first day,
294
711000
2000
JM: Αυτό χρησιμοποιήθηκε πάνω απο 1 εκ. φορες την πρώτη μέρα,
12:08
and this is really the bestκαλύτερος of all the queriesερωτήματα.
295
713000
2000
και αυτή είναι η καλύτερη ερώτηση.
12:10
So people want to be theirδικα τους bestκαλύτερος, put theirδικα τους bestκαλύτερος footπόδι forwardπρος τα εμπρός.
296
715000
3000
Οι άνθρωποι θέλουν να προσπαθούν, συνέχεια για το καλύτερο.
12:13
But it turnsστροφές out in the 18thth centuryαιώνας, people didn't really careΦροντίδα about that at all.
297
718000
3000
Απ' ότι φαίνετε όμως, οι άνθρωποι τον 18ο αιώνα δεν ενδιαφερόντουσαν πολύ γι' αυτό.
12:16
They didn't want to be theirδικα τους bestκαλύτερος, they wanted to be theirδικα τους beftbeft.
298
721000
3000
Απ' ότι φαίνετε δεν ήθελαν να "προσπαθούν" (best), αλλά να "προσψαθούν" (beft)
12:19
So what happenedσυνέβη is, of courseσειρά μαθημάτων, this is just a mistakeλάθος.
299
724000
3000
Βέβαια, αυτό που έγινε είναι απλά ένα λάθος.
12:22
It's not that stroveπροσπάθησε for mediocrityμετριότητα,
300
727000
2000
Δεν ήταν αγώνας για τη μετριότητα.
12:24
it's just that the S used to be writtenγραπτός differentlyδιαφορετικά, kindείδος of like an F.
301
729000
3000
απλά τότε το "π" (s) γραφότανε αλλιώς, κάπως σας "ψ" (f).
12:27
Now of courseσειρά μαθημάτων, GoogleGoogle didn't pickδιαλέγω this up at the time,
302
732000
3000
Βέβαια η Google, δεν το εντόπισε τότε
12:30
so we reportedέχουν αναφερθεί this in the scienceεπιστήμη articleάρθρο that we wroteέγραψε.
303
735000
3000
όποτε το αναφέραμε στο επιστημονικό άρθρο που δημοσιεύσαμε.
12:33
But it turnsστροφές out this is just a reminderυπενθύμιση
304
738000
2000
Αλλά απ' ότι φαίνεται αυτό είναι μόνο μια υπενθύμιση
12:35
that, althoughαν και this is a lot of funδιασκέδαση,
305
740000
2000
οτι παρ' οτι είναι πολύ διασκεδαστικό,
12:37
when you interpretερμηνεύσει these graphsγραφικές παραστάσεις, you have to be very carefulπροσεκτικός,
306
742000
2000
όταν ερμηνεύεις τα γραφήματα θα πρέπει να είσαι πολύ προσεκτικός
12:39
and you have to adoptενστερνίζομαι the baseβάση standardsπρότυπα in the sciencesεπιστήμες.
307
744000
3000
και να υιοθετείς τις βασικές αρχές των επιστημών.
12:42
ELAΕΛΑ: People have been usingχρησιμοποιώντας this for all kindsείδη of funδιασκέδαση purposesσκοποί.
308
747000
3000
ELA: Οι άνθρωποι το χρησιμοποιούν για πολύ διασκεδαστικούς σκοπούς.
12:45
(LaughterΤο γέλιο)
309
750000
7000
(Γέλια)
12:52
ActuallyΣτην πραγματικότητα, we're not going to have to talk,
310
757000
2000
Βασικά θα σταματήσουμε να μιλάμε,
12:54
we're just going to showπροβολή you all the slidesδιαφάνειες and remainπαραμένει silentσιωπηλός.
311
759000
3000
και θα σας δείξουμε την υπόλοιπη παρουσίαση σιωπηλοί.
12:57
This personπρόσωπο was interestedενδιαφερόμενος in the historyιστορία of frustrationματαίωση.
312
762000
3000
Αυτός ο άνθρωπος ενδιαφερόταν για την ιστορία του εκνευρισμού.
13:00
There's variousδιάφορος typesτύπους of frustrationματαίωση.
313
765000
3000
Υπάρχουν πολλοί τύποι εκνευρισμού.
13:03
If you stubστέλεχος your toetoe, that's a one A "arghΩπ."
314
768000
3000
Άμα στραμπουλήξεις το δάχτυλό σου, υπάρχει ένα "argh" με μόνο ένα "α".
13:06
If the planetπλανήτης EarthΓη is annihilatedεκμηδενιστεί by the VogonsVogons
315
771000
2000
Αν ο πλανήτης Γη εξολοθρευτεί από εξωγήινους
13:08
to make roomδωμάτιο for an interstellarδιάστερος bypassπαράκαμψη,
316
773000
2000
για να κάνουν χώρο, για κάποιο διαστρικό ταξίδι,
13:10
that's an eightοκτώ A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
αυτό είναι "aaaaaaaargh" με οχτώ "α."
13:12
This personπρόσωπο studiesσπουδές all the "arghsarghs,"
318
777000
2000
Αυτός ο άνθρωπος μελετάει τα διάφορα "arghs"
13:14
from one throughδιά μέσου eightοκτώ A'sΑ.
319
779000
2000
από ένα μέχρι οχτώ "α".
13:16
And it turnsστροφές out
320
781000
2000
Και απ' ότι φαίνεται
13:18
that the less-frequentλιγότερο συχνές "arghsarghs"
321
783000
2000
τα λιγότερο συχνά "arghs"
13:20
are, of courseσειρά μαθημάτων, the onesαυτές that correspondαντιστοιχούν to things that are more frustratingαπογοητευτικό --
322
785000
3000
είναι αυτά που αντιστοιχούν σε περισσότερο εκνευρισμό --
13:23
exceptεκτός, oddlyπαράδοξα, in the earlyνωρίς 80s.
323
788000
3000
εκτός, παραδόξως, από τις αρχές της δεκαετίας του '80.
13:26
We think that mightθα μπορούσε have something to do with ReaganΡήγκαν.
324
791000
2000
Πιστεύουμε πως αυτό έχει κάποια σχέση με τον Ρόναλντ Ρήγκαν
13:28
(LaughterΤο γέλιο)
325
793000
2000
(Γέλια)
13:30
JMJM: There are manyΠολλά usagesχρήσεις of this dataδεδομένα,
326
795000
3000
JM: Υπάρχουν πολλές χρήσεις για αυτά τα δεδομένα,
13:33
but the bottomκάτω μέρος lineγραμμή is that the historicalιστορικός recordΡεκόρ is beingνα εισαι digitizedψηφιοποιημένο.
327
798000
3000
αλλά η ουσία είναι οτι ψηφιοποιείτε το ιστορικό μητρώο.
13:36
GoogleGoogle has startedξεκίνησε to digitizeψηφιοποίηση 15 millionεκατομμύριο booksβιβλία.
328
801000
2000
Η Google έχει ψηφιοποιήσει 15 εκ. βιβλία.
13:38
That's 12 percentτοις εκατό of all the booksβιβλία that have ever been publishedδημοσίευσε.
329
803000
2000
Αυτό είναι το 12% όλων των βιβλίων που έχουν ποτέ εκδοθεί.
13:40
It's a sizableΕυμεγέθης chunkμεγάλο κομμάτι of humanο άνθρωπος cultureΠολιτισμός.
330
805000
3000
Είναι ένα μεγάλο κομμάτι του ανθρώπινου πολιτισμού.
13:43
There's much more in cultureΠολιτισμός: there's manuscriptsχειρόγραφα, there newspapersεφημερίδες,
331
808000
3000
Υπάρχουν πολλά περισσότερα στον πολιτισμό: υπάρχουν χειρόγραφα, εφημερίδες,
13:46
there's things that are not textκείμενο, like artτέχνη and paintingsΠΙΝΑΚΕΣ ΖΩΓΡΑΦΙΚΗΣ.
332
811000
2000
υπάρχουν πραγματα που δεν είναι κείμενο, όπως τέχνη και πίνακες.
13:48
These all happenσυμβεί to be on our computersΥπολογιστές,
333
813000
2000
Όλα αυτά τυχαίνει να είναι στους υπολογιστές μας,
13:50
on computersΥπολογιστές acrossαπέναντι the worldκόσμος.
334
815000
2000
σε υπολογιστές σε όλο το κόσμο.
13:52
And when that happensσυμβαίνει, that will transformμεταμορφώνω the way we have
335
817000
3000
Και όταν αυτό συμβεί, θα αλλάξει το τρόπο που αντιλαμβανόμαστε
13:55
to understandκαταλαβαίνουν our pastτο παρελθόν, our presentπαρόν and humanο άνθρωπος cultureΠολιτισμός.
336
820000
2000
το παρελθόν μας, το παρόν μας και τον ανθρώπινο πολιτισμό.
13:57
Thank you very much.
337
822000
2000
Ευχαριστούμε πολύ.
13:59
(ApplauseΧειροκροτήματα)
338
824000
3000
(Χειροκρότημα)
Translated by Spispi Met
Reviewed by Katerina Koinis

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com