ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com
TED2010

Sebastian Wernicke: Lies, damned lies and statistics (about TEDTalks)

Valheita, kirottuja valheita ja tilastotiedettä (TEDTalkeista)

Filmed:
2,510,120 views

Tässä mahtavasti kieli poskessa tehdyssä analyysissä Sebastian Wernicke soveltaa tilastollisen analyysin konsteja TEDTalkeihin kehittääkseen menetelmän, jolla voi luoda "ihanteellisen TEDTalkin" perustuen käyttäjien arvioihin. Miten arvostelisit sen itse? "Leuat loksauttava?" "Epäuskottava?" Vaiko yksinkertaisesti "Hauska"?
- Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects. Full bio

Double-click the English transcript below to play the video.

00:16
If you go on the TEDTED websiteverkkosivusto,
0
1000
3000
Jos menee TED sivustolle,
00:19
you can currentlytällä hetkellä find there
1
4000
2000
voi siellä tällä hetkellä nähdä
00:21
over a fullkoko weekviikko of TEDTalkTEDTalk videosVideot,
2
6000
3000
yli viikon edestä TEDTalk-videoita,
00:24
over 1.3 millionmiljoona
3
9000
2000
yli 1,3 miljoonaa
00:26
wordssanat of transcriptsselostukset
4
11000
2000
sanaa tekstiä
00:28
and millionsmiljoonia of userkäyttäjä ratingsluokitukset.
5
13000
2000
ja miljoonia käyttäjien tekemiä arvosteluja.
00:30
And that's a hugevaltava amountmäärä of datadata.
6
15000
3000
Se on paljon dataa.
00:33
And it got me wonderingMietitkö:
7
18000
2000
Joten aloin miettimään:
00:35
If you tookkesti all this datadata
8
20000
2000
Jos kaiken tämän datan
00:37
and put it throughkautta statisticaltilastollinen analysisanalyysi,
9
22000
2000
ajaisi tilastollisen analyysin läpi,
00:39
could you reversekäänteinen engineerinsinööri a TEDTalkTEDTalk?
10
24000
2000
voisiko TEDTalkin ratkaista?
00:41
Could you createluoda
11
26000
2000
Olisiko mahdollista luoda
00:43
the ultimateperimmäinen TEDTalkTEDTalk?
12
28000
2000
täydellinen TEDTalk?
00:45
(LaughterNaurua) (ApplauseSuosionosoitukset)
13
30000
2000
(Naurua) (Aplodeja)
00:47
And alsomyös, could you createluoda
14
32000
2000
Ja olisiko myös mahdollista luoda
00:49
the worstpahin possiblemahdollinen TEDTalkTEDTalk
15
34000
2000
huonoin mahdollinen TEDTalk,
00:51
that they would still let you get away with?
16
36000
2000
joka olisi silti hyväksyttävä?
00:53
To find this out, I lookedkatsoin at threekolme things:
17
38000
2000
Selvittääkseni tämän, keskityin kolmeen asiaan:
00:55
I lookedkatsoin at the topicaihe that you should choosevalita,
18
40000
2000
Selvitin mikä aihe kannattaisi valita,
00:57
I lookedkatsoin at how you should delivertoimittaa it
19
42000
3000
miten se pitäisi esittää
01:00
and the visualsgrafiikka onstagelavalla.
20
45000
2000
ja mihin visuaalisiin seikkoihin tulisi kiinnittää huomiota.
01:02
Now, with the topicaihe: There's a wholekoko rangealue of topicsaiheista you can choosevalita,
21
47000
3000
Aloitetaan aiheesta: Aiheita on vaikka miten paljon,
01:05
but you should choosevalita wiselyälykkäästi,
22
50000
2000
mutta valinta kannattaa tehdä huolella,
01:07
because your topicaihe stronglyvoimakkaasti correlateskorreloi
23
52000
2000
sillä valitsemasi aihe on vahvasti yhteydessä siihen,
01:09
with how userskäyttäjät will reactsuhtautua to your talk.
24
54000
3000
miten käyttäjät reagoivat puheeseesi.
01:12
Now, to make this more concretebetoni,
25
57000
2000
Havainnollistetaan tätä
01:14
let's look at the listlista of topYlin 10 wordssanat
26
59000
3000
tarkastelemalla listaa kymmenestä suosituimmasta sanasta,
01:17
that statisticallytilastollisesti sticktikku out
27
62000
2000
jotka erottuvat tilastollisesti muista
01:19
in the mostsuurin osa favoritesuosikki- TEDTalksTEDTalks
28
64000
2000
sekä suosituimmissa,
01:21
and in the leastvähiten favoritesuosikki- TEDTalksTEDTalks.
29
66000
3000
että vähiten suosituissa TEDTalkeissa.
01:24
So if you cametuli here
30
69000
2000
Eli mikäli saapuu tänne
01:26
to talk about how Frenchranska coffeekahvi
31
71000
2000
puhumaan siitä, miten ranskalainen kahvi
01:28
will spreadlevitä happinessonnellisuus in our brainsäly,
32
73000
3000
levittää onnellisuutta aivoissamme,
01:31
that's a go.
33
76000
2000
on oikeilla raiteilla.
01:33
(LaughterNaurua) (ApplauseSuosionosoitukset)
34
78000
2000
(Naurua) (Aplodeja)
01:35
WhereasKatsoo, että, if you wanted to talk about
35
80000
2000
Jos sen sijaan haluaisi puhua
01:37
your projectprojekti involvingjohon
36
82000
2000
projektista, johon liittyy
01:39
oxygenhappi, girlstytöt, aircraftilma-alus --
37
84000
2000
happea, tyttöjä, lentokone --
01:41
actuallyitse asiassa, I would like to hearkuulla that talk, (LaughterNaurua)
38
86000
2000
oikeastaan haluaisin kuulla sen puheen, (Naurua)
01:43
but statisticstilasto say it's not so good.
39
88000
2000
mutta tilastojen mukaan se ei olisi kovin hyvä.
01:45
Oh, well.
40
90000
2000
No olkoon.
01:47
If you generalizeyleistää this,
41
92000
2000
Yleistäen voi sanoa,
01:49
the mostsuurin osa favoritesuosikki- TEDTalksTEDTalks are those
42
94000
2000
että suosituimpia TEDTalkeja ovat ne,
01:51
that featureominaisuus topicsaiheista we can connectkytkeä with,
43
96000
3000
joiden aiheisiin on helppo samaistua
01:54
bothmolemmat easilyhelposti and deeplysyvään,
44
99000
2000
sekä pintapuolisesti että pintaa syvemmältä,
01:56
suchsellainen as happinessonnellisuus, our ownoma bodyruumis,
45
101000
2000
kuten onnellisuus, oma kehomme,
01:58
foodruoka, emotionstunteet.
46
103000
2000
ruoka, tunteet.
02:00
And the more technicaltekninen topicsaiheista,
47
105000
2000
Sen sijaan teknisemmät aiheet,
02:02
suchsellainen as architecturearkkitehtuuri, materialstarvikkeet and, strangelyKumma enoughtarpeeksi, menmiehet,
48
107000
3000
kuten arkkitehtuuri, erilaiset materiaalit sekä yllättäen miehet
02:05
those are not good topicsaiheista to talk about.
49
110000
3000
eivät ole hyviä puheenaiheita.
02:08
How should you delivertoimittaa your talk?
50
113000
2000
Miten puhe pitäisi esittää?
02:10
TEDTED is famouskuuluisa for keepingpito
51
115000
2000
TED on tunnettu
02:12
a very sharpterävä eyesilmä on the clockkello,
52
117000
2000
tiukoista aikatauluistaan,
02:14
so they're going to hatevihata me
53
119000
2000
joten he eivät varmasti pidä minusta
02:16
for revealingpaljastava this, because, actuallyitse asiassa,
54
121000
2000
tämän paljastuksen jälkeen, mutta oikeastaan
02:18
you should talk as long as they will let you. (LaughterNaurua)
55
123000
2000
pitäisi puhua niin kauan kuin vain annetaan. (Naurua)
02:20
Because the mostsuurin osa favoritesuosikki- TEDTalksTEDTalks
56
125000
3000
Sillä suosituimmat TEDTalkit
02:23
are, on averagekeskiverto, over 50 percentprosentti longerkauemmin
57
128000
2000
ovat arviolta 50 prosenttia pidempiä
02:25
than the leastvähiten favoritesuosikki- onesyhdet.
58
130000
2000
kuin vähiten suositut.
02:28
And this holdspitää truetotta for all rankingranking listsluettelot on TEDTED.comcom
59
133000
2000
Tämä pätee TED.comin jokaisella rankinglistalla,
02:30
exceptpaitsi if you want to have a talk
60
135000
2000
paitsi jos haluaa pitää puheen,
02:32
that's beautifulkaunis, inspiringinnoittava or funnyhauska.
61
137000
2000
joka on kaunis, inspiroiva tai hauska.
02:34
Then, you should be brieflyhyt. (LaughterNaurua) But other than that,
62
139000
2000
Siinä tapauksessa kannattaa olla nopea. (Naurua) Mutta muissa tapauksissa
02:36
talk untilsiihen asti kun they dragraahata you off the stagevaihe.
63
141000
3000
kannattaa puhua kunnes raahataan lavalta pois.
02:39
(LaughterNaurua)
64
144000
2000
(Naurua)
02:41
Now, while ...
65
146000
2000
Kun ...
02:43
(ApplauseSuosionosoitukset)
66
148000
6000
(Aplodeja)
02:49
While you're pushingajaa the clockkello, there's a fewharvat rulessäännöt to obeytotella.
67
154000
3000
Kun pitkittää puhettaan, pitää muistaa pari sääntöä.
02:52
I foundlöydetty these rulessäännöt out by comparingverrataan the statisticstilasto
68
157000
2000
Löysin nämä säännöt, kun vertailin statistiikkaa
02:54
of four-wordneljän sanan phraseslauseita
69
159000
2000
nelisanaisissa ilmauksissa,
02:56
that appearilmestyä more oftenusein in the mostsuurin osa favoritesuosikki- TEDTalksTEDTalks
70
161000
3000
joita esiintyy useammin suosituimmissa TEDTalkeissa
02:59
as opposedvastakkainen to the leastvähiten favoritesuosikki- TEDTalksTEDTalks.
71
164000
2000
kuin vähiten suosituissa.
03:01
I'll give you threekolme examplesesimerkkejä.
72
166000
2000
Annan kolme esimerkkiä.
03:03
First of all, I muston pakko, as a speakerkaiutin,
73
168000
2000
Ensinnäkin minun, puhujana, pitää
03:05
providesäätää a servicepalvelu to the audienceyleisö and talk about what I will give you,
74
170000
3000
tehdä yleisölle palvelus ja puhua siitä, mitä annan teille
03:08
insteadsen sijaan of sayingsanonta what I can't have.
75
173000
2000
sen sijaan, että kertoisin mitä en voi saada.
03:10
SecondlyToiseksi, it's imperativeimperatiivi
76
175000
2000
Toisekseen on äärimmäisen tärkeää,
03:12
that you do not citesiteerata The NewUusi YorkYork TimesKertaa.
77
177000
2000
että ei siteeraa The New York Timesia.
03:14
(LaughterNaurua)
78
179000
2000
(Naurua)
03:16
And finallyvihdoin, it's okay for the speakerkaiutin -- that's the good newsuutiset --
79
181000
3000
Ja lopuksi puhujan on hyväksyttävää -- hyviä uutisia --
03:19
to fakeväärennös intellectualälyllinen capacitykapasiteetti.
80
184000
2000
teeskennellä älykästä.
03:21
If I don't understandymmärtää something, I can just say, "etcjne., etcjne."
81
186000
3000
Jos en ymmärrä jotakin, voin vain sanoa "jne., jne."
03:24
You'llSinun all staypysyä with me.
82
189000
2000
Ja te kaikki ymmärrätte.
03:26
It's perfectlytäydellisesti fine.
83
191000
2000
Se on aivan hyväksyttävää.
03:28
(ApplauseSuosionosoitukset)
84
193000
4000
(Aplodeja)
03:32
Now, let's go to the visualsgrafiikka.
85
197000
2000
Sitten visuaalisiin asioihin.
03:34
The mostsuurin osa obviousilmeinen visualvisuaalinen thing on stagevaihe is the speakerkaiutin.
86
199000
3000
Ilmeisin lavalla näkyvä asia on puhuja.
03:37
And analysisanalyysi showsosoittaa if you want to be
87
202000
2000
Analyysin mukaan
03:39
amongkeskuudessa the mostsuurin osa favoritesuosikki- TEDTED speakerskaiuttimet,
88
204000
2000
suosituimmilla TED-puhujilla
03:41
you should let your hairhiukset growkasvaa a little bitbitti longerkauemmin than averagekeskiverto,
89
206000
3000
on hieman keskivertoa pidemmät hiukset,
03:44
make sure you wearpitää yllään your glasseslasit and be slightlyhieman more dressed-uppukeutunut-ylös
90
209000
3000
he käyttävät silmälaseja ja ovat hieman paremmin pukeutuneita
03:47
than the averagekeskiverto TEDTED speakerkaiutin.
91
212000
2000
kuin keskiverto TED-puhuja.
03:49
SlidesDiat are okay, thoughvaikka you mightmahti considerharkita going for propsrekvisiitta.
92
214000
3000
Diojen käyttö on ok, joskin kannattaa harkita lavasteita.
03:52
And now the mostsuurin osa importanttärkeä thing,
93
217000
2000
Kaikkein tärkein asia on kuitenkin
03:54
that is the moodmieliala onstagelavalla.
94
219000
2000
tunnelma lavalla.
03:56
ColorVäri playspelaa a very importanttärkeä rolerooli.
95
221000
2000
Väreillä on hyvin suuri merkitys.
03:58
ColorVäri closelytarkasti correlateskorreloi
96
223000
2000
Värit ovat selvästi yhteydessä
04:00
with the ratingsluokitukset that talksneuvottelut get on the websiteverkkosivusto.
97
225000
3000
puheiden saamiin arvosteluihin sivustolla.
04:03
(ApplauseSuosionosoitukset)
98
228000
2000
(Aplodeja)
04:05
For exampleesimerkki, fascinatinglumoava talksneuvottelut
99
230000
2000
Esimerkiksi kiehtovissa puheissa
04:07
containsisältää a statisticallytilastollisesti highkorkea amountmäärä
100
232000
2000
esiintyy tilastollisesti merkittävä osuus
04:09
of exactlytarkalleen this bluesininen colorväri-, (LaughterNaurua)
101
234000
2000
juuri tätä sinistä väriä. (Naurua)
04:11
much more than the averagekeskiverto TEDTalkTEDTalk.
102
236000
2000
Paljon enemmän kuin keskiverto TEDTalkissa.
04:13
IngeniousNerokas TEDTalksTEDTalks, much more this greenvihreä colorväri-,
103
238000
2000
Nerokkaissa TEDTalkeissa taas paljon enemmän tätä vihreää
04:15
etcjne., etja.
104
240000
2000
jne., jne.
04:17
(LaughterNaurua) (ApplauseSuosionosoitukset)
105
242000
7000
(Naurua) (Aplodeja)
04:24
Now, personallyhenkilökohtaisesti, I think
106
249000
2000
Henkilökohtaisesti en usko,
04:26
I'm not the first one who has donetehty this analysisanalyysi,
107
251000
2000
että olen ensimmäinen, joka on tehnyt tämän analyysin
04:28
but I'll leavejättää this
108
253000
2000
mutta jätän sen
04:30
to your good judgmenttuomio.
109
255000
3000
teidän tulkittavaksenne.
04:33
So, now it's time to put it all togetheryhdessä
110
258000
2000
Nyt on aika yhdistää tämä kaikki
04:35
and designdesign the ultimateperimmäinen TEDTalkTEDTalk.
111
260000
2000
ja suunnitella täydellinen TEDTalk.
04:37
Now, sincesiitä asti kun this is TEDActiveTEDActive,
112
262000
2000
Koska tämä tapahtuma on TEDActive,
04:39
and I learnedoppinut from my analysisanalyysi
113
264000
2000
ja koska opin analyysistäni,
04:41
that I should actuallyitse asiassa give you something,
114
266000
2000
että minun pitäisi itse asiassa antaa teille jotain,
04:43
I will not imposeasettaa the ultimateperimmäinen
115
268000
2000
en aio tyrkyttää teille parasta tai
04:45
or worstpahin TEDTalkTEDTalk on you,
116
270000
2000
pahinta TEDTalkia,
04:47
but ratherpikemminkin give you a tooltyökalu to createluoda your ownoma.
117
272000
2000
vaan annan teille työkalun, jolla voitte luoda omanne.
04:49
And I call this tooltyökalu the TEDPadTEDPad.
118
274000
3000
Kutsun tätä työkalua TEDPadiksi.
04:52
(LaughterNaurua)
119
277000
3000
(Naurua)
04:55
And the TEDPadTEDPad is a matrixmatriisi
120
280000
2000
TEDPad on matriisi,
04:57
of 100 specificallyerityisesti selectedvalittu,
121
282000
2000
jossa on sata tarkkaan valittua
04:59
highlyerittäin curatedkuraattori sentenceslauseita
122
284000
3000
ja järjestettyä lausetta,
05:02
that you can easilyhelposti piecepala togetheryhdessä to get your ownoma TEDTalkTEDTalk.
123
287000
3000
joista voi helposti koota oman TEDTalkin.
05:07
You only have to make one decisionpäätös,
124
292000
2000
Tehtäviä päätöksiä on vain yksi:
05:09
and that is: Are you going to use the whitevalkoinen versionversio
125
294000
2000
Aiotko käyttää valkoista versiota
05:11
for very good TEDTalksTEDTalks,
126
296000
2000
erittäin hyviin TEDTalkeihin
05:13
about creativityluovuus, humanihmisen geniusnero?
127
298000
2000
luovuudesta tai ihmisen nerokkuudesta?
05:15
Or are you going to go with a blackmusta versionversio,
128
300000
2000
Vai aiotko valita mustan version,
05:17
whichjoka will allowsallia you to createluoda really badhuono TEDTalksTEDTalks,
129
302000
2000
jonka avulla voit tehdä todella huonoja TEDTalkeja
05:19
mostlyenimmäkseen about blogsblogit,
130
304000
2000
enimmäkseen blogeista,
05:21
politicspolitiikka and stuffjutut?
131
306000
2000
politiikasta ja sellaisesta?
05:23
So, downloadladata it and have funhauska with it.
132
308000
2000
Joten ladatkaa se ja pitäkää hauskaa.
05:25
Now I hopetoivoa you enjoynauttia the sessionistunto.
133
310000
3000
Toivottavasti nautitte tilaisuudesta.
05:28
I hopetoivoa you enjoynauttia designingsuunnittelu your ownoma
134
313000
2000
Toivottavasti nautitte omien täydellisten sekä surkeiden
05:30
ultimateperimmäinen and worstpahin possiblemahdollinen TEDTalksTEDTalks.
135
315000
2000
TEDTalkienne suunnittelusta.
05:32
And I hopetoivoa some of you will be inspiredinnoittunut for nextSeuraava yearvuosi
136
317000
3000
Ja toivottavasti jotkut teistä innostuvat rakentamaan tämän
05:35
to createluoda this, whichjoka I really want to see.
137
320000
3000
ensi vuodeksi. Sen haluaisin todella nähdä.
05:38
Thank you very much.
138
323000
2000
Paljon kiitoksia.
05:40
(ApplauseSuosionosoitukset) ThanksKiitos.
139
325000
10000
(Aplodeja) Kiitos.
Translated by Ville Martikainen
Reviewed by Ulla Vainio

▲Back to top

ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com

Data provided by TED.

This site was created in May 2015 and the last update was on January 12, 2020. It will no longer be updated.

We are currently creating a new site called "eng.lish.video" and would be grateful if you could access it.

If you have any questions or suggestions, please feel free to write comments in your language on the contact form.

Privacy Policy

Developer's Blog

Buy Me A Coffee