ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com
TEDxCambridge

Sebastian Wernicke: How to use data to make a hit TV show

Sebastian Wernicke: Jak využít data ke stvoření skvělé TV show

Filmed:
1,628,704 views

Vede sbírání více dat k lepším rozhodnutím? Soupeřivé, v datech zběhlé firmy jako Amazon, Google a Netflix zjistily, že datová analýza nemusí vždycky vyprodukovat optimální výsledky. V této přednášce rozebírá Sebastian Wernicke, vědec zabývající se daty, proč je špatné spoléhat se při rozhodování pouze na data a nabízí inteligentnější způsob jejich využití.
- Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects. Full bio

Double-click the English transcript below to play the video.

00:12
RoyRoy PriceCena is a man that mostvětšina of you
have probablypravděpodobně never heardslyšel about,
0
820
4276
Roy Price je muž, o kterém
většina z vás nikdy neslyšela,
00:17
even thoughačkoli he maysmět have been responsibleodpovědný
1
5120
2496
přestože jste možná díky němu
00:19
for 22 somewhatponěkud mediocrePrůměrné
minutesminut of your life on AprilDuben 19, 2013.
2
7640
6896
strávili 19.dubna 2013
22 minut tak nějak podprůměrně.
Možná někteří z vás díky němu strávili
22 minut života velmi zábavně,
00:26
He maysmět have alsotaké been responsibleodpovědný
for 22 very entertainingzábavný minutesminut,
3
14560
3176
00:29
but not very manymnoho of you.
4
17760
2256
ale nejspíš už ne tolik z vás.
00:32
And all of that goesjde back to a decisionrozhodnutí
5
20040
1896
A toto všechno díky rozhodnutí,
00:33
that RoyRoy had to make
about threetři yearsroky agopřed.
6
21960
2000
které Roy musel udělat.
00:35
So you see, RoyRoy PriceCena
is a seniorsenior executivevýkonný with AmazonAmazon StudiosStudia.
7
23984
4832
Roy Price je vedoucí pracovník
v Amazon Studios,
00:40
That's the TVTV productionvýroba
companyspolečnost of AmazonAmazon.
8
28840
3016
což je firma Amazonu
zaměřená na TV produkci.
00:43
He's 47 yearsroky oldstarý, slimštíhlý, spikyšpičaté hairvlasy,
9
31880
3256
Je mu 47, je štíhlý, má zježené vlasy,
00:47
describespopisuje himselfsám on TwitterTwitter
as "moviesfilmy, TVTV, technologytechnika, tacostacos."
10
35160
4816
popisuje se na Twitteru takto:
"filmy, TV, technologie, tacos."
00:52
And RoyRoy PriceCena has a very responsibleodpovědný jobpráce,
because it's his responsibilityodpovědnost
11
40000
5176
A Roy Price má velmi zodpovědnou práci,
protože jeho zodpovědností je
00:57
to pickvýběr the showsukazuje, the originaloriginál contentobsah
that AmazonAmazon is going to make.
12
45200
4056
vybrat pořady, které pak
Amazon natočí.
01:01
And of coursechod that's
a highlyvysoce competitivekonkurenční spaceprostor.
13
49280
2336
A to je samozřejmě vysoce
konkurenční oblast.
01:03
I mean, there are so manymnoho
TVTV showsukazuje alreadyjiž out there,
14
51640
2736
Vezměte si, kolik televizních seriálů
již bylo natočeno.
01:06
that RoyRoy can't just chooseVybrat any showshow.
15
54400
2176
Roy proto nemůže vybrat
jen tak nějaký seriál.
01:08
He has to find showsukazuje
that are really, really great.
16
56600
4096
Musí najít seriál,
který je vážně, vážně skvělý.
01:12
So in other wordsslova, he has to find showsukazuje
17
60720
2816
Jinými slovy, musí najít seriály,
01:15
that are on the very right endkonec
of this curvekřivka here.
18
63560
2376
které by byly na úplném
konci tady této křivky.
01:17
So this curvekřivka here
is the ratinghodnocení distributionrozdělení
19
65960
2656
Ta křivka značí rozmístění
asi 2500 TV seriálů na IMDB
01:20
of about 2,500 TVTV showsukazuje
on the websitewebová stránka IMDBIMDB,
20
68640
4376
podle jejich hodnocení,
01:25
and the ratinghodnocení goesjde from one to 10,
21
73040
2896
které je od 1 do 10,
01:27
and the heightvýška here showsukazuje you
how manymnoho showsukazuje get that ratinghodnocení.
22
75960
2976
a výška tady ukazuje, kolik
seriálů toho hodnocení dosáhlo.
01:30
So if your showshow getsdostane a ratinghodnocení
of ninedevět pointsbodů or highervyšší, that's a winnervítěz.
23
78960
4696
Takže váš seriál vyhrává,
jestliže dostane 9 nebo více bodů.
01:35
Then you have a tophorní two percentprocent showshow.
24
83680
1816
Pak máte show v horních 2 %.
01:37
That's showsukazuje like "BreakingRozdělení BadŠpatné,"
"GameHra of ThronesTrůny," "The WireDrát,"
25
85520
3896
To jsou seriály jako "Perníkový táta",
"Hra o trůny", "The Wire",
01:41
so all of these showsukazuje that are addictivenávykové,
26
89440
2296
všechny takové ty návykové seriály,
01:43
whereafterDámská you've watchedsledoval a seasonsezóna,
your brainmozek is basicallyv podstatě like,
27
91760
3056
u kterých vám mozek po zhlédnutí
série v podstatě říká:
01:46
"Where can I get more of these episodesepizody?"
28
94840
2176
"Kde seženu další epizody?"
01:49
That kinddruh of showshow.
29
97040
1200
Takový typ seriálu.
01:50
On the left sideboční, just for clarityjasnost,
here on that endkonec,
30
98920
2496
Jen pro ujasnění, na levé straně,
tady na konci,
01:53
you have a showshow calledvolal
"ToddlersBatolata and TiarasČelenky" --
31
101440
3176
se nachází show nazvaná
Toddlers and Tiaras (Batolata a čelenky) -
01:56
(LaughterSmích)
32
104640
2656
(smích)
01:59
-- whichkterý should tell you enoughdost
33
107320
1536
- což by mělo dost vypovídat o tom,
02:00
about what's going on
on that endkonec of the curvekřivka.
34
108880
2191
co se děje na konci té křivky.
02:03
Now, RoyRoy PriceCena is not worriedustaraný about
gettingdostat on the left endkonec of the curvekřivka,
35
111095
4161
Teď, Roy Price se nebojí toho,
že by se mohl dostat na levý konec křivky,
02:07
because I think you would have to have
some seriousvážně brainpowerinteligenčního potenciálu
36
115280
2936
protože si myslím,
že k trumfnutí "Batolat a čelenek"
musíte mít opravdu ohromnou inteligenci.
02:10
to undercutzápich "ToddlersBatolata and TiarasČelenky."
37
118240
1696
02:11
So what he's worriedustaraný about
is this middlestřední bulgeboule here,
38
119960
3936
To, co jej znervózňuje je ta
výduť tady uprostřed,
02:15
the bulgeboule of averageprůměrný TVTV,
39
123920
1816
výduť průměrné televize,
02:17
you know, those showsukazuje
that aren'tnejsou really good or really badšpatný,
40
125760
2856
takové ty seriály, které nejsou
ani dobré ani špatné,
02:20
they don't really get you excitedvzrušený.
41
128639
1656
které vás tak moc nenadchnou.
02:22
So he needspotřeby to make sure
that he's really on the right endkonec of this.
42
130320
4856
On si potřebuje zajistit, aby se jeho show
dostala úplně na pravý konec křivky.
02:27
So the pressuretlak is on,
43
135200
1576
Takže je pod tlakem,
02:28
and of coursechod it's alsotaké the first time
44
136800
2176
a také je to samozřejmě poprvé,
02:31
that AmazonAmazon is even
doing something like this,
45
139000
2176
co Amazon zkouší něco takového,
02:33
so RoyRoy PriceCena does not want
to take any chancesšance.
46
141200
3336
takže Roy Price nechce riskovat.
02:36
He wants to engineerinženýr successúspěch.
47
144560
2456
Chce sestrojit úspěch.
02:39
He needspotřeby a guaranteedzaručené successúspěch,
48
147040
1776
Potřebuje garantovaný úspěch,
02:40
and so what he does is,
he holdsdrží a competitionsoutěž.
49
148840
2576
a tak uspořádá soutěž.
02:43
So he takes a bunchchomáč of ideasnápady for TVTV showsukazuje,
50
151440
3136
Takže vezme pár nápadů na TV seriály,
02:46
and from those ideasnápady,
throughpřes an evaluationhodnocení,
51
154600
2296
a po zvážení z nich
02:48
they selectvybrat eightosm candidateskandidáti for TVTV showsukazuje,
52
156920
4096
vyberou osm kandidátů na TV seriály.
02:53
and then he just makesdělá the first episodeEpizoda
of eachkaždý one of these showsukazuje
53
161040
3216
Pak natočí jen první epizodu
každého z těchto seriálů
02:56
and putsdělá them onlineonline for freevolný, uvolnit
for everyonekaždý to watch.
54
164280
3136
a dají je pro všechny zadarmo na internet.
02:59
And so when AmazonAmazon
is givingposkytující out freevolný, uvolnit stuffvěci,
55
167440
2256
A když Amazon rozdává věci zadarmo,
03:01
you're going to take it, right?
56
169720
1536
tak to vezmete, ne?
03:03
So millionsmiliony of viewersdiváků
are watchingsledování those episodesepizody.
57
171280
5136
A tak milióny diváku
sledují tyto epizody.
03:08
What they don't realizerealizovat is that,
while they're watchingsledování theirjejich showsukazuje,
58
176440
3216
To, co ale neví, je,
že zatímco sledují tyto epizody,
03:11
actuallyvlastně, they are beingbytost watchedsledoval.
59
179680
2296
jsou sami sledováni.
03:14
They are beingbytost watchedsledoval
by RoyRoy PriceCena and his teamtým,
60
182000
2336
Sleduje je Roy Price a jeho tým,
03:16
who recordzáznam everything.
61
184360
1376
a vše zaznamenávají.
03:17
They recordzáznam when somebodyněkdo presseslisy playhrát si,
when somebodyněkdo presseslisy pausepauza,
62
185760
3376
Zaznamenávají, když někdo zmáčkne přehrát,
když někdo video pozastaví,
03:21
what partsčásti they skippřeskočit,
what partsčásti they watch again.
63
189160
2536
které části lidé přeskakují
a které sledují znova.
03:23
So they collectsbírat millionsmiliony of datadata pointsbodů,
64
191720
2256
Takže shromažďují milióny dat,
03:26
because they want
to have those datadata pointsbodů
65
194000
2096
protože chtějí ta data,
03:28
to then deciderozhodni se
whichkterý showshow they should make.
66
196120
2696
aby pak mohli rozhodnout,
který seriál natočit.
03:30
And sure enoughdost,
so they collectsbírat all the datadata,
67
198840
2176
A tak jsou tedy data shromážděna,
03:33
they do all the datadata crunchingkřupavý,
and an answerOdpovědět emergesobjevuje se,
68
201040
2576
zanalyzována, a pak se objeví odpověď,
03:35
and the answerOdpovědět is,
69
203640
1216
a ta odpověď je:
03:36
"AmazonAmazon should do a sitcomsituační komedie
about fourčtyři RepublicanRepublikán US SenatorsSenátoři."
70
204880
5536
"Amazon by měl udělat sitcom
o čtyřech republikánských senátorech."
03:42
They did that showshow.
71
210440
1216
Oni to natočili.
03:43
So does anyonekdokoliv know the namenázev of the showshow?
72
211680
2160
Zná teda někdo jméno toho seriálu?
03:46
(AudiencePublikum: "AlphaAlfa HouseDům.")
73
214720
1296
(obecenstvo: "Alpha House.")
03:48
Yes, "AlphaAlfa HouseDům,"
74
216040
1456
Ano, "Alpha House."
03:49
but it seemszdá se like not too manymnoho of you here
rememberpamatovat that showshow, actuallyvlastně,
75
217520
4096
Ale nezdá se, že by si mnoho
z vás pamatovalo ten seriál,
03:53
because it didn't turnotočit se out that great.
76
221640
1856
protože to nakonec nebylo tak skvělé.
03:55
It's actuallyvlastně just an averageprůměrný showshow,
77
223520
1856
Ve skutečnosti je to průměrný seriál,
03:57
actuallyvlastně -- literallydoslovně, in factskutečnost, because
the averageprůměrný of this curvekřivka here is at 7.4,
78
225400
4576
a to doslova, protože průměr
na křivce je tady na 7,4
04:02
and "AlphaAlfa HouseDům" landspozemky at 7.5,
79
230000
2416
a "Alpha House" se umístil na 7,5,
04:04
so a slightlymírně abovevýše averageprůměrný showshow,
80
232440
2016
takže jen kousek nad průměrem,
04:06
but certainlyrozhodně not what RoyRoy PriceCena
and his teamtým were aimingcílem for.
81
234480
2920
kam ale určitě Roy Price
a jeho tým nemířili.
04:10
MeanwhileMezitím, howevernicméně,
at about the samestejný time,
82
238320
2856
Ale zhruba ve stejnou dobu,
04:13
at anotherdalší companyspolečnost,
83
241200
1576
v jiné společnosti,
04:14
anotherdalší executivevýkonný did managespravovat
to landpřistát a tophorní showshow usingpoužitím datadata analysisanalýza,
84
242800
4216
dokázal jiný vedoucí provést
skvělou ukázku použití analýzy dat,
04:19
and his namenázev is TedTed,
85
247040
1576
a jeho jméno je Ted,
04:20
TedTed SarandosSarandos, who is
the ChiefNáčelník ContentObsah OfficerDůstojník of NetflixNetflix,
86
248640
3416
Ted Sarandos, což je
vedoucí oddělení obsahu v Netflixu
04:24
and just like RoyRoy,
he's on a constantkonstantní missionmise
87
252080
2136
a ten je stejně jako Roy
na neustálé misi,
04:26
to find that great TVTV showshow,
88
254240
1496
kterou je nalezení skvělé show,
04:27
and he usespoužití datadata as well to do that,
89
255760
2016
a také k tomu používá data,
04:29
exceptaž na he does it
a little bitbit differentlyjinak.
90
257800
2015
jen trochu jiným způsobem.
04:31
So insteadmísto toho of holdingpodíl a competitionsoutěž,
what he did -- and his teamtým of coursechod --
91
259839
3737
Místo uspořádání soutěže,
on a jeho tým
04:35
was they lookedpodíval se at all the datadata
they alreadyjiž had about NetflixNetflix viewersdiváků,
92
263600
3536
prohlédli všechna ta data,
co už měli o uživatelích Netflixu,
04:39
you know, the ratingshodnocení
they give theirjejich showsukazuje,
93
267160
2096
třeba jak hodnotili různé filmy,
04:41
the viewingprohlížení historieshistorie,
what showsukazuje people like, and so on.
94
269280
2696
historie zhlédnutých filmů,
co mají lidé rádi atd.
04:44
And then they use that datadata to discoverobjevit
95
272000
1896
A pak ta data použili
04:45
all of these little bitsbitů and pieceskousky
about the audiencepublikum:
96
273920
2616
k zjištění všeho možného o svém publiku:
04:48
what kindsdruhy of showsukazuje they like,
97
276560
1456
jaké typy seriálů se jim líbí,
04:50
what kinddruh of producersvýrobců,
what kinddruh of actorsherci.
98
278040
2096
jací producenti, jací herci.
04:52
And oncejednou they had
all of these pieceskousky togetherspolu,
99
280160
2576
Když měli všechny kousky po hromadě,
04:54
they tookvzal a leapskok of faithvíra,
100
282760
1656
udělali skok do neznáma,
04:56
and they decidedrozhodl to licenselicence
101
284440
2096
a rozhodli se podpořit něco,
04:58
not a sitcomsituační komedie about fourčtyři SenatorsSenátoři
102
286560
2456
co nebyl sitcom o čtyřech senátorech,
05:01
but a dramadrama seriessérie about a singlesingl SenatorSenátor.
103
289040
2880
nýbrž drama o jediném senátorovi.
05:04
You guys know the showshow?
104
292760
1656
Znáte ten seriál?
05:06
(LaughterSmích)
105
294440
1296
(smích)
05:07
Yes, "HouseDům of CardsKarty," and NetflixNetflix
of coursechod, nailedzahnaný it with that showshow,
106
295760
3736
Ano, "House of Cards" a Netflix
s tou show pořádně zaválel,
05:11
at leastnejméně for the first two seasonsroční období.
107
299520
2136
aspoň teda s prvními dvěma sériemi.
05:13
(LaughterSmích) (ApplausePotlesk)
108
301680
3976
(smích)
(potlesk)
05:17
"HouseDům of CardsKarty" getsdostane
a 9.1 ratinghodnocení on this curvekřivka,
109
305680
3176
"House of Cards" dostal
na této křivce hodnocení 9,1,
05:20
so it's exactlypřesně
where they wanted it to be.
110
308880
3176
takže je přesně tam,
kde jej chtěli mít.
05:24
Now, the questionotázka of coursechod is,
what happenedStalo here?
111
312080
2416
A teď se tady skýtá otázka,
co se to vlastně stalo?
05:26
So you have two very competitivekonkurenční,
data-savvydat důvtipný companiesspolečnosti.
112
314520
2656
Máme dvě velmi soupeřivé,
v datech zběhlé společnosti.
05:29
They connectpřipojit all of these
millionsmiliony of datadata pointsbodů,
113
317200
2856
Spojí dohromady všechny ty milióny dat,
05:32
and then it workspráce
beautifullykrásně for one of them,
114
320080
2376
a pak to funguje hladce
jenom pro jednu z nich,
05:34
and it doesn't work for the other one.
115
322480
1856
zatímco pro tu druhou to nefunguje.
05:36
So why?
116
324360
1216
Takže proč?
05:37
Because logiclogika kinddruh of tellsvypráví you
that this should be workingpracovní all the time.
117
325600
3456
Logika říká, že by to
mělo fungovat vždycky.
05:41
I mean, if you're collectingshromažďování
millionsmiliony of datadata pointsbodů
118
329080
2456
Když sesbíráte taková kvanta dat,
05:43
on a decisionrozhodnutí you're going to make,
119
331560
1736
abyste udělali nějaké rozhodnutí,
05:45
then you should be ableschopný
to make a prettydosti good decisionrozhodnutí.
120
333320
2616
pak by vám to mělo přece
celkem dobře vyjít, ne?
05:47
You have 200 yearsroky
of statisticsstatistika to relyspolehnout se on.
121
335960
2216
Máte 200 let statistik
na které se spoléháte.
05:50
You're amplifyingzesilování it
with very powerfulsilný computerspočítačů.
122
338200
3016
Vyhodnocujete všechno s pomocí
vysoce výkonných počítačů.
05:53
The leastnejméně you could expectočekávat
is good TVTV, right?
123
341240
3280
To byste mohli očekávat
alespoň slušný seriál, že?
05:57
And if datadata analysisanalýza
does not work that way,
124
345880
2720
A pokud takhle datová analýza nefunguje,
06:01
then it actuallyvlastně getsdostane a little scaryděsivé,
125
349520
2056
pak to začíná být celkem děsivé,
06:03
because we livežít in a time
where we're turningotáčení to datadata more and more
126
351600
3816
protože žijeme v době,
kdy se na data stále více a více obracíme,
06:07
to make very seriousvážně decisionsrozhodnutí
that go fardaleko beyondmimo TVTV.
127
355440
4480
aby nám pomohla učinit velmi závažná
rozhodnutí, daleko závažnější než v TV.
06:12
Does anyonekdokoliv here know the companyspolečnost
Multi-HealthMulti-zdraví SystemsSystémy?
128
360760
3240
Znáte někdo společnost
Multi-Health Systems?
06:17
No one. OK, that's good actuallyvlastně.
129
365080
1656
Nikdo, OK, to je vlastně dobře.
06:18
OK, so Multi-HealthMulti-zdraví SystemsSystémy
is a softwaresoftware companyspolečnost,
130
366760
3216
Dobře, takže Multi-Health System
je softwarová společnost,
06:22
and I hopenaděje that nobodynikdo here in this roompokoj, místnost
131
370000
2816
a já doufám, že se s jejich softwarem
nesetkal nikdo z této místnosti,
06:24
ever comespřijde into contactKontakt
with that softwaresoftware,
132
372840
3176
06:28
because if you do,
it meansprostředek you're in prisonvězení.
133
376040
2096
protože kdyby ano,
tak by byl ve vězení.
06:30
(LaughterSmích)
134
378160
1176
(smích)
06:31
If someoneněkdo here in the US is in prisonvězení,
and they applyaplikovat for parolepodmínečné propuštění,
135
379360
3536
Protože když někdo v USA ve vězení
požádá o propuštění na podmínku,
06:34
then it's very likelypravděpodobně that
datadata analysisanalýza softwaresoftware from that companyspolečnost
136
382920
4296
pak je velmi pravděpodobné, že software
pro datovou analýzu té společnosti
06:39
will be used in determiningurčení
whetherzda to grantgrant that parolepodmínečné propuštění.
137
387240
3616
bude použit k rozhodnutí,
jestli jej pustí.
06:42
So it's the samestejný principlezásada
as AmazonAmazon and NetflixNetflix,
138
390880
2576
Takže to je ten samý princip jako
u Amazonu a Netflixu,
06:45
but now insteadmísto toho of decidingrozhodování whetherzda
a TVTV showshow is going to be good or badšpatný,
139
393480
4616
Ale namísto určování,
jestli bude seriál špatný nebo dobrý,
06:50
you're decidingrozhodování whetherzda a personosoba
is going to be good or badšpatný.
140
398120
2896
teď rozhoduje, jestli bude
člověk špatný nebo dobrý.
06:53
And mediocrePrůměrné TVTV, 22 minutesminut,
that can be prettydosti badšpatný,
141
401040
5496
A podprůměrný 22 minutový TV program,
to může být celkem zlé,
06:58
but more yearsroky in prisonvězení,
I guesstipni si, even worsehorší.
142
406560
2640
ale řekl bych, že další roky ve
vězení by byly daleko horší.
07:02
And unfortunatelybohužel, there is actuallyvlastně
some evidencedůkaz that this datadata analysisanalýza,
143
410360
4136
A naneštěstí existuje evidence,
že tyto datové analýzy
07:06
despitei přes havingmít lots of datadata,
does not always producevyrobit optimumoptimální resultsvýsledky.
144
414520
4216
neprodukují vždycky optimální výsledky,
přestože mají spousty dat.
07:10
And that's not because a companyspolečnost
like Multi-HealthMulti-zdraví SystemsSystémy
145
418760
2722
A to ne kvůli tomu,
že by firmy jako Multi-Health Systems
07:13
doesn't know what to do with datadata.
146
421506
1627
nevěděly, co dělat s daty.
07:15
Even the mostvětšina data-savvydat důvtipný
companiesspolečnosti get it wrongšpatně.
147
423158
2298
I ty nejchytřejší
datové firmy se někdy zmýlí.
07:17
Yes, even GoogleGoogle getsdostane it wrongšpatně sometimesněkdy.
148
425480
2400
Ano, dokonce i Google se občas splete.
07:20
In 2009, GoogleGoogle announcedoznámila
that they were ableschopný, with datadata analysisanalýza,
149
428680
4496
V roce 2009 Google prohlásil,
že jsou schopni pomocí datové analýzy
07:25
to predictpředpovědět outbreaksvypuknutí of influenzachřipka,
the nastyošklivé kinddruh of fluchřipka,
150
433200
4136
předvídat vypuknutí chřipky tím,
07:29
by doing datadata analysisanalýza
on theirjejich GoogleGoogle searcheshledání.
151
437360
3776
že zanalyzují své vyhledávání.
07:33
And it workedpracoval beautifullykrásně,
and it madevyrobeno a bigvelký splashsplash in the newszprávy,
152
441160
3856
Fungovalo to krásně
a byl z toho obří poprask v médiích,
07:37
includingpočítaje v to the pinnaclevrchol
of scientificvědecký successúspěch:
153
445040
2136
dokonce to dosáhlo
vrcholu vědeckého úspěchu:
07:39
a publicationvydání in the journalčasopis "NaturePříroda."
154
447200
2456
zveřejnění v časopisu "Nature."
07:41
It workedpracoval beautifullykrásně
for yearrok after yearrok after yearrok,
155
449680
3616
Rok za rokem to vše krásně fungovalo,
07:45
untilaž do one yearrok it failedselhalo.
156
453320
1656
ale pak se to najednou pokazilo.
07:47
And nobodynikdo could even tell exactlypřesně why.
157
455000
2256
Nikdo nemohl říct, proč přesně.
07:49
It just didn't work that yearrok,
158
457280
1696
Prostě to ten rok nefungovalo.
07:51
and of coursechod that again madevyrobeno bigvelký newszprávy,
159
459000
1936
Samozřejmě se to zase dostalo do zpráv
07:52
includingpočítaje v to now a retractionodvolání
160
460960
1616
a pak následovalo stažení publikace
z časopisu "Nature."
07:54
of a publicationvydání
from the journalčasopis "NaturePříroda."
161
462600
2840
07:58
So even the mostvětšina data-savvydat důvtipný companiesspolečnosti,
AmazonAmazon and GoogleGoogle,
162
466480
3336
Takže i ty nejvyspělejší firmy
v oblasti dat, Amazon a Google,
08:01
they sometimesněkdy get it wrongšpatně.
163
469840
2136
to někdy spočítají špatně.
08:04
And despitei přes all those failuresselhání,
164
472000
2936
A i přes všechna tato selhání
08:06
datadata is movingpohybující se rapidlyrychle
into real-lifereal život decision-makingrozhodování --
165
474960
3856
se velká data rychle přesouvají do
rozhodovacích procesů každodenního života:
08:10
into the workplacepracoviště,
166
478840
1816
na pracoviště,
08:12
lawzákon enforcementvynucení,
167
480680
1816
vymáhání práva,
08:14
medicinemedicína.
168
482520
1200
do medicíny.
08:16
So we should better make sure
that datadata is helpingpomáhání.
169
484400
3336
Takže bychom si radši měli být jisti,
že ta data opravdu pomáhají.
08:19
Now, personallyosobně I've seenviděno
a lot of this struggleboj with datadata myselfmoje maličkost,
170
487760
3136
Nedávno jsem viděl
spousty těchto potíží s daty,
08:22
because I work in computationalvýpočetní geneticsgenetika,
171
490920
1976
protože pracuji ve výpočetní genetice,
08:24
whichkterý is alsotaké a fieldpole
where lots of very smartchytrý people
172
492920
2496
což je obor, ve kterém
hodně velmi chytrých lidí
08:27
are usingpoužitím unimaginablenepředstavitelné amountsmnožství of datadata
to make prettydosti seriousvážně decisionsrozhodnutí
173
495440
3656
používá nepředstavitelná kvanta dat
k rozhodování o tak vážných věcech,
08:31
like decidingrozhodování on a cancerrakovina therapyterapie
or developingrozvíjející se a druglék.
174
499120
3560
jako je rakovinová terapie
nebo vývoj léků.
08:35
And over the yearsroky,
I've noticedvšiml si a sorttřídění of patternvzor
175
503520
2376
A za ty roky
jsem našel určitý vzor,
08:37
or kinddruh of rulepravidlo, if you will,
about the differencerozdíl
176
505920
2456
či pravidlo,
08:40
betweenmezi successfulúspěšný
decision-makingrozhodování with datadata
177
508400
2696
v rozdílu mezi úspěšným a neúspěšným
08:43
and unsuccessfulneúspěšné decision-makingrozhodování,
178
511120
1616
rozhodnutím podle dat.
08:44
and I find this a patternvzor worthhodnota sharingsdílení,
and it goesjde something like this.
179
512760
3880
A tento vzor pokládám za hodný sdílení,
a pracuje to zhruba takhle:
08:50
So wheneverkdykoli you're
solvingřešení a complexkomplex problemproblém,
180
518520
2135
Kdykoliv řešíte komplexní problém,
08:52
you're doing essentiallyv podstatě two things.
181
520679
1737
děláte v podstatě dvě věci.
08:54
The first one is, you take that problemproblém
apartodděleně into its bitsbitů and pieceskousky
182
522440
3296
Nejprve problém rozeberete
na malé kousky a části,
08:57
so that you can deeplyhluboce analyzeanalyzovat
those bitsbitů and pieceskousky,
183
525760
2496
abyste poté mohli tyto kousky
důkladně zanalyzovat,
09:00
and then of coursechod
you do the seconddruhý partčást.
184
528280
2016
a pak uděláte, samozřejmě, tu druhou část.
09:02
You put all of these bitsbitů and pieceskousky
back togetherspolu again
185
530320
2656
Dáte to všechno zase dohromady,
09:05
to come to your conclusionzávěr.
186
533000
1336
abyste mohli dojít k závěru.
09:06
And sometimesněkdy you
have to do it over again,
187
534360
2336
A někdy to musíte udělat znova a znova,
09:08
but it's always those two things:
188
536720
1656
ale pořád děláte tyto dvě věci:
09:10
takingpřijmout apartodděleně and puttinguvedení
back togetherspolu again.
189
538400
2320
rozkládáte a znova skládáte.
09:14
And now the crucialrozhodující thing is
190
542280
1616
A je důležité vědět,
09:15
that datadata and datadata analysisanalýza
191
543920
2896
že data a datová analýza
09:18
is only good for the first partčást.
192
546840
2496
jsou dobré jen pro tu první část.
09:21
DataÚdaje and datadata analysisanalýza,
no matterhmota how powerfulsilný,
193
549360
2216
Data a datová analýza,
jakkoliv silné,
09:23
can only help you takingpřijmout a problemproblém apartodděleně
and understandingporozumění its pieceskousky.
194
551600
4456
vám pomůžou pouze rozebrat problém
a pochopit jeho kousky.
09:28
It's not suitedvhodný to put those pieceskousky
back togetherspolu again
195
556080
3496
Nejsou stvořeny pro skládání
kousků zpět dohromady
09:31
and then to come to a conclusionzávěr.
196
559600
1896
a k vytvoření nějakého závěru.
09:33
There's anotherdalší toolnástroj that can do that,
and we all have it,
197
561520
2736
Na to je jiný nástroj,
který máme všichni,
09:36
and that toolnástroj is the brainmozek.
198
564280
1296
a tím nástrojem je mozek.
09:37
If there's one thing a brainmozek is good at,
199
565600
1936
Mozek vyniká v tom, že dokáže
09:39
it's takingpřijmout bitsbitů and pieceskousky
back togetherspolu again,
200
567560
2256
poskládat kousky zpět dohromady,
09:41
even when you have incompleteneúplný informationinformace,
201
569840
2016
i když nemá kompletní informace,
09:43
and comingpříchod to a good conclusionzávěr,
202
571880
1576
a dojít správnému závěru,
09:45
especiallyzvláště if it's the brainmozek of an expertexpert.
203
573480
2936
zvláště je-li to mozek experta.
09:48
And that's why I believe
that NetflixNetflix was so successfulúspěšný,
204
576440
2656
A proto byl dle mého názoru
Netflix tak úspěšný.
09:51
because they used datadata and brainsmozky
where they belongpatřit in the processproces.
205
579120
3576
Protože používají data i hlavu tam,
kam v procesu patří.
09:54
They use datadata to first understandrozumět
lots of pieceskousky about theirjejich audiencepublikum
206
582720
3536
Používají data ke zjišťování
drobností o jejich publiku,
09:58
that they otherwisev opačném případě wouldn'tby ne have
been ableschopný to understandrozumět at that depthhloubka,
207
586280
3416
které by jinak nemohli
pochopit do takové hloubky.
10:01
but then the decisionrozhodnutí
to take all these bitsbitů and pieceskousky
208
589720
2616
Ale konečné rozhodnutí,
že to všechno zase vezmou
10:04
and put them back togetherspolu again
and make a showshow like "HouseDům of CardsKarty,"
209
592360
3336
a seskládají a vydají seriál
jako "House of Cards,"
10:07
that was nowherenikde in the datadata.
210
595720
1416
to už nebylo na datech.
10:09
TedTed SarandosSarandos and his teamtým
madevyrobeno that decisionrozhodnutí to licenselicence that showshow,
211
597160
3976
Ted Sarantos s jeho týmem rozhodl,
že ten seriál budou licencovat,
10:13
whichkterý alsotaké meantznamená, by the way,
that they were takingpřijmout
212
601160
2381
což také mimochodem znamenalo,
že s tím rozhodnutím
na sebe vzali celkem velký risk.
10:15
a prettydosti bigvelký personalosobní riskriziko
with that decisionrozhodnutí.
213
603565
2851
10:18
And AmazonAmazon, on the other handruka,
they did it the wrongšpatně way around.
214
606440
3016
Na druhou stranu v Amazonu
to vzali za špatný konec.
10:21
They used datadata all the way
to driveřídit theirjejich decision-makingrozhodování,
215
609480
2736
Používali data v celém
rozhodovacím procesu.
10:24
first when they helddržený
theirjejich competitionsoutěž of TVTV ideasnápady,
216
612240
2416
Nejprve vyhlásili soutěž nápadů,
10:26
then when they selectedvybraný "AlphaAlfa HouseDům"
to make as a showshow.
217
614680
3696
z které si pak vybrali "Alpha House."
10:30
WhichKterý of coursechod was
a very safebezpečný decisionrozhodnutí for them,
218
618400
2496
To pro ně bylo samozřejmě
velmi bezpečné rozhodnutí,
10:32
because they could always
pointbod at the datadata, sayingrčení,
219
620920
2456
protože vždy mohli
poukázat na data a říct:
10:35
"This is what the datadata tellsvypráví us."
220
623400
1696
"Toto nám tvrdila data."
10:37
But it didn't leadVést to the exceptionalvýjimečný
resultsvýsledky that they were hopingdoufám for.
221
625120
4240
Ale nevedlo to k výjimečným výsledkům,
ve které doufali.
10:42
So datadata is of coursechod a massivelymasivně
usefulužitečný toolnástroj to make better decisionsrozhodnutí,
222
630120
4976
Takže data jsou samozřejmě velmi mocným
nástrojem pro zlepšení rozhodování,
10:47
but I believe that things go wrongšpatně
223
635120
2376
ale věřím, že věci začnou jít špatně,
10:49
when datadata is startingzačínající
to driveřídit those decisionsrozhodnutí.
224
637520
2576
když necháme data
udělat ta rozhodnutí celé.
10:52
No matterhmota how powerfulsilný,
datadata is just a toolnástroj,
225
640120
3776
Ať jsou data jakkoliv mocná,
stále jsou pouhým nástrojem,
10:55
and to keep that in mindmysl,
I find this devicepřístroj here quitedocela usefulužitečný.
226
643920
3336
a k zapamatování si tohoto faktu
je dobré toto malé zařízení.
10:59
ManyMnoho of you will ...
227
647280
1216
Mnoho z vás bude znát...
11:00
(LaughterSmích)
228
648520
1216
(smích)
11:01
Before there was datadata,
229
649760
1216
před vynalezením dat
se rozhodovalo podle tohoto zařízení
11:03
this was the decision-makingrozhodování
devicepřístroj to use.
230
651000
2856
11:05
(LaughterSmích)
231
653880
1256
(smích)
11:07
ManyMnoho of you will know this.
232
655160
1336
Mnoho z vás to bude znát.
11:08
This toyhračka here is calledvolal the MagicMagie 8 BallMíč,
233
656520
1953
Tato hračka se nazývá Magic 8 Ball,
11:10
and it's really amazingúžasný,
234
658497
1199
a je opravdu úžasná,
11:11
because if you have a decisionrozhodnutí to make,
a yes or no questionotázka,
235
659720
2896
protože když se musíte
rozhodnout mezi ano a ne,
11:14
all you have to do is you shakeotřást the ballmíč,
and then you get an answerOdpovědět --
236
662640
3736
všechno, co musíte udělat je zatřást
tou koulí, a pak dostanete odpověď -
11:18
"MostVětšina LikelyPravděpodobné," -- right here
in this windowokno in realnemovitý time.
237
666400
2816
"S největší pravděpodobností"
- tady, takřka ihned.
11:21
I'll have it out laterpozději for techtech demosdemos.
238
669240
2096
Budu to tu mít později
na ukázku technologie.
11:23
(LaughterSmích)
239
671360
1216
(smích)
11:24
Now, the thing is, of coursechod --
so I've madevyrobeno some decisionsrozhodnutí in my life
240
672600
3576
No, a teď, samozřejmě -
udělal jsem v životě rozhodnutí,
11:28
where, in hindsightOhlédnutí zpět,
I should have just listenedposlouchal to the ballmíč.
241
676200
2896
kdy jsem měl prostě poslechnout tu kouli,
když se tak teď dívám zpět.
11:31
But, you know, of coursechod,
if you have the datadata availabledostupný,
242
679120
3336
Ale to víte, kdybyste měli ta data,
11:34
you want to replacenahradit this with something
much more sophisticatedsofistikovaný,
243
682480
3056
rádi byste toto vyměnili
za něco mnohem sofistikovanějšího,
11:37
like datadata analysisanalýza
to come to a better decisionrozhodnutí.
244
685560
3616
třeba za datovou analýzu,
pro lepší rozhodnutí.
11:41
But that does not changezměna the basiczákladní setupinstalace.
245
689200
2616
To ale nemění základní princip.
11:43
So the ballmíč maysmět get smarterchytřejší
and smarterchytřejší and smarterchytřejší,
246
691840
3176
Ta koule může být čím dál chytřejší,
11:47
but I believe it's still on us
to make the decisionsrozhodnutí
247
695040
2816
ale podle mě, se musíme
rozhodnout my sami,
11:49
if we want to achievedosáhnout
something extraordinarymimořádný,
248
697880
3016
pokud chceme dosáhnout něčeho skvělého
11:52
on the right endkonec of the curvekřivka.
249
700920
1936
na pravém konci křivky.
11:54
And I find that a very encouragingpovzbudivý
messagezpráva, in factskutečnost,
250
702880
4496
A myslím si, že je velmi
povzbudivou zprávou,
11:59
that even in the facetvář
of hugeobrovský amountsmnožství of datadata,
251
707400
3976
že i tváří v tvář
takovému množství dat,
12:03
it still paysplatí off to make decisionsrozhodnutí,
252
711400
4096
se stále vyplatí činit rozhodnutí,
12:07
to be an expertexpert in what you're doing
253
715520
2656
být expertem v tom, co děláte,
12:10
and take risksrizika.
254
718200
2096
a riskovat.
12:12
Because in the endkonec, it's not datadata,
255
720320
2776
Protože to nakonec nejsou data,
co vás dostane na pravý konec křivky,
12:15
it's risksrizika that will landpřistát you
on the right endkonec of the curvekřivka.
256
723120
3960
jsou to risky.
12:19
Thank you.
257
727840
1216
Děkuji vám.
12:21
(ApplausePotlesk)
258
729080
3680
(potlesk)
Translated by Matouš Melecký
Reviewed by Nicole K

▲Back to top

ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com