ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com
TEDxCambridge

Sebastian Wernicke: How to use data to make a hit TV show

Hvordan man bruger data til at lave en populær TV-serie: How to use data to make a hit TV show

Filmed:
1,628,704 views

Fører indsamlingen af mere data til bedre beslutningstagen? Kokurrencedygtige, data-kyndige firmaer såsom Amazon, Google og Netflix har lært at analysering af data ikke alene er garanti for at producere optimale resultater. I dette foredrag forklarer data forsker Sebastian Wernicke hvad der går galt når vi basere beslutninger på data alene - og foreslår en smartere måde at bruge det på.
- Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects. Full bio

Double-click the English transcript below to play the video.

00:12
RoyRoy PricePris is a man that mostmest of you
have probablysandsynligvis never heardhørt about,
0
820
4276
Roy Price er en mand som de fleste af jer
nok aldrig har hørt om,
00:17
even thoughselvom he maykan have been responsibleansvarlig
1
5120
2496
selvom han måske er ansvarlig
00:19
for 22 somewhatnoget mediocremiddelmådig
minutesminutter of your life on AprilApril 19, 2013.
2
7640
6896
for 22 mere eller mindre middelmådige
minutter af jeres liv den 19. april 2013.
00:26
He maykan have alsoogså been responsibleansvarlig
for 22 very entertainingunderholdende minutesminutter,
3
14560
3176
Han kan også have været ansvarlig for 22
meget underholdende minutter,
00:29
but not very manymange of you.
4
17760
2256
men ikke for særligt mange af jer.
00:32
And all of that goesgår back to a decisionafgørelse
5
20040
1896
Og alt det stammer fra en beslutning
00:33
that RoyRoy had to make
about threetre yearsflere år agosiden.
6
21960
2000
som Roy var nød til at tage
omkring tre år siden.
00:35
So you see, RoyRoy PricePris
is a seniorsenior- executiveudøvende with AmazonAmazon StudiosStudios.
7
23984
4832
Ser i, Roy Price
er en overordnet leder hos Amazon Studios.
00:40
That's the TVTV productionproduktion
companySelskab of AmazonAmazon.
8
28840
3016
Det er Amazons TV produktionsselskab.
00:43
He's 47 yearsflere år oldgammel, slimslank, spikystrittende hairhår,
9
31880
3256
Han er 47 år gammel, slank, strithår,
00:47
describesbeskriver himselfham selv on TwitterTwitter
as "moviesfilm, TVTV, technologyteknologi, tacostacos."
10
35160
4816
beskriver sig selv på Twitter
som "film, TV, teknologi, taco."
00:52
And RoyRoy PricePris has a very responsibleansvarlig jobjob,
because it's his responsibilityansvar
11
40000
5176
Og Roy Price har et meget ansvarsfuldt job,
fordi det er hans ansvar
00:57
to pickplukke the showsviser sig, the originaloriginal contentindhold
that AmazonAmazon is going to make.
12
45200
4056
at vælge de serier, det originale indhold
som Amazon skal producere.
01:01
And of courseRute that's
a highlymeget competitivekonkurrencedygtig spaceplads.
13
49280
2336
Og det er selvfølgelig
et meget konkurrerende miljø.
01:03
I mean, there are so manymange
TVTV showsviser sig alreadyallerede out there,
14
51640
2736
Det er jo allerede
så mange TV-serier,
01:06
that RoyRoy can't just choosevælge any showat vise.
15
54400
2176
så Roy kan ikke bare vælge en hvilket som helst serie.
01:08
He has to find showsviser sig
that are really, really great.
16
56600
4096
Han bliver nød til at finde serier
som er rigtig, rigtig gode.
01:12
So in other wordsord, he has to find showsviser sig
17
60720
2816
Med andre ord, skal han finde serier
01:15
that are on the very right endende
of this curvekurve here.
18
63560
2376
som er helt til højre på denne kurve her.
01:17
So this curvekurve here
is the ratingrating distributionfordeling
19
65960
2656
Denne kurve her er
fordeling af bedømmelser
01:20
of about 2,500 TVTV showsviser sig
on the websiteinternet side IMDBIMDB,
20
68640
4376
af omkring 2.500 TV serier
på hjemmesiden IMDB,
01:25
and the ratingrating goesgår from one to 10,
21
73040
2896
og bedømmelserne går fra et til 10,
01:27
and the heighthøjde here showsviser sig you
how manymange showsviser sig get that ratingrating.
22
75960
2976
og højden her viser hvor mange serier
der får den bedømmelse.
01:30
So if your showat vise getsfår a ratingrating
of nineni pointspunkter or higherhøjere, that's a winnervinder.
23
78960
4696
Så hvis din serie får en bedømmelse på
ni point eller højere er det en vinder.
01:35
Then you have a toptop two percentprocent showat vise.
24
83680
1816
Så har du en top to procent serie.
01:37
That's showsviser sig like "BreakingBryde BadDårlig,"
"GameSpil of ThronesThrones," "The WireWire,"
25
85520
3896
Det er serier som "Breaking Bad,"
"Game of Thrones," "The Wire,"
01:41
so all of these showsviser sig that are addictivevanedannende,
26
89440
2296
Altså alle de her serier
som er vanedannende,
01:43
whereafterhvorefter you've watchedovervåget a seasonsæson,
your brainhjerne is basicallyi bund og grund like,
27
91760
3056
hvor når du har set en sæson,
siger din hjerne bare,
01:46
"Where can I get more of these episodesepisoder?"
28
94840
2176
"Hvor kan jeg få flere af de her afsnit?"
01:49
That kindvenlig of showat vise.
29
97040
1200
Den slags serier.
01:50
On the left sideside, just for clarityklarhed,
here on that endende,
30
98920
2496
På venstre side, for at gøre det klart,
i den her side,
01:53
you have a showat vise calledhedder
"ToddlersSmåbørn and TiarasDiademer" --
31
101440
3176
er der serier som hedder
"Toddlers and Tiaras" -
01:56
(LaughterLatter)
32
104640
2656
(Latter)
01:59
-- whichhvilken should tell you enoughnok
33
107320
1536
- hvilket burde sige det hele
02:00
about what's going on
on that endende of the curvekurve.
34
108880
2191
omkring hvad der sker i den ende
af kurven.
02:03
Now, RoyRoy PricePris is not worriedbekymret about
getting on the left endende of the curvekurve,
35
111095
4161
Roy Price er ikke bekymret for at ende
på den venstre side af kurven,
02:07
because I think you would have to have
some seriousalvorlig brainpowerintellektuelle ressourcer
36
115280
2936
fordi jeg tror at du virkelig
skal have noget tankevirksomhed
02:10
to undercutunderbyde "ToddlersSmåbørn and TiarasDiademer."
37
118240
1696
for at komme under
"Toddlers and Tiaras."
02:11
So what he's worriedbekymret about
is this middlemidten bulgebule here,
38
119960
3936
Så det han er bekymret omkring
er bulen her i midten,
02:15
the bulgebule of averagegennemsnit TVTV,
39
123920
1816
bulen med gennemsnitlig TV,
02:17
you know, those showsviser sig
that aren'ter ikke really good or really baddårlig,
40
125760
2856
I ved, den slags serier som ikke er
rigtig gode eller rigtig dårlige
02:20
they don't really get you excitedbegejstret.
41
128639
1656
- de begejstrer ikke rigtig.
02:22
So he needsbehov to make sure
that he's really on the right endende of this.
42
130320
4856
Så han bliver nød til at sikre sig,
at han er på den rigtige side af denne.
02:27
So the pressuretryk is on,
43
135200
1576
Så der er pres på,
02:28
and of courseRute it's alsoogså the first time
44
136800
2176
og det er selvfølgelig også første gang,
02:31
that AmazonAmazon is even
doing something like this,
45
139000
2176
at Amazon overhovedet laver sådan noget,
02:33
so RoyRoy PricePris does not want
to take any chanceschancer.
46
141200
3336
så Roy Price vil ikke tage nogle chancer.
02:36
He wants to engineeringeniør successsucces.
47
144560
2456
Han vil skabe succes.
02:39
He needsbehov a guaranteedgaranteret successsucces,
48
147040
1776
Han har brug for en garanteret succes,
02:40
and so what he does is,
he holdsbesidder a competitionkonkurrence.
49
148840
2576
og derfor afholder han en konkurrence.
02:43
So he takes a bunchflok of ideasideer for TVTV showsviser sig,
50
151440
3136
Han tager en bunke idéer til TV-serier
02:46
and from those ideasideer,
throughigennem an evaluationevaluering,
51
154600
2296
og gennem en evaluering af de idéer
02:48
they selectVælg eightotte candidateskandidater for TVTV showsviser sig,
52
156920
4096
bliver otte kandidater til TV-serier valgt
02:53
and then he just makesmærker the first episodeEpisode
of eachhver one of these showsviser sig
53
161040
3216
og så laver han kun den
første episode til hver serie
02:56
and putsputs them onlineonline for freegratis
for everyonealle sammen to watch.
54
164280
3136
og lægger dem online
så alle kan se dem gratis.
02:59
And so when AmazonAmazon
is givinggiver out freegratis stuffting og sager,
55
167440
2256
Og når Amazon giver dig noget gratis
03:01
you're going to take it, right?
56
169720
1536
så tager du imod det, ikke?
03:03
So millionsmillioner of viewersseere
are watchingser those episodesepisoder.
57
171280
5136
Så millioner af seere ser disse episoder.
03:08
What they don't realizerealisere is that,
while they're watchingser theirderes showsviser sig,
58
176440
3216
Hvad de ikke indser er
at mens de ser deres serie
03:11
actuallyrent faktisk, they are beingvære watchedovervåget.
59
179680
2296
bliver de faktisk selv iagttaget.
03:14
They are beingvære watchedovervåget
by RoyRoy PricePris and his teamhold,
60
182000
2336
De bliver iagttaget af Roy Price
og hans hold
03:16
who recordoptage everything.
61
184360
1376
som optager alting,
03:17
They recordoptage when somebodyen eller anden pressespresser playSpille,
when somebodyen eller anden pressespresser pausepause,
62
185760
3376
De optager når nogen trykker play.
når nogen trykker pause,
03:21
what partsdele they skipspringe,
what partsdele they watch again.
63
189160
2536
hvilke dele de springer over,
hvilke dele de ser igen.
03:23
So they collectindsamle millionsmillioner of datadata pointspunkter,
64
191720
2256
Så de samler millioner af data point,
03:26
because they want
to have those datadata pointspunkter
65
194000
2096
fordi de vil have de data point
03:28
to then decidebeslutte
whichhvilken showat vise they should make.
66
196120
2696
til når de skal beslutte hvilken serie de vil lave.
03:30
And sure enoughnok,
so they collectindsamle all the datadata,
67
198840
2176
Som sagt så gjort,
de samlede al data,
03:33
they do all the datadata crunchingknasende,
and an answersvar emergesfremgår,
68
201040
2576
de analyserede denne
og et svar dukkede op,
03:35
and the answersvar is,
69
203640
1216
og det svar er,
03:36
"AmazonAmazon should do a sitcomsitcom
about fourfire RepublicanRepublikanske US SenatorsSenatorer."
70
204880
5536
"Amazon bør lave en komedieserie
om fire republikanske senatorer."
03:42
They did that showat vise.
71
210440
1216
De lavede den serie.
03:43
So does anyonenogen som helst know the namenavn of the showat vise?
72
211680
2160
Er der nogen der kender navnet på den serie?
03:46
(AudiencePublikum: "AlphaAlpha HouseHus.")
73
214720
1296
(Publikum: "Alpha House.")
03:48
Yes, "AlphaAlpha HouseHus,"
74
216040
1456
Ja, "Alpha House,"
03:49
but it seemsser ud til like not too manymange of you here
rememberHusk that showat vise, actuallyrent faktisk,
75
217520
4096
men det virker som om der ikke er så
mange af jer som faktisk husker den serie,
03:53
because it didn't turntur out that great.
76
221640
1856
fordi den endte med ikke
at blive så god.
03:55
It's actuallyrent faktisk just an averagegennemsnit showat vise,
77
223520
1856
Det er faktisk kun
en gennemsnitlig serie
03:57
actuallyrent faktisk -- literallybogstaveligt talt, in factfaktum, because
the averagegennemsnit of this curvekurve here is at 7.4,
78
225400
4576
endda bogstavelig talt,
fordi gennemsnittet på denne kurve er 7,4
04:02
and "AlphaAlpha HouseHus" landslander at 7.5,
79
230000
2416
og "Alpha House" er på 7,5,
04:04
so a slightlyen anelse aboveover averagegennemsnit showat vise,
80
232440
2016
så en lige over gennemsnittet serie,
04:06
but certainlysikkert not what RoyRoy PricePris
and his teamhold were aimingsigter for.
81
234480
2920
men helt sikkert ikke hvad Roy Price
og hans hold gik efter.
04:10
MeanwhileI mellemtiden, howeverimidlertid,
at about the samesamme time,
82
238320
2856
I mellemtiden,
04:13
at anotheren anden companySelskab,
83
241200
1576
i et andet firma,
04:14
anotheren anden executiveudøvende did managestyre
to landjord a toptop showat vise usingved brug af datadata analysisanalyse,
84
242800
4216
lykkedes det en anden leder at skaffe en
top serie ved hjælp af data analysering,
04:19
and his namenavn is TedTed,
85
247040
1576
og hans navn er Ted,
04:20
TedTed SarandosSarandos, who is
the ChiefChief ContentIndhold OfficerOfficer of NetflixNetflix,
86
248640
3416
Ted Sarandos, som er
Chief Content Officer hos Netflix.
04:24
and just like RoyRoy,
he's on a constantkonstant missionmission
87
252080
2136
og ligesom Roy, er han på
en konstant mission
04:26
to find that great TVTV showat vise,
88
254240
1496
for at finde en god TV-serie,
04:27
and he usesanvendelser datadata as well to do that,
89
255760
2016
og til det bruger han også data,
04:29
exceptundtagen he does it
a little bitbit differentlyforskelligt.
90
257800
2015
bortset fra,
at han gør det lidt anderledes.
04:31
So insteadi stedet of holdingbedrift a competitionkonkurrence,
what he did -- and his teamhold of courseRute --
91
259839
3737
I stedet for at afholde en konkurrence,
han - og hans hold selvfølgelig -
04:35
was they lookedkigget at all the datadata
they alreadyallerede had about NetflixNetflix viewersseere,
92
263600
3536
så på al den data
de allerede havde om Netflix seere.
04:39
you know, the ratingsratings
they give theirderes showsviser sig,
93
267160
2096
I ved, de bedømmelser
de giver deres serier,
04:41
the viewingvisning historieshistorier,
what showsviser sig people like, and so on.
94
269280
2696
afspilningshistorik,
hvilke serier folk kan lide, osv.
04:44
And then they use that datadata to discoveropdage
95
272000
1896
Og så bruger de den data til at opdage
04:45
all of these little bitsbits and piecesstykker
about the audiencepublikum:
96
273920
2616
alle disse små dele
af informationer om seererne:
04:48
what kindsformer of showsviser sig they like,
97
276560
1456
hvilken slags serier,
04:50
what kindvenlig of producersproducenter,
what kindvenlig of actorsaktører.
98
278040
2096
producere, skuespillere de kan lide.
04:52
And onceenkelt gang they had
all of these piecesstykker togethersammen,
99
280160
2576
Og når de havde samlet alle disse dele,
04:54
they tooktog a leapspringe of faithtro,
100
282760
1656
tog de en chance,
04:56
and they decidedbesluttede to licenselicens
101
284440
2096
og de besluttede at lave
04:58
not a sitcomsitcom about fourfire SenatorsSenatorer
102
286560
2456
- ikke en komedieserie om fire senatorer -
05:01
but a dramadrama seriesserie about a singleenkelt SenatorSenator.
103
289040
2880
men en drama serie om en enkelt senator.
05:04
You guys know the showat vise?
104
292760
1656
Kender i denne serie?
05:06
(LaughterLatter)
105
294440
1296
(Latter)
05:07
Yes, "HouseHus of CardsKort," and NetflixNetflix
of courseRute, nailednaglet it with that showat vise,
106
295760
3736
Ja, "House of Cards," og Netflix
selvfølgelig ramte rigtig med den serie,
05:11
at leastmindst for the first two seasonssæsoner.
107
299520
2136
i hvert fald de første to sæsoner,
05:13
(LaughterLatter) (ApplauseBifald)
108
301680
3976
(Latter) (Klapsalver)
05:17
"HouseHus of CardsKort" getsfår
a 9.1 ratingrating on this curvekurve,
109
305680
3176
"House of Cards" får 9,1 på denne kurve,
05:20
so it's exactlyNemlig
where they wanted it to be.
110
308880
3176
så det er præcis der hvor
de gerne ville have den skulle være.
05:24
Now, the questionspørgsmål of courseRute is,
what happenedskete here?
111
312080
2416
Så er spørgsmålet selvfølgelig
hvad skete der her?
05:26
So you have two very competitivekonkurrencedygtig,
data-savvydata-kyndige companiesvirksomheder.
112
314520
2656
Du har to konkurrencedygtige,
data-kløgtige firmaer.
05:29
They connectforbinde all of these
millionsmillioner of datadata pointspunkter,
113
317200
2856
De samler alle de her
millioner af data point,
05:32
and then it worksarbejder
beautifullysmukt for one of them,
114
320080
2376
Og det fungerer fantastisk for en af dem
05:34
and it doesn't work for the other one.
115
322480
1856
og det virker ikke for den anden.
05:36
So why?
116
324360
1216
Hvorfor?
05:37
Because logiclogik kindvenlig of tellsfortæller you
that this should be workingarbejder all the time.
117
325600
3456
Fordi logisk set burde det
egentlig fungerer hver gang.
05:41
I mean, if you're collectingopsamling
millionsmillioner of datadata pointspunkter
118
329080
2456
Hvis du samler millioner af data point
05:43
on a decisionafgørelse you're going to make,
119
331560
1736
til en beslutning du skal tage,
05:45
then you should be ablei stand
to make a prettysmuk good decisionafgørelse.
120
333320
2616
så burde du kunne tage
en ret god beslutning.
05:47
You have 200 yearsflere år
of statisticsstatistik to relystole on.
121
335960
2216
Du har 200 års statistik
at falde tilbage på.
05:50
You're amplifyingforstærke it
with very powerfulkraftfuld computerscomputere.
122
338200
3016
Det forstærker du
med kraftfulde computere.
05:53
The leastmindst you could expectforventer
is good TVTV, right?
123
341240
3280
Det mindste du kan forvente
er vel god TV, ikke?
05:57
And if datadata analysisanalyse
does not work that way,
124
345880
2720
Og hvis data analyse
ikke virker på den måde,
06:01
then it actuallyrent faktisk getsfår a little scaryskræmmende,
125
349520
2056
så er det faktisk lidt skræmmende,
06:03
because we livelevende in a time
where we're turningdreje to datadata more and more
126
351600
3816
fordi vi lever i en tid
hvor vi bruger data mere og mere
06:07
to make very seriousalvorlig decisionsbeslutninger
that go farlangt beyondud over TVTV.
127
355440
4480
til at tage seriøse valg langt udover TV.
06:12
Does anyonenogen som helst here know the companySelskab
Multi-HealthMulti sundhed SystemsSystemer?
128
360760
3240
Er der nogen her der kender firmaet
Multi-Health Systems?
06:17
No one. OK, that's good actuallyrent faktisk.
129
365080
1656
Ingen. Okay, det er faktisk godt.
06:18
OK, so Multi-HealthMulti sundhed SystemsSystemer
is a softwaresoftware companySelskab,
130
366760
3216
Okay, så Multi-Health Systems
er et software firma,
06:22
and I hopehåber that nobodyingen here in this roomværelse
131
370000
2816
og jeg håber ikke at nogen i dette lokale
06:24
ever comeskommer into contactkontakt
with that softwaresoftware,
132
372840
3176
nogensinde kommer i kontakt
med den software,
06:28
because if you do,
it meansmidler you're in prisonfængsel.
133
376040
2096
fordi så betyder det at I er i fængsel.
06:30
(LaughterLatter)
134
378160
1176
(Latter)
06:31
If someonenogen here in the US is in prisonfængsel,
and they applyansøge for paroleparole,
135
379360
3536
Hvis nogen her i USA er i fængsel og
ansøger om prøveløsladelse,
06:34
then it's very likelysandsynligt that
datadata analysisanalyse softwaresoftware from that companySelskab
136
382920
4296
så er det meget sandsynligt,
at data analyse software fra det firma
06:39
will be used in determiningbestemmelse
whetherom to grantgive that paroleparole.
137
387240
3616
vil blive brugt til at bestemme om
der skal gives prøveløsladelse.
06:42
So it's the samesamme principleprincip
as AmazonAmazon and NetflixNetflix,
138
390880
2576
Så det er det samme princip
som Amazon og Netflix,
06:45
but now insteadi stedet of decidingbeslutte whetherom
a TVTV showat vise is going to be good or baddårlig,
139
393480
4616
men i stedet for at bestemme om
en TV-serie bliver god eller dårlig,
06:50
you're decidingbeslutte whetherom a personperson
is going to be good or baddårlig.
140
398120
2896
bestemmer man om en fange
bliver god eller dårlig.
06:53
And mediocremiddelmådig TVTV, 22 minutesminutter,
that can be prettysmuk baddårlig,
141
401040
5496
Og middelmådig TV, 22 minutter,
det kan være ret dårligt,
06:58
but more yearsflere år in prisonfængsel,
I guessgætte, even worseværre.
142
406560
2640
men flere år i fængsel,
går jeg udfra, er endnu værre.
07:02
And unfortunatelydesværre, there is actuallyrent faktisk
some evidencebeviser that this datadata analysisanalyse,
143
410360
4136
Og uheldigvis er der faktisk bevis for.
at denne data analyse,
07:06
despitepå trods af havingat have lots of datadata,
does not always producefremstille optimumoptimal resultsresultater.
144
414520
4216
på trods af masser af date,
ikke altid producerer optimale resultater.
07:10
And that's not because a companySelskab
like Multi-HealthMulti sundhed SystemsSystemer
145
418760
2722
Og det er ikke fordi et firma
som Multi-Health Systems
07:13
doesn't know what to do with datadata.
146
421506
1627
ikke bruger den data korrekt.
07:15
Even the mostmest data-savvydata-kyndige
companiesvirksomheder get it wrongforkert.
147
423158
2298
Selv de mest data-kyndige
firmaer fejler.
07:17
Yes, even GoogleGoogle getsfår it wrongforkert sometimesSommetider.
148
425480
2400
Ja, selv Google fejler noglegange.
07:20
In 2009, GoogleGoogle announcedannonceret
that they were ablei stand, with datadata analysisanalyse,
149
428680
4496
I 2009 annoncerede Google,
at de var i stand til, med data analyse,
07:25
to predictforudsige outbreaksudbrud of influenzainfluenza,
the nastyNasty kindvenlig of fluinfluenza,
150
433200
4136
at forudse udbrud ad influenza,
den slemme slags,
07:29
by doing datadata analysisanalyse
on theirderes GoogleGoogle searchessøgninger.
151
437360
3776
ved at lave data analyse
på deres Google søgninger.
07:33
And it workedarbejdet beautifullysmukt,
and it madelavet a bigstor splashplaske in the newsnyheder,
152
441160
3856
Og det virkede fantastisk, og det
blev en stor historie i nyhederne,
07:37
includinginklusive the pinnacletinde
of scientificvidenskabelig successsucces:
153
445040
2136
inklusiv højdepunktet
i videnskabelig succes:
07:39
a publicationoffentliggørelse in the journaltidsskrift "NatureNatur."
154
447200
2456
en udgivelse i tidskriftet "Nature."
07:41
It workedarbejdet beautifullysmukt
for yearår after yearår after yearår,
155
449680
3616
Det virkede fantastisk
år efter år efter år,
07:45
untilindtil one yearår it failedmislykkedes.
156
453320
1656
indtil det et år fejlede.
07:47
And nobodyingen could even tell exactlyNemlig why.
157
455000
2256
Og ingen kunne forklare præcis hvorfor.
07:49
It just didn't work that yearår,
158
457280
1696
Det virkede bare ikke det år,
07:51
and of courseRute that again madelavet bigstor newsnyheder,
159
459000
1936
og det blev selvfølgelig også en nyhed,
07:52
includinginklusive now a retractionretraktion
160
460960
1616
med efterfølgende tilbagetrækning
07:54
of a publicationoffentliggørelse
from the journaltidsskrift "NatureNatur."
161
462600
2840
af udgivelsen i tidskriftet "Nature."
07:58
So even the mostmest data-savvydata-kyndige companiesvirksomheder,
AmazonAmazon and GoogleGoogle,
162
466480
3336
Så selv de mest data-kyndige firmaer,
Amazon og Google,
08:01
they sometimesSommetider get it wrongforkert.
163
469840
2136
fejler sommetider.
08:04
And despitepå trods af all those failuressvigt,
164
472000
2936
Og på trods af disse fiaskoer,
08:06
datadata is movingbevæger sig rapidlyhurtigt
into real-lifeReal-life decision-makingbeslutningstagning --
165
474960
3856
rykker data hastigt ind det virkelig livs
beslutningstagen -
08:10
into the workplacearbejdsplads,
166
478840
1816
ind på arbejdspladsen,
08:12
lawlov enforcementhåndhævelse,
167
480680
1816
retshåndhævelsen,
08:14
medicinemedicin.
168
482520
1200
lægevidenskab.
08:16
So we should better make sure
that datadata is helpinghjælpe.
169
484400
3336
Så vi må hellere være sikker på.
at data hjælper.
08:19
Now, personallypersonligt I've seenset
a lot of this strugglekamp with datadata myselfMig selv,
170
487760
3136
Personligt har jeg set megen af denne
kamp med data selv,
08:22
because I work in computationalberegningsmæssige geneticsgenetik,
171
490920
1976
da jeg arbejder med databehandletgenetik,
08:24
whichhvilken is alsoogså a fieldMark
where lots of very smartsmart people
172
492920
2496
hvilket også er et felt
hvor mange meget smart folk
08:27
are usingved brug af unimaginableutænkelig amountsmængder of datadata
to make prettysmuk seriousalvorlig decisionsbeslutninger
173
495440
3656
bruger utrolige mængder data til
at træffe nogle ret seriøse beslutninger,
08:31
like decidingbeslutte on a cancerKræft therapyterapi
or developingudvikle a drugmedicin.
174
499120
3560
såsom valg vedrørende kræft terapi
eller udvikle et medikament.
08:35
And over the yearsflere år,
I've noticedbemærket a sortsortere of patternmønster
175
503520
2376
Og i årenes løb
har jeg lagt mærke til et mønster
08:37
or kindvenlig of ruleHerske, if you will,
about the differenceforskel
176
505920
2456
eller en slags regel, om du vil,
om forskellen
08:40
betweenmellem successfulvellykket
decision-makingbeslutningstagning with datadata
177
508400
2696
mellem succesfuld
beslutningstagen med data
08:43
and unsuccessfulmislykket decision-makingbeslutningstagning,
178
511120
1616
og fejlende beslutningstagen,
08:44
and I find this a patternmønster worthværdi sharingdeling,
and it goesgår something like this.
179
512760
3880
og jeg fandt dette mønster værd at dele,
og det er sådan her.
08:50
So wheneverhver gang you're
solvingopgaveløsning a complexkompleks problemproblem,
180
518520
2135
Hver gang du løser
et kompleks problem,
08:52
you're doing essentiallyvæsentlige two things.
181
520679
1737
gør du i virkeligheden to ting.
08:54
The first one is, you take that problemproblem
aparten del into its bitsbits and piecesstykker
182
522440
3296
Den første er at du deler problemet
op i mindre stykker
08:57
so that you can deeplydybt analyzeanalysere
those bitsbits and piecesstykker,
183
525760
2496
så du kan analysere disse stykker i dybden
09:00
and then of courseRute
you do the secondanden parten del.
184
528280
2016
og så laver du selvfølgelig
den anden del.
09:02
You put all of these bitsbits and piecesstykker
back togethersammen again
185
530320
2656
Du samler alle disse stykker igen
for at komme
09:05
to come to your conclusionkonklusion.
186
533000
1336
frem til din konklusion.
09:06
And sometimesSommetider you
have to do it over again,
187
534360
2336
Og noglegange skal du begynde forfra,
09:08
but it's always those two things:
188
536720
1656
men det er altid disse to ting:
09:10
takingtager aparten del and puttingsætte
back togethersammen again.
189
538400
2320
skille det ad
og samle det igen.
09:14
And now the crucialafgørende thing is
190
542280
1616
Og den vigtige del er,
09:15
that datadata and datadata analysisanalyse
191
543920
2896
at data og data analyse
09:18
is only good for the first parten del.
192
546840
2496
er kun brugbart til den første del.
09:21
DataData and datadata analysisanalyse,
no matterstof how powerfulkraftfuld,
193
549360
2216
Data og data analyse,
uanset hvor stærk,
09:23
can only help you takingtager a problemproblem aparten del
and understandingforståelse its piecesstykker.
194
551600
4456
kan kun hjælpe med at skille problemet ad
og forstå stykkerne.
09:28
It's not suitedegnet to put those piecesstykker
back togethersammen again
195
556080
3496
Det er ikke lavet til at samle
stykkerne igen
09:31
and then to come to a conclusionkonklusion.
196
559600
1896
og komme frem til en konklusion.
09:33
There's anotheren anden toolværktøj that can do that,
and we all have it,
197
561520
2736
Der er et andet værktøj der kan gøre det
og alle har det,
09:36
and that toolværktøj is the brainhjerne.
198
564280
1296
og det værktøj er hjernen.
09:37
If there's one thing a brainhjerne is good at,
199
565600
1936
Hvis det er en ting hjernen er god til,
09:39
it's takingtager bitsbits and piecesstykker
back togethersammen again,
200
567560
2256
så er det at samle stykker sammen igen,
09:41
even when you have incompleteufuldstændig informationinformation,
201
569840
2016
selv hvis du ikke har al informationen,
09:43
and comingkommer to a good conclusionkonklusion,
202
571880
1576
og nå en god konklusion,
09:45
especiallyisær if it's the brainhjerne of an expertekspert.
203
573480
2936
især hvis det er en eksperts hjerne.
09:48
And that's why I believe
that NetflixNetflix was so successfulvellykket,
204
576440
2656
Og det er derfor jeg tror,
at Netflix var så succesfulde
09:51
because they used datadata and brainshjerner
where they belongtilhører in the processbehandle.
205
579120
3576
fordi de brugte data og hjerne
der hvor de passede i processen.
09:54
They use datadata to first understandforstå
lots of piecesstykker about theirderes audiencepublikum
206
582720
3536
De brugte først data til at forstå
en masse stykker af deres seere
09:58
that they otherwiseEllers wouldn'tville ikke have
been ablei stand to understandforstå at that depthdybde,
207
586280
3416
som de ellers ikke kunne have
forstået på sådan et niveau,
10:01
but then the decisionafgørelse
to take all these bitsbits and piecesstykker
208
589720
2616
men beslutningen om at tage
alle disse stykker
10:04
and put them back togethersammen again
and make a showat vise like "HouseHus of CardsKort,"
209
592360
3336
og samle dem igen
og lave en serie som "House of Cards,"
10:07
that was nowhereingen steder in the datadata.
210
595720
1416
var ikke i nærheden af data.
10:09
TedTed SarandosSarandos and his teamhold
madelavet that decisionafgørelse to licenselicens that showat vise,
211
597160
3976
Ted Sandaros og hans hold
tog beslutningen om at lave den serie,
10:13
whichhvilken alsoogså meantbetød, by the way,
that they were takingtager
212
601160
2381
hvilket i øvrigt også betød,
at de løb
10:15
a prettysmuk bigstor personalpersonlig riskrisiko
with that decisionafgørelse.
213
603565
2851
en ret stor personlig risiko
med den beslutning.
10:18
And AmazonAmazon, on the other handhånd,
they did it the wrongforkert way around.
214
606440
3016
Og Amazon, på den anden side,
de gjorde det på den forkerte led.
10:21
They used datadata all the way
to drivekøre theirderes decision-makingbeslutningstagning,
215
609480
2736
De brugte data hele vejen
i deres beslutningstagen,
10:24
first when they heldholdt
theirderes competitionkonkurrence of TVTV ideasideer,
216
612240
2416
først da de afholdte konkurrencen
med TV idéer
10:26
then when they selectedvalgte "AlphaAlpha HouseHus"
to make as a showat vise.
217
614680
3696
senere da de valgte at lave
"Alpha House" til en serie.
10:30
WhichSom of courseRute was
a very safesikker decisionafgørelse for them,
218
618400
2496
Hvilket selvfølgelig var
en sikker beslutning for dem
10:32
because they could always
pointpunkt at the datadata, sayingordsprog,
219
620920
2456
fordi de altid kunne
pege på dataen og sige:
10:35
"This is what the datadata tellsfortæller us."
220
623400
1696
"Dette er hvad dataen fortalte os."
10:37
But it didn't leadat føre to the exceptionalenestående
resultsresultater that they were hopinghåber for.
221
625120
4240
Men det første ikke til det exceptionelle
resultat som de håbede på.
10:42
So datadata is of courseRute a massivelymassivt
usefulnyttig toolværktøj to make better decisionsbeslutninger,
222
630120
4976
Data er selvfølgelig et enormt brugbart
værktøj til at tage bedre valg
10:47
but I believe that things go wrongforkert
223
635120
2376
men jeg tror, at det går galt
10:49
when datadata is startingstart
to drivekøre those decisionsbeslutninger.
224
637520
2576
når data begynder at styre de valg.
10:52
No matterstof how powerfulkraftfuld,
datadata is just a toolværktøj,
225
640120
3776
Uanset hvor stærk data er,
er det kun et værktøj
10:55
and to keep that in mindsind,
I find this deviceenhed here quitetemmelig usefulnyttig.
226
643920
3336
og for at huske på dette,
finder jeg denne her meget brugbar.
10:59
ManyMange of you will ...
227
647280
1216
Mange af jer vil ...
11:00
(LaughterLatter)
228
648520
1216
(Latter)
11:01
Before there was datadata,
229
649760
1216
Før der var data,
11:03
this was the decision-makingbeslutningstagning
deviceenhed to use.
230
651000
2856
var dette beslutningstager-enheden
man brugte.
11:05
(LaughterLatter)
231
653880
1256
(Latter)
11:07
ManyMange of you will know this.
232
655160
1336
Mange af kender denne.
11:08
This toylegetøj here is calledhedder the MagicMagic 8 BallBold,
233
656520
1953
Dette legetøj her hedder en magisk 8-ball
11:10
and it's really amazingfantastiske,
234
658497
1199
og den er helt utrolig,
11:11
because if you have a decisionafgørelse to make,
a yes or no questionspørgsmål,
235
659720
2896
fordi hvis du har et valg du skal tage.
et ja/nej spørgsmål,
11:14
all you have to do is you shakeryste the ballbold,
and then you get an answersvar --
236
662640
3736
det eneste du skal gøre er
at ryste kuglen og så får du et svar -
11:18
"MostDe fleste LikelySandsynligvis" -- right here
in this windowvindue in realægte time.
237
666400
2816
"Højst sandsynlig" - lige her
i dette vindue i realtid.
11:21
I'll have it out latersenere for techtech demosdemoer.
238
669240
2096
Jeg vil demonstrere derude senere.
11:23
(LaughterLatter)
239
671360
1216
(Latter)
11:24
Now, the thing is, of courseRute --
so I've madelavet some decisionsbeslutninger in my life
240
672600
3576
Sagen er, at jeg har taget
nogle valg i mit liv
11:28
where, in hindsightset i bakspejlet,
I should have just listenedlyttede to the ballbold.
241
676200
2896
hvor jeg skulle have lyttet
til kuglen, set i bakspejlet.
11:31
But, you know, of courseRute,
if you have the datadata availableledig,
242
679120
3336
Men, I ved, hvis man har data til rådighed
11:34
you want to replaceerstatte this with something
much more sophisticatedsofistikeret,
243
682480
3056
vil man erstatte den
med noget langt mere sofistikeret,
11:37
like datadata analysisanalyse
to come to a better decisionafgørelse.
244
685560
3616
såsom data analyse
for at komme frem til en bedre beslutning.
11:41
But that does not changelave om the basicgrundlæggende setupOpsætning.
245
689200
2616
Men det ændrer ikke den basale opsætning.
11:43
So the ballbold maykan get smartersmartere
and smartersmartere and smartersmartere,
246
691840
3176
Kuglen bliver måske klogere
og klogere og klogere,
11:47
but I believe it's still on us
to make the decisionsbeslutninger
247
695040
2816
men jeg mener stadig,
at vi skal tage beslutningerne
11:49
if we want to achieveopnå
something extraordinaryekstraordinær,
248
697880
3016
hvis vi vil opnå noget ekstraordinært,
11:52
on the right endende of the curvekurve.
249
700920
1936
i den højre ende af kurven.
11:54
And I find that a very encouragingopmuntrende
messagebesked, in factfaktum,
250
702880
4496
Og det mener jeg faktisk
er en meget opmuntrende besked,
11:59
that even in the faceansigt
of hugekæmpe stor amountsmængder of datadata,
251
707400
3976
at selv overfor masser af data
12:03
it still paysbetaler off to make decisionsbeslutninger,
252
711400
4096
betaler det sig stadig
at tage beslutninger,
12:07
to be an expertekspert in what you're doing
253
715520
2656
at være en ekspert til det du laver
12:10
and take risksrisici.
254
718200
2096
og take chancer.
12:12
Because in the endende, it's not datadata,
255
720320
2776
For når alt kommer til alt,
er det ikke data
12:15
it's risksrisici that will landjord you
on the right endende of the curvekurve.
256
723120
3960
det er chancer der vil føre dig
til den højre ende af kurven.
12:19
Thank you.
257
727840
1216
Tak.
12:21
(ApplauseBifald)
258
729080
3680
(Klapsalver)
Translated by Morten Villadsen
Reviewed by Simon Djernæs

▲Back to top

ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com