ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com
TEDxCambridge

Sebastian Wernicke: How to use data to make a hit TV show

Sebastian Wernicke: Hoe gebruik je data om een succesvolle TV show te maken

Filmed:
1,628,704 views

Leidt het verzamelen van meer data tot het nemen van betere beslissingen? Concurrerende, data-bewuste bedrijven zoals Amazon, Google en Netflix hebben geleerd dat alleen data-analyse niet altijd tot optimale resultaten leidt. In deze talk legt data-wetenschapper Sebastian Wernicke uit wat er fout gaat als we beslissingen nemen die louter op data gebaseerd zijn -- en stelt een slimmere manier voor om ermee om te gaan.
- Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects. Full bio

Double-click the English transcript below to play the video.

00:12
RoyRoy PricePrijs is a man that mostmeest of you
have probablywaarschijnlijk never heardgehoord about,
0
820
4276
Van Roy Price hebben de meesten van jullie
waarschijnlijk nog nooit gehoord,
00:17
even thoughhoewel he maymei have been responsibleverantwoordelijk
1
5120
2496
hoewel hij verantwoordelijk
kan zijn geweest
00:19
for 22 somewhatenigszins mediocremiddelmatige
minutesnotulen of your life on AprilApril 19, 2013.
2
7640
6896
voor 22 middelmatige minuten
van je leven, op 19 april 2013.
00:26
He maymei have alsoook been responsibleverantwoordelijk
for 22 very entertainingonderhoudend minutesnotulen,
3
14560
3176
Hij kan ook verantwoordelijk zijn
geweest voor 22 amusante minuten,
00:29
but not very manyveel of you.
4
17760
2256
maar niet voor velen van jullie.
00:32
And all of that goesgaat back to a decisionbesluit
5
20040
1896
Dat had alles te maken met een beslissing
00:33
that RoyRoy had to make
about threedrie yearsjaar agogeleden.
6
21960
2000
die Roy zo'n drie jaar geleden
moest maken.
00:35
So you see, RoyRoy PricePrijs
is a seniorsenior executiveuitvoerend with AmazonAmazon StudiosStudio 's.
7
23984
4832
Roy Price is senior manager
bij de Amazon Studios,
00:40
That's the TVTV productionproductie
companybedrijf of AmazonAmazon.
8
28840
3016
het televisieproductiebedrijf van Amazon.
Hij is 47 jaar, slank, heeft stekelhaar
00:43
He's 47 yearsjaar oldoud, slimslank, spikystekelige hairhaar-,
9
31880
3256
00:47
describesbeschrijft himselfzichzelf on TwitterTwitter
as "moviesfilms, TVTV, technologytechnologie, tacosTaco 's."
10
35160
4816
en omschrijft zichzelf op Twitter
als "film, tv, technologie, taco's".
00:52
And RoyRoy PricePrijs has a very responsibleverantwoordelijk jobbaan,
because it's his responsibilityverantwoordelijkheid
11
40000
5176
Roy Price heeft
een hele verantwoordelijke baan,
want hij moet ervoor zorgen
de goede shows te kiezen,
00:57
to pickplukken the showsshows, the originalorigineel contentinhoud
that AmazonAmazon is going to make.
12
45200
4056
de originele producties
die Amazon gaat uitbrengen.
01:01
And of courseCursus that's
a highlyzeer competitivecompetitief spaceruimte.
13
49280
2336
Dat is natuurlijk
een zeer concurrerend terrein.
01:03
I mean, there are so manyveel
TVTV showsshows alreadynu al out there,
14
51640
2736
Er zijn al zoveel televisie-shows
01:06
that RoyRoy can't just chooseKiezen any showtonen.
15
54400
2176
dat Roy niet zomaar een show kan kiezen.
01:08
He has to find showsshows
that are really, really great.
16
56600
4096
Hij moet shows vinden
die echt heel goed zijn.
01:12
So in other wordstekst, he has to find showsshows
17
60720
2816
Met andere woorden,
hij moet shows vinden
01:15
that are on the very right endeinde
of this curvekromme here.
18
63560
2376
die aan de goede kant
van deze curve zitten.
01:17
So this curvekromme here
is the ratingrating distributiondistributie
19
65960
2656
Deze curve toont de
waarderingsverdeling
01:20
of about 2,500 TVTV showsshows
on the websitewebsite IMDBIMDB,
20
68640
4376
van zo'n 2500 tv-shows
op de IMDb-website
01:25
and the ratingrating goesgaat from one to 10,
21
73040
2896
en de waardering loopt van 1 tot 10.
01:27
and the heighthoogte here showsshows you
how manyveel showsshows get that ratingrating.
22
75960
2976
De hoogte hier toont
hoeveel shows die waardering krijgen.
01:30
So if your showtonen getskrijgt a ratingrating
of ninenegen pointspoints or higherhoger, that's a winnerwinnaar.
23
78960
4696
Als je show dus een waardering krijgt
van 9 punten of meer, dat is een topper.
Dan hoort je show tot de top 2 procent.
01:35
Then you have a toptop two percentprocent showtonen.
24
83680
1816
01:37
That's showsshows like "BreakingBreken BadSlechte,"
"GameSpel of ThronesTronen," "The WireDraad,"
25
85520
3896
Dat zijn shows als 'Breaking Bad',
'Game of Thrones' en 'The Wire',
01:41
so all of these showsshows that are addictiveverslavend,
26
89440
2296
dus al die shows die verslavend zijn,
shows waarvan je hersenen
aan het einde van het seizoen zeggen:
01:43
whereafterwaarna you've watchedbekeken a seasonseizoen,
your brainhersenen is basicallyeigenlijk like,
27
91760
3056
"Waar kan ik nog meer afleveringen zien?"
01:46
"Where can I get more of these episodesafleveringen?"
28
94840
2176
01:49
That kindsoort of showtonen.
29
97040
1200
Zo'n soort show.
01:50
On the left sidekant, just for clarityhelderheid,
here on that endeinde,
30
98920
2496
Links, voor de duidelijkheid,
hier aan dit einde,
01:53
you have a showtonen calledriep
"ToddlersPeuters and TiarasTiaras" --
31
101440
3176
heb je een show getiteld
'Toddlers and Tiaras' --
01:56
(LaughterGelach)
32
104640
2656
(Gelach)
01:59
-- whichwelke should tell you enoughgenoeg
33
107320
1536
-- dan weet je direct
02:00
about what's going on
on that endeinde of the curvekromme.
34
108880
2191
wat er aan dat eind
van de curve gebeurt.
02:03
Now, RoyRoy PricePrijs is not worriedbezorgd about
gettingkrijgen on the left endeinde of the curvekromme,
35
111095
4161
Roy Price maakt zich geen zorgen
om links op de curve te komen,
omdat je volgens mij
heel intelligent moet zijn
02:07
because I think you would have to have
some seriousernstig brainpowerBrainpower
36
115280
2936
om onder 'Toddlers and Tiaras' te scoren.
02:10
to undercutuitsparing "ToddlersPeuters and TiarasTiaras."
37
118240
1696
02:11
So what he's worriedbezorgd about
is this middlemidden- bulgeArdennen here,
38
119960
3936
Waar hij zich dus zorgen om maakt,
is deze bult in het midden,
02:15
the bulgeArdennen of averagegemiddelde TVTV,
39
123920
1816
de bult van gemiddelde tv,
02:17
you know, those showsshows
that aren'tzijn niet really good or really badslecht,
40
125760
2856
de shows die niet
echt goed of heel slecht zijn.
Je raakt er niet echt opgewonden van.
02:20
they don't really get you excitedopgewonden.
41
128639
1656
02:22
So he needsbehoefte aan to make sure
that he's really on the right endeinde of this.
42
130320
4856
Hij moet er dus voor zorgen
dat hij aan de rechterkant komt.
De druk is dus hoog
02:27
So the pressuredruk is on,
43
135200
1576
02:28
and of courseCursus it's alsoook the first time
44
136800
2176
en het is natuurlijk ook de eerste keer
02:31
that AmazonAmazon is even
doing something like this,
45
139000
2176
dat Amazon iets dergelijks doet.
02:33
so RoyRoy PricePrijs does not want
to take any chanceskansen.
46
141200
3336
Roy Price wil dus geen risico lopen.
02:36
He wants to engineeringenieur successsucces.
47
144560
2456
Hij wil succes creëren.
02:39
He needsbehoefte aan a guaranteedgegarandeerd successsucces,
48
147040
1776
Hij wil gegarandeerd succes
02:40
and so what he does is,
he holdshoudt a competitionwedstrijd.
49
148840
2576
en wat hij dus doet,
is een wedstrijd houden.
02:43
So he takes a bunchbos of ideasideeën for TVTV showsshows,
50
151440
3136
Hij neemt een aantal ideeën voor tv-shows
02:46
and from those ideasideeën,
throughdoor an evaluationevaluatie,
51
154600
2296
en door evaluatie
02:48
they selectkiezen eightacht candidateskandidaten for TVTV showsshows,
52
156920
4096
kiezen ze acht kandidaten voor tv-shows.
02:53
and then he just makesmerken the first episodeaflevering
of eachelk one of these showsshows
53
161040
3216
Dan maakt hij de eerste aflevering
van elk van deze shows
02:56
and putsputs them onlineonline for freegratis
for everyoneiedereen to watch.
54
164280
3136
en zet ze gratis online,
zodat iedereen ze kan zien.
02:59
And so when AmazonAmazon
is givinggeven out freegratis stuffspul,
55
167440
2256
Als Amazon dingen voor niks weggeeft,
03:01
you're going to take it, right?
56
169720
1536
dan wil je het hebben ook, toch?
03:03
So millionsmiljoenen of viewerskijkers
are watchingkijken those episodesafleveringen.
57
171280
5136
Dus zien miljoenen kijkers
die afleveringen.
03:08
What they don't realizerealiseren is that,
while they're watchingkijken theirhun showsshows,
58
176440
3216
Maar wat ze niet beseffen is dat,
terwijl ze zitten te kijken,
03:11
actuallywerkelijk, they are beingwezen watchedbekeken.
59
179680
2296
zij zelf ook bekeken worden.
03:14
They are beingwezen watchedbekeken
by RoyRoy PricePrijs and his teamteam,
60
182000
2336
Ze worden bekeken
door Roy Price en zijn team,
die alles opslaan.
03:16
who recordrecord everything.
61
184360
1376
03:17
They recordrecord when somebodyiemand pressespersen playspelen,
when somebodyiemand pressespersen pausepauze,
62
185760
3376
Ze slaan op wanneer iemand
op 'afspelen' of op 'pauze' drukt,
welke stukken ze overslaan,
welke worden herhaald.
03:21
what partsonderdelen they skipoverspringen,
what partsonderdelen they watch again.
63
189160
2536
03:23
So they collectverzamelen millionsmiljoenen of datagegevens pointspoints,
64
191720
2256
Ze verzamelen miljoenen gegevens,
03:26
because they want
to have those datagegevens pointspoints
65
194000
2096
omdat ze die data willen hebben
om te kunnen beslissen
welke show ze moeten maken.
03:28
to then decidebesluiten
whichwelke showtonen they should make.
66
196120
2696
03:30
And sure enoughgenoeg,
so they collectverzamelen all the datagegevens,
67
198840
2176
Dus verzamelen ze die data
en als die data zijn geanalyseerd
rolt daar een antwoord uit,
03:33
they do all the datagegevens crunchingkraken,
and an answerantwoord emergesvoorschijn,
68
201040
2576
03:35
and the answerantwoord is,
69
203640
1216
en dat antwoord is:
03:36
"AmazonAmazon should do a sitcomsitcom
about fourvier RepublicanRepublikeinse US SenatorsSenatoren."
70
204880
5536
"Amazon moet een serie maken
over vier Republikeinse senatoren".
03:42
They did that showtonen.
71
210440
1216
En dat deden ze.
03:43
So does anyoneiedereen know the namenaam of the showtonen?
72
211680
2160
Weet iemand de naam van de show?
(Publiek) 'Alpha House'.
03:46
(AudiencePubliek: "AlphaAlpha HouseHuis.")
73
214720
1296
03:48
Yes, "AlphaAlpha HouseHuis,"
74
216040
1456
Ja, 'Alpha House',
03:49
but it seemslijkt like not too manyveel of you here
rememberonthouden that showtonen, actuallywerkelijk,
75
217520
4096
maar het lijkt erop dat niet veel mensen
zich die show herinneren,
03:53
because it didn't turnbeurt out that great.
76
221640
1856
hij pakte dan ook niet erg goed uit.
03:55
It's actuallywerkelijk just an averagegemiddelde showtonen,
77
223520
1856
Eigenlijk is het maar een doorsnee show,
03:57
actuallywerkelijk -- literallyletterlijk, in factfeit, because
the averagegemiddelde of this curvekromme here is at 7.4,
78
225400
4576
letterlijk, omdat het gemiddelde
van deze curve hier 7,4 is
04:02
and "AlphaAlpha HouseHuis" landslandt at 7.5,
79
230000
2416
en 'Alpha House' kwam op 7,5,
04:04
so a slightlylicht abovebovenstaand averagegemiddelde showtonen,
80
232440
2016
dus net boven het gemiddelde,
04:06
but certainlyzeker not what RoyRoy PricePrijs
and his teamteam were aimingdie gericht zijn for.
81
234480
2920
zeker niet waar Roy Price
en zijn team op mikten.
04:10
MeanwhileOndertussen, howeverechter,
at about the samedezelfde time,
82
238320
2856
In de tussentijd echter,
ongeveer tegelijkertijd,
04:13
at anothereen ander companybedrijf,
83
241200
1576
bij een ander bedrijf,
slaagde een andere manager erin
een topproductie te maken met data-analyse
04:14
anothereen ander executiveuitvoerend did managebeheren
to landland- a toptop showtonen usinggebruik makend van datagegevens analysisanalyse,
84
242800
4216
04:19
and his namenaam is TedTed,
85
247040
1576
en zijn naam is Ted.
04:20
TedTed SarandosSarandos, who is
the ChiefChief ContentInhoud OfficerOfficier of NetflixNetflix,
86
248640
3416
Ted Sarandos is bij Netflix
hoofd 'eigen productie'
en net als Roy is hij
op een constante missie
04:24
and just like RoyRoy,
he's on a constantconstante missionmissie
87
252080
2136
04:26
to find that great TVTV showtonen,
88
254240
1496
die geweldige tv-show te vinden;
04:27
and he usestoepassingen datagegevens as well to do that,
89
255760
2016
hij gebruikt daarbij ook data,
04:29
exceptbehalve he does it
a little bitbeetje differentlyanders.
90
257800
2015
alleen doet hij het een beetje anders.
04:31
So insteadin plaats daarvan of holdingbezit a competitionwedstrijd,
what he did -- and his teamteam of courseCursus --
91
259839
3737
In plaats van een competitie te houden
keken hij -- en zijn team natuurlijk --
04:35
was they lookedkeek at all the datagegevens
they alreadynu al had about NetflixNetflix viewerskijkers,
92
263600
3536
naar alle data die ze al hadden
over Netflix-kijkers,
04:39
you know, the ratingsratings
they give theirhun showsshows,
93
267160
2096
dus de waarderingscijfers die ze geven,
waar ze meestal naar kijken,
wat ze leuk vinden, enz.
04:41
the viewingviewing historiesgeschiedenissen,
what showsshows people like, and so on.
94
269280
2696
Vervolgens gebruikten ze die data
04:44
And then they use that datagegevens to discoverontdekken
95
272000
1896
om elk detail
over het publiek te ontdekken:
04:45
all of these little bitsstukjes and piecesstukken
about the audiencepubliek:
96
273920
2616
04:48
what kindssoorten of showsshows they like,
97
276560
1456
welke shows ze leuk vinden,
04:50
what kindsoort of producersproducenten,
what kindsoort of actorsacteurs.
98
278040
2096
welke producers, welke acteurs.
04:52
And onceeen keer they had
all of these piecesstukken togethersamen,
99
280160
2576
Zodra ze al die details bij elkaar hadden,
04:54
they tooknam a leapsprong of faithgeloof,
100
282760
1656
namen ze een sprong in het diepe
04:56
and they decidedbeslist to licenselicentie
101
284440
2096
en besloten niet te kiezen
voor een programma over vier senatoren
04:58
not a sitcomsitcom about fourvier SenatorsSenatoren
102
286560
2456
05:01
but a dramadrama seriesserie about a singlesingle SenatorSenator.
103
289040
2880
maar voor een dramaserie over één senator.
05:04
You guys know the showtonen?
104
292760
1656
Kennen jullie die serie?
05:06
(LaughterGelach)
105
294440
1296
(Gelach)
05:07
Yes, "HouseHuis of CardsKaarten," and NetflixNetflix
of courseCursus, nailedgenageld it with that showtonen,
106
295760
3736
Ja, 'House of Cards', en Netflix
had een voltreffer met die show,
in ieder geval
voor de eerste twee seizoenen.
05:11
at leastminst for the first two seasonsseizoenen.
107
299520
2136
05:13
(LaughterGelach) (ApplauseApplaus)
108
301680
3976
(Gelach) (Applaus)
05:17
"HouseHuis of CardsKaarten" getskrijgt
a 9.1 ratingrating on this curvekromme,
109
305680
3176
'House of Cards' scoort 9.1 op deze curve,
05:20
so it's exactlyprecies
where they wanted it to be.
110
308880
3176
precies waar ze wilden zitten.
05:24
Now, the questionvraag of courseCursus is,
what happenedgebeurd here?
111
312080
2416
De vraag is nu natuurlijk:
wat gebeurde hier?
05:26
So you have two very competitivecompetitief,
data-savvygegevens-savvy companiesbedrijven.
112
314520
2656
Je hebt twee concurrerende
data-bewuste bedrijven.
05:29
They connectaansluiten all of these
millionsmiljoenen of datagegevens pointspoints,
113
317200
2856
Ze koppelen al deze miljoenen gegevens
05:32
and then it workswerken
beautifullymooi for one of them,
114
320080
2376
en dan pakt dat heel goed uit voor de een,
05:34
and it doesn't work for the other one.
115
322480
1856
maar niet voor de ander.
05:36
So why?
116
324360
1216
Waarom eigenlijk?
05:37
Because logiclogica kindsoort of tellsvertelt you
that this should be workingwerkend all the time.
117
325600
3456
Het lijkt zo vanzelfsprekend
dat dit altijd zou moeten werken.
05:41
I mean, if you're collectingverzamelen
millionsmiljoenen of datagegevens pointspoints
118
329080
2456
Ik bedoel, als je miljoenen
gegevens verzamelt
05:43
on a decisionbesluit you're going to make,
119
331560
1736
voor een beslissing die je gaat nemen,
05:45
then you should be ablein staat
to make a prettymooi good decisionbesluit.
120
333320
2616
dan zou je toch een goede beslissing
moeten kunnen nemen.
05:47
You have 200 yearsjaar
of statisticsstatistieken to relyvertrouwen on.
121
335960
2216
Je kunt steunen op 200 jaar statistiek.
05:50
You're amplifyingfrequentiebanden te versterken it
with very powerfulkrachtig computerscomputers.
122
338200
3016
Je versterkt het nog
met hele krachtige computers.
05:53
The leastminst you could expectverwachten
is good TVTV, right?
123
341240
3280
Dan mag je toch in ieder geval
wel goede televisie verwachten, niet?
05:57
And if datagegevens analysisanalyse
does not work that way,
124
345880
2720
Mocht data-analyse zo niet werken
06:01
then it actuallywerkelijk getskrijgt a little scaryeng,
125
349520
2056
dan wordt het een beetje griezelig,
06:03
because we liveleven in a time
where we're turningdraaien to datagegevens more and more
126
351600
3816
want we leven in een tijd
waarin we steeds meer op data afgaan
06:07
to make very seriousernstig decisionsbeslissingen
that go farver beyondvoorbij TVTV.
127
355440
4480
om serieuze beslissingen te nemen
die televisie ver te boven gaan.
06:12
Does anyoneiedereen here know the companybedrijf
Multi-HealthMulti gezondheid SystemsSystemen?
128
360760
3240
Kent iemand hier het bedrijf
Multi-Health Systems?
06:17
No one. OK, that's good actuallywerkelijk.
129
365080
1656
Niemand. OK, gelukkig maar.
06:18
OK, so Multi-HealthMulti gezondheid SystemsSystemen
is a softwaresoftware companybedrijf,
130
366760
3216
Multi-Health Systems
is een software-bedrijf
06:22
and I hopehoop that nobodyniemand here in this roomkamer
131
370000
2816
en ik hoop dat niemand hier in deze zaal
06:24
ever comeskomt into contactcontact
with that softwaresoftware,
132
372840
3176
ooit in contact komt met die software,
want anders betekent het
dat je in de gevangenis zit.
06:28
because if you do,
it meansmiddelen you're in prisongevangenis.
133
376040
2096
06:30
(LaughterGelach)
134
378160
1176
(Gelach)
06:31
If someoneiemand here in the US is in prisongevangenis,
and they applyvan toepassing zijn for paroleparole,
135
379360
3536
Als iemand in de VS in de gevangenis zit
en voorwaardelijk vrij wil komen,
06:34
then it's very likelywaarschijnlijk that
datagegevens analysisanalyse softwaresoftware from that companybedrijf
136
382920
4296
dan is het hoogstwaarschijnlijk
dat data-analysesoftware van dat bedrijf
06:39
will be used in determininghet bepalen van
whetherof to grantverlenen that paroleparole.
137
387240
3616
gebruikt wordt om te bepalen
of die aanvraag wordt gehonoreerd.
06:42
So it's the samedezelfde principlebeginsel
as AmazonAmazon and NetflixNetflix,
138
390880
2576
Het is dus hetzelfde principe
als bij Amazon en Netflix,
06:45
but now insteadin plaats daarvan of decidingbeslissende whetherof
a TVTV showtonen is going to be good or badslecht,
139
393480
4616
maar in plaats van te beslissen
of een tv-show het goed zal doen,
06:50
you're decidingbeslissende whetherof a personpersoon
is going to be good or badslecht.
140
398120
2896
beslis je nu of een persoon
het goed of slecht gaat doen.
06:53
And mediocremiddelmatige TVTV, 22 minutesnotulen,
that can be prettymooi badslecht,
141
401040
5496
Middelmatige tv, 22 minuten lang,
kan heel slecht zijn,
06:58
but more yearsjaar in prisongevangenis,
I guessraden, even worseerger.
142
406560
2640
maar meer tijd in de gevangenis
zelfs slechter, gok ik.
07:02
And unfortunatelyhelaas, there is actuallywerkelijk
some evidencebewijsmateriaal that this datagegevens analysisanalyse,
143
410360
4136
Jammer genoeg zijn er zelfs bewijzen
dat deze data-analyse,
07:06
despiteondanks havingmet lots of datagegevens,
does not always produceproduceren optimumoptimum resultsuitslagen.
144
414520
4216
ondanks de beschikbaarheid van veel data,
niet altijd de optimale resultaten geeft.
07:10
And that's not because a companybedrijf
like Multi-HealthMulti gezondheid SystemsSystemen
145
418760
2722
Dat komt niet omdat een bedrijf
als Multi-Health Systems
07:13
doesn't know what to do with datagegevens.
146
421506
1627
niet met data om kan gaan.
07:15
Even the mostmeest data-savvygegevens-savvy
companiesbedrijven get it wrongfout.
147
423158
2298
Zelfs de slimste data-analisten
kunnen fout zitten.
07:17
Yes, even GoogleGoogle getskrijgt it wrongfout sometimessoms.
148
425480
2400
Ja, zelfs Google zit soms fout.
07:20
In 2009, GoogleGoogle announcedaangekondigd
that they were ablein staat, with datagegevens analysisanalyse,
149
428680
4496
In 2009 berichtte Google
dat ze met data-analyse
07:25
to predictvoorspellen outbreaksuitbraken of influenzainfluenza,
the nastyvervelende kindsoort of flugriep,
150
433200
4136
griep-epidemieën konden voorspellen,
het vervelende soort griep,
07:29
by doing datagegevens analysisanalyse
on theirhun GoogleGoogle searcheszoekopdrachten.
151
437360
3776
door data-analyse los te laten
op wat mensen op Google opzochten.
07:33
And it workedwerkte beautifullymooi,
and it madegemaakt a biggroot splashplons in the newsnieuws,
152
441160
3856
Het pakte wonderwel goed uit
en het werd een hit in het nieuws,
07:37
includinginclusief the pinnaclehoogtepunt
of scientificwetenschappelijk successsucces:
153
445040
2136
tot en met het toppunt van
wetenschappelijk succes:
07:39
a publicationpublicatie in the journaldagboek "NatureNatuur."
154
447200
2456
een publicatie in het tijdschrift Nature.
07:41
It workedwerkte beautifullymooi
for yearjaar after yearjaar after yearjaar,
155
449680
3616
Eerst werkte het goed,
jaar na jaar na jaar,
07:45
untiltot one yearjaar it failedmislukt.
156
453320
1656
tot het een bepaald jaar niet werkte.
07:47
And nobodyniemand could even tell exactlyprecies why.
157
455000
2256
Niemand kon precies zeggen waarom.
07:49
It just didn't work that yearjaar,
158
457280
1696
Het werkte dat jaar gewoon niet
07:51
and of courseCursus that again madegemaakt biggroot newsnieuws,
159
459000
1936
en dat haalde weer het nieuws natuurlijk,
07:52
includinginclusief now a retractionretractie
160
460960
1616
inclusief het terugtrekken
07:54
of a publicationpublicatie
from the journaldagboek "NatureNatuur."
161
462600
2840
van een publicatie
in het tijdschrift Nature.
07:58
So even the mostmeest data-savvygegevens-savvy companiesbedrijven,
AmazonAmazon and GoogleGoogle,
162
466480
3336
Dus zelfs de grootste data-verzamelaars,
Amazon en Google,
08:01
they sometimessoms get it wrongfout.
163
469840
2136
hebben het soms mis.
08:04
And despiteondanks all those failuresmislukkingen,
164
472000
2936
Ondanks al die mislukkingen
08:06
datagegevens is movingin beweging rapidlysnel
into real-lifelevensechte decision-makingbesluitvorming --
165
474960
3856
neemt het gebruik van data snel toe
bij beslissingen in het echte leven:
08:10
into the workplacewerkplaats,
166
478840
1816
op de werkvloer,
08:12
lawwet enforcementhandhaving,
167
480680
1816
bij wetshandhaving,
08:14
medicinegeneeskunde.
168
482520
1200
de geneeskunde.
08:16
So we should better make sure
that datagegevens is helpinghelpen.
169
484400
3336
We kunnen er dus maar beter voor zorgen
dat die data ook helpen.
08:19
Now, personallypersoonlijk I've seengezien
a lot of this struggleworstelen with datagegevens myselfmezelf,
170
487760
3136
Zelf heb ik veel gesteggel gezien
bij het gebruiken van data,
08:22
because I work in computationalcomputational geneticsgenetica,
171
490920
1976
omdat ik werk in de computer-genetica,
08:24
whichwelke is alsoook a fieldveld-
where lots of very smartslim people
172
492920
2496
wat ook een terrein is
waar veel slimme mensen
08:27
are usinggebruik makend van unimaginableondenkbaar amountshoeveelheden of datagegevens
to make prettymooi seriousernstig decisionsbeslissingen
173
495440
3656
ongelooflijke hoeveelheden data gebruiken
om serieuze beslissingen te nemen,
08:31
like decidingbeslissende on a cancerkanker therapybehandeling
or developingontwikkelen a drugdrug.
174
499120
3560
zoals over een kankertherapie
of het ontwikkelen van een medicijn.
08:35
And over the yearsjaar,
I've noticedmerkte a sortsoort of patternpatroon
175
503520
2376
Door de jaren heb ik
een patroon zien ontstaan,
08:37
or kindsoort of ruleregel, if you will,
about the differenceverschil
176
505920
2456
of een soort regel als je wilt,
over wat het verschil maakt
08:40
betweentussen successfulgeslaagd
decision-makingbesluitvorming with datagegevens
177
508400
2696
tussen succesvolle beslissingen
op basis van data
08:43
and unsuccessfulmislukte decision-makingbesluitvorming,
178
511120
1616
en niet-succesvolle beslissingen.
08:44
and I find this a patternpatroon worthwaard sharingdelen,
and it goesgaat something like this.
179
512760
3880
Ik vind dit een patroon dat ik wil delen
en het gaat als volgt.
08:50
So whenevertelkens als you're
solvingoplossen a complexcomplex problemprobleem,
180
518520
2135
Als je een complex probleem wilt oplossen,
08:52
you're doing essentiallyin wezen two things.
181
520679
1737
doe je in wezen twee dingen.
Eerst deel je het probleem op
in kleine stukjes,
08:54
The first one is, you take that problemprobleem
apartdeel into its bitsstukjes and piecesstukken
182
522440
3296
zodat je die onderdelen
grondig kunt analyseren,
08:57
so that you can deeplydiep analyzeanalyseren
those bitsstukjes and piecesstukken,
183
525760
2496
09:00
and then of courseCursus
you do the secondtweede partdeel.
184
528280
2016
en dan zet je natuurlijk de tweede stap:
09:02
You put all of these bitsstukjes and piecesstukken
back togethersamen again
185
530320
2656
je doet al die stukjes weer bij elkaar
09:05
to come to your conclusionconclusie.
186
533000
1336
en je komt tot een conclusie.
09:06
And sometimessoms you
have to do it over again,
187
534360
2336
Soms moet je het nog een keer doen,
maar steeds draait het om twee dingen:
09:08
but it's always those two things:
188
536720
1656
09:10
takingnemen apartdeel and puttingzetten
back togethersamen again.
189
538400
2320
uit elkaar halen en terug zetten.
09:14
And now the crucialbeslissend thing is
190
542280
1616
Het cruciale is
09:15
that datagegevens and datagegevens analysisanalyse
191
543920
2896
dat voor data en data-analyse
09:18
is only good for the first partdeel.
192
546840
2496
alleen het eerste deel werkt.
09:21
DataGegevens and datagegevens analysisanalyse,
no matterer toe doen how powerfulkrachtig,
193
549360
2216
Data en data-analyse,
hoe indrukwekkend ook,
09:23
can only help you takingnemen a problemprobleem apartdeel
and understandingbegrip its piecesstukken.
194
551600
4456
helpen je alleen een probleem
te ontrafelen en details te begrijpen.
09:28
It's not suitedgeschikt to put those piecesstukken
back togethersamen again
195
556080
3496
Het is niet geschikt om die stukjes
weer bij elkaar te brengen
en dan tot een conclusie te komen.
09:31
and then to come to a conclusionconclusie.
196
559600
1896
09:33
There's anothereen ander toolgereedschap that can do that,
and we all have it,
197
561520
2736
Een ander hulpmiddel kan dat wel,
en we hebben het allemaal:
09:36
and that toolgereedschap is the brainhersenen.
198
564280
1296
het brein.
09:37
If there's one thing a brainhersenen is good at,
199
565600
1936
Waar het brein echt goed in is,
09:39
it's takingnemen bitsstukjes and piecesstukken
back togethersamen again,
200
567560
2256
is stukjes weer bij elkaar brengen,
09:41
even when you have incompleteincompleet informationinformatie,
201
569840
2016
zelfs als je onvolledige informatie hebt,
09:43
and comingkomt eraan to a good conclusionconclusie,
202
571880
1576
en tot een goede conclusie komen,
09:45
especiallyvooral if it's the brainhersenen of an expertdeskundige.
203
573480
2936
zeker als het het brein van een expert is.
09:48
And that's why I believe
that NetflixNetflix was so successfulgeslaagd,
204
576440
2656
Daarom geloof ik
dat Netflix zo'n succes had,
09:51
because they used datagegevens and brainshersenen
where they belongbehoren in the processwerkwijze.
205
579120
3576
omdat ze de data en het brein gebruikten
waar ze in het proces thuishoren.
09:54
They use datagegevens to first understandbegrijpen
lots of piecesstukken about theirhun audiencepubliek
206
582720
3536
Ze gebruiken data om eerst veel details
van hun publiek te begrijpen,
09:58
that they otherwiseanders- wouldn'tzou het niet have
been ablein staat to understandbegrijpen at that depthdiepte,
207
586280
3416
details die ze anders nooit zo grondig
hadden kunnen begrijpen.
10:01
but then the decisionbesluit
to take all these bitsstukjes and piecesstukken
208
589720
2616
Maar de beslissing
om al deze losse stukjes
10:04
and put them back togethersamen again
and make a showtonen like "HouseHuis of CardsKaarten,"
209
592360
3336
weer bijeen te brengen
en een show als House of Cards te maken,
dat stond nergens in de data.
10:07
that was nowherenergens in the datagegevens.
210
595720
1416
10:09
TedTed SarandosSarandos and his teamteam
madegemaakt that decisionbesluit to licenselicentie that showtonen,
211
597160
3976
Ted Sarandos en zijn team namen
de beslissing om die serie goed te keuren,
waarmee ze trouwens ook
een groot persoonlijk risico namen.
10:13
whichwelke alsoook meantbedoelde, by the way,
that they were takingnemen
212
601160
2381
10:15
a prettymooi biggroot personalpersoonlijk riskrisico
with that decisionbesluit.
213
603565
2851
10:18
And AmazonAmazon, on the other handhand-,
they did it the wrongfout way around.
214
606440
3016
Bij Amazon deden ze
het echter omgekeerd, dus fout.
10:21
They used datagegevens all the way
to driverijden theirhun decision-makingbesluitvorming,
215
609480
2736
Ze gebruikten steeds data
om hun beslissing te sturen,
10:24
first when they heldheld
theirhun competitionwedstrijd of TVTV ideasideeën,
216
612240
2416
eerst toen ze hun wedstrijd
van tv-ideeën hielden,
10:26
then when they selectedgekozen "AlphaAlpha HouseHuis"
to make as a showtonen.
217
614680
3696
en later toen ze besloten
'Alpha House' te maken.
10:30
WhichDie of courseCursus was
a very safeveilig decisionbesluit for them,
218
618400
2496
Dat was voor hen
een hele veilige beslissing,
10:32
because they could always
pointpunt at the datagegevens, sayinggezegde,
219
620920
2456
omdat ze altijd konden wijzen
naar de data en zeggen:
10:35
"This is what the datagegevens tellsvertelt us."
220
623400
1696
"Dit zeggen de data ons."
10:37
But it didn't leadlood to the exceptionalbuitengewoon
resultsuitslagen that they were hopinghoop for.
221
625120
4240
Maar het leidde niet
tot de uitzonderlijke resultaten
die ze hadden gehoopt.
10:42
So datagegevens is of courseCursus a massivelymassaal
usefulnuttig toolgereedschap to make better decisionsbeslissingen,
222
630120
4976
Data zijn dus een enorm nuttig middel
om betere beslissingen te nemen,
10:47
but I believe that things go wrongfout
223
635120
2376
maar ik denk dat dingen fout gaan
10:49
when datagegevens is startingbeginnend
to driverijden those decisionsbeslissingen.
224
637520
2576
zodra data die beslissingen
beginnen te sturen.
10:52
No matterer toe doen how powerfulkrachtig,
datagegevens is just a toolgereedschap,
225
640120
3776
Hoe sterk ze ook zijn,
data zijn slechts een hulpmiddel
10:55
and to keep that in mindgeest,
I find this deviceapparaat here quiteheel usefulnuttig.
226
643920
3336
en met dat in je achterhoofd
vind ik dit ding hier heel nuttig.
10:59
ManyVeel of you will ...
227
647280
1216
Velen van jullie zullen .....
11:00
(LaughterGelach)
228
648520
1216
(Gelach)
Voordat er data waren,
11:01
Before there was datagegevens,
229
649760
1216
11:03
this was the decision-makingbesluitvorming
deviceapparaat to use.
230
651000
2856
was dit het hulpmiddel
om beslissingen te nemen.
11:05
(LaughterGelach)
231
653880
1256
(Gelach)
11:07
ManyVeel of you will know this.
232
655160
1336
Velen van jullie kennen het.
11:08
This toyspeelgoed- here is calledriep the MagicMagie 8 BallBal,
233
656520
1953
Dit speeltje hier heet de Magic 8 Ball,
11:10
and it's really amazingverbazingwekkend,
234
658497
1199
heel verbazingwekkend,
11:11
because if you have a decisionbesluit to make,
a yes or no questionvraag,
235
659720
2896
omdat als je een besluit moet nemen,
een ja of nee vraag,
je alleen de bal maar hoeft te schudden
en dan krijg je het antwoord
11:14
all you have to do is you shakeschudden the ballbal,
and then you get an answerantwoord --
236
662640
3736
-- "Hoogstwaarschijnlijk" --
hier in dit venster, hier en nu.
11:18
"MostDe meeste LikelyWaarschijnlijk" -- right here
in this windowvenster in realecht time.
237
666400
2816
11:21
I'll have it out laterlater for techtech demosdemos.
238
669240
2096
Ik laat hem straks
rondgaan ter demonstratie.
11:23
(LaughterGelach)
239
671360
1216
(Gelach)
11:24
Now, the thing is, of courseCursus --
so I've madegemaakt some decisionsbeslissingen in my life
240
672600
3576
Wat ik natuurlijk wil zeggen is
dat ik besluiten heb genomen in mijn leven
11:28
where, in hindsightachteraf,
I should have just listenedluisterde to the ballbal.
241
676200
2896
waarbij ik achteraf toch naar de bal
had moeten luisteren.
11:31
But, you know, of courseCursus,
if you have the datagegevens availablebeschikbaar,
242
679120
3336
Maar als je de data
tot je beschikking hebt,
11:34
you want to replacevervangen this with something
much more sophisticatedgeavanceerde,
243
682480
3056
wil je zo'n bal door iets
veel geavanceerders vervangen,
zoals data-analyse,
om tot een besluit te komen.
11:37
like datagegevens analysisanalyse
to come to a better decisionbesluit.
244
685560
3616
11:41
But that does not changeverandering the basicbasis- setupSetup.
245
689200
2616
Maar fundamenteel verandert er niets.
11:43
So the ballbal maymei get smarterslimmer
and smarterslimmer and smarterslimmer,
246
691840
3176
De bal kan slimmer
en slimmer en slimmer worden,
11:47
but I believe it's still on us
to make the decisionsbeslissingen
247
695040
2816
maar ik denk dat wij nog steeds
de beslissingen moeten nemen
11:49
if we want to achievebereiken
something extraordinarybuitengewoon,
248
697880
3016
als we iets buitengewoons willen bereiken
11:52
on the right endeinde of the curvekromme.
249
700920
1936
aan de rechterkant van de curve.
11:54
And I find that a very encouragingbemoedigend
messagebericht, in factfeit,
250
702880
4496
Ik vind dat eigenlijk
een hele bemoedigende boodschap,
11:59
that even in the facegezicht
of hugereusachtig amountshoeveelheden of datagegevens,
251
707400
3976
dat het zelfs onder het oog
van grote hoeveelheden data
12:03
it still payspays off to make decisionsbeslissingen,
252
711400
4096
loont om besluiten te nemen,
12:07
to be an expertdeskundige in what you're doing
253
715520
2656
om expert te zijn bij wat je doet
12:10
and take risksrisico's.
254
718200
2096
en om risico's te nemen.
12:12
Because in the endeinde, it's not datagegevens,
255
720320
2776
Want uiteindelijk zijn het niet de data
maar de risico's die je doen belanden
aan de rechterzijde van de curve.
12:15
it's risksrisico's that will landland- you
on the right endeinde of the curvekromme.
256
723120
3960
12:19
Thank you.
257
727840
1216
Dank je wel.
12:21
(ApplauseApplaus)
258
729080
3680
(Applaus)
Translated by Paul Vrancken
Reviewed by Peter Van de Ven

▲Back to top

ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com