ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com
TEDxCambridge

Sebastian Wernicke: How to use data to make a hit TV show

Sebastian Wernicke: Hogyan készítsünk sikersorozatot adathalmazok segítségével?

Filmed:
1,628,704 views

Több adat begyűjtése jobb döntéshozatalt eredményez? Kompetitív, adatközpontú cégek, mint az Amazon, a Google és a Netflix megtanulták, hogy az adatelemzés nem mindig jár optimális eredményekkel. Ebben a videóban Sebastian Wernicke, adattudós részletezi, hogy milyen hibákat véthetünk, ha kizárólag adathalmazok alapján hozunk döntéseket -- helyette pedig egy okosabb módszert javasol.
- Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects. Full bio

Double-click the English transcript below to play the video.

00:12
RoyRoy PriceÁr is a man that mosta legtöbb of you
have probablyvalószínűleg never heardhallott about,
0
820
4276
A legtöbben valószínűleg
még nem hallottatok Roy Price-ről,
00:17
even thoughbár he maylehet have been responsiblefelelős
1
5120
2496
pedig lehet, hogy neki köszönhettek
00:19
for 22 somewhatnémileg mediocreközépszerű
minutespercek of your life on AprilÁprilis 19, 2013.
2
7640
6896
az életetekből kb. 22 középszerű percet
2013. április 19-én.
00:26
He maylehet have alsois been responsiblefelelős
for 22 very entertainingszórakoztató minutespercek,
3
14560
3176
Szintén lehet, hogy ő volt a felelős
22 nagyon szórakoztató percért
00:29
but not very manysok of you.
4
17760
2256
de nem sok ember számára.
00:32
And all of that goesmegy back to a decisiondöntés
5
20040
1896
És mindez egy döntésből fakad,
00:33
that RoyRoy had to make
about threehárom yearsévek agoezelőtt.
6
21960
2000
amit Roy-nak kb. 3 éve
kellett meghoznia.
00:35
So you see, RoyRoy PriceÁr
is a senioridősebb executivevégrehajtó with AmazonAmazon StudiosStudios.
7
23984
4832
Roy Price felsővezető
az Amazon Studios-nál.
00:40
That's the TVTV productionTermelés
companyvállalat of AmazonAmazon.
8
28840
3016
Ez az Amazon tv-s produkciós cége.
00:43
He's 47 yearsévek oldrégi, slimvékony, spikytüskés hairhaj,
9
31880
3256
Roy 47 éves, vékony, tüskés hajú,
00:47
describeskörülír himselfsaját maga on TwitterTwitter
as "moviesfilmek, TVTV, technologytechnológia, tacosTaco."
10
35160
4816
Twitteren így jellemzi magát:
"filmek, tv, technológia, taco."
00:52
And RoyRoy PriceÁr has a very responsiblefelelős jobmunka,
because it's his responsibilityfelelősség
11
40000
5176
Roy Price-nak nagyon felelősségteljes
munkája van, mert az ő felelőssége
00:57
to pickszed the showsműsorok, the originaleredeti contenttartalom
that AmazonAmazon is going to make.
12
45200
4056
kiválasztani a sorozatokat, az eredeti
tartalmat, amit az Amazon elkészít.
01:01
And of coursetanfolyam that's
a highlymagasan competitivekompetitív spacehely.
13
49280
2336
Ez természetesen nagyon kompetitív.
01:03
I mean, there are so manysok
TVTV showsműsorok alreadymár out there,
14
51640
2736
Hiszen már most
nagyon sok tv show létezik,
01:06
that RoyRoy can't just chooseválaszt any showelőadás.
15
54400
2176
Roy pedig nem választhat bármit.
01:08
He has to find showsműsorok
that are really, really great.
16
56600
4096
Meg kell találnia
a nagyon, nagyon jó show-kat.
01:12
So in other wordsszavak, he has to find showsműsorok
17
60720
2816
Más szóval, meg kell találnia
azokat a show-kat,
01:15
that are on the very right endvég
of this curveív here.
18
63560
2376
amelyek ennek a görbének
a jó végén vannak.
01:17
So this curveív here
is the ratingminősítés distributionterjesztés
19
65960
2656
Ez a görbe kb. 2500 tv show
01:20
of about 2,500 TVTV showsműsorok
on the websiteweboldal IMDBIMDB,
20
68640
4376
értékelési statisztikáját mutatja
az IMDB weboldalán
01:25
and the ratingminősítés goesmegy from one to 10,
21
73040
2896
1-10-es skálán.
01:27
and the heightmagasság here showsműsorok you
how manysok showsműsorok get that ratingminősítés.
22
75960
2976
Itt pedig azt látjuk, mennyi show
kapja az adott osztályzatot.
01:30
So if your showelőadás getsjelentkeznek a ratingminősítés
of ninekilenc pointspont or highermagasabb, that's a winnergyőztes.
23
78960
4696
Ha a műsorod 9 pontot, vagy többet kap,
az nyerő.
01:35
Then you have a topfelső two percentszázalék showelőadás.
24
83680
1816
Az egy top 2%-ba tartozó show.
01:37
That's showsműsorok like "BreakingTörés Badrossz,"
"GameJáték of ThronesTrón," "The WireDrót,"
25
85520
3896
Mint pl. a "Totál szívás",
a "Trónok harca", vagy a "A drót".
01:41
so all of these showsműsorok that are addictiveaddiktív,
26
89440
2296
Olyan addiktív sorozatok,
01:43
whereafterezt követően you've watchedfigyelte a seasonévad,
your brainagy is basicallyalapvetően like,
27
91760
3056
amik egy évad megnézése után
felvetik a kérdést:
01:46
"Where can I get more of these episodesepizódok?"
28
94840
2176
"Hol találom az újabb részeket?"
01:49
That kindkedves of showelőadás.
29
97040
1200
Ilyenek.
01:50
On the left sideoldal, just for clarityvilágosság,
here on that endvég,
30
98920
2496
A skála bal szélén
01:53
you have a showelőadás calledhívott
"ToddlersKisgyermekek and TiarasTiaras" --
31
101440
3176
van pl. az "Apró szépségek" --
01:56
(LaughterNevetés)
32
104640
2656
(Nevetés)
01:59
-- whichmelyik should tell you enoughelég
33
107320
1536
-- ami sokat elmond arról,
02:00
about what's going on
on that endvég of the curveív.
34
108880
2191
hogy mi zajlik a görbe rosszabbik végén.
02:03
Now, RoyRoy PriceÁr is not worriedaggódó about
gettingszerzés on the left endvég of the curveív,
35
111095
4161
Roy Price nem amiatt aggódik,
hogy a görbe bal felére kerül,
02:07
because I think you would have to have
some serioussúlyos brainpoweragyak
36
115280
2936
mert komoly agymunka kellene hozzá,
hogy rosszabbat csináljon
02:10
to undercutkínáltak "ToddlersKisgyermekek and TiarasTiaras."
37
118240
1696
mint az "Apró szépségek".
02:11
So what he's worriedaggódó about
is this middleközépső bulgeÁgában kiszélesedő részbe öntik here,
38
119960
3936
Ami miatt aggódhat, az a középső rész,
02:15
the bulgeÁgában kiszélesedő részbe öntik of averageátlagos TVTV,
39
123920
1816
az átlagos sorozatok része.
02:17
you know, those showsműsorok
that aren'tnem really good or really badrossz,
40
125760
2856
Azok a sorozatok, amik nem igazán
jók vagy rosszak,
02:20
they don't really get you excitedizgatott.
41
128639
1656
nem hoznak izgalomba.
02:22
So he needsigények to make sure
that he's really on the right endvég of this.
42
130320
4856
Biztosra kell mennie,
hogy ennek a jó oldalán legyen.
02:27
So the pressurenyomás is on,
43
135200
1576
Tehát nagy a nyomás,
02:28
and of coursetanfolyam it's alsois the first time
44
136800
2176
és ez az első alkalom,
02:31
that AmazonAmazon is even
doing something like this,
45
139000
2176
hogy az Amazon ilyesmit csinál,
02:33
so RoyRoy PriceÁr does not want
to take any chancesesélyeit.
46
141200
3336
tehát Roy Price
semmit sem akar kockáztatni.
02:36
He wants to engineermérnök successsiker.
47
144560
2456
Sikert akar építeni.
02:39
He needsigények a guaranteedgarantált successsiker,
48
147040
1776
Garantált sikerre van szüksége.
02:40
and so what he does is,
he holdstart a competitionverseny.
49
148840
2576
Ennek érdekében versenyhelyzetet teremt.
02:43
So he takes a bunchcsokor of ideasötletek for TVTV showsműsorok,
50
151440
3136
Fog egy csomó sorozatötletet,
02:46
and from those ideasötletek,
throughkeresztül an evaluationértékelése,
51
154600
2296
az ötleteket értékelik,
02:48
they selectválaszt eightnyolc candidatesjelöltek for TVTV showsműsorok,
52
156920
4096
és kiválasztanak 8 sorozatjelölt show-t.
02:53
and then he just makesgyártmányú the first episodeepizód
of eachminden egyes one of these showsműsorok
53
161040
3216
Aztán csak a sorozatok első részeit
készíti el,
02:56
and putshelyezi them onlineonline for freeingyenes
for everyonemindenki to watch.
54
164280
3136
online elérhetővé teszik,
ahol mindenki megnézheti.
02:59
And so when AmazonAmazon
is givingígy out freeingyenes stuffdolog,
55
167440
2256
Amikor pedig az Amazon ingyen ad valamit,
03:01
you're going to take it, right?
56
169720
1536
lecsapunk rá, igaz?
03:03
So millionsTöbb millió of viewersa nézők
are watchingnézni those episodesepizódok.
57
171280
5136
Milliónyi néző tekinti meg
ezeket az epizódokat.
03:08
What they don't realizemegvalósítani is that,
while they're watchingnézni theirazok showsműsorok,
58
176440
3216
Amit nem realizálnak,
hogy a show nézése közben
03:11
actuallytulajdonképpen, they are beinglény watchedfigyelte.
59
179680
2296
igazából őket figyelik.
03:14
They are beinglény watchedfigyelte
by RoyRoy PriceÁr and his teamcsapat,
60
182000
2336
Őket figyeli Roy Price és csapata,
03:16
who recordrekord everything.
61
184360
1376
akik mindent rögzítenek.
03:17
They recordrekord when somebodyvalaki pressesprések playjáték,
when somebodyvalaki pressesprések pauseszünet,
62
185760
3376
Rögzítik, ha valaki elindít,
szünetel egy videót,
03:21
what partsalkatrészek they skipÁtugrani,
what partsalkatrészek they watch again.
63
189160
2536
melyik részeket ugorja át,
mely részeket néznek újra.
03:23
So they collectgyűjt millionsTöbb millió of dataadat pointspont,
64
191720
2256
És így milliónyi adatpontokat gyűjtenek,
03:26
because they want
to have those dataadat pointspont
65
194000
2096
mert szükségük van az adatpontokra,
03:28
to then decidedöntsd el
whichmelyik showelőadás they should make.
66
196120
2696
hogy eldönthessék,
melyik show-t rendeljék be.
03:30
And sure enoughelég,
so they collectgyűjt all the dataadat,
67
198840
2176
És be is gyűjtik az adatokat,
03:33
they do all the dataadat crunchingropogó,
and an answerválasz emergeskiemelkedik,
68
201040
2576
kielemzik őket, és előáll egy válasz.
03:35
and the answerválasz is,
69
203640
1216
A válasz pedig:
03:36
"AmazonAmazon should do a sitcomszituációs komédia
about fournégy RepublicanRepublikánus US SenatorsSzenátorok."
70
204880
5536
"Az Amazonnak csinálnia kell egy szitkomot
4 republikánus amerikai szenátorról."
03:42
They did that showelőadás.
71
210440
1216
Meg is csinálták.
03:43
So does anyonebárki know the namenév of the showelőadás?
72
211680
2160
Ismeri valaki a sorozatot?
03:46
(AudienceKözönség: "AlphaAlfa HouseHáz.")
73
214720
1296
(Közönség: "Alpha House")
03:48
Yes, "AlphaAlfa HouseHáz,"
74
216040
1456
Igen, "Alpha House,"
03:49
but it seemsÚgy tűnik, like not too manysok of you here
rememberemlékezik that showelőadás, actuallytulajdonképpen,
75
217520
4096
de úgy tűnik,
igazából nem sokan emlékeztek rá,
03:53
because it didn't turnfordulat out that great.
76
221640
1856
mert nem volt jó.
03:55
It's actuallytulajdonképpen just an averageátlagos showelőadás,
77
223520
1856
Csak egy átlagos sorozat volt.
03:57
actuallytulajdonképpen -- literallyszó szerint, in facttény, because
the averageátlagos of this curveív here is at 7.4,
78
225400
4576
Tényleg átlagos, mert a görbe átlaga
7,4 körül van,
04:02
and "AlphaAlfa HouseHáz" landsa földeket at 7.5,
79
230000
2416
Az "Alpha House"-t pedig 7,5-re
értékelték,
04:04
so a slightlynémileg abovefelett averageátlagos showelőadás,
80
232440
2016
picit jobbra, mint egy átlagos show-t.
04:06
but certainlybiztosan not what RoyRoy PriceÁr
and his teamcsapat were aimingcélzás for.
81
234480
2920
De Roy Price és csapata célja
egyáltalán nem ez volt.
04:10
MeanwhileKözben, howeverazonban,
at about the sameazonos time,
82
238320
2856
Eközben nagyjából ugyanekkor,
04:13
at anotheregy másik companyvállalat,
83
241200
1576
egy másik cégnél
04:14
anotheregy másik executivevégrehajtó did managekezel
to landföld a topfelső showelőadás usinghasználva dataadat analysiselemzés,
84
242800
4216
egy másik vezető top sorozatot
gyártott adatelemzés segítségével,
04:19
and his namenév is TedTed,
85
247040
1576
az ő neve Ted,
04:20
TedTed SarandosSarandos, who is
the ChiefVezető ContentTartalom OfficerTisztviselő of NetflixNetflix,
86
248640
3416
Ted Sarandos,
a Netflix tartalmakért felelős nagyfőnöke.
04:24
and just like RoyRoy,
he's on a constantállandó missionmisszió
87
252080
2136
Akinek állandó feladata Roy-hoz hasonlóan
04:26
to find that great TVTV showelőadás,
88
254240
1496
rátalálni a sikersorozatokra.
04:27
and he usesfelhasználások dataadat as well to do that,
89
255760
2016
Ő is adatokat elemez ennek érdekében,
04:29
exceptkivéve he does it
a little bitbit differentlyeltérően.
90
257800
2015
viszont egy kicsit másképp csinálja.
04:31
So insteadhelyette of holdingholding a competitionverseny,
what he did -- and his teamcsapat of coursetanfolyam --
91
259839
3737
Ahelyett, hogy versenyeztetné a
sorozatokat,
04:35
was they lookednézett at all the dataadat
they alreadymár had about NetflixNetflix viewersa nézők,
92
263600
3536
csapatával megvizsgálta
a Netflix már létező adatait a nézőkről.
04:39
you know, the ratingsértékelés
they give theirazok showsműsorok,
93
267160
2096
Olyanokat, mint az értékelések,
04:41
the viewingmegtekintés historiestörténetek,
what showsműsorok people like, and so on.
94
269280
2696
a korábban nézett sorozatok,
mely show-kat kedvelik stb.
04:44
And then they use that dataadat to discoverfelfedez
95
272000
1896
És ezeket az adatokat arra használják,
04:45
all of these little bitsbit and piecesdarabok
about the audienceközönség:
96
273920
2616
hogy minden apró részletet
megtudjanak a közönségről:
04:48
what kindsféle of showsműsorok they like,
97
276560
1456
milyen sorozatokat kedvelnek,
04:50
what kindkedves of producerstermelők,
what kindkedves of actorsszereplők.
98
278040
2096
milyen producereket,
milyen színészeket.
04:52
And onceegyszer they had
all of these piecesdarabok togetheregyütt,
99
280160
2576
És amikor összerakták a kirakót,
04:54
they tookvett a leapUgrás of faithhit,
100
282760
1656
hittek benne, és úgy döntöttek,
04:56
and they decidedhatározott to licenseengedély
101
284440
2096
hogy nem egy 4 szenátorról
04:58
not a sitcomszituációs komédia about fournégy SenatorsSzenátorok
102
286560
2456
szóló szitkomot készítenek,
05:01
but a dramadráma seriessorozat about a singleegyetlen SenatorSzenátor.
103
289040
2880
hanem egy drámasorozatot egy szenátorról.
05:04
You guys know the showelőadás?
104
292760
1656
Ismeritek a sorozatot?
05:06
(LaughterNevetés)
105
294440
1296
(Nevetés)
05:07
Yes, "HouseHáz of CardsKártyák," and NetflixNetflix
of coursetanfolyam, nailedszögezték it with that showelőadás,
106
295760
3736
Igen, a "Kártyavár", ami nagyon
bejött a Netflixnek,
05:11
at leastlegkevésbé for the first two seasonsévszakok.
107
299520
2136
legalábbis az első két évadban.
05:13
(LaughterNevetés) (ApplauseTaps)
108
301680
3976
(Nevetés) (Taps)
05:17
"HouseHáz of CardsKártyák" getsjelentkeznek
a 9.1 ratingminősítés on this curveív,
109
305680
3176
A "Kártyavár" 9,1-es értékelést
kapott ezen a görbén,
05:20
so it's exactlypontosan
where they wanted it to be.
110
308880
3176
ezzel pontosan ott van, ahova tervezték.
05:24
Now, the questionkérdés of coursetanfolyam is,
what happenedtörtént here?
111
312080
2416
A kérdés a következő: mi történt?
05:26
So you have two very competitivekompetitív,
data-savvyadatok-hozzáértés companiesvállalatok.
112
314520
2656
Adott két nagyon kompetitív,
adatmániás cég.
05:29
They connectkapcsolódni all of these
millionsTöbb millió of dataadat pointspont,
113
317200
2856
Milliónyi adatpontokat gyűjtenek,
05:32
and then it worksművek
beautifullyszépen for one of them,
114
320080
2376
aztán az egyiküknek összejön,
05:34
and it doesn't work for the other one.
115
322480
1856
míg a másiknak nem.
05:36
So why?
116
324360
1216
Miért?
05:37
Because logiclogika kindkedves of tellsmegmondja you
that this should be workingdolgozó all the time.
117
325600
3456
A logika szerint mindig működnie kellene.
05:41
I mean, if you're collectinggyűjtő
millionsTöbb millió of dataadat pointspont
118
329080
2456
Úgy értem, ha egy meghozandó döntésről
05:43
on a decisiondöntés you're going to make,
119
331560
1736
milliónyi adatpontot összegyűjtesz,
05:45
then you should be ableképes
to make a prettyszép good decisiondöntés.
120
333320
2616
abból elég jó döntésre
lehetne következtetni.
05:47
You have 200 yearsévek
of statisticsstatisztika to relytámaszkodni on.
121
335960
2216
200 évnyi statisztikára alapozhatod,
05:50
You're amplifyingerősítő it
with very powerfulerős computersszámítógépek.
122
338200
3016
nagyon erős számítógépek segítségével.
05:53
The leastlegkevésbé you could expectelvár
is good TVTV, right?
123
341240
3280
A minimum, amit elvársz,
az a jó tv, nem igaz?
05:57
And if dataadat analysiselemzés
does not work that way,
124
345880
2720
Amikor pedig az adatelemzés
nem így működik,
06:01
then it actuallytulajdonképpen getsjelentkeznek a little scaryijedős,
125
349520
2056
egy kissé ijesztővé válik a helyzet,
06:03
because we liveélő in a time
where we're turningfordítás to dataadat more and more
126
351600
3816
mert olyan korban élünk, amikor
egyre többször fordulunk az adatokhoz,
06:07
to make very serioussúlyos decisionsdöntések
that go farmessze beyondtúl TVTV.
127
355440
4480
hogy a tv-nél sokkal komolyabb
döntéseket hozzunk.
06:12
Does anyonebárki here know the companyvállalat
Multi-HealthTöbb egészségügyi SystemsRendszerek?
128
360760
3240
Ismeri valaki
a Multi-Health Systems céget?
06:17
No one. OK, that's good actuallytulajdonképpen.
129
365080
1656
Senki. Oké, az a jó.
06:18
OK, so Multi-HealthTöbb egészségügyi SystemsRendszerek
is a softwareszoftver companyvállalat,
130
366760
3216
A Multi-Health Systems egy szoftvercég,
06:22
and I hoperemény that nobodysenki here in this roomszoba
131
370000
2816
és remélem, a jelenlévők közül
06:24
ever comesjön into contactkapcsolatba lépni
with that softwareszoftver,
132
372840
3176
soha, senkinek
nem kell használnia a szoftverüket.
06:28
because if you do,
it meanseszközök you're in prisonbörtön.
133
376040
2096
Mert aki használja, börtönben van.
06:30
(LaughterNevetés)
134
378160
1176
(Nevetés)
06:31
If someonevalaki here in the US is in prisonbörtön,
and they applyalkalmaz for parolefeltételes szabadlábra helyezés,
135
379360
3536
Ha valaki az USA-ban börtönben van,
és feltételest kérvényez,
06:34
then it's very likelyvalószínűleg that
dataadat analysiselemzés softwareszoftver from that companyvállalat
136
382920
4296
nagy eséllyel a cég adatelemző szoftverét
06:39
will be used in determiningmeghatározó
whetherakár to grantbiztosít that parolefeltételes szabadlábra helyezés.
137
387240
3616
fogják használni a döntésnél.
06:42
So it's the sameazonos principleelv
as AmazonAmazon and NetflixNetflix,
138
390880
2576
Az elv ugyanaz,
mint az Amazonnál és a Netflixnél,
06:45
but now insteadhelyette of decidingdöntés whetherakár
a TVTV showelőadás is going to be good or badrossz,
139
393480
4616
de nem egy tv show-ról döntik el,
hogy jó, vagy rossz-e,
06:50
you're decidingdöntés whetherakár a personszemély
is going to be good or badrossz.
140
398120
2896
hanem arról,
hogy egy ember jó, vagy rossz-e.
06:53
And mediocreközépszerű TVTV, 22 minutespercek,
that can be prettyszép badrossz,
141
401040
5496
Egy középszerű, 22 perces sorozat
is elég rossz lehet,
06:58
but more yearsévek in prisonbörtön,
I guessTaláld ki, even worserosszabb.
142
406560
2640
de több év börtönben
szerintem még rosszabb.
07:02
And unfortunatelysajnálatos módon, there is actuallytulajdonképpen
some evidencebizonyíték that this dataadat analysiselemzés,
143
410360
4136
Sajnos van rá bizonyíték,
hogy ez az adatelemzés
07:06
despiteannak ellenére havingamelynek lots of dataadat,
does not always producegyárt optimumoptimális resultstalálatok.
144
414520
4216
a sok adat ellenére, nem mindig
zárul optimális eredményekkel.
07:10
And that's not because a companyvállalat
like Multi-HealthTöbb egészségügyi SystemsRendszerek
145
418760
2722
De nem azért, mert a Multi-Health Systems
és hasonló cégek
07:13
doesn't know what to do with dataadat.
146
421506
1627
nem tudják az adatokat kezelni.
07:15
Even the mosta legtöbb data-savvyadatok-hozzáértés
companiesvállalatok get it wrongrossz.
147
423158
2298
Még a legprofibb adatelemző cégek
is elrontják.
07:17
Yes, even GoogleGoogle getsjelentkeznek it wrongrossz sometimesnéha.
148
425480
2400
Igen, néha még a Google is.
07:20
In 2009, GoogleGoogle announcedbejelentett
that they were ableképes, with dataadat analysiselemzés,
149
428680
4496
2009-ben a Google bejelentette,
hogy adatelemzéssel
07:25
to predictmegjósolni outbreaksjárványok of influenzainfluenza,
the nastycsúnya kindkedves of fluinfluenza,
150
433200
4136
előre tudják jelezni
az influenzajárvány kitöréseit,
07:29
by doing dataadat analysiselemzés
on theirazok GoogleGoogle searcheskeresések.
151
437360
3776
a Google keresések adatelemzésével.
07:33
And it workeddolgozott beautifullyszépen,
and it madekészült a bignagy splashloccsanás in the newshírek,
152
441160
3856
Nagyszerűen működött,
nagy visszhangja volt a hírekben,
07:37
includingbeleértve the pinnacleorom
of scientifictudományos successsiker:
153
445040
2136
többek között
a tudományos siker tetőpontján,
07:39
a publicationkiadvány in the journalfolyóirat "NatureTermészet."
154
447200
2456
a "Nature" folyóiratban is publikálták.
07:41
It workeddolgozott beautifullyszépen
for yearév after yearév after yearév,
155
449680
3616
Gyönyörűen működött évről évre,
07:45
untilamíg one yearév it failednem sikerült.
156
453320
1656
amíg egyszer csak mégsem.
07:47
And nobodysenki could even tell exactlypontosan why.
157
455000
2256
Senki sem tudta, hogy pontosan miért.
07:49
It just didn't work that yearév,
158
457280
1696
Egyszerűen nem működött akkor,
07:51
and of coursetanfolyam that again madekészült bignagy newshírek,
159
459000
1936
persze megint nagy visszhangot keltett,
07:52
includingbeleértve now a retractionvisszahúzás
160
460960
1616
visszavonták a "Nature"-ben
07:54
of a publicationkiadvány
from the journalfolyóirat "NatureTermészet."
161
462600
2840
megjelent publikációt is.
07:58
So even the mosta legtöbb data-savvyadatok-hozzáértés companiesvállalatok,
AmazonAmazon and GoogleGoogle,
162
466480
3336
Tehát még a legjobb adatelemző cégek,
az Amazon és a Google is
08:01
they sometimesnéha get it wrongrossz.
163
469840
2136
elrontja néha.
08:04
And despiteannak ellenére all those failureshibák,
164
472000
2936
Mindezen kudarcok ellenére
08:06
dataadat is movingmozgó rapidlygyorsan
into real-lifevalós decision-makingDöntéshozatal --
165
474960
3856
az adatok villámgyorsan épülnek
be az igazi döntéshozatalba
08:10
into the workplacemunkahely,
166
478840
1816
a munkahelyen,
08:12
lawtörvény enforcementvégrehajtás,
167
480680
1816
a jogalkalmazásban,
08:14
medicinegyógyszer.
168
482520
1200
a gyógyászatban.
08:16
So we should better make sure
that dataadat is helpingsegít.
169
484400
3336
Ezért biztosra kell mennünk,
hogy az adatok segítenek.
08:19
Now, personallySzemélyesen I've seenlátott
a lot of this struggleküzdelem with dataadat myselfmagamat,
170
487760
3136
Személy szerint sok küzdelmet
megéltem adatokkal,
08:22
because I work in computationalszámítási geneticsgenetika,
171
490920
1976
mert számítógépes genomikával foglalkozom
08:24
whichmelyik is alsois a fieldmező
where lots of very smartOkos people
172
492920
2496
és ezen a területen sok nagyon okos ember
08:27
are usinghasználva unimaginableelképzelhetetlen amountsösszegek of dataadat
to make prettyszép serioussúlyos decisionsdöntések
173
495440
3656
használ elképzelhetetlen mennyiségű adatot
fontos döntések meghozatalára,
08:31
like decidingdöntés on a cancerrák therapyterápia
or developingfejlesztés a drugdrog.
174
499120
3560
pl. rákterápiát és
új gyógyszereket érintő kérdésekben.
08:35
And over the yearsévek,
I've noticedészrevette a sortfajta of patternminta
175
503520
2376
Az évek során észrevettem egy mintát
08:37
or kindkedves of ruleszabály, if you will,
about the differencekülönbség
176
505920
2456
vagy egy szabályt
08:40
betweenközött successfulsikeres
decision-makingDöntéshozatal with dataadat
177
508400
2696
az adatok segítségével
történő sikeres és sikertelen
08:43
and unsuccessfulsikertelen decision-makingDöntéshozatal,
178
511120
1616
döntéshozatal között.
08:44
and I find this a patternminta worthérdemes sharingmegosztás,
and it goesmegy something like this.
179
512760
3880
Úgy gondolom,
érdemes megosztanom ezt a mintát.
08:50
So wheneverbármikor you're
solvingmegoldó a complexösszetett problemprobléma,
180
518520
2135
Amikor egy komplex problémával
nézünk szembe,
08:52
you're doing essentiallylényegében two things.
181
520679
1737
lényegében két dolgot csinálunk.
08:54
The first one is, you take that problemprobléma
aparteltekintve into its bitsbit and piecesdarabok
182
522440
3296
Az első: darabokra szedjük a problémát,
08:57
so that you can deeplymélyen analyzeelemez
those bitsbit and piecesdarabok,
183
525760
2496
hogy azokat a darabokat
behatóan elemezzük.
09:00
and then of coursetanfolyam
you do the secondmásodik partrész.
184
528280
2016
Aztán jön a második rész,
09:02
You put all of these bitsbit and piecesdarabok
back togetheregyütt again
185
530320
2656
amikor újra összerakjuk a darabkákat,
09:05
to come to your conclusionkövetkeztetés.
186
533000
1336
hogy konklúzióra jussunk.
09:06
And sometimesnéha you
have to do it over again,
187
534360
2336
Néha újra és újra meg kell csinálnunk,
09:08
but it's always those two things:
188
536720
1656
de mindig ez a két rész a fontos:
09:10
takingbevétel aparteltekintve and puttingelhelyezés
back togetheregyütt again.
189
538400
2320
szétszedni és újra összerakni.
09:14
And now the crucialalapvető thing is
190
542280
1616
A kritikus rész az,
09:15
that dataadat and dataadat analysiselemzés
191
543920
2896
hogy az adatok és az adatelemzés
09:18
is only good for the first partrész.
192
546840
2496
csak az első részre jók.
09:21
DataAdatok and dataadat analysiselemzés,
no matterügy how powerfulerős,
193
549360
2216
Az adatok és az adatelemzés,
mindegy, milyen jó,
09:23
can only help you takingbevétel a problemprobléma aparteltekintve
and understandingmegértés its piecesdarabok.
194
551600
4456
csak a probléma szétszedésében
és a darabok megértésében segíthet.
09:28
It's not suitedalkalmas to put those piecesdarabok
back togetheregyütt again
195
556080
3496
Nem alkalmas
a darabok újbóli összerakására,
09:31
and then to come to a conclusionkövetkeztetés.
196
559600
1896
majd a konklúzió meghozatalára.
09:33
There's anotheregy másik tooleszköz that can do that,
and we all have it,
197
561520
2736
Van erre egy másik eszközünk,
amivel mindenki rendelkezik.
09:36
and that tooleszköz is the brainagy.
198
564280
1296
Ez az eszköz az agyunk.
09:37
If there's one thing a brainagy is good at,
199
565600
1936
Ha valamire jó az agyunk,
09:39
it's takingbevétel bitsbit and piecesdarabok
back togetheregyütt again,
200
567560
2256
az a darabkák újra összerakása,
09:41
even when you have incompletebefejezetlen informationinformáció,
201
569840
2016
akkor is, ha az információ nem teljes,
09:43
and comingeljövetel to a good conclusionkövetkeztetés,
202
571880
1576
és a jó következtetés,
09:45
especiallykülönösen if it's the brainagy of an expertszakértő.
203
573480
2936
különösképp, ha az agy egy szakértőé.
09:48
And that's why I believe
that NetflixNetflix was so successfulsikeres,
204
576440
2656
Szerintem a Netflix azért olyan sikeres,
09:51
because they used dataadat and brainsagyvelő
where they belongtartoznak in the processfolyamat.
205
579120
3576
mert ott használják az adatokat
és az agyat, ahol szükséges.
09:54
They use dataadat to first understandmegért
lots of piecesdarabok about theirazok audienceközönség
206
582720
3536
Először az adatokat használják, hogy
megtudjanak sok mindent a közönségről,
09:58
that they otherwisemásképp wouldn'tnem have
been ableképes to understandmegért at that depthmélység,
207
586280
3416
amit másképp nem tudnának
olyan mélyen megérteni,
10:01
but then the decisiondöntés
to take all these bitsbit and piecesdarabok
208
589720
2616
de a döntés a darabkák összerakásáról
10:04
and put them back togetheregyütt again
and make a showelőadás like "HouseHáz of CardsKártyák,"
209
592360
3336
egy olyan sorozat létrehozásánál,
mint a "Kártyavár",
az nem az adatoknak köszönhető.
10:07
that was nowheremost itt in the dataadat.
210
595720
1416
10:09
TedTed SarandosSarandos and his teamcsapat
madekészült that decisiondöntés to licenseengedély that showelőadás,
211
597160
3976
Ted Sarandos és csapata hozta a döntést
a sorozat berendeléséről,
10:13
whichmelyik alsois meantjelentett, by the way,
that they were takingbevétel
212
601160
2381
ami azt is jelentette, hogy elég nagy
10:15
a prettyszép bignagy personalszemélyes riskkockázat
with that decisiondöntés.
213
603565
2851
személyes kockázatot vállaltak vele.
10:18
And AmazonAmazon, on the other handkéz,
they did it the wrongrossz way around.
214
606440
3016
Az Amazonnál pedig rosszul csinálták.
10:21
They used dataadat all the way
to drivehajtás theirazok decision-makingDöntéshozatal,
215
609480
2736
Végig adatokat használtak
a döntéshozatalban.
10:24
first when they heldtartotta
theirazok competitionverseny of TVTV ideasötletek,
216
612240
2416
Először amikor versenyeztették
az ötleteket,
10:26
then when they selectedkiválasztott "AlphaAlfa HouseHáz"
to make as a showelőadás.
217
614680
3696
majd amikor kiválasztották
az "Alpha House"-t.
10:30
WhichAmely of coursetanfolyam was
a very safebiztonságos decisiondöntés for them,
218
618400
2496
Ami persze nagyon biztonságos döntés
volt számukra,
10:32
because they could always
pointpont at the dataadat, sayingmondás,
219
620920
2456
mert mindig mutogathattak az adatokra,
mondván, hogy
10:35
"This is what the dataadat tellsmegmondja us."
220
623400
1696
"Az adatokból ez következik."
10:37
But it didn't leadvezet to the exceptionalkivételes
resultstalálatok that they were hopingremélve for.
221
625120
4240
De mégsem hozta az elvárt
kiugró eredményeket.
10:42
So dataadat is of coursetanfolyam a massivelymasszívan
usefulhasznos tooleszköz to make better decisionsdöntések,
222
630120
4976
Az adatelemzés persze nagyon hasznos
eszköz a jobb döntéshozatalban,
10:47
but I believe that things go wrongrossz
223
635120
2376
de szerintem az már rossz,
10:49
when dataadat is startingkiindulási
to drivehajtás those decisionsdöntések.
224
637520
2576
ha adatok kezdik
meghatározni a döntéseket.
10:52
No matterügy how powerfulerős,
dataadat is just a tooleszköz,
225
640120
3776
Mindegy, milyen erőteljes,
az adat csak eszköz.
10:55
and to keep that in mindelme,
I find this deviceeszköz here quiteegészen usefulhasznos.
226
643920
3336
Van egy nagyon hasznos eszköz arra,
hogy ezt ne felejtsük el.
10:59
ManySok of you will ...
227
647280
1216
Ez ismerős lesz...
11:00
(LaughterNevetés)
228
648520
1216
(Nevetés)
11:01
Before there was dataadat,
229
649760
1216
Az adatelemzés előtt
11:03
this was the decision-makingDöntéshozatal
deviceeszköz to use.
230
651000
2856
ezt az eszközt használták
döntéshozatalra.
11:05
(LaughterNevetés)
231
653880
1256
(Nevetés)
11:07
ManySok of you will know this.
232
655160
1336
Sokan ismeritek.
11:08
This toyjáték here is calledhívott the MagicMagic 8 BallLabda,
233
656520
1953
Ez a játék a Varázslatos 8-as golyó,
11:10
and it's really amazingelképesztő,
234
658497
1199
és valóban lenyűgöző.
11:11
because if you have a decisiondöntés to make,
a yes or no questionkérdés,
235
659720
2896
Ha van egy eldöntendő kérdésed,
11:14
all you have to do is you shakeráz the balllabda,
and then you get an answerválasz --
236
662640
3736
csak megrázod a labdát,
és választ kapsz rá:
11:18
"MostA legtöbb LikelyValószínűleg" -- right here
in this windowablak in realigazi time.
237
666400
2816
"Nagyon valószínű"
olvasható rajta máris.
11:21
I'll have it out latera későbbiekben for techtech demosdemók.
238
669240
2096
Később kipróbálhatjátok.
11:23
(LaughterNevetés)
239
671360
1216
(Nevetés)
11:24
Now, the thing is, of coursetanfolyam --
so I've madekészült some decisionsdöntések in my life
240
672600
3576
Hoztam pár olyan döntést az életben,
11:28
where, in hindsightutólag,
I should have just listenedhallgatta to the balllabda.
241
676200
2896
amikor csak a golyóra kellett volna
hallgatnom.
11:31
But, you know, of coursetanfolyam,
if you have the dataadat availableelérhető,
242
679120
3336
De persze, ha van
elérhető háttérinformáció,
11:34
you want to replacecserélje this with something
much more sophisticatedkifinomult,
243
682480
3056
valami ennél kifinomultabbat
is használnánk,
11:37
like dataadat analysiselemzés
to come to a better decisiondöntés.
244
685560
3616
mint például az adatelemzést,
hogy jobb döntést hozzunk.
11:41
But that does not changeváltozás the basicalapvető setupa telepítő.
245
689200
2616
De ez nem változtat az alapfelálláson.
11:43
So the balllabda maylehet get smarterintelligensebb
and smarterintelligensebb and smarterintelligensebb,
246
691840
3176
lehet, hogy a golyó egyre okosabb lesz,
11:47
but I believe it's still on us
to make the decisionsdöntések
247
695040
2816
de még mindig nekünk kell döntenünk,
11:49
if we want to achieveelér
something extraordinaryrendkívüli,
248
697880
3016
ha valami rendkívülit akarunk elérni
11:52
on the right endvég of the curveív.
249
700920
1936
a görbe jó végén.
11:54
And I find that a very encouragingbátorító
messageüzenet, in facttény,
250
702880
4496
Nagyon ösztönzőnek tartom,
11:59
that even in the facearc
of hugehatalmas amountsösszegek of dataadat,
251
707400
3976
hogy még hatalmas adathalmazok
12:03
it still paysfizet off to make decisionsdöntések,
252
711400
4096
mellett is kifizetődik a döntéshozatal,
12:07
to be an expertszakértő in what you're doing
253
715520
2656
hogy szakértője legyél a témának,
12:10
and take riskskockázatok.
254
718200
2096
és hogy kockáztass.
12:12
Because in the endvég, it's not dataadat,
255
720320
2776
Mert végül is nem az adatok,
12:15
it's riskskockázatok that will landföld you
on the right endvég of the curveív.
256
723120
3960
hanem a kockázat segít át
a görbe jó oldalára.
12:19
Thank you.
257
727840
1216
Köszönöm.
12:21
(ApplauseTaps)
258
729080
3680
(Taps)
Translated by Tibor Somogyi
Reviewed by Zsuzsanna Lőrincz

▲Back to top

ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com