ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com
TEDxCambridge

Sebastian Wernicke: How to use data to make a hit TV show

Sebastian Wernicke: Kaip naudojantis duomenimis sukurti kultinę TV laidą

Filmed:
1,628,704 views

Ar duomenų rinkimas padeda priimti geresnius sprendimus? Konkurencingoms, duomenų rinkimą ir naudojimą išmanančioms kompanijoms „Amazon“, „Google“ ir „Netflix“ teko patirti, kad norint geriausių rezultatų ne visuomet galima pasikliauti vien duomenų analize. Statistikas Sebastian Wernicke savo kalboje atskleidžia, kas nutinka, kai mūsų sprendimai būna paremti vien duomenimis, ir nurodo, kaip duomenis būtų galima panaudoti „išmaniau“.
- Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects. Full bio

Double-click the English transcript below to play the video.

00:12
RoyRoy PriceKaina is a man that mostlabiausiai of you
have probablytikriausiai never heardišgirdo about,
0
820
4276
Turbūt nedaugelis iš jūsų
esate girdėję apie Roy Price’ą,
00:17
even thoughnors he mayGegužė have been responsibleatsakingas
1
5120
2496
nors galimai per jį nuobodžiavote
22 savo gyvenimo minutes
00:19
for 22 somewhatšiek tiek mediocrevidutiniškas
minutesminutės of your life on AprilBalandis 19, 2013.
2
7640
6896
2013 m. balandžio 19 dieną.
00:26
He mayGegužė have alsotaip pat been responsibleatsakingas
for 22 very entertaininglinksmas minutesminutės,
3
14560
3176
Galimai tos 22 minutės Roy dėka
praėjo labai linksmai,
00:29
but not very manydaug of you.
4
17760
2256
bet tik nedaugeliui iš jūsų.
00:32
And all of that goeseina back to a decisionsprendimas
5
20040
1896
Prieš maždaug trejus metus
Roy priėmė sprendimą.
00:33
that RoyRoy had to make
about threetrys yearsmetai agoprieš.
6
21960
2000
00:35
So you see, RoyRoy PriceKaina
is a seniorvyresnysis executivevykdomasis with AmazonAmazon StudiosStudijos.
7
23984
4832
Matote, Roy Price’as –
„Amazon Studios“ vyr. vadovas.
00:40
That's the TVTV productiongamyba
companybendrovė of AmazonAmazon.
8
28840
3016
„Amazon Studios“ – „Amazon“ TV kompanija.
00:43
He's 47 yearsmetai oldsenas, slimlieknas, spikysmailas hairplaukai,
9
31880
3256
Roy – 47-eri metai,
jis lieknas, pašiauštais plaukais.
00:47
describesapibūdina himselfpats on TwitterŚwiergotać
as "moviesfilmai, TVTV, technologytechnologija, tacostacos."
10
35160
4816
„Twitter“ tinkle apibūdina save taip:
„Kinas, TV, technologijos, taco“.
00:52
And RoyRoy PriceKaina has a very responsibleatsakingas jobdarbas,
because it's his responsibilityatsakomybė
11
40000
5176
Roy Price’o darbas labai atsakingas.
Jam tenka išrinkti,
kokias laidas kurs „Amazon“ kompanija.
00:57
to pickpasiimti the showsparodos, the originaloriginalus contentturinys
that AmazonAmazon is going to make.
12
45200
4056
01:01
And of coursežinoma that's
a highlylabai competitiveKonkurencinis spaceerdvė.
13
49280
2336
Šioms laidoms tenka
labai didelė konkurencija.
01:03
I mean, there are so manydaug
TVTV showsparodos alreadyjau out there,
14
51640
2736
TV laidų yra be galo daug,
tad Roy negali rinktis bet ko.
01:06
that RoyRoy can't just choosepasirinkti any showRodyti.
15
54400
2176
01:08
He has to find showsparodos
that are really, really great.
16
56600
4096
Jis turi surasti
pačias geriausias TV laidas.
01:12
So in other wordsžodžiai, he has to find showsparodos
17
60720
2816
Laidas, kurios būtų
pačiame dešiniajame šios kreivės gale.
01:15
that are on the very right endgalas
of this curvekreivė here.
18
63560
2376
01:17
So this curvekreivė here
is the ratingreitingas distributionplatinimas
19
65960
2656
Ši kreivė rodo, kaip yra reitinguotos
maždaug 2 500 TV laidų „IMDb“ tinklapyje.
01:20
of about 2,500 TVTV showsparodos
on the websiteInterneto svetainė IMDBIMDB,
20
68640
4376
01:25
and the ratingreitingas goeseina from one to 10,
21
73040
2896
Reitinguojama nuo vieno iki dešimt,
01:27
and the heightaukštis here showsparodos you
how manydaug showsparodos get that ratingreitingas.
22
75960
2976
o kreivės aukštis rodo,
kiek laidų gauna tokį reitingą.
01:30
So if your showRodyti getsgauna a ratingreitingas
of ninedevyni pointstaškai or higherdidesnis, that's a winnernugalėtojas.
23
78960
4696
Jei tavo laida gauna
9 punktus ar daugiau,
reiškia, ji puiki, geresnė nei 98% laidų.
01:35
Then you have a topviršuje two percentproc showRodyti.
24
83680
1816
01:37
That's showsparodos like "BreakingTrūkimo Badblogas,"
"GameŽaidimas of ThronesSosto," "The WireVielos,"
25
85520
3896
Lygi „Bręstančiam blogiui“,
„Sostų karams“, „Blakei“.
01:41
so all of these showsparodos that are addictivepriklausomybę,
26
89440
2296
Tokios laidos užkabina,
01:43
whereafterpo to you've watchedstebėjo a seasonsezonas,
your brainsmegenys is basicallyiš esmės like,
27
91760
3056
peržiūrėjus vieną sezoną,
smegenys nerimsta:
„Kur gauti daugiau serijų?“
01:46
"Where can I get more of these episodesepizodai?"
28
94840
2176
(Juokas.).
01:49
That kindmalonus of showRodyti.
29
97040
1200
Kalbu apie tokią laidą.
01:50
On the left sidepusė, just for clarityaiškumas,
here on that endgalas,
30
98920
2496
O kairiajame kreivės gale, įdomumo dėlei,
yra tokios laidos kaip...
01:53
you have a showRodyti calledvadinamas
"ToddlersMažiems vaikams and TiarasTiaras" --
31
101440
3176
„Vaikai ir tiaros“.
01:56
(LaughterJuokas)
32
104640
2656
(Juokas.).
01:59
-- whichkuris should tell you enoughpakankamai
33
107320
1536
Dabar jums turėtų būti aišku,
kas dedasi tame kreivės gale.
02:00
about what's going on
on that endgalas of the curvekreivė.
34
108880
2191
02:03
Now, RoyRoy PriceKaina is not worriedsusirūpinęs about
gettinggauti on the left endgalas of the curvekreivė,
35
111095
4161
Roy Price’o nedomina
kairysis kreivės galas,
02:07
because I think you would have to have
some seriousrimtas brainpowerIntelektualinio potencialo
36
115280
2936
o be to, reikėtų nemažai pasukti smegenis,
kad nurungtum „Vaikus ir tiaras“.
02:10
to undercutsumažino "ToddlersMažiems vaikams and TiarasTiaras."
37
118240
1696
02:11
So what he's worriedsusirūpinęs about
is this middleviduryje bulgebumbulas here,
38
119960
3936
Jį domina šis viduriukas –
įprastinės laidos.
02:15
the bulgebumbulas of averagevidurkis TVTV,
39
123920
1816
02:17
you know, those showsparodos
that aren'tnėra really good or really badblogai,
40
125760
2856
Nei geros, nei blogos.
Jos pernelyg nejaudina.
02:20
they don't really get you excitedsusijaudinęs.
41
128639
1656
02:22
So he needsporeikiai to make sure
that he's really on the right endgalas of this.
42
130320
4856
Roy privalo užtikrinti,
kad jo laida atsidurs
dešiniajame kreivės gale.
02:27
So the pressurespaudimas is on,
43
135200
1576
Jis jautė šiokį tokį spaudimą,
02:28
and of coursežinoma it's alsotaip pat the first time
44
136800
2176
„Amazon“ dar nebuvo kūrusi laidų,
02:31
that AmazonAmazon is even
doing something like this,
45
139000
2176
02:33
so RoyRoy PriceKaina does not want
to take any chancesšansai.
46
141200
3336
todėl Roy Price'as nenorėjo rizikuoti.
02:36
He wants to engineerinžinierius successsėkmė.
47
144560
2456
Jis norėjo nuvesti prie sėkmės.
02:39
He needsporeikiai a guaranteedgarantuotas successsėkmė,
48
147040
1776
Jam reikėjo garantuotos sėkmės.
02:40
and so what he does is,
he holdslaiko a competitionkonkurencija.
49
148840
2576
Taigi, jis surengė konkursą.
02:43
So he takes a bunchkrūva of ideasidėjos for TVTV showsparodos,
50
151440
3136
Prigalvojo idėjų TV laidoms,
02:46
and from those ideasidėjos,
throughper an evaluationvertinimo,
51
154600
2296
iš jų, po ilgų svarstymų,
02:48
they selectpasirinkite eightaštuoni candidateskandidatai for TVTV showsparodos,
52
156920
4096
buvo išrinktos aštuonios galimos laidos,
02:53
and then he just makesdaro the first episodeepizodas
of eachkiekvienas one of these showsparodos
53
161040
3216
o tada visoms šioms laidoms
jis sukurė pirmąsias serijas
02:56
and putskelia them onlineprisijungęs for freenemokamai
for everyoneVisi to watch.
54
164280
3136
ir sudėjo jas į internetą,
kad žiūrėtum nemokamai.
02:59
And so when AmazonAmazon
is givingduoti out freenemokamai stuffdaiktai,
55
167440
2256
O kai „Amazon“ duoda kažką už dyką,
negi neimsi?
03:01
you're going to take it, right?
56
169720
1536
03:03
So millionsmilijonai of viewersžiūrovai
are watchingžiūriu those episodesepizodai.
57
171280
5136
Milijonai žiūrovų
žiūrėjo šias serijas.
03:08
What they don't realizesuvokti is that,
while they're watchingžiūriu their showsparodos,
58
176440
3216
Tik jiems neatėjo į galvą,
kad kol žiūrėjo laidas...
03:11
actuallyiš tikrųjų, they are beingesamas watchedstebėjo.
59
179680
2296
kažkas žiūrėjo į juos.
03:14
They are beingesamas watchedstebėjo
by RoyRoy PriceKaina and his teamkomanda,
60
182000
2336
Roy Price'as ir jo komanda žiūrėjo
ir viską įrašinėjo.
03:16
who recordįrašyti everything.
61
184360
1376
03:17
They recordįrašyti when somebodykažkas pressespresai playGroti,
when somebodykažkas pressespresai pausePauzė,
62
185760
3376
Kada paspaudžiama „groti“,
kada paspaudžiama „pauzė“,
03:21
what partsdalys they skippraleisti,
what partsdalys they watch again.
63
189160
2536
kas prasukama,
o kas – žiūrima antrąsyk.
03:23
So they collectrinkti millionsmilijonai of dataduomenys pointstaškai,
64
191720
2256
Taip buvo surinkti
milijonai duomenų taškų,
03:26
because they want
to have those dataduomenys pointstaškai
65
194000
2096
o jų reikia, kad nuspręstum,
kokį serialą sukurti.
03:28
to then decidenuspręsti
whichkuris showRodyti they should make.
66
196120
2696
03:30
And sure enoughpakankamai,
so they collectrinkti all the dataduomenys,
67
198840
2176
Galiausiai, surinkus visus šiuos duomenis,
juos išnagrinėjus, buvo gautas atsakymas:
03:33
they do all the dataduomenys crunchingvos,
and an answeratsakyti emergesatsiranda,
68
201040
2576
03:35
and the answeratsakyti is,
69
203640
1216
„„Amazon“ turėtų sukurti serialą
apie 4 JAV senatorius respublikonus.“
03:36
"AmazonAmazon should do a sitcomseriale
about fourketuri RepublicanRespublikinė US SenatorsSenatorius."
70
204880
5536
(Juokas.).
03:42
They did that showRodyti.
71
210440
1216
Ką „Amazon“ ir padarė.
03:43
So does anyonekas nors know the namevardas of the showRodyti?
72
211680
2160
Ar kas žinot serialo pavadinimą?
(Publika: „Alfa namelis“.).
03:46
(AudienceAuditorija: "AlphaAlfa HouseNamas.")
73
214720
1296
Taip, „Alfa namelis“.
03:48
Yes, "AlphaAlfa HouseNamas,"
74
216040
1456
03:49
but it seemsatrodo like not too manydaug of you here
rememberPrisiminti that showRodyti, actuallyiš tikrųjų,
75
217520
4096
Tik atrodo, kad nedaugelis iš jūsų
atsimenat šią laidą.
03:53
because it didn't turnpasukti out that great.
76
221640
1856
Ji neišėjo tokia jau gera.
03:55
It's actuallyiš tikrųjų just an averagevidurkis showRodyti,
77
223520
1856
Greičiau vidutiniška.
03:57
actuallyiš tikrųjų -- literallypažodžiui, in factfaktas, because
the averagevidurkis of this curvekreivė here is at 7.4,
78
225400
4576
Vidutiniška tiesiogine prasme,
nes šios kreivės vidurkis – 7,4 punktai,
04:02
and "AlphaAlfa HouseNamas" landsžemių at 7.5,
79
230000
2416
o „Alfa namelis“ surinko 7,5 punktus.
04:04
so a slightlyLengvai aboveaukščiau averagevidurkis showRodyti,
80
232440
2016
Ji kiek geresnė už vidutinę laidą,
04:06
but certainlytikrai not what RoyRoy PriceKaina
and his teamkomanda were aimingsiekiant for.
81
234480
2920
tačiau tikrai ne tokios
siekė Roy Price'as ir jo komanda.
04:10
MeanwhileTuo tarpu, howevertačiau,
at about the sametas pats time,
82
238320
2856
Maždaug tuo pačiu metu
04:13
at anotherkitas companybendrovė,
83
241200
1576
kitos kompanijos vadovui
pavyko sukurti puikią laidą,
04:14
anotherkitas executivevykdomasis did managetvarkyti
to landžemė a topviršuje showRodyti usingnaudojant dataduomenys analysisanalizė,
84
242800
4216
naudojant duomenų analizę.
04:19
and his namevardas is TedTED,
85
247040
1576
Kalbame apie Tedą,
04:20
TedTED SarandosSarandos, who is
the ChiefVyriausiasis ContentTurinys OfficerPareigūnas of NetflixNetflix,
86
248640
3416
Tedą Sarandos – „Netflix“ direktorių,
atsakingą už turinį.
04:24
and just like RoyRoy,
he's on a constantpastovi missionmisija
87
252080
2136
Kaip Roy, Tedo nuolatinė užduotis –
sukurti tą puikiąją TV laidą.
04:26
to find that great TVTV showRodyti,
88
254240
1496
04:27
and he usesnaudoja dataduomenys as well to do that,
89
255760
2016
Jis irgi naudojasi duomenimis,
tik naudojasi jais kiek kitaip.
04:29
exceptišskyrus he does it
a little bitšiek tiek differentlyskirtingai.
90
257800
2015
04:31
So insteadvietoj to of holdinglaikymasis a competitionkonkurencija,
what he did -- and his teamkomanda of coursežinoma --
91
259839
3737
Jis nerengė konkurso,
bet kartu su savo komanda
04:35
was they lookedatrodė at all the dataduomenys
they alreadyjau had about NetflixNetflix viewersžiūrovai,
92
263600
3536
peržvelgė visą jau turimą informaciją
apie „Netflix“ žiūrovus.
04:39
you know, the ratingsreitingai
they give their showsparodos,
93
267160
2096
Kaip žiūrovai reitingavo laidas,
ką žiūrėjo, ką mėgsta ir panašiai.
04:41
the viewingperžiūra historiesistorijos,
what showsparodos people like, and so on.
94
269280
2696
04:44
And then they use that dataduomenys to discoveratrasti
95
272000
1896
Šie duomenys jiems padėjo sužinoti
visokiausių detalių apie savo žiūrovus.
04:45
all of these little bitsbitai and piecesvienetai
about the audienceauditorija:
96
273920
2616
04:48
what kindsrūšys of showsparodos they like,
97
276560
1456
Kokias laidas jie mėgsta,
kokius prodiuserius, kokius aktorius.
04:50
what kindmalonus of producersgamintojai,
what kindmalonus of actorsaktoriai.
98
278040
2096
04:52
And oncekartą they had
all of these piecesvienetai togetherkartu,
99
280160
2576
Kai pagaliau sudėjo
visas šias detales į vieną,
04:54
they tookpaėmė a leapšuolis of faithtikėjimas,
100
282760
1656
jie šoko į nežinią
04:56
and they decidednusprendė to licenselicencija
101
284440
2096
ir nusprendė sukurti
ne serialą apie keturis senatorius,
04:58
not a sitcomseriale about fourketuri SenatorsSenatorius
102
286560
2456
05:01
but a dramadramos seriesserija about a singlevienišas SenatorSenatorius.
103
289040
2880
o dramą-serialą apie vieną senatorių.
05:04
You guys know the showRodyti?
104
292760
1656
Kokia tai laida?
05:06
(LaughterJuokas)
105
294440
1296
(Juokas.).
05:07
Yes, "HouseNamas of CardsKortelės," and NetflixNetflix
of coursežinoma, nailedprikaltas it with that showRodyti,
106
295760
3736
Taip, tai – „Kortų namelis“.
„Netflix“ pataikė kaip pirštu į akį...
05:11
at leastmažiausiai for the first two seasonsmetų laikai.
107
299520
2136
Bent jau pirmuosius du sezonus.
05:13
(LaughterJuokas) (ApplausePlojimai)
108
301680
3976
(Juokas ir plojimai.).
05:17
"HouseNamas of CardsKortelės" getsgauna
a 9.1 ratingreitingas on this curvekreivė,
109
305680
3176
„Kortų namelis“ šioje kreivėje įvertintas
9,1 punktais – ko „Netflix“ ir siekė.
05:20
so it's exactlytiksliai
where they wanted it to be.
110
308880
3176
05:24
Now, the questionklausimas of coursežinoma is,
what happenedįvyko here?
111
312080
2416
Klausimas, aišku, kas nutiko?
05:26
So you have two very competitiveKonkurencinis,
data-savvyduomenys-išminties companiesįmonės.
112
314520
2656
Turim dvi labai konkurencingas kompanijas.
Abi supranta duomenis,
abi sujungė milijonus duomenų taškų.
05:29
They connectPrisijungti all of these
millionsmilijonai of dataduomenys pointstaškai,
113
317200
2856
05:32
and then it worksdarbai
beautifullygražiai for one of them,
114
320080
2376
Vienai puikiai pavyko, o kitai ne.
05:34
and it doesn't work for the other one.
115
322480
1856
05:36
So why?
116
324360
1216
Kodėl?
05:37
Because logiclogika kindmalonus of tellspasakoja you
that this should be workingdirba all the time.
117
325600
3456
Logika sako, kad turėjo pavykti abiem.
05:41
I mean, if you're collectingrinkti
millionsmilijonai of dataduomenys pointstaškai
118
329080
2456
Jei renki kalnus informacijos,
kad priimtum sprendimą,
05:43
on a decisionsprendimas you're going to make,
119
331560
1736
05:45
then you should be ablegalingas
to make a prettygana good decisionsprendimas.
120
333320
2616
tavo sprendimas
turėtų būti gana neblogas.
05:47
You have 200 yearsmetai
of statisticsstatistika to relypasikliauti on.
121
335960
2216
Statistikos mokslas vystėsi 200 metų,
05:50
You're amplifyingtobulina it
with very powerfulgalingas computerskompiuteriai.
122
338200
3016
turim galingus kompiuterius
rezultatui pagerinti.
05:53
The leastmažiausiai you could expecttikėtis
is good TVTV, right?
123
341240
3280
Laida turėtų išeiti bent jau gera...
(Juokas.).
05:57
And if dataduomenys analysisanalizė
does not work that way,
124
345880
2720
O jei duomenų analizė veikia kitaip,
darosi kiek baisoka.
06:01
then it actuallyiš tikrųjų getsgauna a little scarybaugus,
125
349520
2056
06:03
because we livegyventi in a time
where we're turningtekinimas to dataduomenys more and more
126
351600
3816
Juk su kiekviena diena
mes vis dažniau griebiamės duomenų,
06:07
to make very seriousrimtas decisionssprendimai
that go fartoli beyondtoliau TVTV.
127
355440
4480
kad primtume daug svarbesnius sprendimus,
nei to reikalauja televizija.
06:12
Does anyonekas nors here know the companybendrovė
Multi-HealthDaugelio sveikatos SystemsSistemos?
128
360760
3240
Ar kas žinot kompaniją
„Multi-Health Systems“?
06:17
No one. OK, that's good actuallyiš tikrųjų.
129
365080
1656
Niekas. Puiku.
06:18
OK, so Multi-HealthDaugelio sveikatos SystemsSistemos
is a softwareprograminė įranga companybendrovė,
130
366760
3216
„Multi-Health Systems“
gamina kompiuterinę įrangą.
06:22
and I hopetikiuosi that nobodyniekas here in this roomkambarys
131
370000
2816
Viliuosi, niekam iš jūsų
neteks susidurti su šia programa.
06:24
ever comesateina into contactsusisiekti
with that softwareprograminė įranga,
132
372840
3176
06:28
because if you do,
it meansreiškia you're in prisonkalėjimas.
133
376040
2096
Susidursit – jūs kalėjime.
06:30
(LaughterJuokas)
134
378160
1176
(Juokas.).
06:31
If someonekas nors here in the US is in prisonkalėjimas,
and they applytaikyti for parolelygtinio paleidimo,
135
379360
3536
Jei kalinys JAV kalėjime
paprašo jį lygtinai paleisti,
06:34
then it's very likelytikėtina that
dataduomenys analysisanalizė softwareprograminė įranga from that companybendrovė
136
382920
4296
daug šansų, kad sprendimas bus priimtas,
naudojant būtent šios kompanijos programą.
06:39
will be used in determiningnustatant
whetherar to grantdotacija that parolelygtinio paleidimo.
137
387240
3616
06:42
So it's the sametas pats principleprincipas
as AmazonAmazon and NetflixNetflix,
138
390880
2576
Ji veikia kaip „Amazon“ ir „Netflix“.
06:45
but now insteadvietoj to of decidingsprendžiant whetherar
a TVTV showRodyti is going to be good or badblogai,
139
393480
4616
Tik su ja nesprendžiama,
ar TV laida bus gera, ar bloga.
06:50
you're decidingsprendžiant whetherar a personasmuo
is going to be good or badblogai.
140
398120
2896
Sprendžiama,
ar žmogus bus geras, ar blogas.
06:53
And mediocrevidutiniškas TVTV, 22 minutesminutės,
that can be prettygana badblogai,
141
401040
5496
22 minutės nuobodžios televizijos
gali būti gana skausmingos,
06:58
but more yearsmetai in prisonkalėjimas,
I guessatspėti, even worseblogiau.
142
406560
2640
bet nemanau, kad prilygsta
ilgesniam laikui kalėjime.
07:02
And unfortunatelyDeja, there is actuallyiš tikrųjų
some evidenceįrodymai that this dataduomenys analysisanalizė,
143
410360
4136
Deja, yra įrodymų, kad duomenų analizė,
kiek bebūtų joje duomenų,
07:06
despitenepaisant havingturintys lots of dataduomenys,
does not always producepagaminti optimumoptimalus resultsrezultatai.
144
414520
4216
ne visada duoda geriausius rezultatus.
Nereiškia, kad tokios kompanijos
kaip „Multi-Health Systems“
07:10
And that's not because a companybendrovė
like Multi-HealthDaugelio sveikatos SystemsSistemos
145
418760
2722
07:13
doesn't know what to do with dataduomenys.
146
421506
1627
nemoka elgtis su duomenimis:
čia suklumpa net išmaniausios kompanijos.
07:15
Even the mostlabiausiai data-savvyduomenys-išminties
companiesįmonės get it wrongneteisingai.
147
423158
2298
07:17
Yes, even Google"Google" getsgauna it wrongneteisingai sometimeskartais.
148
425480
2400
Taip, kartais suklumpa net „Google“.
07:20
In 2009, Google"Google" announcedpaskelbė
that they were ablegalingas, with dataduomenys analysisanalizė,
149
428680
4496
2009 m. „Google“ pranešė, kad gali,
naudodami duomenų analizę,
07:25
to predictnumatyti outbreaksprotrūkiai of influenzagripas,
the nastybjaurus kindmalonus of flugripas,
150
433200
4136
numatyti gripo protrūkius.
07:29
by doing dataduomenys analysisanalizė
on their Google"Google" searchespaieškos.
151
437360
3776
Tereikia išanalizuoti informaciją
„Google“ paieškos sistemoje.
07:33
And it workeddirbo beautifullygražiai,
and it madepagamintas a bigdidelis splashįstrigti in the newsnaujienos,
152
441160
3856
Jų metodas veikė puikiai, tapo sensacija,
07:37
includingįskaitant the pinnaclepinnacle
of scientificmokslinis successsėkmė:
153
445040
2136
pasiekė net šiokią tokią mokslo viršūnę –
užsitarnavo straipsnį žurnale „Nature“.
07:39
a publicationpaskelbimas in the journalžurnalas "NatureGamta."
154
447200
2456
07:41
It workeddirbo beautifullygražiai
for yearmetai after yearmetai after yearmetai,
155
449680
3616
Metodas veikė puikiai metai iš metų,
tačiau vienąsyk ėmė ir nesuveikė.
07:45
untiliki one yearmetai it failednepavyko.
156
453320
1656
07:47
And nobodyniekas could even tell exactlytiksliai why.
157
455000
2256
Niekas net negalėjo pasakyti,
kodėl tais metais jis nesuveikė.
07:49
It just didn't work that yearmetai,
158
457280
1696
07:51
and of coursežinoma that again madepagamintas bigdidelis newsnaujienos,
159
459000
1936
Žinoma, laikraščiai vėl rašė, o be to,
07:52
includingįskaitant now a retractionatsisakymas
160
460960
1616
„Google“ straipsnis iš žurnalo „Nature“
buvo išimtas.
07:54
of a publicationpaskelbimas
from the journalžurnalas "NatureGamta."
161
462600
2840
07:58
So even the mostlabiausiai data-savvyduomenys-išminties companiesįmonės,
AmazonAmazon and Google"Google",
162
466480
3336
Tad suklumpa net duomenų
ekspertės „Amazon“ ir „Google“.
08:01
they sometimeskartais get it wrongneteisingai.
163
469840
2136
08:04
And despitenepaisant all those failuresnesėkmių,
164
472000
2936
Visgi duomenys vis dažniau naudojami
sprendimams realiame gyvenime:
08:06
dataduomenys is movingjuda rapidlygreitai
into real-liferealiame gyvenime decision-makingsprendimų priėmimas --
165
474960
3856
08:10
into the workplacedarbo vietoje,
166
478840
1816
darbe,
08:12
lawteisė enforcementvykdymas,
167
480680
1816
teisėsaugoje,
08:14
medicinevaistas.
168
482520
1200
medicinoje...
08:16
So we should better make sure
that dataduomenys is helpingpadedant.
169
484400
3336
Todėl privalome būti tikri,
kad duomenys mums padeda.
08:19
Now, personallyasmeniškai I've seenmatė
a lot of this strugglekova with dataduomenys myselfsave,
170
487760
3136
Aš dažnai susiduriu
su duomenų keliamomis problemomis,
08:22
because I work in computationalskaičiavimo geneticsgenetika,
171
490920
1976
nes dirbu statistinės genetikos srityje.
08:24
whichkuris is alsotaip pat a fieldlaukas
where lots of very smartprotingas people
172
492920
2496
Čia daugybė labai protingų žmonių
naudoja neįsivaizduojamą kiekį duomenų,
08:27
are usingnaudojant unimaginableneįsivaizduojamas amountssumos of dataduomenys
to make prettygana seriousrimtas decisionssprendimai
173
495440
3656
kad priimtų gana rimtus sprendimus,
pvz., kaip gydyti vėžį ar sukurti vaistą.
08:31
like decidingsprendžiant on a cancervėžys therapyterapija
or developingplėtojant a drugvaistas.
174
499120
3560
08:35
And over the yearsmetai,
I've noticedpastebėjau a sortrūšiuoti of patternmodelis
175
503520
2376
Bėgant metams pradėjau įžvelgti
tam tikrą dėsnį ar taisyklę tarp
08:37
or kindmalonus of ruletaisyklė, if you will,
about the differenceskirtumas
176
505920
2456
08:40
betweentarp successfulsėkmingas
decision-makingsprendimų priėmimas with dataduomenys
177
508400
2696
sėkmingo duomenų panaudojimo
sprendimams priimti ir nesėkmingo.
08:43
and unsuccessfulnesėkmingas decision-makingsprendimų priėmimas,
178
511120
1616
08:44
and I find this a patternmodelis worthverta sharingdalijimasis,
and it goeseina something like this.
179
512760
3880
Manau, šiuo pastebėjimu verta pasidalinti.
Klausykite.
08:50
So wheneverkada you're
solvingspręsti a complexkompleksas problemproblema,
180
518520
2135
Spręsdami sudėtingą problemą,
iš esmės atliekame du veiksmus.
08:52
you're doing essentiallyiš esmės two things.
181
520679
1737
Pirma, suskaidome problemą
į daugybę detalių,
08:54
The first one is, you take that problemproblema
apartatskirai into its bitsbitai and piecesvienetai
182
522440
3296
kad galėtume jas nuodugniai ištirti.
08:57
so that you can deeplygiliai analyzeanalizuoti
those bitsbitai and piecesvienetai,
183
525760
2496
09:00
and then of coursežinoma
you do the secondantra partdalis.
184
528280
2016
O tada ateina antroji dalis.
Vėl sudedame visas detales į vieną,
kad priimtume sprendimą.
09:02
You put all of these bitsbitai and piecesvienetai
back togetherkartu again
185
530320
2656
09:05
to come to your conclusionišvadą.
186
533000
1336
09:06
And sometimeskartais you
have to do it over again,
187
534360
2336
Kartais tenka pakartoti viską iš naujo,
bet du dalykai išlieka:
09:08
but it's always those two things:
188
536720
1656
skaidome, o paskui dedame į vieną.
09:10
takingpasiimti apartatskirai and puttingišleisti
back togetherkartu again.
189
538400
2320
09:14
And now the cruciallabai svarbu thing is
190
542280
1616
Svarbiausia tai,
09:15
that dataduomenys and dataduomenys analysisanalizė
191
543920
2896
kad duomenys ir duomenų analizė
09:18
is only good for the first partdalis.
192
546840
2496
veikia tik pirmajame etape.
09:21
DataDuomenų and dataduomenys analysisanalizė,
no matterklausimas how powerfulgalingas,
193
549360
2216
Net labai išsamūs duomenys
tepadeda išskaidyti problemą
09:23
can only help you takingpasiimti a problemproblema apartatskirai
and understandingsuprasti its piecesvienetai.
194
551600
4456
ir suprasti jos pavienes dalis.
09:28
It's not suitedtinkamas to put those piecesvienetai
back togetherkartu again
195
556080
3496
Negalime sudėti dalių atgal į vieną
ir šitaip daryti sprendimo.
09:31
and then to come to a conclusionišvadą.
196
559600
1896
09:33
There's anotherkitas toolįrankis that can do that,
and we all have it,
197
561520
2736
Šiam tikslui turime kitą įrankį.
09:36
and that toolįrankis is the brainsmegenys.
198
564280
1296
Smegenis.
09:37
If there's one thing a brainsmegenys is good at,
199
565600
1936
Smegenys puikiausiai žino,
kaip sudėti detales atgal į vieną.
09:39
it's takingpasiimti bitsbitai and piecesvienetai
back togetherkartu again,
200
567560
2256
Žino, kaip priimti gerą sprendimą,
net kai informacija nepilna.
09:41
even when you have incompleteNebaigtas informationinformacija,
201
569840
2016
09:43
and comingartėja to a good conclusionišvadą,
202
571880
1576
09:45
especiallyypač if it's the brainsmegenys of an expertekspertas.
203
573480
2936
Ypač jei šios smegenys – eksperto.
09:48
And that's why I believe
that NetflixNetflix was so successfulsėkmingas,
204
576440
2656
Matyt, todėl „Netflix“ puikiai pavyko.
09:51
because they used dataduomenys and brainssmegenys
where they belongpriklausyti in the processprocesas.
205
579120
3576
Jie duomenis ir smegenis
panaudojo ten, kur reikia.
09:54
They use dataduomenys to first understandsuprasti
lots of piecesvienetai about their audienceauditorija
206
582720
3536
Iš pradžių per duomenis
susipažino su savo žiūrovais.
09:58
that they otherwisekitaip wouldn'tnebūtų have
been ablegalingas to understandsuprasti at that depthgylis,
207
586280
3416
Be duomenų ši pažintis
būtų buvusi paviršutiniška.
10:01
but then the decisionsprendimas
to take all these bitsbitai and piecesvienetai
208
589720
2616
Tačiau ne duomenys sudėjo viską į vieną
ir sukurė laidą „Kortų namelis“.
10:04
and put them back togetherkartu again
and make a showRodyti like "HouseNamas of CardsKortelės,"
209
592360
3336
10:07
that was nowhereniekur in the dataduomenys.
210
595720
1416
Tedas Sarandos ir jo komanda
priėmė sprendimą ją sukurti.
10:09
TedTED SarandosSarandos and his teamkomanda
madepagamintas that decisionsprendimas to licenselicencija that showRodyti,
211
597160
3976
10:13
whichkuris alsotaip pat meantsuprato, by the way,
that they were takingpasiimti
212
601160
2381
Beje, šiuo sprendimu jie labai rizikavo.
10:15
a prettygana bigdidelis personalasmeninis riskrizika
with that decisionsprendimas.
213
603565
2851
10:18
And AmazonAmazon, on the other handranka,
they did it the wrongneteisingai way around.
214
606440
3016
O „Amazon“ darė viską neteisingai,
nes naudojo duomenis visiems sprendimams.
10:21
They used dataduomenys all the way
to drivevairuoti their decision-makingsprendimų priėmimas,
215
609480
2736
Iš pradžių surengė tą TV laidų konkursą,
10:24
first when they heldsurengtas
their competitionkonkurencija of TVTV ideasidėjos,
216
612240
2416
o paskui būsimąja laida
išrinko „Alfa namelį“.
10:26
then when they selectedpasirinkta "AlphaAlfa HouseNamas"
to make as a showRodyti.
217
614680
3696
10:30
WhichKuri of coursežinoma was
a very safesaugus decisionsprendimas for them,
218
618400
2496
Aišku, jų sprendimas
buvo labai saugus.
10:32
because they could always
pointtaškas at the dataduomenys, sayingsakydamas,
219
620920
2456
Nori, gali durti pirštu į duomenis
ir sakyti: „Taip sako duomenys.“
10:35
"This is what the dataduomenys tellspasakoja us."
220
623400
1696
10:37
But it didn't leadvadovauti to the exceptionališskirtinis
resultsrezultatai that they were hopingtikiuosi for.
221
625120
4240
Tačiau duomenys iki rezultatų,
kurių jie norėjo, taip ir nenuvedė.
10:42
So dataduomenys is of coursežinoma a massivelymasiškai
usefulnaudinga toolįrankis to make better decisionssprendimai,
222
630120
4976
Tad duomenys yra nepaprastai svarbūs,
kad būtų priimtas geresnis sprendimas.
10:47
but I believe that things go wrongneteisingai
223
635120
2376
Tik tikiu, kad reikalai
pakrypsta ne į tą pusę,
10:49
when dataduomenys is startingpradedant
to drivevairuoti those decisionssprendimai.
224
637520
2576
kai duomenys veda prie sprendimų.
10:52
No matterklausimas how powerfulgalingas,
dataduomenys is just a toolįrankis,
225
640120
3776
Duomenys gali būti labai išsamūs,
bet jie tėra įrankis.
10:55
and to keep that in mindprotas,
I find this deviceprietaisas here quitegana usefulnaudinga.
226
643920
3336
Kad to nepamirščiau,
man padeda šis daikčiukas.
10:59
ManyDaug of you will ...
227
647280
1216
Daugelis iš jūsų...
11:00
(LaughterJuokas)
228
648520
1216
(Juokas.).
Kol nerinkome duomenų,
11:01
Before there was dataduomenys,
229
649760
1216
11:03
this was the decision-makingsprendimų priėmimas
deviceprietaisas to use.
230
651000
2856
priimdavome sprendimus,
naudodamiesi šiuo daikčiuku.
11:05
(LaughterJuokas)
231
653880
1256
(Juokas.).
11:07
ManyDaug of you will know this.
232
655160
1336
Daugeliui jis pažįstamas.
11:08
This toyžaislas here is calledvadinamas the MagicMagija 8 BallKamuolys,
233
656520
1953
Šis žaisliukas,„Magic 8 Ball“,
yra tikrai nuostabus.
11:10
and it's really amazingnuostabus,
234
658497
1199
Jei jums reikia priimti sprendimą
„taip“ ar „ne“,
11:11
because if you have a decisionsprendimas to make,
a yes or no questionklausimas,
235
659720
2896
pakratę šį rutulį, gausite atsakymą:
11:14
all you have to do is you shakesuplakti the ballkamuolys,
and then you get an answeratsakyti --
236
662640
3736
11:18
"MostDauguma LikelyTikėtina," -- right here
in this windowlangas in realrealus time.
237
666400
2816
„Tikriausiai“.
Nereikia net laukti.
11:21
I'll have it out latervėliau for techtech demosdemos.
238
669240
2096
Už užkulisių parodysiu, kaip jis veikia.
11:23
(LaughterJuokas)
239
671360
1216
(Juokas.).
11:24
Now, the thing is, of coursežinoma --
so I've madepagamintas some decisionssprendimai in my life
240
672600
3576
Žinoma, savo gyvenime
esu priėmęs sprendimų,
11:28
where, in hindsightdabar matyti,
I should have just listenedklausėsi to the ballkamuolys.
241
676200
2896
o po kiek laiko supratęs,
kad vertėjo paklausyti rutulio.
11:31
But, you know, of coursežinoma,
if you have the dataduomenys availableprieinama,
242
679120
3336
Aišku, turint duomenų,
11:34
you want to replacepakeisti this with something
much more sophisticatedrafinuotas,
243
682480
3056
norisi pakeisti šį rutulį
kažkuo daug įmantresniu,
11:37
like dataduomenys analysisanalizė
to come to a better decisionsprendimas.
244
685560
3616
pavyzdžiui, duomenų analize,
kad priimtum geresnį sprendimą.
11:41
But that does not changekeisti the basicpagrindinis setupsąranka.
245
689200
2616
Tačiau tai nekeičia esminio dalyko.
11:43
So the ballkamuolys mayGegužė get smarterprotingesnis
and smarterprotingesnis and smarterprotingesnis,
246
691840
3176
Rutulys gali įgauti vis daugiau proto,
11:47
but I believe it's still on us
to make the decisionssprendimai
247
695040
2816
bet turėtume sprendimus priiminėti patys,
11:49
if we want to achievepasiekti
something extraordinarynepaprastas,
248
697880
3016
kad pasiektume kažką tikrai nepaprasto
dešiniajame kreivės gale.
11:52
on the right endgalas of the curvekreivė.
249
700920
1936
11:54
And I find that a very encouragingskatinti
messagepranešimas, in factfaktas,
250
702880
4496
Mane labai nuramina mintis, tiesą sakant,
11:59
that even in the faceveidas
of hugedidelis amountssumos of dataduomenys,
251
707400
3976
kad net turint nepaprastą galybę duomenų,
12:03
it still paysmoka off to make decisionssprendimai,
252
711400
4096
apsimoka priimti sprendimus,
12:07
to be an expertekspertas in what you're doing
253
715520
2656
būti ekspertu savo srityje ir...
12:10
and take risksrizika.
254
718200
2096
rizikuoti.
12:12
Because in the endgalas, it's not dataduomenys,
255
720320
2776
Juk galų gale...
Ne duomenys, o rizikingi sprendimai
leis atsidurti dešiniajame kreivės gale.
12:15
it's risksrizika that will landžemė you
on the right endgalas of the curvekreivė.
256
723120
3960
12:19
Thank you.
257
727840
1216
Ačiū.
(Plojimai.).
12:21
(ApplausePlojimai)
258
729080
3680

▲Back to top

ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com