ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com
TEDxCambridge

Sebastian Wernicke: How to use data to make a hit TV show

Sebastian Wernicke: Como usar a análise de dados para criar um programa de TV de sucesso

Filmed:
1,628,704 views

Será que recolher mais informação leva a uma melhor tomada de decisões? Empresas competitivas e conhecedoras em análise de dados como a Amazon, a Google e a Netflix aprenderam que a análise de dados por si só nem sempre produz bons resultados. Nesta palestra, o cientista Sebastian Wernicke demonstra o que pode correr mal quando tomamos decisões baseadas apenas na análise de dados — e sugere uma forma mais cerebral de o fazer.
- Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects. Full bio

Double-click the English transcript below to play the video.

00:12
RoyRoy PricePreço is a man that mosta maioria of you
have probablyprovavelmente never heardouviu about,
0
820
4276
Roy Price é um homem do qual
provavelmente nunca ouviram falar,
00:17
even thoughApesar he maypode have been responsibleresponsável
1
5120
2496
ainda que ele tenha sido responsável
00:19
for 22 somewhatum pouco mediocremedíocre
minutesminutos of your life on AprilAbril 19, 2013.
2
7640
6896
por uns 22 minutos algo medíocres
da nossa vida, a 19 de Abril de 2013.
00:26
He maypode have alsoAlém disso been responsibleresponsável
for 22 very entertainingdivertido minutesminutos,
3
14560
3176
Pode ter sido também responsável
por 22 minutos muito agradáveis,
00:29
but not very manymuitos of you.
4
17760
2256
mas não para muitos de vocês.
00:32
And all of that goesvai back to a decisiondecisão
5
20040
1896
E tudo isso remonta a uma decisão
00:33
that RoyRoy had to make
about threetrês yearsanos agoatrás.
6
21960
2000
que Roy teve de fazer
há cerca de três anos.
00:35
So you see, RoyRoy PricePreço
is a seniorSenior executiveexecutivo with AmazonAmazônia StudiosEstúdios de.
7
23984
4832
Pois vejam, Roy Price
é um executivo sénior na Amazon Studios.
00:40
That's the TVTV productionProdução
companyempresa of AmazonAmazônia.
8
28840
3016
É a empresa de produção televisiva
da Amazon.
00:43
He's 47 yearsanos oldvelho, slimfino, spikyespetado haircabelo,
9
31880
3256
Tem 47 anos, é esbelto,
com o cabelo espetado,
00:47
describesdescreve himselfele mesmo on TwitterTwitter
as "moviesfilmes, TVTV, technologytecnologia, tacostacos de."
10
35160
4816
descreve-se no Twitter como
"filmes, TV, tecnologia, tacos."
00:52
And RoyRoy PricePreço has a very responsibleresponsável jobtrabalho,
because it's his responsibilityresponsabilidade
11
40000
5176
Roy Price tem um trabalho importante,
porque é da sua responsabilidade
escolher programas, o conteúdo original
que a Amazon vai fazer.
00:57
to pickescolher the showsmostra, the originaloriginal contentconteúdo
that AmazonAmazônia is going to make.
12
45200
4056
01:01
And of coursecurso that's
a highlyaltamente competitivecompetitivo spaceespaço.
13
49280
2336
Claro que esse é um espaço
muito competitivo.
01:03
I mean, there are so manymuitos
TVTV showsmostra already out there,
14
51640
2736
Quero dizer, há tantos
programas televisivos já lançados,
01:06
that RoyRoy can't just chooseescolher any showexposição.
15
54400
2176
que Roy não pode escolher
qualquer programa.
01:08
He has to find showsmostra
that are really, really great.
16
56600
4096
Tem que encontrar programas
que sejam mesmo, mesmo bons.
01:12
So in other wordspalavras, he has to find showsmostra
17
60720
2816
Por outras palavras,
tem que encontrar programas
01:15
that are on the very right endfim
of this curvecurva here.
18
63560
2376
que estejam do lado direito
desta curva aqui.
01:17
So this curvecurva here
is the ratingclassificação distributiondistribuição
19
65960
2656
Esta curva aqui
é a distribuição de avaliações
01:20
of about 2,500 TVTV showsmostra
on the websitelocal na rede Internet IMDBIMDB,
20
68640
4376
de cerca de 2500 programas de TV,
no site do IMDb.
01:25
and the ratingclassificação goesvai from one to 10,
21
73040
2896
Essas avaliações vão de 1 a 10.
01:27
and the heightaltura here showsmostra you
how manymuitos showsmostra get that ratingclassificação.
22
75960
2976
Esta altura aqui mostra quantos
programas obtêm essa avaliação.
01:30
So if your showexposição getsobtém a ratingclassificação
of ninenove pointspontos or highersuperior, that's a winnervencedora.
23
78960
4696
Se o programa tem uma avaliação
de 9 pontos ou superior, é um vencedor.
01:35
Then you have a toptopo two percentpor cento showexposição.
24
83680
1816
Assim temos 2% de programas de topo.
01:37
That's showsmostra like "BreakingQuebrando BadMau,"
"GameJogo of ThronesTronos," "The WireFio,"
25
85520
3896
São programas como o "Breaking Bad",
"Game of Thrones", "The Wire",
01:41
so all of these showsmostra that are addictiveviciante,
26
89440
2296
todos esses programas que são viciantes,
01:43
whereafterapós you've watchedassisti a seasonestação,
your braincérebro is basicallybasicamente like,
27
91760
3056
em que, depois de se ter visto uma série,
o cérebro fica assim como:
01:46
"Where can I get more of these episodesepisódios?"
28
94840
2176
"Onde posso obter mais
destes episódios?"
01:49
That kindtipo of showexposição.
29
97040
1200
Esse tipo de programas.
01:50
On the left sidelado, just for clarityclareza,
here on that endfim,
30
98920
2496
No lado esquerdo, só para clarificar,
tem-se, por outro lado,
01:53
you have a showexposição calledchamado
"ToddlersCrianças pequenas and TiarasTiaras de" --
31
101440
3176
um programa chamado
"Toddlers and Tiaras"...
01:56
(LaughterRiso)
32
104640
2656
(Risos)
01:59
-- whichqual should tell you enoughsuficiente
33
107320
1536
... que deve dizer o suficiente
02:00
about what's going on
on that endfim of the curvecurva.
34
108880
2191
sobre o que se passa neste lado da curva.
02:03
Now, RoyRoy PricePreço is not worriedpreocupado about
gettingobtendo on the left endfim of the curvecurva,
35
111095
4161
Agora, o Roy Price não está preocupado
em ficar do lado esquerdo da curva,
02:07
because I think you would have to have
some seriousgrave brainpowerrecursos intelectuais
36
115280
2936
porque acho que é preciso ter
um sério poder mental
02:10
to undercutuma subcotação "ToddlersCrianças pequenas and TiarasTiaras de."
37
118240
1696
para superar "Toddlers e Tiaras."
02:11
So what he's worriedpreocupado about
is this middlemeio bulgeprotuberância here,
38
119960
3936
Ele está preocupado
com esta parte aqui no meio,
02:15
the bulgeprotuberância of averagemédia TVTV,
39
123920
1816
a parte da TV mediana.
02:17
you know, those showsmostra
that aren'tnão são really good or really badmau,
40
125760
2856
Vocês sabem, aqueles programas
que são mais ou menos,
02:20
they don't really get you excitedanimado.
41
128639
1656
que não vos deixam entusiasmados.
02:22
So he needsprecisa to make sure
that he's really on the right endfim of this.
42
130320
4856
Ele tem que ter a certeza
que fica do lado direito da curva.
02:27
So the pressurepressão is on,
43
135200
1576
A pressão é máxima,
02:28
and of coursecurso it's alsoAlém disso the first time
44
136800
2176
e claro que é também a primeira vez
02:31
that AmazonAmazônia is even
doing something like this,
45
139000
2176
que a Amazon está a fazer algo assim,
02:33
so RoyRoy PricePreço does not want
to take any chanceschances.
46
141200
3336
por isso o Roy Price não quer arriscar.
02:36
He wants to engineerengenheiro successsucesso.
47
144560
2456
Ele quer fabricar um sucesso.
02:39
He needsprecisa a guaranteedGarantidas successsucesso,
48
147040
1776
Ele precisa de sucesso garantido.
02:40
and so what he does is,
he holdsdetém a competitionconcorrência.
49
148840
2576
Então o que ele faz é
lançar uma competição.
02:43
So he takes a bunchgrupo of ideasidéias for TVTV showsmostra,
50
151440
3136
Pega numa data de ideias
para programas de TV
02:46
and from those ideasidéias,
throughatravés an evaluationavaliação,
51
154600
2296
e a partir dessas ideias,
através de uma avaliação,
02:48
they selectselecione eightoito candidatescandidatos for TVTV showsmostra,
52
156920
4096
selecionam 8 candidatos
para programas de TV.
02:53
and then he just makesfaz com que the first episodeEpisódio
of eachcada one of these showsmostra
53
161040
3216
Depois faz só o 1º episódio
de cada um desses programas
02:56
and putscoloca them onlineconectados for freelivre
for everyonetodos to watch.
54
164280
3136
e põe-nos "online" grátis,
para toda a gente ver.
02:59
And so when AmazonAmazônia
is givingdando out freelivre stuffcoisa,
55
167440
2256
E quando a Amazon dá coisas grátis,
03:01
you're going to take it, right?
56
169720
1536
toda a gente a vai ver, não é?
03:03
So millionsmilhões of viewersespectadores
are watchingassistindo those episodesepisódios.
57
171280
5136
Há milhões de telespectadores
a ver esses episódios.
03:08
What they don't realizeperceber is that,
while they're watchingassistindo theirdeles showsmostra,
58
176440
3216
O que eles não se apercebem é que,
enquanto estão a ver o programa,
03:11
actuallyna realidade, they are beingser watchedassisti.
59
179680
2296
estão ser observados.
03:14
They are beingser watchedassisti
by RoyRoy PricePreço and his teamequipe,
60
182000
2336
Estão a ser observados
pelo Roy Price e pela sua equipa
03:16
who recordregistro everything.
61
184360
1376
que gravam tudo.
03:17
They recordregistro when somebodyalguém pressesPrensas playToque,
when somebodyalguém pressesPrensas pausepausa,
62
185760
3376
Gravam quando alguém pressiona "Play",
quando alguém pressiona "Pausa",
03:21
what partspartes they skippular,
what partspartes they watch again.
63
189160
2536
que partes passam à frente,
que partes vêem de novo.
03:23
So they collectrecolher millionsmilhões of datadados pointspontos,
64
191720
2256
Recolhem milhares de dados,
03:26
because they want
to have those datadados pointspontos
65
194000
2096
porque querem ter essa informação
03:28
to then decidedecidir
whichqual showexposição they should make.
66
196120
2696
para depois decidir
que programa devem fazer.
03:30
And sure enoughsuficiente,
so they collectrecolher all the datadados,
67
198840
2176
E claro, recolhem toda a informação,
03:33
they do all the datadados crunchingtriturando,
and an answerresponda emergesemerge,
68
201040
2576
analisam-na, e a resposta surge.
03:35
and the answerresponda is,
69
203640
1216
E a resposta é:
03:36
"AmazonAmazônia should do a sitcomseriado
about fourquatro RepublicanRepublicano US SenatorsSenadores."
70
204880
5536
"A Amazon devia fazer uma comédia
sobre 4 senadores Republicanos dos EUA."
(Risos)
03:42
They did that showexposição.
71
210440
1216
Fizeram esse programa.
03:43
So does anyonealguém know the namenome of the showexposição?
72
211680
2160
Então? Alguém sabe o nome desse programa?
Audiência: "Alpha House."
03:46
(AudienceAudiência: "AlphaAlfa HouseCasa.")
73
214720
1296
03:48
Yes, "AlphaAlfa HouseCasa,"
74
216040
1456
Sim, "Alpha House,"
03:49
but it seemsparece like not too manymuitos of you here
rememberlembrar that showexposição, actuallyna realidade,
75
217520
4096
mas parece que poucos aqui
se lembram desse programa,
03:53
because it didn't turnvirar out that great.
76
221640
1856
porque não ficou assim tão bom.
03:55
It's actuallyna realidade just an averagemédia showexposição,
77
223520
1856
Na verdade, é só um programa mediano,
03:57
actuallyna realidade -- literallyliteralmente, in factfacto, because
the averagemédia of this curvecurva here is at 7.4,
78
225400
4576
literalmente, de facto,
porque a média da curva está em 7,4
04:02
and "AlphaAlfa HouseCasa" landsterras at 7.5,
79
230000
2416
e "Alpha House" tem 7,5.
04:04
so a slightlylevemente aboveacima averagemédia showexposição,
80
232440
2016
Portanto, está ligeiramente acima da média,
04:06
but certainlyCertamente not what RoyRoy PricePreço
and his teamequipe were aimingcom o objetivo for.
81
234480
2920
mas certamente não é o que Roy Price
e a sua equipa queriam atingir.
04:10
MeanwhileEnquanto isso, howeverContudo,
at about the samemesmo time,
82
238320
2856
Mas, entretanto,
por volta da mesma altura,
04:13
at anotheroutro companyempresa,
83
241200
1576
numa outra empresa
04:14
anotheroutro executiveexecutivo did managegerir
to landterra a toptopo showexposição usingusando datadados analysisanálise,
84
242800
4216
outro executivo produziu um programa
do topo, usando análise de dados.
04:19
and his namenome is TedTed,
85
247040
1576
Chama-se Ted, Ted Sarandos,
04:20
TedTed SarandosSarandos, who is
the ChiefChefe ContentConteúdo OfficerOficial of NetflixNetflix,
86
248640
3416
é o diretor de Conteúdos da Netflix.
04:24
and just like RoyRoy,
he's on a constantconstante missionmissão
87
252080
2136
Tal como o Roy,
ele está numa missão constante
04:26
to find that great TVTV showexposição,
88
254240
1496
para encontrar um programa de topo
04:27
and he usesusa datadados as well to do that,
89
255760
2016
e também usa dados para fazer isso,
04:29
exceptexceto he does it
a little bitpouco differentlydiferente.
90
257800
2015
excepto que o faz de forma
um pouco diferente.
04:31
So insteadem vez de of holdingsegurando a competitionconcorrência,
what he did -- and his teamequipe of coursecurso --
91
259839
3737
Em vez de lançar uma competição,
ele e a sua equipa
olharam para todos os dados que tinham
sobre os telespectadores da Netflix,
04:35
was they lookedolhou at all the datadados
they already had about NetflixNetflix viewersespectadores,
92
263600
3536
04:39
you know, the ratingsclassificações
they give theirdeles showsmostra,
93
267160
2096
as avaliações que dão aos programas,
04:41
the viewingvisualizando historieshistórias,
what showsmostra people like, and so on.
94
269280
2696
o historial de visualizações,
o que gostam, etc.
04:44
And then they use that datadados to discoverdescobrir
95
272000
1896
Depois usaram esses dados
para descobrir
04:45
all of these little bitsbits and piecespeças
about the audiencepúblico:
96
273920
2616
toda a informação e mais alguma
sobre a audiência:
04:48
what kindstipos of showsmostra they like,
97
276560
1456
que tipos de programas gostam,
04:50
what kindtipo of producersprodutores,
what kindtipo of actorsatores.
98
278040
2096
que tipo de produtores,
que tipo de actores.
04:52
And onceuma vez they had
all of these piecespeças togetherjuntos,
99
280160
2576
Depois de terem
toda essa informação junta,
04:54
they tooktomou a leapsalto of faith,
100
282760
1656
num acto de fé,
04:56
and they decideddecidiu to licenselicença
101
284440
2096
decidiram licenciar,
04:58
not a sitcomseriado about fourquatro SenatorsSenadores
102
286560
2456
não uma comédia sobre quatro senadores
05:01
but a dramadrama seriesSeries about a singlesolteiro SenatorSenador.
103
289040
2880
mas uma série dramática sobre
um único senador.
05:04
You guys know the showexposição?
104
292760
1656
Vocês conhecem o programa?
05:06
(LaughterRiso)
105
294440
1296
(Risos)
05:07
Yes, "HouseCasa of CardsCartões de," and NetflixNetflix
of coursecurso, nailedpregado it with that showexposição,
106
295760
3736
Sim, "House of Cards", e a Netflix claro,
acertou em cheio com esse programa,
05:11
at leastpelo menos for the first two seasonsestações do ano.
107
299520
2136
pelos menos nas primeiras duas temporadas.
05:13
(LaughterRiso) (ApplauseAplausos)
108
301680
3976
(Risos)
(Aplausos)
05:17
"HouseCasa of CardsCartões de" getsobtém
a 9.1 ratingclassificação on this curvecurva,
109
305680
3176
"House of Cards" tem uma avaliação
de 9,1 nesta curva.
05:20
so it's exactlyexatamente
where they wanted it to be.
110
308880
3176
Exactamente onde queriam
que estivesse.
05:24
Now, the questionquestão of coursecurso is,
what happenedaconteceu here?
111
312080
2416
Agora, a pergunta é:
"O que aconteceu aqui?"
05:26
So you have two very competitivecompetitivo,
data-savvydados-esclarecido companiesempresas.
112
314520
2656
Temos duas empresas muito competitivas
que usam análise de dados.
05:29
They connectconectar all of these
millionsmilhões of datadados pointspontos,
113
317200
2856
Relacionam estes milhões
de pontos de informação,
05:32
and then it workstrabalho
beautifullybelas for one of them,
114
320080
2376
mas depois funciona lindamente
para um deles,
05:34
and it doesn't work for the other one.
115
322480
1856
e não funciona para outro.
05:36
So why?
116
324360
1216
Então porquê?
05:37
Because logiclógica kindtipo of tellsconta you
that this should be workingtrabalhando all the time.
117
325600
3456
Porque a lógica diz
que isto devia resultar todas as vezes.
05:41
I mean, if you're collectingcoletando
millionsmilhões of datadados pointspontos
118
329080
2456
Quero dizer, se estamos a recolher
milhares de dados
05:43
on a decisiondecisão you're going to make,
119
331560
1736
para tomar uma decisão
05:45
then you should be ablecapaz
to make a prettybonita good decisiondecisão.
120
333320
2616
então devíamos conseguir
tomar uma boa decisão.
Temos 200 anos de estatísticas
com que podemos contar.
05:47
You have 200 yearsanos
of statisticsEstatisticas to relycontar com on.
121
335960
2216
05:50
You're amplifyingamplificando it
with very powerfulpoderoso computerscomputadores.
122
338200
3016
Estamos a amplificá-la
com computadores muito potentes.
05:53
The leastpelo menos you could expectEspero
is good TVTV, right?
123
341240
3280
O mínimo que podíamos esperar
é boa televisão, ou não é?
05:57
And if datadados analysisanálise
does not work that way,
124
345880
2720
Se a análise de dados não funciona
dessa maneira,
06:01
then it actuallyna realidade getsobtém a little scaryassustador,
125
349520
2056
então torna-se assustador,
06:03
because we liveviver in a time
where we're turninggiro to datadados more and more
126
351600
3816
porque vivemos numa época
em que dependemos cada vez mais de dados
06:07
to make very seriousgrave decisionsdecisões
that go farlonge beyondalém TVTV.
127
355440
4480
para tomar decisões sérias
que vão para além da televisão.
06:12
Does anyonealguém here know the companyempresa
Multi-HealthMulti saúde SystemsSistemas de?
128
360760
3240
Alguém aqui conhece a empresa
Multi-Health Systems?
06:17
No one. OK, that's good actuallyna realidade.
129
365080
1656
Ninguém. OK, isso é certamente bom.
06:18
OK, so Multi-HealthMulti saúde SystemsSistemas de
is a softwareProgramas companyempresa,
130
366760
3216
A Multi-Health systems
é uma empresa de "software",
06:22
and I hopeesperança that nobodyninguém here in this roomquarto
131
370000
2816
e espero que ninguém aqui nesta sala
06:24
ever comesvem into contactcontato
with that softwareProgramas,
132
372840
3176
venha a estar em contacto
com esse "software",
06:28
because if you do,
it meanssignifica you're in prisonprisão.
133
376040
2096
porque, se estiver,
significa que está preso.
06:30
(LaughterRiso)
134
378160
1176
(Risos)
06:31
If someonealguém here in the US is in prisonprisão,
and they applyAplique for paroleliberdade condicional,
135
379360
3536
Se alguém aqui nos EUA está na prisão,
e pretende a liberdade condicional
06:34
then it's very likelyprovável that
datadados analysisanálise softwareProgramas from that companyempresa
136
382920
4296
é muito provável que o "software"
de análise de dados dessa empresa
06:39
will be used in determiningdeterminando
whetherse to grantconceder that paroleliberdade condicional.
137
387240
3616
seja usado para determinar
se essa proposta é ou não aceite.
06:42
So it's the samemesmo principleprincípio
as AmazonAmazônia and NetflixNetflix,
138
390880
2576
É o mesmo principio
que a Amazon e a Netflix utilizam,
06:45
but now insteadem vez de of decidingdecidindo whetherse
a TVTV showexposição is going to be good or badmau,
139
393480
4616
mas agora em vez de decidir
se um programa vai ser bom ou mau,
06:50
you're decidingdecidindo whetherse a personpessoa
is going to be good or badmau.
140
398120
2896
vai-se decidir se uma pessoa
vai ser boa ou má.
06:53
And mediocremedíocre TVTV, 22 minutesminutos,
that can be prettybonita badmau,
141
401040
5496
Uma TV medíocre, 22 minutos,
pode ser muito mau,
06:58
but more yearsanos in prisonprisão,
I guessacho, even worsepior.
142
406560
2640
mas mais anos na prisão,
acho eu, é ainda pior.
07:02
And unfortunatelyinfelizmente, there is actuallyna realidade
some evidenceevidência that this datadados analysisanálise,
143
410360
4136
Infelizmente, há algumas provas
de que a análise de dados,
07:06
despiteapesar de havingtendo lots of datadados,
does not always produceproduzir optimumotimizado resultsresultados.
144
414520
4216
apesar da enormidade de dados,
nem sempre produz óptimos resultados.
07:10
And that's not because a companyempresa
like Multi-HealthMulti saúde SystemsSistemas de
145
418760
2722
E não é porque uma empresa
como a Multi-Health Systems.
não saiba o que fazer com os dados.
07:13
doesn't know what to do with datadados.
146
421506
1627
07:15
Even the mosta maioria data-savvydados-esclarecido
companiesempresas get it wrongerrado.
147
423158
2298
Até as empresas mais conhecedoras
na área falham.
07:17
Yes, even GoogleGoogle getsobtém it wrongerrado sometimesas vezes.
148
425480
2400
Sim, até a Google erra às vezes.
07:20
In 2009, GoogleGoogle announcedanunciado
that they were ablecapaz, with datadados analysisanálise,
149
428680
4496
Em 2009, a Google anunciou
que conseguia, com a análise de dados,
07:25
to predictprever outbreakssurtos of influenzagripe,
the nastydesagradável kindtipo of flugripe,
150
433200
4136
prever surtos de gripe da pior espécie,
07:29
by doing datadados analysisanálise
on theirdeles GoogleGoogle searchespesquisas.
151
437360
3776
fazendo análise de dados
nas pesquisas da Google.
07:33
And it workedtrabalhou beautifullybelas,
and it madefeito a biggrande splashsplash in the newsnotícia,
152
441160
3856
E funcionou lindamente,
fazendo grande sensação nas notícias,
07:37
includingIncluindo the pinnaclepináculo
of scientificcientífico successsucesso:
153
445040
2136
incluindo o pináculo
do sucesso científico:
07:39
a publicationpublicação in the journalDiário "NatureNatureza."
154
447200
2456
uma publicação na revista "Nature".
07:41
It workedtrabalhou beautifullybelas
for yearano after yearano after yearano,
155
449680
3616
Funcionou óptimamente,
ano após ano após ano,
07:45
untilaté one yearano it failedfalhou.
156
453320
1656
até que um dia falhou.
07:47
And nobodyninguém could even tell exactlyexatamente why.
157
455000
2256
Ninguém conseguiu dizer
exactamente porquê.
Simplesmente não funcionou nesse ano.
07:49
It just didn't work that yearano,
158
457280
1696
07:51
and of coursecurso that again madefeito biggrande newsnotícia,
159
459000
1936
Claro que isso também
foi uma grande notícia,
07:52
includingIncluindo now a retractionretração
160
460960
1616
incluindo agora uma retratação
07:54
of a publicationpublicação
from the journalDiário "NatureNatureza."
161
462600
2840
de uma publicação
da revista "Nature".
07:58
So even the mosta maioria data-savvydados-esclarecido companiesempresas,
AmazonAmazônia and GoogleGoogle,
162
466480
3336
Então, até as empresas mais conhecedoras,
como a Amazon e a Google,
08:01
they sometimesas vezes get it wrongerrado.
163
469840
2136
às vezes erram.
08:04
And despiteapesar de all those failuresfalhas,
164
472000
2936
Apesar de todos esses falhanços,
08:06
datadados is movingmovendo-se rapidlyrapidamente
into real-lifevida real decision-makingtomando uma decisão --
165
474960
3856
os dados intervêm cada vez mais
em decisões da vida real
08:10
into the workplaceambiente de trabalho,
166
478840
1816
— no espaço de trabalho,
08:12
lawlei enforcementexecução,
167
480680
1816
no cumprimento da lei,
08:14
medicineremédio.
168
482520
1200
na medicina.
08:16
So we should better make sure
that datadados is helpingajudando.
169
484400
3336
Então devíamos ter a certeza
de que os dados estão a ajudar.
08:19
Now, personallypessoalmente I've seenvisto
a lot of this struggleluta with datadados myselfEu mesmo,
170
487760
3136
Agora, pessoalmente, já vi
muita desta luta com dados,
08:22
because I work in computationalcomputacional geneticsgenética,
171
490920
1976
porque trabalho com genética
computacional,
que é também um campo
onde muita gente inteligente
08:24
whichqual is alsoAlém disso a fieldcampo
where lots of very smartinteligente people
172
492920
2496
08:27
are usingusando unimaginableinimaginável amountsvalores of datadados
to make prettybonita seriousgrave decisionsdecisões
173
495440
3656
usa quantidades de dados inimagináveis
para tomar decisões importantes,
08:31
like decidingdecidindo on a cancerCâncer therapyterapia
or developingem desenvolvimento a drugdroga.
174
499120
3560
como decidir uma terapia de cancro
ou desenvolver uma droga.
08:35
And over the yearsanos,
I've noticednotado a sortordenar of patternpadronizar
175
503520
2376
Ao longo dos anos,
notei um tipo de padrão
08:37
or kindtipo of ruleregra, if you will,
about the differencediferença
176
505920
2456
ou uma regra, se quiserem,
sobre a diferença
08:40
betweenentre successfulbem sucedido
decision-makingtomando uma decisão with datadados
177
508400
2696
entre tomadas de decisão
bem sucedidas com dados
08:43
and unsuccessfulsem sucesso decision-makingtomando uma decisão,
178
511120
1616
e tomadas de decisão mal-sucedidas.
08:44
and I find this a patternpadronizar worthque vale a pena sharingcompartilhando,
and it goesvai something like this.
179
512760
3880
Acho que é um padrão que devo partilhar,
e é mais ou menos assim.
08:50
So wheneversempre que you're
solvingresolvendo a complexcomplexo problemproblema,
180
518520
2135
Sempre que se resolve um problema complexo
08:52
you're doing essentiallyessencialmente two things.
181
520679
1737
fazem-se basicamente duas coisas.
08:54
The first one is, you take that problemproblema
apartseparados into its bitsbits and piecespeças
182
522440
3296
A primeira é dividir esse problema
em várias partes
08:57
so that you can deeplyprofundamente analyzeanalisar
those bitsbits and piecespeças,
183
525760
2496
para que se possa analisar
cada parte em separado.
09:00
and then of coursecurso
you do the secondsegundo partparte.
184
528280
2016
Depois, claro, faz-se a segunda parte.
09:02
You put all of these bitsbits and piecespeças
back togetherjuntos again
185
530320
2656
Juntam-se todas essas partes de novo
09:05
to come to your conclusionconclusão.
186
533000
1336
para chegar a uma conclusão.
09:06
And sometimesas vezes you
have to do it over again,
187
534360
2336
Às vezes é preciso fazer tudo de novo,
09:08
but it's always those two things:
188
536720
1656
mas são sempre essas duas coisas:
09:10
takinglevando apartseparados and puttingcolocando
back togetherjuntos again.
189
538400
2320
Dividir e voltar a juntar de novo.
09:14
And now the crucialcrucial thing is
190
542280
1616
Agora a parte crucial é
09:15
that datadados and datadados analysisanálise
191
543920
2896
que esses dados e a análise de dados
09:18
is only good for the first partparte.
192
546840
2496
servem apenas para a primeira parte.
09:21
DataDados and datadados analysisanálise,
no matterimportam how powerfulpoderoso,
193
549360
2216
Os dados e análise de dados,
por mais poderosos que sejam,
09:23
can only help you takinglevando a problemproblema apartseparados
and understandingcompreensão its piecespeças.
194
551600
4456
só ajudam a dividir o problema
e a compreender as suas partes.
09:28
It's not suitedadequado to put those piecespeças
back togetherjuntos again
195
556080
3496
Não é adequado para voltar a juntar
essas partes de novo
09:31
and then to come to a conclusionconclusão.
196
559600
1896
e depois chegar a uma conclusão.
09:33
There's anotheroutro toolferramenta that can do that,
and we all have it,
197
561520
2736
Há outra ferramenta que faz isso,
e todos a temos.
09:36
and that toolferramenta is the braincérebro.
198
564280
1296
Essa ferramenta é o cérebro.
09:37
If there's one thing a braincérebro is good at,
199
565600
1936
Se há uma coisa em que o cérebro é bom
09:39
it's takinglevando bitsbits and piecespeças
back togetherjuntos again,
200
567560
2256
é em pegar em pedaços
de informação e juntá-los
09:41
even when you have incompleteincompleto informationem formação,
201
569840
2016
mesmo quando a informação é incompleta,
09:43
and comingchegando to a good conclusionconclusão,
202
571880
1576
e chegar a uma boa conclusão,
09:45
especiallyespecialmente if it's the braincérebro of an expertespecialista.
203
573480
2936
especialmente se for o cérebro
de um especialista.
09:48
And that's why I believe
that NetflixNetflix was so successfulbem sucedido,
204
576440
2656
É por isso que acredito
que a Netflix teve tanto sucesso,
09:51
because they used datadados and brainscérebro
where they belongpertencer in the processprocesso.
205
579120
3576
porque usaram dados e cérebros
onde devido, durante o processo.
09:54
They use datadados to first understandCompreendo
lots of piecespeças about theirdeles audiencepúblico
206
582720
3536
Utilizaram dados para perceber
informações sobre a audiência
09:58
that they otherwisede outra forma wouldn'tnão seria have
been ablecapaz to understandCompreendo at that depthprofundidade,
207
586280
3416
que, de outra maneira, não conseguiriam
perceber àquele nível.
10:01
but then the decisiondecisão
to take all these bitsbits and piecespeças
208
589720
2616
Mas a decisão de pegar
em todas essas informações
10:04
and put them back togetherjuntos again
and make a showexposição like "HouseCasa of CardsCartões de,"
209
592360
3336
e juntá-las de novo, para fazer
uma série como a "House of Cards,"
10:07
that was nowherelugar algum in the datadados.
210
595720
1416
isso não estava nos dados.
10:09
TedTed SarandosSarandos and his teamequipe
madefeito that decisiondecisão to licenselicença that showexposição,
211
597160
3976
Ted Sarandos e a sua equipa
tomaram a decisão de licenciar a série,
10:13
whichqual alsoAlém disso meantsignificava, by the way,
that they were takinglevando
212
601160
2381
o que também significou,
que eles estavam a correr
10:15
a prettybonita biggrande personalpessoal riskrisco
with that decisiondecisão.
213
603565
2851
um grande risco pessoal
com essa decisão.
10:18
And AmazonAmazônia, on the other handmão,
they did it the wrongerrado way around.
214
606440
3016
A Amazon, por outro lado, fez o oposto.
10:21
They used datadados all the way
to drivedirigir theirdeles decision-makingtomando uma decisão,
215
609480
2736
Usaram os dados para guiar
a sua tomada de decisão,
10:24
first when they heldmantido
theirdeles competitionconcorrência of TVTV ideasidéias,
216
612240
2416
primeiro quando lançaram
a competição de ideias de TV,
10:26
then when they selectedselecionado "AlphaAlfa HouseCasa"
to make as a showexposição.
217
614680
3696
depois quanto escolheram
"Alpha House" como série.
10:30
WhichQue of coursecurso was
a very safeseguro decisiondecisão for them,
218
618400
2496
Claro que foi uma decisão
muito segura para eles,
10:32
because they could always
pointponto at the datadados, sayingdizendo,
219
620920
2456
porque podiam sempre
apontar para os dados e dizer:
10:35
"This is what the datadados tellsconta us."
220
623400
1696
"Isto é o que os dados nos dizem."
10:37
But it didn't leadconduzir to the exceptionalexcepcional
resultsresultados that they were hopingna esperança for.
221
625120
4240
Mas não os levou aos resultados
excepcionais que eles estavam à espera.
10:42
So datadados is of coursecurso a massivelymaciçamente
usefulútil toolferramenta to make better decisionsdecisões,
222
630120
4976
Claro que os dados são uma ferramenta
muito útil para tomar melhores decisões,
10:47
but I believe that things go wrongerrado
223
635120
2376
mas acredito que as coisas
dão para o torto
10:49
when datadados is startinginiciando
to drivedirigir those decisionsdecisões.
224
637520
2576
quando os dados começam
a guiar tais decisões.
10:52
No matterimportam how powerfulpoderoso,
datadados is just a toolferramenta,
225
640120
3776
Não interessa quão poderosos possam
ser os dados, são só uma ferramenta.
10:55
and to keep that in mindmente,
I find this devicedispositivo here quitebastante usefulútil.
226
643920
3336
Para manter isso presente,
acho este aparelho aqui muito útil.
10:59
ManyMuitos of you will ...
227
647280
1216
Muitos de vocês vão...
11:00
(LaughterRiso)
228
648520
1216
(Risos)
11:01
Before there was datadados,
229
649760
1216
Antes de haver dados,
11:03
this was the decision-makingtomando uma decisão
devicedispositivo to use.
230
651000
2856
este era o aparelho
de tomada de decisões que se usava.
11:05
(LaughterRiso)
231
653880
1256
(Risos)
11:07
ManyMuitos of you will know this.
232
655160
1336
Devem conhecer isto.
Este brinquedo chama-se "Magic 8 Ball",
11:08
This toybrinquedo here is calledchamado the MagicMagia 8 BallBola,
233
656520
1953
11:10
and it's really amazingsurpreendente,
234
658497
1199
E é realmente incrível,
11:11
because if you have a decisiondecisão to make,
a yes or no questionquestão,
235
659720
2896
Porque, se tivermos uma decisão a tomar,
uma questão de sim/não,
11:14
all you have to do is you shakemexe the ballbola,
and then you get an answerresponda --
236
662640
3736
basta abanarmos a bola,
e recebemos uma resposta.
11:18
"MostMaioria LikelyProvável" -- right here
in this windowjanela in realreal time.
237
666400
2816
"Muito provavelmente"
— aqui nesta janela, em tempo real.
11:21
I'll have it out latermais tarde for techtecnologia demosdemos.
238
669240
2096
Vou deixá-la por aí para uma "tech demo".
11:23
(LaughterRiso)
239
671360
1216
11:24
Now, the thing is, of coursecurso --
so I've madefeito some decisionsdecisões in my life
240
672600
3576
Agora, eu tomei algumas decisões
na minha vida
11:28
where, in hindsightVisão Retrospectiva,
I should have just listenedOuvido to the ballbola.
241
676200
2896
em que, em retrospectiva,
eu devia ter dado ouvidos à bola.
11:31
But, you know, of coursecurso,
if you have the datadados availableacessível,
242
679120
3336
Mas, claro,
se temos dados disponíveis,
11:34
you want to replacesubstituir this with something
much more sophisticatedsofisticado,
243
682480
3056
queremos substituir a bola
por algo mais sofisticado,
11:37
like datadados analysisanálise
to come to a better decisiondecisão.
244
685560
3616
como a análise de dados,
para tomar uma decisão melhor.
11:41
But that does not changemudança the basicbásico setupinstalação.
245
689200
2616
Mas tal não altera a configuração base.
11:43
So the ballbola maypode get smartermais esperto
and smartermais esperto and smartermais esperto,
246
691840
3176
A bola pode ficar
cada vez mais inteligente
11:47
but I believe it's still on us
to make the decisionsdecisões
247
695040
2816
mas eu acredito que somos nós
que temos que tomar decisões,
11:49
if we want to achievealcançar
something extraordinaryextraordinário,
248
697880
3016
se queremos alcançar
algo extraordinário,
11:52
on the right endfim of the curvecurva.
249
700920
1936
no lado direito da curva.
11:54
And I find that a very encouragingencorajando
messagemensagem, in factfacto,
250
702880
4496
Acho que uma mensagem muito encorajadora
11:59
that even in the facecara
of hugeenorme amountsvalores of datadados,
251
707400
3976
é que, mesmo perante imensa informação,
12:03
it still payspaga off to make decisionsdecisões,
252
711400
4096
ainda compensa tomar decisões,
12:07
to be an expertespecialista in what you're doing
253
715520
2656
ser um especialista no que fazemos
12:10
and take risksriscos.
254
718200
2096
e correr riscos.
12:12
Because in the endfim, it's not datadados,
255
720320
2776
Porque, afinal, não são os dados,
12:15
it's risksriscos that will landterra you
on the right endfim of the curvecurva.
256
723120
3960
são os riscos que nos possibilitam
estar no lado direito da curva.
12:19
Thank you.
257
727840
1216
Obrigado.
12:21
(ApplauseAplausos)
258
729080
3680
(Aplausos)
Translated by Joel Santos
Reviewed by Margarida Ferreira

▲Back to top

ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com