ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com
TED2015

Fei-Fei Li: How we're teaching computers to understand pictures

Fei-Fei Li: Como estamos a ensinar os computadores a entender imagens

Filmed:
2,702,344 views

Quando uma criança muito pequena olha para uma imagem, consegue identificar elementos simples: "gato", "livro", "cadeira". Os computadores estão a ficar suficientemente inteligentes para também fazerem isso. O que é que há de novo? Numa palestra emocionante, Fei-Fei Li, especialista de visão de computadores, descreve a última geração — incluindo a base de dados de 15 milhões de fotos que a sua equipa criou para "ensinar" um computador a entender imagens — e as perceções fundamentais que ainda pertencem ao futuro.
- Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio

Double-click the English transcript below to play the video.

00:14
Let me showexposição you something.
0
2366
3738
Vou mostrar-vos uma coisa.
00:18
(VideoVídeo) GirlMenina: Okay, that's a catgato
sittingsentado in a bedcama.
1
6104
4156
(Vídeo) Menina: Isto é um gato
sentado numa cama.
00:22
The boyGaroto is pettingacariciando the elephantelefante.
2
10260
4040
O rapaz está a fazer festas ao elefante.
00:26
Those are people
that are going on an airplaneavião.
3
14300
4354
Isso são pessoas a ir para um avião.
00:30
That's a biggrande airplaneavião.
4
18654
2810
É um grande avião.
00:33
Fei-FeiFei-Fei LiLi: This is
a three-year-oldtrês anos de idade childcriança
5
21464
2206
Fei-Fei Li: Esta é uma criança de 3 anos
00:35
describingdescrevendo what she sees
in a seriesSeries of photosfotos.
6
23670
3679
a descrever o que vê num
conjunto de fotografias.
00:39
She mightpoderia still have a lot
to learnaprender about this worldmundo,
7
27349
2845
Ela poderá ter ainda muito
para aprender neste mundo,
00:42
but she's already an expertespecialista
at one very importantimportante tasktarefa:
8
30194
4549
mas já é especialista
numa tarefa muito importante:
00:46
to make sensesentido of what she sees.
9
34743
2846
dar sentido ao que vê.
00:50
Our societysociedade is more
technologicallytecnologicamente advancedavançado than ever.
10
38229
4226
A nossa sociedade
está mais avançada do que nunca.
00:54
We sendenviar people to the moonlua,
we make phonestelefones that talk to us
11
42455
3629
Enviamos pessoas para a lua,
fazemos telefones que falam connosco
00:58
or customizecustomizar radiorádio stationsestações
that can playToque only musicmúsica we like.
12
46084
4946
ou personalizamos estações de rádio
que apenas tocam música de que gostamos.
01:03
YetAinda, our mosta maioria advancedavançado
machinesmáquinas and computerscomputadores
13
51030
4055
No entanto, as nossas máquinas
e computadores mais avançados
01:07
still struggleluta at this tasktarefa.
14
55085
2903
ainda têm dificuldade
em realizar esta tarefa.
01:09
So I'm here todayhoje
to give you a progressprogresso reportrelatório
15
57988
3459
Por isso estou aqui hoje,
para vos dar um relato
01:13
on the latestMais recentes advancesavanços
in our researchpesquisa in computercomputador visionvisão,
16
61447
4047
sobre os últimos avanços do nosso trabalho
em visão computacional,
01:17
one of the mosta maioria frontierfronteira
and potentiallypotencialmente revolutionaryrevolucionário
17
65494
4161
uma das tecnologias mais inovadoras
e potencialmente mais revolucionárias
01:21
technologiestecnologias in computercomputador scienceCiência.
18
69655
3206
da ciência informática.
01:24
Yes, we have prototypedcom protótipo carscarros
that can drivedirigir by themselvessi mesmos,
19
72861
4551
É verdade que já temos protótipos
de carros que conduzem sozinhos,
01:29
but withoutsem smartinteligente visionvisão,
they cannotnão podes really tell the differencediferença
20
77412
3853
mas sem visão inteligente,
eles não conseguem distinguir
01:33
betweenentre a crumpledamassado paperpapel bagBolsa
on the roadestrada, whichqual can be runcorre over,
21
81265
3970
entre um saco de papel amarrotado,
que o carro pode atropelar,
01:37
and a rockRocha that sizeTamanho,
whichqual should be avoidedevitou.
22
85235
3340
e uma pedra do mesmo tamanho,
que deve ser evitada.
01:41
We have madefeito fabulousfabuloso megapixelmegapixel camerascâmeras,
23
89415
3390
Criámos fabulosas câmaras de megapixéis,
01:44
but we have not deliveredentregue
sightvista to the blindcego.
24
92805
3135
mas não conseguimos devolver
a visão a pessoas cegas.
01:48
DronesZangões can flymosca over massivemaciço landterra,
25
96420
3305
Os drones conseguem voar
sobre uma área extensa de terra,
01:51
but don't have enoughsuficiente visionvisão technologytecnologia
26
99725
2134
mas não têm a tecnologia
de visualização
01:53
to help us to trackpista
the changesalterar of the rainforestsflorestas tropicais.
27
101859
3461
necessária para detetar
alterações nas florestas tropicais
01:57
SecuritySegurança camerascâmeras are everywhereem toda parte,
28
105320
2950
Temos câmaras de segurança
por todo o lado,
02:00
but they do not alertalerta us when a childcriança
is drowningse afogando in a swimmingnatação poolpiscina.
29
108270
5067
mas elas não nos alertam quando uma
criança se está a afogar numa piscina.
02:06
PhotosFotos and videosvídeos are becomingtornando-se
an integralintegral partparte of globalglobal life.
30
114167
5595
As fotografias e os vídeos
estão a tornar-se
parte integrante da vida em todo o mundo.
02:11
They're beingser generatedgerado at a paceritmo
that's farlonge beyondalém what any humanhumano,
31
119762
4087
São gerados a um ritmo muito mais rápido
do que qualquer ser humano,
02:15
or teamsequipes of humanshumanos, could hopeesperança to viewVisão,
32
123849
2783
ou equipas de seres humanos
poderiam esperar ver.
02:18
and you and I are contributingcontribuindo
to that at this TEDTED.
33
126632
3921
Nós estamos neste momento a contribuir
para este fenómeno, com este evento TED.
02:22
YetAinda our mosta maioria advancedavançado softwareProgramas
is still strugglinglutando at understandingcompreensão
34
130553
5232
No entanto, até o software mais avançado
tem ainda dificuldades em compreender
02:27
and managinggerenciamento de this enormousenorme contentconteúdo.
35
135785
3876
e gerir uma quantidade
de dados tão grande.
02:31
So in other wordspalavras,
collectivelycoletivamente as a societysociedade,
36
139661
5272
Por outras palavras, enquanto sociedade,
nós somos bastante cegos,
02:36
we're very much blindcego,
37
144933
1746
02:38
because our smartestmais inteligente
machinesmáquinas are still blindcego.
38
146679
3387
porque as nossas máquinas
mais inteligentes ainda são cegas.
02:43
"Why is this so hardDifícil?" you maypode askpergunte.
39
151526
2926
"Porque é isto tão difícil?"
poderão perguntar.
02:46
CamerasCâmeras can take picturesAs fotos like this one
40
154452
2693
As câmaras fotográficas
tiram fotografias como esta,
02:49
by convertingconvertendo lightsluzes into
a two-dimensionalbidimensional arraymatriz of numbersnúmeros
41
157145
3994
convertendo luzes
numa tabela com números,
02:53
knownconhecido as pixelspixéis,
42
161139
1650
conhecidos como pixéis,
02:54
but these are just lifelesssem vida numbersnúmeros.
43
162789
2251
mas são apenas números sem vida.
02:57
They do not carrylevar meaningsignificado in themselvessi mesmos.
44
165040
3111
Por si só não têm significado.
03:00
Just like to hearouvir is not
the samemesmo as to listen,
45
168151
4343
Pela mesma razão que ouvir
não é o mesmo que escutar,
03:04
to take picturesAs fotos is not
the samemesmo as to see,
46
172494
4040
tirar fotografias
não é o mesmo que ver,
03:08
and by seeingvendo,
we really mean understandingcompreensão.
47
176534
3829
e por ver entenda-se compreender.
03:13
In factfacto, it tooktomou MotherMãe NatureNatureza
540 millionmilhão yearsanos of hardDifícil work
48
181293
6177
Na verdade, a Mãe Natureza precisou
de 540 milhões de anos de trabalho duro
03:19
to do this tasktarefa,
49
187470
1973
para realizar esta tarefa.
03:21
and much of that effortesforço
50
189443
1881
Muito desse esforço
03:23
wentfoi into developingem desenvolvimento the visualvisual
processingem processamento apparatusaparelho of our brainscérebro,
51
191324
5271
foi para o desenvolvimento do mecanismo
de processamento visual do cérebro,
03:28
not the eyesolhos themselvessi mesmos.
52
196595
2647
e não para os olhos.
03:31
So visionvisão beginscomeça with the eyesolhos,
53
199242
2747
Portanto, a visão começa nos olhos,
03:33
but it trulyverdadeiramente takes placeLugar, colocar in the braincérebro.
54
201989
3518
mas onde realmente acontece é no cérebro.
03:38
So for 15 yearsanos now, startinginiciando
from my PhPH.D. at CaltechCaltech
55
206287
5060
Há já 15 anos, desde
o meu doutoramento em Caltech,
03:43
and then leadingconduzindo Stanford'sStanford VisionVisão LabLaboratório,
56
211347
2926
e depois como diretora
do laboratório Stanford's Vision,
03:46
I've been workingtrabalhando with my mentorsmentores,
collaboratorscolaboradores and studentsalunos
57
214273
4396
tenho trabalhado com os meus mentores,
colaboradores e estudantes
03:50
to teachEnsinar computerscomputadores to see.
58
218669
2889
para ensinar os computadores a ver.
A nossa área de investigação chama-se
03:54
Our researchpesquisa fieldcampo is calledchamado
computercomputador visionvisão and machinemáquina learningAprendendo.
59
222658
3294
visão computacional
e aprendizagem automática.
03:57
It's partparte of the generalgeral fieldcampo
of artificialartificial intelligenceinteligência.
60
225952
3878
Faz parte do campo mais geral
da inteligência artificial.
04:03
So ultimatelyem última análise, we want to teachEnsinar
the machinesmáquinas to see just like we do:
61
231000
5493
Em ultima análise, queremos ensinar
as máquinas a ver, tal como nós vemos:
04:08
namingnomeação de objectsobjetos, identifyingidentificando people,
inferringinferindo 3D geometrygeometria of things,
62
236493
5387
nomear objetos, identificar pessoas,
inferir a geometria 3D das coisas,
04:13
understandingcompreensão relationsrelações, emotionsemoções,
actionsações and intentionsintenções.
63
241880
5688
entender relações, emoções,
ações e intenções.
04:19
You and I weavetecer togetherjuntos entireinteira storieshistórias
of people, placeslocais and things
64
247568
6153
Todos imaginamos e criamos histórias
sobre pessoas, lugares e objetos
04:25
the momentmomento we laydeitar our gazeolhar on them.
65
253721
2164
mal lhes deitamos a vista em cima.
04:28
The first stepdegrau towardsem direção this goalobjetivo
is to teachEnsinar a computercomputador to see objectsobjetos,
66
256955
5583
O primeiro passo para este objetivo
é ensinar um computador a ver objetos,
04:34
the buildingconstrução blockquadra of the visualvisual worldmundo.
67
262538
3368
os blocos de construção do mundo visual.
04:37
In its simplestmais simples termstermos,
imagineImagine this teachingensino processprocesso
68
265906
4434
Na sua forma mais simples, imaginem
este processo de ensinar os computadores
04:42
as showingmostrando the computerscomputadores
some trainingTreinamento imagesimagens
69
270340
2995
como o ato de lhes mostrar
imagens de um dado objeto
04:45
of a particularespecial objectobjeto, let's say catsgatos,
70
273335
3321
para treino, por exemplo gatos,
04:48
and designingprojetando a modelmodelo that learnsaprende
from these trainingTreinamento imagesimagens.
71
276656
4737
e conceber um modelo que aprende
a partir dessas imagens para treino.
04:53
How hardDifícil can this be?
72
281393
2044
Quão difícil será fazer isto?
04:55
After all, a catgato is just
a collectioncoleção of shapesformas and colorscores,
73
283437
4052
Afinal de contas, um gato não é mais
que um conjunto de formas e cores,
04:59
and this is what we did
in the earlycedo daysdias of objectobjeto modelingmodelagem.
74
287489
4086
e foi o que fizemos nos primeiros
tempos da modelação de objetos.
05:03
We'dGostaríamos tell the computercomputador algorithmalgoritmo de
in a mathematicalmatemático languagelíngua
75
291575
3622
Dizíamos ao algoritmo do computador,
em linguagem matemática,
05:07
that a catgato has a roundvolta facecara,
a chubbygordinho bodycorpo,
76
295197
3343
que um gato tem uma face redonda,
um corpo volumoso,
05:10
two pointyBicudo earsorelhas, and a long tailrabo,
77
298540
2299
duas orelhas pontiagudas,
uma cauda comprida,
05:12
and that lookedolhou all fine.
78
300839
1410
e esse modelo parecia bem assim.
05:14
But what about this catgato?
79
302859
2113
Mas o que acontece com este gato?
05:16
(LaughterRiso)
80
304972
1091
(Risos)
05:18
It's all curledenrolado up.
81
306063
1626
Está todo enrolado.
05:19
Now you have to addadicionar anotheroutro shapeforma
and viewpointponto de vista to the objectobjeto modelmodelo.
82
307689
4719
Agora vamos ter de adicionar
outra forma e perspetiva ao modelo.
05:24
But what if catsgatos are hiddenescondido?
83
312408
1715
E se os gatos estiverem escondidos?
05:27
What about these sillyboba catsgatos?
84
315143
2219
E quanto a estes gatos patetas?
05:31
Now you get my pointponto.
85
319112
2417
Agora compreendem o meu problema.
05:33
Even something as simplesimples
as a householdfamília petanimal
86
321529
3367
Até mesmo algo tão simples
quanto um animal doméstico
05:36
can presentpresente an infiniteinfinito numbernúmero
of variationsvariações to the objectobjeto modelmodelo,
87
324896
4504
pode ter um número infinito
de variações relativamente ao modelo
05:41
and that's just one objectobjeto.
88
329400
2233
e estamos a falar de um único objeto.
05:44
So about eightoito yearsanos agoatrás,
89
332573
2492
Então, há cerca de oito anos,
05:47
a very simplesimples and profoundprofundo observationobservação
changedmudou my thinkingpensando.
90
335065
5030
uma observação muito simples e profunda
mudou a minha forma de pensar.
05:53
No one tellsconta a childcriança how to see,
91
341425
2685
Ninguém diz a uma criança como se vê,
05:56
especiallyespecialmente in the earlycedo yearsanos.
92
344110
2261
especialmente nos primeiros anos de vida.
05:58
They learnaprender this throughatravés
real-worldmundo real experiencesexperiências and examplesexemplos.
93
346371
5000
As crianças aprendem isso através
de experiências e exemplos da vida real.
06:03
If you considerconsiderar a child'sdo filho eyesolhos
94
351371
2740
Se considerarmos os olhos de uma criança
06:06
as a pairpar of biologicalbiológico camerascâmeras,
95
354111
2554
como duas máquinas fotográficas biológicas,
06:08
they take one picturecenário
about everycada 200 millisecondsmilissegundos,
96
356665
4180
elas tiram uma fotografia a cada
200 millisegundos aproximadamente,
06:12
the averagemédia time an eyeolho movementmovimento is madefeito.
97
360845
3134
o tempo médio que demora
um movimento ocular.
06:15
So by ageera threetrês, a childcriança would have seenvisto
hundredscentenas of millionsmilhões of picturesAs fotos
98
363979
5550
Assim, aos três anos, uma criança
terá visto centenas de milhões de imagens
06:21
of the realreal worldmundo.
99
369529
1834
do mundo real.
06:23
That's a lot of trainingTreinamento examplesexemplos.
100
371363
2280
São imensos exemplos para treino.
06:26
So insteadem vez de of focusingconcentrando solelyunicamente
on better and better algorithmsalgoritmos,
101
374383
5989
Deste modo, em vez de me focar apenas
em algoritmos cada vez melhores,
06:32
my insightdiscernimento was to give the algorithmsalgoritmos
the kindtipo of trainingTreinamento datadados
102
380372
5272
a minha ideia foi treinar os algoritmos
com o mesmo tipo de dados
06:37
that a childcriança was givendado throughatravés experiencesexperiências
103
385644
3319
que uma criança recebe
através das suas experiências,
06:40
in bothambos quantityquantidade and qualityqualidade.
104
388963
3878
tanto em quantidade como qualidade.
06:44
OnceVez we know this,
105
392841
1858
Depois de percebermos isto,
06:46
we knewsabia we needednecessário to collectrecolher a datadados setconjunto
106
394699
2971
sabíamos que teríamos de reunir
um conjunto de dados
06:49
that has farlonge more imagesimagens
than we have ever had before,
107
397670
4459
com muito mais imagens
do que alguma vez tínhamos tido,
06:54
perhapspossivelmente thousandsmilhares of timesvezes more,
108
402129
2577
talvez mesmo milhares de vezes mais.
06:56
and togetherjuntos with ProfessorProfessor
KaiKai LiLi at PrincetonPrinceton UniversityUniversidade,
109
404706
4111
Juntamente com o Professor Kai Li
na Universidade de Princeton,
07:00
we launchedlançado the ImageNetImageNet projectprojeto in 2007.
110
408817
4752
iniciámos o projeto ImageNet, em 2007.
07:05
LuckilyPor sorte, we didn't have to mountmonte
a cameraCâmera on our headcabeça
111
413569
3838
Felizmente, não precisámos de montar
uma câmara na cabeça
07:09
and wait for manymuitos yearsanos.
112
417407
1764
e esperar vários anos.
07:11
We wentfoi to the InternetInternet,
113
419171
1463
Recorremos à Internet,
07:12
the biggestmaior treasuretesouro troveachado de of picturesAs fotos
that humanshumanos have ever createdcriada.
114
420634
4436
o maior tesouro de imagens
que o Homem alguma vez criou.
07:17
We downloadedbaixado nearlypor pouco a billionbilhão imagesimagens
115
425070
3041
Descarregámos cerca
de mil milhões de imagens
07:20
and used crowdsourcingcrowdsourcing technologytecnologia
like the AmazonAmazônia MechanicalMecânica TurkTurk platformplataforma
116
428111
5880
e utilizámos tecnologias
de contribuição voluntária,
como a plataforma Amazon Mechanical Turk,
07:25
to help us to labelrótulo these imagesimagens.
117
433991
2339
para nos ajudar a rotular essas imagens.
07:28
At its peakpico, ImageNetImageNet was one of
the biggestmaior employersempregadores
118
436330
4900
No seu auge, o ImageNet
era um dos maiores empregadores
07:33
of the AmazonAmazônia MechanicalMecânica TurkTurk workerstrabalhadores:
119
441230
2996
da Amazon Mechanical Turk.
07:36
togetherjuntos, almostquase 50,000 workerstrabalhadores
120
444226
3854
No total, quase 50 mil trabalhadores
07:40
from 167 countriespaíses around the worldmundo
121
448080
4040
de 167 países de todo o mundo
07:44
helpedajudou us to cleanlimpar \ limpo, sortordenar and labelrótulo
122
452120
3947
ajudaram-nos a limpar, ordenar e rotular
07:48
nearlypor pouco a billionbilhão candidatecandidato imagesimagens.
123
456067
3575
cerca de mil milhões
de imagens candidatas.
07:52
That was how much effortesforço it tooktomou
124
460612
2653
Foi quanto custou captar
07:55
to capturecapturar even a fractionfração
of the imageryimagens
125
463265
3900
uma fração de todas as imagens
07:59
a child'sdo filho mindmente takes in
in the earlycedo developmentaldo desenvolvimento yearsanos.
126
467165
4171
que uma criança vê nos seus
primeiros anos de desenvolvimento.
08:04
In hindsightVisão Retrospectiva, this ideaidéia of usingusando biggrande datadados
127
472148
3902
Em retrospetiva, esta ideia
de usar grandes volumes de dados
08:08
to traintrem computercomputador algorithmsalgoritmos
maypode seemparecem obviousóbvio now,
128
476050
4550
para treinar algoritmos em computadores
pode hoje parecer óbvia,
08:12
but back in 2007, it was not so obviousóbvio.
129
480600
4110
mas em 2007 não era assim tão óbvia.
08:16
We were fairlybastante alonesozinho on this journeyviagem
for quitebastante a while.
130
484710
3878
Estivemos sozinhos neste percurso
durante algum tempo.
08:20
Some very friendlyamigáveis colleaguescolegas advisedaconselhados me
to do something more usefulútil for my tenureposse,
131
488588
5003
Alguns colegas amáveis aconselharam-me
a fazer algo mais útil no meu mandato,
08:25
and we were constantlyconstantemente strugglinglutando
for researchpesquisa fundingfinanciamento.
132
493591
4342
e estávamos constantemente a lutar
por financiamento para a investigação.
08:29
OnceVez, I even jokedbrincou to my graduategraduado studentsalunos
133
497933
2485
Uma vez até disse, a brincar,
aos meus alunos
08:32
that I would just reopenreabrir
my dryseco cleaner'sdo líquido de limpeza shopfazer compras to fundfundo ImageNetImageNet.
134
500418
4063
que ia reabrir a minha loja
de limpeza a seco,
para financiar o ImageNet.
08:36
After all, that's how I fundedfinanciado
my collegeFaculdade yearsanos.
135
504481
4761
Afinal de contas,
foi assim que eu financiei
os meus estudos na universidade.
08:41
So we carriedtransportado on.
136
509242
1856
E assim continuámos o trabalho.
08:43
In 2009, the ImageNetImageNet projectprojeto deliveredentregue
137
511098
3715
Em 2009, o ImageNet disponibilizou
08:46
a databasebase de dados of 15 millionmilhão imagesimagens
138
514813
4042
uma base de dado
com 15 milhões de imagens
08:50
acrossatravés 22,000 classesclasses
of objectsobjetos and things
139
518855
4805
ao longo de 22 mil classes
de objetos e coisas,
08:55
organizedorganizado by everydaytodo dia EnglishInglês wordspalavras.
140
523660
3320
organizados por palavras
inglesas de uso comum.
08:58
In bothambos quantityquantidade and qualityqualidade,
141
526980
2926
Tanto em quantidade como em qualidade,
09:01
this was an unprecedentedsem precedente scaleescala.
142
529906
2972
tratou-se de uma escala sem precedentes.
09:04
As an exampleexemplo, in the casecaso of catsgatos,
143
532878
3461
Como exemplo disto temos,
no caso dos gatos,
09:08
we have more than 62,000 catsgatos
144
536339
2809
mais de 62 mil gatos
09:11
of all kindstipos of looksparece and posesposes
145
539148
4110
de todos os tipos e em variadas poses,
09:15
and acrossatravés all speciesespécies
of domesticdoméstica and wildselvagem catsgatos.
146
543258
5223
assim como todas as espécies
de gatos domésticos e selvagens.
09:20
We were thrilledemocionados
to have put togetherjuntos ImageNetImageNet,
147
548481
3344
Estávamos muito entusiasmados
por termos construído o ImageNet
09:23
and we wanted the wholetodo researchpesquisa worldmundo
to benefitbeneficiar from it,
148
551825
3738
e queríamos que toda a pesquisa mundial
pudesse beneficiar dele,
09:27
so in the TEDTED fashionmoda,
we openedaberto up the entireinteira datadados setconjunto
149
555563
4041
por isso, à boa maneira do TED,
disponibilizámos toda a base de dados
09:31
to the worldwideno mundo todo
researchpesquisa communitycomunidade for freelivre.
150
559604
3592
para a comunidade de pesquisa
mundial, gratuitamente.
(Aplausos)
09:36
(ApplauseAplausos)
151
564636
4000
09:41
Now that we have the datadados
to nourishNutrir our computercomputador braincérebro,
152
569416
4538
Agora que já temos os dados para alimentar
o cérebro do nosso computador,
09:45
we're readypronto to come back
to the algorithmsalgoritmos themselvessi mesmos.
153
573954
3737
estamos prontos para voltar
a trabalhar nos algoritmos.
09:49
As it turnedvirou out, the wealthriqueza
of informationem formação providedforneceu by ImageNetImageNet
154
577691
5178
Como se veio a perceber, a riqueza
de informações fornecidas pelo ImageNet
09:54
was a perfectperfeito matchpartida to a particularespecial classclasse
of machinemáquina learningAprendendo algorithmsalgoritmos
155
582869
4806
era perfeita para uma classe particular
de algoritmos de aprendizagem automática
09:59
calledchamado convolutionalconvolucional neuralneural networkrede,
156
587675
2415
designada por "rede neural convoluta",
10:02
pioneeredpioneira em by KunihikoKunihiko FukushimaFukushima,
GeoffGeoff HintonHinton, and YannYann LeCunLopes
157
590090
5248
lançada por Kunihiko Fukushima,
Geoff Hinton e Yann LeCun,
10:07
back in the 1970s and '80s.
158
595338
3645
nos anos 70 e 80.
10:10
Just like the braincérebro consistsconsiste
of billionsbilhões of highlyaltamente connectedconectado neuronsneurônios,
159
598983
5619
À semelhança do cérebro,
formado por milhares de milhões
de neurónios altamente ligados,
10:16
a basicbásico operatingoperativo unitunidade in a neuralneural networkrede
160
604602
3854
uma operação unitária básica
numa rede neural
10:20
is a neuron-likeneurônio-como nodenó de.
161
608456
2415
é idêntica a um nodo de neurónios.
10:22
It takes inputentrada from other nodesNós
162
610871
2554
Esse nodo recebe e envia informações
10:25
and sendsenvia outputsaída to othersoutras.
163
613425
2718
de outros nodos e para outros nodos.
10:28
MoreoverAlém disso, these hundredscentenas of thousandsmilhares
or even millionsmilhões of nodesNós
164
616143
4713
Além disso, essas centenas de milhares
ou mesmo milhões de nodos
10:32
are organizedorganizado in hierarchicalhierárquica layerscamadas,
165
620856
3227
estão organizados em camadas hierárquicas,
10:36
alsoAlém disso similarsemelhante to the braincérebro.
166
624083
2554
à semelhança do que se passa no cérebro.
10:38
In a typicaltípica neuralneural networkrede we use
to traintrem our objectobjeto recognitionreconhecimento modelmodelo,
167
626637
4783
Numa rede neural típica que usamos,
para treinar o modelo
de reconhecimento de objetos
10:43
it has 24 millionmilhão nodesNós,
168
631420
3181
existem 24 milhões de nodos,
10:46
140 millionmilhão parametersparâmetros,
169
634601
3297
140 milhões de parâmetros
e 15 mil milhões de ligações.
10:49
and 15 billionbilhão connectionsconexões.
170
637898
2763
10:52
That's an enormousenorme modelmodelo.
171
640661
2415
É um modelo enorme.
10:55
PoweredAlimentado by the massivemaciço datadados from ImageNetImageNet
172
643076
3901
Abastecido pelos imensos dados do ImageNet
10:58
and the modernmoderno CPUsCPUs and GPUsGPUs
to traintrem suchtal a humongousuma floresta modelmodelo,
173
646977
5433
dos CPUs e GPUs modernos para treinar
um modelo tão pesado quanto este,
11:04
the convolutionalconvolucional neuralneural networkrede
174
652410
2369
a rede neural convoluta
11:06
blossomedfloresceu in a way that no one expectedesperado.
175
654779
3436
floresceu de um modo que ninguém esperava.
11:10
It becamepassou a ser the winningganhando architecturearquitetura
176
658215
2508
Tornou-se na arquitetura vencedora
11:12
to generategerar excitingemocionante newNovo resultsresultados
in objectobjeto recognitionreconhecimento.
177
660723
5340
para a geração de resultados
sensacionais no reconhecimento de objetos.
11:18
This is a computercomputador tellingdizendo us
178
666063
2810
Aqui temos um computador a dizer-nos
11:20
this picturecenário containscontém a catgato
179
668873
2300
que esta imagem tem um gato
11:23
and where the catgato is.
180
671173
1903
e a localização do gato na imagem.
11:25
Of coursecurso there are more things than catsgatos,
181
673076
2112
É claro que há mais coisas além de gatos,
11:27
so here'saqui está a computercomputador algorithmalgoritmo de tellingdizendo us
182
675188
2438
e assim temos aqui um algoritmo
de computador a dizer-nos
11:29
the picturecenário containscontém
a boyGaroto and a teddypeluche bearUrso;
183
677626
3274
que a imagem contém um rapaz
e um ursinho de peluche,
11:32
a dogcachorro, a personpessoa, and a smallpequeno kitepipa
in the backgroundfundo;
184
680900
4366
um cão, uma pessoa
e um pequeno papagaio ao fundo,
11:37
or a picturecenário of very busyocupado things
185
685266
3135
ou uma imagem com muitos elementos,
11:40
like a man, a skateboardskate,
railingstrilhos, a lampostlampost, and so on.
186
688401
4644
tais como um homem, um "skate",
grades, um poste de iluminação, etc.
11:45
SometimesÀs vezes, when the computercomputador
is not so confidentconfiante about what it sees,
187
693045
5293
Por vezes, quando o computador
não está seguro do que vê,
11:51
we have taughtensinado it to be smartinteligente enoughsuficiente
188
699498
2276
ensinámo-lo a ser
suficientemente inteligente
11:53
to give us a safeseguro answerresponda
insteadem vez de of committingcometendo too much,
189
701774
3878
para nos dar uma resposta segura
em vez de se comprometer demasiado,
11:57
just like we would do,
190
705652
2811
tal como nós faríamos.
12:00
but other timesvezes our computercomputador algorithmalgoritmo de
is remarkablenotável at tellingdizendo us
191
708463
4666
Mas outras vezes o nosso algoritmo
é brilhante a dizer exatamente
12:05
what exactlyexatamente the objectsobjetos are,
192
713129
2253
quais são os objetos na imagem,
12:07
like the make, modelmodelo, yearano of the carscarros.
193
715382
3436
como a marca, o modelo
e o ano de fabrico dos carros.
12:10
We appliedaplicado this algorithmalgoritmo de to millionsmilhões
of GoogleGoogle StreetRua ViewModo de exibição imagesimagens
194
718818
5386
Aplicámos este algoritmo a milhões
de imagens do Google Street View
12:16
acrossatravés hundredscentenas of AmericanAmericana citiescidades,
195
724204
3135
a centenas de cidades norte-americanas
12:19
and we have learnedaprendido something
really interestinginteressante:
196
727339
2926
e aprendemos algo muito interessante:
12:22
first, it confirmedconfirmado our commoncomum wisdomsabedoria
197
730265
3320
primeiro, confirmou a sabedoria comum
12:25
that carcarro pricespreços correlatecorrelacionar very well
198
733585
3290
que diz que os preços dos carros
estão fortemente correlacionados
12:28
with householdfamília incomesrendimentos.
199
736875
2345
com os rendimentos familiares.
12:31
But surprisinglysurpreendentemente, carcarro pricespreços
alsoAlém disso correlatecorrelacionar well
200
739220
4527
Mas, surpreendentemente, os preços
dos carros também estão correlacionados
12:35
with crimecrime ratestaxas in citiescidades,
201
743747
2300
com as taxas de criminalidade em cidades,
ou padrões de votação por código postal.
12:39
or votingvotação patternspadrões by zipfecho eclair codescódigos de.
202
747007
3963
Mas esperem. É mesmo assim?
12:44
So wait a minuteminuto. Is that it?
203
752060
2206
12:46
Has the computercomputador already matchedcoincide
or even surpassedsuperou humanhumano capabilitiescapacidades?
204
754266
5153
O computador já conseguiu mesmo igualar
ou até ultrapassar as capacidades humanas?
12:51
Not so fastvelozes.
205
759419
2138
Vamos com calma.
12:53
So farlonge, we have just taughtensinado
the computercomputador to see objectsobjetos.
206
761557
4923
Até agora, apenas ensinámos
o computador a ver objetos.
12:58
This is like a smallpequeno childcriança
learningAprendendo to uttertotal a fewpoucos nounssubstantivos.
207
766480
4644
Isto é o equivalente a uma criança
que aprende a pronunciar alguns nomes.
13:03
It's an incredibleincrível accomplishmentrealização,
208
771124
2670
É um feito incrível,
13:05
but it's only the first stepdegrau.
209
773794
2460
mas é apenas o primeiro passo.
13:08
SoonEm breve, anotheroutro developmentaldo desenvolvimento
milestoneMarco histórico will be hitacertar,
210
776254
3762
As crianças atingem rapidamente
um novo marco no seu desenvolvimento,
13:12
and childrencrianças begininício
to communicatecomunicar in sentencesfrases.
211
780016
3461
começando a comunicar com frases.
13:15
So insteadem vez de of sayingdizendo
this is a catgato in the picturecenário,
212
783477
4224
Ou seja, em vez de dizer
que há um gato na imagem,
13:19
you already heardouviu the little girlmenina
tellingdizendo us this is a catgato lyingdeitado on a bedcama.
213
787701
5202
já ouvimos a menina dizer-nos
que é um gato deitado numa cama.
13:24
So to teachEnsinar a computercomputador
to see a picturecenário and generategerar sentencesfrases,
214
792903
5595
Para ensinar um computador
a gerar frases a partir de uma imagem,
13:30
the marriagecasamento betweenentre biggrande datadados
and machinemáquina learningAprendendo algorithmalgoritmo de
215
798498
3948
é agora preciso que o casamento
entre o volume de dados
e a aprendizagem automática
13:34
has to take anotheroutro stepdegrau.
216
802446
2275
dê mais um passo.
Agora, o computador terá que aprender,
não só a partir de imagens,
13:36
Now, the computercomputador has to learnaprender
from bothambos picturesAs fotos
217
804721
4156
13:40
as well as naturalnatural languagelíngua sentencesfrases
218
808877
2856
como também frases naturais da linguagem
13:43
generatedgerado by humanshumanos.
219
811733
3322
geradas pelos seres humanos.
13:47
Just like the braincérebro integratesintegra-se
visionvisão and languagelíngua,
220
815055
3853
Tal como o cérebro integra
a visão e a linguagem,
13:50
we developeddesenvolvido a modelmodelo
that connectsse conecta partspartes of visualvisual things
221
818908
5201
nós desenvolvemos um modelo
que relaciona partes de coisas visuais,
13:56
like visualvisual snippetstrechos
222
824109
1904
tais como fragmentos visuais,
13:58
with wordspalavras and phrasesfrases in sentencesfrases.
223
826013
4203
com palavras e expressões em frases.
14:02
About fourquatro monthsmeses agoatrás,
224
830216
2763
Há cerca de 4 meses,
14:04
we finallyfinalmente tiedamarrado all this togetherjuntos
225
832979
2647
conseguimos finalmente conjugar tudo isto
14:07
and producedproduzido one of the first
computercomputador visionvisão modelsmodelos
226
835626
3784
e produzir um dos primeiros
modelos de visão computacional
14:11
that is capablecapaz of generatinggerando
a human-likecomo humano sentencesentença
227
839410
3994
capaz de gerar uma frase semelhante
à gerada por um ser humano,
14:15
when it sees a picturecenário for the first time.
228
843404
3506
quando vê uma imagem pela primeira vez.
14:18
Now, I'm readypronto to showexposição you
what the computercomputador saysdiz
229
846910
4644
Agora, estou pronta para vos mostrar
o que o computador diz
14:23
when it sees the picturecenário
230
851554
1975
quando vê a imagem
14:25
that the little girlmenina saw
at the beginningcomeçando of this talk.
231
853529
3830
que a menina viu no início desta palestra.
(Vídeo) Computador:
Um homem está ao pé de um elefante.
14:31
(VideoVídeo) ComputerComputador: A man is standingparado
nextPróximo to an elephantelefante.
232
859519
3344
14:36
A largeampla airplaneavião sittingsentado on toptopo
of an airportaeroporto runwaypista.
233
864393
3634
Um avião de grande porte
poisado na pista de um aeroporto.
14:41
FFLFFL: Of coursecurso, we're still workingtrabalhando hardDifícil
to improvemelhorar our algorithmsalgoritmos,
234
869057
4212
FFL: Claro que ainda estamos a trabalhar
arduamente para melhorar os algoritmos,
14:45
and it still has a lot to learnaprender.
235
873269
2596
e o computador ainda tem
muito que aprender.
14:47
(ApplauseAplausos)
236
875865
2291
(Aplausos)
14:51
And the computercomputador still makesfaz com que mistakeserros.
237
879556
3321
O computador ainda faz erros.
14:54
(VideoVídeo) ComputerComputador: A catgato lyingdeitado
on a bedcama in a blanketcobertor.
238
882877
3391
(Vídeo) Computador:
Um gato deitado numa cama num cobertor.
14:58
FFLFFL: So of coursecurso, when it sees
too manymuitos catsgatos,
239
886268
2553
FFL: Claro que, depois de ver
muitos gatos,
15:00
it thinksacha everything
mightpoderia look like a catgato.
240
888821
2926
ele pensa que tudo é um gato.
15:05
(VideoVídeo) ComputerComputador: A youngjovem boyGaroto
is holdingsegurando a baseballbaseball batbastão.
241
893317
2864
(Video) Computador: Um menino
segura um taco de basebol.
15:08
(LaughterRiso)
242
896181
1765
(Risos)
15:09
FFLFFL: Or, if it hasn'tnão tem seenvisto a toothbrushescova dental,
it confusesconfunde it with a baseballbaseball batbastão.
243
897946
4583
FFL: Ou, se o computador
nunca viu uma escova de dentes,
confunde-a com um taco de basebol.
15:15
(VideoVídeo) ComputerComputador: A man ridingequitação a horsecavalo
down a streetrua nextPróximo to a buildingconstrução.
244
903309
3434
(Vídeo) Computador: Um homem a cavalo
desce uma rua ao pé de um edifício.
15:18
(LaughterRiso)
245
906743
2023
(Risos)
15:20
FFLFFL: We haven'tnão tem taughtensinado ArtArte 101
to the computerscomputadores.
246
908766
3552
FFL: Não ensinámos aos computadores
a disciplina de Introdução à Arte.
15:25
(VideoVídeo) ComputerComputador: A zebraZebra standingparado
in a fieldcampo of grassgrama.
247
913768
2884
(Vídeo) Computador:
Uma zebra num relvado.
FFL: Também não aprenderam ainda
a apreciar o esplendor da natureza,
15:28
FFLFFL: And it hasn'tnão tem learnedaprendido to appreciateapreciar
the stunningimpressionante beautybeleza of naturenatureza
248
916652
3367
15:32
like you and I do.
249
920019
2438
como vocês e eu fazemos.
15:34
So it has been a long journeyviagem.
250
922457
2832
Portanto, tem sido um longo percurso.
15:37
To get from ageera zerozero to threetrês was hardDifícil.
251
925289
4226
Ir dos zero aos três anos foi difícil.
O verdadeiro desafio será ir
dos três anos aos treze e para além disso.
15:41
The realreal challengedesafio is to go
from threetrês to 13 and farlonge beyondalém.
252
929515
5596
15:47
Let me remindlembrar you with this picturecenário
of the boyGaroto and the cakebolo again.
253
935111
4365
Vou mostrar-vos novamente
esta imagem do rapaz e do bolo.
15:51
So farlonge, we have taughtensinado
the computercomputador to see objectsobjetos
254
939476
4064
Até agora, ensinámos
o computador a ver objetos
15:55
or even tell us a simplesimples storyhistória
when seeingvendo a picturecenário.
255
943540
4458
ou mesmo a contar-nos uma pequena história
quando vê uma imagem.
15:59
(VideoVídeo) ComputerComputador: A personpessoa sittingsentado
at a tablemesa with a cakebolo.
256
947998
3576
(Vídeo) Computador: Uma pessoa
sentada à mesa com um bolo.
16:03
FFLFFL: But there's so much more
to this picturecenário
257
951574
2630
FFL: Mas há muito mais nesta imagem
16:06
than just a personpessoa and a cakebolo.
258
954204
2270
do que somente uma pessoa e um bolo.
16:08
What the computercomputador doesn't see
is that this is a specialespecial ItalianItaliano cakebolo
259
956474
4467
O que o computador não consegue ver
é que se trata de um bolo italiano especial
16:12
that's only servedservido duringdurante EasterPáscoa time.
260
960941
3217
que só se serve durante a Páscoa.
16:16
The boyGaroto is wearingvestindo his favoritefavorito t-shirtcamiseta
261
964158
3205
O rapaz está a usar
a sua T-shirt preferida
16:19
givendado to him as a giftpresente by his fatherpai
after a tripviagem to SydneySydney,
262
967363
3970
que o pai lhe ofereceu
após uma viagem a Sydney.
16:23
and you and I can all tell how happyfeliz he is
263
971333
3808
Tanto eu como vocês conseguimos ver
como o rapaz está feliz
16:27
and what's exactlyexatamente on his mindmente
at that momentmomento.
264
975141
3203
e o que se passa exatamente
na sua mente nesse momento.
16:31
This is my sonfilho LeoLeo.
265
979214
3125
Este é o meu filho Leo.
16:34
On my questbusca for visualvisual intelligenceinteligência,
266
982339
2624
Na minha busca pela inteligência visual,
16:36
I think of LeoLeo constantlyconstantemente
267
984963
2391
penso frequentemente no Leo
16:39
and the futurefuturo worldmundo he will liveviver in.
268
987354
2903
e no mundo em que ele viverá no futuro.
16:42
When machinesmáquinas can see,
269
990257
2021
Quando as máquinas conseguirem ver,
16:44
doctorsmédicos and nursesenfermeiros will have
extraextra pairspares of tirelessincansável eyesolhos
270
992278
4712
médicos e enfermeiros irão ter
um par adicional de olhos incansáveis
16:48
to help them to diagnosediagnosticar
and take careCuidado of patientspacientes.
271
996990
4092
para os ajudar a diagnosticar
e cuidar dos seus doentes.
16:53
CarsCarros will runcorre smartermais esperto
and safermais segura on the roadestrada.
272
1001082
4383
Os automóveis irão andar na estrada
de modo mais inteligente e seguro.
16:57
RobotsRobôs, not just humanshumanos,
273
1005465
2694
Os robôs, não apenas os seres humanos,
17:00
will help us to bravebravo the disasterdesastre zoneszonas
to saveSalve  the trappedpreso and woundedferido.
274
1008159
4849
irão ajudar-nos a enfrentar
zonas de catástrofe,
salvando feridos e encarcerados.
Iremos descobrir novas espécies,
melhores materiais,
17:05
We will discoverdescobrir newNovo speciesespécies,
better materialsmateriais,
275
1013798
3796
17:09
and exploreexplorar unseeninvisível frontiersfronteiras
with the help of the machinesmáquinas.
276
1017594
4509
e explorar limites nunca antes vistos
com a ajuda de máquinas.
17:15
Little by little, we're givingdando sightvista
to the machinesmáquinas.
277
1023113
4167
Pouco a pouco, estamos a dar
às máquinas a capacidade de ver.
17:19
First, we teachEnsinar them to see.
278
1027280
2798
Primeiro, ensinamo-las a ver.
17:22
Then, they help us to see better.
279
1030078
2763
Depois, elas ajudam-nos a ver melhor.
17:24
For the first time, humanhumano eyesolhos
won'tnão vai be the only onesuns
280
1032841
4165
Pela primeira vez, os olhos humanos
não estarão sozinhos
17:29
ponderingponderando sobre and exploringexplorando our worldmundo.
281
1037006
2934
na exploração e compreensão
do nosso mundo.
17:31
We will not only use the machinesmáquinas
for theirdeles intelligenceinteligência,
282
1039940
3460
Iremos usar máquinas
não somente pela sua inteligência,
17:35
we will alsoAlém disso collaboratecolaborar with them
in waysmaneiras that we cannotnão podes even imagineImagine.
283
1043400
6179
mas também para colaborar com elas
de formas que ainda
não conseguimos imaginar.
17:41
This is my questbusca:
284
1049579
2161
Esta é a minha missão:
17:43
to give computerscomputadores visualvisual intelligenceinteligência
285
1051740
2712
dar inteligência visual aos computadores
17:46
and to createcrio a better futurefuturo
for LeoLeo and for the worldmundo.
286
1054452
5131
e criar um futuro melhor
para o Leo e para o mundo.
Obrigada.
17:51
Thank you.
287
1059583
1811
(Aplausos)
17:53
(ApplauseAplausos)
288
1061394
3785
Translated by Juliana Rodrigues
Reviewed by Margarida Ferreira

▲Back to top

ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com