Fei-Fei Li: How we're teaching computers to understand pictures
Fei-Fei Li: Como estamos a ensinar os computadores a entender imagens
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio
Double-click the English transcript below to play the video.
sitting in a bed.
sentado numa cama.
that are going on an airplane.
a three-year-old child
in a series of photos.
conjunto de fotografias.
to learn about this world,
para aprender neste mundo,
at one very important task:
numa tarefa muito importante:
technologically advanced than ever.
está mais avançada do que nunca.
we make phones that talk to us
fazemos telefones que falam connosco
that can play only music we like.
que apenas tocam música de que gostamos.
machines and computers
e computadores mais avançados
em realizar esta tarefa.
to give you a progress report
para vos dar um relato
in our research in computer vision,
em visão computacional,
and potentially revolutionary
e potencialmente mais revolucionárias
that can drive by themselves,
de carros que conduzem sozinhos,
they cannot really tell the difference
eles não conseguem distinguir
on the road, which can be run over,
que o carro pode atropelar,
which should be avoided.
que deve ser evitada.
sight to the blind.
a visão a pessoas cegas.
sobre uma área extensa de terra,
de visualização
the changes of the rainforests.
alterações nas florestas tropicais
por todo o lado,
is drowning in a swimming pool.
criança se está a afogar numa piscina.
an integral part of global life.
estão a tornar-se
that's far beyond what any human,
do que qualquer ser humano,
poderiam esperar ver.
to that at this TED.
para este fenómeno, com este evento TED.
is still struggling at understanding
tem ainda dificuldades em compreender
de dados tão grande.
collectively as a society,
machines are still blind.
mais inteligentes ainda são cegas.
poderão perguntar.
tiram fotografias como esta,
a two-dimensional array of numbers
numa tabela com números,
the same as to listen,
não é o mesmo que escutar,
the same as to see,
não é o mesmo que ver,
we really mean understanding.
540 million years of hard work
de 540 milhões de anos de trabalho duro
processing apparatus of our brains,
de processamento visual do cérebro,
from my Ph.D. at Caltech
o meu doutoramento em Caltech,
do laboratório Stanford's Vision,
collaborators and students
colaboradores e estudantes
computer vision and machine learning.
e aprendizagem automática.
of artificial intelligence.
da inteligência artificial.
the machines to see just like we do:
as máquinas a ver, tal como nós vemos:
inferring 3D geometry of things,
inferir a geometria 3D das coisas,
actions and intentions.
ações e intenções.
of people, places and things
sobre pessoas, lugares e objetos
is to teach a computer to see objects,
é ensinar um computador a ver objetos,
imagine this teaching process
este processo de ensinar os computadores
some training images
imagens de um dado objeto
from these training images.
a partir dessas imagens para treino.
a collection of shapes and colors,
que um conjunto de formas e cores,
in the early days of object modeling.
tempos da modelação de objetos.
in a mathematical language
em linguagem matemática,
a chubby body,
um corpo volumoso,
uma cauda comprida,
and viewpoint to the object model.
outra forma e perspetiva ao modelo.
as a household pet
quanto um animal doméstico
of variations to the object model,
de variações relativamente ao modelo
changed my thinking.
mudou a minha forma de pensar.
real-world experiences and examples.
de experiências e exemplos da vida real.
about every 200 milliseconds,
200 millisegundos aproximadamente,
um movimento ocular.
hundreds of millions of pictures
terá visto centenas de milhões de imagens
on better and better algorithms,
em algoritmos cada vez melhores,
the kind of training data
com o mesmo tipo de dados
através das suas experiências,
um conjunto de dados
than we have ever had before,
do que alguma vez tínhamos tido,
Kai Li at Princeton University,
na Universidade de Princeton,
a camera on our head
uma câmara na cabeça
that humans have ever created.
que o Homem alguma vez criou.
de mil milhões de imagens
like the Amazon Mechanical Turk platform
de contribuição voluntária,
the biggest employers
era um dos maiores empregadores
de imagens candidatas.
of the imagery
in the early developmental years.
primeiros anos de desenvolvimento.
de usar grandes volumes de dados
may seem obvious now,
pode hoje parecer óbvia,
for quite a while.
durante algum tempo.
to do something more useful for my tenure,
a fazer algo mais útil no meu mandato,
for research funding.
por financiamento para a investigação.
aos meus alunos
my dry cleaner's shop to fund ImageNet.
de limpeza a seco,
my college years.
foi assim que eu financiei
com 15 milhões de imagens
of objects and things
de objetos e coisas,
inglesas de uso comum.
no caso dos gatos,
of domestic and wild cats.
de gatos domésticos e selvagens.
to have put together ImageNet,
por termos construído o ImageNet
to benefit from it,
pudesse beneficiar dele,
we opened up the entire data set
disponibilizámos toda a base de dados
research community for free.
mundial, gratuitamente.
to nourish our computer brain,
o cérebro do nosso computador,
to the algorithms themselves.
a trabalhar nos algoritmos.
of information provided by ImageNet
de informações fornecidas pelo ImageNet
of machine learning algorithms
de algoritmos de aprendizagem automática
Geoff Hinton, and Yann LeCun
Geoff Hinton e Yann LeCun,
of billions of highly connected neurons,
de neurónios altamente ligados,
numa rede neural
or even millions of nodes
ou mesmo milhões de nodos
to train our object recognition model,
de reconhecimento de objetos
to train such a humongous model,
um modelo tão pesado quanto este,
in object recognition.
sensacionais no reconhecimento de objetos.
de computador a dizer-nos
a boy and a teddy bear;
e um ursinho de peluche,
in the background;
e um pequeno papagaio ao fundo,
railings, a lampost, and so on.
grades, um poste de iluminação, etc.
is not so confident about what it sees,
não está seguro do que vê,
suficientemente inteligente
instead of committing too much,
em vez de se comprometer demasiado,
is remarkable at telling us
é brilhante a dizer exatamente
e o ano de fabrico dos carros.
of Google Street View images
de imagens do Google Street View
really interesting:
estão fortemente correlacionados
also correlate well
dos carros também estão correlacionados
or even surpassed human capabilities?
ou até ultrapassar as capacidades humanas?
the computer to see objects.
o computador a ver objetos.
learning to utter a few nouns.
que aprende a pronunciar alguns nomes.
milestone will be hit,
um novo marco no seu desenvolvimento,
to communicate in sentences.
this is a cat in the picture,
que há um gato na imagem,
telling us this is a cat lying on a bed.
que é um gato deitado numa cama.
to see a picture and generate sentences,
a gerar frases a partir de uma imagem,
and machine learning algorithm
e a aprendizagem automática
não só a partir de imagens,
from both pictures
vision and language,
a visão e a linguagem,
that connects parts of visual things
que relaciona partes de coisas visuais,
computer vision models
modelos de visão computacional
a human-like sentence
à gerada por um ser humano,
what the computer says
o que o computador diz
at the beginning of this talk.
Um homem está ao pé de um elefante.
next to an elephant.
of an airport runway.
poisado na pista de um aeroporto.
to improve our algorithms,
arduamente para melhorar os algoritmos,
muito que aprender.
on a bed in a blanket.
Um gato deitado numa cama num cobertor.
too many cats,
muitos gatos,
might look like a cat.
is holding a baseball bat.
segura um taco de basebol.
it confuses it with a baseball bat.
nunca viu uma escova de dentes,
down a street next to a building.
desce uma rua ao pé de um edifício.
to the computers.
a disciplina de Introdução à Arte.
in a field of grass.
Uma zebra num relvado.
a apreciar o esplendor da natureza,
the stunning beauty of nature
dos três anos aos treze e para além disso.
from three to 13 and far beyond.
of the boy and the cake again.
esta imagem do rapaz e do bolo.
the computer to see objects
o computador a ver objetos
when seeing a picture.
quando vê uma imagem.
at a table with a cake.
sentada à mesa com um bolo.
to this picture
is that this is a special Italian cake
é que se trata de um bolo italiano especial
a sua T-shirt preferida
after a trip to Sydney,
após uma viagem a Sydney.
como o rapaz está feliz
at that moment.
na sua mente nesse momento.
extra pairs of tireless eyes
um par adicional de olhos incansáveis
and take care of patients.
e cuidar dos seus doentes.
and safer on the road.
de modo mais inteligente e seguro.
to save the trapped and wounded.
salvando feridos e encarcerados.
melhores materiais,
better materials,
with the help of the machines.
com a ajuda de máquinas.
to the machines.
às máquinas a capacidade de ver.
won't be the only ones
não estarão sozinhos
do nosso mundo.
for their intelligence,
não somente pela sua inteligência,
in ways that we cannot even imagine.
não conseguimos imaginar.
for Leo and for the world.
para o Leo e para o mundo.
ABOUT THE SPEAKER
Fei-Fei Li - Computer scientistAs Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.
Why you should listen
Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.
Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.
Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers.
Fei-Fei Li | Speaker | TED.com