Joseph Redmon: How computers learn to recognize objects instantly
Joseph Redmon: Como um computador aprende a reconhecer objetos instantaneamente
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
de visão computacional
thought that getting a computer
com que um computador
between a cat and a dog
entre um gato e um cão
in the state of artificial intelligence.
no campo da inteligência artificial.
greater than 99 percent accuracy.
com uma precisão superior a 99%.
atribuirmos-lhe um rótulo,
put a label to that image --
thousands of other categories as well.
milhares de outras categorias também.
at the University of Washington,
da Universidade de Washington,
computer vision models.
de visão computacional.
o nosso classificador nesta imagem,
a prediction of dog or cat,
se é um cão ou um gato,
specific breed predictions.
of granularity we have now.
in image classification,
na classificação de imagem,
when we run our classifier
o classificador numa imagem como esta?
with a pretty similar prediction.
uma predição muito similar.
there is a malamute in the image,
we don't actually know that much
não conseguimos saber muito
called object detection,
chamada deteção de objetos,
e tentamos achar todos os objetos,
and try to find all of the objects,
à volta deles
when we run a detector on this image.
usamos um detetor nesta imagem.
algoritmos de visão computacional.
with our computer vision algorithms.
that there's a cat and a dog.
que está ali um gato e um cão.
o tamanho deles.
on top of computer vision,
a partir da visão computacional,
or a robotic system,
ou um sistema robótico,
of information that you want.
you can interact with the physical world.
interagir com o mundo físico.
em deteção de objetos,
on object detection,
processar uma única imagem.
to process a single image.
speed is so important in this domain,
velocidade é tão importante neste campo,
de um detetor de objetos
to process an image.
para processar uma imagem.
it makes predictions,
que demora a fazer predições,
para uma aplicação.
by another factor of 10,
at five frames per second.
a cinco quadros por segundo.
movimento significativo,
like this driving my car.
como este a conduzir o meu carro.
running in real time on my laptop.
em tempo-real no meu portátil.
as I move around the frame,
enquanto me movo à volta do quadro,
of changes in size,
de mudanças de tamanho,
isto é uma maravilha.
on top of computer vision.
a partir de visão computacional.
a thousand times faster.
mil vezes mais rápido.
object detection systems
os sistemas de deteção de objetos
on each of these regions,
em cada uma destas regiões.
para aquele classificador
detections in the image.
thousands of times over an image,
milhares de vezes numa imagem,
to produce detection.
para produzir deteção.
to do all of detection for us.
para fazer toda a deteção por nós.
and class probabilities simultaneously.
probabilidades de classe simultaneamente.
at an image thousands of times
olhar para uma imagem milhares de vezes
the YOLO method of object detection.
o método YOLO de deteção de objetos.
we're not just limited to images;
não estamos limitados apenas a imagens;
that cat and dog,
um gato e um cão,
and interact with each other.
e interagirem um com o outro.
like spoon and fork, bowl,
como colher e garfo, tigela,
de coisas mais exóticas:
que tipos de coisas podemos detetar.
out into the audience
our threshold for detection a little bit,
de deteção por um momento,
out in the audience.
mais pessoas na audiência.
detetar essas placas.
is happening in real time
está a ocorrer em tempo real
de deteção de propósito geral,
object detection system,
qualquer domínio de imagens.
ou pedestres,
células cancerígenas
already using this technology
que já usam esta tecnologia
like medicine, robotics.
como a medicina, a robótica.
of animals in Nairobi National Park
um recenseamento de animais
of this detection system.
deste sistema de deteção.
é de código aberto
free for anyone to use.
livre para qualquer um usar.
even more accessible and usable,
ainda mais acessível e utilizável,
of model optimization,
de otimização de modelos,
running on a phone.
de objetos rodar num telemóvel.
now we have a pretty powerful solution
agora temos uma solução muito poderosa
visão computacional de baixo-nível,
and build something with it.
e fazer algo com ele.
with access to this software,
com acesso a este software.
will build with this technology.
pessoas construirão com esta tecnologia.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com