Joseph Redmon: How computers learn to recognize objects instantly
Joseph Redmon: Como um computador aprende a reconhecer objetos instantaneamente
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
da visão computacional
thought that getting a computer
distinguir um cão de um gato
between a cat and a dog
in the state of artificial intelligence.
da inteligência artificial.
greater than 99 percent accuracy.
com precisão superior a 99%.
atribuir a ela um rótulo,
put a label to that image --
thousands of other categories as well.
milhares de outras categorias.
at the University of Washington,
e testar modelos de visão computacional.
computer vision models.
acha desta imagem que temos.
nosso classificador nela,
a prediction of dog or cat,
specific breed predictions.
of granularity we have now.
in image classification,
na classificação de imagens,
when we run our classifier
o classificador em uma imagem como esta?
with a pretty similar prediction.
um prognóstico bastante semelhante.
there is a malamute in the image,
we don't actually know that much
realmente muito a respeito
called object detection,
chamado detecção de objetos,
and try to find all of the objects,
e tentamos achar todos os objetos,
e dizemos o que eles são.
when we run a detector on this image.
um detector nesta imagem.
with our computer vision algorithms.
com a visão computacional.
that there's a cat and a dog.
que há um gato e um cachorro.
extras, como um livro ao fundo.
on top of computer vision,
atualizado de visão computacional,
or a robotic system,
ou um sistema robótico,
of information that you want.
que vocês precisam.
you can interact with the physical world.
interagir com o mundo físico.
on object detection,
para processar uma única imagem.
to process a single image.
speed is so important in this domain,
da velocidade nesta área,
de um detector de objetos
to process an image.
para processar uma imagem.
it makes predictions,
os prognósticos, tudo mudou,
para uma aplicação.
by another factor of 10,
at five frames per second.
a cinco quadros por segundo.
like this driving my car.
como esse dirigindo meu carro.
running in real time on my laptop.
rodando em tempo real em meu laptop.
as I move around the frame,
meu movimento ao redor do quadro,
of changes in size,
de mudanças de tamanho,
on top of computer vision.
atualizados de visão computacional.
a thousand times faster.
object detection systems
de detecção de objetos
on each of these regions,
um classificador em cada uma delas.
para esse classificador
detections in the image.
thousands of times over an image,
milhares de vezes em uma imagem,
to produce detection.
para fazer a detecção.
to do all of detection for us.
para fazer toda a detecção para nós.
and class probabilities simultaneously.
e probabilidades de classe ao mesmo tempo.
at an image thousands of times
uma imagem milhares de vezes
olhamos apenas uma vez.
the YOLO method of object detection.
"YOLO" de detecção de objetos.
we're not just limited to images;
limitados somente a imagens;
that cat and dog,
aquele gato e cachorro,
and interact with each other.
e a interação entre eles.
like spoon and fork, bowl,
como colher, garfo, tigela,
de coisas mais exóticas:
que tipo de coisas podemos detectar.
out into the audience
our threshold for detection a little bit,
nossa tolerância de detecção,
out in the audience.
mais de vocês na plateia.
pegar os sinais de PARE.
em tempo real no laptop.
is happening in real time
de objetos de uso geral.
object detection system,
para qualquer domínio de imagem.
de PARE ou pedestres,
células cancerígenas
already using this technology
que já utilizam esta tecnologia
like medicine, robotics.
como medicina, robótica.
of animals in Nairobi National Park
de animais no Nairobi National Park
of this detection system.
deste sistema de detecção.
free for anyone to use.
para qualquer um usar.
even more accessible and usable,
ainda mais acessível e utilizável.
of model optimization,
de otimização de modelo,
running on a phone.
sendo executada em um celular.
now we have a pretty powerful solution
pois temos uma solução muito potente
and build something with it.
e construir algo com ele.
with access to this software,
com acesso a este software.
will build with this technology.
o que elas farão com essa tecnologia.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com