Joseph Redmon: How computers learn to recognize objects instantly
Joseph Redmon: Cómo las computadoras aprenden a reconocer objetos al instante
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
de la visión artificial
thought that getting a computer
between a cat and a dog
in the state of artificial intelligence.
de la inteligencia artificial.
greater than 99 percent accuracy.
superior al 99 % de precisión.
put a label to that image --
thousands of other categories as well.
de otras categorías también.
en la Universidad de Washington,
at the University of Washington,
computer vision models.
de modelos de visión artificial,
una predicción de perro o gato,
a prediction of dog or cat,
predicciones de raza específicas.
specific breed predictions.
of granularity we have now.
in image classification,
en la clasificación de imágenes,
when we run our classifier
al ejecutar nuestro clasificador
with a pretty similar prediction.
con una predicción bastante similar.
there is a malamute in the image,
hay un malamute en la imagen,
we don't actually know that much
en realidad, no sabemos mucho
llamado detección de objetos,
called object detection,
intentamos encontrar todos los objetos,
and try to find all of the objects,
alrededor de ellos
when we run a detector on this image.
al ejecutar un detector en esta imagen.
algoritmos de visión artificial.
with our computer vision algorithms.
that there's a cat and a dog.
alguna información adicional.
on top of computer vision,
en la visión artificial
or a robotic system,
o un sistema robótico,
of information that you want.
que necesita.
you can interact with the physical world.
en la detección de objetos,
on object detection,
to process a single image.
en procesar una sola imagen.
speed is so important in this domain,
es tan importante en este ámbito,
de un detector de objetos
to process an image.
en procesar una imagen.
it makes predictions,
de hacer las predicciones,
by another factor of 10,
en cinco fotogramas por segundo.
at five frames per second.
like this driving my car.
conduciendo mi auto.
se ejecuta en tiempo real en mi portátil.
running in real time on my laptop.
as I move around the frame,
mientras me muevo en la imagen,
of changes in size,
de cambios de tamaño,
on top of computer vision.
con base en visión artificial.
a thousand times faster.
mil veces más rápido.
object detection systems
los sistemas de detección de objetos
on each of these regions,
en cada una de estas regiones,
de ese clasificador
detections in the image.
thousands of times over an image,
miles de veces sobre una imagen,
to produce detection.
para producir detección.
to do all of detection for us.
una sola red para hacer toda la detección.
and class probabilities simultaneously.
y ordena las probabilidades en simultáneo.
at an image thousands of times
de mirar una imagen miles de veces
the YOLO method of object detection.
método YOLO de detección de objetos.
we're not just limited to images;
no estamos limitados a las imágenes;
that cat and dog,
a ese gato y perro,
and interact with each other.
e interactuar unos con otros.
like spoon and fork, bowl,
como cuchara y tenedor, cuenco,
out into the audience
our threshold for detection a little bit,
nuestro umbral de detección un poco,
out in the audience.
a más de Uds. en la audiencia.
estas señales de stop.
is happening in real time
está sucediendo en tiempo real
object detection system,
detección de objetos de propósito general,
para cualquier dominio de la imagen.
de stop o de peatones,
para encontrar células cancerosas
already using this technology
que ya usan esta tecnología
like medicine, robotics.
como la medicina, la robótica.
of animals in Nairobi National Park
haciendo en el Parque Nacional de Nairobi
of this detection system.
de este sistema de detección.
porque Darknet es de código abierto
free for anyone to use.
que lo use cualquier persona.
even more accessible and usable,
fuera aún más accesible y usable,
of model optimization,
de optimización de modelos,
running on a phone.
que funciona en un teléfono.
now we have a pretty powerful solution
tenemos una solución bastante potente
de bajo nivel,
and build something with it.
y hacer algo con esto.
with access to this software,
con acceso a este software,
will build with this technology.
la gente con esta tecnología.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com