Joseph Redmon: How computers learn to recognize objects instantly
Joseph Redmon: Comment enseigner à un ordinateur la reconnaissance instantanée des objets
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
thought that getting a computer
en vision artificielle pensaient
between a cat and a dog
un chat d'un chien
in the state of artificial intelligence.
réalisés en intelligence artificielle.
greater than 99 percent accuracy.
avec une fiabilité supérieure à 99 %.
la classification d'images.
put a label to that image --
thousands of other categories as well.
des milliers d'autres catégories.
at the University of Washington,
à l'université de Washington,
computer vision models.
les modèles numériques de vision.
a prediction of dog or cat,
la prédiction « chat » ou « chien »
specific breed predictions.
of granularity we have now.
in image classification,
sont donc incroyables.
when we run our classifier
si notre classifieur
with a pretty similar prediction.
relativement similaire.
there is a malamute in the image,
l'image contient un malamute.
we don't actually know that much
n'indique pas grand-chose
called object detection,
and try to find all of the objects,
présents sur une image,
when we run a detector on this image.
le détecteur analyse cette image.
with our computer vision algorithms.
de vision artificielle.
that there's a cat and a dog.
la présence du chat et du chien.
on top of computer vision,
basé sur la vision artificielle,
or a robotic system,
ou un système robotisé,
of information that you want.
you can interact with the physical world.
avec le monde physique.
on object detection,
dans la détection d'objets,
to process a single image.
pour analyser une seule image.
speed is so important in this domain,
de la rapidité dans ce domaine,
to process an image.
it makes predictions,
qu'il fasse des prédictions,
by another factor of 10,
d'un facteur de dix,
at five frames per second.
cinq images par seconde.
like this driving my car.
conduise ma voiture.
running in real time on my laptop.
en temps réel sur mon PC portable.
as I move around the frame,
mes déplacements dans le cadre,
of changes in size,
de changements de taille,
on top of computer vision.
basés sur la vision artificielle.
a thousand times faster.
Mille fois plus vite.
object detection systems
on each of these regions,
analysait chacune d'elles,
detections in the image.
thousands of times over an image,
des milliers de fois
to produce detection.
pour une détection.
to do all of detection for us.
à réaliser ces détections.
and class probabilities simultaneously.
les probabilités de classes simultanément.
at an image thousands of times
plus une image des milliers de fois
the YOLO method of object detection.
pour « You Only Look Once ».
we're not just limited to images;
aux seules images
des vidéos en temps réel.
that cat and dog,
and interact with each other.
like spoon and fork, bowl,
de la cuillère à la fourchette et au bol.
plus inhabituelles :
des zèbres, des girafes.
out into the audience
our threshold for detection a little bit,
out in the audience.
is happening in real time
object detection system,
d'objets à usage général.
pour tout domaine visuel.
des panneaux stop, des piétons
pour détecter des cellules cancéreuses
already using this technology
déjà cette technologie
like medicine, robotics.
comme la médecine ou la robotique.
of animals in Nairobi National Park
de la faune du parc national de Nairobi
of this detection system.
pour son système de détection.
car Darknet est en open source
free for anyone to use.
Il est libre d'utilisation.
even more accessible and usable,
encore plus accessible et pratique.
of model optimization,
de l'optimisation de modèles
et l'approximation,
running on a phone.
sur un téléphone.
now we have a pretty powerful solution
dorénavant d'une solution puissante
de vision artificielle faible.
and build something with it.
pour concevoir ce qu'il veut.
with access to this software,
qui ont accès à ce logiciel.
will build with this technology.
feront de cette technologie.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com