Joseph Redmon: How computers learn to recognize objects instantly
Joseph Redmon: Hoe een computer leert objecten in realtime te herkennen
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
'computer vision'-onderzoekers
thought that getting a computer
tussen een kat en een hond
between a cat and a dog
in the state of artificial intelligence.
nog zulke grote vorderingen.
greater than 99 percent accuracy.
van meer dan 99%.
put a label to that image --
en hij labelt die.
thousands of other categories as well.
duizenden andere categorieën.
at the University of Washington,
Universiteit van Washington.
een neuraal netwerk
computer vision models.
van computer vision-modellen.
van deze afbeelding vinden?
op deze afbeelding toepassen,
a prediction of dog or cat,
maar zelfs het ras.
specific breed predictions.
of granularity we have now.
in image classification,
bij beeldclassificatie.
when we run our classifier
op zo'n afbeelding toepassen?
with a pretty similar prediction.
bijna dezelfde voorspelling.
there is a malamute in the image,
wat er gebeurt in de afbeelding.
we don't actually know that much
called object detection,
van objectdetectie.
and try to find all of the objects,
op een afbeelding te vinden.
en labelen de objecten.
when we run a detector on this image.
op deze afbeelding toepassen.
met onze computer vision-algoritmen.
with our computer vision algorithms.
that there's a cat and a dog.
en hoe groot ze zijn.
zoals het boek op de achtergrond.
on top of computer vision,
op basis van computer vision,
or a robotic system,
of een robotsysteem,
of information that you want.
you can interact with the physical world.
met de fysieke wereld.
on object detection,
aan objectdetectie,
to process a single image.
van één afbeelding 20 seconden.
speed is so important in this domain,
zo belangrijk is op dit gebied.
die er twee seconden over doet
to process an image.
die er 20 seconden over deed.
it makes predictions,
is de situatie al veranderd.
voor een toepassing.
by another factor of 10,
at five frames per second.
die vijf beelden per seconden verwerkt.
like this driving my car.
mijn auto bestuurt.
running in real time on my laptop.
dat in realtime op mijn laptop draait.
as I move around the frame,
of changes in size,
in grootte en houding.
op basis van computer vision.
on top of computer vision.
a thousand times faster.
object detection systems
zo'n afbeelding op in een aantal gebieden.
on each of these regions,
op elk gebied.
was dat een detectie.
detections in the image.
thousands of times over an image,
duizenden keren toegepast.
to produce detection.
van het netwerk om een detectie te doen.
to do all of detection for us.
om alle detecties uit te voeren.
and class probabilities simultaneously.
en voorspellingen tegelijkertijd.
at an image thousands of times
niet duizend keer naar een afbeelding
'you only look once'.
the YOLO method of object detection.
de YOLO-methode.
we're not just limited to images;
zijn we niet beperkt tot afbeeldingen.
that cat and dog,
and interact with each other.
en op elkaar reageren.
met 80 verschillende categorieën
like spoon and fork, bowl,
zoals lepels, vorken en kommen.
zoals auto's, zebra's en giraffes.
out into the audience
in het publiek kunnen detecteren.
our threshold for detection a little bit,
zodat hij meer mensen detecteert.
out in the audience.
is happening in real time
object detection system,
voor elk soort beeld.
voetgangers en fietsers
om kankercellen te vinden
already using this technology
gebruiken deze technologie al
like medicine, robotics.
in de geneeskunde en robotica.
over een census van de dieren
of animals in Nairobi National Park
of this detection system.
bij het detectiesysteem.
free for anyone to use.
even more accessible and usable,
nog toegankelijker maken.
of model optimization,
van het netwerk
running on a phone.
via een telefoon.
now we have a pretty powerful solution
voor dit computer vision-probleem.
and build something with it.
met toegang tot deze software.
with access to this software,
wat men met deze technologie maakt.
will build with this technology.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com