Joseph Redmon: How computers learn to recognize objects instantly
Joseph Redmon: A számítógép betanítása valós idejű tárgyfelismerésre
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
thought that getting a computer
nem hitték,
rábírni egy számítógépet,
between a cat and a dog
egy kutyát egy macskától,
in the state of artificial intelligence.
jelentős előrehaladásával sem.
greater than 99 percent accuracy.
képesek vagyunk erre.
put a label to that image --
thousands of other categories as well.
más kategóriát is felismer.
at the University of Washington,
végzős hallgatója vagyok,
computer vision models.
fejlesztése és tesztelése a célom.
a prediction of dog or cat,
előképét kapjuk,
specific breed predictions.
of granularity we have now.
in image classification,
a képosztályozás terén,
when we run our classifier
with a pretty similar prediction.
ad meg az osztályozónk.
there is a malamute in the image,
malamut van a képen,
we don't actually know that much
nem sokat tudunk meg arról,
called object detection,
problémáján dolgozom,
and try to find all of the objects,
minden tárgyat beazonosítani,
when we run a detector on this image.
ha lefuttatunk egy felismerő programot.
látó algoritmusainkkal.
with our computer vision algorithms.
that there's a cat and a dog.
egy macska és egy kutya.
viszonyított helyzetüket,
on top of computer vision,
rendszert akarunk építeni,
or a robotic system,
vagy robotrendszer,
of information that you want.
you can interact with the physical world.
fizikai valóságunkkal.
on object detection,
to process a single image.
egyetlen kép feldolgozása.
speed is so important in this domain,
a sebesség ezen a területen,
to process an image.
dolgoz fel egy képet.
it makes predictions,
előrejelzéseket végez.
by another factor of 10,
at five frames per second.
tud másodpercenként.
like this driving my car.
rendszer vezetné az autómat.
running in real time on my laptop.
valós időben fut a laptopomon.
as I move around the frame,
ahogy itt sétálgatok,
of changes in size,
a méretváltozásomat,
on top of computer vision.
a számítógépes látásra.
a thousand times faster.
ezerszeres sebességig.
object detection systems
on each of these regions,
lefuttattak egy osztályozót,
detections in the image.
thousands of times over an image,
az osztályozót egy képen,
to produce detection.
vezettek a felismeréshez.
bíztuk az egész felismerő tevékenységet.
to do all of detection for us.
and class probabilities simultaneously.
és az osztályozást.
at an image thousands of times
több ezerszer végignézni egy képet
[You Only Look Once],
the YOLO method of object detection.
YOLO-módszerének.
we're not just limited to images;
nemcsak képeket vizsgálhatunk,
that cat and dog,
és a macskát nézzük,
and interact with each other.
és kapcsolatot teremtenek.
like spoon and fork, bowl,
kanalat, villát, tálat,
out into the audience
és szétnézünk,
our threshold for detection a little bit,
a felismerési küszöb értékét,
out in the audience.
a megfelelő fickókat.
is happening in real time
object detection system,
tárgyfelismerő rendszer,
already using this technology
alkalmazzák kutatók
like medicine, robotics.
fejlesztésekhez.
of animals in Nairobi National Park
YOLO-alapú felismerő rendszerrel
of this detection system.
mert a Darknet nyílt forráskódú,
free for anyone to use.
bárki szabadon használhatja.
even more accessible and usable,
felismerő rendszert akarunk fejleszteni,
of model optimization,
és approximációval
running on a phone.
felismerő programot fejlesztünk.
now we have a pretty powerful solution
van egy igazán ütős megoldásunk
számítógépes látási problémára,
and build something with it.
with access to this software,
ehhez a szoftverhez,
will build with this technology.
miket hoznak létre ezzel a technológiával.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com