Joseph Redmon: How computers learn to recognize objects instantly
Joseph Redmon: Kaip kompiuteris išmoksta akimirksniu atpažinti objektus
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
kompiuterinę regą, manė,
thought that getting a computer
atskirti katę nuo šuns
between a cat and a dog
dirbtinio intelekto srityje.
in the state of artificial intelligence.
greater than 99 percent accuracy.
nei 99-ių procentų tikslumu.
put a label to that image --
thousands of other categories as well.
tūkstančius kategorijų.
at the University of Washington,
„Darknet“ (angl. „tamsusis tinklas“).
computer vision models.
kompiuterinės regos modelius.
apie aptiktas kates ir šunis,
a prediction of dog or cat,
specific breed predictions.
pasiektas išsamumo lygis.
of granularity we have now.
in image classification,
vaizdų klasifikacijoje,
paleidžiame klasifikatorių
when we run our classifier
with a pretty similar prediction.
there is a malamute in the image,
we don't actually know that much
nesuteikia jokios informacijos
vadinamos objektų aptikimu.
called object detection,
and try to find all of the objects,
jame esančius objektus,
when we run a detector on this image.
detektorių, pateikę jam šį atvaizdą.
mūsų kompiuterinės regos algoritmais.
with our computer vision algorithms.
that there's a cat and a dog.
atvaizde yra katė ir šuo.
on top of computer vision,
pagrįstą kompiuterine rega,
or a robotic system,
priemonę ar robotą,
informacija, kurios jums reikia.
of information that you want.
you can interact with the physical world.
galimybę bendrauti su fiziniu pasauliu.
on object detection,
užtrukdavo 20 sekundžių.
to process a single image.
speed is so important in this domain,
srityje greitis yra toks svarbus,
apdorojamas per dvi sekundes.
to process an image.
galiausiai atlieka spėjimą,
it makes predictions,
by another factor of 10,
dar 10-čia kartų,
at five frames per second.
penkis vaizdus per sekundę.
vaizdas greitai keičiasi,
like this driving my car.
vairuotų mano automobilį.
veikianti esamu laiku, mano kompiuteryje.
running in real time on my laptop.
as I move around the frame,
of changes in size,
pokyčių, tokių kaip dydis,
on top of computer vision.
pagrįstas kompiuterine rega.
vienam atvaizdui.
a thousand times faster.
object detection systems
on each of these regions,
apdorodavo kiekvieną jų.
detections in the image.
thousands of times over an image,
tūkstantį kartų kiekvienam vaizdui,
to produce detection.
analizių vienam objektui aptikti.
to do all of detection for us.
neuroninį tinklą aptikti visus objektus.
and class probabilities simultaneously.
ir suskaičiuoja jų tikimybes.
at an image thousands of times
į tą patį atvaizdą tūkstantį kartų,
objektų aptikimo metodą:
the YOLO method of object detection.
angl. „tu tik pažiūri kartą“).
we're not just limited to images;
ne tik nuotraukas,
that cat and dog,
and interact with each other.
sąveikaujant vienas su kitu.
80 skirtingų klasių,
like spoon and fork, bowl,
pavyzdžiui, šaukštų, šakučių, lėkščių
out into the audience
daiktus galime joje aptikti.
pliušinių meškinų.
our threshold for detection a little bit,
out in the audience.
šiuos „Stop“ ženklus.
is happening in real time
object detection system,
objektų aptikimo sistema,
transporto priemones,
vėžines ląsteles audinio biopsijoje.
already using this technology
jau naudojasi šia technologija,
kaip medicina ar robotų technika.
like medicine, robotics.
of animals in Nairobi National Park
nacionaliniame parke buvo surašyti
of this detection system.
vieną iš sistemos dalių.
free for anyone to use.
naudotis ja gali visi ir už dyką.
even more accessible and usable,
objektų aptikimo prieinamumą ir naudą,
of model optimization,
running on a phone.
veikiantį mobiliajame telefone.
now we have a pretty powerful solution
turime ganėtinai galingą sprendimą
regos problemai,
and build something with it.
šią sistemą ir kažką su ja sukurti.
priėjimą prie šios programinės įrangos,
with access to this software,
will build with this technology.
sukurs, naudodamiesi šia technologija.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com