Joseph Redmon: How computers learn to recognize objects instantly
Джозеф Редмон: Як комп'ютер вчиться миттєво визначати об'єкти
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
thought that getting a computer
вважали, що навчити комп'ютер
between a cat and a dog
між котом і собакою —
in the state of artificial intelligence.
в галузі штучного інтелекту.
greater than 99 percent accuracy.
з точністю понад 99%.
зображень —
put a label to that image --
назвати це зображення —
thousands of other categories as well.
тисячі таких категорій.
at the University of Washington,
Університету Вашингтона,
під назвою Даркнет,
computer vision models.
моделі комп'ютерного зору.
a prediction of dog or cat,
щодо кішки чи собаки,
specific breed predictions.
визначення породи.
of granularity we have now.
ми маємо зараз.
in image classification,
у класифікації зображень,
when we run our classifier
класифікатор
with a pretty similar prediction.
з дуже подібним передбаченням.
there is a malamute in the image,
є маламут,
we don't actually know that much
ми небагато дізналися про те,
called object detection,
під назвою визначення об'єктів,
and try to find all of the objects,
і намагаємося знайти усі об'єкти,
when we run a detector on this image.
для цього зображення.
with our computer vision algorithms.
комп'ютерного зору.
that there's a cat and a dog.
що це кіт і собака.
додаткову інформацію.
on top of computer vision,
на основі комп'ютерного зору,
or a robotic system,
чи роботизовану систему,
of information that you want.
саме такої інформації.
you can interact with the physical world.
взаємодіяти з матеріальним світом.
визначенням об'єктітв,
on object detection,
to process a single image.
20 секунд.
speed is so important in this domain,
настільки важлива в цій галузі,
to process an image.
на обробку зображення.
it makes predictions,
свій прогноз,
вже змінився.
by another factor of 10,
ще вдесятеро,
at five frames per second.
на швидкості 5 кадрів на секунду.
like this driving my car.
керувала моєю автівкою.
running in real time on my laptop.
що працює наживо на моєму лептопі.
as I move around the frame,
поки я рухаюсь коло меж,
of changes in size,
змін розміру,
on top of computer vision.
на основі комп'ютерного зору.
на зображення
a thousand times faster.
у тисячу разів швидше.
object detection systems
on each of these regions,
для кожного регіону,
detections in the image.
за визначення зображення.
thousands of times over an image,
класифікатора тисячі разів,
to produce detection.
щоб зробити визначення.
to do all of detection for us.
робити усі визначення для нас.
and class probabilities simultaneously.
й сортує ймовірності одночасно.
щоб тисячі разів дивитися на зображення
at an image thousands of times
ми дивимося один раз:
the YOLO method of object detection.
визначення об'єктів YOLO.
we're not just limited to images;
ми не обмежені зображеннями,
that cat and dog,
тих кота і собаку,
and interact with each other.
рухаються і взаємодіють.
like spoon and fork, bowl,
ложка і виделка, миска,
out into the audience
визначити.
our threshold for detection a little bit,
поріг розпізнавання,
out in the audience.
в аудиторії.
is happening in real time
в реальному часі
object detection system,
загального призначення,
для будь-якого типу зображень.
ракові клітини
already using this technology
вже використовують цю технологію,
like medicine, robotics.
чи робототехніку.
of animals in Nairobi National Park
в Національному парку Найробі,
of this detection system.
як частину системи розпізнавання.
кодом
free for anyone to use.
безкоштовний для використання.
even more accessible and usable,
навіть доступнішим і зручнішим,
of model optimization,
running on a phone.
працює на телефоні.
now we have a pretty powerful solution
зараз у нас є досить потужне розв'язання
and build something with it.
і щоб з цим побудувати.
with access to this software,
які мають доступ до цієї програми,
will build with this technology.
які люди створять із цією технологією.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com