Joseph Redmon: How computers learn to recognize objects instantly
Джозеф Редмон: Как компьютер умеет мгновенно распознавать объекты
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
thought that getting a computer
думали, что научить компьютер
between a cat and a dog
in the state of artificial intelligence.
в развитии искусственного интеллекта.
greater than 99 percent accuracy.
с точностью до 99 процентов.
put a label to that image --
присвойте этой картинке категорию,
thousands of other categories as well.
at the University of Washington,
computer vision models.
модели компьютерного зрения.
a prediction of dog or cat,
собака здесь изображена или кошка,
specific breed predictions.
варианты конкретных пород.
of granularity we have now.
in image classification,
в классификации изображений,
when we run our classifier
когда мы запускаем наш классификатор
которая выглядит вот так?
with a pretty similar prediction.
довольно похожие варианты.
there is a malamute in the image,
we don't actually know that much
мы на самом деле не знаем,
called object detection,
касающимся обнаружения объекта,
and try to find all of the objects,
и пытаемся найти все объекты,
прямоугольники вокруг них
when we run a detector on this image.
детектор на этом изображении.
with our computer vision algorithms.
с нашими алгоритмами компьютерного зрения.
that there's a cat and a dog.
где кошка, а где собака.
относительно друг друга,
дополнительную информацию.
on top of computer vision,
сверхсистему компьютерного зрения,
or a robotic system,
средство или робототехническую систему,
of information that you want.
которая вам пригодится.
you can interact with the physical world.
взаимодействовать с материальным миром.
обнаружения объекта,
on object detection,
to process a single image.
изображения требуется 20 секунд.
speed is so important in this domain,
скорость так важна в этой области,
to process an image.
на обработку изображения.
it makes predictions,
когда он выдаёт варианты,
by another factor of 10,
at five frames per second.
пять кадров в секунду.
движение, я бы не хотел,
like this driving my car.
управляла моим автомобилем.
running in real time on my laptop.
обнаружения работает в реальном времени.
as I move around the frame,
как я передвигаюсь по помещению,
of changes in size,
спектр изменений в размере,
on top of computer vision.
самого лучшего компьютерного зрения.
на одно изображение
a thousand times faster.
что в тысячу раз быстрее.
object detection systems
on each of these regions,
по каждой из этих секций,
detections in the image.
thousands of times over an image,
перебрать тысячи вариантов изображения,
to produce detection.
чтобы выдать конечный результат.
to do all of detection for us.
сеть, которая выполнила всю работу за нас.
and class probabilities simultaneously.
и варианты видов одновременно.
чтобы смотреть на изображение тысячи раз
at an image thousands of times
the YOLO method of object detection.
метод опознавания YOLO.
we're not just limited to images;
разнообразием объектов,
в режиме реального времени.
that cat and dog,
смотреть на эту кошку и собаку,
and interact with each other.
и общаются друг с другом.
like spoon and fork, bowl,
такие как как ложка, вилка, миска
out into the audience
какие объекты мы сможем определить.
плюшевых медведей.
our threshold for detection a little bit,
out in the audience.
кое-что о вас узнать, друзья.
получить эти знаки остановки.
is happening in real time
в режиме реального времени
object detection system,
с изображениями из разных областей.
«Стоп» или пешеходов,
для поиска раковых клеток
already using this technology
уже используют эту технологию
like medicine, robotics.
в медицине, робототехнике.
of animals in Nairobi National Park
при составлении переписи животных
of this detection system.
этой системы обнаружения.
является общедоступным ресурсом
free for anyone to use.
может пользоваться им бесплатно.
even more accessible and usable,
ещё более доступным и удобным,
of model optimization,
running on a phone.
объекта с помощью телефона.
now we have a pretty powerful solution
у нас есть очень мощное решение
компьютерного зрения,
and build something with it.
и что-нибудь создать с его помощью.
зависит от всех вас
with access to this software,
к данному программному обеспечению,
will build with this technology.
люди создадут с помощью этой технологии.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com