Joseph Redmon: How computers learn to recognize objects instantly
조셉 레드몬(Joseph Redmon): 즉각적 사물 인식을 컴퓨터가 학습하는 과정
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
thought that getting a computer
between a cat and a dog
구별해 내는 것은
in the state of artificial intelligence.
발전해도 말이지요.
greater than 99 percent accuracy.
그 일이 가능한데,
put a label to that image --
thousands of other categories as well.
유형까지 알아냅니다.
at the University of Washington,
석사과정을 밟고 있고
프로젝트를 연구하고 있습니다.
computer vision models.
교육하고 실험하는데 쓰입니다.
'다크넷'이 어떤 식으로
a prediction of dog or cat,
예측 뿐만 아니라
specific breed predictions.
of granularity we have now.
세밀한 수준에 올라와 있습니다.
in image classification,
발전을 해왔는데
when we run our classifier
저희 선별법을 적용시키면
with a pretty similar prediction.
하는 것을 볼 수 있습니다.
there is a malamute in the image,
we don't actually know that much
called object detection,
문제에 대해 연구하고 있습니다.
and try to find all of the objects,
모든 사물들을 찾아내서
when we run a detector on this image.
어떻게 되는지 보겠습니다.
with our computer vision algorithms.
더 많은 것을 해낼 수 있겠군요.
that there's a cat and a dog.
알고 있을지도 모르겠네요.
on top of computer vision,
어떤 시스템을 개발한다면,
or a robotic system,
of information that you want.
여러분들이 원하는 정보일 겁니다.
you can interact with the physical world.
가능하게 하는 것들 말이지요.
on object detection,
'사물감지' 연구에 들어갔을 때
to process a single image.
20초가 걸렸습니다.
speed is so important in this domain,
중요한지 알고 싶다면
to process an image.
2초 밖에 걸리지 않습니다.
it makes predictions,
예측을 하기 시작할 때면
바뀌어 있을 테니까
by another factor of 10,
at five frames per second.
감지기능이 됩니다.
like this driving my car.
운전하기를 원친 않겠지요.
running in real time on my laptop.
작동되고 있는 감지 시스템입니다.
as I move around the frame,
움직이는 대로 따라오죠.
of changes in size,
다양한 크기
우리에게 필요한 것입니다.
on top of computer vision.
시스템을 개발할 때 말이지요.
a thousand times faster.
천배나 빨라졌습니다.
object detection systems
on each of these regions,
가장 높은 점수들이
detections in the image.
간주되는 방식이었습니다.
thousands of times over an image,
수천 번의 분류작업이
to produce detection.
거쳐야 했습니다.
to do all of detection for us.
모든 탐지가 가능케 했습니다.
and class probabilities simultaneously.
동시에 처리해 내는 것이지요.
at an image thousands of times
the YOLO method of object detection.
부르는 이유입니다.
we're not just limited to images;
처리할 수 있습니다.
that cat and dog,
인지하는 것을 넘어서
and interact with each other.
서로 어울리는 것도 볼 수 있습니다.
감지기능입니다.
코코 데이터 세트 안에서
얻어낸 것이지요.
like spoon and fork, bowl,
평범한 물건들이
out into the audience
our threshold for detection a little bit,
out in the audience.
잡아낼 수 있는지 보겠습니다.
is happening in real time
object detection system,
사물감지 시스템이란 것입니다.
적용시킬 수 있겠지요.
찾아내기도 하고
already using this technology
like medicine, robotics.
쓰고 있습니다.
of animals in Nairobi National Park
of this detection system.
사용된다고 나왔더군요.
free for anyone to use.
있도록 열려있기 때문입니다.
even more accessible and usable,
접근성과 사용성을 더 높이고 싶었고
of model optimization,
적절한 조화를 통해서
running on a phone.
사물감지가 가능하게 했습니다.
now we have a pretty powerful solution
급이 낮은 컴퓨터 시각 문제점들을
방법이 있으니까요.
and build something with it.
원하는 것들을 만들어 낼 수 있습니다.
여러분들의 몫이고요.
with access to this software,
세상의 모든 분들의 몫입니다.
will build with this technology.
만들어 낼지 너무 기대됩니다.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com