Joseph Redmon: How computers learn to recognize objects instantly
جوزف ردمون: چگونه یک کامپیوتر یاد میگیرد تا فورا یک شی را بازشناسی کند
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
thought that getting a computer
between a cat and a dog
in the state of artificial intelligence.
هوش مصنوعی.
greater than 99 percent accuracy.
دقت بیشتر از ۹۹ درصد انجام بدیم
put a label to that image --
thousands of other categories as well.
نیز به خوبی میدانند.
at the University of Washington,
دانشگاه واشنگتن هستم
دارکنت (شبکه سیاه)
computer vision models.
مدلهای بینایی کامیپوتر.
دارکنت
a prediction of dog or cat,
سگ یا گربه بودن نیست.
specific breed predictions.
of granularity we have now.
in image classification,
در دسته بندی تصاویر ساختهایم،
when we run our classifier
وقتی طبقهبندمان را
این اجرا میکنیم؟
with a pretty similar prediction.
پیشبینی خیلی مشابه باز میگردد.
there is a malamute in the image,
یک مالاموت در تصویر وجود دارد،
we don't actually know that much
در واقع خیلی درباره
چه رخ داده نمیدانیم.
called object detection,
یافتن اشیا نامیده میشود،
and try to find all of the objects,
و سعی در یافتن تمام اشیا داریم،
گذاشته
چه هستند.
when we run a detector on this image.
وقتی یابنده را اجرا کنیم اتفاق میافتد.
with our computer vision algorithms.
بینای کامپیوترمان کار کنیم.
that there's a cat and a dog.
یک گربه و یک سگ وجود دارد.
اطلاعات اضافی نیز بدانیم.
on top of computer vision,
در صدر بینایی کامپیوتر بسازید،
or a robotic system,
of information that you want.
you can interact with the physical world.
و دنیای فیزیکی تعامل کند.
on object detection,
to process a single image.
تا تصویر را پردازش کند.
speed is so important in this domain,
سرعت در این حوزه خیلی مهم است،
to process an image.
تا تصویری را پردازش کند.
it makes predictions,
میتوانید همزمان ببینید،
by another factor of 10,
۱۰ برابر سریعتر کنیم
at five frames per second.
بر ثانیه اجرا خواهد شد.
like this driving my car.
سیستمی شبیه این، ماشینم را براند.
running in real time on my laptop.
که در زمان حقیقی روی لپ تاپم اجرا میشود.
as I move around the frame,
بطوریکه من دور فریم حرکت میکنم،
of changes in size,
تغییرات در اندازه
on top of computer vision.
در صدر بینایی کامپیوترها بسازیم.
a thousand times faster.
هزار بار سریعتر.
object detection systems
سیستمهای یافتن اشیا
on each of these regions,
یک دسته بند را اجرا میکردند
detections in the image.
در نظر گرفته میشد.
thousands of times over an image,
روی یک تصویر را شامل میشد،
to produce detection.
"یافتن" را تولید کنند.
to do all of detection for us.
تا کل یافتنها را برای ما انجام دهد.
and class probabilities simultaneously.
همه احتمالات را با هم کلاس بندی میکند.
at an image thousands of times
به یک تصویر برای هزاران بار
the YOLO method of object detection.
متد YOLO برای یافتن اشیا نامیدیم.
we're not just limited to images;
ما فقط به یک تصویر محدود نیستیم:
پردازش کنیم.
that cat and dog,
and interact with each other.
با یکدیگر را نیز ببینیم.
like spoon and fork, bowl,
قاشق، چنگال، کاسه را دارد
out into the audience
our threshold for detection a little bit,
در یافتن را کمی کاهش دهیم،
out in the audience.
بین مخاطبین پیدا کنیم.
علامتهای ایست را یافت.
is happening in real time
object detection system,
اشیا همه منظوره است،
برای هر حوزه تصویری آموزش دهیم.
already using this technology
همچنین این سیستم را
like medicine, robotics.
روباتیک استفاده میکنند.
of animals in Nairobi National Park
پارک ملی نایروبی
of this detection system.
بخشی از این سیستم یابنده.
که دارکنت منبع آزاد است
free for anyone to use.
استفاده همگان آزاد است.
even more accessible and usable,
در دسترستر و قابل استفادهتر کنیم
of model optimization,
running on a phone.
یافتن اشیا روی گوشی هستیم.
now we have a pretty powerful solution
زیرا حالا یک راه حل خیلی قدرتمند
بینایی کامپیوتر داریم.
and build something with it.
و یک چیزی با آن بسازد.
with access to this software,
will build with this technology.
مردم با این تکنولوژی چه خواهند ساخت.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com