Joseph Redmon: How computers learn to recognize objects instantly
جوزيف ريدمود: كيف يتعلم الحاسوب التعرف على الأشياء فورًا؟
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
thought that getting a computer
على جهاز كمبيوتر
between a cat and a dog
in the state of artificial intelligence.
الذكاء الاصطناعي.
greater than 99 percent accuracy.
دقة أعلى من 99%.
put a label to that image --
ووضع تسمية لتلك الصورة --
thousands of other categories as well.
من الفئات الأخرى.
at the University of Washington,
computer vision models.
a prediction of dog or cat,
specific breed predictions.
تنبؤات سلالة محددة.
of granularity we have now.
in image classification,
تصنيف الصورة،
when we run our classifier
نشغّل المصنف لدينا
with a pretty similar prediction.
there is a malamute in the image,
فهناك ملموت فى الصورة،
we don't actually know that much
فنحن حقاً لا نعرف الكثير
called object detection,
تسمى الكشف عن الكائن،
and try to find all of the objects,
ونحاول العثور على كل الكائنات،
when we run a detector on this image.
المكشاف على هذه الصورة.
with our computer vision algorithms.
مع خوارزمياتنا لرؤية الكمبيوتر.
that there's a cat and a dog.
on top of computer vision,
or a robotic system,
of information that you want.
you can interact with the physical world.
مع العالم المادي.
on object detection,
في الكشف عن الكائنات،
to process a single image.
لمعالجة صورة واحدة.
speed is so important in this domain,
لماذا السرعة مهمة جدًا فى هذا المجال،
to process an image.
لمعالجة صورة.
it makes predictions,
أنه يقوم بتنبؤات،
by another factor of 10,
بواسطة عامل آخر بمقدار 10
at five frames per second.
بمعدل خمسة إطارات فى الثانية الواحدة.
like this driving my car.
running in real time on my laptop.
فى الوقت الحقيقي على كمبيوتري المحمول.
as I move around the frame,
بينما أتحرك في جميع أنحاء الإطار،
of changes in size,
من التغيرات في الحجم،
on top of computer vision.
على رأس رؤية الكمبيوتر.
a thousand times faster.
أسرع بألف مرة.
object detection systems
كانت أنظمة الكشف عن الكائن
on each of these regions,
على كلّ من تلك المناطق،
detections in the image.
thousands of times over an image,
الآف المرات على الصورة،
to produce detection.
لإنتاج الكشف.
to do all of detection for us.
للقيام بالكشف كاملاً لنا.
and class probabilities simultaneously.
وفئة الإحتمالات في آن واحد.
at an image thousands of times
في الصورة لآلاف المرات
the YOLO method of object detection.
طريقة الكشف عن كائن "يولو."
we're not just limited to images;
فنحن لا نقتصر فقط على الصور؛
الوقت الحقيقي.
that cat and dog,
ذلك القط والكلب،
and interact with each other.
وتفاعلهم تجاه بعضهم البعض.
like spoon and fork, bowl,
مثل الملعقة والشوكة والسلطانية.
والزرافات
out into the audience
الكشف عنها.
our threshold for detection a little bit,
لدينا للكشف عنه قليلاً،
out in the audience.
من ذلك الجمهور.
على علامات التوقف هذه.
is happening in real time
فى الوقت الحقيقي
object detection system,
لنظام الكشف عن الكائن،
already using this technology
يستخدمون هذه التكنولوجيا بالفعل
like medicine, robotics.
وعلم الإنسان الآلي.
of animals in Nairobi National Park
للحيوانات فى حديقة وطنية في نيروبي
of this detection system.
free for anyone to use.
كما أنه مجاناً لأي شخص ليستخدمه.
even more accessible and usable,
إلى الكشف أكتر سهولة وكذلك استعماله،
of model optimization,
والقيمة التقريبية،
running on a phone.
على الهاتف المحمول.
now we have a pretty powerful solution
الآن حل قوي جداً
and build something with it.
وبناء شيء باستخدامها.
with access to this software,
وصول إلى هذا البرنامج،
will build with this technology.
الناس باستخدام هذه التكنولوجيا.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com