Joseph Redmon: How computers learn to recognize objects instantly
वक्ता: जोसेफ रेडमन: कंप्यूटर वस्तुओं को पहचानना कैसे सीखता है?
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
thought that getting a computer
सोचा था कि एक कंप्यूटर द्वारा
between a cat and a dog
के बीच अंतर बताना
in the state of artificial intelligence.
प्रगति के बावजूद भी
greater than 99 percent accuracy.
अधिक यथार्थता के साथ कर सकते हैं
put a label to that image --
उस छवि पर एक लेबल डालें -
thousands of other categories as well.
भी जानते हैं
at the University of Washington,
एक स्नातक छात्र हूँ,
पर काम करता हूं,
computer vision models.
प्रशिक्षण और परीक्षण के लिए
a prediction of dog or cat,
कुत्ते या बिल्ली का ही नहीं ,
specific breed predictions.
पूर्वानुमान भी हो जाता है
of granularity we have now.
छवि वर्गीकरण में,
in image classification,
जब हम अपने वर्गीकारक को चलाते हैं
when we run our classifier
with a pretty similar prediction.
एक बहुत ही समान भविष्यवाणी के साथ
there is a malamute in the image,
we don't actually know that much
हम वास्तव में इतना नहीं जानते हैं
समस्या पर काम करता हूँ,
called object detection,
वस्तुओं को खोजने का प्रयास करते हैं,
and try to find all of the objects,
when we run a detector on this image.
तो यह होता है।
¶
with our computer vision algorithms.
दूर दृष्टि एल्गोरिदम के साथ
that there's a cat and a dog.
कि एक बिल्ली व एक कुत्ता है
जानकारी भी जान सकता है
on top of computer vision,
शीर्ष पर एक सिस्टम बनाना चाहते हैं
or a robotic system,
या एक रोबोट प्रणाली,
of information that you want.
की जानकारी चाहते हैं
you can interact with the physical world.
आप भौतिक दुनिया के साथ बातचीत कर सकते हैं
on object detection,
काम करना शुरू किया
to process a single image.
करने के लिए 20 सेकंड लगे
speed is so important in this domain,
ऐसा महसूस करने के लिए
to process an image.
एक छबी को संसाधित करने के लिए
it makes predictions,
जब यह पूर्वानुमान लगता है,
by another factor of 10,
और तेज करते हैं
at five frames per second.
फ्रेम प्रति सेकंड पर चलते हुए
like this driving my car.
ऐसा सिस्टम नहीं चाहूंगा
running in real time on my laptop.
यह हमारी पहचान प्रणाली है
as I move around the frame,
जब मैं फ्रेम के पास गति विधि करता हूँ
of changes in size,
on top of computer vision.
शीर्ष पर बनाने जा रहे हैं
a thousand times faster.
यानि कि एक हजार गुना तेज!
object detection systems
ऑब्जेक्ट डिटेक्शन सिस्टम
विभाजित कर के
on each of these regions,
क्लासिफायर चलाते हुए
detections in the image.
thousands of times over an image,
छवि पर हजारों बार क्लासिफायर चलाना,
to produce detection.
करना होता था
to do all of detection for us.
एक एकल नेटवर्क को प्रशिक्षित किया
and class probabilities simultaneously.
संभावनाओं को बनाता है
at an image thousands of times
हजारों बार देखने की बजाय
the YOLO method of object detection.
वस्तु का पता लगाने की योलो विधि
we're not just limited to images;
हम सिर्फ छवियों तक सीमित नहीं हैं;
संसाधित कर सकते हैं
that cat and dog,
कि बिल्ली और कुत्ते,
and interact with each other.
और एक दूसरे के साथ बातचीत करते हुए।
हमने प्रशिक्षित किया है
like spoon and fork, bowl,
जैसे चम्मच और कांटा, कटोरा,
out into the audience
बीच जाने वाले हैं
चीजों का पता लगाते हैं
our threshold for detection a little bit,
थोड़ी सी नीचे कर सकते हैं
out in the audience.
दर्शकों में ढूंढ सकते हैं
संकेत प्राप्त कर सकते हैं।
is happening in real time
वास्तविक समय में हो रहा है
¶
object detection system,
ऑब्जेक्ट डिटेक्शन सिस्टम,
के लिए प्रशिक्षित कर सकते हैं।
पैदल चलने वालों को ढूंढने के लिए,
इस्तेमाल किया जा सकता है
already using this technology
इस तकनीक का इस्तेमाल
like medicine, robotics.
की प्रगति के लिए कर रहे हैं
of animals in Nairobi National Park
पशुओं की जनगणना कर रहे थे
of this detection system.
जो इसका हिस्सा रहा
डार्कनेट खुला स्रोत है
free for anyone to use.
जो सभी के लिए नि:शुल्क है
¶
even more accessible and usable,
व उपयोगी बनाना चाहा¶
of model optimization,
बिनारिजेशन और सन्निकटन के
running on a phone.
एक फोन पर चल रही है
¶
now we have a pretty powerful solution
अब हमारे पास एक बहुत शक्तिशाली समाधान है¶
कंप्यूटर दृष्टि समस्या के लिए,
and build something with it.
और कुछ निर्माण कर सकता है
दुनिया भर के लोगों पर,
with access to this software,
के साथ, निर्भर करता है
will build with this technology.
लोग इस तकनीक से क्या बनायेगें
¶
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com