ABOUT THE SPEAKER
Joseph Redmon - Computer scientist
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.

Why you should listen

Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.

Redmon is also internet-famous for his resume.

More profile about the speaker
Joseph Redmon | Speaker | TED.com
TED2017

Joseph Redmon: How computers learn to recognize objects instantly

جوزيف ريدمود: كيف يتعلم الحاسوب التعرف على الأشياء فورًا؟

Filmed:
2,471,805 views

قبل عشر سنوات، اعتقد الباحثون أن الحصول على جهاز كمبيوتر يمكنه التفريق بين القط والكلب سيكون من المستحيل تقريبًا. لكن اليوم، تستطيع الرؤية الحاسوبية فعل ذلك مع أكثر من 99 % من الدقة. كيف ذلك؟ يعمل جوزيف ريدمون على يولو (انظر مرة واحدة فقط)، وهي طريقة مفتوحة المصدر للكشف عن الكائنات في الصور والفيديو - من الحمر الوحشية وحتى إشارات التوقف - بسرعة البرق. وذلك في عرض حي ملحوظ، ويظهر يدمون قبالة هذه الخطوة الهامة إلى الأمام لتطبيقات مثل السيارات ذاتية القيادة وتصميم واستخدام الإنسان الآلي وحتى الكشف عن السرطان.
- Computer scientist
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio

Double-click the English transcript below to play the video.

00:12
Tenعشرة yearsسنوات agoمنذ,
0
825
1151
منذ عشر سنوات مضت،
00:14
computerالحاسوب visionرؤية researchersالباحثين
thought that gettingالحصول على a computerالحاسوب
1
2000
2776
اعتقد باحثوا رؤية الكمبيوتر أن الحصول
على جهاز كمبيوتر
00:16
to tell the differenceفرق
betweenما بين a catقط and a dogالكلب
2
4800
2696
لمعرفة الفرق بين القط والكلب
00:19
would be almostتقريبيا impossibleغير ممكن,
3
7520
1976
سيكون شبه مستحيل،
00:21
even with the significantكبير advanceتقدم
in the stateحالة of artificialمصطنع intelligenceالمخابرات.
4
9520
3696
وحتى مع التقدم الكبير فى حالة
الذكاء الاصطناعي.
00:25
Now we can do it at a levelمستوى
greaterأكبر than 99 percentنسبه مئويه accuracyصحة.
5
13240
3560
يمكننا الآن أن نفعل ذلك بمستوى
دقة أعلى من 99%.
00:29
This is calledمسمي imageصورة classificationتصنيف --
6
17680
1856
وهذا ما يسمى بالتصنيف الصوري --
00:31
give it an imageصورة,
put a labelضع الكلمة المناسبة to that imageصورة --
7
19560
3096
وإعطائها صورة،
ووضع تسمية لتلك الصورة --
00:34
and computersأجهزة الكمبيوتر know
thousandsالآلاف of other categoriesالاقسام as well.
8
22680
3040
وكذلك تعرف أجهزة الكمبيوتر الآلاف
من الفئات الأخرى.
00:38
I'm a graduateتخرج studentطالب علم
at the Universityجامعة of Washingtonواشنطن,
9
26680
2896
أنا طالب دراسات عليا فى جامعة واشنطن
00:41
and I work on a projectمشروع calledمسمي Darknetداركنت,
10
29600
1896
وأنا أعمل على مشروع يسمى "داركنيت"
00:43
whichالتي is a neuralعصبي networkشبكة الاتصال frameworkالإطار
11
31520
1696
وهو إطار الشبكة العصبية
00:45
for trainingتدريب and testingاختبارات
computerالحاسوب visionرؤية modelsعارضات ازياء.
12
33240
2816
لتدريب واختبار نماذج رؤية الكمبيوتر.
00:48
So let's just see what Darknetداركنت thinksيعتقد
13
36080
2976
ولذلك، دعونا نرى ماذا يفكر "داركنيت"
00:51
of this imageصورة that we have.
14
39080
1760
فى هذه الصورة لدينا.
00:54
When we runيركض our classifierمصنف
15
42520
2336
عندما نقوم بتشغيل المصنف لدينا
00:56
on this imageصورة,
16
44880
1216
على هذه الصورة،
00:58
we see we don't just get
a predictionتنبؤ of dogالكلب or catقط,
17
46120
2456
نجد أننا لا نحصل فقط على تنبؤ للكلب والقط،
01:00
we actuallyفعلا get
specificمحدد breedتربية predictionsتوقعات.
18
48600
2336
نحن فى الواقع نحصل على
تنبؤات سلالة محددة.
01:02
That's the levelمستوى
of granularityتقسيمات we have now.
19
50960
2176
ذلك هو مستوى التقسيمات المتوفر لنا الآن.
01:05
And it's correctصيح.
20
53160
1616
وهو صحيح.
01:06
My dogالكلب is in factحقيقة a malamuteو Malamute.
21
54800
1840
في الحقيقة فإن كلبي هو "ملموت."
01:09
So we'veقمنا madeمصنوع amazingرائعة حقا stridesخطوات
in imageصورة classificationتصنيف,
22
57040
4336
ولذلك فقد حقننا خطوة مذهلة فى
تصنيف الصورة،
01:13
but what happensيحدث
when we runيركض our classifierمصنف
23
61400
2000
ولكن ماذا يحدث عندما
نشغّل المصنف لدينا
01:15
on an imageصورة that looksتبدو like this?
24
63424
1960
في صورة تبدو كهذه؟
01:19
Well ...
25
67080
1200
حسناً ...
01:24
We see that the classifierمصنف comesيأتي back
with a prettyجميلة similarمماثل predictionتنبؤ.
26
72640
3896
نرى أن المصنف يعود مع تنبؤ مماثل جداً.
01:28
And it's correctصيح,
there is a malamuteو Malamute in the imageصورة,
27
76560
3096
وهذا صحيح،
فهناك ملموت فى الصورة،
01:31
but just givenمعطى this labelضع الكلمة المناسبة,
we don't actuallyفعلا know that much
28
79680
3696
ولكن فقط نظراً لهذه التسمية،
فنحن حقاً لا نعرف الكثير
01:35
about what's going on in the imageصورة.
29
83400
1667
عن ماذا يدور فى الصورة.
01:37
We need something more powerfulقوي.
30
85091
1560
ونحن بحاجة إلى شيء أكثر قوة.
01:39
I work on a problemمشكلة
calledمسمي objectموضوع detectionكشف,
31
87240
2616
أنا أعمل على مشكلة
تسمى الكشف عن الكائن،
01:41
where we look at an imageصورة
and try to find all of the objectsشاء,
32
89880
2936
حيث ننظر إلى صورة
ونحاول العثور على كل الكائنات،
01:44
put boundingالمحيط boxesمربعات around them
33
92840
1456
ووضع المربعات المحيطة بهم
01:46
and say what those objectsشاء are.
34
94320
1520
ونقول ما هي تلك الكائنات.
01:48
So here'sمن هنا what happensيحدث
when we runيركض a detectorكاشف on this imageصورة.
35
96400
3280
وهنا ما يحدث عندما نقوم بتشغيل
المكشاف على هذه الصورة.
01:53
Now, with this kindطيب القلب of resultنتيجة,
36
101240
2256
والآن، مع نتيجة من هذا النوع،
01:55
we can do a lot more
with our computerالحاسوب visionرؤية algorithmsخوارزميات.
37
103520
2696
نستطيع فعل أكثر من ذللك بكثير
مع خوارزمياتنا لرؤية الكمبيوتر.
01:58
We see that it knowsيعرف
that there's a catقط and a dogالكلب.
38
106240
2976
نجد أنه يعرف أن هناك قط وكلب.
02:01
It knowsيعرف theirهم relativeنسبيا locationsمواقع,
39
109240
2256
ويعرف مواقعهم النسبية،
02:03
theirهم sizeبحجم.
40
111520
1216
وحجمهم.
02:04
It mayقد even know some extraإضافي informationمعلومات.
41
112760
1936
وربما يعرف معلومات إضافية.
02:06
There's a bookكتاب sittingجلسة in the backgroundخلفية.
42
114720
1960
يوجد كتاب فى الخلفية.
02:09
And if you want to buildبناء a systemالنظام
on topأعلى of computerالحاسوب visionرؤية,
43
117280
3256
وإذا أردت بناء نظام أعلى رؤية الكمبيوتر،
02:12
say a self-drivingالقيادة الذاتية vehicleمركبة
or a roboticالروبوتية systemالنظام,
44
120560
3456
فلنقل سيارة ذاتية القيادة أو نظام روبوتية
02:16
this is the kindطيب القلب
of informationمعلومات that you want.
45
124040
2456
هذا هو نوع المعلومات التي تريدها.
02:18
You want something so that
you can interactتفاعل with the physicalجسدي - بدني worldالعالمية.
46
126520
3239
تريد شيئًا بحيث يمكنك التفاعل
مع العالم المادي.
02:22
Now, when I startedبدأت workingعامل
on objectموضوع detectionكشف,
47
130759
2257
والآن، عندما بدأت العمل
في الكشف عن الكائنات،
02:25
it tookأخذ 20 secondsثواني
to processمعالج a singleغير مرتبطة imageصورة.
48
133040
3296
فقد استغرق الأمر 20 ثانية
لمعالجة صورة واحدة.
02:28
And to get a feel for why
speedسرعة is so importantمهم in this domainنطاق,
49
136360
3880
وللحصول على شعور
لماذا السرعة مهمة جدًا فى هذا المجال،
02:33
here'sمن هنا an exampleمثال of an objectموضوع detectorكاشف
50
141120
2536
هنا مثال للكشف عن كائن
02:35
that takes two secondsثواني
to processمعالج an imageصورة.
51
143680
2416
والذي يستغرق تانيتين
لمعالجة صورة.
02:38
So this is 10 timesمرات fasterبسرعة
52
146120
2616
لذا فهذا أسرع ب 10 مرات
02:40
than the 20-seconds-per-image-seconds لكل صورة detectorكاشف,
53
148760
3536
من 20 تانية لكل كشف على صورة واحدة،
02:44
and you can see that by the time
it makesيصنع predictionsتوقعات,
54
152320
2656
ويمكنك فى نفس الوقت أن ترى
أنه يقوم بتنبؤات،
02:47
the entireكامل stateحالة of the worldالعالمية has changedتغير,
55
155000
2040
فقد تغيّرت حالة العالم بأسرها،
02:49
and this wouldn'tلن be very usefulمفيد
56
157880
2416
وهذا لن يكون مفيدًا جدًا
02:52
for an applicationالوضعية.
57
160320
1416
للتطبيق.
02:53
If we speedسرعة this up
by anotherآخر factorعامل of 10,
58
161760
2496
إذا قمنا بتسريع هذا
بواسطة عامل آخر بمقدار 10
02:56
this is a detectorكاشف runningجري
at fiveخمسة framesإطارات perلكل secondثانيا.
59
164280
2816
فهذا كاشف يعمل
بمعدل خمسة إطارات فى الثانية الواحدة.
02:59
This is a lot better,
60
167120
1536
وهذا أفضل بكثير،
03:00
but for exampleمثال,
61
168680
1976
ولكن على سبيل المثال،
03:02
if there's any significantكبير movementحركة,
62
170680
2296
فإذا كان هناك أي حركة كبيرة،
03:05
I wouldn'tلن want a systemالنظام
like this drivingالقيادة my carسيارة.
63
173000
2560
فلن أحتاج إلى نظام مثل قيادة سيارتي.
03:09
This is our detectionكشف systemالنظام
runningجري in realحقيقة time on my laptopحاسوب محمول.
64
177120
3240
هذا هو نظام الكشف لدينا المشغّل
فى الوقت الحقيقي على كمبيوتري المحمول.
03:13
So it smoothlyبسلاسة tracksالمسارات me
as I moveنقل around the frameالإطار,
65
181000
3136
حيث يتتبعني بسلاسة
بينما أتحرك في جميع أنحاء الإطار،
03:16
and it's robustقوي to a wideواسع varietyتشكيلة
of changesالتغييرات in sizeبحجم,
66
184160
3720
وهي قوى لمجموعة واسعة
من التغيرات في الحجم،
03:21
poseيشير إلى,
67
189440
1200
والتشكيل،
03:23
forwardإلى الأمام, backwardالى الوراء.
68
191280
1856
إلى الأمام وإلى الخلف.
03:25
This is great.
69
193160
1216
هذا عظيم.
03:26
This is what we really need
70
194400
1736
هذا هو حقًا ما نريده
03:28
if we're going to buildبناء systemsأنظمة
on topأعلى of computerالحاسوب visionرؤية.
71
196160
2896
إذا كنا سنبني أنظمة
على رأس رؤية الكمبيوتر.
03:31
(Applauseتصفيق)
72
199080
4000
(تصفيق)
03:36
So in just a fewقليل yearsسنوات,
73
204280
2176
بالتالي في بضع سنوات فقط،
03:38
we'veقمنا goneذهب from 20 secondsثواني perلكل imageصورة
74
206480
2656
فقد انتقلنا من 20 ثانية لكل صورة
03:41
to 20 millisecondsميلي ثانية perلكل imageصورة,
a thousandألف timesمرات fasterبسرعة.
75
209160
3536
إلى 20 جزء من ألف جزء من الثانية لكل صورة،
أسرع بألف مرة.
03:44
How did we get there?
76
212720
1416
كيف وصلنا إلى هناك؟
03:46
Well, in the pastالماضي,
objectموضوع detectionكشف systemsأنظمة
77
214160
3016
حسناً، في الماضي
كانت أنظمة الكشف عن الكائن
03:49
would take an imageصورة like this
78
217200
1936
تأخذ صورة من هذا القبيل
03:51
and splitانشق، مزق it into a bunchباقة of regionsالمناطق
79
219160
2456
وتقوم بتقسيمها إلى مجموعة من المناطق
03:53
and then runيركض a classifierمصنف
on eachكل of these regionsالمناطق,
80
221640
3256
ثم تقوم بتشغيل المصنف
على كلّ من تلك المناطق،
03:56
and highمتوسط scoresدرجات for that classifierمصنف
81
224920
2536
ودرجات عالية من المصنف
03:59
would be consideredاعتبر
detectionsاكتشافات in the imageصورة.
82
227480
3136
ستعتبر بمثابة الكشف عن الصورة.
04:02
But this involvedمتورط runningجري a classifierمصنف
thousandsالآلاف of timesمرات over an imageصورة,
83
230640
4056
ولكن هذا ينطوى على تشغيل المصنف
الآف المرات على الصورة،
04:06
thousandsالآلاف of neuralعصبي networkشبكة الاتصال evaluationsالتقييم
to produceإنتاج detectionكشف.
84
234720
2920
والآلاف من تقييم الشبكة العصبية
لإنتاج الكشف.
04:11
Insteadفي حين أن, we trainedمتدرب a singleغير مرتبطة networkشبكة الاتصال
to do all of detectionكشف for us.
85
239240
4536
وبدلاً من ذلك، فقد قمنا بتدريب شبكة واحدة
للقيام بالكشف كاملاً لنا.
04:15
It producesينتج عنه all of the boundingالمحيط boxesمربعات
and classصف دراسي probabilitiesالاحتمالات simultaneouslyالوقت ذاته.
86
243800
4280
فهي تنتج كافة المربعات المحيطة
وفئة الإحتمالات في آن واحد.
04:20
With our systemالنظام, insteadفي حين أن of looking
at an imageصورة thousandsالآلاف of timesمرات
87
248680
3496
مع نظامنا، بدلاً من البحث
في الصورة لآلاف المرات
04:24
to produceإنتاج detectionكشف,
88
252200
1456
لإنتاج كشفها،
04:25
you only look onceذات مرة,
89
253680
1256
فأنت تنظر مرة واحدة فقط،
04:26
and that's why we call it
the YOLOYOLO methodطريقة of objectموضوع detectionكشف.
90
254960
2920
ولهذا السبب نحن نسميها
طريقة الكشف عن كائن "يولو."
04:31
So with this speedسرعة,
we're not just limitedمحدود to imagesصور;
91
259360
3976
لهذا بهذه السرعة
فنحن لا نقتصر فقط على الصور؛
04:35
we can processمعالج videoفيديو in realحقيقة time.
92
263360
2416
بل نستطيع أن نعالج الفيديو في
الوقت الحقيقي.
04:37
And now, insteadفي حين أن of just seeingرؤية
that catقط and dogالكلب,
93
265800
3096
والآن، بدلاً من مجرد رؤية
ذلك القط والكلب،
04:40
we can see them moveنقل around
and interactتفاعل with eachكل other.
94
268920
2960
نستطيع أن نرى تحركاتهم
وتفاعلهم تجاه بعضهم البعض.
04:46
This is a detectorكاشف that we trainedمتدرب
95
274560
2056
وهذا هو جهاز الكشف الذي قمنا بتدريبه
04:48
on 80 differentمختلف classesالطبقات
96
276640
4376
في 80 فئة مختلفة
04:53
in Microsoft'sمايكروسوفت COCOCOCO datasetبيانات.
97
281040
3256
في مجموعة بيانات "كوكو" ميكروسفت.
04:56
It has all sortsأنواع of things
like spoonملعقة and forkشوكة, bowlعاء,
98
284320
3336
لديها جميع أنواع االأشياء
مثل الملعقة والشوكة والسلطانية.
04:59
commonمشترك objectsشاء like that.
99
287680
1800
الأشياء الشائعة من هذا القبيل.
05:02
It has a varietyتشكيلة of more exoticغريب things:
100
290360
3096
لديها مجموعة متنوعة من أشياء أكثر غرابة:
05:05
animalsالحيوانات, carsالسيارات, zebrasالحمار الوحشي, giraffesالزرافات.
101
293480
3256
مثل الحيوانات والسيارات والحمر الوحشية
والزرافات
05:08
And now we're going to do something funمرح.
102
296760
1936
وسنقوم الآن بشيء مرح.
05:10
We're just going to go
out into the audienceجمهور
103
298720
2096
سنستهدف الجمهور
05:12
and see what kindطيب القلب of things we can detectالكشف.
104
300840
2016
ونرى ما نوع الأشياء التي يمكننا
الكشف عنها.
05:14
Does anyoneأي واحد want a stuffedمحشو animalحيوان?
105
302880
1620
هل من أحد يريد الحيوانات المحنطة؟
05:18
There are some teddyدمية bearsتتحمل out there.
106
306000
1762
توجد بعض الدببة هناك.
05:22
And we can turnمنعطف أو دور down
our thresholdعتبة for detectionكشف a little bitقليلا,
107
310040
4536
ويمكننا أن نخفض العتبة
لدينا للكشف عنه قليلاً،
05:26
so we can find more of you guys
out in the audienceجمهور.
108
314600
3400
لذا فنستطيع أن نجد عددًا أكبر يا رفاق
من ذلك الجمهور.
05:31
Let's see if we can get these stop signsعلامات.
109
319560
2336
لنرى إذا كان يمكننا الحصول
على علامات التوقف هذه.
05:33
We find some backpacksعلى الظهر.
110
321920
1880
نجد بعض حقائب الظهر.
05:37
Let's just zoomتكبير in a little bitقليلا.
111
325880
1840
دعونا فقط نكبّر قليلاً.
05:42
And this is great.
112
330320
1256
وهذا شيء عظيم.
05:43
And all of the processingمعالجة
is happeningحدث in realحقيقة time
113
331600
3176
والتحويل يحدث كلياً
فى الوقت الحقيقي
05:46
on the laptopحاسوب محمول.
114
334800
1200
على الكمبيوتر المحمول.
05:49
And it's importantمهم to rememberتذكر
115
337080
1456
وهذا أمر هام للتذكّر
05:50
that this is a generalجنرال لواء purposeغرض
objectموضوع detectionكشف systemالنظام,
116
338560
3216
وهذا هو الغرض العام
لنظام الكشف عن الكائن،
05:53
so we can trainقطار this for any imageصورة domainنطاق.
117
341800
5000
نستطيع أن نُدرب هذا لأي نطاق للصورة.
06:00
The sameنفسه codeالشفرة that we use
118
348320
2536
نفس التعليمات البرمجية التى نستخدمها
06:02
to find stop signsعلامات or pedestriansالمشاة,
119
350880
2456
لإيجاد علامات التوقف أو المشاة،
06:05
bicyclesدراجات in a self-drivingالقيادة الذاتية vehicleمركبة,
120
353360
1976
والدراجات الهوائية في سيارة ذاتية القيادة
06:07
can be used to find cancerسرطان cellsخلايا
121
355360
2856
يمكن استخدامها لإيجاد الخلايا السرطانية
06:10
in a tissueمناديل ورقية biopsyخزعة.
122
358240
3016
فى عينة من الأنسجة.
06:13
And there are researchersالباحثين around the globeكره ارضيه
alreadyسابقا usingاستخدام this technologyتقنية
123
361280
4040
وهناك باحثون حول العالم
يستخدمون هذه التكنولوجيا بالفعل
06:18
for advancesالتقدم in things
like medicineدواء, roboticsالروبوتات.
124
366240
3416
للتقدم في أمور مثل الطب
وعلم الإنسان الآلي.
06:21
This morningصباح, I readاقرأ a paperورقة
125
369680
1376
فقد قرأت جريدة هذا الصباح
06:23
where they were takingمع الأخذ a censusالتعداد
of animalsالحيوانات in Nairobiنيروبي Nationalالوطني Parkمنتزه
126
371080
4576
حيث أنهم يتخذون إجراء تعداد
للحيوانات فى حديقة وطنية في نيروبي
06:27
with YOLOYOLO as partجزء
of this detectionكشف systemالنظام.
127
375680
3136
مع "يولو" كجزء من نظام الكشف هذا.
06:30
And that's because Darknetداركنت is openفتح sourceمصدر
128
378840
3096
وهذا لأن "داركنيت" هو المصدر المفتوح
06:33
and in the publicعامة domainنطاق,
freeحر for anyoneأي واحد to use.
129
381960
2520
وفى المجال العام،
كما أنه مجاناً لأي شخص ليستخدمه.
06:37
(Applauseتصفيق)
130
385600
5696
(تصفيق)
06:43
But we wanted to make detectionكشف
even more accessibleيمكن الوصول and usableصالح للإستعمال,
131
391320
4936
ولكننا أردنا جعل الوصول
إلى الكشف أكتر سهولة وكذلك استعماله،
06:48
so throughعبر a combinationمزيج
of modelنموذج optimizationالاقوي,
132
396280
4056
وذلك من خلال الجمع بين النموذج الأمثل،
06:52
networkشبكة الاتصال binarizationbinarization and approximationتقريب,
133
400360
2296
ووضغ البيانات على شكل ثنائي
والقيمة التقريبية،
06:54
we actuallyفعلا have objectموضوع detectionكشف
runningجري on a phoneهاتف.
134
402680
3920
ولدينا بالفعل كاشف مواد يعمل
على الهاتف المحمول.
07:04
(Applauseتصفيق)
135
412800
5320
(تصفيق)
07:10
And I'm really excitedفرح because
now we have a prettyجميلة powerfulقوي solutionحل
136
418960
5056
وأنا متحمس حقًا لأنه لدينا
الآن حل قوي جداً
07:16
to this low-levelمستوى منخفض computerالحاسوب visionرؤية problemمشكلة,
137
424040
2296
لمشكلة رؤية الكمبيوتر ذات المستوى المنخفض،
07:18
and anyoneأي واحد can take it
and buildبناء something with it.
138
426360
3856
ويستطيع أي شخص أخذها
وبناء شيء باستخدامها.
07:22
So now the restراحة is up to all of you
139
430240
3176
لذا، البقية الآن متروكة لكم جميعاً
07:25
and people around the worldالعالمية
with accessالتمكن من to this softwareالبرمجيات,
140
433440
2936
والناس حول العالم ممن لهم إمكانية
وصول إلى هذا البرنامج،
07:28
and I can't wait to see what people
will buildبناء with this technologyتقنية.
141
436400
3656
ولا أستطيع الانتظار كي أرى ما سيبنيه
الناس باستخدام هذه التكنولوجيا.
07:32
Thank you.
142
440080
1216
شكراً لكم.
07:33
(Applauseتصفيق)
143
441320
3440
(تصفيق)
Translated by Abd El-Rahman Malek
Reviewed by Riyad Almubarak

▲Back to top

ABOUT THE SPEAKER
Joseph Redmon - Computer scientist
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.

Why you should listen

Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.

Redmon is also internet-famous for his resume.

More profile about the speaker
Joseph Redmon | Speaker | TED.com