ABOUT THE SPEAKER

Joseph Redmon - Computer scientist
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.

Why you should listen

Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.

Redmon is also internet-famous for his resume.

More profile about the speaker
Joseph Redmon | Speaker | TED.com

TED2017

Joseph Redmon: How computers learn to recognize objects instantly

جوزيف ريدمود: كيف يتعلم الحاسوب التعرف على الأشياء فورًا؟

Filmed: 2017-04-24

Readability: 4.5

2,471,805 views

قبل عشر سنوات، اعتقد الباحثون أن الحصول على جهاز كمبيوتر يمكنه التفريق بين القط والكلب سيكون من المستحيل تقريبًا. لكن اليوم، تستطيع الرؤية الحاسوبية فعل ذلك مع أكثر من 99 % من الدقة. كيف ذلك؟ يعمل جوزيف ريدمون على يولو (انظر مرة واحدة فقط)، وهي طريقة مفتوحة المصدر للكشف عن الكائنات في الصور والفيديو - من الحمر الوحشية وحتى إشارات التوقف - بسرعة البرق. وذلك في عرض حي ملحوظ، ويظهر يدمون قبالة هذه الخطوة الهامة إلى الأمام لتطبيقات مثل السيارات ذاتية القيادة وتصميم واستخدام الإنسان الآلي وحتى الكشف عن السرطان.

Joseph Redmon - Computer scientist
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio

Double-click the English transcript below to play the video.

00:12

Tenعشرة yearsسنوات agoمنذ,

0

825

1151

منذ عشر سنوات مضت،

00:14

computerالحاسوب visionرؤية researchersالباحثين
thought that gettingالحصول على a computerالحاسوب

1

2000

2776

اعتقد باحثوا رؤية الكمبيوتر أن الحصول
على جهاز كمبيوتر

00:16

to tell the differenceفرق
betweenما بين a catقط and a dogالكلب

2

4800

2696

لمعرفة الفرق بين القط والكلب

00:19

would be almostتقريبيا impossibleغير ممكن,

3

7520

1976

سيكون شبه مستحيل،

00:21

even with the significantكبير advanceتقدم
in the stateحالة of artificialمصطنع intelligenceالمخابرات.

4

9520

3696

وحتى مع التقدم الكبير فى حالة
الذكاء الاصطناعي.

00:25

Now we can do it at a levelمستوى
greaterأكبر than 99 percentنسبه مئويه accuracyصحة.

5

13240

3560

يمكننا الآن أن نفعل ذلك بمستوى
دقة أعلى من 99%.

00:29

This is calledمسمي imageصورة classificationتصنيف --

6

17680

1856

وهذا ما يسمى بالتصنيف الصوري --

00:31

give it an imageصورة,
put a labelضع الكلمة المناسبة to that imageصورة --

7

19560

3096

وإعطائها صورة،
ووضع تسمية لتلك الصورة --

00:34

and computersأجهزة الكمبيوتر know
thousandsالآلاف of other categoriesالاقسام as well.

8

22680

3040

وكذلك تعرف أجهزة الكمبيوتر الآلاف
من الفئات الأخرى.

00:38

I'm a graduateتخرج studentطالب علم
at the Universityجامعة of Washingtonواشنطن,

9

26680

2896

أنا طالب دراسات عليا فى جامعة واشنطن

00:41

and I work on a projectمشروع calledمسمي Darknetداركنت,

10

29600

1896

وأنا أعمل على مشروع يسمى "داركنيت"

00:43

whichالتي is a neuralعصبي networkشبكة الاتصال frameworkالإطار

11

31520

1696

وهو إطار الشبكة العصبية

00:45

for trainingتدريب and testingاختبارات
computerالحاسوب visionرؤية modelsعارضات ازياء.

12

33240

2816

لتدريب واختبار نماذج رؤية الكمبيوتر.

00:48

So let's just see what Darknetداركنت thinksيعتقد

13

36080

2976

ولذلك، دعونا نرى ماذا يفكر "داركنيت"

00:51

of this imageصورة that we have.

14

39080

1760

فى هذه الصورة لدينا.

00:54

When we runيركض our classifierمصنف

15

42520

2336

عندما نقوم بتشغيل المصنف لدينا

00:56

on this imageصورة,

16

44880

1216

على هذه الصورة،

00:58

we see we don't just get
a predictionتنبؤ of dogالكلب or catقط,

17

46120

2456

نجد أننا لا نحصل فقط على تنبؤ للكلب والقط،

01:00

we actuallyفعلا get
specificمحدد breedتربية predictionsتوقعات.

18

48600

2336

نحن فى الواقع نحصل على
تنبؤات سلالة محددة.

01:02

That's the levelمستوى
of granularityتقسيمات we have now.

19

50960

2176

ذلك هو مستوى التقسيمات المتوفر لنا الآن.

01:05

And it's correctصيح.

20

53160

1616

وهو صحيح.

01:06

My dogالكلب is in factحقيقة a malamuteو Malamute.

21

54800

1840

في الحقيقة فإن كلبي هو "ملموت."

01:09

So we'veقمنا madeمصنوع amazingرائعة حقا stridesخطوات
in imageصورة classificationتصنيف,

22

57040

4336

ولذلك فقد حقننا خطوة مذهلة فى
تصنيف الصورة،

01:13

but what happensيحدث
when we runيركض our classifierمصنف

23

61400

2000

ولكن ماذا يحدث عندما
نشغّل المصنف لدينا

01:15

on an imageصورة that looksتبدو like this?

24

63424

1960

في صورة تبدو كهذه؟

01:19

Well ...

25

67080

1200

حسناً ...

01:24

We see that the classifierمصنف comesيأتي back
with a prettyجميلة similarمماثل predictionتنبؤ.

26

72640

3896

نرى أن المصنف يعود مع تنبؤ مماثل جداً.

01:28

And it's correctصيح,
there is a malamuteو Malamute in the imageصورة,

27

76560

3096

وهذا صحيح،
فهناك ملموت فى الصورة،

01:31

but just givenمعطى this labelضع الكلمة المناسبة,
we don't actuallyفعلا know that much

28

79680

3696

ولكن فقط نظراً لهذه التسمية،
فنحن حقاً لا نعرف الكثير

01:35

about what's going on in the imageصورة.

29

83400

1667

عن ماذا يدور فى الصورة.

01:37

We need something more powerfulقوي.

30

85091

1560

ونحن بحاجة إلى شيء أكثر قوة.

01:39

I work on a problemمشكلة
calledمسمي objectموضوع detectionكشف,

31

87240

2616

أنا أعمل على مشكلة
تسمى الكشف عن الكائن،

01:41

where we look at an imageصورة
and try to find all of the objectsشاء,

32

89880

2936

حيث ننظر إلى صورة
ونحاول العثور على كل الكائنات،

01:44

put boundingالمحيط boxesمربعات around them

33

92840

1456

ووضع المربعات المحيطة بهم

01:46

and say what those objectsشاء are.

34

94320

1520

ونقول ما هي تلك الكائنات.

01:48

So here'sمن هنا what happensيحدث
when we runيركض a detectorكاشف on this imageصورة.

35

96400

3280

وهنا ما يحدث عندما نقوم بتشغيل
المكشاف على هذه الصورة.

01:53

Now, with this kindطيب القلب of resultنتيجة,

36

101240

2256

والآن، مع نتيجة من هذا النوع،

01:55

we can do a lot more
with our computerالحاسوب visionرؤية algorithmsخوارزميات.

37

103520

2696

نستطيع فعل أكثر من ذللك بكثير
مع خوارزمياتنا لرؤية الكمبيوتر.

01:58

We see that it knowsيعرف
that there's a catقط and a dogالكلب.

38

106240

2976

نجد أنه يعرف أن هناك قط وكلب.

02:01

It knowsيعرف theirهم relativeنسبيا locationsمواقع,

39

109240

2256

ويعرف مواقعهم النسبية،

02:03

theirهم sizeبحجم.

40

111520

1216

وحجمهم.

02:04

It mayقد even know some extraإضافي informationمعلومات.

41

112760

1936

وربما يعرف معلومات إضافية.

02:06

There's a bookكتاب sittingجلسة in the backgroundخلفية.

42

114720

1960

يوجد كتاب فى الخلفية.

02:09

And if you want to buildبناء a systemالنظام
on topأعلى of computerالحاسوب visionرؤية,

43

117280

3256

وإذا أردت بناء نظام أعلى رؤية الكمبيوتر،

02:12

say a self-drivingالقيادة الذاتية vehicleمركبة
or a roboticالروبوتية systemالنظام,

44

120560

3456

فلنقل سيارة ذاتية القيادة أو نظام روبوتية

02:16

this is the kindطيب القلب
of informationمعلومات that you want.

45

124040

2456

هذا هو نوع المعلومات التي تريدها.

02:18

You want something so that
you can interactتفاعل with the physicalجسدي - بدني worldالعالمية.

46

126520

3239

تريد شيئًا بحيث يمكنك التفاعل
مع العالم المادي.

02:22

Now, when I startedبدأت workingعامل
on objectموضوع detectionكشف,

47

130759

2257

والآن، عندما بدأت العمل
في الكشف عن الكائنات،

02:25

it tookأخذ 20 secondsثواني
to processمعالج a singleغير مرتبطة imageصورة.

48

133040

3296

فقد استغرق الأمر 20 ثانية
لمعالجة صورة واحدة.

02:28

And to get a feel for why
speedسرعة is so importantمهم in this domainنطاق,

49

136360

3880

وللحصول على شعور
لماذا السرعة مهمة جدًا فى هذا المجال،

02:33

here'sمن هنا an exampleمثال of an objectموضوع detectorكاشف

50

141120

2536

هنا مثال للكشف عن كائن

02:35

that takes two secondsثواني
to processمعالج an imageصورة.

51

143680

2416

والذي يستغرق تانيتين
لمعالجة صورة.

02:38

So this is 10 timesمرات fasterبسرعة

52

146120

2616

لذا فهذا أسرع ب 10 مرات

02:40

than the 20-seconds-per-image-seconds لكل صورة detectorكاشف,

53

148760

3536

من 20 تانية لكل كشف على صورة واحدة،

02:44

and you can see that by the time
it makesيصنع predictionsتوقعات,

54

152320

2656

ويمكنك فى نفس الوقت أن ترى
أنه يقوم بتنبؤات،

02:47

the entireكامل stateحالة of the worldالعالمية has changedتغير,

55

155000

2040

فقد تغيّرت حالة العالم بأسرها،

02:49

and this wouldn'tلن be very usefulمفيد

56

157880

2416

وهذا لن يكون مفيدًا جدًا

02:52

for an applicationالوضعية.

57

160320

1416

للتطبيق.

02:53

If we speedسرعة this up
by anotherآخر factorعامل of 10,

58

161760

2496

إذا قمنا بتسريع هذا
بواسطة عامل آخر بمقدار 10

02:56

this is a detectorكاشف runningجري
at fiveخمسة framesإطارات perلكل secondثانيا.

59

164280

2816

فهذا كاشف يعمل
بمعدل خمسة إطارات فى الثانية الواحدة.

02:59

This is a lot better,

60

167120

1536

وهذا أفضل بكثير،

03:00

but for exampleمثال,

61

168680

1976

ولكن على سبيل المثال،

03:02

if there's any significantكبير movementحركة,

62

170680

2296

فإذا كان هناك أي حركة كبيرة،

03:05

I wouldn'tلن want a systemالنظام
like this drivingالقيادة my carسيارة.

63

173000

2560

فلن أحتاج إلى نظام مثل قيادة سيارتي.

03:09

This is our detectionكشف systemالنظام
runningجري in realحقيقة time on my laptopحاسوب محمول.

64

177120

3240

هذا هو نظام الكشف لدينا المشغّل
فى الوقت الحقيقي على كمبيوتري المحمول.

03:13

So it smoothlyبسلاسة tracksالمسارات me
as I moveنقل around the frameالإطار,

65

181000

3136

حيث يتتبعني بسلاسة
بينما أتحرك في جميع أنحاء الإطار،

03:16

and it's robustقوي to a wideواسع varietyتشكيلة
of changesالتغييرات in sizeبحجم,

66

184160

3720

وهي قوى لمجموعة واسعة
من التغيرات في الحجم،

03:21

poseيشير إلى,

67

189440

1200

والتشكيل،

03:23

forwardإلى الأمام, backwardالى الوراء.

68

191280

1856

إلى الأمام وإلى الخلف.

03:25

This is great.

69

193160

1216

هذا عظيم.

03:26

This is what we really need

70

194400

1736

هذا هو حقًا ما نريده

03:28

if we're going to buildبناء systemsأنظمة
on topأعلى of computerالحاسوب visionرؤية.

71

196160

2896

إذا كنا سنبني أنظمة
على رأس رؤية الكمبيوتر.

03:31

(Applauseتصفيق)

72

199080

4000

(تصفيق)

03:36

So in just a fewقليل yearsسنوات,

73

204280

2176

بالتالي في بضع سنوات فقط،

03:38

we'veقمنا goneذهب from 20 secondsثواني perلكل imageصورة

74

206480

2656

فقد انتقلنا من 20 ثانية لكل صورة

03:41

to 20 millisecondsميلي ثانية perلكل imageصورة,
a thousandألف timesمرات fasterبسرعة.

75

209160

3536

إلى 20 جزء من ألف جزء من الثانية لكل صورة،
أسرع بألف مرة.

03:44

How did we get there?

76

212720

1416

كيف وصلنا إلى هناك؟

03:46

Well, in the pastالماضي,
objectموضوع detectionكشف systemsأنظمة

77

214160

3016

حسناً، في الماضي
كانت أنظمة الكشف عن الكائن

03:49

would take an imageصورة like this

78

217200

1936

تأخذ صورة من هذا القبيل

03:51

and splitانشق، مزق it into a bunchباقة of regionsالمناطق

79

219160

2456

وتقوم بتقسيمها إلى مجموعة من المناطق

03:53

and then runيركض a classifierمصنف
on eachكل of these regionsالمناطق,

80

221640

3256

ثم تقوم بتشغيل المصنف
على كلّ من تلك المناطق،

03:56

and highمتوسط scoresدرجات for that classifierمصنف

81

224920

2536

ودرجات عالية من المصنف

03:59

would be consideredاعتبر
detectionsاكتشافات in the imageصورة.

82

227480

3136

ستعتبر بمثابة الكشف عن الصورة.

04:02

But this involvedمتورط runningجري a classifierمصنف
thousandsالآلاف of timesمرات over an imageصورة,

83

230640

4056

ولكن هذا ينطوى على تشغيل المصنف
الآف المرات على الصورة،

04:06

thousandsالآلاف of neuralعصبي networkشبكة الاتصال evaluationsالتقييم
to produceإنتاج detectionكشف.

84

234720

2920

والآلاف من تقييم الشبكة العصبية
لإنتاج الكشف.

04:11

Insteadفي حين أن, we trainedمتدرب a singleغير مرتبطة networkشبكة الاتصال
to do all of detectionكشف for us.

85

239240

4536

وبدلاً من ذلك، فقد قمنا بتدريب شبكة واحدة
للقيام بالكشف كاملاً لنا.

04:15

It producesينتج عنه all of the boundingالمحيط boxesمربعات
and classصف دراسي probabilitiesالاحتمالات simultaneouslyالوقت ذاته.

86

243800

4280

فهي تنتج كافة المربعات المحيطة
وفئة الإحتمالات في آن واحد.

04:20

With our systemالنظام, insteadفي حين أن of looking
at an imageصورة thousandsالآلاف of timesمرات

87

248680

3496

مع نظامنا، بدلاً من البحث
في الصورة لآلاف المرات

04:24

to produceإنتاج detectionكشف,

88

252200

1456

لإنتاج كشفها،

04:25

you only look onceذات مرة,

89

253680

1256

فأنت تنظر مرة واحدة فقط،

04:26

and that's why we call it
the YOLOYOLO methodطريقة of objectموضوع detectionكشف.

90

254960

2920

ولهذا السبب نحن نسميها
طريقة الكشف عن كائن "يولو."

04:31

So with this speedسرعة,
we're not just limitedمحدود to imagesصور;

91

259360

3976

لهذا بهذه السرعة
فنحن لا نقتصر فقط على الصور؛

04:35

we can processمعالج videoفيديو in realحقيقة time.

92

263360

2416

بل نستطيع أن نعالج الفيديو في
الوقت الحقيقي.

04:37

And now, insteadفي حين أن of just seeingرؤية
that catقط and dogالكلب,

93

265800

3096

والآن، بدلاً من مجرد رؤية
ذلك القط والكلب،

04:40

we can see them moveنقل around
and interactتفاعل with eachكل other.

94

268920

2960

نستطيع أن نرى تحركاتهم
وتفاعلهم تجاه بعضهم البعض.

04:46

This is a detectorكاشف that we trainedمتدرب

95

274560

2056

وهذا هو جهاز الكشف الذي قمنا بتدريبه

04:48

on 80 differentمختلف classesالطبقات

96

276640

4376

في 80 فئة مختلفة

04:53

in Microsoft'sمايكروسوفت COCOCOCO datasetبيانات.

97

281040

3256

في مجموعة بيانات "كوكو" ميكروسفت.

04:56

It has all sortsأنواع of things
like spoonملعقة and forkشوكة, bowlعاء,

98

284320

3336

لديها جميع أنواع االأشياء
مثل الملعقة والشوكة والسلطانية.

04:59

commonمشترك objectsشاء like that.

99

287680

1800

الأشياء الشائعة من هذا القبيل.

05:02

It has a varietyتشكيلة of more exoticغريب things:

100

290360

3096

لديها مجموعة متنوعة من أشياء أكثر غرابة:

05:05

animalsالحيوانات, carsالسيارات, zebrasالحمار الوحشي, giraffesالزرافات.

101

293480

3256

مثل الحيوانات والسيارات والحمر الوحشية
والزرافات

05:08

And now we're going to do something funمرح.

102

296760

1936

وسنقوم الآن بشيء مرح.

05:10

We're just going to go
out into the audienceجمهور

103

298720

2096

سنستهدف الجمهور

05:12

and see what kindطيب القلب of things we can detectالكشف.

104

300840

2016

ونرى ما نوع الأشياء التي يمكننا
الكشف عنها.

05:14

Does anyoneأي واحد want a stuffedمحشو animalحيوان?

105

302880

1620

هل من أحد يريد الحيوانات المحنطة؟

05:18

There are some teddyدمية bearsتتحمل out there.

106

306000

1762

توجد بعض الدببة هناك.

05:22

And we can turnمنعطف أو دور down
our thresholdعتبة for detectionكشف a little bitقليلا,

107

310040

4536

ويمكننا أن نخفض العتبة
لدينا للكشف عنه قليلاً،

05:26

so we can find more of you guys
out in the audienceجمهور.

108

314600

3400

لذا فنستطيع أن نجد عددًا أكبر يا رفاق
من ذلك الجمهور.

05:31

Let's see if we can get these stop signsعلامات.

109

319560

2336

لنرى إذا كان يمكننا الحصول
على علامات التوقف هذه.

05:33

We find some backpacksعلى الظهر.

110

321920

1880

نجد بعض حقائب الظهر.

05:37

Let's just zoomتكبير in a little bitقليلا.

111

325880

1840

دعونا فقط نكبّر قليلاً.

05:42

And this is great.

112

330320

1256

وهذا شيء عظيم.

05:43

And all of the processingمعالجة
is happeningحدث in realحقيقة time

113

331600

3176

والتحويل يحدث كلياً
فى الوقت الحقيقي

05:46

on the laptopحاسوب محمول.

114

334800

1200

على الكمبيوتر المحمول.

05:49

And it's importantمهم to rememberتذكر

115

337080

1456

وهذا أمر هام للتذكّر

05:50

that this is a generalجنرال لواء purposeغرض
objectموضوع detectionكشف systemالنظام,

116

338560

3216

وهذا هو الغرض العام
لنظام الكشف عن الكائن،

05:53

so we can trainقطار this for any imageصورة domainنطاق.

117

341800

5000

نستطيع أن نُدرب هذا لأي نطاق للصورة.

06:00

The sameنفسه codeالشفرة that we use

118

348320

2536

نفس التعليمات البرمجية التى نستخدمها

06:02

to find stop signsعلامات or pedestriansالمشاة,

119

350880

2456

لإيجاد علامات التوقف أو المشاة،

06:05

bicyclesدراجات in a self-drivingالقيادة الذاتية vehicleمركبة,

120

353360

1976

والدراجات الهوائية في سيارة ذاتية القيادة

06:07

can be used to find cancerسرطان cellsخلايا

121

355360

2856

يمكن استخدامها لإيجاد الخلايا السرطانية

06:10

in a tissueمناديل ورقية biopsyخزعة.

122

358240

3016

فى عينة من الأنسجة.

06:13

And there are researchersالباحثين around the globeكره ارضيه
alreadyسابقا usingاستخدام this technologyتقنية

123

361280

4040

وهناك باحثون حول العالم
يستخدمون هذه التكنولوجيا بالفعل

06:18

for advancesالتقدم in things
like medicineدواء, roboticsالروبوتات.

124

366240

3416

للتقدم في أمور مثل الطب
وعلم الإنسان الآلي.

06:21

This morningصباح, I readاقرأ a paperورقة

125

369680

1376

فقد قرأت جريدة هذا الصباح

06:23

where they were takingمع الأخذ a censusالتعداد
of animalsالحيوانات in Nairobiنيروبي Nationalالوطني Parkمنتزه

126

371080

4576

حيث أنهم يتخذون إجراء تعداد
للحيوانات فى حديقة وطنية في نيروبي

06:27

with YOLOYOLO as partجزء
of this detectionكشف systemالنظام.

127

375680

3136

مع "يولو" كجزء من نظام الكشف هذا.

06:30

And that's because Darknetداركنت is openفتح sourceمصدر

128

378840

3096

وهذا لأن "داركنيت" هو المصدر المفتوح

06:33

and in the publicعامة domainنطاق,
freeحر for anyoneأي واحد to use.

129

381960

2520

وفى المجال العام،
كما أنه مجاناً لأي شخص ليستخدمه.

06:37

(Applauseتصفيق)

130

385600

5696

(تصفيق)

06:43

But we wanted to make detectionكشف
even more accessibleيمكن الوصول and usableصالح للإستعمال,

131

391320

4936

ولكننا أردنا جعل الوصول
إلى الكشف أكتر سهولة وكذلك استعماله،

06:48

so throughعبر a combinationمزيج
of modelنموذج optimizationالاقوي,

132

396280

4056

وذلك من خلال الجمع بين النموذج الأمثل،

06:52

networkشبكة الاتصال binarizationbinarization and approximationتقريب,

133

400360

2296

ووضغ البيانات على شكل ثنائي
والقيمة التقريبية،

06:54

we actuallyفعلا have objectموضوع detectionكشف
runningجري on a phoneهاتف.

134

402680

3920

ولدينا بالفعل كاشف مواد يعمل
على الهاتف المحمول.

07:04

(Applauseتصفيق)

135

412800

5320

(تصفيق)

07:10

And I'm really excitedفرح because
now we have a prettyجميلة powerfulقوي solutionحل

136

418960

5056

وأنا متحمس حقًا لأنه لدينا
الآن حل قوي جداً

07:16

to this low-levelمستوى منخفض computerالحاسوب visionرؤية problemمشكلة,

137

424040

2296

لمشكلة رؤية الكمبيوتر ذات المستوى المنخفض،

07:18

and anyoneأي واحد can take it
and buildبناء something with it.

138

426360

3856

ويستطيع أي شخص أخذها
وبناء شيء باستخدامها.

07:22

So now the restراحة is up to all of you

139

430240

3176

لذا، البقية الآن متروكة لكم جميعاً

07:25

and people around the worldالعالمية
with accessالتمكن من to this softwareالبرمجيات,

140

433440

2936

والناس حول العالم ممن لهم إمكانية
وصول إلى هذا البرنامج،

07:28

and I can't wait to see what people
will buildبناء with this technologyتقنية.

141

436400

3656

ولا أستطيع الانتظار كي أرى ما سيبنيه
الناس باستخدام هذه التكنولوجيا.

07:32

Thank you.

142

440080

1216

شكراً لكم.

07:33

(Applauseتصفيق)

143

441320

3440

(تصفيق)

Translated by Abd El-Rahman Malek
Reviewed by Riyad Almubarak

ABOUT THE SPEAKER

Joseph Redmon - Computer scientist
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.

Why you should listen

Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.

Redmon is also internet-famous for his resume.

More profile about the speaker
Joseph Redmon | Speaker | TED.com

THE ORIGINAL VIDEO ON TED.COM

جوزيف ريدمود: كيف يتعلم الحاسوب التعرف على الأشياء فورًا؟ | TED Talk | TED.com