ABOUT THE SPEAKER
Joseph Redmon - Computer scientist
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.

Why you should listen

Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.

Redmon is also internet-famous for his resume.

More profile about the speaker
Joseph Redmon | Speaker | TED.com
TED2017

Joseph Redmon: How computers learn to recognize objects instantly

جوزف ردمون: چگونه یک کامپیوتر یاد می‌گیرد تا فورا یک شی را بازشناسی کند

Filmed:
2,471,805 views

۱۰ سال قبل، محققان فکر می‌کردند که گفتن فرق بین یک گربه و یک سگ به یک کامپیوتر غیر ممکن است. امروزه، سیستم‌های بینایی کامپیوتر این را با دقت بهتر از ۹۹ درصد انجام می‌دهد. چگونه؟ جوزف ردمون روی یک سیتم YOLO(تو فقط یک بار نگاه کن) کار می‌کند، یک متد منبع آزاد برای یافتن اشیایی که می‌توانند در تصویر و ویدیو-- از گورخر تا علامت ایست-- با سرعت رعد و برق شناسایی شوند. در یک نمایش زنده قابل توجه، ردمون این پله مهم رو به جلو برای کاربردهایی مانند خودروهای خودران، رباتیک و حتی شناسایی سرطان به نمایش می‌گذارد
- Computer scientist
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio

Double-click the English transcript below to play the video.

00:12
Tenده yearsسالها agoپیش,
0
825
1151
۱۰ سال قبل
00:14
computerکامپیوتر visionچشم انداز researchersمحققان
thought that gettingگرفتن a computerکامپیوتر
1
2000
2776
محققان بینایی ماشین فکر کردند که
00:16
to tell the differenceتفاوت
betweenبین a catگربه and a dogسگ
2
4800
2696
گفتن فرق بین گربه و سگ به کامپیوتر
00:19
would be almostتقریبا impossibleغیرممکن است,
3
7520
1976
تقریبا غیرممکن خواهد بود،
00:21
even with the significantقابل توجه advanceپیشرفت
in the stateحالت of artificialمصنوعی intelligenceهوش.
4
9520
3696
حتی با پیشرفت‌های قابل توجه در
هوش مصنوعی.
00:25
Now we can do it at a levelسطح
greaterبزرگتر than 99 percentدرصد accuracyدقت.
5
13240
3560
حالا ما می‌توانیم این را با
دقت بیشتر از ۹۹ درصد انجام بدیم
00:29
This is calledبه نام imageتصویر classificationطبقه بندی --
6
17680
1856
این را دسته بندی تصویر می‌گویند--
00:31
give it an imageتصویر,
put a labelبرچسب to that imageتصویر --
7
19560
3096
یک تصویر بهش بده و یک برچسب به تصویر بزن--
00:34
and computersکامپیوترها know
thousandsهزاران نفر of other categoriesدسته بندی ها as well.
8
22680
3040
و کامپیوترها هزاران دسته بندی دیگر را
نیز به خوبی می‌دانند.
00:38
I'm a graduateفارغ التحصیل studentدانشجو
at the Universityدانشگاه of Washingtonواشنگتن,
9
26680
2896
من دانشجوی ارشد از
دانشگاه واشنگتن هستم
00:41
and I work on a projectپروژه calledبه نام DarknetDarknet,
10
29600
1896
و مشغول کار روی پروژه‌
دارک‌نت (شبکه سیاه)
00:43
whichکه is a neuralعصبی networkشبکه frameworkچارچوب
11
31520
1696
که در چارچوب شبکه عصبی است
00:45
for trainingآموزش and testingآزمایش کردن
computerکامپیوتر visionچشم انداز modelsمدل ها.
12
33240
2816
برای آموزش دادن و تست کردن
مدلهای بینایی کامیپوتر.
00:48
So let's just see what DarknetDarknet thinksفکر می کند
13
36080
2976
خب بیاید به چگونگی فکر کردن
دارک‌نت
00:51
of this imageتصویر that we have.
14
39080
1760
به این تصاویری که داریم، نگاه کنیم.
00:54
When we runاجرا کن our classifierطبقه بندی
15
42520
2336
وقتی طبقه بندیمان را روی این تصاویر
00:56
on this imageتصویر,
16
44880
1216
اجرا می‌کنیم.
00:58
we see we don't just get
a predictionپیش بینی of dogسگ or catگربه,
17
46120
2456
می‌بینیم که فقط پیش‌بینی
سگ یا گربه بودن نیست.
01:00
we actuallyدر واقع get
specificخاص breedنژاد predictionsپیش بینی ها.
18
48600
2336
در واقع نژاد پیش‌بینی‌ها را نیز می‌گوییم.
01:02
That's the levelسطح
of granularityدانه دانه بودن we have now.
19
50960
2176
این سطح جزئیاتی است که الان داریم
01:05
And it's correctدرست.
20
53160
1616
و صحیح است.
01:06
My dogسگ is in factواقعیت a malamuteمالاموت.
21
54800
1840
سگ من در حقیقت مالاموت است.
01:09
So we'veما هستیم madeساخته شده amazingحیرت آور stridesگام ها
in imageتصویر classificationطبقه بندی,
22
57040
4336
خب گام‌های حیرت آوری
در دسته بندی تصاویر ساخته‌ایم،
01:13
but what happensاتفاق می افتد
when we runاجرا کن our classifierطبقه بندی
23
61400
2000
اما چه اتفاقی میفتد
وقتی طبقه‌بندمان را
01:15
on an imageتصویر that looksبه نظر می رسد like this?
24
63424
1960
روی تصویری مثل
این اجرا می‌کنیم؟
01:19
Well ...
25
67080
1200
خب...
01:24
We see that the classifierطبقه بندی comesمی آید back
with a prettyبسیار similarمشابه predictionپیش بینی.
26
72640
3896
می‌بینیم که طبقه‌بند با یک
پیش‌بینی خیلی مشابه باز میگردد.
01:28
And it's correctدرست,
there is a malamuteمالاموت in the imageتصویر,
27
76560
3096
و درسته،
یک مالاموت در تصویر وجود دارد،
01:31
but just givenداده شده this labelبرچسب,
we don't actuallyدر واقع know that much
28
79680
3696
اما فقط یک برچسب داده شده،
در واقع خیلی درباره
01:35
about what's going on in the imageتصویر.
29
83400
1667
اینکه در تصویر
چه رخ داده نمیدانیم.
01:37
We need something more powerfulقدرتمند.
30
85091
1560
به چیزی قویتری نیاز داریم.
01:39
I work on a problemمسئله
calledبه نام objectشی detectionتشخیص,
31
87240
2616
من روی یک مسئله کار می‌کنم که
یافتن اشیا نامیده می‌شود،
01:41
where we look at an imageتصویر
and try to find all of the objectsاشیاء,
32
89880
2936
وقتی به تصویری نگاه می کنیم
و سعی در یافتن تمام اشیا داریم،
01:44
put boundingمحدود کردن boxesجعبه ها around them
33
92840
1456
آنها را داخل مستطیلهای نمایش
گذاشته
01:46
and say what those objectsاشیاء are.
34
94320
1520
و می‌گوییم که این اشیا
چه هستند.
01:48
So here'sاینجاست what happensاتفاق می افتد
when we runاجرا کن a detectorآشکارساز on this imageتصویر.
35
96400
3280
خب، این چیزی است که
وقتی یابنده را اجرا کنیم اتفاق میافتد.
01:53
Now, with this kindنوع of resultنتيجه,
36
101240
2256
حالا، با این نتایج،
01:55
we can do a lot more
with our computerکامپیوتر visionچشم انداز algorithmsالگوریتم ها.
37
103520
2696
میتوانیم کمی بیشتربا الگوریتم
بینای کامپیوترمان کار کنیم.
01:58
We see that it knowsمی داند
that there's a catگربه and a dogسگ.
38
106240
2976
میبینیم همانطور که می‌دانید
یک گربه و یک سگ وجود دارد.
02:01
It knowsمی داند theirخودشان relativeنسبت فامیلی locationsمکان ها,
39
109240
2256
و محلهای نسبی و اندازه
02:03
theirخودشان sizeاندازه.
40
111520
1216
آنها را می‌داند.
02:04
It mayممکن است even know some extraاضافی informationاطلاعات.
41
112760
1936
حتی شاید کمی
اطلاعات اضافی نیز بدانیم.
02:06
There's a bookکتاب sittingنشسته in the backgroundزمینه.
42
114720
1960
در پس زمینه هم یک کتاب قرار دارد.
02:09
And if you want to buildساختن a systemسیستم
on topبالا of computerکامپیوتر visionچشم انداز,
43
117280
3256
و اگر شما بخواید یک سیستم
در صدر بینایی کامپیوتر بسازید،
02:12
say a self-drivingخود رانندگی vehicleوسیله نقلیه
or a roboticروباتیک systemسیستم,
44
120560
3456
مثل یک خودروی خودران یا یک سیستم رباتیکی،
02:16
this is the kindنوع
of informationاطلاعات that you want.
45
124040
2456
این نوع اطلاعاتی است که می‌خواهید.
02:18
You want something so that
you can interactتعامل with the physicalفیزیکی worldجهان.
46
126520
3239
چیزی می‌خواهید که بین شما
و دنیای فیزیکی تعامل کند.
02:22
Now, when I startedآغاز شده workingکار کردن
on objectشی detectionتشخیص,
47
130759
2257
حالا وقتی من یافتن اشیا را شروع کردم.
02:25
it tookگرفت 20 secondsثانیه
to processروند a singleتنها imageتصویر.
48
133040
3296
۲۰ ثانیه طول کشید
تا تصویر را پردازش کند.
02:28
And to get a feel for why
speedسرعت is so importantمهم in this domainدامنه,
49
136360
3880
و برای اینکه حس کنید چرا
سرعت در این حوزه خیلی مهم است،
02:33
here'sاینجاست an exampleمثال of an objectشی detectorآشکارساز
50
141120
2536
اینجا یک مثال از یافتن اشیا داریم
02:35
that takes two secondsثانیه
to processروند an imageتصویر.
51
143680
2416
که ۲ ثانیه طول می‌کشد
تا تصویری را پردازش کند.
02:38
So this is 10 timesبار fasterسریعتر
52
146120
2616
خب این ۱۰ برابر سریعتر
02:40
than the 20-seconds-per-image-seconds-per-image detectorآشکارساز,
53
148760
3536
از یابنده ۲۰ ثانیه بر تصویر است.
02:44
and you can see that by the time
it makesباعث می شود predictionsپیش بینی ها,
54
152320
2656
و شما این پیش‌بینی‌ها را
می‌توانید همزمان ببینید،
02:47
the entireکل stateحالت of the worldجهان has changedتغییر کرد,
55
155000
2040
کل جهان تغییر کرده است،
02:49
and this wouldn'tنمی خواهم be very usefulمفید است
56
157880
2416
و این برای یک برنامه خیلی مفید
02:52
for an applicationکاربرد.
57
160320
1416
نخواهد بود.
02:53
If we speedسرعت this up
by anotherیکی دیگر factorعامل of 10,
58
161760
2496
اگر این را با یک فاکتور دیگر
۱۰ برابر سریعتر کنیم
02:56
this is a detectorآشکارساز runningدر حال اجرا
at fiveپنج framesفریم ها perدر هر secondدومین.
59
164280
2816
این یابنده با ۵ فریم
بر ثانیه اجرا خواهد شد.
02:59
This is a lot better,
60
167120
1536
این بسیار بهتر است،
03:00
but for exampleمثال,
61
168680
1976
اما برای مثال،
03:02
if there's any significantقابل توجه movementجنبش,
62
170680
2296
اگر هر حرکت قابل توجهی وجود داشته باشد،
03:05
I wouldn'tنمی خواهم want a systemسیستم
like this drivingرانندگی my carماشین.
63
173000
2560
نمی‌خواهم که
سیستمی شبیه این، ماشینم را براند.
03:09
This is our detectionتشخیص systemسیستم
runningدر حال اجرا in realواقعی time on my laptopلپ تاپ.
64
177120
3240
این سیستم یابنده ماست
که در زمان حقیقی روی لپ تاپ‌م اجرا می‌شود.
03:13
So it smoothlyبه نرمی tracksآهنگ های me
as I moveحرکت around the frameفریم,
65
181000
3136
خب به آرامی من را دنبال می‌کند
بطوریکه من دور فریم حرکت می‌کنم،
03:16
and it's robustقدرتمند to a wideوسیع varietyتنوع
of changesتغییرات in sizeاندازه,
66
184160
3720
و این شیوه مواجه با انواع
تغییرات در اندازه
03:21
poseژست,
67
189440
1200
ژست،
03:23
forwardرو به جلو, backwardبه عقب.
68
191280
1856
رو به جلو،رو به پشت است.
03:25
This is great.
69
193160
1216
این عالیه.
03:26
This is what we really need
70
194400
1736
این چیزیست که واقعا نیاز داریم
03:28
if we're going to buildساختن systemsسیستم های
on topبالا of computerکامپیوتر visionچشم انداز.
71
196160
2896
اگر بخواهیم سیستمی را
در صدر بینایی کامپیوترها بسازیم.
03:31
(Applauseتشویق و تمجید)
72
199080
4000
(تشویق)
03:36
So in just a fewتعداد کمی yearsسالها,
73
204280
2176
خب، ظرف فقط چند سال،
03:38
we'veما هستیم goneرفته from 20 secondsثانیه perدر هر imageتصویر
74
206480
2656
ما از ۲۰ ثانیه درتصویر به
03:41
to 20 millisecondsمیلی ثانیه perدر هر imageتصویر,
a thousandهزار timesبار fasterسریعتر.
75
209160
3536
۲۰ میلی ثانیه بر تصویر رفتیم،
هزار بار سریعتر.
03:44
How did we get there?
76
212720
1416
چطور به اینجا رسیدیم؟
03:46
Well, in the pastگذشته,
objectشی detectionتشخیص systemsسیستم های
77
214160
3016
خب، در گذشته،
سیستم‌های یافتن اشیا
03:49
would take an imageتصویر like this
78
217200
1936
تصویری شبیه این می‌گرفتند
03:51
and splitشکاف it into a bunchدسته ای of regionsمناطق
79
219160
2456
و آن را به بسیاری از مناطق تقسیم می‌کردند
03:53
and then runاجرا کن a classifierطبقه بندی
on eachهر یک of these regionsمناطق,
80
221640
3256
و سپس برای هر یک از این مناطق
یک دسته بند را اجرا می‌کردند
03:56
and highبالا scoresنمرات for that classifierطبقه بندی
81
224920
2536
و بالاترین امتیاز برای این دسته بندیها
03:59
would be consideredدر نظر گرفته شده
detectionsتشخیص in the imageتصویر.
82
227480
3136
به عنوان تصویر یافته شده
در نظر گرفته میشد.
04:02
But this involvedگرفتار runningدر حال اجرا a classifierطبقه بندی
thousandsهزاران نفر of timesبار over an imageتصویر,
83
230640
4056
اما این هزاران بار اجرا کردن یک دسته بند
روی یک تصویر را شامل می‌شد،
04:06
thousandsهزاران نفر of neuralعصبی networkشبکه evaluationsارزیابی ها
to produceتولید کردن detectionتشخیص.
84
234720
2920
هزاران شبکه عصبی ارزیابی می‌کردند تا
"یافتن" را تولید کنند.
04:11
Insteadبجای, we trainedآموزش دیده a singleتنها networkشبکه
to do all of detectionتشخیص for us.
85
239240
4536
درعوض، ما یک تک شبکه را آموزش دادیم
تا کل یافتنها را برای ما انجام دهد.
04:15
It producesتولید می کند all of the boundingمحدود کردن boxesجعبه ها
and classکلاس probabilitiesاحتمالات simultaneouslyهمزمان.
86
243800
4280
همه باندهای محدود را تولید و
همه احتمالات را با هم کلاس بندی می‌کند.
04:20
With our systemسیستم, insteadبجای of looking
at an imageتصویر thousandsهزاران نفر of timesبار
87
248680
3496
با یک سیستم، به جای نگاه کردن
به یک تصویر برای هزاران بار
04:24
to produceتولید کردن detectionتشخیص,
88
252200
1456
برای تولید یافتن
04:25
you only look onceیک بار,
89
253680
1256
شما فقط یک بار نگاه می‌کنید،
04:26
and that's why we call it
the YOLOYOLO methodروش of objectشی detectionتشخیص.
90
254960
2920
و به همین دلیل ما آن را
متد YOLO برای یافتن اشیا نامیدیم.
04:31
So with this speedسرعت,
we're not just limitedمحدود to imagesتصاویر;
91
259360
3976
خب، با این سرعت
ما فقط به یک تصویر محدود نیستیم:
04:35
we can processروند videoویدئو in realواقعی time.
92
263360
2416
همچنین می‌توانیم ویدیو را نیز همزمان
پردازش کنیم.
04:37
And now, insteadبجای of just seeingدیدن
that catگربه and dogسگ,
93
265800
3096
و حالا، به جای نگاه کردن به گربه و سگ
04:40
we can see them moveحرکت around
and interactتعامل with eachهر یک other.
94
268920
2960
می‌توانیم حرکت و تعامل آنها
با یکدیگر را نیز ببینیم.
04:46
This is a detectorآشکارساز that we trainedآموزش دیده
95
274560
2056
این یابنده‌ای است که ما
04:48
on 80 differentناهمسان classesکلاس ها
96
276640
4376
در ۸۰ کلاس مختلف دردر دیتاست
04:53
in Microsoft'sمایکروسافت COCOCOCO datasetمجموعه داده.
97
281040
3256
coco مایکروسافت آموزش دادیم.
04:56
It has all sortsانواع of things
like spoonقاشق and forkچنگال, bowlکاسه,
98
284320
3336
انواع اشیاء مثل
قاشق، چنگال، کاسه را دارد
04:59
commonمشترک objectsاشیاء like that.
99
287680
1800
اشیا معمولی مانند این.
05:02
It has a varietyتنوع of more exoticعجیب و غریب things:
100
290360
3096
تنوع عجیب و غریبی از اشیا را دارد:
05:05
animalsحیوانات, carsماشین ها, zebrasژیرو, giraffesزرافه ها.
101
293480
3256
حیوانات، ماشین ها، گورخرها، زرافه‌ها.
05:08
And now we're going to do something funسرگرم کننده.
102
296760
1936
و حالا میخواهیم یک کار مفرح انجام دهیم.
05:10
We're just going to go
out into the audienceحضار
103
298720
2096
فقط میخواهیم بیایم بیرون در بین مخاطبان
05:12
and see what kindنوع of things we can detectتشخیص.
104
300840
2016
و ببینیم چه چیزهایی را می‌توانیم بیابیم.
05:14
Does anyoneهر کسی want a stuffedپر شده animalحیوانات?
105
302880
1620
آیا کسی یک حیوان پر شده می‌خواهد؟
05:18
There are some teddyعروسکی bearsخرس ها out there.
106
306000
1762
تعدادی خرس عروسکی اینجا هست.
05:22
And we can turnدور زدن down
our thresholdآستانه for detectionتشخیص a little bitبیت,
107
310040
4536
و ما میتوانیم آستانه خود
در یافتن را کمی کاهش دهیم،
05:26
so we can find more of you guys
out in the audienceحضار.
108
314600
3400
خب می‌توانیم شما آقایان را در
بین مخاطبین پیدا کنیم.
05:31
Let's see if we can get these stop signsعلائم.
109
319560
2336
ببینیم آیا میتوان این
علامتهای ایست را یافت.
05:33
We find some backpacksکوله پشتی.
110
321920
1880
ما تعدادی کوله پشتی یافتیم
05:37
Let's just zoomبزرگنمایی in a little bitبیت.
111
325880
1840
بیاید فقط کمی زوم کنیم.
05:42
And this is great.
112
330320
1256
و این عالیه.
05:43
And all of the processingدر حال پردازش
is happeningاتفاق می افتد in realواقعی time
113
331600
3176
و تمام این اتفاقات در زمان واقعی اتفاق میافتد.
05:46
on the laptopلپ تاپ.
114
334800
1200
روی لپ تاپ.
05:49
And it's importantمهم to rememberیاد آوردن
115
337080
1456
و مهم است به خاطر داشته باشید
05:50
that this is a generalعمومی purposeهدف
objectشی detectionتشخیص systemسیستم,
116
338560
3216
که این یک سیستم یابنده
اشیا همه منظوره است،
05:53
so we can trainقطار this for any imageتصویر domainدامنه.
117
341800
5000
خب ما میتوانیم این را
برای هر حوزه تصویری آموزش دهیم.
06:00
The sameیکسان codeکد that we use
118
348320
2536
همان کدی است که ما استفاده کردیم
06:02
to find stop signsعلائم or pedestriansعابر پیاده,
119
350880
2456
تا علامت ایست یا عابرپیاده،
06:05
bicyclesدوچرخه in a self-drivingخود رانندگی vehicleوسیله نقلیه,
120
353360
1976
دوچرخه در یک خودروی خودران را پیدا کنیم،
06:07
can be used to find cancerسرطان cellsسلول ها
121
355360
2856
میتواند برای یافتن سلولهای سرطانی
06:10
in a tissueبافت biopsyبیوپسی.
122
358240
3016
دریک نمونه برداری بافت استفاده شود.
06:13
And there are researchersمحققان around the globeجهان
alreadyقبلا usingاستفاده كردن this technologyتکنولوژی
123
361280
4040
و محققانی در سراسر جهان وجود دارند
همچنین این سیستم را
06:18
for advancesپیشرفت in things
like medicineدارو, roboticsروباتیک.
124
366240
3416
برای چیزهای پیشرفته مانند دارو
روباتیک استفاده می‌کنند.
06:21
This morningصبح, I readخواندن a paperکاغذ
125
369680
1376
امروز صبح، مقاله‌ای خواندم.
06:23
where they were takingگرفتن a censusسرشماری
of animalsحیوانات in Nairobiنایروبی Nationalملی Parkپارک
126
371080
4576
جایی یک صحبتی بود از سرشماری حیوانات
پارک ملی نایروبی
06:27
with YOLOYOLO as partبخشی
of this detectionتشخیص systemسیستم.
127
375680
3136
با سیستم YOLO به عنوانی
بخشی از این سیستم یابنده.
06:30
And that's because DarknetDarknet is openباز کن sourceمنبع
128
378840
3096
و این به خاطر این است
که دارکنت منبع آزاد است
06:33
and in the publicعمومی domainدامنه,
freeرایگان for anyoneهر کسی to use.
129
381960
2520
ودر حوزه عمومی برای
استفاده همگان آزاد است.
06:37
(Applauseتشویق و تمجید)
130
385600
5696
(تشویق)
06:43
But we wanted to make detectionتشخیص
even more accessibleدر دسترس and usableقابل استفاده,
131
391320
4936
اما می‌خواهیم یافتن را حتی
در دسترس‌تر و قابل استفاده‌تر کنیم
06:48
so throughاز طریق a combinationترکیبی
of modelمدل optimizationبهينه سازي,
132
396280
4056
بنابراین ازطریق ترکیب مدلهای بهینه
06:52
networkشبکه binarizationتقسیم بندی and approximationتقریبی,
133
400360
2296
شبکه تقسیم بندی شده و تقریبی
06:54
we actuallyدر واقع have objectشی detectionتشخیص
runningدر حال اجرا on a phoneتلفن.
134
402680
3920
ما در واقع در حال اجرای
یافتن اشیا روی گوشی هستیم.
07:04
(Applauseتشویق و تمجید)
135
412800
5320
(تشویق)
07:10
And I'm really excitedبرانگیخته because
now we have a prettyبسیار powerfulقدرتمند solutionراه حل
136
418960
5056
و من خیلی هیجان زده هستم
زیرا حالا یک راه حل خیلی قدرتمند
07:16
to this low-levelسطح پایین computerکامپیوتر visionچشم انداز problemمسئله,
137
424040
2296
برای این مسئله سطح پایین
بینایی کامپیوتر داریم.
07:18
and anyoneهر کسی can take it
and buildساختن something with it.
138
426360
3856
و هرکسی می‌تواند این را بردارد
و یک چیزی با آن بسازد.
07:22
So now the restباقی مانده is up to all of you
139
430240
3176
خب حالا دیگر بقیه آن به شما و مردم جهان
07:25
and people around the worldجهان
with accessدسترسی به to this softwareنرم افزار,
140
433440
2936
با دسترسی به این نرم افزار بستگی دارد.
07:28
and I can't wait to see what people
will buildساختن with this technologyتکنولوژی.
141
436400
3656
و من نمی‌توانم صبر کنم ببینم
مردم با این تکنولوژی چه خواهند ساخت.
07:32
Thank you.
142
440080
1216
متشکرم.
07:33
(Applauseتشویق و تمجید)
143
441320
3440
(تشویق)
Translated by morteza homayounfar
Reviewed by Leila Ataei

▲Back to top

ABOUT THE SPEAKER
Joseph Redmon - Computer scientist
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.

Why you should listen

Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.

Redmon is also internet-famous for his resume.

More profile about the speaker
Joseph Redmon | Speaker | TED.com