ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com
TED2015

Fei-Fei Li: How we're teaching computers to understand pictures

Фей-Фей Лі: Як ми вчимо комп'ютери розуміти зображення

Filmed:
2,702,344 views

Коли немовля дивиться на фото, воно може розрізняти прості елементи: кота, книжку, стілець. Зараз комп'ютери достатньо розумні, щоб робити те саме. Що далі? У своїй захоплюючій доповіді експерт з комп'ютерного бачення Фей-Фей Лі розповідає про останні досягнення (включаючи базу даних з 15 мільйонів зображень, створену її командою, щоб навчити комп'ютер розуміти зображення) і плани на майбутнє.
- Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio

Double-click the English transcript below to play the video.

00:14
Let me showпоказати you something.
0
2366
3738
Дозвольте вам дещо показати.
00:18
(VideoВідео) GirlДівчина: Okay, that's a catкот
sittingсидячи in a bedліжко.
1
6104
4156
(Відео) Дівчинка: Так, це кіт,
який сидить на ліжку.
00:22
The boyхлопчик is pettingПеттінг the elephantслон.
2
10260
4040
Хлопчик гладить слона.
00:26
Those are people
that are going on an airplaneлітак.
3
14300
4354
Ті люди сідають в літак.
00:30
That's a bigвеликий airplaneлітак.
4
18654
2810
Літак дуже великий.
00:33
Fei-FeiФей Фей LiЛі: This is
a three-year-oldтрирічна childдитина
5
21464
2206
Фей-Фей Лі: Це трирічна дитина,
00:35
describingописуючи what she seesбачить
in a seriesсерія of photosфотографії.
6
23670
3679
яка описує те,
що бачить на фотографіях.
00:39
She mightможе still have a lot
to learnвчитися about this worldсвіт,
7
27349
2845
Ще багато чого їй треба
вивчити про цей світ,
00:42
but she's alreadyвже an expertексперт
at one very importantважливо taskзавдання:
8
30194
4549
проте вже зараз їй під силу
одне дуже важливе завдання:
00:46
to make senseсенс of what she seesбачить.
9
34743
2846
вона розуміє, що вона бачить.
00:50
Our societyсуспільство is more
technologicallyтехнологічно advancedпросунутий than ever.
10
38229
4226
Наше суспільство найбільш технологічно
розвинене, ніж будь-коли.
00:54
We sendвідправити people to the moonмісяць,
we make phonesтелефони that talk to us
11
42455
3629
Ми відправляємо людей на місяць,
ми створюємо телефони, які говорять,
00:58
or customizeналаштовувати radioрадіо stationsстанції
that can playграти only musicмузика we like.
12
46084
4946
ми налаштовуємо радіостанції так,
щоб вони грали лише нашу улюблену музику.
01:03
YetЩе, our mostнайбільше advancedпросунутий
machinesмашини and computersкомп'ютери
13
51030
4055
Проте наші найбільш передові
механізми і комп'ютери
01:07
still struggleборотьба at this taskзавдання.
14
55085
2903
все ще не можуть впоратися
з цим завданням.
01:09
So I'm here todayсьогодні
to give you a progressпрогрес reportзвіт
15
57988
3459
Сьогодні я тут, щоб розповісти вам
про найостанніші досягнення
01:13
on the latestостанній advancesаванси
in our researchдослідження in computerкомп'ютер visionбачення,
16
61447
4047
у наших дослідженнях
комп'ютерного розпізнавання об'єктів,
01:17
one of the mostнайбільше frontierприкордонної
and potentiallyпотенційно revolutionaryреволюційний
17
65494
4161
однієї з найбільш передових
і потенційно революційних
01:21
technologiesтехнології in computerкомп'ютер scienceнаука.
18
69655
3206
технологій в комп'ютерній науці.
01:24
Yes, we have prototypedдосліджуємо carsавтомобілі
that can driveїхати by themselvesсамі,
19
72861
4551
Так, ми розробили прототипи машин,
які можуть самостійно рухатися,
01:29
but withoutбез smartрозумний visionбачення,
they cannotне можу really tell the differenceрізниця
20
77412
3853
але без розумного розпізнавання,
для них не буде різниці
01:33
betweenміж a crumpledм'ята paperпапір bagсумка
on the roadдорога, whichкотрий can be runбіжи over,
21
81265
3970
між зім'ятим пакетом на дорозі,
по якому можна проїхати,
01:37
and a rockрок that sizeрозмір,
whichкотрий should be avoidedуникати.
22
85235
3340
і камінням такого розміру,
що його краще об'їхати.
01:41
We have madeзроблений fabulousказковий megapixelмегапіксельною camerasкамери,
23
89415
3390
Ми створили неймовірні
мегапіксельні фотокамери,
01:44
but we have not deliveredдоставлений
sightвидовище to the blindсліпий.
24
92805
3135
але ми не навчили сліпих бачити.
01:48
DronesБезпілотних літаків can flyлітати over massiveмасивний landземля,
25
96420
3305
Безпілотні літаки можуть літати
на величезні відстані, але не мають
01:51
but don't have enoughдостатньо visionбачення technologyтехнологія
26
99725
2134
достатніх
розпізнавальних технологій,
01:53
to help us to trackтрек
the changesзміни of the rainforestsтропічні ліси.
27
101859
3461
щоб допомогти нам прослідкувати
за змінами в тропічних лісах.
01:57
SecurityБезпека camerasкамери are everywhereскрізь,
28
105320
2950
Ми скрізь маємо камери
відеоспостереження,
02:00
but they do not alertоповіщення us when a childдитина
is drowningутоплення in a swimmingплавання poolбасейн.
29
108270
5067
але вони не попереджають нас,
коли дитина тоне в басейні.
02:06
PhotosФотографії and videosвідеоролики are becomingстає
an integralневід'ємною partчастина of globalглобальний life.
30
114167
5595
Фото та відео стали
невід'ємними частинами глобального життя.
02:11
They're beingбуття generatedзгенерований at a paceтемп
that's farдалеко beyondдалі what any humanлюдина,
31
119762
4087
Вони накопичуються з такою швидкістю,
що людина або група людей
02:15
or teamsкоманд of humansлюди, could hopeнадія to viewвид,
32
123849
2783
не можуть навіть сподіватися на те,
щоб переглянути їх усі,
02:18
and you and I are contributingсприяючи
to that at this TEDТЕД.
33
126632
3921
і ми з вами робимо свій внесок
у це на TED сьогодні.
02:22
YetЩе our mostнайбільше advancedпросунутий softwareпрограмне забезпечення
is still strugglingбореться at understandingрозуміння
34
130553
5232
Проте наші найпередовіші програми
все ще намагаються навчитися
02:27
and managingуправління this enormousвеличезний contentзміст.
35
135785
3876
керувати цією численною
базою даних.
02:31
So in other wordsслова,
collectivelyколективно as a societyсуспільство,
36
139661
5272
Іншими словами,
ми всі як суспільство
02:36
we're very much blindсліпий,
37
144933
1746
залишаємося достатньо сліпими,
02:38
because our smartestнайрозумніший
machinesмашини are still blindсліпий.
38
146679
3387
оскільки наші найрозумніші машини
все ще сліпі.
02:43
"Why is this so hardважко?" you mayможе askзапитай.
39
151526
2926
Ви можете запитати:
"Чому це так важко?"
02:46
CamerasКамери can take picturesмалюнки like this one
40
154452
2693
Камери роблять знімки,
такі як ось цей,
02:49
by convertingперетворення lightsвогні into
a two-dimensionalдвовимірні arrayмасив of numbersномери
41
157145
3994
шляхом перетворення світла
на двовимірну сукупність цифр,
02:53
knownвідомий as pixelsпікселів,
42
161139
1650
відомих як пікселі,
02:54
but these are just lifelessмляві numbersномери.
43
162789
2251
але це лише мертві цифри.
02:57
They do not carryносити meaningсенс in themselvesсамі.
44
165040
3111
Вони самі по собі не несуть значення.
03:00
Just like to hearпочуй is not
the sameтой же as to listen,
45
168151
4343
Так само, як слухати
не одне й те саме, що чути,
03:04
to take picturesмалюнки is not
the sameтой же as to see,
46
172494
4040
робити фото не одне й те саме,
що бачити,
03:08
and by seeingбачачи,
we really mean understandingрозуміння.
47
176534
3829
а під баченням ми маємо на увазі
розуміння.
03:13
In factфакт, it tookвзяв MotherМатері NatureПрирода
540 millionмільйон yearsроків of hardважко work
48
181293
6177
Насправді, матері природі
знадобилося 540 млн. років важкої роботи,
03:19
to do this taskзавдання,
49
187470
1973
щоб впоратися з цим завданням,
03:21
and much of that effortзусилля
50
189443
1881
і більшість з її зусиль
03:23
wentпішов into developingрозвивається the visualвізуальний
processingобробка apparatusапарат of our brainsмозок,
51
191324
5271
було спрямовано на розвиток в нашому мозку
органу з обробки візуальної інформації,
03:28
not the eyesочі themselvesсамі.
52
196595
2647
і це не лише очі.
03:31
So visionбачення beginsпочинається with the eyesочі,
53
199242
2747
Бачення розпочинається з очей,
03:33
but it trulyсправді takes placeмісце in the brainмозок.
54
201989
3518
але насправді відбувається в мозку.
03:38
So for 15 yearsроків now, startingпочинаючи
from my PhРН.D. at CaltechКаліфорнійського технологічного інституту
55
206287
5060
Вже 15 років, починаючи з
отримання докторського ступеня в Калтех
03:43
and then leadingпровідний Stanford'sСтенфордського університету VisionБачення LabЛабораторія,
56
211347
2926
і потім, очоливши
Стенфордську лабораторію Vision Lab,
03:46
I've been workingпрацює with my mentorsнаставники,
collaboratorsСпівробітники and studentsстуденти
57
214273
4396
я працюю з моїми наставниками,
співробітниками і студентами,
03:50
to teachвчити computersкомп'ютери to see.
58
218669
2889
щоб навчити комп'ютери бачити.
03:54
Our researchдослідження fieldполе is calledназивається
computerкомп'ютер visionбачення and machineмашина learningнавчання.
59
222658
3294
Наша сфера дослідження називається
комп'ютерне бачення
03:57
It's partчастина of the generalзагальний fieldполе
of artificialштучний intelligenceрозвідка.
60
225952
3878
та машинне навчання, що є складовою
частиною сфери штучного інтелекту.
04:03
So ultimatelyв кінцевому підсумку, we want to teachвчити
the machinesмашини to see just like we do:
61
231000
5493
Тож, в кінцевому рахунку, ми хочемо
навчити машини бачити так само, як ми:
04:08
namingіменування objectsоб'єкти, identifyingвизначення people,
inferringвиводити 3D geometryгеометрія of things,
62
236493
5387
називати об'єкти, розпізнавати людей,
виводити 3D геометрію речей,
04:13
understandingрозуміння relationsвідносини, emotionsемоції,
actionsдії and intentionsнаміри.
63
241880
5688
розуміти стосунки, емоції,
дії та наміри.
04:19
You and I weaveпереплетення togetherразом entireцілий storiesоповідання
of people, placesмісць and things
64
247568
6153
Ми з вами складаємо
цілі історії про людей, місця та речі,
04:25
the momentмомент we layлежати our gazeпогляду on them.
65
253721
2164
лише глянувши на них.
04:28
The first stepкрок towardsназустріч this goalмета
is to teachвчити a computerкомп'ютер to see objectsоб'єкти,
66
256955
5583
Перший крок до досягнення цієї мети -
навчити комп'ютер бачити об'єкти,
04:34
the buildingбудівля blockблок of the visualвізуальний worldсвіт.
67
262538
3368
будівельні блоки нашого візуального світу.
04:37
In its simplestнайпростіший termsтерміни,
imagineуявіть собі this teachingвикладання processпроцес
68
265906
4434
Простими словами,
уявіть цей процес навчання,
04:42
as showingпоказати the computersкомп'ютери
some trainingтренування imagesзображення
69
270340
2995
як демонстрацію комп'ютерам
певних тренувальних зображень
04:45
of a particularконкретно objectоб'єкт, let's say catsкоти,
70
273335
3321
конкретних об'єктів, скажімо, котів,
04:48
and designingпроектування a modelмодель that learnsвчиться
from these trainingтренування imagesзображення.
71
276656
4737
і розробку моделей, які б навчалися,
споглядаючи ці зображення.
04:53
How hardважко can this be?
72
281393
2044
Наскільки це може бути складно?
04:55
After all, a catкот is just
a collectionколекція of shapesфігури and colorsкольори,
73
283437
4052
Адже кіт - це всього лише
сукупність форм і кольорів,
04:59
and this is what we did
in the earlyрано daysдні of objectоб'єкт modelingмоделювання.
74
287489
4086
і раніше саме так ми і підходили
до моделювання об'єкту.
05:03
We'dМи б tell the computerкомп'ютер algorithmалгоритм
in a mathematicalматематичний languageмова
75
291575
3622
Ми задавали комп'ютеру алгоритм
математичною мовою,
05:07
that a catкот has a roundкруглий faceобличчя,
a chubbyпухкі bodyтіло,
76
295197
3343
що кіт має круглу морду,
пухке тіло,
05:10
two pointyзагострений earsвуха, and a long tailхвіст,
77
298540
2299
два загострених вуха
і довгого хвоста,
05:12
and that lookedподивився all fine.
78
300839
1410
і цього було достатньо.
05:14
But what about this catкот?
79
302859
2113
Але як щодо цього кота?
05:16
(LaughterСміх)
80
304972
1091
(Сміх)
05:18
It's all curledзгорнувшись up.
81
306063
1626
Він увесь вигнутий.
05:19
Now you have to addдодати anotherінший shapeформа
and viewpointточка зору to the objectоб'єкт modelмодель.
82
307689
4719
Тож потрібно додати іншу форму
та іншу перспективу до моделі об'єкта.
05:24
But what if catsкоти are hiddenприхований?
83
312408
1715
Але що як кіт сховався?
05:27
What about these sillyдурний catsкоти?
84
315143
2219
Як щодо цих грайливих котів?
05:31
Now you get my pointточка.
85
319112
2417
Ви мене зрозуміли.
05:33
Even something as simpleпростий
as a householdгосподарство petдомашня тварина
86
321529
3367
Навіть така проста річ,
як домашня тварина
05:36
can presentприсутній an infiniteнескінченний numberномер
of variationsваріації to the objectоб'єкт modelмодель,
87
324896
4504
може привнести до моделі об'єкту
численну кількість варіацій,
05:41
and that's just one objectоб'єкт.
88
329400
2233
а це ж лише один об'єкт.
05:44
So about eightвісім yearsроків agoтому назад,
89
332573
2492
Майже вісім років тому,
05:47
a very simpleпростий and profoundглибокий observationспостереження
changedзмінився my thinkingмислення.
90
335065
5030
дуже просте і глибоке спостереження
змінило напрям моїх думок.
05:53
No one tellsрозповідає a childдитина how to see,
91
341425
2685
Ніхто не говорить дитині, як треба бачити,
05:56
especiallyособливо in the earlyрано yearsроків.
92
344110
2261
особливо у перші роки.
05:58
They learnвчитися this throughчерез
real-worldРеальний світ experiencesдосвід and examplesприклади.
93
346371
5000
Вони навчаються цьому через
досвід та на прикладах з реального світу.
06:03
If you considerрозглянемо a child'sдитини eyesочі
94
351371
2740
Якщо розглядати очі дитини
06:06
as a pairпара of biologicalбіологічний camerasкамери,
95
354111
2554
як пару біологічних камер,
06:08
they take one pictureкартина
about everyкожен 200 millisecondsМС,
96
356665
4180
вони сприймають одне зображення
приблизно кожних 200 мілісекунд,
06:12
the averageсередній time an eyeоко movementрух is madeзроблений.
97
360845
3134
середній час для руху ока.
06:15
So by ageвік threeтри, a childдитина would have seenбачив
hundredsсотні of millionsмільйони of picturesмалюнки
98
363979
5550
Тож до трирічного віку дитина побачить
сотні мільйонів зображень
06:21
of the realреальний worldсвіт.
99
369529
1834
реального світу.
06:23
That's a lot of trainingтренування examplesприклади.
100
371363
2280
Це дуже багато учбових прикладів.
06:26
So insteadзамість цього of focusingфокусування solelyвиключно
on better and better algorithmsалгоритми,
101
374383
5989
Тож, замість того, щоб зосереджуватися
виключно на покращенні алгоритмів,
06:32
my insightв поле зору was to give the algorithmsалгоритми
the kindдоброзичливий of trainingтренування dataдані
102
380372
5272
мій здогад полягає в тому, щоб дати
алгоритмам певний вид тренувальних даних,
06:37
that a childдитина was givenдано throughчерез experiencesдосвід
103
385644
3319
кількісно і якісно схожих на ті,
06:40
in bothобидва quantityкількість and qualityякість.
104
388963
3878
які дитина отримує через досвід.
06:44
OnceОдного разу we know this,
105
392841
1858
Як тільки ми це зрозуміли,
06:46
we knewзнав we neededнеобхідний to collectзбирати a dataдані setвстановити
106
394699
2971
нам необхідно було
зібрати сукупність даних,
06:49
that has farдалеко more imagesзображення
than we have ever had before,
107
397670
4459
яка включатиме в себе значно більше
зображень, ніж ми мали до цього,
06:54
perhapsможе бути thousandsтисячі of timesразів more,
108
402129
2577
можливо, в тисячі разів більше.
06:56
and togetherразом with ProfessorПрофесор
KaiКай LiЛі at PrincetonПрінстон UniversityУніверситет,
109
404706
4111
Разом з професором з Прінстонського
університету Кай Лі
07:00
we launchedзапущений the ImageNetImageNet projectпроект in 2007.
110
408817
4752
ми заснували проект ImageNet у 2007 році.
07:05
LuckilyНа щастя, we didn't have to mountмонтувати
a cameraкамера on our headголова
111
413569
3838
На щастя, нам не довелося встановлювати
камери на голови
07:09
and wait for manyбагато хто yearsроків.
112
417407
1764
і чекати протягом багатьох років.
07:11
We wentпішов to the InternetІнтернет,
113
419171
1463
Ми звернулися до Інтернету,
07:12
the biggestнайбільший treasureскарб troveскарб of picturesмалюнки
that humansлюди have ever createdстворений.
114
420634
4436
найбільшої колекції зображень
за всю історію людства.
07:17
We downloadedзавантажений nearlyмайже a billionмільярд imagesзображення
115
425070
3041
Ми завантажили близько
мільярда зображень
07:20
and used crowdsourcingКраудсорсінг technologyтехнологія
like the AmazonAmazon MechanicalМеханічні TurkТерк platformплатформа
116
428111
5880
і за допомогою такої платформи
краудсорсингу, як Amazon Mechanical Turk,
07:25
to help us to labelетикетка these imagesзображення.
117
433991
2339
ми дали назву кожному зображенню.
07:28
At its peakпік, ImageNetImageNet was one of
the biggestнайбільший employersроботодавців
118
436330
4900
На своєму піку ImageNet була
одним з найбільших роботодавців
07:33
of the AmazonAmazon MechanicalМеханічні TurkТерк workersпрацівники:
119
441230
2996
для працівників на
Amazon Mechanical Turk:
07:36
togetherразом, almostмайже 50,000 workersпрацівники
120
444226
3854
разом майже 50 000 працівників
07:40
from 167 countriesкраїн around the worldсвіт
121
448080
4040
з 167 країн світу
07:44
helpedдопомагав us to cleanчистий, sortсортувати and labelетикетка
122
452120
3947
допомагали нам чистити,
сортувати та називати
07:48
nearlyмайже a billionмільярд candidateкандидат imagesзображення.
123
456067
3575
майже мільярд
зображень-кандидатів.
07:52
That was how much effortзусилля it tookвзяв
124
460612
2653
От скільки знадобилося зусиль,
07:55
to captureзахоплення even a fractionфракція
of the imageryобрази
125
463265
3900
щоб охопити хоча б частину
зображень,
07:59
a child'sдитини mindрозум takes in
in the earlyрано developmentalрозвитку yearsроків.
126
467165
4171
які дитячий мозок сприймає
у перші роки життя.
08:04
In hindsightОзираючись назад, this ideaідея of usingвикористовуючи bigвеликий dataдані
127
472148
3902
Зараз ця ідея
щодо використання великої кількості даних
08:08
to trainпоїзд computerкомп'ютер algorithmsалгоритми
mayможе seemздається obviousочевидний now,
128
476050
4550
для навчання комп'ютерних алгоритмів,
може адаватися очевидною.
08:12
but back in 2007, it was not so obviousочевидний.
129
480600
4110
Але у 2007 вона не була
настільки очевидною.
08:16
We were fairlyсправедливо aloneпоодинці on this journeyподорож
for quiteцілком a while.
130
484710
3878
Певний час ми були абсолютно самотніми
на цьому шляху.
08:20
Some very friendlyдружній colleaguesколеги advisedпорадив me
to do something more usefulкорисний for my tenureволодіння,
131
488588
5003
Деякі дружні колеги радили мені
робити щось більш корисне на моїй посаді,
08:25
and we were constantlyпостійно strugglingбореться
for researchдослідження fundingфінансування.
132
493591
4342
і ми постійно намагалися знайти
фінансування для нашого дослідження.
08:29
OnceОдного разу, I even jokedпожартував to my graduateвипускник studentsстуденти
133
497933
2485
Якось я навіть пожартувала
перед моїми випускниками,
08:32
that I would just reopenПовторне відкриття
my dryсухий cleaner'sПрибиральниця shopмагазин to fundфонд ImageNetImageNet.
134
500418
4063
що я б знову відкрила свою хімчистку,
аби фінансувати ImageNet.
08:36
After all, that's how I fundedфінансується
my collegeколедж yearsроків.
135
504481
4761
Саме так я заробляла гроші,
навчаючись в коледжі.
08:41
So we carriedносили on.
136
509242
1856
Тож ми продовжували.
08:43
In 2009, the ImageNetImageNet projectпроект deliveredдоставлений
137
511098
3715
У 2009 проект ImageNet
08:46
a databaseбаза даних of 15 millionмільйон imagesзображення
138
514813
4042
мав базу даних у 15 мільйонів зображень
08:50
acrossпоперек 22,000 classesкласи
of objectsоб'єкти and things
139
518855
4805
з 22 000 класів об'єктів і речей,
08:55
organizedорганізований by everydayкожен день Englishанглійська wordsслова.
140
523660
3320
впорядкованих щоденними
англійськими словами.
08:58
In bothобидва quantityкількість and qualityякість,
141
526980
2926
Кількісно і якісно
09:01
this was an unprecedentedбезпрецедентний scaleмасштаб.
142
529906
2972
це був безпрецедентний масштаб.
09:04
As an exampleприклад, in the caseсправа of catsкоти,
143
532878
3461
Для прикладу, у випадку з котами
09:08
we have more than 62,000 catsкоти
144
536339
2809
ми мали більше 62 000 котів
09:11
of all kindsвидів of looksвиглядає and posesпоз
145
539148
4110
з усіма видами зовнішності
і в усіх позах,
09:15
and acrossпоперек all speciesвидів
of domesticвітчизняний and wildдикий catsкоти.
146
543258
5223
а також усіх порід,
як домашніх, так і диких.
09:20
We were thrilledв захваті
to have put togetherразом ImageNetImageNet,
147
548481
3344
Ми були у захваті від
досягнення ImageNet,
09:23
and we wanted the wholeцілий researchдослідження worldсвіт
to benefitкористь from it,
148
551825
3738
і хотіли, щоб увесь науковий світ
мав користь з цього,
09:27
so in the TEDТЕД fashionмода,
we openedвідкрито up the entireцілий dataдані setвстановити
149
555563
4041
тож, за зразком TED,
ми відкрили усі дані
09:31
to the worldwideсвітовий
researchдослідження communityспільнота for freeбезкоштовно.
150
559604
3592
для усього наукового світу
безкоштовно.
09:36
(ApplauseОплески)
151
564636
4000
(Оплески)
09:41
Now that we have the dataдані
to nourishживлять our computerкомп'ютер brainмозок,
152
569416
4538
Наразі, маючи дані
для наповнення мозку комп'ютера,
09:45
we're readyготовий to come back
to the algorithmsалгоритми themselvesсамі.
153
573954
3737
ми готові повернутися
до алгоритмів.
09:49
As it turnedобернувся out, the wealthбагатство
of informationінформація providedнадано by ImageNetImageNet
154
577691
5178
Виявилося, що та велика кількість
інформації, отримана з ImageNet,
09:54
was a perfectдосконалий matchматч to a particularконкретно classклас
of machineмашина learningнавчання algorithmsалгоритми
155
582869
4806
ідеально підходить для конкретного класу
навчальних алгоритмів для машин,
09:59
calledназивається convolutionalconvolutional neuralнейронний networkмережа,
156
587675
2415
який називається
"згорнутою нейронною мережею",
10:02
pioneeredініціатором by KunihikoKunihiko FukushimaФукусіма,
GeoffДжефф HintonХінтон, and YannYann LeCunLeCun
157
590090
5248
що була розроблена Куніхіко Фукушімою,
Геоффом Гінтоном та Янном Лекуном
10:07
back in the 1970s and '80s.
158
595338
3645
у 1970 - 80-х роках.
10:10
Just like the brainмозок consistsскладається
of billionsмільярди of highlyвисоко connectedпов'язаний neuronsнейрони,
159
598983
5619
Подібно до мозку, який складається
з мільйонів поєднаних нейронів,
10:16
a basicосновний operatingдіючий unitодиниця in a neuralнейронний networkмережа
160
604602
3854
базова операційна одиниця
в нейронній мережі
10:20
is a neuron-likeнейрон, як nodeвузол.
161
608456
2415
складається з нейроноподібних вузлів.
10:22
It takes inputвхід from other nodesвузли
162
610871
2554
Вона приймає інформацію від одних вузлів
10:25
and sendsпосилає outputвихід to othersінші.
163
613425
2718
і передає її до інших.
10:28
MoreoverДо того ж, these hundredsсотні of thousandsтисячі
or even millionsмільйони of nodesвузли
164
616143
4713
Більше того, ці сотні тисяч,
або навіть мільйони вузлів
10:32
are organizedорганізований in hierarchicalієрархічна layersшари,
165
620856
3227
організовані в ієрархічні шари,
10:36
alsoтакож similarподібний to the brainмозок.
166
624083
2554
так само, як і мозок.
10:38
In a typicalтиповий neuralнейронний networkмережа we use
to trainпоїзд our objectоб'єкт recognitionвизнання modelмодель,
167
626637
4783
Типова нейронна мережа, яку
ми використовуємо для тренування
10:43
it has 24 millionмільйон nodesвузли,
168
631420
3181
нашої моделі розпізнавання об'єкту,
має 24 мільйони вузлів,
10:46
140 millionмільйон parametersпараметри,
169
634601
3297
140 мільйонів параметрів
10:49
and 15 billionмільярд connectionsз'єднання.
170
637898
2763
і 15 мільярдів зв'язків.
10:52
That's an enormousвеличезний modelмодель.
171
640661
2415
Це величезна модель.
10:55
PoweredХарчування by the massiveмасивний dataдані from ImageNetImageNet
172
643076
3901
Оснащена великою кількістю даних
з ImageNet
10:58
and the modernсучасний CPUsПроцесори and GPUsГрафічні процесори NVIDIA
to trainпоїзд suchтакий a humongousHumongous modelмодель,
173
646977
5433
і сучасними процесорами,
для тренування такої гігантської моделі,
11:04
the convolutionalconvolutional neuralнейронний networkмережа
174
652410
2369
згорнута нейронна мережа
11:06
blossomedрозцвіла in a way that no one expectedочікуваний.
175
654779
3436
продемонструвала неочікувані результати.
11:10
It becameстає the winningвиграш architectureархітектура
176
658215
2508
ЇЇ виграшна архітектура
11:12
to generateгенерувати excitingхвилююче newновий resultsрезультати
in objectоб'єкт recognitionвизнання.
177
660723
5340
демонструє неймовірні нові результати
у розпізнаванні об'єкта.
11:18
This is a computerкомп'ютер tellingкажучи us
178
666063
2810
Це комп'ютер говорить нам,
11:20
this pictureкартина containsмістить a catкот
179
668873
2300
що на фото є кіт
11:23
and where the catкот is.
180
671173
1903
і де саме кіт знаходиться.
11:25
Of courseзвичайно there are more things than catsкоти,
181
673076
2112
Звичайно, на фото є й інші речі,
окрім котів,
11:27
so here'sось тут a computerкомп'ютер algorithmалгоритм tellingкажучи us
182
675188
2438
тож комп'ютерний алгоритм каже нам,
11:29
the pictureкартина containsмістить
a boyхлопчик and a teddyТедді bearведмедя;
183
677626
3274
що на фото є хлопець
і плюшевий ведмедик;
11:32
a dogпес, a personлюдина, and a smallмаленький kiteкайт
in the backgroundфон;
184
680900
4366
собака, людина і маленький
паперовий змій на задньому плані;
11:37
or a pictureкартина of very busyзайнятий things
185
685266
3135
або фото, на якому багато всього:
11:40
like a man, a skateboardскейтборд,
railingsПоручні, a lampostlampost, and so on.
186
688401
4644
чоловік, скейтборд,
огорожа, ліхтарний стовп і так далі.
11:45
SometimesІноді, when the computerкомп'ютер
is not so confidentвпевнений about what it seesбачить,
187
693045
5293
У випадках, коли комп'ютер не впевнений
у тому, що він бачить,
11:51
we have taughtнавчав it to be smartрозумний enoughдостатньо
188
699498
2276
ми навчили його бути достатньо розумним
11:53
to give us a safeбезпечний answerвідповісти
insteadзамість цього of committingвчинити too much,
189
701774
3878
і давати припущення,
а не брати на себе забагато,
11:57
just like we would do,
190
705652
2811
як і ми самі зробили б.
12:00
but other timesразів our computerкомп'ютер algorithmалгоритм
is remarkableчудовий at tellingкажучи us
191
708463
4666
Проте у інших випадках
алгоритм нашого комп'ютера
12:05
what exactlyточно the objectsоб'єкти are,
192
713129
2253
з вражаючою точністю
називає об'єкти,
12:07
like the make, modelмодель, yearрік of the carsавтомобілі.
193
715382
3436
такі як марка, модель та
рік випуску машин.
12:10
We appliedзастосований this algorithmалгоритм to millionsмільйони
of GoogleGoogle StreetВулиця ViewПодання imagesзображення
194
718818
5386
Застосувавши цей алгоритм до мільйонів
зображень Google Street View,
12:16
acrossпоперек hundredsсотні of AmericanАмериканський citiesмістах,
195
724204
3135
які включають сотні американських міст,
12:19
and we have learnedнавчився something
really interestingцікаво:
196
727339
2926
ми виявили дещо дуже цікаве:
12:22
first, it confirmedпідтверджено our commonзагальний wisdomмудрість
197
730265
3320
по-перше, він підтвердив
відому істину про те,
12:25
that carмашина pricesціни correlateспіввідносяться very well
198
733585
3290
що ціни на машини залежать від
12:28
with householdгосподарство incomesдоходи.
199
736875
2345
прибутків домашніх господарств.
12:31
But surprisinglyдивно, carмашина pricesціни
alsoтакож correlateспіввідносяться well
200
739220
4527
Але неочікувано виявилося,
що ціни на машини також корелюються
12:35
with crimeзлочин ratesставки in citiesмістах,
201
743747
2300
з рівнем злочинності в містах,
12:39
or votingголосування patternsвізерунки by zipzip codesкоди.
202
747007
3963
і навіть з моделлю голосування
в різних штатах.
12:44
So wait a minuteхвилина. Is that it?
203
752060
2206
Зачекайте хвилинку. Чи це вже воно?
12:46
Has the computerкомп'ютер alreadyвже matchedузгоджений
or even surpassedперевершив humanлюдина capabilitiesможливостей?
204
754266
5153
Чи комп'ютер вже досяг
чи навіть перевищив людські можливості?
12:51
Not so fastшвидко.
205
759419
2138
Не так швидко.
12:53
So farдалеко, we have just taughtнавчав
the computerкомп'ютер to see objectsоб'єкти.
206
761557
4923
Наразі ми навчили комп'ютер
бачити об'єкти.
12:58
This is like a smallмаленький childдитина
learningнавчання to utterвимовити a fewмало хто nounsіменники.
207
766480
4644
Так само, як немовля
вчиться вимовляти слова.
13:03
It's an incredibleнеймовірний accomplishmentдосягнення,
208
771124
2670
Це неймовірне досягнення,
13:05
but it's only the first stepкрок.
209
773794
2460
але це лише перший крок.
13:08
SoonНезабаром, anotherінший developmentalрозвитку
milestoneвіха will be hitхіт,
210
776254
3762
Згодом буде досягнуто
наступний етап розвитку,
13:12
and childrenдіти beginпочати
to communicateспілкуватися in sentencesречення.
211
780016
3461
коли діти починають спілкуватися
за допомогою речень.
13:15
So insteadзамість цього of sayingкажучи
this is a catкот in the pictureкартина,
212
783477
4224
Замість того, щоб сказати,
що на фото є кіт,
13:19
you alreadyвже heardпочув the little girlдівчина
tellingкажучи us this is a catкот lyingлежачий on a bedліжко.
213
787701
5202
маленька дівчинка каже нам,
що є кіт, який лежить на ліжку.
13:24
So to teachвчити a computerкомп'ютер
to see a pictureкартина and generateгенерувати sentencesречення,
214
792903
5595
Щоб навчити комп'ютер
бачити фото і формулювати речення,
13:30
the marriageшлюб betweenміж bigвеликий dataдані
and machineмашина learningнавчання algorithmалгоритм
215
798498
3948
тісний союз між величезною кількістю даних
та навчальним алгоритмом для машин
13:34
has to take anotherінший stepкрок.
216
802446
2275
повинен запрацювати на новому рівні.
13:36
Now, the computerкомп'ютер has to learnвчитися
from bothобидва picturesмалюнки
217
804721
4156
Зараз комп'ютер повинен навчатися,
використовуючи як фото,
13:40
as well as naturalприродний languageмова sentencesречення
218
808877
2856
так і речення природної мови,
13:43
generatedзгенерований by humansлюди.
219
811733
3322
за допомогою яких спілкуються люди.
13:47
Just like the brainмозок integratesінтегрує
visionбачення and languageмова,
220
815055
3853
Подібно до того, як мозок
поєднує бачення та мову,
13:50
we developedрозроблений a modelмодель
that connectsз'єднується partsчастин of visualвізуальний things
221
818908
5201
ми розробили модель,
яка поєднує частини візуальних речей,
13:56
like visualвізуальний snippetsфрагменти
222
824109
1904
таких як візуальні фрагменти,
13:58
with wordsслова and phrasesфрази in sentencesречення.
223
826013
4203
зі словами та фразами у реченнях.
14:02
About fourчотири monthsмісяці agoтому назад,
224
830216
2763
Близько 4 місяців тому,
14:04
we finallyнарешті tiedзв'язали all this togetherразом
225
832979
2647
ми нарешті поєднали усе це докупи
14:07
and producedвироблено one of the first
computerкомп'ютер visionбачення modelsмоделі
226
835626
3784
і створили одну з перших
моделей комп'ютерного розпізнавання,
14:11
that is capableздатний of generatingгенеруючи
a human-likeлюб'язний sentenceречення
227
839410
3994
яка здатна створювати
подібні до людських речення,
14:15
when it seesбачить a pictureкартина for the first time.
228
843404
3506
коли бачить фото вперше.
14:18
Now, I'm readyготовий to showпоказати you
what the computerкомп'ютер saysкаже
229
846910
4644
Зараз я продемонструю вам,
що говорить комп'ютер,
14:23
when it seesбачить the pictureкартина
230
851554
1975
коли бачить фото,
14:25
that the little girlдівчина saw
at the beginningпочаток of this talk.
231
853529
3830
які описувала маленька дівчинка
на початку моєї доповіді.
14:31
(VideoВідео) ComputerКомп'ютер: A man is standingстоячи
nextдалі to an elephantслон.
232
859519
3344
(Відео) Комп'ютер: Чоловік
стоїть поряд зі слоном.
14:36
A largeвеликий airplaneлітак sittingсидячи on topвершина
of an airportаеропорт runwayВПП.
233
864393
3634
Великий літак стоїть
на злітно-посадковій смузі.
14:41
FFLFFL: Of courseзвичайно, we're still workingпрацює hardважко
to improveполіпшити our algorithmsалгоритми,
234
869057
4212
ФФЛ: Звичайно, ми продовжуємо наполегливо
працювати над удосконаленням алгоритмів,
14:45
and it still has a lot to learnвчитися.
235
873269
2596
і йому ще треба багато чого навчитися.
14:47
(ApplauseОплески)
236
875865
2291
(Оплески)
14:51
And the computerкомп'ютер still makesробить mistakesпомилки.
237
879556
3321
Комп'ютер все ще допускає помилки.
14:54
(VideoВідео) ComputerКомп'ютер: A catкот lyingлежачий
on a bedліжко in a blanketКовдра.
238
882877
3391
(Відео) Комп'ютер: Кіт лежить на ліжку
в ковдрі.
14:58
FFLFFL: So of courseзвичайно, when it seesбачить
too manyбагато хто catsкоти,
239
886268
2553
ФФЛ: Звичайно, коли він бачить
дуже багато котів,
15:00
it thinksдумає everything
mightможе look like a catкот.
240
888821
2926
він вважає, що все має виглядати, як кіт.
15:05
(VideoВідео) ComputerКомп'ютер: A youngмолодий boyхлопчик
is holdingпроведення a baseballбейсбол batкажан.
241
893317
2864
(Відео) Комп'ютер: Хлопець
тримає бейсбольну біту.
15:08
(LaughterСміх)
242
896181
1765
(Сміх)
15:09
FFLFFL: Or, if it hasn'tне має seenбачив a toothbrushзубна щітка,
it confusesбентежить it with a baseballбейсбол batкажан.
243
897946
4583
ФФЛ: Або, якщо він не бачив зубну щітку,
він переплутає її з бейсбольною битою.
15:15
(VideoВідео) ComputerКомп'ютер: A man ridingкатання на конях a horseкінь
down a streetвулиця nextдалі to a buildingбудівля.
244
903309
3434
(Відео) Комп'ютер: Чоловік їде на коні
по вулиці біля будинку.
15:18
(LaughterСміх)
245
906743
2023
(Сміх)
15:20
FFLFFL: We haven'tні taughtнавчав ArtМистецтво 101
to the computersкомп'ютери.
246
908766
3552
ФФЛ: Ми не вчили комп'ютери
розуміти мистецтво.
15:25
(VideoВідео) ComputerКомп'ютер: A zebraЗебра standingстоячи
in a fieldполе of grassтрава.
247
913768
2884
(Відео) Комп'ютер: Зебра стоїть
на полі, вкритому травою.
15:28
FFLFFL: And it hasn'tне має learnedнавчився to appreciateцінуємо
the stunningприголомшливий beautyкрасуня of natureприрода
248
916652
3367
ФФЛ: Він не навчився цінувати
надзвичайну красу природи,
15:32
like you and I do.
249
920019
2438
як це робимо ми з вами.
15:34
So it has been a long journeyподорож.
250
922457
2832
Ми пройшли довгий шлях.
15:37
To get from ageвік zeroнуль to threeтри was hardважко.
251
925289
4226
Було важко дістатися
від 0 до 3 років.
15:41
The realреальний challengeвиклик is to go
from threeтри to 13 and farдалеко beyondдалі.
252
929515
5596
Але справжній виклик -
це пройти від 3 років до 13 і далі.
15:47
Let me remindнагадаю you with this pictureкартина
of the boyхлопчик and the cakeторт again.
253
935111
4365
Дозвольте мені нагадати вам це фото
з хлопчиком і пирогом.
15:51
So farдалеко, we have taughtнавчав
the computerкомп'ютер to see objectsоб'єкти
254
939476
4064
Ми вже навчили комп'ютер
бачити об'єкти
15:55
or even tell us a simpleпростий storyісторія
when seeingбачачи a pictureкартина.
255
943540
4458
і навіть розповідати прості історії
про те, що він бачить на фото.
15:59
(VideoВідео) ComputerКомп'ютер: A personлюдина sittingсидячи
at a tableстіл with a cakeторт.
256
947998
3576
(Відео) Комп'ютер: Людина сидить
за столом з пирогом.
16:03
FFLFFL: But there's so much more
to this pictureкартина
257
951574
2630
ФФЛ: Але на фото присутні
значно більше об'єктів,
16:06
than just a personлюдина and a cakeторт.
258
954204
2270
ніж лише людина і пиріг.
16:08
What the computerкомп'ютер doesn't see
is that this is a specialособливий Italianіталійська cakeторт
259
956474
4467
Повз увагу комп'ютера проходить те,
що це спеціальний італійський пиріг,
16:12
that's only servedслужив duringпід час EasterВеликдень time.
260
960941
3217
який їдять виключно на Паску.
16:16
The boyхлопчик is wearingносити his favoriteулюблений t-shirtфутболка
261
964158
3205
Хлопець одягнутий у свою
улюблену футболку,
16:19
givenдано to him as a giftподарунок by his fatherбатько
after a tripпоїздка to SydneyСідней,
262
967363
3970
яку йому батько привіз із Сіднею.
16:23
and you and I can all tell how happyщасливий he is
263
971333
3808
Ми з вами можемо сказати,
наскільки він щасливий
16:27
and what's exactlyточно on his mindрозум
at that momentмомент.
264
975141
3203
і що саме у нього на думці
в цей момент.
16:31
This is my sonсин LeoЛев.
265
979214
3125
Це мій син Лео.
16:34
On my questквест for visualвізуальний intelligenceрозвідка,
266
982339
2624
У моїх пошуках візуального інтелекту
16:36
I think of LeoЛев constantlyпостійно
267
984963
2391
я постійно думаю про Лео
16:39
and the futureмайбутнє worldсвіт he will liveжити in.
268
987354
2903
і майбутній світ, у якому йому
доведеться жити.
16:42
When machinesмашини can see,
269
990257
2021
Коли машини зможуть бачити,
16:44
doctorsлікарі and nursesмедсестри will have
extraдодатково pairsпари of tirelessНевтомний eyesочі
270
992278
4712
лікарі та медсестри отримають
додаткові пари невтомних очей,
16:48
to help them to diagnoseдіагностувати
and take careтурбота of patientsпацієнти.
271
996990
4092
які допомагатимуть їм у діагностуванні
та догляді за хворими.
16:53
CarsАвтомобілі will runбіжи smarterрозумніше
and saferбезпечніше on the roadдорога.
272
1001082
4383
Машини їздитимуть обачніше
і безпечніше на дорогах.
16:57
RobotsРоботів, not just humansлюди,
273
1005465
2694
Роботи, а не лише люди,
17:00
will help us to braveхоробрий the disasterкатастрофа zonesпояси
to saveзберегти the trappedв пастці and woundedпоранений.
274
1008159
4849
допомагатимуть у зонах катастроф
рятувати поранених людей.
17:05
We will discoverвідкрити newновий speciesвидів,
better materialsматеріали,
275
1013798
3796
За допомогою машин
ми відкриємо нові види,
17:09
and exploreдосліджувати unseenневидимий frontiersкордони
with the help of the machinesмашини.
276
1017594
4509
кращі матеріали
і дослідимо небачені нові можливості.
17:15
Little by little, we're givingдавати sightвидовище
to the machinesмашини.
277
1023113
4167
Потроху ми даємо машинам зір.
17:19
First, we teachвчити them to see.
278
1027280
2798
Спочатку ми вчимо їх бачити.
17:22
Then, they help us to see better.
279
1030078
2763
Потім вони допоможуть
нам бачити краще.
17:24
For the first time, humanлюдина eyesочі
won'tне буде be the only onesті, хто
280
1032841
4165
Вперше людські очі
вже не єдині,
17:29
ponderingобдумуючи and exploringдосліджуючи our worldсвіт.
281
1037006
2934
що можуть спостерігати
і досліджувати наш світ.
17:31
We will not only use the machinesмашини
for theirїх intelligenceрозвідка,
282
1039940
3460
Ми не лише будемо використовувати
інтелект машин,
17:35
we will alsoтакож collaborateспівпрацювати with them
in waysшляхи that we cannotне можу even imagineуявіть собі.
283
1043400
6179
ми також будемо співпрацювати з ними
різними неймовірними способами.
17:41
This is my questквест:
284
1049579
2161
Я бачу своє завдання у тому,
17:43
to give computersкомп'ютери visualвізуальний intelligenceрозвідка
285
1051740
2712
щоб надати комп'ютерам
візуальний інтелект
17:46
and to createстворити a better futureмайбутнє
for LeoЛев and for the worldсвіт.
286
1054452
5131
і створити краще майбутнє
для Лео і для світу.
17:51
Thank you.
287
1059583
1811
Дякую
17:53
(ApplauseОплески)
288
1061394
3785
(Оплески)
Translated by Tetiana Katsimon
Reviewed by Khrystyna Romashko

▲Back to top

ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com