ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com
TED2015

Fei-Fei Li: How we're teaching computers to understand pictures

Фей-Фей Ли: Как мы учим компьютеры понимать изображения

Filmed:
2,702,344 views

Когда малыш смотрит на изображение, он может определить простые объекты: «кот», «книга», «стул». Сейчас компьютеры стали такими умными, что сами могут справиться с этой задачей. Что дальше? В захватывающем выступлении эксперт по компьютерному зрению Фей-Фей Ли описывает последние достижения науки, включая базу данных, содержащую 15 миллионов фотографий, которую создала её команда, чтобы «научить» компьютер понимать изображения, — а в скором будущем последуют и главные результаты этой работы.
- Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio

Double-click the English transcript below to play the video.

00:14
Let me showпоказать you something.
0
2366
3738
Позвольте вам кое-что показать.
00:18
(Videoвидео) Girlдевушка: Okay, that's a catКот
sittingсидящий in a bedпостель.
1
6104
4156
(Видео) Девочка: Кот сидит на кровати.
00:22
The boyмальчик is pettingласки the elephantслон.
2
10260
4040
Мальчик гладит слона.
00:26
Those are people
that are going on an airplaneсамолет.
3
14300
4354
Люди садятся в самолёт.
00:30
That's a bigбольшой airplaneсамолет.
4
18654
2810
Это большой самолёт.
00:33
Fei-FeiFei-Fei LiLi: This is
a three-year-oldтри-летний childребенок
5
21464
2206
Фей-Фей Ли: Трёхлетняя девочка
00:35
describingописывающее what she seesвидит
in a seriesсерии of photosфото.
6
23670
3679
описывает то, что она видит
на фотографиях.
00:39
She mightмог бы still have a lot
to learnучить about this worldМир,
7
27349
2845
Ей предстоит ещё много
узнать об этом мире,
00:42
but she's alreadyуже an expertэксперт
at one very importantважный taskзадача:
8
30194
4549
но она уже довольно искусно
справляется с очень важной задачей:
00:46
to make senseсмысл of what she seesвидит.
9
34743
2846
она осознаёт то, что видит.
00:50
Our societyобщество is more
technologicallyтехнологически advancedпередовой than ever.
10
38229
4226
Наше общество технологически развито
больше, чем когда-либо.
00:54
We sendОтправить people to the moonЛуна,
we make phonesтелефоны that talk to us
11
42455
3629
Мы отправляем людей на Луну,
создаём телефоны, которые говорят с нами,
00:58
or customizeнастроить radioрадио stationsстанций
that can playиграть only musicМузыка we like.
12
46084
4946
и настраиваем радиостанции, чтобы слушать
только такую музыку, которая нам нравится.
01:03
YetВсе же, our mostбольшинство advancedпередовой
machinesмашины and computersкомпьютеры
13
51030
4055
Но эта задача всё ещё не под силу
нашим самым продвинутым
01:07
still struggleборьба at this taskзадача.
14
55085
2903
механизмам и компьютерам.
01:09
So I'm here todayCегодня
to give you a progressпрогресс reportдоклад
15
57988
3459
Сегодня я выступлю перед вами
с докладом
01:13
on the latestпоследний advancesдостижения
in our researchисследование in computerкомпьютер visionвидение,
16
61447
4047
о наших последних достижениях
в области машинного зрения,
01:17
one of the mostбольшинство frontierграница
and potentiallyпотенциально revolutionaryреволюционер
17
65494
4161
одной из самых передовых
и потенциально революционных
01:21
technologiesтехнологии in computerкомпьютер scienceнаука.
18
69655
3206
технологий в области компьютерных наук.
01:24
Yes, we have prototypedпрототип carsлегковые автомобили
that can driveводить машину by themselvesсамих себя,
19
72861
4551
Да, мы создали прототипы
беспилотных автомобилей,
01:29
but withoutбез smartумная visionвидение,
they cannotне могу really tell the differenceразница
20
77412
3853
но без компьютерного зрения
они не смогут отличить
01:33
betweenмежду a crumpledмятый paperбумага bagмешок
on the roadДорога, whichкоторый can be runбег over,
21
81265
3970
на дороге бумажный пакет,
по которому можно проехать,
01:37
and a rockкамень that sizeразмер,
whichкоторый should be avoidedизбегать.
22
85235
3340
от камня похожего размера,
который стоит объехать.
01:41
We have madeсделал fabulousневероятный megapixelмегапиксельную camerasкамеры,
23
89415
3390
Мы создали замечательные
мегапиксельные камеры,
01:44
but we have not deliveredдоставлен
sightвзгляд to the blindслепой.
24
92805
3135
но не смогли вернуть зрение слепым.
01:48
DronesДроны can flyлетать over massiveмассивный landземельные участки,
25
96420
3305
Беспилотные аппараты могут преодолевать
огромные расстояния,
01:51
but don't have enoughдостаточно visionвидение technologyтехнологии
26
99725
2134
но не обладают достаточной
технологией зрения,
01:53
to help us to trackтрек
the changesизменения of the rainforestsтропические леса.
27
101859
3461
чтобы помочь нам отслеживать
динамику вырубки тропических лесов.
01:57
SecurityБезопасность camerasкамеры are everywhereвезде,
28
105320
2950
Повсюду находятся
камеры видеонаблюдения,
02:00
but they do not alertбдительный us when a childребенок
is drowningутопление in a swimmingплавание poolбассейн.
29
108270
5067
но они не могут предупредить нас
о тонущем в бассейне ребёнке.
02:06
PhotosФото and videosвидео are becomingстановление
an integralинтеграл partчасть of globalГлобальный life.
30
114167
5595
Фотографии и видеоролики становятся
неотъемлемой частью нашей жизни.
02:11
They're beingявляющийся generatedгенерироваться at a paceтемп
that's farдалеко beyondза what any humanчеловек,
31
119762
4087
Они накапливаются с такой скоростью,
что их все невозможно просмотреть
02:15
or teamsкоманды of humansлюди, could hopeнадежда to viewПосмотреть,
32
123849
2783
ни одному человеку, ни группе людей.
02:18
and you and I are contributingспособствуя
to that at this TEDТЕД.
33
126632
3921
Мы, участники TED, тоже этому
поспособствовали.
02:22
YetВсе же our mostбольшинство advancedпередовой softwareпрограммного обеспечения
is still strugglingборющийся at understandingпонимание
34
130553
5232
Нашему самому продвинутому программному
обеспечению не под силу воспринимать
02:27
and managingуправление this enormousогромный contentсодержание.
35
135785
3876
этот огромный массив данных
и управлять им.
02:31
So in other wordsслова,
collectivelyколлективно as a societyобщество,
36
139661
5272
Иначе говоря, коллективно
02:36
we're very much blindслепой,
37
144933
1746
наше общество слепо,
02:38
because our smartestсмышленым
machinesмашины are still blindслепой.
38
146679
3387
потому что наши самые умные машины
всё ещё не умеют видеть.
02:43
"Why is this so hardжесткий?" you mayмай askпросить.
39
151526
2926
«Почему же это так сложно?» —
спросите вы.
02:46
Camerasкамеры can take picturesкартинки like this one
40
154452
2693
Фотокамеры могут делать
вот такие фотографии,
02:49
by convertingпреобразование lightsогни into
a two-dimensionalдвумерный arrayмассив of numbersчисел
41
157145
3994
преобразовывая свет
в двухмерную числовую последовательность,
02:53
knownизвестен as pixelsпикселей,
42
161139
1650
известную как «пиксели».
02:54
but these are just lifelessбезжизненный numbersчисел.
43
162789
2251
Но это просто числа.
02:57
They do not carryнести meaningимея в виду in themselvesсамих себя.
44
165040
3111
Они не несут в себе никакого смысла.
03:00
Just like to hearзаслушивать is not
the sameодна и та же as to listen,
45
168151
4343
Так же, как «слышать» —
не то же самое, что «слушать»,
03:04
to take picturesкартинки is not
the sameодна и та же as to see,
46
172494
4040
«делать» фотографии — не то же самое,
что «видеть» их,
03:08
and by seeingвидя,
we really mean understandingпонимание.
47
176534
3829
а под «видеть», конечно же,
имеется в виду «понимать».
03:13
In factфакт, it tookвзял MotherМама NatureПрирода
540 millionмиллиона yearsлет of hardжесткий work
48
181293
6177
Природе пришлось усердно трудиться
в течение 540 миллионов лет,
03:19
to do this taskзадача,
49
187470
1973
чтобы решить эту задачу,
03:21
and much of that effortусилие
50
189443
1881
и многие из этих усилий
были направлены
03:23
wentотправился into developingразвивающийся the visualвизуальный
processingобработка apparatusустройство of our brainsмозги,
51
191324
5271
на создание аппарата обработки
визуальных данных в нашем мозге,
03:28
not the eyesглаза themselvesсамих себя.
52
196595
2647
а не глаз как таковых.
03:31
So visionвидение beginsначинается with the eyesглаза,
53
199242
2747
Зрение начинается с глаз,
03:33
but it trulyдействительно takes placeместо in the brainголовной мозг.
54
201989
3518
но фактически происходит в мозге.
03:38
So for 15 yearsлет now, startingначало
from my PhpH.D. at CaltechКалифорнийский технологический институт
55
206287
5060
В течение вот уже 15 лет, начиная
с аспирантуры в Калтехе,
03:43
and then leadingведущий Stanford'sСтэнфорда Visionвидение Labлаборатория,
56
211347
2926
а затем возглавляя стэнфордскую
лабораторию зрения,
03:46
I've been workingза работой with my mentorsнаставники,
collaboratorsсотрудники and studentsстуденты
57
214273
4396
я работаю вместе с наставниками,
коллегами и студентами,
03:50
to teachучат computersкомпьютеры to see.
58
218669
2889
обучая компьютеры видеть.
03:54
Our researchисследование fieldполе is calledназывается
computerкомпьютер visionвидение and machineмашина learningобучение.
59
222658
3294
Сфера наших исследований —
машинное зрение и обучение машин.
03:57
It's partчасть of the generalГенеральная fieldполе
of artificialискусственный intelligenceинтеллект.
60
225952
3878
Это часть области под названием
искусственный интеллект.
04:03
So ultimatelyв конечном счете, we want to teachучат
the machinesмашины to see just like we do:
61
231000
5493
Наша главная задача — научить
машины видеть, так как это можем мы:
04:08
namingименование objectsобъекты, identifyingидентифицирующий people,
inferringвыводя 3D geometryгеометрия of things,
62
236493
5387
называть объекты, узнавать людей,
использовать трёхмерную геометрию вещей,
04:13
understandingпонимание relationsсвязи, emotionsэмоции,
actionsдействия and intentionsнамерения.
63
241880
5688
понимать отношения, эмоции,
действия и намерения.
04:19
You and I weaveткать togetherвместе entireвсе storiesистории
of people, placesмест and things
64
247568
6153
Мы можем создавать целые истории
о людях, местах, вещах —
04:25
the momentмомент we layпрокладывать our gazeпосмотреть on them.
65
253721
2164
стоит нам только на них взглянуть.
04:28
The first stepшаг towardsв направлении this goalЦель
is to teachучат a computerкомпьютер to see objectsобъекты,
66
256955
5583
Первый шаг к этой цели —
научить машины видеть объекты,
04:34
the buildingздание blockблок of the visualвизуальный worldМир.
67
262538
3368
стандартные элементы визуального мира.
04:37
In its simplestсамый простой termsсроки,
imagineпредставить this teachingобучение processобработать
68
265906
4434
Простыми словами, процесс обучения —
04:42
as showingпоказ the computersкомпьютеры
some trainingобучение imagesизображений
69
270340
2995
это демонстрация компьютеру некоторых
обучающих изображений
04:45
of a particularконкретный objectобъект, let's say catsкоты,
70
273335
3321
определённых объектов, например, кошек,
04:48
and designingпроектирование a modelмодель that learnsузнает
from these trainingобучение imagesизображений.
71
276656
4737
и разработка модели, которая обучается
на основе данных изображений.
04:53
How hardжесткий can this be?
72
281393
2044
Насколько это может быть сложным?
04:55
After all, a catКот is just
a collectionколлекция of shapesформы and colorsцвета,
73
283437
4052
Кошка — это просто
набор очертаний и цветов,
04:59
and this is what we did
in the earlyрано daysдней of objectобъект modelingмоделирование.
74
287489
4086
и именно этим мы занимались на заре
моделирования объектов.
05:03
We'dМы б tell the computerкомпьютер algorithmалгоритм
in a mathematicalматематическая languageязык
75
291575
3622
Посредством математического алгоритма
мы сообщали компьютеру,
05:07
that a catКот has a roundкруглый faceлицо,
a chubbyкруглолицый bodyтело,
76
295197
3343
что у кошки круглая морда,
пухленькое тело,
05:10
two pointyзаостренный earsуши, and a long tailхвост,
77
298540
2299
два острых уха и длинный хвост,
05:12
and that lookedсмотрел all fine.
78
300839
1410
и этого было достаточно.
05:14
But what about this catКот?
79
302859
2113
А как насчёт этого кота?
05:16
(LaughterСмех)
80
304972
1091
(Смех)
05:18
It's all curledкурчавый up.
81
306063
1626
Он изогнут непонятно как.
05:19
Now you have to addДобавить anotherдругой shapeформа
and viewpointсмотровая площадка to the objectобъект modelмодель.
82
307689
4719
Нужно добавить ещё одну форму
и точку обзора в модель.
05:24
But what if catsкоты are hiddenскрытый?
83
312408
1715
А если кот прячется?
05:27
What about these sillyглупый catsкоты?
84
315143
2219
Как насчёт этих смешных котов?
05:31
Now you get my pointточка.
85
319112
2417
Теперь вы меня понимаете.
05:33
Even something as simpleпросто
as a householdдомашнее хозяйство petдомашнее животное
86
321529
3367
Даже простой домашний питомец
05:36
can presentнастоящее время an infiniteбесконечный numberномер
of variationsвариации to the objectобъект modelмодель,
87
324896
4504
может представлять бесконечное число
вариаций в модели объекта,
05:41
and that's just one objectобъект.
88
329400
2233
а это всего лишь один объект.
05:44
So about eight8 yearsлет agoтому назад,
89
332573
2492
Где-то восемь лет назад
05:47
a very simpleпросто and profoundглубокий observationнаблюдение
changedизменено my thinkingмышление.
90
335065
5030
простое, но значительное наблюдение
изменило ход моих мыслей.
05:53
No one tellsговорит a childребенок how to see,
91
341425
2685
Никто не говорит ребёнку,
как надо видеть,
05:56
especiallyособенно in the earlyрано yearsлет.
92
344110
2261
особенно в ранние годы жизни.
05:58
They learnучить this throughчерез
real-worldреальный мир experiencesопыт and examplesПримеры.
93
346371
5000
Он учится этому на реальных примерах.
06:03
If you considerрассматривать a child'sДети eyesглаза
94
351371
2740
Если предположить, что глаза ребёнка —
06:06
as a pairпара of biologicalбиологический camerasкамеры,
95
354111
2554
это пара биологических камер,
06:08
they take one pictureкартина
about everyкаждый 200 millisecondsмиллисекунды,
96
356665
4180
то они делают один снимок
каждые 200 миллисекунд, —
06:12
the averageв среднем time an eyeглаз movementдвижение is madeсделал.
97
360845
3134
среднее время движения глазного яблока.
06:15
So by ageвозраст threeтри, a childребенок would have seenвидели
hundredsсотни of millionsмиллионы of picturesкартинки
98
363979
5550
К трём годам ребёнок уже увидит
сотни миллионов изображений
06:21
of the realреальный worldМир.
99
369529
1834
окружающего мира.
06:23
That's a lot of trainingобучение examplesПримеры.
100
371363
2280
Это очень много обучающих примеров.
06:26
So insteadвместо of focusingфокусирование solelyисключительно
on better and better algorithmsалгоритмы,
101
374383
5989
И вместо того, чтобы улучшать алгоритмы,
06:32
my insightв поле зрения was to give the algorithmsалгоритмы
the kindсвоего рода of trainingобучение dataданные
102
380372
5272
я предложила предоставить этим алгоритмам
такую же обучающую информацию,
06:37
that a childребенок was givenданный throughчерез experiencesопыт
103
385644
3319
которую через опыт получает ребёнок,
06:40
in bothи то и другое quantityколичество and qualityкачественный.
104
388963
3878
в таком же количестве и качестве.
06:44
Onceоднажды we know this,
105
392841
1858
Как только мы это осознали,
06:46
we knewзнал we neededнеобходимый to collectсобирать a dataданные setзадавать
106
394699
2971
мы поняли, что нам нужно было
собрать базу данных,
06:49
that has farдалеко more imagesизображений
than we have ever had before,
107
397670
4459
содержащую намного больше изображений,
чем когда-либо ранее,
06:54
perhapsвозможно thousandsтысячи of timesраз more,
108
402129
2577
возможно, в тысячи раз больше.
06:56
and togetherвместе with ProfessorПрофессор
KaiКай LiLi at PrincetonPrinceton UniversityУниверситет,
109
404706
4111
В 2007 году я и профессор Кай Ли
из Принстонского университета
07:00
we launchedзапущенный the ImageNetImageNet projectпроект in 2007.
110
408817
4752
запустили проект ImageNet.
07:05
Luckilyк счастью, we didn't have to mountкрепление
a cameraкамера on our headглава
111
413569
3838
К счастью, нам не пришлось
устанавливать камеру себе на голову
07:09
and wait for manyмногие yearsлет.
112
417407
1764
и ждать много лет.
07:11
We wentотправился to the Internetинтернет,
113
419171
1463
Мы использовали интернет —
07:12
the biggestсамый большой treasureсокровище troveклад of picturesкартинки
that humansлюди have ever createdсозданный.
114
420634
4436
кладезь изображений, самую большую
из созданных человечеством.
07:17
We downloadedзагруженный nearlyоколо a billionмиллиард imagesизображений
115
425070
3041
Мы скачали почти миллиард изображений
07:20
and used crowdsourcingкраудсорсинг technologyтехнологии
like the AmazonАмазонка Mechanicalмеханический Turkтурчанка platformПлатформа
116
428111
5880
и для их описания применили
краудсорсинг-платформу
07:25
to help us to labelметка these imagesизображений.
117
433991
2339
Amazon Mechanical Turk.
07:28
At its peakвершина горы, ImageNetImageNet was one of
the biggestсамый большой employersработодатели
118
436330
4900
На пике активности ImageNet была одним
из самых популярных работодателей
07:33
of the AmazonАмазонка Mechanicalмеханический Turkтурчанка workersрабочие:
119
441230
2996
для сотрудников Amazon Mechanical Turk:
07:36
togetherвместе, almostпочти 50,000 workersрабочие
120
444226
3854
порядка 50 000 работников
07:40
from 167 countriesстраны around the worldМир
121
448080
4040
из 167 стран мира
07:44
helpedпомог us to cleanчистый, sortСортировать and labelметка
122
452120
3947
помогли нам привести в порядок,
отсортировать и описать
07:48
nearlyоколо a billionмиллиард candidateкандидат imagesизображений.
123
456067
3575
почти миллиард изображений-кандидатов.
07:52
That was how much effortусилие it tookвзял
124
460612
2653
Вот сколько потребовалось усилий,
07:55
to captureзахватить even a fractionдоля
of the imageryобразность
125
463265
3900
чтобы охватить лишь малую часть
той базы изображений,
07:59
a child'sДети mindразум takes in
in the earlyрано developmentalразвивающий yearsлет.
126
467165
4171
которую создаёт мозг ребёнка
в ранние годы развития.
08:04
In hindsightнепредусмотрительность, this ideaидея of usingс помощью bigбольшой dataданные
127
472148
3902
Оглядываясь назад, идея использования
большого архива данных
08:08
to trainпоезд computerкомпьютер algorithmsалгоритмы
mayмай seemказаться obviousочевидный now,
128
476050
4550
для обучения компьютеров
сейчас может показаться очевидной,
08:12
but back in 2007, it was not so obviousочевидный.
129
480600
4110
но в 2007 году это было далеко не так.
08:16
We were fairlyдовольно aloneв одиночестве on this journeyпоездка
for quiteдовольно a while.
130
484710
3878
Долгое время у нас совсем
не было единомышленников.
08:20
Some very friendlyдружелюбный colleaguesколлеги advisedрекомендуется me
to do something more usefulполезным for my tenureвладение,
131
488588
5003
Некоторые дружелюбные коллеги советовали
мне заняться более полезным делом,
08:25
and we were constantlyпостоянно strugglingборющийся
for researchисследование fundingфинансирование.
132
493591
4342
и нам никогда не хватало денег
на исследования.
08:29
Onceоднажды, I even jokedпошутил to my graduateвыпускник studentsстуденты
133
497933
2485
Однажды я даже пошутила
со своими студентами,
08:32
that I would just reopenвозобновлять
my dryсухой cleaner'sочистители shopмагазин to fundфонд ImageNetImageNet.
134
500418
4063
что я снова открою свою химчистку,
чтобы профинансировать ImageNet.
08:36
After all, that's how I fundedфундированный
my collegeколледж yearsлет.
135
504481
4761
В конце концов, именно с её помощью
я оплатила обучение в университете.
08:41
So we carriedосуществляется on.
136
509242
1856
И мы продолжили работать.
08:43
In 2009, the ImageNetImageNet projectпроект deliveredдоставлен
137
511098
3715
В 2009 году проект ImageNet собрал
08:46
a databaseбаза данных of 15 millionмиллиона imagesизображений
138
514813
4042
базу из 15 миллионов изображений,
08:50
acrossчерез 22,000 classesклассы
of objectsобъекты and things
139
518855
4805
22 тысяч классов объектов и предметов,
08:55
organizedорганизованная by everydayкаждый день Englishанглийский wordsслова.
140
523660
3320
упорядоченных при помощи повседневных
английских слов.
08:58
In bothи то и другое quantityколичество and qualityкачественный,
141
526980
2926
Как количественно, так и качественно
09:01
this was an unprecedentedбеспрецедентный scaleмасштаб.
142
529906
2972
это был беспрецедентный по размеру проект.
09:04
As an exampleпример, in the caseдело of catsкоты,
143
532878
3461
Например, в случае с котами
09:08
we have more than 62,000 catsкоты
144
536339
2809
в базе содержится более 62 000 котов
09:11
of all kindsвиды of looksвыглядит and posesпозы
145
539148
4110
разных пород, в разных позах,
09:15
and acrossчерез all speciesвид
of domesticвнутренний and wildдикий catsкоты.
146
543258
5223
всех видов, как домашних, так и диких.
09:20
We were thrilledвзволнованный
to have put togetherвместе ImageNetImageNet,
147
548481
3344
Мы были на седьмом небе от счастья,
когда база ImageNet была готова.
09:23
and we wanted the wholeвсе researchисследование worldМир
to benefitвыгода from it,
148
551825
3738
Мы хотели, чтобы она принесла пользу
всему научному сообществу.
09:27
so in the TEDТЕД fashionмода,
we openedоткрытый up the entireвсе dataданные setзадавать
149
555563
4041
И мы, как и TED, открыли бесплатный
неограниченный доступ к базе данных
09:31
to the worldwideМировой
researchисследование communityсообщество for freeсвободно.
150
559604
3592
для всего мирового научного сообщества.
09:36
(ApplauseАплодисменты)
151
564636
4000
(Аплодисменты)
09:41
Now that we have the dataданные
to nourishудобрять our computerкомпьютер brainголовной мозг,
152
569416
4538
Сейчас, когда у нас есть база данных,
чтобы питать наш компьютерный мозг,
09:45
we're readyготов to come back
to the algorithmsалгоритмы themselvesсамих себя.
153
573954
3737
мы готовы вернуться к алгоритмам.
09:49
As it turnedоказалось out, the wealthбогатство
of informationИнформация providedпредоставлена by ImageNetImageNet
154
577691
5178
Как оказалось, база данных,
предоставленная ImageNet,
09:54
was a perfectидеально matchсовпадение to a particularконкретный classкласс
of machineмашина learningобучение algorithmsалгоритмы
155
582869
4806
точно подходила для определённого класса
алгоритмов обучения машин,
09:59
calledназывается convolutionalсверточного neuralнервный networkсеть,
156
587675
2415
который называется
свёрточная нейронная сеть,
10:02
pioneeredвпервые by KunihikoКунихико FukushimaФукусима,
GeoffGeoff HintonХинтон, and YannYann LeCunLeCun
157
590090
5248
начало которому положили
Кунихико Фукушима, Джефф Хинтон
10:07
back in the 1970s and '80s.
158
595338
3645
и Ян ЛеКун ещё в 1970-е и 80-е годы.
10:10
Just like the brainголовной мозг consistsсостоит
of billionsмиллиарды of highlyвысоко connectedсвязанный neuronsнейроны,
159
598983
5619
Так же как и в мозге, состоящем
из миллиардов взаимосвязанных нейронов,
10:16
a basicосновной operatingоперационная unitЕд. изм in a neuralнервный networkсеть
160
604602
3854
простейшей операционной единицей
нейронной сети
10:20
is a neuron-likeнейроноподобной nodeузел.
161
608456
2415
является нейроподобный узел.
10:22
It takes inputвход from other nodesузлы
162
610871
2554
Он принимает входные данные
от одних узлов
10:25
and sendsпосылает outputвывод to othersдругие.
163
613425
2718
и отправляет выходные данные другим.
10:28
Moreoverболее того, these hundredsсотни of thousandsтысячи
or even millionsмиллионы of nodesузлы
164
616143
4713
Более того, сотни тысяч
или даже миллионы таких узлов
10:32
are organizedорганизованная in hierarchicalиерархическая layersслои,
165
620856
3227
упорядочены по иерархическим уровням,
10:36
alsoтакже similarаналогичный to the brainголовной мозг.
166
624083
2554
также по аналогии с человеческим мозгом.
10:38
In a typicalтипичный neuralнервный networkсеть we use
to trainпоезд our objectобъект recognitionпризнание modelмодель,
167
626637
4783
В обычной нейронной сети,
которую мы используем для обучения
10:43
it has 24 millionмиллиона nodesузлы,
168
631420
3181
нашей модели распознавания,
содержится 24 миллиона узлов,
10:46
140 millionмиллиона parametersпараметры,
169
634601
3297
140 миллионов параметров
10:49
and 15 billionмиллиард connectionsсвязи.
170
637898
2763
и 15 миллиардов связей.
10:52
That's an enormousогромный modelмодель.
171
640661
2415
Эта модель огромна.
10:55
PoweredРаботает by the massiveмассивный dataданные from ImageNetImageNet
172
643076
3901
Функционирующая
на основе базы ImageNet
10:58
and the modernсовременное CPUsпроцессоры and GPUsГрафические процессоры
to trainпоезд suchтакие a humongousHumongous modelмодель,
173
646977
5433
при помощи современных микропроцессоров
для обучения этой огромной модели,
11:04
the convolutionalсверточного neuralнервный networkсеть
174
652410
2369
свёрточная нейронная сеть
11:06
blossomedрасцвела in a way that no one expectedожидаемый.
175
654779
3436
превзошла все ожидания.
11:10
It becameстал the winningвыигрыш architectureархитектура
176
658215
2508
Она позволила создать
эффективную систему
11:12
to generateгенерировать excitingзахватывающе newновый resultsРезультаты
in objectобъект recognitionпризнание.
177
660723
5340
для получения новых многообещающих
результатов в распознавании объектов.
11:18
This is a computerкомпьютер tellingговоря us
178
666063
2810
Вот компьютер, который говорит нам,
11:20
this pictureкартина containsсодержит a catКот
179
668873
2300
что на картинке есть кот
11:23
and where the catКот is.
180
671173
1903
и где этот кот находится.
11:25
Of courseкурс there are more things than catsкоты,
181
673076
2112
Конечно, на картинках не только коты.
11:27
so here'sвот a computerкомпьютер algorithmалгоритм tellingговоря us
182
675188
2438
Вот компьютер, который сообщает нам,
11:29
the pictureкартина containsсодержит
a boyмальчик and a teddyТедди bearмедведь;
183
677626
3274
что на фото мальчик и плюшевый мишка,
11:32
a dogсобака, a personчеловек, and a smallмаленький kiteвоздушный змей
in the backgroundзадний план;
184
680900
4366
собака, человек, и маленький
воздушный змей на заднем фоне.
11:37
or a pictureкартина of very busyзанятый things
185
685266
3135
Или фотография с большим
количеством объектов:
11:40
like a man, a skateboardскейтборд,
railingsдуги, a lampostlampost, and so on.
186
688401
4644
мужчина, скейтборд,
перила, фонарь и т.д.
11:45
SometimesИногда, when the computerкомпьютер
is not so confidentуверенная в себе about what it seesвидит,
187
693045
5293
Когда компьютер не уверен в том,
что он видит,
11:51
we have taughtучил it to be smartумная enoughдостаточно
188
699498
2276
он обучен действовать по-умному
11:53
to give us a safeбезопасно answerответ
insteadвместо of committingсовершение too much,
189
701774
3878
и давать нам наиболее безопасный
ответ, без неоправданных рисков,
11:57
just like we would do,
190
705652
2811
что именно и сделал бы человек.
12:00
but other timesраз our computerкомпьютер algorithmалгоритм
is remarkableзамечательный at tellingговоря us
191
708463
4666
Но бывает и так, что наш алгоритм
совершенно безошибочно сообщает нам,
12:05
what exactlyв точку the objectsобъекты are,
192
713129
2253
какие объекты он видит.
12:07
like the make, modelмодель, yearгод of the carsлегковые автомобили.
193
715382
3436
Например, марку, модель
и год выпуска автомобиля.
12:10
We appliedприкладная this algorithmалгоритм to millionsмиллионы
of GoogleGoogle Streetулица ViewПосмотреть imagesизображений
194
718818
5386
Мы применили этот алгоритм к миллионам
фотографий на Google Street View
12:16
acrossчерез hundredsсотни of Americanамериканский citiesгорода,
195
724204
3135
из сотен американских городов
12:19
and we have learnedнаучился something
really interestingинтересно:
196
727339
2926
и получили очень интересные результаты.
12:22
first, it confirmedподтвердил our commonобщий wisdomмудрость
197
730265
3320
Во-первых, они подтвердили известный факт,
12:25
that carавтомобиль pricesЦены correlateсоотносить very well
198
733585
3290
что стоимость автомобиля зависит
12:28
with householdдомашнее хозяйство incomesдоходов.
199
736875
2345
от дохода семьи.
12:31
But surprisinglyкак ни странно, carавтомобиль pricesЦены
alsoтакже correlateсоотносить well
200
739220
4527
Но, к удивлению,
цены на автомобили также зависят
12:35
with crimeпреступление ratesставки in citiesгорода,
201
743747
2300
от уровня преступности в городах
12:39
or votingголосование patternsузоры by zipзастежка-молния codesкоды.
202
747007
3963
или даже модели голосования
в разных штатах.
12:44
So wait a minuteминут. Is that it?
203
752060
2206
Минутку. Это свершилось?
12:46
Has the computerкомпьютер alreadyуже matchedсоответствие
or even surpassedпревзойден humanчеловек capabilitiesвозможности?
204
754266
5153
Компьютеры догнали или даже превзошли
человеческие возможности?
12:51
Not so fastбыстро.
205
759419
2138
Не тут-то было.
12:53
So farдалеко, we have just taughtучил
the computerкомпьютер to see objectsобъекты.
206
761557
4923
Пока мы научили компьютеры
только видеть объекты.
12:58
This is like a smallмаленький childребенок
learningобучение to utterвыговорить a fewмало nounsсуществительные.
207
766480
4644
Это сродни тому, как маленький ребёнок
учится произносить несколько слов.
13:03
It's an incredibleнеимоверный accomplishmentдостижение,
208
771124
2670
Это невероятное достижение,
13:05
but it's only the first stepшаг.
209
773794
2460
но это всего лишь первый шаг.
13:08
SoonСкоро, anotherдругой developmentalразвивающий
milestoneвеха will be hitудар,
210
776254
3762
Вскоре будет пройден
новый этап развития,
13:12
and childrenдети beginначать
to communicateобщаться in sentencesпредложения.
211
780016
3461
и ребёнок сможет составлять
из слов предложения.
13:15
So insteadвместо of sayingпоговорка
this is a catКот in the pictureкартина,
212
783477
4224
И вместо того чтобы сказать,
что на картинке кошка,
13:19
you alreadyуже heardуслышанным the little girlдевушка
tellingговоря us this is a catКот lyingлежащий on a bedпостель.
213
787701
5202
маленькая девочка скажет,
что кошка лежит на кровати.
13:24
So to teachучат a computerкомпьютер
to see a pictureкартина and generateгенерировать sentencesпредложения,
214
792903
5595
Для того чтобы научить компьютер видеть
картинку и составлять предложения,
13:30
the marriageБрак, создание семьи betweenмежду bigбольшой dataданные
and machineмашина learningобучение algorithmалгоритм
215
798498
3948
связь между большой базой данных
и алгоритмом обучения машин
13:34
has to take anotherдругой stepшаг.
216
802446
2275
должна выйти на новый уровень.
13:36
Now, the computerкомпьютер has to learnучить
from bothи то и другое picturesкартинки
217
804721
4156
Теперь компьютер должен учиться
не только по фотографиям,
13:40
as well as naturalнатуральный languageязык sentencesпредложения
218
808877
2856
но и на основе предложений
естественного языка,
13:43
generatedгенерироваться by humansлюди.
219
811733
3322
составляемых человеком.
13:47
Just like the brainголовной мозг integratesинтегрирует
visionвидение and languageязык,
220
815055
3853
Отталкиваясь от факта,
что мозг объединяет зрение и язык,
13:50
we developedразвитая a modelмодель
that connectsподключает partsчасти of visualвизуальный things
221
818908
5201
мы разработали модель,
соединяющую части визуальной картины,
13:56
like visualвизуальный snippetsобрывки
222
824109
1904
как маленькие фрагменты,
13:58
with wordsслова and phrasesфразы in sentencesпредложения.
223
826013
4203
со словами и фразами в предложениях.
14:02
About four4 monthsмесяцы agoтому назад,
224
830216
2763
Около четырёх месяцев назад
14:04
we finallyв конце концов tiedсвязанный all this togetherвместе
225
832979
2647
мы привели всё это
к общему знаменателю
14:07
and producedпроизведенный one of the first
computerкомпьютер visionвидение modelsмодели
226
835626
3784
и создали одну из первых моделей
компьютерного зрения,
14:11
that is capableспособный of generatingпорождающий
a human-likeчеловек, как sentenceпредложение
227
839410
3994
способную, подобно человеку,
создавать предложения
14:15
when it seesвидит a pictureкартина for the first time.
228
843404
3506
после просмотра фотографии в первый раз.
14:18
Now, I'm readyготов to showпоказать you
what the computerкомпьютер saysговорит
229
846910
4644
Сейчас я покажу вам,
что говорит компьютер,
14:23
when it seesвидит the pictureкартина
230
851554
1975
когда видит фотографию,
14:25
that the little girlдевушка saw
at the beginningначало of this talk.
231
853529
3830
которую описывала девочка
в начале этого доклада.
14:31
(Videoвидео) Computerкомпьютер: A man is standingпостоянный
nextследующий to an elephantслон.
232
859519
3344
(Видео) Компьютер:
Рядом со слоном стоит мужчина.
14:36
A largeбольшой airplaneсамолет sittingсидящий on topВверх
of an airportаэропорт runwayВПП.
233
864393
3634
Большой самолёт находится
на взлётно-посадочной полосе аэропорта.
14:41
FFLFFL: Of courseкурс, we're still workingза работой hardжесткий
to improveулучшать our algorithmsалгоритмы,
234
869057
4212
ФФЛ: Конечно, мы продолжаем усердно
работать над улучшением нашего алгоритма,
14:45
and it still has a lot to learnучить.
235
873269
2596
и ему предстоит ещё многому научиться.
14:47
(ApplauseАплодисменты)
236
875865
2291
(Аплодисменты)
14:51
And the computerкомпьютер still makesмарки mistakesошибки.
237
879556
3321
Компьютер всё ещё допускает ошибки.
14:54
(Videoвидео) Computerкомпьютер: A catКот lyingлежащий
on a bedпостель in a blanketодеяло.
238
882877
3391
(Видео) Компьютер:
Кот лежит на кровати в одеяле.
14:58
FFLFFL: So of courseкурс, when it seesвидит
too manyмногие catsкоты,
239
886268
2553
ФФЛ: Конечно, когда он видит
слишком много котов,
15:00
it thinksдумает everything
mightмог бы look like a catКот.
240
888821
2926
он считает, что всё остальное
тоже выглядит как кот.
15:05
(Videoвидео) Computerкомпьютер: A youngмолодой boyмальчик
is holdingдержа a baseballбейсбол batлетучая мышь.
241
893317
2864
(Видео) Компьютер:
Мальчик держит бейсбольную биту.
15:08
(LaughterСмех)
242
896181
1765
(Смех)
15:09
FFLFFL: Or, if it hasn'tне имеет seenвидели a toothbrushзубная щетка,
it confusesпутает it with a baseballбейсбол batлетучая мышь.
243
897946
4583
ФФЛ: Если он не видел зубной щётки,
он принимает её за бейсбольную биту.
15:15
(Videoвидео) Computerкомпьютер: A man ridingверховая езда a horseлошадь
down a streetулица nextследующий to a buildingздание.
244
903309
3434
(Видео) Компьютер: Мужчина едет верхом
по улице рядом со зданием.
15:18
(LaughterСмех)
245
906743
2023
(Смех)
15:20
FFLFFL: We haven'tне taughtучил ArtИзобразительное искусство 101
to the computersкомпьютеры.
246
908766
3552
ФФЛ: Мы не обучили компьютер
основам искусства.
15:25
(Videoвидео) Computerкомпьютер: A zebraзебра standingпостоянный
in a fieldполе of grassтрава.
247
913768
2884
(Видео) Компьютер:
Зебра стоит на поле с травой.
15:28
FFLFFL: And it hasn'tне имеет learnedнаучился to appreciateценить
the stunningоглушающий beautyкрасота of natureприрода
248
916652
3367
ФФЛ: Он также ещё не может оценить
красоту природы так,
15:32
like you and I do.
249
920019
2438
как это можем мы с вами.
15:34
So it has been a long journeyпоездка.
250
922457
2832
Это длительный процесс.
15:37
To get from ageвозраст zeroнуль to threeтри was hardжесткий.
251
925289
4226
Дорасти до трёх лет было трудно.
15:41
The realреальный challengeвызов is to go
from threeтри to 13 and farдалеко beyondза.
252
929515
5596
Ещё сложнее — от трёх
до тринадцати и так далее.
15:47
Let me remindнапоминать you with this pictureкартина
of the boyмальчик and the cakeкекс again.
253
935111
4365
Позвольте вам снова показать фотографию
мальчика с тортом.
15:51
So farдалеко, we have taughtучил
the computerкомпьютер to see objectsобъекты
254
939476
4064
Компьютер уже умеет видеть предметы
15:55
or even tell us a simpleпросто storyистория
when seeingвидя a pictureкартина.
255
943540
4458
и даже вкратце рассказывать историю о том,
что изображено на фотографии.
15:59
(Videoвидео) Computerкомпьютер: A personчеловек sittingсидящий
at a tableТаблица with a cakeкекс.
256
947998
3576
(Видео) Компьютер:
Человек сидит за столом с тортом.
16:03
FFLFFL: But there's so much more
to this pictureкартина
257
951574
2630
ФФЛ: На этой фотографии
изображено гораздо больше,
16:06
than just a personчеловек and a cakeкекс.
258
954204
2270
чем просто человек и торт.
16:08
What the computerкомпьютер doesn't see
is that this is a specialособый Italianитальянский cakeкекс
259
956474
4467
Компьютер не видит, что это особый
итальянский торт,
16:12
that's only servedслужил duringв течение EasterПасха time.
260
960941
3217
который пекут только во время Пасхи.
16:16
The boyмальчик is wearingносить his favoriteлюбимый t-shirtФутболка
261
964158
3205
На мальчике надета
его любимая футболка,
16:19
givenданный to him as a giftподарок by his fatherотец
after a tripпоездка to SydneyСидней,
262
967363
3970
которую ему подарил отец
после поездки в Сидней.
16:23
and you and I can all tell how happyсчастливый he is
263
971333
3808
И невооружённым глазом видно,
как счастлив мальчик
16:27
and what's exactlyв точку on his mindразум
at that momentмомент.
264
975141
3203
и о чём именно он думает в этот момент.
16:31
This is my sonсын LeoЛео.
265
979214
3125
Это мой сын Лео.
16:34
On my questпоиск for visualвизуальный intelligenceинтеллект,
266
982339
2624
В моих поисках визуального интеллекта
16:36
I think of LeoЛео constantlyпостоянно
267
984963
2391
я постоянно думаю о Лео
16:39
and the futureбудущее worldМир he will liveжить in.
268
987354
2903
и о том мире, в котором он будет жить.
16:42
When machinesмашины can see,
269
990257
2021
Когда машины будут способны видеть,
16:44
doctorsврачи and nursesмедсестры will have
extraдополнительный pairsпары of tirelessнеутомимый eyesглаза
270
992278
4712
доктора и медсёстры обзаведутся
дополнительной парой неустающих глаз
16:48
to help them to diagnoseдиагностики
and take careзабота of patientsпациентов.
271
996990
4092
для диагностики заболеваний
и ухода за пациентами.
16:53
CarsЛегковые автомобили will runбег smarterумнее
and saferбезопаснее on the roadДорога.
272
1001082
4383
Машины на дорогах станут
умнее и безопаснее.
16:57
RobotsРоботы, not just humansлюди,
273
1005465
2694
Не только люди, но и роботы
17:00
will help us to braveХрабрый the disasterкатастрофа zonesзон
to saveспасти the trappedловушке and woundedраненый.
274
1008159
4849
смогут оказывать помощь в зонах бедствий
и спасать людей из-под завалов.
17:05
We will discoverобнаружить newновый speciesвид,
better materialsматериалы,
275
1013798
3796
С помощью машин мы откроем
новые виды животных и растений,
17:09
and exploreисследовать unseenневидимый frontiersграницы
with the help of the machinesмашины.
276
1017594
4509
усовершенствуем материалы
и расширим границы своей деятельности.
17:15
Little by little, we're givingдающий sightвзгляд
to the machinesмашины.
277
1023113
4167
Постепенно машины обретут зрение.
17:19
First, we teachучат them to see.
278
1027280
2798
Сначала мы научим их видеть.
17:22
Then, they help us to see better.
279
1030078
2763
Затем они помогут видеть лучше нам самим.
17:24
For the first time, humanчеловек eyesглаза
won'tне будет be the only onesте,
280
1032841
4165
Впервые человек будет
осваивать и осознавать мир
17:29
ponderingразмышляют and exploringисследование our worldМир.
281
1037006
2934
посредством не только своих,
но и компьютерных глаз.
17:31
We will not only use the machinesмашины
for theirих intelligenceинтеллект,
282
1039940
3460
Мы будем не только использовать машины
благодаря их интеллекту,
17:35
we will alsoтакже collaborateсотрудничать with them
in waysпути that we cannotне могу even imagineпредставить.
283
1043400
6179
но и работать совместно с ними так,
как никто и не мог вообразить.
17:41
This is my questпоиск:
284
1049579
2161
Это моя задача:
17:43
to give computersкомпьютеры visualвизуальный intelligenceинтеллект
285
1051740
2712
дать машинам визуальный интеллект
17:46
and to createСоздайте a better futureбудущее
for LeoЛео and for the worldМир.
286
1054452
5131
и создать лучшее будущее
для Лео и всего мира.
17:51
Thank you.
287
1059583
1811
Спасибо.
17:53
(ApplauseАплодисменты)
288
1061394
3785
(Аплодисменты)
Translated by Olga Babeeva
Reviewed by Katya Roberts

▲Back to top

ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com