ABOUT THE SPEAKER

Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers.

More profile about the speaker
Fei-Fei Li | Speaker | TED.com

TED2015

Fei-Fei Li: How we're teaching computers to understand pictures

Фей-Фей Ли: Как мы учим компьютеры понимать изображения

Filmed: 2015-03-17

Readability: 4.5

2,702,344 views

Когда малыш смотрит на изображение, он может определить простые объекты: «кот», «книга», «стул». Сейчас компьютеры стали такими умными, что сами могут справиться с этой задачей. Что дальше? В захватывающем выступлении эксперт по компьютерному зрению Фей-Фей Ли описывает последние достижения науки, включая базу данных, содержащую 15 миллионов фотографий, которую создала её команда, чтобы «научить» компьютер понимать изображения, — а в скором будущем последуют и главные результаты этой работы.

Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio

Double-click the English transcript below to play the video.

00:14

Let me showпоказать you something.

0

2366

3738

Позвольте вам кое-что показать.

00:18

(Videoвидео) Girlдевушка: Okay, that's a catКот
sittingсидящий in a bedпостель.

1

6104

4156

(Видео) Девочка: Кот сидит на кровати.

00:22

The boyмальчик is pettingласки the elephantслон.

2

10260

4040

Мальчик гладит слона.

00:26

Those are people
that are going on an airplaneсамолет.

3

14300

4354

Люди садятся в самолёт.

00:30

That's a bigбольшой airplaneсамолет.

4

18654

2810

Это большой самолёт.

00:33

Fei-FeiFei-Fei LiLi: This is
a three-year-oldтри-летний childребенок

5

21464

2206

Фей-Фей Ли: Трёхлетняя девочка

00:35

describingописывающее what she seesвидит
in a seriesсерии of photosфото.

6

23670

3679

описывает то, что она видит
на фотографиях.

00:39

She mightмог бы still have a lot
to learnучить about this worldМир,

7

27349

2845

Ей предстоит ещё много
узнать об этом мире,

00:42

but she's alreadyуже an expertэксперт
at one very importantважный taskзадача:

8

30194

4549

но она уже довольно искусно
справляется с очень важной задачей:

00:46

to make senseсмысл of what she seesвидит.

9

34743

2846

она осознаёт то, что видит.

00:50

Our societyобщество is more
technologicallyтехнологически advancedпередовой than ever.

10

38229

4226

Наше общество технологически развито
больше, чем когда-либо.

00:54

We sendОтправить people to the moonЛуна,
we make phonesтелефоны that talk to us

11

42455

3629

Мы отправляем людей на Луну,
создаём телефоны, которые говорят с нами,

00:58

or customizeнастроить radioрадио stationsстанций
that can playиграть only musicМузыка we like.

12

46084

4946

и настраиваем радиостанции, чтобы слушать
только такую музыку, которая нам нравится.

01:03

YetВсе же, our mostбольшинство advancedпередовой
machinesмашины and computersкомпьютеры

13

51030

4055

Но эта задача всё ещё не под силу
нашим самым продвинутым

01:07

still struggleборьба at this taskзадача.

14

55085

2903

механизмам и компьютерам.

01:09

So I'm here todayCегодня
to give you a progressпрогресс reportдоклад

15

57988

3459

Сегодня я выступлю перед вами
с докладом

01:13

on the latestпоследний advancesдостижения
in our researchисследование in computerкомпьютер visionвидение,

16

61447

4047

о наших последних достижениях
в области машинного зрения,

01:17

one of the mostбольшинство frontierграница
and potentiallyпотенциально revolutionaryреволюционер

17

65494

4161

одной из самых передовых
и потенциально революционных

01:21

technologiesтехнологии in computerкомпьютер scienceнаука.

18

69655

3206

технологий в области компьютерных наук.

01:24

Yes, we have prototypedпрототип carsлегковые автомобили
that can driveводить машину by themselvesсамих себя,

19

72861

4551

Да, мы создали прототипы
беспилотных автомобилей,

01:29

but withoutбез smartумная visionвидение,
they cannotне могу really tell the differenceразница

20

77412

3853

но без компьютерного зрения
они не смогут отличить

01:33

betweenмежду a crumpledмятый paperбумага bagмешок
on the roadДорога, whichкоторый can be runбег over,

21

81265

3970

на дороге бумажный пакет,
по которому можно проехать,

01:37

and a rockкамень that sizeразмер,
whichкоторый should be avoidedизбегать.

22

85235

3340

от камня похожего размера,
который стоит объехать.

01:41

We have madeсделал fabulousневероятный megapixelмегапиксельную camerasкамеры,

23

89415

3390

Мы создали замечательные
мегапиксельные камеры,

01:44

but we have not deliveredдоставлен
sightвзгляд to the blindслепой.

24

92805

3135

но не смогли вернуть зрение слепым.

01:48

DronesДроны can flyлетать over massiveмассивный landземельные участки,

25

96420

3305

Беспилотные аппараты могут преодолевать
огромные расстояния,

01:51

but don't have enoughдостаточно visionвидение technologyтехнологии

26

99725

2134

но не обладают достаточной
технологией зрения,

01:53

to help us to trackтрек
the changesизменения of the rainforestsтропические леса.

27

101859

3461

чтобы помочь нам отслеживать
динамику вырубки тропических лесов.

01:57

SecurityБезопасность camerasкамеры are everywhereвезде,

28

105320

2950

Повсюду находятся
камеры видеонаблюдения,

02:00

but they do not alertбдительный us when a childребенок
is drowningутопление in a swimmingплавание poolбассейн.

29

108270

5067

но они не могут предупредить нас
о тонущем в бассейне ребёнке.

02:06

PhotosФото and videosвидео are becomingстановление
an integralинтеграл partчасть of globalГлобальный life.

30

114167

5595

Фотографии и видеоролики становятся
неотъемлемой частью нашей жизни.

02:11

They're beingявляющийся generatedгенерироваться at a paceтемп
that's farдалеко beyondза what any humanчеловек,

31

119762

4087

Они накапливаются с такой скоростью,
что их все невозможно просмотреть

02:15

or teamsкоманды of humansлюди, could hopeнадежда to viewПосмотреть,

32

123849

2783

ни одному человеку, ни группе людей.

02:18

and you and I are contributingспособствуя
to that at this TEDТЕД.

33

126632

3921

Мы, участники TED, тоже этому
поспособствовали.

02:22

YetВсе же our mostбольшинство advancedпередовой softwareпрограммного обеспечения
is still strugglingборющийся at understandingпонимание

34

130553

5232

Нашему самому продвинутому программному
обеспечению не под силу воспринимать

02:27

and managingуправление this enormousогромный contentсодержание.

35

135785

3876

этот огромный массив данных
и управлять им.

02:31

So in other wordsслова,
collectivelyколлективно as a societyобщество,

36

139661

5272

Иначе говоря, коллективно

02:36

we're very much blindслепой,

37

144933

1746

наше общество слепо,

02:38

because our smartestсмышленым
machinesмашины are still blindслепой.

38

146679

3387

потому что наши самые умные машины
всё ещё не умеют видеть.

02:43

"Why is this so hardжесткий?" you mayмай askпросить.

39

151526

2926

«Почему же это так сложно?» —
спросите вы.

02:46

Camerasкамеры can take picturesкартинки like this one

40

154452

2693

Фотокамеры могут делать
вот такие фотографии,

02:49

by convertingпреобразование lightsогни into
a two-dimensionalдвумерный arrayмассив of numbersчисел

41

157145

3994

преобразовывая свет
в двухмерную числовую последовательность,

02:53

knownизвестен as pixelsпикселей,

42

161139

1650

известную как «пиксели».

02:54

but these are just lifelessбезжизненный numbersчисел.

43

162789

2251

Но это просто числа.

02:57

They do not carryнести meaningимея в виду in themselvesсамих себя.

44

165040

3111

Они не несут в себе никакого смысла.

03:00

Just like to hearзаслушивать is not
the sameодна и та же as to listen,

45

168151

4343

Так же, как «слышать» —
не то же самое, что «слушать»,

03:04

to take picturesкартинки is not
the sameодна и та же as to see,

46

172494

4040

«делать» фотографии — не то же самое,
что «видеть» их,

03:08

and by seeingвидя,
we really mean understandingпонимание.

47

176534

3829

а под «видеть», конечно же,
имеется в виду «понимать».

03:13

In factфакт, it tookвзял MotherМама NatureПрирода
540 millionмиллиона yearsлет of hardжесткий work

48

181293

6177

Природе пришлось усердно трудиться
в течение 540 миллионов лет,

03:19

to do this taskзадача,

49

187470

1973

чтобы решить эту задачу,

03:21

and much of that effortусилие

50

189443

1881

и многие из этих усилий
были направлены

03:23

wentотправился into developingразвивающийся the visualвизуальный
processingобработка apparatusустройство of our brainsмозги,

51

191324

5271

на создание аппарата обработки
визуальных данных в нашем мозге,

03:28

not the eyesглаза themselvesсамих себя.

52

196595

2647

а не глаз как таковых.

03:31

So visionвидение beginsначинается with the eyesглаза,

53

199242

2747

Зрение начинается с глаз,

03:33

but it trulyдействительно takes placeместо in the brainголовной мозг.

54

201989

3518

но фактически происходит в мозге.

03:38

So for 15 yearsлет now, startingначало
from my PhpH.D. at CaltechКалифорнийский технологический институт

55

206287

5060

В течение вот уже 15 лет, начиная
с аспирантуры в Калтехе,

03:43

and then leadingведущий Stanford'sСтэнфорда Visionвидение Labлаборатория,

56

211347

2926

а затем возглавляя стэнфордскую
лабораторию зрения,

03:46

I've been workingза работой with my mentorsнаставники,
collaboratorsсотрудники and studentsстуденты

57

214273

4396

я работаю вместе с наставниками,
коллегами и студентами,

03:50

to teachучат computersкомпьютеры to see.

58

218669

2889

обучая компьютеры видеть.

03:54

Our researchисследование fieldполе is calledназывается
computerкомпьютер visionвидение and machineмашина learningобучение.

59

222658

3294

Сфера наших исследований —
машинное зрение и обучение машин.

03:57

It's partчасть of the generalГенеральная fieldполе
of artificialискусственный intelligenceинтеллект.

60

225952

3878

Это часть области под названием
искусственный интеллект.

04:03

So ultimatelyв конечном счете, we want to teachучат
the machinesмашины to see just like we do:

61

231000

5493

Наша главная задача — научить
машины видеть, так как это можем мы:

04:08

namingименование objectsобъекты, identifyingидентифицирующий people,
inferringвыводя 3D geometryгеометрия of things,

62

236493

5387

называть объекты, узнавать людей,
использовать трёхмерную геометрию вещей,

04:13

understandingпонимание relationsсвязи, emotionsэмоции,
actionsдействия and intentionsнамерения.

63

241880

5688

понимать отношения, эмоции,
действия и намерения.

04:19

You and I weaveткать togetherвместе entireвсе storiesистории
of people, placesмест and things

64

247568

6153

Мы можем создавать целые истории
о людях, местах, вещах —

04:25

the momentмомент we layпрокладывать our gazeпосмотреть on them.

65

253721

2164

стоит нам только на них взглянуть.

04:28

The first stepшаг towardsв направлении this goalЦель
is to teachучат a computerкомпьютер to see objectsобъекты,

66

256955

5583

Первый шаг к этой цели —
научить машины видеть объекты,

04:34

the buildingздание blockблок of the visualвизуальный worldМир.

67

262538

3368

стандартные элементы визуального мира.

04:37

In its simplestсамый простой termsсроки,
imagineпредставить this teachingобучение processобработать

68

265906

4434

Простыми словами, процесс обучения —

04:42

as showingпоказ the computersкомпьютеры
some trainingобучение imagesизображений

69

270340

2995

это демонстрация компьютеру некоторых
обучающих изображений

04:45

of a particularконкретный objectобъект, let's say catsкоты,

70

273335

3321

определённых объектов, например, кошек,

04:48

and designingпроектирование a modelмодель that learnsузнает
from these trainingобучение imagesизображений.

71

276656

4737

и разработка модели, которая обучается
на основе данных изображений.

04:53

How hardжесткий can this be?

72

281393

2044

Насколько это может быть сложным?

04:55

After all, a catКот is just
a collectionколлекция of shapesформы and colorsцвета,

73

283437

4052

Кошка — это просто
набор очертаний и цветов,

04:59

and this is what we did
in the earlyрано daysдней of objectобъект modelingмоделирование.

74

287489

4086

и именно этим мы занимались на заре
моделирования объектов.

05:03

We'dМы б tell the computerкомпьютер algorithmалгоритм
in a mathematicalматематическая languageязык

75

291575

3622

Посредством математического алгоритма
мы сообщали компьютеру,

05:07

that a catКот has a roundкруглый faceлицо,
a chubbyкруглолицый bodyтело,

76

295197

3343

что у кошки круглая морда,
пухленькое тело,

05:10

two pointyзаостренный earsуши, and a long tailхвост,

77

298540

2299

два острых уха и длинный хвост,

05:12

and that lookedсмотрел all fine.

78

300839

1410

и этого было достаточно.

05:14

But what about this catКот?

79

302859

2113

А как насчёт этого кота?

05:16

(LaughterСмех)

80

304972

1091

(Смех)

05:18

It's all curledкурчавый up.

81

306063

1626

Он изогнут непонятно как.

05:19

Now you have to addДобавить anotherдругой shapeформа
and viewpointсмотровая площадка to the objectобъект modelмодель.

82

307689

4719

Нужно добавить ещё одну форму
и точку обзора в модель.

05:24

But what if catsкоты are hiddenскрытый?

83

312408

1715

А если кот прячется?

05:27

What about these sillyглупый catsкоты?

84

315143

2219

Как насчёт этих смешных котов?

05:31

Now you get my pointточка.

85

319112

2417

Теперь вы меня понимаете.

05:33

Even something as simpleпросто
as a householdдомашнее хозяйство petдомашнее животное

86

321529

3367

Даже простой домашний питомец

05:36

can presentнастоящее время an infiniteбесконечный numberномер
of variationsвариации to the objectобъект modelмодель,

87

324896

4504

может представлять бесконечное число
вариаций в модели объекта,

05:41

and that's just one objectобъект.

88

329400

2233

а это всего лишь один объект.

05:44

So about eight8 yearsлет agoтому назад,

89

332573

2492

Где-то восемь лет назад

05:47

a very simpleпросто and profoundглубокий observationнаблюдение
changedизменено my thinkingмышление.

90

335065

5030

простое, но значительное наблюдение
изменило ход моих мыслей.

05:53

No one tellsговорит a childребенок how to see,

91

341425

2685

Никто не говорит ребёнку,
как надо видеть,

05:56

especiallyособенно in the earlyрано yearsлет.

92

344110

2261

особенно в ранние годы жизни.

05:58

They learnучить this throughчерез
real-worldреальный мир experiencesопыт and examplesПримеры.

93

346371

5000

Он учится этому на реальных примерах.

06:03

If you considerрассматривать a child'sДети eyesглаза

94

351371

2740

Если предположить, что глаза ребёнка —

06:06

as a pairпара of biologicalбиологический camerasкамеры,

95

354111

2554

это пара биологических камер,

06:08

they take one pictureкартина
about everyкаждый 200 millisecondsмиллисекунды,

96

356665

4180

то они делают один снимок
каждые 200 миллисекунд, —

06:12

the averageв среднем time an eyeглаз movementдвижение is madeсделал.

97

360845

3134

среднее время движения глазного яблока.

06:15

So by ageвозраст threeтри, a childребенок would have seenвидели
hundredsсотни of millionsмиллионы of picturesкартинки

98

363979

5550

К трём годам ребёнок уже увидит
сотни миллионов изображений

06:21

of the realреальный worldМир.

99

369529

1834

окружающего мира.

06:23

That's a lot of trainingобучение examplesПримеры.

100

371363

2280

Это очень много обучающих примеров.

06:26

So insteadвместо of focusingфокусирование solelyисключительно
on better and better algorithmsалгоритмы,

101

374383

5989

И вместо того, чтобы улучшать алгоритмы,

06:32

my insightв поле зрения was to give the algorithmsалгоритмы
the kindсвоего рода of trainingобучение dataданные

102

380372

5272

я предложила предоставить этим алгоритмам
такую же обучающую информацию,

06:37

that a childребенок was givenданный throughчерез experiencesопыт

103

385644

3319

которую через опыт получает ребёнок,

06:40

in bothи то и другое quantityколичество and qualityкачественный.

104

388963

3878

в таком же количестве и качестве.

06:44

Onceоднажды we know this,

105

392841

1858

Как только мы это осознали,

06:46

we knewзнал we neededнеобходимый to collectсобирать a dataданные setзадавать

106

394699

2971

мы поняли, что нам нужно было
собрать базу данных,

06:49

that has farдалеко more imagesизображений
than we have ever had before,

107

397670

4459

содержащую намного больше изображений,
чем когда-либо ранее,

06:54

perhapsвозможно thousandsтысячи of timesраз more,

108

402129

2577

возможно, в тысячи раз больше.

06:56

and togetherвместе with ProfessorПрофессор
KaiКай LiLi at PrincetonPrinceton UniversityУниверситет,

109

404706

4111

В 2007 году я и профессор Кай Ли
из Принстонского университета

07:00

we launchedзапущенный the ImageNetImageNet projectпроект in 2007.

110

408817

4752

запустили проект ImageNet.

07:05

Luckilyк счастью, we didn't have to mountкрепление
a cameraкамера on our headглава

111

413569

3838

К счастью, нам не пришлось
устанавливать камеру себе на голову

07:09

and wait for manyмногие yearsлет.

112

417407

1764

и ждать много лет.

07:11

We wentотправился to the Internetинтернет,

113

419171

1463

Мы использовали интернет —

07:12

the biggestсамый большой treasureсокровище troveклад of picturesкартинки
that humansлюди have ever createdсозданный.

114

420634

4436

кладезь изображений, самую большую
из созданных человечеством.

07:17

We downloadedзагруженный nearlyоколо a billionмиллиард imagesизображений

115

425070

3041

Мы скачали почти миллиард изображений

07:20

and used crowdsourcingкраудсорсинг technologyтехнологии
like the AmazonАмазонка Mechanicalмеханический Turkтурчанка platformПлатформа

116

428111

5880

и для их описания применили
краудсорсинг-платформу

07:25

to help us to labelметка these imagesизображений.

117

433991

2339

Amazon Mechanical Turk.

07:28

At its peakвершина горы, ImageNetImageNet was one of
the biggestсамый большой employersработодатели

118

436330

4900

На пике активности ImageNet была одним
из самых популярных работодателей

07:33

of the AmazonАмазонка Mechanicalмеханический Turkтурчанка workersрабочие:

119

441230

2996

для сотрудников Amazon Mechanical Turk:

07:36

togetherвместе, almostпочти 50,000 workersрабочие

120

444226

3854

порядка 50 000 работников

07:40

from 167 countriesстраны around the worldМир

121

448080

4040

из 167 стран мира

07:44

helpedпомог us to cleanчистый, sortСортировать and labelметка

122

452120

3947

помогли нам привести в порядок,
отсортировать и описать

07:48

nearlyоколо a billionмиллиард candidateкандидат imagesизображений.

123

456067

3575

почти миллиард изображений-кандидатов.

07:52

That was how much effortусилие it tookвзял

124

460612

2653

Вот сколько потребовалось усилий,

07:55

to captureзахватить even a fractionдоля
of the imageryобразность

125

463265

3900

чтобы охватить лишь малую часть
той базы изображений,

07:59

a child'sДети mindразум takes in
in the earlyрано developmentalразвивающий yearsлет.

126

467165

4171

которую создаёт мозг ребёнка
в ранние годы развития.

08:04

In hindsightнепредусмотрительность, this ideaидея of usingс помощью bigбольшой dataданные

127

472148

3902

Оглядываясь назад, идея использования
большого архива данных

08:08

to trainпоезд computerкомпьютер algorithmsалгоритмы
mayмай seemказаться obviousочевидный now,

128

476050

4550

для обучения компьютеров
сейчас может показаться очевидной,

08:12

but back in 2007, it was not so obviousочевидный.

129

480600

4110

но в 2007 году это было далеко не так.

08:16

We were fairlyдовольно aloneв одиночестве on this journeyпоездка
for quiteдовольно a while.

130

484710

3878

Долгое время у нас совсем
не было единомышленников.

08:20

Some very friendlyдружелюбный colleaguesколлеги advisedрекомендуется me
to do something more usefulполезным for my tenureвладение,

131

488588

5003

Некоторые дружелюбные коллеги советовали
мне заняться более полезным делом,

08:25

and we were constantlyпостоянно strugglingборющийся
for researchисследование fundingфинансирование.

132

493591

4342

и нам никогда не хватало денег
на исследования.

08:29

Onceоднажды, I even jokedпошутил to my graduateвыпускник studentsстуденты

133

497933

2485

Однажды я даже пошутила
со своими студентами,

08:32

that I would just reopenвозобновлять
my dryсухой cleaner'sочистители shopмагазин to fundфонд ImageNetImageNet.

134

500418

4063

что я снова открою свою химчистку,
чтобы профинансировать ImageNet.

08:36

After all, that's how I fundedфундированный
my collegeколледж yearsлет.

135

504481

4761

В конце концов, именно с её помощью
я оплатила обучение в университете.

08:41

So we carriedосуществляется on.

136

509242

1856

И мы продолжили работать.

08:43

In 2009, the ImageNetImageNet projectпроект deliveredдоставлен

137

511098

3715

В 2009 году проект ImageNet собрал

08:46

a databaseбаза данных of 15 millionмиллиона imagesизображений

138

514813

4042

базу из 15 миллионов изображений,

08:50

acrossчерез 22,000 classesклассы
of objectsобъекты and things

139

518855

4805

22 тысяч классов объектов и предметов,

08:55

organizedорганизованная by everydayкаждый день Englishанглийский wordsслова.

140

523660

3320

упорядоченных при помощи повседневных
английских слов.

08:58

In bothи то и другое quantityколичество and qualityкачественный,

141

526980

2926

Как количественно, так и качественно

09:01

this was an unprecedentedбеспрецедентный scaleмасштаб.

142

529906

2972

это был беспрецедентный по размеру проект.

09:04

As an exampleпример, in the caseдело of catsкоты,

143

532878

3461

Например, в случае с котами

09:08

we have more than 62,000 catsкоты

144

536339

2809

в базе содержится более 62 000 котов

09:11

of all kindsвиды of looksвыглядит and posesпозы

145

539148

4110

разных пород, в разных позах,

09:15

and acrossчерез all speciesвид
of domesticвнутренний and wildдикий catsкоты.

146

543258

5223

всех видов, как домашних, так и диких.

09:20

We were thrilledвзволнованный
to have put togetherвместе ImageNetImageNet,

147

548481

3344

Мы были на седьмом небе от счастья,
когда база ImageNet была готова.

09:23

and we wanted the wholeвсе researchисследование worldМир
to benefitвыгода from it,

148

551825

3738

Мы хотели, чтобы она принесла пользу
всему научному сообществу.

09:27

so in the TEDТЕД fashionмода,
we openedоткрытый up the entireвсе dataданные setзадавать

149

555563

4041

И мы, как и TED, открыли бесплатный
неограниченный доступ к базе данных

09:31

to the worldwideМировой
researchисследование communityсообщество for freeсвободно.

150

559604

3592

для всего мирового научного сообщества.

09:36

(ApplauseАплодисменты)

151

564636

4000

(Аплодисменты)

09:41

Now that we have the dataданные
to nourishудобрять our computerкомпьютер brainголовной мозг,

152

569416

4538

Сейчас, когда у нас есть база данных,
чтобы питать наш компьютерный мозг,

09:45

we're readyготов to come back
to the algorithmsалгоритмы themselvesсамих себя.

153

573954

3737

мы готовы вернуться к алгоритмам.

09:49

As it turnedоказалось out, the wealthбогатство
of informationИнформация providedпредоставлена by ImageNetImageNet

154

577691

5178

Как оказалось, база данных,
предоставленная ImageNet,

09:54

was a perfectидеально matchсовпадение to a particularконкретный classкласс
of machineмашина learningобучение algorithmsалгоритмы

155

582869

4806

точно подходила для определённого класса
алгоритмов обучения машин,

09:59

calledназывается convolutionalсверточного neuralнервный networkсеть,

156

587675

2415

который называется
свёрточная нейронная сеть,

10:02

pioneeredвпервые by KunihikoКунихико FukushimaФукусима,
GeoffGeoff HintonХинтон, and YannYann LeCunLeCun

157

590090

5248

начало которому положили
Кунихико Фукушима, Джефф Хинтон

10:07

back in the 1970s and '80s.

158

595338

3645

и Ян ЛеКун ещё в 1970-е и 80-е годы.

10:10

Just like the brainголовной мозг consistsсостоит
of billionsмиллиарды of highlyвысоко connectedсвязанный neuronsнейроны,

159

598983

5619

Так же как и в мозге, состоящем
из миллиардов взаимосвязанных нейронов,

10:16

a basicосновной operatingоперационная unitЕд. изм in a neuralнервный networkсеть

160

604602

3854

простейшей операционной единицей
нейронной сети

10:20

is a neuron-likeнейроноподобной nodeузел.

161

608456

2415

является нейроподобный узел.

10:22

It takes inputвход from other nodesузлы

162

610871

2554

Он принимает входные данные
от одних узлов

10:25

and sendsпосылает outputвывод to othersдругие.

163

613425

2718

и отправляет выходные данные другим.

10:28

Moreoverболее того, these hundredsсотни of thousandsтысячи
or even millionsмиллионы of nodesузлы

164

616143

4713

Более того, сотни тысяч
или даже миллионы таких узлов

10:32

are organizedорганизованная in hierarchicalиерархическая layersслои,

165

620856

3227

упорядочены по иерархическим уровням,

10:36

alsoтакже similarаналогичный to the brainголовной мозг.

166

624083

2554

также по аналогии с человеческим мозгом.

10:38

In a typicalтипичный neuralнервный networkсеть we use
to trainпоезд our objectобъект recognitionпризнание modelмодель,

167

626637

4783

В обычной нейронной сети,
которую мы используем для обучения

10:43

it has 24 millionмиллиона nodesузлы,

168

631420

3181

нашей модели распознавания,
содержится 24 миллиона узлов,

10:46

140 millionмиллиона parametersпараметры,

169

634601

3297

140 миллионов параметров

10:49

and 15 billionмиллиард connectionsсвязи.

170

637898

2763

и 15 миллиардов связей.

10:52

That's an enormousогромный modelмодель.

171

640661

2415

Эта модель огромна.

10:55

PoweredРаботает by the massiveмассивный dataданные from ImageNetImageNet

172

643076

3901

Функционирующая
на основе базы ImageNet

10:58

and the modernсовременное CPUsпроцессоры and GPUsГрафические процессоры
to trainпоезд suchтакие a humongousHumongous modelмодель,

173

646977

5433

при помощи современных микропроцессоров
для обучения этой огромной модели,

11:04

the convolutionalсверточного neuralнервный networkсеть

174

652410

2369

свёрточная нейронная сеть

11:06

blossomedрасцвела in a way that no one expectedожидаемый.

175

654779

3436

превзошла все ожидания.

11:10

It becameстал the winningвыигрыш architectureархитектура

176

658215

2508

Она позволила создать
эффективную систему

11:12

to generateгенерировать excitingзахватывающе newновый resultsРезультаты
in objectобъект recognitionпризнание.

177

660723

5340

для получения новых многообещающих
результатов в распознавании объектов.

11:18

This is a computerкомпьютер tellingговоря us

178

666063

2810

Вот компьютер, который говорит нам,

11:20

this pictureкартина containsсодержит a catКот

179

668873

2300

что на картинке есть кот

11:23

and where the catКот is.

180

671173

1903

и где этот кот находится.

11:25

Of courseкурс there are more things than catsкоты,

181

673076

2112

Конечно, на картинках не только коты.

11:27

so here'sвот a computerкомпьютер algorithmалгоритм tellingговоря us

182

675188

2438

Вот компьютер, который сообщает нам,

11:29

the pictureкартина containsсодержит
a boyмальчик and a teddyТедди bearмедведь;

183

677626

3274

что на фото мальчик и плюшевый мишка,

11:32

a dogсобака, a personчеловек, and a smallмаленький kiteвоздушный змей
in the backgroundзадний план;

184

680900

4366

собака, человек, и маленький
воздушный змей на заднем фоне.

11:37

or a pictureкартина of very busyзанятый things

185

685266

3135

Или фотография с большим
количеством объектов:

11:40

like a man, a skateboardскейтборд,
railingsдуги, a lampostlampost, and so on.

186

688401

4644

мужчина, скейтборд,
перила, фонарь и т.д.

11:45

SometimesИногда, when the computerкомпьютер
is not so confidentуверенная в себе about what it seesвидит,

187

693045

5293

Когда компьютер не уверен в том,
что он видит,

11:51

we have taughtучил it to be smartумная enoughдостаточно

188

699498

2276

он обучен действовать по-умному

11:53

to give us a safeбезопасно answerответ
insteadвместо of committingсовершение too much,

189

701774

3878

и давать нам наиболее безопасный
ответ, без неоправданных рисков,

11:57

just like we would do,

190

705652

2811

что именно и сделал бы человек.

12:00

but other timesраз our computerкомпьютер algorithmалгоритм
is remarkableзамечательный at tellingговоря us

191

708463

4666

Но бывает и так, что наш алгоритм
совершенно безошибочно сообщает нам,

12:05

what exactlyв точку the objectsобъекты are,

192

713129

2253

какие объекты он видит.

12:07

like the make, modelмодель, yearгод of the carsлегковые автомобили.

193

715382

3436

Например, марку, модель
и год выпуска автомобиля.

12:10

We appliedприкладная this algorithmалгоритм to millionsмиллионы
of GoogleGoogle Streetулица ViewПосмотреть imagesизображений

194

718818

5386

Мы применили этот алгоритм к миллионам
фотографий на Google Street View

12:16

acrossчерез hundredsсотни of Americanамериканский citiesгорода,

195

724204

3135

из сотен американских городов

12:19

and we have learnedнаучился something
really interestingинтересно:

196

727339

2926

и получили очень интересные результаты.

12:22

first, it confirmedподтвердил our commonобщий wisdomмудрость

197

730265

3320

Во-первых, они подтвердили известный факт,

12:25

that carавтомобиль pricesЦены correlateсоотносить very well

198

733585

3290

что стоимость автомобиля зависит

12:28

with householdдомашнее хозяйство incomesдоходов.

199

736875

2345

от дохода семьи.

12:31

But surprisinglyкак ни странно, carавтомобиль pricesЦены
alsoтакже correlateсоотносить well

200

739220

4527

Но, к удивлению,
цены на автомобили также зависят

12:35

with crimeпреступление ratesставки in citiesгорода,

201

743747

2300

от уровня преступности в городах

12:39

or votingголосование patternsузоры by zipзастежка-молния codesкоды.

202

747007

3963

или даже модели голосования
в разных штатах.

12:44

So wait a minuteминут. Is that it?

203

752060

2206

Минутку. Это свершилось?

12:46

Has the computerкомпьютер alreadyуже matchedсоответствие
or even surpassedпревзойден humanчеловек capabilitiesвозможности?

204

754266

5153

Компьютеры догнали или даже превзошли
человеческие возможности?

12:51

Not so fastбыстро.

205

759419

2138

Не тут-то было.

12:53

So farдалеко, we have just taughtучил
the computerкомпьютер to see objectsобъекты.

206

761557

4923

Пока мы научили компьютеры
только видеть объекты.

12:58

This is like a smallмаленький childребенок
learningобучение to utterвыговорить a fewмало nounsсуществительные.

207

766480

4644

Это сродни тому, как маленький ребёнок
учится произносить несколько слов.

13:03

It's an incredibleнеимоверный accomplishmentдостижение,

208

771124

2670

Это невероятное достижение,

13:05

but it's only the first stepшаг.

209

773794

2460

но это всего лишь первый шаг.

13:08

SoonСкоро, anotherдругой developmentalразвивающий
milestoneвеха will be hitудар,

210

776254

3762

Вскоре будет пройден
новый этап развития,

13:12

and childrenдети beginначать
to communicateобщаться in sentencesпредложения.

211

780016

3461

и ребёнок сможет составлять
из слов предложения.

13:15

So insteadвместо of sayingпоговорка
this is a catКот in the pictureкартина,

212

783477

4224

И вместо того чтобы сказать,
что на картинке кошка,

13:19

you alreadyуже heardуслышанным the little girlдевушка
tellingговоря us this is a catКот lyingлежащий on a bedпостель.

213

787701

5202

маленькая девочка скажет,
что кошка лежит на кровати.

13:24

So to teachучат a computerкомпьютер
to see a pictureкартина and generateгенерировать sentencesпредложения,

214

792903

5595

Для того чтобы научить компьютер видеть
картинку и составлять предложения,

13:30

the marriageБрак, создание семьи betweenмежду bigбольшой dataданные
and machineмашина learningобучение algorithmалгоритм

215

798498

3948

связь между большой базой данных
и алгоритмом обучения машин

13:34

has to take anotherдругой stepшаг.

216

802446

2275

должна выйти на новый уровень.

13:36

Now, the computerкомпьютер has to learnучить
from bothи то и другое picturesкартинки

217

804721

4156

Теперь компьютер должен учиться
не только по фотографиям,

13:40

as well as naturalнатуральный languageязык sentencesпредложения

218

808877

2856

но и на основе предложений
естественного языка,

13:43

generatedгенерироваться by humansлюди.

219

811733

3322

составляемых человеком.

13:47

Just like the brainголовной мозг integratesинтегрирует
visionвидение and languageязык,

220

815055

3853

Отталкиваясь от факта,
что мозг объединяет зрение и язык,

13:50

we developedразвитая a modelмодель
that connectsподключает partsчасти of visualвизуальный things

221

818908

5201

мы разработали модель,
соединяющую части визуальной картины,

13:56

like visualвизуальный snippetsобрывки

222

824109

1904

как маленькие фрагменты,

13:58

with wordsслова and phrasesфразы in sentencesпредложения.

223

826013

4203

со словами и фразами в предложениях.

14:02

About four4 monthsмесяцы agoтому назад,

224

830216

2763

Около четырёх месяцев назад

14:04

we finallyв конце концов tiedсвязанный all this togetherвместе

225

832979

2647

мы привели всё это
к общему знаменателю

14:07

and producedпроизведенный one of the first
computerкомпьютер visionвидение modelsмодели

226

835626

3784

и создали одну из первых моделей
компьютерного зрения,

14:11

that is capableспособный of generatingпорождающий
a human-likeчеловек, как sentenceпредложение

227

839410

3994

способную, подобно человеку,
создавать предложения

14:15

when it seesвидит a pictureкартина for the first time.

228

843404

3506

после просмотра фотографии в первый раз.

14:18

Now, I'm readyготов to showпоказать you
what the computerкомпьютер saysговорит

229

846910

4644

Сейчас я покажу вам,
что говорит компьютер,

14:23

when it seesвидит the pictureкартина

230

851554

1975

когда видит фотографию,

14:25

that the little girlдевушка saw
at the beginningначало of this talk.

231

853529

3830

которую описывала девочка
в начале этого доклада.

14:31

(Videoвидео) Computerкомпьютер: A man is standingпостоянный
nextследующий to an elephantслон.

232

859519

3344

(Видео) Компьютер:
Рядом со слоном стоит мужчина.

14:36

A largeбольшой airplaneсамолет sittingсидящий on topВверх
of an airportаэропорт runwayВПП.

233

864393

3634

Большой самолёт находится
на взлётно-посадочной полосе аэропорта.

14:41

FFLFFL: Of courseкурс, we're still workingза работой hardжесткий
to improveулучшать our algorithmsалгоритмы,

234

869057

4212

ФФЛ: Конечно, мы продолжаем усердно
работать над улучшением нашего алгоритма,

14:45

and it still has a lot to learnучить.

235

873269

2596

и ему предстоит ещё многому научиться.

14:47

(ApplauseАплодисменты)

236

875865

2291

(Аплодисменты)

14:51

And the computerкомпьютер still makesмарки mistakesошибки.

237

879556

3321

Компьютер всё ещё допускает ошибки.

14:54

(Videoвидео) Computerкомпьютер: A catКот lyingлежащий
on a bedпостель in a blanketодеяло.

238

882877

3391

(Видео) Компьютер:
Кот лежит на кровати в одеяле.

14:58

FFLFFL: So of courseкурс, when it seesвидит
too manyмногие catsкоты,

239

886268

2553

ФФЛ: Конечно, когда он видит
слишком много котов,

15:00

it thinksдумает everything
mightмог бы look like a catКот.

240

888821

2926

он считает, что всё остальное
тоже выглядит как кот.

15:05

(Videoвидео) Computerкомпьютер: A youngмолодой boyмальчик
is holdingдержа a baseballбейсбол batлетучая мышь.

241

893317

2864

(Видео) Компьютер:
Мальчик держит бейсбольную биту.

15:08

(LaughterСмех)

242

896181

1765

(Смех)

15:09

FFLFFL: Or, if it hasn'tне имеет seenвидели a toothbrushзубная щетка,
it confusesпутает it with a baseballбейсбол batлетучая мышь.

243

897946

4583

ФФЛ: Если он не видел зубной щётки,
он принимает её за бейсбольную биту.

15:15

(Videoвидео) Computerкомпьютер: A man ridingверховая езда a horseлошадь
down a streetулица nextследующий to a buildingздание.

244

903309

3434

(Видео) Компьютер: Мужчина едет верхом
по улице рядом со зданием.

15:18

(LaughterСмех)

245

906743

2023

(Смех)

15:20

FFLFFL: We haven'tне taughtучил ArtИзобразительное искусство 101
to the computersкомпьютеры.

246

908766

3552

ФФЛ: Мы не обучили компьютер
основам искусства.

15:25

(Videoвидео) Computerкомпьютер: A zebraзебра standingпостоянный
in a fieldполе of grassтрава.

247

913768

2884

(Видео) Компьютер:
Зебра стоит на поле с травой.

15:28

FFLFFL: And it hasn'tне имеет learnedнаучился to appreciateценить
the stunningоглушающий beautyкрасота of natureприрода

248

916652

3367

ФФЛ: Он также ещё не может оценить
красоту природы так,

15:32

like you and I do.

249

920019

2438

как это можем мы с вами.

15:34

So it has been a long journeyпоездка.

250

922457

2832

Это длительный процесс.

15:37

To get from ageвозраст zeroнуль to threeтри was hardжесткий.

251

925289

4226

Дорасти до трёх лет было трудно.

15:41

The realреальный challengeвызов is to go
from threeтри to 13 and farдалеко beyondза.

252

929515

5596

Ещё сложнее — от трёх
до тринадцати и так далее.

15:47

Let me remindнапоминать you with this pictureкартина
of the boyмальчик and the cakeкекс again.

253

935111

4365

Позвольте вам снова показать фотографию
мальчика с тортом.

15:51

So farдалеко, we have taughtучил
the computerкомпьютер to see objectsобъекты

254

939476

4064

Компьютер уже умеет видеть предметы

15:55

or even tell us a simpleпросто storyистория
when seeingвидя a pictureкартина.

255

943540

4458

и даже вкратце рассказывать историю о том,
что изображено на фотографии.

15:59

(Videoвидео) Computerкомпьютер: A personчеловек sittingсидящий
at a tableТаблица with a cakeкекс.

256

947998

3576

(Видео) Компьютер:
Человек сидит за столом с тортом.

16:03

FFLFFL: But there's so much more
to this pictureкартина

257

951574

2630

ФФЛ: На этой фотографии
изображено гораздо больше,

16:06

than just a personчеловек and a cakeкекс.

258

954204

2270

чем просто человек и торт.

16:08

What the computerкомпьютер doesn't see
is that this is a specialособый Italianитальянский cakeкекс

259

956474

4467

Компьютер не видит, что это особый
итальянский торт,

16:12

that's only servedслужил duringв течение EasterПасха time.

260

960941

3217

который пекут только во время Пасхи.

16:16

The boyмальчик is wearingносить his favoriteлюбимый t-shirtФутболка

261

964158

3205

На мальчике надета
его любимая футболка,

16:19

givenданный to him as a giftподарок by his fatherотец
after a tripпоездка to SydneyСидней,

262

967363

3970

которую ему подарил отец
после поездки в Сидней.

16:23

and you and I can all tell how happyсчастливый he is

263

971333

3808

И невооружённым глазом видно,
как счастлив мальчик

16:27

and what's exactlyв точку on his mindразум
at that momentмомент.

264

975141

3203

и о чём именно он думает в этот момент.

16:31

This is my sonсын LeoЛео.

265

979214

3125

Это мой сын Лео.

16:34

On my questпоиск for visualвизуальный intelligenceинтеллект,

266

982339

2624

В моих поисках визуального интеллекта

16:36

I think of LeoЛео constantlyпостоянно

267

984963

2391

я постоянно думаю о Лео

16:39

and the futureбудущее worldМир he will liveжить in.

268

987354

2903

и о том мире, в котором он будет жить.

16:42

When machinesмашины can see,

269

990257

2021

Когда машины будут способны видеть,

16:44

doctorsврачи and nursesмедсестры will have
extraдополнительный pairsпары of tirelessнеутомимый eyesглаза

270

992278

4712

доктора и медсёстры обзаведутся
дополнительной парой неустающих глаз

16:48

to help them to diagnoseдиагностики
and take careзабота of patientsпациентов.

271

996990

4092

для диагностики заболеваний
и ухода за пациентами.

16:53

CarsЛегковые автомобили will runбег smarterумнее
and saferбезопаснее on the roadДорога.

272

1001082

4383

Машины на дорогах станут
умнее и безопаснее.

16:57

RobotsРоботы, not just humansлюди,

273

1005465

2694

Не только люди, но и роботы

17:00

will help us to braveХрабрый the disasterкатастрофа zonesзон
to saveспасти the trappedловушке and woundedраненый.

274

1008159

4849

смогут оказывать помощь в зонах бедствий
и спасать людей из-под завалов.

17:05

We will discoverобнаружить newновый speciesвид,
better materialsматериалы,

275

1013798

3796

С помощью машин мы откроем
новые виды животных и растений,

17:09

and exploreисследовать unseenневидимый frontiersграницы
with the help of the machinesмашины.

276

1017594

4509

усовершенствуем материалы
и расширим границы своей деятельности.

17:15

Little by little, we're givingдающий sightвзгляд
to the machinesмашины.

277

1023113

4167

Постепенно машины обретут зрение.

17:19

First, we teachучат them to see.

278

1027280

2798

Сначала мы научим их видеть.

17:22

Then, they help us to see better.

279

1030078

2763

Затем они помогут видеть лучше нам самим.

17:24

For the first time, humanчеловек eyesглаза
won'tне будет be the only onesте,

280

1032841

4165

Впервые человек будет
осваивать и осознавать мир

17:29

ponderingразмышляют and exploringисследование our worldМир.

281

1037006

2934

посредством не только своих,
но и компьютерных глаз.

17:31

We will not only use the machinesмашины
for theirих intelligenceинтеллект,

282

1039940

3460

Мы будем не только использовать машины
благодаря их интеллекту,

17:35

we will alsoтакже collaborateсотрудничать with them
in waysпути that we cannotне могу even imagineпредставить.

283

1043400

6179

но и работать совместно с ними так,
как никто и не мог вообразить.

17:41

This is my questпоиск:

284

1049579

2161

Это моя задача:

17:43

to give computersкомпьютеры visualвизуальный intelligenceинтеллект

285

1051740

2712

дать машинам визуальный интеллект

17:46

and to createСоздайте a better futureбудущее
for LeoЛео and for the worldМир.

286

1054452

5131

и создать лучшее будущее
для Лео и всего мира.

17:51

Thank you.

287

1059583

1811

Спасибо.

17:53

(ApplauseАплодисменты)

288

1061394

3785

(Аплодисменты)

Translated by Olga Babeeva
Reviewed by Katya Roberts

ABOUT THE SPEAKER

Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers.

More profile about the speaker
Fei-Fei Li | Speaker | TED.com

THE ORIGINAL VIDEO ON TED.COM

Фей-Фей Ли: Как мы учим компьютеры понимать изображения | TED Talk | TED.com