ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com
TED2015

Fei-Fei Li: How we're teaching computers to understand pictures

Fei-Fei Li: Comment apprendre aux ordinateurs à comprendre des images

Filmed:
2,702,344 views

Quand un tout jeune enfant regarde une photo, il peut identifier des éléments simples : un chat, un livre, une chaise. Aujourd'hui, les ordinateurs sont assez intelligents pour faire la même chose. Et après ? Dans cette passionnante conférence, la spécialiste en vision par ordinateur Fei-Fei Li décrit où nous en sommes : la base de données de 15 millions de photos mise en place par son équipe pour « enseigner » à un ordinateur à comprendre des photos, et un aperçu de ce qui reste encore à faire.
- Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio

Double-click the English transcript below to play the video.

00:14
Let me showmontrer you something.
0
2366
3738
Je vais vous montrer quelque chose.
00:18
(VideoVidéo) GirlJeune fille: Okay, that's a catchat
sittingséance in a bedlit.
1
6104
4156
(Enfant) C'est un chat assis sur un lit.
00:22
The boygarçon is pettingcaresser the elephantl'éléphant.
2
10260
4040
Le garçon caresse l'éléphant.
00:26
Those are people
that are going on an airplaneavion.
3
14300
4354
Des gens montent dans un avion.
00:30
That's a biggros airplaneavion.
4
18654
2810
C'est un gros avion.
00:33
Fei-FeiFei-Fei LiLi: This is
a three-year-oldtrois ans childenfant
5
21464
2206
(Fei-Fei Li) C'est une enfant de 3 ans
00:35
describingdécrivant what she seesvoit
in a seriesséries of photosPhotos.
6
23670
3679
qui décrit ce qu'elle voit sur des photos.
00:39
She mightpourrait still have a lot
to learnapprendre about this worldmonde,
7
27349
2845
Elle a peut-être encore
beaucoup à apprendre,
00:42
but she's alreadydéjà an expertexpert
at one very importantimportant tasktâche:
8
30194
4549
mais elle est déjà experte
dans un domaine très important :
00:46
to make sensesens of what she seesvoit.
9
34743
2846
comprendre ce qu'elle voit.
00:50
Our societysociété is more
technologicallysur le plan technologique advancedAvancée than ever.
10
38229
4226
Notre société est technologiquement
plus avancée que jamais.
00:54
We sendenvoyer people to the moonlune,
we make phonesTéléphones that talk to us
11
42455
3629
On envoie des gens sur la Lune,
on fait des téléphones qui nous parlent,
00:58
or customizePersonnaliser radioradio stationsstations
that can playjouer only musicla musique we like.
12
46084
4946
on a des stations de radio
qui ne passent que ce qu'on aime.
01:03
YetEncore, our mostles plus advancedAvancée
machinesmachines and computersdes ordinateurs
13
51030
4055
Pourtant, les machines et les ordinateurs
les plus avancés
01:07
still strugglelutte at this tasktâche.
14
55085
2903
ont toujours du mal à faire ça.
01:09
So I'm here todayaujourd'hui
to give you a progressle progrès reportrapport
15
57988
3459
Alors aujourd'hui je vais vous expliquer
où nous en sommes,
01:13
on the latestdernier advancesavances
in our researchrecherche in computerordinateur visionvision,
16
61447
4047
nos dernières recherches
sur la vision par ordinateur,
01:17
one of the mostles plus frontierFrontier
and potentiallypotentiellement revolutionaryrévolutionnaire
17
65494
4161
l'une des technologies les plus novatrices
et potentiellement révolutionnaires
01:21
technologiesles technologies in computerordinateur sciencescience.
18
69655
3206
en informatique.
01:24
Yes, we have prototypedun prototype carsdes voitures
that can driveconduire by themselvesse,
19
72861
4551
Oui, nous avons des prototypes de voitures
qui conduisent toutes seules,
01:29
but withoutsans pour autant smartintelligent visionvision,
they cannotne peux pas really tell the differencedifférence
20
77412
3853
mais sans la vision intelligente,
elles ne font pas la différence
01:33
betweenentre a crumpledfroissé paperpapier bagsac
on the roadroute, whichlequel can be runcourir over,
21
81265
3970
entre un sac de papier roulé en boule,
que l'on peut écraser,
01:37
and a rockRoche that sizeTaille,
whichlequel should be avoidedévité.
22
85235
3340
et une pierre qu'il faut éviter.
01:41
We have madefabriqué fabulousfabuleux megapixelmegapixel camerasappareils photo,
23
89415
3390
Nous fabriquons des appareils photo
à mégapixels incroyables,
01:44
but we have not deliveredlivré
sightvue to the blindaveugle.
24
92805
3135
mais nous n'avons pas donné
la vue aux aveugles.
01:48
DronesDrones can flymouche over massivemassif landterre,
25
96420
3305
Les drones peuvent parcourir
de grandes distances
01:51
but don't have enoughassez visionvision technologyLa technologie
26
99725
2134
mais la technologie
n'est pas assez avancée
01:53
to help us to trackPiste
the changeschangements of the rainforestsforêts tropicales.
27
101859
3461
pour suivre l'évolution
des forêts tropicales.
01:57
SecuritySécurité camerasappareils photo are everywherepartout,
28
105320
2950
Il y a des caméras de sécurité partout,
02:00
but they do not alertalerte us when a childenfant
is drowningla noyade in a swimmingla natation poolpiscine.
29
108270
5067
mais elles ne savent pas nous alerter
quand un enfant se noie dans une piscine.
02:06
PhotosPhotos and videosvidéos are becomingdevenir
an integralIntegral partpartie of globalglobal life.
30
114167
5595
La photo et la vidéo
font partie de notre vie.
02:11
They're beingétant generatedgénéré at a pacerythme
that's farloin beyondau-delà what any humanHumain,
31
119762
4087
Elles sont générées tellement vite
qu'aucun humain
02:15
or teamséquipes of humanshumains, could hopeespérer to viewvue,
32
123849
2783
ou groupe d'humains ne peut tout voir,
02:18
and you and I are contributingcontribuant
to that at this TEDTED.
33
126632
3921
Vous et moi, nous y contribuons,
avec cette conférence TED.
02:22
YetEncore our mostles plus advancedAvancée softwareLogiciel
is still strugglingluttant at understandingcompréhension
34
130553
5232
Pourtant nos programmes les plus avancés
ont du mal à comprendre
02:27
and managinggestion this enormousénorme contentcontenu.
35
135785
3876
et à gérer cet énorme contenu.
02:31
So in other wordsmots,
collectivelycollectivement as a societysociété,
36
139661
5272
En d'autres termes, nous, la société,
02:36
we're very much blindaveugle,
37
144933
1746
sommes vraiment aveugles,
02:38
because our smartestle plus intelligent
machinesmachines are still blindaveugle.
38
146679
3387
parce que nos plus intelligentes
machines sont encore aveugles.
02:43
"Why is this so harddifficile?" you maymai askdemander.
39
151526
2926
« Pourquoi est-ce si difficile ? »,
pourriez-vous demander.
02:46
CamerasAppareils photo can take picturesdes photos like this one
40
154452
2693
Un appareil peut prendre une photo
comme celle-ci,
02:49
by convertingconvertir lightslumières into
a two-dimensionalbidimensionnel arraytableau of numbersNombres
41
157145
3994
il convertit la lumière
en tableaux bidimensionnels
02:53
knownconnu as pixelspixels,
42
161139
1650
que l'on nomme pixels,
02:54
but these are just lifelesssans vie numbersNombres.
43
162789
2251
mais ce ne sont que des nombres sans vie.
02:57
They do not carryporter meaningsens in themselvesse.
44
165040
3111
Par eux-mêmes, ils ne signifient rien.
03:00
Just like to hearentendre is not
the sameMême as to listen,
45
168151
4343
Tout comme entendre
n'est pas la même chose qu'écouter,
03:04
to take picturesdes photos is not
the sameMême as to see,
46
172494
4040
prendre une photo,
ce n'est pas comme voir,
03:08
and by seeingvoyant,
we really mean understandingcompréhension.
47
176534
3829
et par « voir », entendez « comprendre ».
03:13
In factfait, it tooka pris MotherMère NatureNature
540 millionmillion yearsannées of harddifficile work
48
181293
6177
En fait, Mère Nature a travaillé dur
540 millions d'années
03:19
to do this tasktâche,
49
187470
1973
pour accomplir cette tâche,
03:21
and much of that efforteffort
50
189443
1881
et le plus gros de cet effort a été
03:23
wentest allé into developingdéveloppement the visualvisuel
processingEn traitement apparatusappareil of our brainscerveaux,
51
191324
5271
le développement de l'appareil
qui produit la vision dans notre cerveau,
03:28
not the eyesles yeux themselvesse.
52
196595
2647
pas les yeux.
03:31
So visionvision beginscommence with the eyesles yeux,
53
199242
2747
La vision commence avec les yeux,
03:33
but it trulyvraiment takes placeendroit in the braincerveau.
54
201989
3518
mais tout se passe en fait dans le cerveau.
03:38
So for 15 yearsannées now, startingdépart
from my PhPH.D. at CaltechCaltech
55
206287
5060
Depuis maintenant 15 ans, d'abord en thèse à Caltech
03:43
and then leadingde premier plan Stanford'sDe Stanford VisionVision LabLab,
56
211347
2926
puis à la tête du Vision Lab à Stanford,
03:46
I've been workingtravail with my mentorsmentors,
collaboratorscollaborateurs and studentsélèves
57
214273
4396
je travaille avec mes mentors,
collaborateurs et étudiants
03:50
to teachapprendre computersdes ordinateurs to see.
58
218669
2889
pour apprendre la vision aux ordinateurs.
03:54
Our researchrecherche fieldchamp is calledappelé
computerordinateur visionvision and machinemachine learningapprentissage.
59
222658
3294
Il s'agit de vision par ordinateur et
d'apprentissage machine.
03:57
It's partpartie of the generalgénéral fieldchamp
of artificialartificiel intelligenceintelligence.
60
225952
3878
C'est un pan de la recherche sur
l'intelligence artificielle.
04:03
So ultimatelyen fin de compte, we want to teachapprendre
the machinesmachines to see just like we do:
61
231000
5493
Le but est d'enseigner aux machines
à voir comme nous :
04:08
namingNaming objectsobjets, identifyingidentifier les people,
inferringla déduction 3D geometrygéométrie of things,
62
236493
5387
nommer des objets, identifier des gens,
déduire des formes géométriques 3D,
04:13
understandingcompréhension relationsrapports, emotionsémotions,
actionsactes and intentionsintentions.
63
241880
5688
comprendre les relations, les émotions,
les actions et les intentions.
04:19
You and I weavetisser togetherensemble entiretout storieshistoires
of people, placesdes endroits and things
64
247568
6153
Nous tissons constamment des histoires
de gens, d'endroits, de choses
04:25
the momentmoment we layallonger our gazeregard on them.
65
253721
2164
dès que nous posons les yeux dessus.
04:28
The first stepétape towardsvers this goalobjectif
is to teachapprendre a computerordinateur to see objectsobjets,
66
256955
5583
Le premier pas est d'apprendre
à l'ordinateur à voir des objets,
04:34
the buildingbâtiment blockbloc of the visualvisuel worldmonde.
67
262538
3368
c'est l'élément de base du monde visuel.
04:37
In its simplestle plus simple termstermes,
imagineimaginer this teachingenseignement processprocessus
68
265906
4434
Pour parler simplement, imaginez
que ce processus d'apprentissage
04:42
as showingmontrer the computersdes ordinateurs
some trainingentraînement imagesimages
69
270340
2995
consiste à montrer à l'ordinateur
04:45
of a particularparticulier objectobjet, let's say catschats,
70
273335
3321
des images d'un certain objet,
par exemple des chats,
04:48
and designingconception a modelmaquette that learnsapprend
from these trainingentraînement imagesimages.
71
276656
4737
puis concevoir un modèle
qui puisse apprendre avec ces images.
04:53
How harddifficile can this be?
72
281393
2044
Ça ne doit pas être bien difficile !
04:55
After all, a catchat is just
a collectioncollection of shapesformes and colorscouleurs,
73
283437
4052
Après tout, un chat est un ensemble
de formes et de couleurs.
04:59
and this is what we did
in the earlyde bonne heure daysjournées of objectobjet modelingla modélisation.
74
287489
4086
Au début de la modélisation objet,
c'est ce que nous avons fait.
05:03
We'dNous le ferions tell the computerordinateur algorithmalgorithme de
in a mathematicalmathématique languagela langue
75
291575
3622
On rentrait un algorithme
en langage mathématique
05:07
that a catchat has a roundrond facevisage,
a chubbyjoufflu bodycorps,
76
295197
3343
pour dire que le chat a un visage rond,
un corps un peu dodu,
05:10
two pointypointu earsoreilles, and a long tailqueue,
77
298540
2299
deux oreilles pointues et une longue queue
05:12
and that lookedregardé all fine.
78
300839
1410
et tout allait bien.
05:14
But what about this catchat?
79
302859
2113
Mais que fait-on pour celui-ci ?
05:16
(LaughterRires)
80
304972
1091
(Rires)
05:18
It's all curledchicorées up.
81
306063
1626
Il est tout retourné.
05:19
Now you have to addajouter anotherun autre shapeforme
and viewpointpoint de vue to the objectobjet modelmaquette.
82
307689
4719
Alors il faut ajouter d'autres formes
et points de vue au modèle objet.
05:24
But what if catschats are hiddencaché?
83
312408
1715
Et si le chat est caché ?
05:27
What about these sillyidiot catschats?
84
315143
2219
Et ces drôles de chats-là ?
05:31
Now you get my pointpoint.
85
319112
2417
Vous voyez ce que je veux dire.
05:33
Even something as simplesimple
as a householdMénage petanimal de compagnie
86
321529
3367
Quelque chose d'aussi simple
qu'un animal domestique
05:36
can presentprésent an infiniteinfini numbernombre
of variationsvariations to the objectobjet modelmaquette,
87
324896
4504
présente une infinité de variations
du modèle objet.
05:41
and that's just one objectobjet.
88
329400
2233
Et ça n'est qu'un seul objet.
05:44
So about eighthuit yearsannées agodepuis,
89
332573
2492
Il y a environ 8 ans,
05:47
a very simplesimple and profoundprofond observationobservation
changedmodifié my thinkingen pensant.
90
335065
5030
une réflexion toute simple mais profonde
a changé ma manière de penser.
05:53
No one tellsraconte a childenfant how to see,
91
341425
2685
Personne ne dit à un enfant comment voir,
05:56
especiallynotamment in the earlyde bonne heure yearsannées.
92
344110
2261
surtout dans les premières années.
05:58
They learnapprendre this throughpar
real-worldmonde réel experiencesexpériences and examplesexemples.
93
346371
5000
Il apprend par l'expérience,
par des exemples quotidiens.
06:03
If you considerconsidérer a child'sde l’enfant eyesles yeux
94
351371
2740
Pensez aux yeux d'un enfant
06:06
as a pairpaire of biologicalbiologique camerasappareils photo,
95
354111
2554
comme à deux appareils photo biologiques
06:08
they take one picturephoto
about everychaque 200 millisecondsmillisecondes,
96
356665
4180
qui prennent une photo
chaque 200 millisecondes,
06:12
the averagemoyenne time an eyeœil movementmouvement is madefabriqué.
97
360845
3134
la durée moyenne du mouvement de l’œil.
06:15
So by ageâge threeTrois, a childenfant would have seenvu
hundredsdes centaines of millionsdes millions of picturesdes photos
98
363979
5550
A 3 ans, un enfant a vu
des centaines de millions de photos
06:21
of the realréal worldmonde.
99
369529
1834
du monde réel.
06:23
That's a lot of trainingentraînement examplesexemples.
100
371363
2280
Ça nous fait beaucoup d'exemples.
06:26
So insteadau lieu of focusingse concentrer solelyuniquement
on better and better algorithmsalgorithmes,
101
374383
5989
Alors plutôt que se concentrer
sur l'amélioration des algorithmes,
06:32
my insightperspicacité was to give the algorithmsalgorithmes
the kindgentil of trainingentraînement dataLes données
102
380372
5272
mon idée a été de former les algorithmes
avec le genre de données
06:37
that a childenfant was givendonné throughpar experiencesexpériences
103
385644
3319
qu'un enfant reçoit par l'expérience
06:40
in bothtous les deux quantityquantité and qualityqualité.
104
388963
3878
tant en quantité qu'en qualité
06:44
OnceFois we know this,
105
392841
1858
Une fois que nous avons compris ça,
06:46
we knewa connu we needednécessaire to collectcollecte a dataLes données setensemble
106
394699
2971
nous savions qu'il fallait collecter
un ensemble de données
06:49
that has farloin more imagesimages
than we have ever had before,
107
397670
4459
qui contienne bien plus d'images
que jamais auparavant,
06:54
perhapspeut être thousandsmilliers of timesfois more,
108
402129
2577
peut-être des milliers de fois plus.
06:56
and togetherensemble with ProfessorProfesseur
KaiKai LiLi at PrincetonPrinceton UniversityUniversité,
109
404706
4111
Avec le professeur Kai Li
de l'Université de Princeton,
07:00
we launchedlancé the ImageNetImageNet projectprojet in 2007.
110
408817
4752
nous avons donc lancé
le projet ImageNet en 2007.
07:05
LuckilyHeureusement, we didn't have to mountmonter
a cameracaméra on our headtête
111
413569
3838
Heureusement, ce n'était pas la peine
de se mettre une caméra sur la tête
07:09
and wait for manybeaucoup yearsannées.
112
417407
1764
et d'attendre plusieurs années.
07:11
We wentest allé to the InternetInternet,
113
419171
1463
Nous sommes allés sur Internet,
07:12
the biggestplus grand treasureTrésor trovemine d’or of picturesdes photos
that humanshumains have ever createdcréé.
114
420634
4436
la plus grande mine de photos
que l'humain ait jamais créée.
07:17
We downloadedtéléchargé nearlypresque a billionmilliard imagesimages
115
425070
3041
Nous avons téléchargé
près d'un milliard d'images.
07:20
and used crowdsourcingcrowdsourcing technologyLa technologie
like the AmazonAmazon MechanicalMécanique TurkTurk platformPlate-forme
116
428111
5880
Des technologies de crowdsourcing
comme le Turc Mécanique d'Amazon
07:25
to help us to labelétiquette these imagesimages.
117
433991
2339
nous ont aidés à cataloguer les images.
07:28
At its peakde pointe, ImageNetImageNet was one of
the biggestplus grand employersemployeurs
118
436330
4900
A son plus haut, ImageNet a été
l'un des plus gros employeurs
07:33
of the AmazonAmazon MechanicalMécanique TurkTurk workersouvriers:
119
441230
2996
du Turc Mécanique d'Amazon :
07:36
togetherensemble, almostpresque 50,000 workersouvriers
120
444226
3854
près de 50 000 employés
07:40
from 167 countriesdes pays around the worldmonde
121
448080
4040
dans 167 pays
07:44
helpedaidé us to cleannettoyer, sortTrier and labelétiquette
122
452120
3947
nous ont aidés
à nettoyer, trier, étiqueter
07:48
nearlypresque a billionmilliard candidatecandidat imagesimages.
123
456067
3575
presque un milliard d'images.
07:52
That was how much efforteffort it tooka pris
124
460612
2653
C'est vous dire l'effort entrepris
07:55
to captureCapturer even a fractionfraction
of the imageryimagerie
125
463265
3900
pour capturer une fraction des images
07:59
a child'sde l’enfant mindesprit takes in
in the earlyde bonne heure developmentaldu développement yearsannées.
126
467165
4171
qu'un enfant stocke
pendant ses premières années.
08:04
In hindsightavec le recul, this ideaidée of usingen utilisant biggros dataLes données
127
472148
3902
Aujourd'hui, cette idée
d'utiliser ces masses de données
08:08
to traintrain computerordinateur algorithmsalgorithmes
maymai seemsembler obviousévident now,
128
476050
4550
pour construire des algorithmes
peut paraître évidente,
08:12
but back in 2007, it was not so obviousévident.
129
480600
4110
mais pas en 2007.
08:16
We were fairlyéquitablement aloneseul on this journeypériple
for quiteassez a while.
130
484710
3878
Pendant longtemps, nous étions bien seuls.
08:20
Some very friendlyamical colleaguescollègues adviseda conseillé me
to do something more usefulutile for my tenuremandat,
131
488588
5003
Des collègues me conseillaient de trouver
autre chose pour devenir titulaire,
08:25
and we were constantlyconstamment strugglingluttant
for researchrecherche fundingfinancement.
132
493591
4342
et c'était une bataille constante
pour trouver des crédits de recherche.
08:29
OnceFois, I even jokeda plaisanté to my graduatediplômé studentsélèves
133
497933
2485
Je disais en plaisantant à mes étudiants
08:32
that I would just reopenrouvrir
my drysec cleaner'snettoyeur shopboutique to fundfonds ImageNetImageNet.
134
500418
4063
que je pourrais reprendre ma laverie
pour financer ImageNet.
08:36
After all, that's how I fundedfinancé
my collegeUniversité yearsannées.
135
504481
4761
Après tout, j'avais financé mes études
grâce à elle.
08:41
So we carriedporté on.
136
509242
1856
Mais nous avons continué.
08:43
In 2009, the ImageNetImageNet projectprojet deliveredlivré
137
511098
3715
En 2009, le projet ImageNet avait
08:46
a databasebase de données of 15 millionmillion imagesimages
138
514813
4042
une base de données
de 15 millions d'images,
08:50
acrossà travers 22,000 classesclasses
of objectsobjets and things
139
518855
4805
22 000 classes d'objets et de choses
08:55
organizedorganisé by everydaytous les jours EnglishAnglais wordsmots.
140
523660
3320
organisées avec des mots d'anglais
du quotidien.
08:58
In bothtous les deux quantityquantité and qualityqualité,
141
526980
2926
Tant en quantité qu'en qualité,
09:01
this was an unprecedentedsans précédent scaleéchelle.
142
529906
2972
une telle échelle de grandeur
était une première.
09:04
As an exampleExemple, in the caseCas of catschats,
143
532878
3461
Par exemple, les chats,
09:08
we have more than 62,000 catschats
144
536339
2809
nous avons plus de 62 000 chats,
09:11
of all kindssortes of looksregards and posespose
145
539148
4110
toutes sortes d'apparences et de poses,
09:15
and acrossà travers all speciesespèce
of domesticnational and wildsauvage catschats.
146
543258
5223
toutes les espèces,
domestiques et sauvages.
09:20
We were thrilledravi
to have put togetherensemble ImageNetImageNet,
147
548481
3344
C'était formidable d'avoir bâti ImageNet,
09:23
and we wanted the wholeentier researchrecherche worldmonde
to benefitavantage from it,
148
551825
3738
et nous voulions en faire profiter
le monde de la recherche.
09:27
so in the TEDTED fashionmode,
we openedouvert up the entiretout dataLes données setensemble
149
555563
4041
Alors, à la manière de TED,
nous avons donné l'accès aux données
09:31
to the worldwideà l'échelle mondiale
researchrecherche communitycommunauté for freegratuit.
150
559604
3592
à la recherche, gratuitement
et dans le monde entier.
(Applaudissements)
09:36
(ApplauseApplaudissements)
151
564636
4000
09:41
Now that we have the dataLes données
to nourishnourrir our computerordinateur braincerveau,
152
569416
4538
Maintenant que nous avons les données
pour nourrir notre cerveau informatique,
09:45
we're readyprêt to come back
to the algorithmsalgorithmes themselvesse.
153
573954
3737
nous pouvons revenir sur les algorithmes.
09:49
As it turnedtourné out, the wealthrichesse
of informationinformation providedà condition de by ImageNetImageNet
154
577691
5178
Il se trouve que la manne d'informations
désormais dans ImageNet
09:54
was a perfectparfait matchrencontre to a particularparticulier classclasse
of machinemachine learningapprentissage algorithmsalgorithmes
155
582869
4806
allait parfaitement avec
un certain type d'algorithmes,
09:59
calledappelé convolutionalconvolutifs neuralneural networkréseau,
156
587675
2415
le réseau de neurones à convolution,
10:02
pioneeredpionnier by KunihikoKunihiko FukushimaFukushima,
GeoffGeoff HintonHinton, and YannYann LeCunLeCun
157
590090
5248
développé par Kunihiko Fukushima,
Geoff Hinton et Yann LeCun
10:07
back in the 1970s and '80s.
158
595338
3645
dans les années 1970 et 80.
10:10
Just like the braincerveau consistsconsiste
of billionsdes milliards of highlytrès connectedconnecté neuronsneurones,
159
598983
5619
Tout comme le cerveau est composé
de milliards de neurones connectés,
10:16
a basicde base operatingen fonctionnement unitunité in a neuralneural networkréseau
160
604602
3854
l'unité de base d'un réseau neuronal
10:20
is a neuron-likeneurone-like nodenœud.
161
608456
2415
est le nœud de type neurone.
10:22
It takes inputcontribution from other nodesnœuds
162
610871
2554
Il reçoit des informations d'autres nœuds
10:25
and sendsenvoie outputsortie to othersautres.
163
613425
2718
et en envoie à d'autres.
10:28
MoreoverEn outre, these hundredsdes centaines of thousandsmilliers
or even millionsdes millions of nodesnœuds
164
616143
4713
De plus, ces centaines de milliers
voire millions de nœuds
10:32
are organizedorganisé in hierarchicalhiérarchique layerscouches,
165
620856
3227
sont organisés en couches hiérarchiques,
10:36
alsoaussi similarsimilaire to the braincerveau.
166
624083
2554
similaires au cerveau.
10:38
In a typicaltypique neuralneural networkréseau we use
to traintrain our objectobjet recognitionreconnaissance modelmaquette,
167
626637
4783
Dans le réseau neuronal classique
que nous utilisons,
10:43
it has 24 millionmillion nodesnœuds,
168
631420
3181
il y a 24 millions de nœuds,
10:46
140 millionmillion parametersparamètres,
169
634601
3297
140 millions de paramètres,
10:49
and 15 billionmilliard connectionsles liaisons.
170
637898
2763
et 15 milliards de connexions.
10:52
That's an enormousénorme modelmaquette.
171
640661
2415
C'est un modèle énorme.
10:55
PoweredPropulsé by the massivemassif dataLes données from ImageNetImageNet
172
643076
3901
Avec la puissance des données d'ImageNet
10:58
and the modernmoderne CPUsUnités centrales and GPUsGPU
to traintrain suchtel a humongousHumongous modelmaquette,
173
646977
5433
et les processeurs modernes
pour traiter cet énorme modèle,
11:04
the convolutionalconvolutifs neuralneural networkréseau
174
652410
2369
le réseau de neurones à convolution
11:06
blossomeds’épanouit in a way that no one expectedattendu.
175
654779
3436
s'est transformé de manière inattendue.
11:10
It becamedevenu the winninggagnant architecturearchitecture
176
658215
2508
Il est devenu l'architecture idéale
11:12
to generateGénérer excitingpassionnant newNouveau resultsrésultats
in objectobjet recognitionreconnaissance.
177
660723
5340
pour générer des résultats fabuleux
en reconnaissance d'objets.
11:18
This is a computerordinateur tellingrécit us
178
666063
2810
Ceci est un ordinateur qui nous dit
11:20
this picturephoto containscontient a catchat
179
668873
2300
que la photo contient un chat
11:23
and where the catchat is.
180
671173
1903
et où est ce chat.
11:25
Of coursecours there are more things than catschats,
181
673076
2112
Bien sûr, il y a
autre chose que des chats.
11:27
so here'svoici a computerordinateur algorithmalgorithme de tellingrécit us
182
675188
2438
Ici un algorithme nous dit
11:29
the picturephoto containscontient
a boygarçon and a teddynounours bearours;
183
677626
3274
que la photo contient un garçon
et un ours en peluche,
11:32
a dogchien, a personla personne, and a smallpetit kitecerf-volant
in the backgroundContexte;
184
680900
4366
un chien, une personne,
et un cerf-volant en arrière-plan.
11:37
or a picturephoto of very busyoccupé things
185
685266
3135
Ici, beaucoup d'activités
11:40
like a man, a skateboardplanche à roulette,
railingsbalustrades, a lampostLampadaire, and so on.
186
688401
4644
avec un homme, un skateboard, une rampe,
un lampadaire, etc.
11:45
SometimesParfois, when the computerordinateur
is not so confidentsur de soi about what it seesvoit,
187
693045
5293
Parfois l'ordinateur n'est pas trop sûr,
11:51
we have taughtenseigné it to be smartintelligent enoughassez
188
699498
2276
nous lui avons appris à être
assez intelligent
11:53
to give us a safesûr answerrépondre
insteadau lieu of committingcommettre too much,
189
701774
3878
pour donner une réponse sûre,
sans trop s'engager,
11:57
just like we would do,
190
705652
2811
c'est ce que nous ferions.
12:00
but other timesfois our computerordinateur algorithmalgorithme de
is remarkableremarquable at tellingrécit us
191
708463
4666
D'autres fois, l'algorithme
a la capacité incroyable
12:05
what exactlyexactement the objectsobjets are,
192
713129
2253
de nous dire exactement
ce qu'est l'objet :
12:07
like the make, modelmaquette, yearan of the carsdes voitures.
193
715382
3436
marque, modèle, année d'une voiture.
12:10
We appliedappliqué this algorithmalgorithme de to millionsdes millions
of GoogleGoogle StreetRue ViewVue imagesimages
194
718818
5386
Nous avons utilisé cet algorithme sur
des millions d'images Google Street View,
12:16
acrossà travers hundredsdes centaines of AmericanAméricain citiesvilles,
195
724204
3135
dans des centaines de villes américaines,
12:19
and we have learnedappris something
really interestingintéressant:
196
727339
2926
et nous avons découvert
quelque chose de très intéressant.
12:22
first, it confirmedconfirmé our commoncommun wisdomsagesse
197
730265
3320
D'abord, il a été confirmé
12:25
that carvoiture pricesdes prix correlatecorréler very well
198
733585
3290
que le prix des voitures
12:28
with householdMénage incomesrevenus.
199
736875
2345
et le revenu des foyers sont liés.
12:31
But surprisinglyétonnamment, carvoiture pricesdes prix
alsoaussi correlatecorréler well
200
739220
4527
Mais, étonnamment, le prix des voitures
et le taux de crimes dans les villes
sont également liés,
12:35
with crimela criminalité ratesles taux in citiesvilles,
201
743747
2300
12:39
or votingvote patternsmodèles by zipZip *: français codescodes.
202
747007
3963
même chose avec la répartition
géographique des votes.
12:44
So wait a minuteminute. Is that it?
203
752060
2206
Attendez un peu... c'est tout ?
12:46
Has the computerordinateur alreadydéjà matchedapparié
or even surpasseda dépassé humanHumain capabilitiescapacités?
204
754266
5153
Est-ce que l'ordinateur atteint,
voire surpasse, les capacités humaines ?
12:51
Not so fastvite.
205
759419
2138
Pas si vite.
12:53
So farloin, we have just taughtenseigné
the computerordinateur to see objectsobjets.
206
761557
4923
Jusque là, nous avons appris
aux ordinateurs à voir des objets,
12:58
This is like a smallpetit childenfant
learningapprentissage to utterUtter a fewpeu nounsnoms.
207
766480
4644
comme un jeune enfant apprend
à prononcer quelques noms.
13:03
It's an incredibleincroyable accomplishmentaccomplissement,
208
771124
2670
C'est déjà incroyable,
13:05
but it's only the first stepétape.
209
773794
2460
mais ce n'est que la première étape.
13:08
SoonBientôt, anotherun autre developmentaldu développement
milestoneÉtape importante will be hitfrappé,
210
776254
3762
Bientôt, nous atteindrons un autre niveau,
13:12
and childrenles enfants begincommencer
to communicatecommuniquer in sentencesphrases.
211
780016
3461
l'enfant commence à faire des phrases.
13:15
So insteadau lieu of sayingen disant
this is a catchat in the picturephoto,
212
783477
4224
Au lieu de dire que
c'est un chat sur la photo,
13:19
you alreadydéjà heardentendu the little girlfille
tellingrécit us this is a catchat lyingmensonge on a bedlit.
213
787701
5202
comme nous l'a dit la petite fille
tout à l'heure.
13:24
So to teachapprendre a computerordinateur
to see a picturephoto and generateGénérer sentencesphrases,
214
792903
5595
Pour apprendre à l'ordinateur à générer
des phrases à partir d'une photo,
13:30
the marriagemariage betweenentre biggros dataLes données
and machinemachine learningapprentissage algorithmalgorithme de
215
798498
3948
le mariage entre les données
et l'algorithme d'apprentissage
13:34
has to take anotherun autre stepétape.
216
802446
2275
doit franchir une autre étape.
13:36
Now, the computerordinateur has to learnapprendre
from bothtous les deux picturesdes photos
217
804721
4156
L'ordinateur doit apprendre
à partir des photos,
13:40
as well as naturalNaturel languagela langue sentencesphrases
218
808877
2856
en utilisant des phrases
en langage naturel
13:43
generatedgénéré by humanshumains.
219
811733
3322
générée par l'être humain.
13:47
Just like the braincerveau integratess’intègre
visionvision and languagela langue,
220
815055
3853
Tout comme le cerveau
combine vision et langage,
13:50
we developeddéveloppé a modelmaquette
that connectsse connecte partsles pièces of visualvisuel things
221
818908
5201
notre modèle connecte
les parties de choses visuelles,
13:56
like visualvisuel snippetsextraits
222
824109
1904
des petits bouts visuels,
13:58
with wordsmots and phrasesphrases in sentencesphrases.
223
826013
4203
avec des mots ou groupes de mots,
pour en faire des phrases.
14:02
About fourquatre monthsmois agodepuis,
224
830216
2763
Il y a environ 4 mois,
14:04
we finallyenfin tiedattaché all this togetherensemble
225
832979
2647
nous avons enfin réussi
14:07
and producedproduit one of the first
computerordinateur visionvision modelsdes modèles
226
835626
3784
à créer l'un des premiers
modèles de vision artificielle
14:11
that is capablecapable of generatinggénérateur
a human-likehumain sentencephrase
227
839410
3994
capagle de générer une phrase
comme un être humain
14:15
when it seesvoit a picturephoto for the first time.
228
843404
3506
qui découvre une image.
14:18
Now, I'm readyprêt to showmontrer you
what the computerordinateur saysdit
229
846910
4644
Aujourd'hui, je suis prête à vous montrer
ce que dit l'ordinateur
14:23
when it seesvoit the picturephoto
230
851554
1975
quand il voit la photo
14:25
that the little girlfille saw
at the beginningdébut of this talk.
231
853529
3830
que la petite fille voyait tout à l'heure.
14:31
(VideoVidéo) ComputerOrdinateur: A man is standingpermanent
nextprochain to an elephantl'éléphant.
232
859519
3344
(Vidéo) L'ordinateur :
Un homme est debout à coté d'un éléphant.
14:36
A largegrand airplaneavion sittingséance on topHaut
of an airportaéroport runwaypiste.
233
864393
3634
Un grand avion est assis
sur une piste d'aéroport.
14:41
FFLFFL: Of coursecours, we're still workingtravail harddifficile
to improveaméliorer our algorithmsalgorithmes,
234
869057
4212
FFL : Bien sûr, il y a encore
beaucoup de travail sur les algorithmes,
14:45
and it still has a lot to learnapprendre.
235
873269
2596
l'ordinateur a encore
beaucoup à apprendre,
14:47
(ApplauseApplaudissements)
236
875865
2291
(Applaudissements)
14:51
And the computerordinateur still makesfait du mistakeserreurs.
237
879556
3321
et il fait encore des erreurs.
14:54
(VideoVidéo) ComputerOrdinateur: A catchat lyingmensonge
on a bedlit in a blanketcouverture.
238
882877
3391
(Vidéo) Ordinateur : un chat est couché
sur un lit dans une couverture.
14:58
FFLFFL: So of coursecours, when it seesvoit
too manybeaucoup catschats,
239
886268
2553
FFL : Bien sûr, s'il voit trop de chats,
15:00
it thinkspense everything
mightpourrait look like a catchat.
240
888821
2926
il pense que tout
est peut-être un chat.
15:05
(VideoVidéo) ComputerOrdinateur: A youngJeune boygarçon
is holdingen portant a baseballbase-ball batchauve souris.
241
893317
2864
(Vidéo) Ordinateur : un garçon
tient une batte de base-ball.
15:08
(LaughterRires)
242
896181
1765
(Rires)
15:09
FFLFFL: Or, if it hasn'tn'a pas seenvu a toothbrushbrosse à dents,
it confusesconfond it with a baseballbase-ball batchauve souris.
243
897946
4583
FFL : Ou alors, s'il n'a jamais vu
de brosse à dents, elle devient une batte.
15:15
(VideoVidéo) ComputerOrdinateur: A man ridingéquitation a horsecheval
down a streetrue nextprochain to a buildingbâtiment.
244
903309
3434
(Vidéo) Ordinateur : Un homme se promène
à cheval près d'un bâtiment.
15:18
(LaughterRires)
245
906743
2023
(Rires)
15:20
FFLFFL: We haven'tn'a pas taughtenseigné ArtArt 101
to the computersdes ordinateurs.
246
908766
3552
Nous n'avons pas enseigné
l'histoire de l'art à l'ordinateur.
15:25
(VideoVidéo) ComputerOrdinateur: A zebraZebra standingpermanent
in a fieldchamp of grassherbe.
247
913768
2884
(Vidéo) L'ordinateur : Un zèbre
se trouve dans un pré.
15:28
FFLFFL: And it hasn'tn'a pas learnedappris to appreciateapprécier
the stunningétourdissant beautybeauté of naturela nature
248
916652
3367
FFL : Et il ne sait pas apprécier
la beauté de la nature
15:32
like you and I do.
249
920019
2438
comme vous et moi.
15:34
So it has been a long journeypériple.
250
922457
2832
Ça a donc été un long voyage.
15:37
To get from ageâge zerozéro to threeTrois was harddifficile.
251
925289
4226
Aller de 0 à 3 ans a été difficile.
15:41
The realréal challengedéfi is to go
from threeTrois to 13 and farloin beyondau-delà.
252
929515
5596
Le vrai défi est d'aller de 3 à 13
et bien au-delà.
15:47
Let me remindrappeler you with this picturephoto
of the boygarçon and the cakegâteau again.
253
935111
4365
Revoici l'image du garçon avec le gâteau.
15:51
So farloin, we have taughtenseigné
the computerordinateur to see objectsobjets
254
939476
4064
Jusque là, nous avons appris
à l'ordinateur à voir des objets
15:55
or even tell us a simplesimple storyrécit
when seeingvoyant a picturephoto.
255
943540
4458
ou à créer une petite histoire
d'après une photo.
15:59
(VideoVidéo) ComputerOrdinateur: A personla personne sittingséance
at a tabletable with a cakegâteau.
256
947998
3576
(Vidéo) L'ordinateur : Une personne
assise à une table avec un gâteau.
16:03
FFLFFL: But there's so much more
to this picturephoto
257
951574
2630
FFL : Mais il y a beaucoup plus
16:06
than just a personla personne and a cakegâteau.
258
954204
2270
qu'une personne et un gâteau.
16:08
What the computerordinateur doesn't see
is that this is a specialspécial ItalianItalien cakegâteau
259
956474
4467
Ce que l'ordinateur ne voit pas
est que c'est un gâteau italien spécial
16:12
that's only servedservi duringpendant EasterPâques time.
260
960941
3217
servi uniquement à Pâques.
16:16
The boygarçon is wearingportant his favoritepréféré t-shirtT-shirt
261
964158
3205
Le garçon porte son t-shirt préféré,
16:19
givendonné to him as a giftcadeau by his fatherpère
after a tripvoyage to SydneySydney,
262
967363
3970
celui que lui a offert son père
après un voyage à Sydney,
16:23
and you and I can all tell how happycontent he is
263
971333
3808
et vous et moi voyons bien
à quel point il est heureux
16:27
and what's exactlyexactement on his mindesprit
at that momentmoment.
264
975141
3203
et ce qu'il pense à ce moment.
16:31
This is my sonfils LeoLeo.
265
979214
3125
C'est mon fils Léo.
16:34
On my questquête for visualvisuel intelligenceintelligence,
266
982339
2624
Au cours de ma quête
de l'intelligence visuelle,
16:36
I think of LeoLeo constantlyconstamment
267
984963
2391
Léo était constamment dans mes pensées
16:39
and the futureavenir worldmonde he will livevivre in.
268
987354
2903
ainsi que le monde dans lequel il vivra.
16:42
When machinesmachines can see,
269
990257
2021
Quand les machines pourront voir,
16:44
doctorsmédecins and nursesinfirmières will have
extrasupplémentaire pairspaires of tirelessinfatigable eyesles yeux
270
992278
4712
les médecins et infirmières auront
une paire d'yeux infatigables en plus
16:48
to help them to diagnosediagnostiquer
and take carese soucier of patientsles patients.
271
996990
4092
pour les aider au diagnostic
et au soin des patients.
16:53
CarsVoitures will runcourir smarterplus intelligent
and saferplus sûr on the roadroute.
272
1001082
4383
Les voitures seront plus intelligentes
et plus sûres.
16:57
RobotsRobots, not just humanshumains,
273
1005465
2694
Des robots, pas seulement des humains,
17:00
will help us to bravecourageux the disastercatastrophe zoneszones
to saveenregistrer the trappedpiégé and woundedblessés.
274
1008159
4849
nous aideront à sauver des vies
dans des zones sinistrées.
17:05
We will discoverdécouvrir newNouveau speciesespèce,
better materialsmatériaux,
275
1013798
3796
Nous découvrirons de nouvelles espèces,
de meilleurs matériaux,
17:09
and exploreexplorer unseeninvisible frontiersfrontières
with the help of the machinesmachines.
276
1017594
4509
nous explorerons d'autres frontières,
avec l'aide des machines.
17:15
Little by little, we're givingdonnant sightvue
to the machinesmachines.
277
1023113
4167
Petit à petit, nous donnons la vue
aux machines.
17:19
First, we teachapprendre them to see.
278
1027280
2798
D'abord nous leur apprenons à voir.
17:22
Then, they help us to see better.
279
1030078
2763
Puis c'est elles
qui nous aident à mieux voir.
17:24
For the first time, humanHumain eyesles yeux
won'thabitude be the only onesceux
280
1032841
4165
Pour la première fois, les yeux humains
ne seront pas les seuls
17:29
ponderings’interrogeant sur and exploringexplorant our worldmonde.
281
1037006
2934
à questionner et explorer notre monde.
17:31
We will not only use the machinesmachines
for theirleur intelligenceintelligence,
282
1039940
3460
En plus d'utiliser les machines
pour leur intelligence,
17:35
we will alsoaussi collaboratecollaborer with them
in waysfaçons that we cannotne peux pas even imagineimaginer.
283
1043400
6179
nous collaborerons avec elles
de manière inédite.
17:41
This is my questquête:
284
1049579
2161
C'est ma quête :
17:43
to give computersdes ordinateurs visualvisuel intelligenceintelligence
285
1051740
2712
donner aux ordinateurs
l'intelligence visuelle
17:46
and to createcréer a better futureavenir
for LeoLeo and for the worldmonde.
286
1054452
5131
et créer un meilleur avenir
pour Léo et pour le monde.
17:51
Thank you.
287
1059583
1811
Merci.
17:53
(ApplauseApplaudissements)
288
1061394
3785
(Applaudissements)
Translated by eric vautier
Reviewed by Nakhli Rania

▲Back to top

ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com