ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com
TED2015

Fei-Fei Li: How we're teaching computers to understand pictures

Fei-Fei Li: Hvordan vi lærer computere at forstå billeder

Filmed:
2,702,344 views

Når et meget ungt barn kigger på billeder, kan hun identificere simple elementer: "Kat", "bog", "stol". Nu er computere ved at være så smarte at de kan gøre det også. Hvad er så det næste? I en spændende talk, computersyns ekspert Fei-Fei Li beskriver status - herunder en database med 15 millioner fotos som hendes team har samlet for at "lære" computere at forstå billeder - og stadigvæk mangler der meget.
- Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio

Double-click the English transcript below to play the video.

00:14
Let me showat vise you something.
0
2366
3738
Lad mig vise jer noget.
00:18
(VideoVideo) GirlPige: Okay, that's a catkat
sittingsidder in a bedseng.
1
6104
4156
(Video) Pige: Ok, det er en kat der
sidder i en seng.
00:22
The boydreng is pettingPetting the elephantelefant.
2
10260
4040
Drengen klapper elefanten.
00:26
Those are people
that are going on an airplanefly.
3
14300
4354
Det er folk, der går ind i en flymaskine.
00:30
That's a bigstor airplanefly.
4
18654
2810
Det er en stor flymaskine.
00:33
Fei-FeiFei-Fei LiLi: This is
a three-year-oldtre-årig childbarn
5
21464
2206
Fei-Fei Li: Det her er et treårigt barn
00:35
describingbeskriver what she seesser
in a seriesserie of photosfotos.
6
23670
3679
der beskriver hvad hun ser i en
række billeder.
00:39
She mightmagt still have a lot
to learnlære about this worldverden,
7
27349
2845
Hun har endnu masser at lære om verden
00:42
but she's alreadyallerede an expertekspert
at one very importantvigtig taskopgave:
8
30194
4549
men hun er allerede ekspert i en
meget vigtig ting:
00:46
to make sensefølelse of what she seesser.
9
34743
2846
at få mening ud af det hun ser.
00:50
Our societysamfund is more
technologicallyteknologisk advancedfremskreden than ever.
10
38229
4226
Vort samfund er mere teknologisk
avanceret end nogensinde.
00:54
We sendsende people to the moonmåne,
we make phonestelefoner that talk to us
11
42455
3629
Vi sender folk til månen, vi laver
telefoner der taler til os
00:58
or customizetilpasse radioradio stationsstationer
that can playSpille only musicmusik we like.
12
46084
4946
eller tilpasser radio stationer der kan
spille musik som kun vi kan lide.
01:03
YetEndnu, our mostmest advancedfremskreden
machinesmaskiner and computerscomputere
13
51030
4055
Alligevel har de mest avancerede
maskiner og computere
01:07
still strugglekamp at this taskopgave.
14
55085
2903
stadig problemer med dette.
01:09
So I'm here todayi dag
to give you a progressfremskridt reportrapport
15
57988
3459
Jeg er her idag for at give jer
en statusrapport
01:13
on the latestseneste advancesfremskridt
in our researchforskning in computercomputer visionvision,
16
61447
4047
på de nyeste fremskridt i
forskningen af computer vision
01:17
one of the mostmest frontiergrænse
and potentiallypotentielt revolutionaryrevolutionerende
17
65494
4161
en af de mest banebrydende og
muligvis revolutionære
01:21
technologiesteknologier in computercomputer sciencevidenskab.
18
69655
3206
teknologier i computer videnskab.
01:24
Yes, we have prototypedafprøves carsbiler
that can drivekøre by themselvesdem selv,
19
72861
4551
Ja, vi har prototyper af biler,
der er selvkørende
01:29
but withoutuden smartsmart visionvision,
they cannotkan ikke really tell the differenceforskel
20
77412
3853
men uden intelligent vision kan de
ikke se forskel
01:33
betweenmellem a crumpledkrøllede paperpapir bagtaske
on the roadvej, whichhvilken can be runløb over,
21
81265
3970
mellem en krøllet pose på vejen,
der kan køres over
01:37
and a rockklippe that sizestørrelse,
whichhvilken should be avoidedundgås.
22
85235
3340
og en sten af samme størrelse,
der skal undgås.
01:41
We have madelavet fabulousfabelagtig megapixelmegapixel cameraskameraer,
23
89415
3390
Vi har lavet fabelagtige megapixel
kameraer
01:44
but we have not deliveredleveret
sightsyn to the blindblind.
24
92805
3135
men vi har ikke givet blinde syn.
01:48
DronesDroner can flyflyve over massivemassiv landjord,
25
96420
3305
Droner kan flyve over store landområder
01:51
but don't have enoughnok visionvision technologyteknologi
26
99725
2134
men vi har ikke nok vision teknologi
01:53
to help us to trackspore
the changesændringer of the rainforestsregnskove.
27
101859
3461
til at følge forandringerne i regnskoven.
01:57
SecuritySikkerhed cameraskameraer are everywhereoveralt,
28
105320
2950
Sikkerhedskameraer er allevegne
02:00
but they do not alertalert us when a childbarn
is drowningdrukning in a swimmingsvømning poolpool.
29
108270
5067
men de advarer os ikke, når et barn
drukner i en svømmepøl.
02:06
PhotosBilleder and videosvideoer are becomingblive
an integralintegreret parten del of globalglobal life.
30
114167
5595
Foto og video er blevet en integreret
del af det globale liv.
02:11
They're beingvære generatedgenereret at a pacetempo
that's farlangt beyondud over what any humanhuman,
31
119762
4087
De bliver fremstillet hurtigere end
noget menneske
02:15
or teamshold of humansmennesker, could hopehåber to viewudsigt,
32
123849
2783
eller hold af folk kan nå at se
02:18
and you and I are contributingbidrager
to that at this TEDTED.
33
126632
3921
og du og jeg bidrager til det
ved denne TED.
02:22
YetEndnu our mostmest advancedfremskreden softwaresoftware
is still strugglingkæmper at understandingforståelse
34
130553
5232
Vor mest avancerede software
kæmper stadig med at forstå
02:27
and managingadministration af this enormousenorm contentindhold.
35
135785
3876
og administrere dette enorme indhold.
02:31
So in other wordsord,
collectivelykollektivt as a societysamfund,
36
139661
5272
Med andre ord er vi kollektivt som samfund
02:36
we're very much blindblind,
37
144933
1746
stadig meget blinde,
02:38
because our smartestsmarteste
machinesmaskiner are still blindblind.
38
146679
3387
for vor klogeste maskiner er
stadig blinde.
02:43
"Why is this so hardhårdt?" you maykan askSpørg.
39
151526
2926
"Hvorfor er det så svært?" spørger
du måske.
02:46
CamerasKameraer can take picturesbilleder like this one
40
154452
2693
Kameraer tager billeder som dette
02:49
by convertingkonvertering lightslys into
a two-dimensionaltodimensional arraymatrix of numbersnumre
41
157145
3994
ved at konvertere lys til en
to-dimensionel række af tal
02:53
knownkendt as pixelspixel,
42
161139
1650
kendt som pixler
02:54
but these are just lifelesslivløs numbersnumre.
43
162789
2251
men de er kun livløse tal.
02:57
They do not carrybære meaningbetyder in themselvesdem selv.
44
165040
3111
De har ingen mening i sig selv.
03:00
Just like to hearhøre is not
the samesamme as to listen,
45
168151
4343
Ligesom at høre ikke er det samme
som at lytte
03:04
to take picturesbilleder is not
the samesamme as to see,
46
172494
4040
er det at tage billeder ikke det
samme som at se
03:08
and by seeingat se,
we really mean understandingforståelse.
47
176534
3829
og ved at se mener vi at forstå.
03:13
In factfaktum, it tooktog MotherMor NatureNatur
540 millionmillion yearsflere år of hardhårdt work
48
181293
6177
Faktisk tog det Moder Natur 540 mio. års
hårdt arbejde
03:19
to do this taskopgave,
49
187470
1973
at løse denne opgave
03:21
and much of that effortindsats
50
189443
1881
og megen af den indsats
03:23
wentgik into developingudvikle the visualvisuel
processingforarbejdning apparatusapparater of our brainshjerner,
51
191324
5271
gik til at udvikle det visuelle
apparat i vor hjerner
03:28
not the eyesøjne themselvesdem selv.
52
196595
2647
og ikke selve øjnene.
03:31
So visionvision beginsbegynder with the eyesøjne,
53
199242
2747
Vision starter med øjnene
03:33
but it trulyvirkelig takes placeplacere in the brainhjerne.
54
201989
3518
men foregår virkelig i hjernen.
03:38
So for 15 yearsflere år now, startingstart
from my PhPh.D. at CaltechCaltech
55
206287
5060
I 15 år nu, fra min Ph.D. i Caltech
03:43
and then leadingførende Stanford'sStanfords VisionVision LabLab,
56
211347
2926
og bagefter da jeg førte
Stanford´s Vision Lab,
03:46
I've been workingarbejder with my mentorsmentorer,
collaboratorssamarbejdspartnere and studentsstuderende
57
214273
4396
har jeg arbejdet med mine mentorer,
kolleger og elever
03:50
to teachunderviser computerscomputere to see.
58
218669
2889
med at lære computere at se.
03:54
Our researchforskning fieldMark is calledhedder
computercomputer visionvision and machinemaskine learninglæring.
59
222658
3294
Vort forskningsfelt kaldes
computer vision og maskinlærdom.
03:57
It's parten del of the generalgenerel fieldMark
of artificialkunstig intelligenceintelligens.
60
225952
3878
Det er en del af det generelle felt
af kunstig intelligens.
04:03
So ultimatelyultimativt, we want to teachunderviser
the machinesmaskiner to see just like we do:
61
231000
5493
Vi vil lære maskiner at se ligesom os:
04:08
namingnavngivning objectsobjekter, identifyingat identificere people,
inferringudlede 3D geometrygeometri of things,
62
236493
5387
identificere objekter, mennesker og
udlede 3D geometrien af ting
04:13
understandingforståelse relationsrelationer, emotionsfølelser,
actionshandlinger and intentionsintentioner.
63
241880
5688
at forstå relationer, følelser
handlinger og intentioner.
04:19
You and I weavevæve togethersammen entirehel storieshistorier
of people, placessteder and things
64
247568
6153
Du og jeg udleder hele historier
af folk, steder og ting
04:25
the momentøjeblik we laylægge our gazeblik on them.
65
253721
2164
i det sekund vi kigger på dem.
04:28
The first steptrin towardshen imod this goalmål
is to teachunderviser a computercomputer to see objectsobjekter,
66
256955
5583
Første skridt mod dette mål er at
lære computere at se objekter,
04:34
the buildingbygning blockblok of the visualvisuel worldverden.
67
262538
3368
byggestenene i den visuelle verden.
04:37
In its simplestenkleste termsbetingelser,
imagineforestille this teachingundervisning processbehandle
68
265906
4434
Enklest sagt, kan du forestille dig
denne lærdomsproces
04:42
as showingviser the computerscomputere
some traininguddannelse imagesbilleder
69
270340
2995
som at vise computere nogle
træningsbilleder
04:45
of a particularsærlig objectobjekt, let's say catskatte,
70
273335
3321
af et bestemt objekt, f.eks. katte
04:48
and designingdesigne a modelmodel that learnslærer
from these traininguddannelse imagesbilleder.
71
276656
4737
og designe en model der lærer
af disse træningsbilleder.
04:53
How hardhårdt can this be?
72
281393
2044
Hvor svært kan det være?
04:55
After all, a catkat is just
a collectionkollektion of shapesfigurer and colorsfarver,
73
283437
4052
En kat er jo en samling af
former og farver,
04:59
and this is what we did
in the earlytidlig daysdage of objectobjekt modelingmodellering.
74
287489
4086
og dét er hvad vi gjorde i starten
af objekt modelleringen.
05:03
We'dVi ønsker tell the computercomputer algorithmalgoritme
in a mathematicalmatematisk languageSprog
75
291575
3622
Vi fortalte computer algoritmen i et
matematisk sprog
05:07
that a catkat has a roundrund faceansigt,
a chubbybuttede bodylegeme,
76
295197
3343
at en kat har et rundt ansigt,
en fyldig krop,
05:10
two pointyspidse earsører, and a long tailhale,
77
298540
2299
to spidse ører og en lang hale
05:12
and that lookedkigget all fine.
78
300839
1410
og det virkede fint.
05:14
But what about this catkat?
79
302859
2113
Men hvad med denne kat?
05:16
(LaughterLatter)
80
304972
1091
(Latter)
05:18
It's all curledkruset up.
81
306063
1626
Den er helt sammenfoldet.
05:19
Now you have to addtilføje anotheren anden shapeform
and viewpointsynspunkt to the objectobjekt modelmodel.
82
307689
4719
Nu bliver du nødt til at tilføje en ny
form og udsigtspunkt til objektet.
05:24
But what if catskatte are hiddenskjult?
83
312408
1715
Men hvad hvis katten er gemt?
05:27
What about these sillyfjollet catskatte?
84
315143
2219
Hvad med disse fjollede katte?
05:31
Now you get my pointpunkt.
85
319112
2417
Nu ser I problemet.
05:33
Even something as simpleenkel
as a householdhusstand petkæledyr
86
321529
3367
Selv noget så simpelt som et husdyr
05:36
can presenttil stede an infiniteuendelig numbernummer
of variationsvariationer to the objectobjekt modelmodel,
87
324896
4504
kan lave uendelige variationer
til objekt modelleringen,
05:41
and that's just one objectobjekt.
88
329400
2233
og det er kun ét objekt.
05:44
So about eightotte yearsflere år agosiden,
89
332573
2492
For omkring otte år siden
05:47
a very simpleenkel and profounddybtgående observationobservation
changedændret my thinkingtænker.
90
335065
5030
forandrede en meget simpel og dyb
observering min tænkemåde.
05:53
No one tellsfortæller a childbarn how to see,
91
341425
2685
Ingen fortæller et barn hvordan det ser,
05:56
especiallyisær in the earlytidlig yearsflere år.
92
344110
2261
særlig i de tidligste år.
05:58
They learnlære this throughigennem
real-worldvirkelige verden experienceserfaringer and exampleseksempler.
93
346371
5000
De lærer dette gennem virkelige
erfaringer og eksempler.
06:03
If you consideroverveje a child'sbarnets eyesøjne
94
351371
2740
Hvis man ser et barns øjne
06:06
as a pairpar of biologicalbiologisk cameraskameraer,
95
354111
2554
som et par biologiske kameraer
06:08
they take one picturebillede
about everyhver 200 millisecondsmillisekunder,
96
356665
4180
tager de et billede ca. hver
200 millisekunder,
06:12
the averagegennemsnit time an eyeøje movementbevægelse is madelavet.
97
360845
3134
gennemsnitstiden for hver bevægelse
i øjnene.
06:15
So by agealder threetre, a childbarn would have seenset
hundredshundreder of millionsmillioner of picturesbilleder
98
363979
5550
Ved tre-årstiden vil et barn have set
hundrede mio. billeder
06:21
of the realægte worldverden.
99
369529
1834
af den virkelige verden.
06:23
That's a lot of traininguddannelse exampleseksempler.
100
371363
2280
Det er mange træningseksempler.
06:26
So insteadi stedet of focusingfokusering solelyudelukkende
on better and better algorithmsalgoritmer,
101
374383
5989
Istedet for kun at fokusere på
bedre og bedre algoritmer
06:32
my insightindsigt was to give the algorithmsalgoritmer
the kindvenlig of traininguddannelse datadata
102
380372
5272
var min indsigt at give algoritmerne
den slags træningsdata
06:37
that a childbarn was givengivet throughigennem experienceserfaringer
103
385644
3319
som et barn får gennem erfaringer
06:40
in bothbegge quantitymængde and qualitykvalitet.
104
388963
3878
både i kvalitet og kvantitet.
06:44
OnceÉn gang we know this,
105
392841
1858
Når vi ved dette,
06:46
we knewvidste we neededhavde brug for to collectindsamle a datadata setsæt
106
394699
2971
kan vi begynde at samle et data sæt
06:49
that has farlangt more imagesbilleder
than we have ever had before,
107
397670
4459
som har langt flere billeder
end vi før har haft,
06:54
perhapsmåske thousandstusinder of timesgange more,
108
402129
2577
måske tusindvis af gange mere,
06:56
and togethersammen with ProfessorProfessor
KaiKai LiLi at PrincetonPrinceton UniversityUniversitet,
109
404706
4111
og sammen med professor Kai Li
i Princeton University
07:00
we launchedlanceret the ImageNetImageNet projectprojekt in 2007.
110
408817
4752
startede vi ImageNet projektet i 2007.
07:05
LuckilyHeldigvis, we didn't have to mountmount
a camerakamera on our headhoved
111
413569
3838
Heldigvis behøvede vi ikke at sætte et
kamera på hovedet
07:09
and wait for manymange yearsflere år.
112
417407
1764
og vente i mange år.
07:11
We wentgik to the InternetInternet,
113
419171
1463
Vi tog på Internettet,
07:12
the biggeststørste treasureskat troveguldgrube of picturesbilleder
that humansmennesker have ever createdskabt.
114
420634
4436
den største samling af billeder som
mennesket nogensinde har lavet.
07:17
We downloadeddownloadet nearlynæsten a billionmilliard imagesbilleder
115
425070
3041
Vi downloadede næsten en milliard billeder
07:20
and used crowdsourcingcrowdsourcing technologyteknologi
like the AmazonAmazon MechanicalMekanisk TurkTurk platformplatform
116
428111
5880
og brugte crowdsource teknologier såsom
Amazon Mechanical Turk platformen
07:25
to help us to labeletiket these imagesbilleder.
117
433991
2339
til at hjælpe med at sortere billederne.
07:28
At its peakspids, ImageNetImageNet was one of
the biggeststørste employersarbejdsgivere
118
436330
4900
På sit højeste var ImageNet en af de
største arbejdsgivere
07:33
of the AmazonAmazon MechanicalMekanisk TurkTurk workersarbejdere:
119
441230
2996
af alle Amazon Mechanical Turk ansatte:
07:36
togethersammen, almostnæsten 50,000 workersarbejdere
120
444226
3854
tilsammen hjalp næsten 50,000 ansatte
07:40
from 167 countrieslande around the worldverden
121
448080
4040
fra 167 lande rundt omkring i verden
07:44
helpedhjulpet us to cleanren, sortsortere and labeletiket
122
452120
3947
os med at rense, sortere og rubricere
07:48
nearlynæsten a billionmilliard candidatekandidat imagesbilleder.
123
456067
3575
næsten en milliard kandidat-billeder.
07:52
That was how much effortindsats it tooktog
124
460612
2653
Så megen indsats tog det
07:55
to capturefange even a fractionfraktion
of the imagerybilledsprog
125
463265
3900
at fange selv en brøkdel
af alle de billeder
07:59
a child'sbarnets mindsind takes in
in the earlytidlig developmentaludviklingsmæssige yearsflere år.
126
467165
4171
som et barns hjerne bearbejder
i de første leveår.
08:04
In hindsightset i bakspejlet, this ideaide of usingved brug af bigstor datadata
127
472148
3902
Set i bakspejlet er denne idé med at bruge
massive data
08:08
to traintog computercomputer algorithmsalgoritmer
maykan seemsynes obviousindlysende now,
128
476050
4550
til at træne computer algoritmer
måske indlysende,
08:12
but back in 2007, it was not so obviousindlysende.
129
480600
4110
men i 2007 var det ikke så enkelt.
08:16
We were fairlytemmelig alonealene on this journeyrejse
for quitetemmelig a while.
130
484710
3878
Vi var ret alene på denne rejse
i et godt stykke tid.
08:20
Some very friendlyvenlige colleagueskollegaer advisedrådgivet me
to do something more usefulnyttig for my tenureuopsigelighed,
131
488588
5003
Nogle venlige kolleger gav mig det råd at
bruge arbejdstiden mere effektivt
08:25
and we were constantlykonstant strugglingkæmper
for researchforskning fundingfinansiering.
132
493591
4342
og vi arbejdede hårdt for at skaffe
forskningsmidler.
08:29
OnceÉn gang, I even jokedspøgte to my graduatebestå studentsstuderende
133
497933
2485
Jeg jokede også med mine
kandidatstuderende
08:32
that I would just reopengenåbne
my drytør cleaner'sreneres shopbutik to fundfond ImageNetImageNet.
134
500418
4063
at jeg ville genåbne mit renseri
for at skaffe penge til ImageNet.
08:36
After all, that's how I fundedfinansierede
my collegekollegium yearsflere år.
135
504481
4761
Det er jo hvordan jeg finansierede
mine universitetsår.
08:41
So we carriedgennemføres on.
136
509242
1856
Så vi fortsatte.
08:43
In 2009, the ImageNetImageNet projectprojekt deliveredleveret
137
511098
3715
I 2009 leverede ImageNet projektet
08:46
a databasedatabase of 15 millionmillion imagesbilleder
138
514813
4042
en database på 15 millioner billeder
08:50
acrosset kors 22,000 classesklasser
of objectsobjekter and things
139
518855
4805
bestående af 22,000 klasser
af objekter og ting
08:55
organizedorganiseret by everydayhver dag Englishengelsk wordsord.
140
523660
3320
organiseret af engelske dagligdags-ord.
08:58
In bothbegge quantitymængde and qualitykvalitet,
141
526980
2926
I både kvalitet og kvantitet
09:01
this was an unprecedenteduden fortilfælde scalevægt.
142
529906
2972
var dette aldrig set før.
09:04
As an exampleeksempel, in the casetilfælde of catskatte,
143
532878
3461
F.eks. i eksemplet med katte
09:08
we have more than 62,000 catskatte
144
536339
2809
har vi nu mere end 62,000 katte
09:11
of all kindsformer of looksudseende and posesrejser
145
539148
4110
af alle slags udseender og positioner
09:15
and acrosset kors all speciesarter
of domesticindenlandske and wildvild catskatte.
146
543258
5223
og af alle racer af både hus-
og vilde katte.
09:20
We were thrilledbegejstret
to have put togethersammen ImageNetImageNet,
147
548481
3344
Vi var utrolig glade for at have
sammensat ImageNet,
09:23
and we wanted the wholehel researchforskning worldverden
to benefitfordel from it,
148
551825
3738
og vi ville, at hele forskningsverdenen
ville få gavn af dette,
09:27
so in the TEDTED fashionmode,
we openedåbnet up the entirehel datadata setsæt
149
555563
4041
så på ren TED-manér åbnede vi
for hele data-sættet
09:31
to the worldwidei hele verden
researchforskning communityfællesskab for freegratis.
150
559604
3592
gratis til hele forsknings-fællesskabet.
09:36
(ApplauseBifald)
151
564636
4000
(Bifald)
09:41
Now that we have the datadata
to nourishnære our computercomputer brainhjerne,
152
569416
4538
Nu, da vi har data til at nære
vor computer-hjerne
09:45
we're readyparat to come back
to the algorithmsalgoritmer themselvesdem selv.
153
573954
3737
er vi klar til at tage fat på
selve algoritmerne.
09:49
As it turnedvendt out, the wealthrigdom
of informationinformation providedstillet til rådighed by ImageNetImageNet
154
577691
5178
Det viste sig at overfloden af information
som ImageNet gav
09:54
was a perfectperfektionere matchmatch to a particularsærlig classklasse
of machinemaskine learninglæring algorithmsalgoritmer
155
582869
4806
passede perfekt til en særlig klasse af
maskinlærings-algoritmer
09:59
calledhedder convolutionalConvolutional neuralneural networknetværk,
156
587675
2415
kaldet sammenfoldede neurale netværk,
10:02
pioneeredbanebrydende by KunihikoKunihiko FukushimaFukushima,
GeoffGeoff HintonHinton, and YannYann LeCunLeCun
157
590090
5248
udviklet af Kunihiko Fukushima,
Geoff Hinton og Yann LeCun
10:07
back in the 1970s and '80s.
158
595338
3645
i 1970´erne og 80´erne.
10:10
Just like the brainhjerne consistsbestår
of billionsmilliarder of highlymeget connectedforbundet neuronsneuroner,
159
598983
5619
Ligesom hjernen består af milliarder af
sammenkædede neuroner,
10:16
a basicgrundlæggende operatingdrift unitenhed in a neuralneural networknetværk
160
604602
3854
er et grundlæggende armatur i et
neuralt netværk
10:20
is a neuron-likeneuron-lignende nodenode.
161
608456
2415
som en neuron-lignende node.
10:22
It takes inputinput from other nodesnoder
162
610871
2554
Det tager input fra andre noder
10:25
and sendssender outputproduktion to othersandre.
163
613425
2718
og sender output til andre.
10:28
MoreoverDesuden, these hundredshundreder of thousandstusinder
or even millionsmillioner of nodesnoder
164
616143
4713
Disse hundrede tusinder eller endda
millioner af noder
10:32
are organizedorganiseret in hierarchicalhierarkisk layerslag,
165
620856
3227
er organiseret i hierarkiske lag,
10:36
alsoogså similarlignende to the brainhjerne.
166
624083
2554
ligesom i hjernen.
10:38
In a typicaltypisk neuralneural networknetværk we use
to traintog our objectobjekt recognitionanerkendelse modelmodel,
167
626637
4783
I et typisk neuralt netværk vi bruger
til at træne vor objekt-genkendelsesmodel,
10:43
it has 24 millionmillion nodesnoder,
168
631420
3181
er der 24 millioner knuder,
10:46
140 millionmillion parametersparametre,
169
634601
3297
140 millioner parametre,
10:49
and 15 billionmilliard connectionstilslutninger.
170
637898
2763
og 15 milliarder tilslutninger.
10:52
That's an enormousenorm modelmodel.
171
640661
2415
Det er en enorm model.
10:55
PoweredDrevet by the massivemassiv datadata from ImageNetImageNet
172
643076
3901
Drevet af de massive data fra ImageNet,
10:58
and the modernmoderne CPUsCPU'er and GPUsGPU'er
to traintog suchsådan a humongoushumongous modelmodel,
173
646977
5433
og de moderne CPU´er og GPU´er brugt til
at træne en så stor model,
11:04
the convolutionalConvolutional neuralneural networknetværk
174
652410
2369
begyndte det sammenfoldede neurale netværk
11:06
blossomedblomstrede in a way that no one expectedforventes.
175
654779
3436
at blomstre på en måde ingen forventede.
11:10
It becameblev til the winningvinder architecturearkitektur
176
658215
2508
Det blev den førende arkitektur
11:12
to generatefrembringe excitingspændende newny resultsresultater
in objectobjekt recognitionanerkendelse.
177
660723
5340
til at genere spændende nye resultater
i objekt-genkendelse.
11:18
This is a computercomputer tellingfortæller us
178
666063
2810
Dét her er en computer, der fortæller os
11:20
this picturebillede containsindeholder a catkat
179
668873
2300
at dette billede indeholder en kat
11:23
and where the catkat is.
180
671173
1903
og hvor katten er.
11:25
Of courseRute there are more things than catskatte,
181
673076
2112
Der er selvfølgelig andre ting end katte
11:27
so here'sher er a computercomputer algorithmalgoritme tellingfortæller us
182
675188
2438
så her er en computer algoritme
der fortæller
11:29
the picturebillede containsindeholder
a boydreng and a teddyTeddy bearbjørn;
183
677626
3274
at dette billede indeholder en
dreng og en bamse;
11:32
a doghund, a personperson, and a smalllille kiteglente
in the backgroundbaggrund;
184
680900
4366
en hund, en person og en
lille drage i baggrunden;
11:37
or a picturebillede of very busytravl things
185
685266
3135
eller et billede af meget travle ting
11:40
like a man, a skateboardskateboard,
railingsrækværk, a lampostlampost, and so on.
186
688401
4644
som en mand, et skateboard, rækværk,
en lygtepæl, og så videre.
11:45
SometimesNogle gange, when the computercomputer
is not so confidentselvsikker about what it seesser,
187
693045
5293
Sommetider, når computeren ikke er så
sikker på hvad den ser,
11:51
we have taughtundervist it to be smartsmart enoughnok
188
699498
2276
har den lært at være klog nok
11:53
to give us a safesikker answersvar
insteadi stedet of committingbegå too much,
189
701774
3878
til at give os et sikkert svar i stedet
for at være for skråsikker sig,
11:57
just like we would do,
190
705652
2811
ligesom vi ville,
12:00
but other timesgange our computercomputer algorithmalgoritme
is remarkablebemærkelsesværdig at tellingfortæller us
191
708463
4666
men som regel er algoritmen
utrolig god til at fortælle os
12:05
what exactlyNemlig the objectsobjekter are,
192
713129
2253
præcis hvad objekterne er,
12:07
like the make, modelmodel, yearår of the carsbiler.
193
715382
3436
som fremstillingen, modellen og
årgangen af bilerne.
12:10
We appliedanvendt this algorithmalgoritme to millionsmillioner
of GoogleGoogle StreetStreet ViewSe imagesbilleder
194
718818
5386
Vi anvendte algoritmerne i mio.
af Google Street View billeder
12:16
acrosset kors hundredshundreder of AmericanAmerikansk citiesbyer,
195
724204
3135
i hundreder af amerikanske byer,
12:19
and we have learnedlærte something
really interestinginteressant:
196
727339
2926
og vi har lært noget meget
interessant:
12:22
first, it confirmedbekræftet our commonalmindelige wisdomvisdom
197
730265
3320
vi fik bekræftet den gængse viden
12:25
that carbil pricespriser correlatekorrelat very well
198
733585
3290
at bilpriser korrelerer meget godt
12:28
with householdhusstand incomesindkomster.
199
736875
2345
med husholdningsindtægter.
12:31
But surprisinglyoverraskende, carbil pricespriser
alsoogså correlatekorrelat well
200
739220
4527
Men overraskende nok korrelerer
bilpriser godt
12:35
with crimeforbrydelse ratessatser in citiesbyer,
201
743747
2300
med kriminalitet i byer,
12:39
or votingafstemning patternsmønstre by zipzip codeskoder.
202
747007
3963
eller stemmemønstre ved postnumre.
12:44
So wait a minuteminut. Is that it?
203
752060
2206
Vent lidt. Er dét alt?
12:46
Has the computercomputer alreadyallerede matchedmatchede
or even surpassedovergået humanhuman capabilitieskapaciteter?
204
754266
5153
Har computeren allerede nået
eller endda overhalet menneskelige evner?
12:51
Not so fasthurtig.
205
759419
2138
Øjeblik.
12:53
So farlangt, we have just taughtundervist
the computercomputer to see objectsobjekter.
206
761557
4923
Indtil videre har vi kun lært
computeren at se objekter.
12:58
This is like a smalllille childbarn
learninglæring to utterfuldkomne a few nounsnavneord.
207
766480
4644
Det er ligesom et barn, der
lærer at udtale nogle få navneord.
13:03
It's an incredibleutrolig accomplishmentrealisering,
208
771124
2670
Det er en utrolig stor udrettelse,
13:05
but it's only the first steptrin.
209
773794
2460
men det er kun første skridt.
13:08
SoonSnart, anotheren anden developmentaludviklingsmæssige
milestonemilepæl will be hithit,
210
776254
3762
Snart vil en ny udviklingsmæssig
milepæl blive nået,
13:12
and childrenbørn beginbegynde
to communicatekommunikere in sentencessætninger.
211
780016
3461
og barnet begynder at
kommunikere i sætninger.
13:15
So insteadi stedet of sayingordsprog
this is a catkat in the picturebillede,
212
783477
4224
Istedet for at sige at dette
er en kat på billedet,
13:19
you alreadyallerede heardhørt the little girlpige
tellingfortæller us this is a catkat lyingat lyve on a bedseng.
213
787701
5202
har vi allerede hørt pigen sige, at dette
er en kat der ligger på en seng.
13:24
So to teachunderviser a computercomputer
to see a picturebillede and generatefrembringe sentencessætninger,
214
792903
5595
For at lære en computer at se et billede
og lave sætninger,
13:30
the marriageægteskab betweenmellem bigstor datadata
and machinemaskine learninglæring algorithmalgoritme
215
798498
3948
må sammenføringen af massive data og
maskinlærings-algoritmer
13:34
has to take anotheren anden steptrin.
216
802446
2275
tages til et nyt niveau.
13:36
Now, the computercomputer has to learnlære
from bothbegge picturesbilleder
217
804721
4156
Nu må computeren lære fra både billeder
13:40
as well as naturalnaturlig languageSprog sentencessætninger
218
808877
2856
og naturlige sprog-sætninger
13:43
generatedgenereret by humansmennesker.
219
811733
3322
fra mennesker.
13:47
Just like the brainhjerne integratesintegrerer
visionvision and languageSprog,
220
815055
3853
Ligesom hjernen integrerer vision og sprog
13:50
we developedudviklede sig a modelmodel
that connectsforbinder partsdele of visualvisuel things
221
818908
5201
har vi udviklet en model, der
sammenfører dele af visuelle ting,
13:56
like visualvisuel snippetsuddrag
222
824109
1904
eller visuelle klip,
13:58
with wordsord and phrasessætninger in sentencessætninger.
223
826013
4203
med ord og fraser i sætninger.
14:02
About fourfire monthsmåneder agosiden,
224
830216
2763
For fire måneder siden
14:04
we finallyendelig tiedbundet all this togethersammen
225
832979
2647
fik vi endelig sammensat alt dette
14:07
and producedproduceret one of the first
computercomputer visionvision modelsmodeller
226
835626
3784
og producerede en af de første
computervision modeller
14:11
that is capablei stand til at of generatinggenererende
a human-likemenneskelignende sentencesætning
227
839410
3994
der er i stand til at lave
en menneskelignende sætning
14:15
when it seesser a picturebillede for the first time.
228
843404
3506
når den ser et billede for første gang.
14:18
Now, I'm readyparat to showat vise you
what the computercomputer sayssiger
229
846910
4644
Nu er jeg klar til at vise jer
hvad computeren siger,
14:23
when it seesser the picturebillede
230
851554
1975
når den ser billedet af
14:25
that the little girlpige saw
at the beginningstarten of this talk.
231
853529
3830
hvad den lille pige så
i starten af dette foredrag.
14:31
(VideoVideo) ComputerComputer: A man is standingstående
nextNæste to an elephantelefant.
232
859519
3344
(Video) Computer: En mand står
ved siden af en elefant.
14:36
A largestor airplanefly sittingsidder on toptop
of an airportlufthavn runwaylandingsbane.
233
864393
3634
Et stort fly står på en landingsbane
i en lufthavn.
14:41
FFLFFL: Of courseRute, we're still workingarbejder hardhårdt
to improveforbedre our algorithmsalgoritmer,
234
869057
4212
FFL: Selvfølgelig arbejder vi stadig hårdt
med at forbedre vor algoritmer,
14:45
and it still has a lot to learnlære.
235
873269
2596
og den har stadig meget at lære.
14:47
(ApplauseBifald)
236
875865
2291
(Bifald)
14:51
And the computercomputer still makesmærker mistakesfejl.
237
879556
3321
Og computeren laver stadig fejl.
14:54
(VideoVideo) ComputerComputer: A catkat lyingat lyve
on a bedseng in a blankettæppe.
238
882877
3391
(Video) Computer: En kat ligger i et tæppe
på en seng.
14:58
FFLFFL: So of courseRute, when it seesser
too manymange catskatte,
239
886268
2553
FFL: Så selvfølgelig, når den ser
for mange katte,
15:00
it thinkstænker everything
mightmagt look like a catkat.
240
888821
2926
tror den at alt ligner en kat.
15:05
(VideoVideo) ComputerComputer: A youngung boydreng
is holdingbedrift a baseballbaseball batflagermus.
241
893317
2864
(Video) Comp.: En lille dreng
holder et baseball bat.
15:08
(LaughterLatter)
242
896181
1765
(Latter)
15:09
FFLFFL: Or, if it hasn'thar ikke seenset a toothbrushtandbørste,
it confusesforvirrer it with a baseballbaseball batflagermus.
243
897946
4583
FFL: Eller hvis den ikke har set en tand-
børste før, tror den at det er et bat.
15:15
(VideoVideo) ComputerComputer: A man ridingridning a horsehest
down a streetgade nextNæste to a buildingbygning.
244
903309
3434
(Video) Comp.: En mand rider en hest
på en vej ved siden af en bygning.
15:18
(LaughterLatter)
245
906743
2023
(Latter)
15:20
FFLFFL: We haven'thar ikke taughtundervist ArtKunst 101
to the computerscomputere.
246
908766
3552
FFL: Vi har ikke lært computere kunst.
15:25
(VideoVideo) ComputerComputer: A zebraZebra standingstående
in a fieldMark of grassgræs.
247
913768
2884
(Video) Comp.: En zebra står på en eng.
15:28
FFLFFL: And it hasn'thar ikke learnedlærte to appreciatesætter pris på
the stunningbetagende beautyskønhed of naturenatur
248
916652
3367
FFL: Og den har ikke lært at værdsætte
naturens utrolige skønhed
15:32
like you and I do.
249
920019
2438
som du og jeg.
15:34
So it has been a long journeyrejse.
250
922457
2832
Så det har været en lang rejse.
15:37
To get from agealder zeronul to threetre was hardhårdt.
251
925289
4226
Det var svært at nå treårsalderen.
15:41
The realægte challengeudfordring is to go
from threetre to 13 and farlangt beyondud over.
252
929515
5596
Udfordringen ligger i at nå 13-årsstadiet
og endnu længere frem.
15:47
Let me remindminde om you with this picturebillede
of the boydreng and the cakekage again.
253
935111
4365
Lad mig minde jer om billedet af drengen
og kagen igen.
15:51
So farlangt, we have taughtundervist
the computercomputer to see objectsobjekter
254
939476
4064
Indtil videre har vi lært computere
at se objekter
15:55
or even tell us a simpleenkel storyhistorie
when seeingat se a picturebillede.
255
943540
4458
eller endda fortælle en simpel historie
når den ser et billede.
15:59
(VideoVideo) ComputerComputer: A personperson sittingsidder
at a tabletabel with a cakekage.
256
947998
3576
(Video) Computer.: En person sidder ved
et bord med en kage.
16:03
FFLFFL: But there's so much more
to this picturebillede
257
951574
2630
FFL: Men der er så meget mere ved
dette billede
16:06
than just a personperson and a cakekage.
258
954204
2270
end kun en person og en kage.
16:08
What the computercomputer doesn't see
is that this is a specialsærlig Italianitaliensk cakekage
259
956474
4467
Hvad computeren ikke ser, er at dette
er en speciel italiensk kage
16:12
that's only servedserveret duringi løbet af EasterPåske time.
260
960941
3217
som kun bliver serveret ved påske.
16:16
The boydreng is wearingiført his favoritefavorit t-shirtT-shirt
261
964158
3205
Drengen er i sin yndlings t-shirt
16:19
givengivet to him as a giftgave by his fatherfar
after a triprejse to SydneySydney,
262
967363
3970
som hans far gav ham efter en
tur til Sydney,
16:23
and you and I can all tell how happylykkelig he is
263
971333
3808
og vi kan se hvor glad han er
16:27
and what's exactlyNemlig on his mindsind
at that momentøjeblik.
264
975141
3203
og præcis hvad han tænker i dette øjeblik.
16:31
This is my sonsøn LeoLeo.
265
979214
3125
Dette er min søn Leo.
16:34
On my questQuest for visualvisuel intelligenceintelligens,
266
982339
2624
På min mission for visuel intelligens
16:36
I think of LeoLeo constantlykonstant
267
984963
2391
tænker jeg konstant på Leo
16:39
and the futurefremtid worldverden he will livelevende in.
268
987354
2903
og fremtidens verden han vil leve i.
16:42
When machinesmaskiner can see,
269
990257
2021
Når maskiner kan se
16:44
doctorslæger and nursessygeplejersker will have
extraekstra pairspar of tirelessutrættelige eyesøjne
270
992278
4712
vil læger og sygeplejersker have
ekstra utrættelige øjne
16:48
to help them to diagnosediagnosticere
and take careomsorg of patientspatienter.
271
996990
4092
til at hjælpe med at diagnosticere
og pleje patienter.
16:53
CarsBiler will runløb smartersmartere
and safersikrere on the roadvej.
272
1001082
4383
Biler vil være klogere og sikrere
på vejene.
16:57
RobotsRobotter, not just humansmennesker,
273
1005465
2694
Robotter, ikke kun mennesker,
17:00
will help us to bravemodig the disasterkatastrofe zoneszoner
to saveGemme the trappedfanget and woundedsåret.
274
1008159
4849
vil hjælpe med at redde sårede
mennesker på ulykkessteder.
17:05
We will discoveropdage newny speciesarter,
better materialsmaterialer,
275
1013798
3796
Vi vil opdage nye arter,
bedre materialer,
17:09
and exploreudforske unseenusete frontiersgrænser
with the help of the machinesmaskiner.
276
1017594
4509
og udforske nye territorier
ved hjælp af maskiner.
17:15
Little by little, we're givinggiver sightsyn
to the machinesmaskiner.
277
1023113
4167
Vi lærer maskiner at se med tiden.
17:19
First, we teachunderviser them to see.
278
1027280
2798
Først lærer vi dem at se.
17:22
Then, they help us to see better.
279
1030078
2763
Så lærer de os at se bedre.
17:24
For the first time, humanhuman eyesøjne
won'tvil ikke be the only onesdem
280
1032841
4165
For første gang vil menneskelige øjne
ikke være de eneste
17:29
ponderinggrundede and exploringudforske our worldverden.
281
1037006
2934
som iagttager og udforsker vor verden.
17:31
We will not only use the machinesmaskiner
for theirderes intelligenceintelligens,
282
1039940
3460
Vi vil ikke blot bruge maskiner for
deres intelligens,
17:35
we will alsoogså collaboratesamarbejde with them
in waysmåder that we cannotkan ikke even imagineforestille.
283
1043400
6179
vi vil også samarbejde med dem på
måder vi end ikke kan forestille os.
17:41
This is my questQuest:
284
1049579
2161
Dette er min mission:
17:43
to give computerscomputere visualvisuel intelligenceintelligens
285
1051740
2712
at give computere visuel intelligens
17:46
and to createskab a better futurefremtid
for LeoLeo and for the worldverden.
286
1054452
5131
og at skabe en bedre fremtid
for Leo og for verden.
17:51
Thank you.
287
1059583
1811
Tak skal I have.
17:53
(ApplauseBifald)
288
1061394
3785
(Bifald)
Translated by Aviaja Josenius
Reviewed by Anders Finn Jørgensen

▲Back to top

ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com

Data provided by TED.

This site was created in May 2015 and the last update was on January 12, 2020. It will no longer be updated.

We are currently creating a new site called "eng.lish.video" and would be grateful if you could access it.

If you have any questions or suggestions, please feel free to write comments in your language on the contact form.

Privacy Policy

Developer's Blog

Buy Me A Coffee