ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com
TED2015

Fei-Fei Li: How we're teaching computers to understand pictures

Fei-Fei Li: Hogyan tanítjuk meg a számítógépeket a képek megértésére

Filmed:
2,702,344 views

Amikor egy kisgyermek ránéz egy képre, képes beazonosítani az egyszerű alkotóelemeket: "macska", "könyv", "szék". Nemsokára a számítógépek is elég értelmesek lesznek ahhoz, hogy ugyanezt tegyék. Mi a következő lépés? Egy izgalmas előadáson, a számítógép látóképességének szakértője, Fei Fei Li ismerteti a tudomány helyzetét - beleértve azt a 15 millió fotóból álló adatbázist, amelyet a csapata épített, hogy megtanítsanak egy számítógépet a képek megértésére - és az éleslátás kulcsát, amely még csak most jön.
- Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio

Double-click the English transcript below to play the video.

00:14
Let me showelőadás you something.
0
2366
3738
Engedjék meg, hogy mutassak
önöknek valamit.
00:18
(VideoVideóinak) Girllány: Okay, that's a catmacska
sittingülés in a bedágy.
1
6104
4156
(Videó) Kislány: Oké, az egy macska,
amely egy ágyon ül.
A fiú cirógatja az elefántot.
00:22
The boyfiú is pettingpetting the elephantelefánt.
2
10260
4040
Azok az emberek mennek
egy repülőgéphez.
00:26
Those are people
that are going on an airplanerepülőgép.
3
14300
4354
00:30
That's a bignagy airplanerepülőgép.
4
18654
2810
Az egy nagy repülőgép.
00:33
Fei-FeiFei Fei LiLi: This is
a three-year-oldHárom éves childgyermek
5
21464
2206
Fei-Fei Li: Ez egy hároméves gyermek
00:35
describingleíró what she seeslát
in a seriessorozat of photosfotók.
6
23670
3679
leírása arról, amit egy sor fotón lát.
00:39
She mightesetleg still have a lot
to learntanul about this worldvilág,
7
27349
2845
Lehet, hogy sokat kell
még tanulnia a világról,
00:42
but she's alreadymár an expertszakértő
at one very importantfontos taskfeladat:
8
30194
4549
de már szakértője
egy nagyon fontos feladatnak:
00:46
to make senseérzék of what she seeslát.
9
34743
2846
annak, hogy megértse, amit lát.
00:50
Our societytársadalom is more
technologicallytechnológiailag advancedfejlett than ever.
10
38229
4226
Társadalmunk technológiailag
fejlettebb, mint valaha.
00:54
We sendelküld people to the moonhold,
we make phonestelefonok that talk to us
11
42455
3629
Embereket küldünk a Holdra,
telefonokat készítünk, melyek beszélnek,
00:58
or customizetestreszab radiorádió stationsállomások
that can playjáték only musiczene we like.
12
46084
4946
vagy rádióállomásokat állítunk be a
saját zenei ízlésünknek megfelelően.
01:03
YetMég, our mosta legtöbb advancedfejlett
machinesgépek and computersszámítógépek
13
51030
4055
Mégis a legfejlettebb gépeink és
számítógépeink
01:07
still struggleküzdelem at this taskfeladat.
14
55085
2903
csak küszködnek ezzel a feladattal.
01:09
So I'm here todayMa
to give you a progressHaladás reportjelentés
15
57988
3459
Azért vagyok ma itt,
hogy jelentést adjak önöknek
01:13
on the latestlegújabb advanceselőlegek
in our researchkutatás in computerszámítógép visionlátomás,
16
61447
4047
a számítógépes képfelismerés
legújabb kutatási eredményeiről,
01:17
one of the mosta legtöbb frontierhatár
and potentiallypotenciálisan revolutionaryforradalmi
17
65494
4161
a számítástechnika egyik
valószínűleg legforradalmibb
01:21
technologiestechnológiák in computerszámítógép sciencetudomány.
18
69655
3206
technológiai területéről.
01:24
Yes, we have prototypedprototípus carsautók
that can drivehajtás by themselvesmaguk,
19
72861
4551
Igen, vannak olyan prototípus autóink,
amelyek képesek önmagukat vezetni,
01:29
but withoutnélkül smartOkos visionlátomás,
they cannotnem tud really tell the differencekülönbség
20
77412
3853
de tökéletes látás nélkül, nem tudnak
igazán megkülönböztetni
01:33
betweenközött a crumpledgyűrött paperpapír bagtáska
on the roadút, whichmelyik can be runfuss over,
21
81265
3970
egy összegyűrt papírtasakot
az úton, amelyen áthajthatunk,
01:37
and a rockszikla that sizeméret,
whichmelyik should be avoidedkerülendő.
22
85235
3340
egy ugyanolyan méretű kődarabtól,
amelyet el kellene kerülni.
01:41
We have madekészült fabulousmesés megapixelmegapixel cameraskamerák,
23
89415
3390
Mesés megapixeles kameráink vannak,
01:44
but we have not deliveredszállított
sightlátás to the blindvak.
24
92805
3135
de nem segítünk látni a vakoknak.
01:48
DronesHerék can flylégy over massivetömeges landföld,
25
96420
3305
A drónok képesek hatalmas
területeket berepülni,
01:51
but don't have enoughelég visionlátomás technologytechnológia
26
99725
2134
de nincs megfelelő látási
technológiájuk ahhoz,
01:53
to help us to tracknyomon követni
the changesváltoztatások of the rainforestsesőerdők.
27
101859
3461
hogy segítsenek nyomon követni
az esőerdők változásait.
01:57
SecurityBiztonsági cameraskamerák are everywheremindenhol,
28
105320
2950
Biztonsági kamerák vannak mindenhol,
02:00
but they do not alertéber us when a childgyermek
is drowningfulladás in a swimmingúszás poolmedence.
29
108270
5067
de nem figyelmeztetnek minket, amikor
egy gyerek beleesik az úszómedencébe.
02:06
PhotosFotók and videosvideók are becomingegyre
an integralszerves partrész of globalglobális life.
30
114167
5595
A fotók és videók szerves részévé
váltak az életnek.
02:11
They're beinglény generatedgenerált at a pacesebesség
that's farmessze beyondtúl what any humanemberi,
31
119762
4087
Olyan ütemben keletkeznek, ami
messze túl van azon, amit az ember
02:15
or teamscsapat of humansemberek, could hoperemény to viewKilátás,
32
123849
2783
vagy embercsoportok remélhetnének látni.
02:18
and you and I are contributinghozzájáruló
to that at this TEDTED.
33
126632
3921
Önök és én ezen a TED-en most
közreműködhetünk ebben.
02:22
YetMég our mosta legtöbb advancedfejlett softwareszoftver
is still strugglingküzdő at understandingmegértés
34
130553
5232
Még a legfejlettebb
szoftvereink is csak küzdenek
02:27
and managingkezelése this enormoushatalmas contenttartalom.
35
135785
3876
ennek a hatalmas tartalomnak
a megértésével és kezelésével.
02:31
So in other wordsszavak,
collectivelyegyüttesen as a societytársadalom,
36
139661
5272
Más szavakkal,
együttesen, egy közösségként
02:36
we're very much blindvak,
37
144933
1746
szinte teljesen vakok vagyunk,
02:38
because our smartestlegokosabb
machinesgépek are still blindvak.
38
146679
3387
mert a legokosabb gépeink még vakok.
02:43
"Why is this so hardkemény?" you maylehet askkérdez.
39
151526
2926
"Miért olyan nehéz ez?" - kérdezhetik.
02:46
CamerasKamerák can take picturesképek like this one
40
154452
2693
A kamerák képesek ilyen képeket készíteni,
02:49
by convertingáttérés lightsLámpák into
a two-dimensionalkétdimenziós arraysor of numbersszám
41
157145
3994
a fényeket kétdimenziós
számsorokba konvertálják,
02:53
knownismert as pixelspixel,
42
161139
1650
az úgynevezett pixelekbe,
02:54
but these are just lifelessélettelen numbersszám.
43
162789
2251
de ezek csak élettelen számok.
02:57
They do not carryvisz meaningjelentés in themselvesmaguk.
44
165040
3111
Ezek nem hordoznak magukban jelentést.
03:00
Just like to hearhall is not
the sameazonos as to listen,
45
168151
4343
Éppen úgy, ahogy nem ugyanaz
a hallani, mint a hallgatni,
03:04
to take picturesképek is not
the sameazonos as to see,
46
172494
4040
képet készíteni sem ugyanaz, mint látni,
03:08
and by seeinglátás,
we really mean understandingmegértés.
47
176534
3829
és a látás alatt tulajdonképpen
a megértést értjük.
03:13
In facttény, it tookvett MotherAnya NatureTermészet
540 millionmillió yearsévek of hardkemény work
48
181293
6177
Valójában, az Anyatermészet
kemény munkát végez 540 millió éve,
03:19
to do this taskfeladat,
49
187470
1973
ennek a feladatnak az elvégzésével,
03:21
and much of that efforterőfeszítés
50
189443
1881
és rengeteg fáradozásba került
03:23
wentment into developingfejlesztés the visualvizuális
processingfeldolgozás apparatuskészülék of our brainsagyvelő,
51
191324
5271
az agyunk vizuális feldolgozással
foglalkozó részének a kifejlesztése,
03:28
not the eyesszemek themselvesmaguk.
52
196595
2647
nem a szemek maguk.
03:31
So visionlátomás beginselkezdődik with the eyesszemek,
53
199242
2747
A látás a szemekkel kezdődik,
03:33
but it trulyvalóban takes placehely in the brainagy.
54
201989
3518
de valójában az agyban megy végbe.
03:38
So for 15 yearsévek now, startingkiindulási
from my PhPH-érték.D. at CaltechCaltech
55
206287
5060
15 éve már, hogy a Caltechnél
a Ph.D-mtől kezdve,
03:43
and then leadingvezető Stanford'sStanford VisionVision LabLabor,
56
211347
2926
majd a Stanford Látóképeséggel
foglalkozó laborját vezetve,
03:46
I've been workingdolgozó with my mentorsmentorok,
collaboratorsegyüttműködők and studentsdiákok
57
214273
4396
a mentoraimmal, munkatársaimmal
és tanítványaimmal azon dolgozom,
03:50
to teachtanít computersszámítógépek to see.
58
218669
2889
hogy megtanítsam a számítógépeket látni.
03:54
Our researchkutatás fieldmező is calledhívott
computerszámítógép visionlátomás and machinegép learningtanulás.
59
222658
3294
Kutatási területünk a
számítógépes látás és gépi tanulás.
03:57
It's partrész of the generalTábornok fieldmező
of artificialmesterséges intelligenceintelligencia.
60
225952
3878
Ez a mesterséges intelligencia
tudományának a része.
04:03
So ultimatelyvégül, we want to teachtanít
the machinesgépek to see just like we do:
61
231000
5493
Végső soron meg akarjuk tanítani
a gépeket úgy látni, ahogy mi látunk:
04:08
namingelnevezése objectstárgyak, identifyingazonosítása people,
inferringkövetkeztetett 3D geometrygeometria of things,
62
236493
5387
tárgyak megnevezése, emberek azonosítása,
következtetés a tárgyak 3D-s alakjára,
04:13
understandingmegértés relationskapcsolatok, emotionsérzelmek,
actionsakciók and intentionsszándékok.
63
241880
5688
a kapcsolatok, érzések,
tevékenységek és szándékok megértése.
04:19
You and I weaveszövés togetheregyütt entireteljes storiestörténetek
of people, placeshelyek and things
64
247568
6153
Önök és én egész történeteket szövünk
együtt emberekről, helyekről és dolgokról
04:25
the momentpillanat we layvilági our gazetekintete on them.
65
253721
2164
abban a pillanatban,
amikor rájuk pillantunk.
04:28
The first steplépés towardsfelé this goalcél
is to teachtanít a computerszámítógép to see objectstárgyak,
66
256955
5583
Az első lépés a cél felé, hogy
megtanítjuk a számítógépeket a tárgyakat,
04:34
the buildingépület blockBlokk of the visualvizuális worldvilág.
67
262538
3368
a képi világ építőköveit látni.
04:37
In its simplestlegegyszerűbb termsfeltételek,
imagineKépzeld el this teachingtanítás processfolyamat
68
265906
4434
A legegyszerűbben kifejezve, képzeljék el
ennek a tanításnak a folyamatát:
04:42
as showingkiállítás the computersszámítógépek
some trainingkiképzés imagesképek
69
270340
2995
mutatunk a számítógépeknek
néhány gyakorló képet
04:45
of a particularkülönös objecttárgy, let's say catsmacskák,
70
273335
3321
egy bizonyos dologról,
mondjuk a macskákról
04:48
and designingtervezés a modelmodell that learnstanul
from these trainingkiképzés imagesképek.
71
276656
4737
és tervezünk egy modellt, amely tanul
ezekből a gyakorló képekből.
04:53
How hardkemény can this be?
72
281393
2044
Milyen nehéz lehet ez?
04:55
After all, a catmacska is just
a collectionGyűjtemény of shapesalakzatok and colorsszínek,
73
283437
4052
Végül is, egy macska csak
színek és formák gyűjteménye,
04:59
and this is what we did
in the earlykorai daysnapok of objecttárgy modelingmodellezés.
74
287489
4086
és ez az, amit a dolgok modellezésének
első napjaiban csináltunk.
05:03
We'dMi lenne tell the computerszámítógép algorithmalgoritmus
in a mathematicalmatematikai languagenyelv
75
291575
3622
Matematikai nyelven mondtuk el
a számítógépes algoritmusnak,
05:07
that a catmacska has a roundkerek facearc,
a chubbypufók bodytest,
76
295197
3343
hogy egy macskának
egy kerek arca, pufók teste,
05:10
two pointyhegyes earsfülek, and a long tailfarok,
77
298540
2299
két hegyes füle és egy hosszú farka van,
05:12
and that lookednézett all fine.
78
300839
1410
és úgy tűnt, hogy minden rendben.
05:14
But what about this catmacska?
79
302859
2113
De mit szólnak ehhez a macskához?
05:16
(LaughterNevetés)
80
304972
1091
(Nevetés)
05:18
It's all curledfodros up.
81
306063
1626
Ez teljesen ki van csavarodva.
05:19
Now you have to addhozzáad anotheregy másik shapealak
and viewpointNézőpont to the objecttárgy modelmodell.
82
307689
4719
Most hozzá kell tenniük egy egész más
formát és nézőpontot a dolog modelljéhez.
05:24
But what if catsmacskák are hiddenrejtett?
83
312408
1715
De mi van, ha a macskák elbújnak?
05:27
What about these sillybolondos catsmacskák?
84
315143
2219
Mit szólnak ezekhez a bolond macskákhoz?
05:31
Now you get my pointpont.
85
319112
2417
Elmondom a véleményemet.
05:33
Even something as simpleegyszerű
as a householdháztartás petházi kedvenc
86
321529
3367
Még ha valami olyan egyszerű is,
mint egy háziállat,
05:36
can presentajándék an infinitevégtelen numberszám
of variationsvariációk to the objecttárgy modelmodell,
87
324896
4504
végtelen sok modellvariációt
képes felvonultatni,
05:41
and that's just one objecttárgy.
88
329400
2233
és ez csak egyetlen objektum.
05:44
So about eightnyolc yearsévek agoezelőtt,
89
332573
2492
Így kb. 8 évvel ezelőtt
05:47
a very simpleegyszerű and profoundmély observationmegfigyelés
changedmegváltozott my thinkinggondolkodás.
90
335065
5030
egy nagyon és mély megfigyelés
megváltoztatta a gondolkodásomat.
05:53
No one tellsmegmondja a childgyermek how to see,
91
341425
2685
Senki nem mondja meg egy
gyermeknek, hogy hogyan lásson,
05:56
especiallykülönösen in the earlykorai yearsévek.
92
344110
2261
különösen az első években.
05:58
They learntanul this throughkeresztül
real-worldvaló Világ experiencestapasztalatok and examplespéldák.
93
346371
5000
A valós világ tapasztalatain és példáin
keresztül tanulják ezt meg.
06:03
If you considerfontolgat a child'sgyermek eyesszemek
94
351371
2740
Ha egy gyermek szemeit
06:06
as a pairpár of biologicalbiológiai cameraskamerák,
95
354111
2554
egy pár biológiai kamerának tekintjük,
06:08
they take one picturekép
about everyminden 200 millisecondsmilliszekundum,
96
356665
4180
ezek körülbelül 200 ezredmásod-
percenként készítenek egy képet,
06:12
the averageátlagos time an eyeszem movementmozgalom is madekészült.
97
360845
3134
ez az átlagos időtartama
egy szemmozdulatnak.
06:15
So by agekor threehárom, a childgyermek would have seenlátott
hundredsszáz of millionsTöbb millió of picturesképek
98
363979
5550
Így hároméves korára egy gyermek
több száz millió képet lát
06:21
of the realigazi worldvilág.
99
369529
1834
a valós világról.
06:23
That's a lot of trainingkiképzés examplespéldák.
100
371363
2280
Az rengeteg gyakorló példa.
06:26
So insteadhelyette of focusingösszpontosítás solelykizárólag
on better and better algorithmsalgoritmusok,
101
374383
5989
Így a kizárólag az egyre jobb
algoritmusokra koncentrálás helyett,
06:32
my insightbepillantás was to give the algorithmsalgoritmusok
the kindkedves of trainingkiképzés dataadat
102
380372
5272
úgy éreztem, hogy az adatok begyakorlására
alkalmas algoritmusokat kellene adnom,
06:37
that a childgyermek was givenadott throughkeresztül experiencestapasztalatok
103
385644
3319
ahogy egy gyermeknek,
a tapasztalatokon keresztül
06:40
in bothmindkét quantitymennyiség and qualityminőség.
104
388963
3878
minőségben és mennyiségben egyaránt.
06:44
OnceEgyszer we know this,
105
392841
1858
Amint ezt felismertük,
06:46
we knewtudta we neededszükséges to collectgyűjt a dataadat setkészlet
106
394699
2971
rögtön tudtuk, hogy gyűjtenünk
kell egy adathalmazt,
06:49
that has farmessze more imagesképek
than we have ever had before,
107
397670
4459
ami sokkal több képet fog tartalmazni,
mint amennyivel valaha is rendelkeztünk,
06:54
perhapstalán thousandsTöbb ezer of timesalkalommal more,
108
402129
2577
talán több ezerszer többet,
06:56
and togetheregyütt with ProfessorProfesszor
KaiKai LiLi at PrincetonPrinceton UniversityEgyetem,
109
404706
4111
és Kai Li professzorral közösen
a Princeton Egyetemen,
07:00
we launchedindított the ImageNetImageNet projectprogram in 2007.
110
408817
4752
2007-ben elindítottuk
az ImageNet projektet.
07:05
LuckilySzerencsére, we didn't have to mounthegy
a camerakamera on our headfej
111
413569
3838
Szerencsére nem kellett
egy kamerát szerelnünk a fejünkre,
07:09
and wait for manysok yearsévek.
112
417407
1764
és évekig várni.
07:11
We wentment to the InternetInternet,
113
419171
1463
Felmentünk az Internetre,
07:12
the biggestlegnagyobb treasurekincs trovejogtalan eltulajdonítás of picturesképek
that humansemberek have ever createdkészítette.
114
420634
4436
a képek legnagyobb tárházára,
amit az emberek valaha létrehoztak.
07:17
We downloadedletöltve nearlyközel a billionmilliárd, ezermillió imagesképek
115
425070
3041
Majdnem egymilliárd képet töltöttünk le
07:20
and used crowdsourcingcrowdsourcing technologytechnológia
like the AmazonAmazon MechanicalMechanikus TurkTurk platformemelvény
116
428111
5880
és az Amazon Mechanical Turk
crowdsourcing technológiát használva
07:25
to help us to labelcímke these imagesképek.
117
433991
2339
felcímkéztük ezeket a képeket.
07:28
At its peakcsúcs, ImageNetImageNet was one of
the biggestlegnagyobb employersa munkáltatók
118
436330
4900
A csúcson az ImageNet volt
07:33
of the AmazonAmazon MechanicalMechanikus TurkTurk workersmunkások:
119
441230
2996
a Mechanical Turk egyik
legnagyobb foglalkoztatója:
07:36
togetheregyütt, almostmajdnem 50,000 workersmunkások
120
444226
3854
együttesen, majdnem 50 000 dolgozó
07:40
from 167 countriesországok around the worldvilág
121
448080
4040
a világ 167 országából
07:44
helpedsegített us to cleantiszta, sortfajta and labelcímke
122
452120
3947
segített nekünk kitisztítani,
rendszerezni és felcímkézni
07:48
nearlyközel a billionmilliárd, ezermillió candidatejelölt imagesképek.
123
456067
3575
majdnem egymilliárd kijelölt képet.
07:52
That was how much efforterőfeszítés it tookvett
124
460612
2653
Ilyen sok erőfeszítésbe került
07:55
to captureelfog even a fractiontöredék
of the imageryképek
125
463265
3900
csak egy töredékét rögzíteni
annak a képanyagnak,
07:59
a child'sgyermek mindelme takes in
in the earlykorai developmentalfejlődési yearsévek.
126
467165
4171
amit egy gyermek agya
a fejlődésének első éveiben befogad.
08:04
In hindsightutólag, this ideaötlet of usinghasználva bignagy dataadat
127
472148
3902
Utólag a "big data"
használatának az ötlete
08:08
to trainvonat computerszámítógép algorithmsalgoritmusok
maylehet seemlátszik obviousnyilvánvaló now,
128
476050
4550
a számítógépes algoritmusok tanítására
már nyilvánvalónak tűnhet,
08:12
but back in 2007, it was not so obviousnyilvánvaló.
129
480600
4110
de 2007-ben ez nem volt olyan kézenfekvő.
08:16
We were fairlymeglehetősen aloneegyedül on this journeyutazás
for quiteegészen a while.
130
484710
3878
Meglehetősen egyedül voltunk
ezen az úton egy jó darabig.
08:20
Some very friendlybarátságos colleagueskollégák advisedtanácsos me
to do something more usefulhasznos for my tenurebirtoklás,
131
488588
5003
Néhány kedves kollégám azt tanácsolta,
hogy hasznosabb dologgal töltsem az időmet
08:25
and we were constantlyállandóan strugglingküzdő
for researchkutatás fundingfinanszírozás.
132
493591
4342
és állandóan harcoltunk
a kutatási támogatásért.
Egyszer még azt is mondtam
viccesen a végzős diákjaimnak,
08:29
OnceEgyszer, I even jokedviccelődött to my graduateérettségizni studentsdiákok
133
497933
2485
08:32
that I would just reopenújbóli megnyitása
my dryszáraz cleaner'stisztító barátait shopüzlet to fundalap ImageNetImageNet.
134
500418
4063
hogy újranyitnám a ruhatisztító boltomat,
hogy az ImageNet-et támogassam.
08:36
After all, that's how I fundedtőkefedezeti
my collegefőiskola yearsévek.
135
504481
4761
Végül is, így finanszíroztam
a főiskolai éveimet.
08:41
So we carriedvégrehajtott on.
136
509242
1856
Tehát folytattuk.
08:43
In 2009, the ImageNetImageNet projectprogram deliveredszállított
137
511098
3715
2009-ben az ImageNet
08:46
a databaseadatbázis of 15 millionmillió imagesképek
138
514813
4042
egy 15 millió képből álló
adatbázist adott át,
08:50
acrossát 22,000 classesosztályok
of objectstárgyak and things
139
518855
4805
az objektumokat és dolgokat
22 000 osztályba sorolva,
08:55
organizedszervezett by everydayminden nap Englishangol wordsszavak.
140
523660
3320
mindennapos angol
szavak szerint elrendezve.
08:58
In bothmindkét quantitymennyiség and qualityminőség,
141
526980
2926
Minőségben és mennyiségben egyaránt
09:01
this was an unprecedentedpéldátlan scaleskála.
142
529906
2972
példátlan méretű.
09:04
As an examplepélda, in the caseügy of catsmacskák,
143
532878
3461
Például a macskák esetében,
09:08
we have more than 62,000 catsmacskák
144
536339
2809
több mint 62 000 képünk volt
09:11
of all kindsféle of looksúgy néz ki, and posespózok
145
539148
4110
mindenféle külsejű és pózoló
09:15
and acrossát all speciesfaj
of domesticbelföldi and wildvad catsmacskák.
146
543258
5223
minden fajta házi- és vadmacskákról.
09:20
We were thrilledizgalommal
to have put togetheregyütt ImageNetImageNet,
147
548481
3344
Le voltunk nyűgözve, hogy
együtt létrehoztuk az ImageNet-et,
09:23
and we wanted the wholeegész researchkutatás worldvilág
to benefithaszon from it,
148
551825
3738
és azt akartuk, hogy az egész
kutatási világ profitáljon ebből,
09:27
so in the TEDTED fashiondivat,
we openednyitott up the entireteljes dataadat setkészlet
149
555563
4041
így a TED módszerével hozzáférhetővé
tettük az egész adatállományt.
09:31
to the worldwidevilágszerte
researchkutatás communityközösség for freeingyenes.
150
559604
3592
az egész világ kutató
közösségének, ingyenesen.
09:36
(ApplauseTaps)
151
564636
4000
(Taps)
09:41
Now that we have the dataadat
to nourishtáplálják our computerszámítógép brainagy,
152
569416
4538
Most, hogy már vannak adataink,
amit betápláljunk a számítógépeink agyába,
09:45
we're readykész to come back
to the algorithmsalgoritmusok themselvesmaguk.
153
573954
3737
készen állunk arra, hogy visszatérjünk
magukhoz az algoritmusokhoz.
09:49
As it turnedfordult out, the wealthjólét
of informationinformáció providedbiztosítani by ImageNetImageNet
154
577691
5178
Mint kiderült, az ImageNet által
biztosított információ értéke
09:54
was a perfecttökéletes matchmérkőzés to a particularkülönös classosztály
of machinegép learningtanulás algorithmsalgoritmusok
155
582869
4806
tökéletesen illeszkedett a gépi tanulási
algoritmusok egy bizonyos osztályához,
09:59
calledhívott convolutionalkonvolúciós neuralideg- networkhálózat,
156
587675
2415
amit konvolúciós neurális hálónak hívunk,
10:02
pioneeredúttörő by KunihikoKunihiko FukushimaFukushima,
GeoffGeoff HintonHinton, and YannYann LeCunLeCun
157
590090
5248
és aminek Kunihiko Fukushima, Geoff Hinton
és Yann LeCun voltak az úttörői
10:07
back in the 1970s and '80s.
158
595338
3645
régen az 1970-es és '80-as években.
10:10
Just like the brainagy consistsáll
of billionsmilliárdokat of highlymagasan connectedcsatlakoztatva neuronsneuronok,
159
598983
5619
Ahogyan az agyban egymáshoz szorosan
kapcsolódó idegsejtek milliárdjai vannak,
10:16
a basicalapvető operatingüzemeltetési unitegység in a neuralideg- networkhálózat
160
604602
3854
ugyanúgy egy neurális háló
operációs alapegysége
10:20
is a neuron-likeneuron-szerű nodecsomópont.
161
608456
2415
egy neuronszerű csomópont.
10:22
It takes inputbemenet from other nodescsomópontok
162
610871
2554
Ez bemenő adatokat fogad
más csomópontoktól
10:25
and sendsküld outputkibocsátás to othersmások.
163
613425
2718
és kimenő adatokat küld a többinek.
10:28
MoreoverTovábbá, these hundredsszáz of thousandsTöbb ezer
or even millionsTöbb millió of nodescsomópontok
164
616143
4713
Ezen kívül, ez a több százezer
vagy akár több millió csomópont
10:32
are organizedszervezett in hierarchicalhierarchikus layersrétegek,
165
620856
3227
hierarchikus rétegekbe szerveződött,
10:36
alsois similarhasonló to the brainagy.
166
624083
2554
az agyhoz hasonlóan.
10:38
In a typicaltipikus neuralideg- networkhálózat we use
to trainvonat our objecttárgy recognitionelismerés modelmodell,
167
626637
4783
A tárgyfelismerési modellünk
tanítására használt tipikus hálózat
10:43
it has 24 millionmillió nodescsomópontok,
168
631420
3181
24 millió csomópontot,
10:46
140 millionmillió parametersparaméterek,
169
634601
3297
140 millió paramétert
10:49
and 15 billionmilliárd, ezermillió connectionskapcsolatok.
170
637898
2763
és 15 milliárd kapcsolatot tartalmaz.
10:52
That's an enormoushatalmas modelmodell.
171
640661
2415
Ez egy hatalmas modell.
10:55
PoweredPowered by the massivetömeges dataadat from ImageNetImageNet
172
643076
3901
E hatalmas modell tanításához használt
óriási ImageNet-es adatmennyiségnek,
10:58
and the modernmodern CPUsCPU-k and GPUsGPU
to trainvonat suchilyen a humongoushumongous modelmodell,
173
646977
5433
valamint a modern processzoroknak
köszönhetően
11:04
the convolutionalkonvolúciós neuralideg- networkhálózat
174
652410
2369
a konvolúciós neurális háló
11:06
blossomedvirágzott in a way that no one expectedvárt.
175
654779
3436
senki által nem remélt iramban fejlődött.
11:10
It becamelett the winningnyerő architectureépítészet
176
658215
2508
Ez lett a nyerő architektúra,
11:12
to generategenerál excitingizgalmas newúj resultstalálatok
in objecttárgy recognitionelismerés.
177
660723
5340
ami izgalmas új eredményeket hozott
az objektumfelismerésben.
11:18
This is a computerszámítógép tellingsokatmondó us
178
666063
2810
Ez egy számítógép, amely megmondja nekünk,
11:20
this picturekép containstartalmaz a catmacska
179
668873
2300
hogy ezen a képen egy macska látható
11:23
and where the catmacska is.
180
671173
1903
és hogy a macska hol van.
11:25
Of coursetanfolyam there are more things than catsmacskák,
181
673076
2112
Természetesen ott nem csak macskák vannak,
11:27
so here'sitt a computerszámítógép algorithmalgoritmus tellingsokatmondó us
182
675188
2438
ezért itt van egy számítógépes algoritmus,
ami megmondja,
11:29
the picturekép containstartalmaz
a boyfiú and a teddyMaci bearmedve;
183
677626
3274
hogy a képen egy fiú
és egy teddy maci is van;
11:32
a dogkutya, a personszemély, and a smallkicsi kitesárkány
in the backgroundháttér;
184
680900
4366
egy kutya, egy ember, és
egy kicsi papírsárkány a háttérben;
11:37
or a picturekép of very busyelfoglalt things
185
685266
3135
vagy nagyon mozgalmas dolgoknak egy képe
11:40
like a man, a skateboardgördeszka,
railingskorlátok, a lampostlampost, and so on.
186
688401
4644
mint egy férfi, egy gördeszka, korlátok,
egy lámpaoszlop és így tovább.
11:45
SometimesNéha, when the computerszámítógép
is not so confidentmagabiztos about what it seeslát,
187
693045
5293
Néha, amikor a számítógép nem biztos
benne, hogy mit lát,
megtanítottuk arra, hogy
kellő biztonsággal válaszoljon,
11:51
we have taughttanított it to be smartOkos enoughelég
188
699498
2276
11:53
to give us a safebiztonságos answerválasz
insteadhelyette of committingelkövetése too much,
189
701774
3878
anélkül, hogy túl határozott lenne,
11:57
just like we would do,
190
705652
2811
éppúgy, ahogy mi tennénk
12:00
but other timesalkalommal our computerszámítógép algorithmalgoritmus
is remarkablefigyelemre méltó at tellingsokatmondó us
191
708463
4666
Máskor viszont az algoritmusunk
figyelemre méltó pontossággal közli.
12:05
what exactlypontosan the objectstárgyak are,
192
713129
2253
hogy milyen tárgyakat lát,
12:07
like the make, modelmodell, yearév of the carsautók.
193
715382
3436
mint az autók gyártmánya,
modellje, évjárata.
12:10
We appliedalkalmazott this algorithmalgoritmus to millionsTöbb millió
of GoogleGoogle StreetUtca ViewNézet imagesképek
194
718818
5386
Ezt az algoritmust alkalmaztuk
a Google több millió utcaképére
12:16
acrossát hundredsszáz of AmericanAmerikai citiesvárosok,
195
724204
3135
amerikai városok százairól
12:19
and we have learnedtanult something
really interestingérdekes:
196
727339
2926
és valami igazán érdekeset tapasztaltunk:
12:22
first, it confirmedmegerősített our commonközös wisdombölcsesség
197
730265
3320
először is, alátámasztotta
a mindennapi bölcsességünket,
12:25
that carautó pricesárak correlatekorrelál very well
198
733585
3290
hogy a kocsiárak nagyon szoros
összefüggésben vannak
12:28
with householdháztartás incomesjövedelmek.
199
736875
2345
a háztartási jövedelmekkel.
12:31
But surprisinglymeglepően, carautó pricesárak
alsois correlatekorrelál well
200
739220
4527
De meglepő módon, szoros
összefüggésben vannak
12:35
with crimebűn ratesárak in citiesvárosok,
201
743747
2300
a bűnözési rátával a városokban,
12:39
or votingszavazás patternsminták by zippostai irányítószám codeskódok.
202
747007
3963
valamint az irányítószámok szerinti
szavazási mintákkal.
Na, álljunk csak meg egy percre!.
Mi történik itt?
12:44
So wait a minuteperc. Is that it?
203
752060
2206
12:46
Has the computerszámítógép alreadymár matchedpárosított
or even surpassedmeghaladta a humanemberi capabilitiesképességek?
204
754266
5153
A számítógép már elérte vagy
még felül is múlta az emberi képességeket?
12:51
Not so fastgyors.
205
759419
2138
Azért csak lassan a testtel!
12:53
So farmessze, we have just taughttanított
the computerszámítógép to see objectstárgyak.
206
761557
4923
Mindeddig, csak azt tanítottuk meg a
számítógépeknek, hogy lássák a tárgyakat.
12:58
This is like a smallkicsi childgyermek
learningtanulás to utterkimondani a fewkevés nounsfőnevek.
207
766480
4644
Ez olyan, mint amikor egy kis gyermek
megtanul kimondani néhány főnevet.
13:03
It's an incrediblehihetetlen accomplishmentteljesítmény,
208
771124
2670
Ez egy hihetetlen teljesítmény,
13:05
but it's only the first steplépés.
209
773794
2460
de csak az első lépés.
13:08
SoonHamarosan, anotheregy másik developmentalfejlődési
milestonemérföldkő will be hittalálat,
210
776254
3762
Nemsokára elérünk a fejlődés
egy másik mérföldkövéhez,
13:12
and childrengyermekek beginkezdődik
to communicatekommunikálni in sentencesmondatok.
211
780016
3461
és a gyerekek elkezdenek
mondatokban kommunikálni.
13:15
So insteadhelyette of sayingmondás
this is a catmacska in the picturekép,
212
783477
4224
Így ahelyett, hogy
"ez egy macska a képen",
13:19
you alreadymár heardhallott the little girllány
tellingsokatmondó us this is a catmacska lyingfekvő on a bedágy.
213
787701
5202
már azt hallották a kislánytól, hogy
"egy macska fekszik egy ágyon".
13:24
So to teachtanít a computerszámítógép
to see a picturekép and generategenerál sentencesmondatok,
214
792903
5595
Ahhoz, hogy egy számítógépet megtanítsunk
képeket látni és mondatokat alkotni,
13:30
the marriageházasság betweenközött bignagy dataadat
and machinegép learningtanulás algorithmalgoritmus
215
798498
3948
a big data technika és a gépi tanulási
algoritmusok együttesének
13:34
has to take anotheregy másik steplépés.
216
802446
2275
eggyel tovább kell lépnie.
13:36
Now, the computerszámítógép has to learntanul
from bothmindkét picturesképek
217
804721
4156
A számítógépnek
képesnek kell lennie mind képekből,
13:40
as well as naturaltermészetes languagenyelv sentencesmondatok
218
808877
2856
mind pedig emberek által alkotott
13:43
generatedgenerált by humansemberek.
219
811733
3322
természetes nyelvi mondatokból tanulni.
13:47
Just like the brainagy integratesintegrál
visionlátomás and languagenyelv,
220
815055
3853
Annak mintájára, ahogy az agy
egyesíti a látást a nyelvvel,
13:50
we developedfejlett a modelmodell
that connectsösszeköt partsalkatrészek of visualvizuális things
221
818908
5201
kifejlesztettünk egy modellt, ami
összekapcsolja a látható dolgok részeit
13:56
like visualvizuális snippetstöredék
222
824109
1904
vizuális töredékekként,
13:58
with wordsszavak and phrasesmondatok in sentencesmondatok.
223
826013
4203
szavakkal és kifejezésekkel a mondatokban.
14:02
About fournégy monthshónap agoezelőtt,
224
830216
2763
Körülbelül négy hónappal ezelőtt
14:04
we finallyvégül tiedkötött all this togetheregyütt
225
832979
2647
végül mindezt összekötöttük
14:07
and producedelőállított one of the first
computerszámítógép visionlátomás modelsmodellek
226
835626
3784
és megalkottuk az első
számítógép látómodellek egyikét,
14:11
that is capableképes of generatinggeneráló
a human-likeemberféle sentencemondat
227
839410
3994
amely képes létrehozni
egy emberihez hasonló mondatot,
14:15
when it seeslát a picturekép for the first time.
228
843404
3506
amikor először lát egy képet.
14:18
Now, I'm readykész to showelőadás you
what the computerszámítógép saysmondja
229
846910
4644
Nos, készen állok bemutatni önöknek,
hogy mit mond a számítógép,
14:23
when it seeslát the picturekép
230
851554
1975
amikor látja a képet
14:25
that the little girllány saw
at the beginningkezdet of this talk.
231
853529
3830
amit a kislány látott az előadás elején.
14:31
(VideoVideóinak) ComputerSzámítógép: A man is standingálló
nextkövetkező to an elephantelefánt.
232
859519
3344
(Video) Számítógép:
Egy férfi áll egy elefánt mellett.
14:36
A largenagy airplanerepülőgép sittingülés on topfelső
of an airportrepülőtér runwaykifutópálya.
233
864393
3634
Egy nagy repülőgép ül
egy reptéri kifutópálya tetején.
14:41
FFLFFL: Of coursetanfolyam, we're still workingdolgozó hardkemény
to improvejavul our algorithmsalgoritmusok,
234
869057
4212
FFL: Természetesen még sokat kell
dolgoznunk az algoritmusunk fejlesztésén,
14:45
and it still has a lot to learntanul.
235
873269
2596
és ez még sokat fog tanulni.
14:47
(ApplauseTaps)
236
875865
2291
(Taps)
14:51
And the computerszámítógép still makesgyártmányú mistakeshibák.
237
879556
3321
A számítógép még követ el hibákat.
14:54
(VideoVideóinak) ComputerSzámítógép: A catmacska lyingfekvő
on a bedágy in a blankettakaró.
238
882877
3391
(Videó) Számítógép: Egy macska fekszik
egy ágyon egy takaróban.
14:58
FFLFFL: So of coursetanfolyam, when it seeslát
too manysok catsmacskák,
239
886268
2553
FFL: Így természetesen,
amikor túl sok macskát lát,
15:00
it thinksazt hiszi everything
mightesetleg look like a catmacska.
240
888821
2926
azt gondolja, hogy
minden hasonlít egy macskára.
15:05
(VideoVideóinak) ComputerSzámítógép: A youngfiatal boyfiú
is holdingholding a baseballbaseball batdenevér.
241
893317
2864
(Videó) Számítógép:
Egy fiatal fiú tart egy baseball ütőt.
15:08
(LaughterNevetés)
242
896181
1765
(Nevetés)
15:09
FFLFFL: Or, if it hasn'tmég nem seenlátott a toothbrushfogkefe,
it confusesösszekever it with a baseballbaseball batdenevér.
243
897946
4583
FFL: Vagy, ha ez még nem látott fogkefét,
összetéveszti egy baseballütővel.
15:15
(VideoVideóinak) ComputerSzámítógép: A man ridinglovaglás a horse
down a streetutca nextkövetkező to a buildingépület.
244
903309
3434
(Videó) Számítógép: Egy férfi lovagol
lenn az utcán egy épület mellett.
15:18
(LaughterNevetés)
245
906743
2023
(Nevetés)
15:20
FFLFFL: We haven'tnincs taughttanított ArtArt 101
to the computersszámítógépek.
246
908766
3552
FFL: Még nem tanítottunk meg
a művészet alapjait a számítógépeknek.
15:25
(VideoVideóinak) ComputerSzámítógép: A zebraZebra standingálló
in a fieldmező of grass.
247
913768
2884
(Videó) Számítógép:
Egy zebra áll egy füves mezőn.
15:28
FFLFFL: And it hasn'tmég nem learnedtanult to appreciateméltányol
the stunninglenyűgöző beautyszépség of naturetermészet
248
916652
3367
FFL: És ez nem tanulta meg értékelni
a természet lenyűgöző szépségét
15:32
like you and I do.
249
920019
2438
mint önök és én.
15:34
So it has been a long journeyutazás.
250
922457
2832
Nos, ez egy hosszú út volt.
15:37
To get from agekor zeronulla to threehárom was hardkemény.
251
925289
4226
Nehéz volt eljutni
a nullától a három éves korig.
15:41
The realigazi challengekihívás is to go
from threehárom to 13 and farmessze beyondtúl.
252
929515
5596
Az igazi kihívás a háromtól a tizenháromig
jutni és annak a határain is túl.
15:47
Let me remindemlékeztet you with this picturekép
of the boyfiú and the caketorta again.
253
935111
4365
Hadd emlékeztessem önöket
a fiúnak és a tortának erre képére.
15:51
So farmessze, we have taughttanított
the computerszámítógép to see objectstárgyak
254
939476
4064
Mindez idáig, megtanítottuk
a számítógépet a tárgyakat látni
15:55
or even tell us a simpleegyszerű storysztori
when seeinglátás a picturekép.
255
943540
4458
vagy még egyszerű történeteket mondani
nekünk, mikor egy meglát egy képet.
15:59
(VideoVideóinak) ComputerSzámítógép: A personszemély sittingülés
at a tableasztal with a caketorta.
256
947998
3576
(Videó) Számítógép: Egy ember ül
egy asztalnál egy tortával.
16:03
FFLFFL: But there's so much more
to this picturekép
257
951574
2630
FFL: Azonban sokkal több
látható ezen a képen,
16:06
than just a personszemély and a caketorta.
258
954204
2270
nemcsak egy ember és egy torta.
16:08
What the computerszámítógép doesn't see
is that this is a specialkülönleges Italianolasz caketorta
259
956474
4467
Amit a számítógép nem lát az az,
hogy ez egy különleges olasz torta,
16:12
that's only servedszolgált duringalatt EasterHúsvét time.
260
960941
3217
amit csak Húsvétkor szolgálnak fel.
16:16
The boyfiú is wearingfárasztó his favoritekedvenc t-shirtpóló
261
964158
3205
A fiú a kedvenc pólóját viseli,
16:19
givenadott to him as a giftajándék by his fatherapa
after a triputazás to SydneySydney,
262
967363
3970
amit apukájától kapott ajándékba
egy Sydney-i kirándulás után,
és hogy önök és én mindannyian
meg látjuk, hogy milyen boldog,
16:23
and you and I can all tell how happyboldog he is
263
971333
3808
16:27
and what's exactlypontosan on his mindelme
at that momentpillanat.
264
975141
3203
és hogy pontosan mi járt a fejében
abban a pillanatban.
16:31
This is my sonfiú LeoLeo.
265
979214
3125
Ez a fiam Leo.
16:34
On my questQuest for visualvizuális intelligenceintelligencia,
266
982339
2624
A vizuális megértés utáni kutatásom során
16:36
I think of LeoLeo constantlyállandóan
267
984963
2391
állandóan Leora gondolok,
16:39
and the futurejövő worldvilág he will liveélő in.
268
987354
2903
és a jövőbeni világra, amiben élni fog.
16:42
When machinesgépek can see,
269
990257
2021
Amikor a gépek képesek lesznek látni,
16:44
doctorsorvosok and nursesápolók will have
extrakülön- pairspárok of tirelessfáradhatatlan eyesszemek
270
992278
4712
az orvosoknak és az ápolóknak
lesz egy plusz fáradhatatlan szempárjuk,
16:48
to help them to diagnosediagnosztizál
and take caregondoskodás of patientsbetegek.
271
996990
4092
amely segíteni fog a diagnózisban
és a betegeket ellátásában.
16:53
CarsAutók will runfuss smarterintelligensebb
and saferbiztonságosabb on the roadút.
272
1001082
4383
Az autók intelligensebben és
biztonságosabban fognak haladni az úton.
16:57
RobotsRobotok, not just humansemberek,
273
1005465
2694
A robotok, nem csak az emberek,
segíteni fognak nekünk
17:00
will help us to bravebátor the disasterkatasztrófa zoneszónák
to savementés the trappedcsapdába and woundedsebesült.
274
1008159
4849
katasztrófák helyszínén a csapdába
esettek és sérültek mentésében.
17:05
We will discoverfelfedez newúj speciesfaj,
better materialsanyagok,
275
1013798
3796
Új fajokat, jobb anyagokat
fogunk felfedezni,
17:09
and exploreFedezd fel unseenláthatatlan frontiershatárok
with the help of the machinesgépek.
276
1017594
4509
és felfedezünk ismeretlen
határterületeket a gépek segítségével.
17:15
Little by little, we're givingígy sightlátás
to the machinesgépek.
277
1023113
4167
Lassanként, látóképességet
adunk a gépeknek.
17:19
First, we teachtanít them to see.
278
1027280
2798
Először megtanítjuk őket látni.
17:22
Then, they help us to see better.
279
1030078
2763
Azután ők segítenek nekünk jobban látni.
17:24
For the first time, humanemberi eyesszemek
won'tszokás be the only onesazok
280
1032841
4165
Első alkalommal, nem az
emberi szemek lesznek az egyetlenek,
17:29
ponderingtöprengett and exploringfeltárása our worldvilág.
281
1037006
2934
melyek elmerengenek
és felfedezik a világot.
17:31
We will not only use the machinesgépek
for theirazok intelligenceintelligencia,
282
1039940
3460
Nem csak az intelligenciájukért
fogjuk használni a gépeket,
17:35
we will alsois collaborateegyüttműködik with them
in waysmódokon that we cannotnem tud even imagineKépzeld el.
283
1043400
6179
olyan módon is együtt fogunk működni
velük, amit még el sem tudunk képzelni.
17:41
This is my questQuest:
284
1049579
2161
Ez az én küldetésem:
17:43
to give computersszámítógépek visualvizuális intelligenceintelligencia
285
1051740
2712
vizuális intelligenciát
adni a számítógépeknek,
17:46
and to createteremt a better futurejövő
for LeoLeo and for the worldvilág.
286
1054452
5131
és egy jobb jövőt teremteni
Leo és világ számára.
17:51
Thank you.
287
1059583
1811
Köszönöm.
17:53
(ApplauseTaps)
288
1061394
3785
(Taps)
Translated by Zsuzsa Vida
Reviewed by Csaba Lóki

▲Back to top

ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com