ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com
TED2015

Fei-Fei Li: How we're teaching computers to understand pictures

Fei-Fei Li: Jak uczymy komputery rozumienia obrazów

Filmed:
2,702,344 views

Kiedy małe dziecko patrzy na zdjęcie, potrafi wskazać proste elementy: "kot", "książka", "krzesło". Obecnie komputery też potrafią to zrobić. Ale co dalej? W porywającej prelekcji Fei-Fei Li, specjalistka w dziedzinie widzenia komputerowego, zdaje relację z obecnego stanu techniki - opisując m.in bazę 15 milionów zdjęć zbudowaną przez jej zespół w celu nauczenia komputerów rozumienia obrazu - i wskazuje kluczowe kwestie, które stoją jeszcze przed nami.
- Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio

Double-click the English transcript below to play the video.

00:14
Let me showpokazać you something.
0
2366
3738
Pokażę wam coś.
(Wideo) Dziewczynka: To jest kot
siedzący na łóżku.
00:18
(VideoWideo) GirlDziewczyna: Okay, that's a catkot
sittingposiedzenie in a bedłóżko.
1
6104
4156
Chłopiec głaszcze słonia.
00:22
The boychłopak is pettingpieszczoty the elephantsłoń.
2
10260
4040
00:26
Those are people
that are going on an airplanesamolot.
3
14300
4354
To są ludzie idący do samolotu.
00:30
That's a bigduży airplanesamolot.
4
18654
2810
Samolot jest duży.
00:33
Fei-FeiFei Fei LiLi: This is
a three-year-oldtrzyletni childdziecko
5
21464
2206
Fei-Fei Li: Tak trzyletnie dziecko
00:35
describingopisujące what she seeswidzi
in a seriesseria of photoszdjęcia.
6
23670
3679
opisuje, co widzi na zdjęciach.
00:39
She mightmoc still have a lot
to learnuczyć się about this worldświat,
7
27349
2845
Wielu rzeczy musi się jeszcze nauczyć,
00:42
but she's alreadyjuż an expertekspert
at one very importantważny taskzadanie:
8
30194
4549
ale w jednej dziedzinie
jest już ekspertem:
00:46
to make sensesens of what she seeswidzi.
9
34743
2846
rozumie, co widzi.
Technicznie nasze społeczeństwo jest
zaawansowane bardziej niż kiedykolwiek.
00:50
Our societyspołeczeństwo is more
technologicallytechnologicznie advancedzaawansowane than ever.
10
38229
4226
00:54
We sendwysłać people to the moonksiężyc,
we make phonestelefony that talk to us
11
42455
3629
Wysyłamy ludzi na Księżyc,
tworzymy telefony, które rozmawiają z nami
00:58
or customizedostosuj radioradio stationsstacje
that can playgrać only musicmuzyka we like.
12
46084
4946
i potrafimy sprawić, żeby stacja radiowa,
grała tylko naszą ulubioną muzykę.
01:03
YetJeszcze, our mostwiększość advancedzaawansowane
machinesmaszyny and computerskomputery
13
51030
4055
A jednak nawet najbardziej
zaawansowane komputery
01:07
still struggleborykać się at this taskzadanie.
14
55085
2903
ciągle nie mogą sobie poradzić
z tym zadaniem.
01:09
So I'm here todaydzisiaj
to give you a progresspostęp reportraport
15
57988
3459
Dzisiaj chciałabym opowiedzieć
01:13
on the latestnajnowszy advanceszaliczki
in our researchBadania in computerkomputer visionwizja,
16
61447
4047
o ostatnich osiągnięciach w dziedzinie
widzenia komputerowego,
01:17
one of the mostwiększość frontiergranica
and potentiallypotencjalnie revolutionaryrewolucyjny
17
65494
4161
jednej z najbardziej pionierskich
i potencjalnie rewolucyjnych
01:21
technologiestechnologie in computerkomputer sciencenauka.
18
69655
3206
technologii w informatyce.
Istnieje już prototyp samochodu,
który jeździ sam,
01:24
Yes, we have prototypedprototypy carssamochody
that can drivenapęd by themselvessami,
19
72861
4551
01:29
but withoutbez smartmądry visionwizja,
they cannotnie może really tell the differenceróżnica
20
77412
3853
ale bez umiejętności rozpoznawania obrazu
nie umie odróżnić
01:33
betweenpomiędzy a crumpledpogniecione paperpapier bagtorba
on the roadDroga, whichktóry can be runbiegać over,
21
81265
3970
zmiętej papierowej torby,
po której można przejechać,
01:37
and a rockskała that sizerozmiar,
whichktóry should be avoidedunikany.
22
85235
3340
od podobnej wielkości kamienia,
który trzeba ominąć.
01:41
We have madezrobiony fabulousfantastyczny megapixelmegapikseli cameraskamery,
23
89415
3390
Istnieją aparaty fotograficzne
o bardzo dużej rozdzielczości,
01:44
but we have not delivereddostarczone
sightwidok to the blindślepy.
24
92805
3135
ale nadal nie wiadomo,
jak przywrócić wzrok niewidomym.
01:48
DronesTrutnie can flylatać over massivemasywny landwylądować,
25
96420
3305
Drony mogą latać na dużych przestrzeniach,
01:51
but don't have enoughdość visionwizja technologytechnologia
26
99725
2134
ale nadal nie istnieje technologia,
01:53
to help us to tracktor
the changeszmiany of the rainforestslasy deszczowe.
27
101859
3461
która pomogłaby śledzić zmiany
w lasach deszczowych.
01:57
SecurityBezpieczeństwa cameraskamery are everywherewszędzie,
28
105320
2950
Kamery przemysłowe są wszędzie,
02:00
but they do not alertalarm us when a childdziecko
is drowningutonięcie in a swimmingpływanie poolbasen.
29
108270
5067
ale nie potrafią nas ostrzec,
jeśli dziecko topi się w basenie.
02:06
PhotosZdjęcia and videosfilmy wideo are becomingtwarzowy
an integralintegralną partczęść of globalświatowy life.
30
114167
5595
Zdjęcia i filmy video stały się
integralną częścią naszego życia.
02:11
They're beingistota generatedwygenerowany at a pacetempo
that's fardaleko beyondpoza what any humanczłowiek,
31
119762
4087
Ilość materiału, który powstaje,
przekracza możliwości odbiorcze
02:15
or teamszespoły of humansludzie, could hopenadzieja to viewwidok,
32
123849
2783
pojedynczego człowieka,
a nawet grupy ludzi.
02:18
and you and I are contributingprzyczynianie się
to that at this TEDTED.
33
126632
3921
Podczas TED dokładamy
do tego swoją cegiełkę.
02:22
YetJeszcze our mostwiększość advancedzaawansowane softwareoprogramowanie
is still strugglingwalczy at understandingzrozumienie
34
130553
5232
Najbardziej zaawansowane oprogramowanie
nadal nie umie sobie poradzić
02:27
and managingZarządzanie this enormousogromny contentzadowolony.
35
135785
3876
ze zrozumieniem i zarządzaniem
tak ogromną ilością danych.
02:31
So in other wordssłowa,
collectivelyłącznie as a societyspołeczeństwo,
36
139661
5272
Innymi słowy jako społeczeństwo
02:36
we're very much blindślepy,
37
144933
1746
jesteśmy niewidomi,
02:38
because our smartestnajmądrzejszy
machinesmaszyny are still blindślepy.
38
146679
3387
bo nasze najmądrzejsze maszyny
wciąż nie widzą.
02:43
"Why is this so hardciężko?" you maymoże askzapytać.
39
151526
2926
"Co w tym trudnego?" moglibyście zapytać.
02:46
CamerasKamery can take pictureskino like this one
40
154452
2693
Aparaty potrafią zrobić zdjęcie,
02:49
by convertingkonwersja lightsświatła into
a two-dimensionaldwuwymiarowy arrayszyk of numbersliczby
41
157145
3994
przekształcając światło
w dwuwymiarowy szereg liczb,
02:53
knownznany as pixelspikseli,
42
161139
1650
czyli w piksele.
02:54
but these are just lifelessmartwe numbersliczby.
43
162789
2251
Ale są to tylko liczby.
02:57
They do not carrynieść meaningznaczenie in themselvessami.
44
165040
3111
Nie niosą ze sobą znaczenia.
03:00
Just like to hearsłyszeć is not
the samepodobnie as to listen,
45
168151
4343
Słyszeć, to nie to samo co słuchać,
03:04
to take pictureskino is not
the samepodobnie as to see,
46
172494
4040
a robić zdjęcia,
to nie to samo co widzieć.
03:08
and by seeingwidzenie,
we really mean understandingzrozumienie.
47
176534
3829
Mówiąc o widzeniu,
mam na myśli rozumienie.
Zrealizowanie tego zadania
zajęło Matce Naturze
03:13
In factfakt, it tookwziął MotherMatka NatureNatura
540 millionmilion yearslat of hardciężko work
48
181293
6177
540 milionów lat ciężkiej pracy,
03:19
to do this taskzadanie,
49
187470
1973
a większość tego wysiłku włożyła
03:21
and much of that effortwysiłek
50
189443
1881
03:23
wentposzedł into developingrozwijanie the visualwizualny
processingprzetwarzanie apparatusaparatury of our brainsmózg,
51
191324
5271
w rozwój części mózgu odpowiedzialnej
za przetwarzanie wizualne,
03:28
not the eyesoczy themselvessami.
52
196595
2647
a nie w rozwój oczu.
03:31
So visionwizja beginszaczyna się with the eyesoczy,
53
199242
2747
Widzenie rozpoczyna się w oczach,
03:33
but it trulynaprawdę takes placemiejsce in the brainmózg.
54
201989
3518
ale tak naprawdę odbywa się w mózgu.
03:38
So for 15 yearslat now, startingstartowy
from my PhPH.D. at CaltechCaltech
55
206287
5060
Od 15 lat, zaczynając
od doktoratu w Caltech,
03:43
and then leadingprowadzący Stanford'sStanford VisionWizja LabLaboratorium,
56
211347
2926
przez prowadzenie Stanford Vision Lab,
03:46
I've been workingpracujący with my mentorsmentorzy,
collaboratorswspółpracownicy and studentsstudenci
57
214273
4396
pracowałam z moimi mentorami,
współpracownikami i studentami
03:50
to teachnauczać computerskomputery to see.
58
218669
2889
nad nauczeniem komputerów widzenia.
03:54
Our researchBadania fieldpole is callednazywa
computerkomputer visionwizja and machinemaszyna learninguczenie się.
59
222658
3294
Pole naszych badań to widzenie
komputerowe i systemy uczące się.
03:57
It's partczęść of the generalgenerał fieldpole
of artificialsztuczny intelligenceinteligencja.
60
225952
3878
Jest to część sztucznej inteligencji.
04:03
So ultimatelyostatecznie, we want to teachnauczać
the machinesmaszyny to see just like we do:
61
231000
5493
Chcemy, żeby maszyny widziały tak, jak my,
04:08
namingNazewnictwo objectsobiekty, identifyingidentyfikacji people,
inferringmający wpływ 3D geometryGeometria of things,
62
236493
5387
potrafiły nazwać rzeczy, rozpoznać ludzi,
wskazać ich położenie w przestrzeni,
04:13
understandingzrozumienie relationsrelacje, emotionsemocje,
actionsdziałania and intentionsintencje.
63
241880
5688
żeby rozumiały relacje, emocje,
działania i intencje.
04:19
You and I weavesplot togetherRazem entireCały storieshistorie
of people, placesmiejsca and things
64
247568
6153
Potrafimy opowiedzieć historię
o ludziach, miejscach czy rzeczach
04:25
the momentza chwilę we laykłaść our gazewzrok on them.
65
253721
2164
w momencie, kiedy na nie spojrzymy.
04:28
The first stepkrok towardsw kierunku this goalcel
is to teachnauczać a computerkomputer to see objectsobiekty,
66
256955
5583
Żeby osiągnąć ten cel, trzeba nauczyć
komputer widzenia rzeczy,
04:34
the buildingbudynek blockblok of the visualwizualny worldświat.
67
262538
3368
klocków, z których składa się świat.
04:37
In its simplestnajprostszy termswarunki,
imaginewyobrażać sobie this teachingnauczanie processproces
68
265906
4434
Wyobraźcie sobie ten proces uczenia
04:42
as showingseans the computerskomputery
some trainingtrening imagesobrazy
69
270340
2995
jako pokazywanie komputerom
04:45
of a particularszczególny objectobiekt, let's say catskoty,
70
273335
3321
zdjęć konkretnych obiektów,
na przykład kotów,
04:48
and designingprojektowanie a modelModel that learnsuczy się
from these trainingtrening imagesobrazy.
71
276656
4737
i tworzenie modelu
na podstawie tych obrazów.
04:53
How hardciężko can this be?
72
281393
2044
Czy to takie trudne?
04:55
After all, a catkot is just
a collectionkolekcja of shapeskształty and colorszabarwienie,
73
283437
4052
W końcu kot to tylko zbiór
kształtów i kolorów.
04:59
and this is what we did
in the earlywcześnie daysdni of objectobiekt modelingmodelowanie.
74
287489
4086
Tak właśnie traktowaliśmy obrazy
na początku modelowania obiektowego.
05:03
We'dChcielibyśmy tell the computerkomputer algorithmalgorytm
in a mathematicalmatematyczny languagejęzyk
75
291575
3622
Używając języka matematyki,
mówiliśmy algorytmowi komputerowemu,
05:07
that a catkot has a roundokrągły facetwarz,
a chubbyGruba bodyciało,
76
295197
3343
że kot ma okrągłą głowę, puchate ciało,
05:10
two pointypointy earsuszy, and a long tailogon,
77
298540
2299
szpiczaste uszy i długi ogon,
05:12
and that lookedspojrzał all fine.
78
300839
1410
i to brzmiało całkiem dobrze.
05:14
But what about this catkot?
79
302859
2113
Ale co zrobić z takim kotem?
05:16
(LaughterŚmiech)
80
304972
1091
(Śmiech)
05:18
It's all curledZakręcony up.
81
306063
1626
On jest cały poskręcany.
05:19
Now you have to addDodaj anotherinne shapekształt
and viewpointpunkt widokowy to the objectobiekt modelModel.
82
307689
4719
Teraz trzeba by dodać nowy kształt
i punkt widzenia do modelu obiektu.
05:24
But what if catskoty are hiddenukryty?
83
312408
1715
A jeśli koty będą schowane?
05:27
What about these sillygłupi catskoty?
84
315143
2219
Co zrobić z takimi kotami?
05:31
Now you get my pointpunkt.
85
319112
2417
Teraz rozumiecie.
05:33
Even something as simpleprosty
as a householdgospodarstwo domowe petzwierzę domowe
86
321529
3367
Nawet coś tak banalnego,
jak zwierzę domowe
05:36
can presentteraźniejszość an infinitenieskończony numbernumer
of variationswariacje to the objectobiekt modelModel,
87
324896
4504
może dostarczyć nieskończenie wielu
wersji modelowi obiektu,
05:41
and that's just one objectobiekt.
88
329400
2233
a to nadal tylko jeden obiekt.
05:44
So about eightosiem yearslat agotemu,
89
332573
2492
Osiem lat temu
05:47
a very simpleprosty and profoundgłęboki observationobserwacja
changedzmienione my thinkingmyślący.
90
335065
5030
proste spostrzeżenie zmieniło
mój sposób myślenia.
05:53
No one tellsmówi a childdziecko how to see,
91
341425
2685
Nikt nie mówi dziecku, jak ma widzieć,
05:56
especiallyszczególnie in the earlywcześnie yearslat.
92
344110
2261
szczególnie we wczesnym dzieciństwie.
05:58
They learnuczyć się this throughprzez
real-worldprawdziwy świat experienceswzruszenie religijne and examplesprzykłady.
93
346371
5000
Dzieci uczą się tego przez
doświadczanie świata.
06:03
If you considerrozważać a child'sdziecka eyesoczy
94
351371
2740
Jeśli potraktować dziecięce oczy
06:06
as a pairpara of biologicalbiologiczny cameraskamery,
95
354111
2554
jako parę biologicznych aparatów,
06:08
they take one pictureobrazek
about everykażdy 200 millisecondsmilisekund,
96
356665
4180
to robią one zdjęcie co 200 milisekund,
06:12
the averageśredni time an eyeoko movementruch is madezrobiony.
97
360845
3134
co jest średnim czasem ruchu oka.
06:15
So by agewiek threetrzy, a childdziecko would have seenwidziany
hundredssetki of millionsmiliony of pictureskino
98
363979
5550
Zanim skończy 3 lata,
dziecko może zobaczyć
setki milionów obrazów realnego świata.
06:21
of the realreal worldświat.
99
369529
1834
06:23
That's a lot of trainingtrening examplesprzykłady.
100
371363
2280
To bardzo dużo przykładów.
06:26
So insteadzamiast of focusingskupienie solelywyłącznie
on better and better algorithmsalgorytmy,
101
374383
5989
Zamiast skupiać się wyłącznie
na ulepszaniu algorytmów,
06:32
my insightwgląd was to give the algorithmsalgorytmy
the kinduprzejmy of trainingtrening datadane
102
380372
5272
wolałam podać im dane treningowe
podobne do tych,
06:37
that a childdziecko was givendany throughprzez experienceswzruszenie religijne
103
385644
3319
które otrzymuje małe dziecko
poznające świat,
06:40
in bothobie quantityilość and qualityjakość.
104
388963
3878
zarówno pod względem ilościowym,
jak i jakościowym.
06:44
OnceRaz we know this,
105
392841
1858
Kiedy się na to zdecydowaliśmy,
06:46
we knewwiedziałem we neededpotrzebne to collectzebrać a datadane setzestaw
106
394699
2971
wiedzieliśmy, że musimy zebrać
06:49
that has fardaleko more imagesobrazy
than we have ever had before,
107
397670
4459
dużo więcej zdjęć, niż mieliśmy dotąd,
06:54
perhapsmoże thousandstysiące of timesczasy more,
108
402129
2577
może nawet tysiące razy więcej.
06:56
and togetherRazem with ProfessorProfesor
KaiKai LiLi at PrincetonPrinceton UniversityUniwersytet,
109
404706
4111
W związku z tym razem z profesorem Kai Li
z uniwersytetu Princeton
07:00
we launcheduruchomiona the ImageNetImageNet projectprojekt in 2007.
110
408817
4752
w 2007 r. uruchomiliśmy projekt ImageNet.
07:05
LuckilyNa szczęście, we didn't have to mountuchwyt
a cameraaparat fotograficzny on our headgłowa
111
413569
3838
Na szczęście nie musieliśmy
montować aparatu na głowie
07:09
and wait for manywiele yearslat.
112
417407
1764
i czekać wiele lat.
07:11
We wentposzedł to the InternetInternet,
113
419171
1463
Skorzystaliśmy z Internetu,
07:12
the biggestnajwiększy treasureskarb troveskarb of pictureskino
that humansludzie have ever createdstworzony.
114
420634
4436
największej skarbnicy zdjęć,
jaką człowiek kiedykolwiek stworzył.
07:17
We downloadedpobrane nearlyprawie a billionmiliard imagesobrazy
115
425070
3041
Pobraliśmy blisko miliard zdjęć
07:20
and used crowdsourcingCrowdsourcing technologytechnologia
like the AmazonAmazon MechanicalMechaniczne TurkTurek platformPlatforma
116
428111
5880
i użyliśmy crowdsourcingowej platformy
Amazon Mechanical Turk,
07:25
to help us to labeletykieta these imagesobrazy.
117
433991
2339
żeby je opisać.
07:28
At its peakszczyt, ImageNetImageNet was one of
the biggestnajwiększy employerspracodawców
118
436330
4900
W szczytowym okresie ImageNet zatrudniał
najwięcej pracowników
07:33
of the AmazonAmazon MechanicalMechaniczne TurkTurek workerspracownicy:
119
441230
2996
na Amazon Mechanical Turk:
07:36
togetherRazem, almostprawie 50,000 workerspracownicy
120
444226
3854
razem prawie 50 000 osób
07:40
from 167 countrieskraje around the worldświat
121
448080
4040
ze 167 krajów
07:44
helpedpomógł us to cleanczysty, sortsortować and labeletykieta
122
452120
3947
pomagało nam posegregować i opisać
07:48
nearlyprawie a billionmiliard candidatekandydat imagesobrazy.
123
456067
3575
prawie miliard zdjęć.
07:52
That was how much effortwysiłek it tookwziął
124
460612
2653
Tak wiele wysiłku kosztowało
07:55
to capturezdobyć even a fractionfrakcja
of the imageryobrazowość
125
463265
3900
uchwycenie zaledwie ułamka zbioru obrazów,
07:59
a child'sdziecka mindumysł takes in
in the earlywcześnie developmentalrozwojowych yearslat.
126
467165
4171
które dziecięcy mózg przyswaja
we wczesnych latach rozwoju.
08:04
In hindsightperspektywy czasu, this ideapomysł of usingza pomocą bigduży datadane
127
472148
3902
Pomysł użycia dużej ilości danych
08:08
to trainpociąg computerkomputer algorithmsalgorytmy
maymoże seemwydać się obviousoczywisty now,
128
476050
4550
do uczenia algorytmu komputerowego,
może wydawać się teraz oczywisty,
08:12
but back in 2007, it was not so obviousoczywisty.
129
480600
4110
ale w 2007 roku taki nie był.
08:16
We were fairlydość alonesam on this journeypodróż
for quitecałkiem a while.
130
484710
3878
Przez dłuższy czas
byliśmy w tej podróży sami.
08:20
Some very friendlyprzyjazny colleagueskoledzy advisedzaleca me
to do something more usefulprzydatny for my tenuretenuta,
131
488588
5003
Kilku kolegów radziło mi nawet,
żebym zrobiła coś bardziej użytecznego
08:25
and we were constantlystale strugglingwalczy
for researchBadania fundingfinansowanie.
132
493591
4342
i ciągle zmagaliśmy się
z brakiem funduszy.
08:29
OnceRaz, I even jokedżartował to my graduateukończyć studentsstudenci
133
497933
2485
Zdarzyło mi się nawet żartować
z moimi studentami,
08:32
that I would just reopenOtwórz ponownie
my drysuchy cleaner'sCleaner jest shopsklep to fundfundusz ImageNetImageNet.
134
500418
4063
że otworzę znowu pralnię,
żeby sfinansować ImageNet.
08:36
After all, that's how I fundedfinansowane
my collegeSzkoła Wyższa yearslat.
135
504481
4761
Jakby nie było, tak właśnie
sfinansowałam swoje studia.
08:41
So we carriedrealizowane on.
136
509242
1856
Kontynuowaliśmy.
08:43
In 2009, the ImageNetImageNet projectprojekt delivereddostarczone
137
511098
3715
W 2009 roku ImageNet miał już bazę
08:46
a databaseBaza danych of 15 millionmilion imagesobrazy
138
514813
4042
15 milionów zdjęć
08:50
acrossprzez 22,000 classesklasy
of objectsobiekty and things
139
518855
4805
skategoryzowanych w 22 000 klas
obiektów i rzeczy
08:55
organizedzorganizowany by everydaycodziennie EnglishAngielski wordssłowa.
140
523660
3320
oznaczonych angielskimi słowami.
08:58
In bothobie quantityilość and qualityjakość,
141
526980
2926
Zarówno pod względem ilości, jak i jakości
09:01
this was an unprecedentedbez precedensu scaleskala.
142
529906
2972
ta baza była unikalna.
09:04
As an exampleprzykład, in the casewalizka of catskoty,
143
532878
3461
Na przykład
09:08
we have more than 62,000 catskoty
144
536339
2809
mieliśmy ponad 62 000 zdjęć kotów
09:11
of all kindsrodzaje of lookswygląda and posespozy
145
539148
4110
wszystkich rodzajów, w różnych pozach
09:15
and acrossprzez all speciesgatunki
of domestickrajowy and wilddziki catskoty.
146
543258
5223
kotów domowych i dzikich,
z najróżniejszych gatunków.
09:20
We were thrilledwstrząśnięty
to have put togetherRazem ImageNetImageNet,
147
548481
3344
Byliśmy tak podekscytowani
stworzeniem ImageNet,
09:23
and we wanted the wholecały researchBadania worldświat
to benefitzasiłek from it,
148
551825
3738
że chcieliśmy, aby cały naukowy świat
mógł z tego projektu korzystać,
09:27
so in the TEDTED fashionmoda,
we openedotwierany up the entireCały datadane setzestaw
149
555563
4041
więc, podobnie jak TED,
udostępniliśmy wszystkie dane
09:31
to the worldwidena calym swiecie
researchBadania communityspołeczność for freewolny.
150
559604
3592
za darmo.
09:36
(ApplauseAplauz)
151
564636
4000
(Brawa)
09:41
Now that we have the datadane
to nourishkarmić our computerkomputer brainmózg,
152
569416
4538
Mając dane do zasilenia
komputerowego mózgu,
09:45
we're readygotowy to come back
to the algorithmsalgorytmy themselvessami.
153
573954
3737
byliśmy gotowi wrócić do algorytmów.
09:49
As it turnedobrócony out, the wealthbogactwo
of informationInformacja providedopatrzony by ImageNetImageNet
154
577691
5178
Jak się okazało, bogactwo informacji
dostarczonych przez ImageNet
09:54
was a perfectidealny matchmecz to a particularszczególny classklasa
of machinemaszyna learninguczenie się algorithmsalgorytmy
155
582869
4806
doskonale odpowiadało konkretnej klasie
algorytmów systemów uczących się,
09:59
callednazywa convolutionalwielką neuralnerwowy networksieć,
156
587675
2415
a konkretnie sieciom neuronowym
10:02
pioneeredpionierem by KunihikoKunihiko FukushimaFukushima,
GeoffGeoff HintonHinton, and YannYann LeCunLeCun
157
590090
5248
zapoczątkowanym przez Kunihiko Fukushimę,
Geoffa Hintona oraz Yanna LeCuna
10:07
back in the 1970s and '80s.
158
595338
3645
w latach 70. i 80.
10:10
Just like the brainmózg consistsskłada się
of billionsmiliardy of highlywysoko connectedpołączony neuronsneurony,
159
598983
5619
Podobnie jak mózg składa się z miliardów
połączonych ze sobą komórek nerwowych,
10:16
a basicpodstawowy operatingoperacyjny unitjednostka in a neuralnerwowy networksieć
160
604602
3854
podstawową jednostką operacyjną
w sieci neuronowej
10:20
is a neuron-likeneuron jak nodewęzeł.
161
608456
2415
jest węzeł przypominający taki neuron.
10:22
It takes inputwkład from other nodeswęzły
162
610871
2554
Pobiera on dane wejściowe z innych węzłów
10:25
and sendswysyła outputwydajność to othersinni.
163
613425
2718
i przekazuje innym dane wyjściowe.
10:28
MoreoverPonadto, these hundredssetki of thousandstysiące
or even millionsmiliony of nodeswęzły
164
616143
4713
Co więcej te miliony węzłów
10:32
are organizedzorganizowany in hierarchicalhierarchiczne layerswarstwy,
165
620856
3227
są zorganizowane w hierarchiczne warstwy,
10:36
alsorównież similarpodobny to the brainmózg.
166
624083
2554
podobnie jak mózg.
10:38
In a typicaltypowy neuralnerwowy networksieć we use
to trainpociąg our objectobiekt recognitionuznanie modelModel,
167
626637
4783
W sieci neuronowej, której użyliśmy
10:43
it has 24 millionmilion nodeswęzły,
168
631420
3181
były 24 miliony węzłów,
10:46
140 millionmilion parametersparametry,
169
634601
3297
140 milionów parametrów,
10:49
and 15 billionmiliard connectionsznajomości.
170
637898
2763
i 15 miliardów połączeń.
10:52
That's an enormousogromny modelModel.
171
640661
2415
To jest olbrzymi model.
10:55
PoweredZasilanie by the massivemasywny datadane from ImageNetImageNet
172
643076
3901
Zasilona wielką ilością danych z ImageNet,
10:58
and the modernnowoczesny CPUsProcesory and GPUsKarty graficzne
to trainpociąg suchtaki a humongousHumongous modelModel,
173
646977
5433
działająca dzięki nowoczesnym
procesorom CPU i GPU
11:04
the convolutionalwielką neuralnerwowy networksieć
174
652410
2369
sieć neuronowa rozwinęła się w sposób,
11:06
blossomedrozkwitła in a way that no one expectedspodziewany.
175
654779
3436
którego nikt się nie spodziewał.
11:10
It becamestał się the winningzwycięski architecturearchitektura
176
658215
2508
Stała się najlepszą architekturą
11:12
to generateGenerować excitingekscytujący newNowy resultswyniki
in objectobiekt recognitionuznanie.
177
660723
5340
do osiągnięcia fascynujących rezultatów
w dziedzinie rozpoznawania obrazów.
11:18
This is a computerkomputer tellingwymowny us
178
666063
2810
Ten komputer mówi,
11:20
this pictureobrazek containszawiera a catkot
179
668873
2300
że na obrazku jest kot,
11:23
and where the catkot is.
180
671173
1903
i gdzie ten kot się znajduje.
11:25
Of coursekurs there are more things than catskoty,
181
673076
2112
Oczywiście koty to nie wszystko,
11:27
so here'soto jest a computerkomputer algorithmalgorytm tellingwymowny us
182
675188
2438
więc tutaj komputer mówi,
11:29
the pictureobrazek containszawiera
a boychłopak and a teddyTeddy bearNiedźwiedź;
183
677626
3274
że zdjęcie pokazuje chłopca
i pluszowego misia;
11:32
a dogpies, a personosoba, and a smallmały kitelatawiec
in the backgroundtło;
184
680900
4366
psa, osobę i mały latawiec w tle;
11:37
or a pictureobrazek of very busyzajęty things
185
685266
3135
albo zdjęcie pełne obiektów
11:40
like a man, a skateboarddeskorolka,
railingsbalustrady, a lampostobiektów takich, and so on.
186
688401
4644
takich jak mężczyzna,
deskorolka, poręcz, latarnia.
11:45
SometimesCzasami, when the computerkomputer
is not so confidentpewni about what it seeswidzi,
187
693045
5293
Czasami, jeśli komputer
nie jest pewien tego, co widzi,
11:51
we have taughtnauczony it to be smartmądry enoughdość
188
699498
2276
nauczyliśmy go udzielać
11:53
to give us a safebezpieczny answerodpowiedź
insteadzamiast of committingzobowiązanie się too much,
189
701774
3878
wymijających odpowiedzi,
11:57
just like we would do,
190
705652
2811
takich, jakich udzieliłby człowiek.
12:00
but other timesczasy our computerkomputer algorithmalgorytm
is remarkableznakomity at tellingwymowny us
191
708463
4666
Ale są też przypadki, kiedy algorytm
potrafi nad wyraz precyzyjnie określić,
12:05
what exactlydokładnie the objectsobiekty are,
192
713129
2253
jakie obiekty znajdują się na zdjęciu,
12:07
like the make, modelModel, yearrok of the carssamochody.
193
715382
3436
podając markę, model
i rok produkcji samochodu.
12:10
We appliedstosowany this algorithmalgorytm to millionsmiliony
of GoogleGoogle StreetUlica ViewWidok imagesobrazy
194
718818
5386
Zastosowaliśmy ten algorytm
do milionów zdjęć z Google Street View
12:16
acrossprzez hundredssetki of AmericanAmerykański citiesmiasta,
195
724204
3135
powstałych w setkach amerykańskich miast
12:19
and we have learnednauczyli something
really interestingciekawy:
196
727339
2926
i odkryliśmy coś interesującego.
12:22
first, it confirmedzatwardziały our commonpospolity wisdommądrość
197
730265
3320
Po pierwsze potwierdził się
popularny pogląd
12:25
that carsamochód pricesceny correlateskorelować very well
198
733585
3290
dotyczący relacji cen samochodów
12:28
with householdgospodarstwo domowe incomesdochodów.
199
736875
2345
i dochodu gospodarstw domowych.
12:31
But surprisinglyzaskakująco, carsamochód pricesceny
alsorównież correlateskorelować well
200
739220
4527
Co zaskakujące, okazało się,
że ceny samochodów wiążą się też
12:35
with crimeprzestępstwo ratesstawki in citiesmiasta,
201
743747
2300
ze skalą przestępczości w miastach,
12:39
or votinggłosowanie patternswzorce by zipzamek błyskawiczny codesKody.
202
747007
3963
czy schematami głosowania.
12:44
So wait a minutechwila. Is that it?
203
752060
2206
Ale zaraz, czy to już wszystko?
12:46
Has the computerkomputer alreadyjuż matcheddopasowane
or even surpassedprzekroczyła humanczłowiek capabilitiesmożliwości?
204
754266
5153
Czy komputer dorównał właśnie
ludzkim możliwościom,
a może nawet je przekroczył?
Nie tak szybko.
12:51
Not so fastszybki.
205
759419
2138
12:53
So fardaleko, we have just taughtnauczony
the computerkomputer to see objectsobiekty.
206
761557
4923
Na razie komputer nauczył się
widzieć przedmioty.
12:58
This is like a smallmały childdziecko
learninguczenie się to utterwypowiem a fewkilka nouns(indeks).
207
766480
4644
Można go porównać do małego dziecka,
które nauczyło się pierwszych słów.
13:03
It's an incredibleniesamowite accomplishmentosiągnięcie,
208
771124
2670
To niesamowite osiągnięcie,
13:05
but it's only the first stepkrok.
209
773794
2460
ale to tylko pierwszy krok.
13:08
SoonWkrótce, anotherinne developmentalrozwojowych
milestonekamień milowy will be hittrafienie,
210
776254
3762
Wkrótce kolejny milowy krok
13:12
and childrendzieci beginzaczynać
to communicatekomunikować się in sentenceszdań.
211
780016
3461
i dziecko nauczy się tworzyć zdania.
13:15
So insteadzamiast of sayingpowiedzenie
this is a catkot in the pictureobrazek,
212
783477
4224
Dziewczyna z początku prelekcji
nie mówi, że na zdjęciu jest kot,
13:19
you alreadyjuż heardsłyszał the little girldziewczyna
tellingwymowny us this is a catkot lyingkłamstwo on a bedłóżko.
213
787701
5202
tylko że kot leży na łóżku.
13:24
So to teachnauczać a computerkomputer
to see a pictureobrazek and generateGenerować sentenceszdań,
214
792903
5595
Żeby nauczyć komputer
patrzenia na zdjęcia i tworzenia zdań,
13:30
the marriagemałżeństwo betweenpomiędzy bigduży datadane
and machinemaszyna learninguczenie się algorithmalgorytm
215
798498
3948
połączenie danych
i algorytmu systemów uczących się
13:34
has to take anotherinne stepkrok.
216
802446
2275
musi posunąć się dalej.
13:36
Now, the computerkomputer has to learnuczyć się
from bothobie pictureskino
217
804721
4156
Teraz komputer musi uczyć się
zarówno ze zdjęć,
13:40
as well as naturalnaturalny languagejęzyk sentenceszdań
218
808877
2856
jak i ze zdań
13:43
generatedwygenerowany by humansludzie.
219
811733
3322
tworzonych przez ludzi.
13:47
Just like the brainmózg integratesintegruje
visionwizja and languagejęzyk,
220
815055
3853
Tak, jak mózg łączy wizję i język,
13:50
we developedrozwinięty a modelModel
that connectsłączy partsCzęści of visualwizualny things
221
818908
5201
rozwinęliśmy model,
który łączy fragmenty rzeczy,
13:56
like visualwizualny snippetssnippets
222
824109
1904
jak elementy wizualne,
13:58
with wordssłowa and phrasesZwroty in sentenceszdań.
223
826013
4203
z wyrazami i określeniami w zdaniach.
14:02
About fourcztery monthsmiesiące agotemu,
224
830216
2763
Cztery miesiące temu
14:04
we finallywreszcie tiedprzywiązane all this togetherRazem
225
832979
2647
w końcu połączyliśmy to wszystko razem
14:07
and producedwytworzony one of the first
computerkomputer visionwizja modelsmodele
226
835626
3784
i stworzyliśmy jeden z pierwszych modeli
widzenia komputerowego,
14:11
that is capablezdolny of generatinggenerowanie
a human-likepodobne do ludzi sentencezdanie
227
839410
3994
który umie tworzyć zdania
14:15
when it seeswidzi a pictureobrazek for the first time.
228
843404
3506
na temat pierwszy raz widzianego zdjęcia.
14:18
Now, I'm readygotowy to showpokazać you
what the computerkomputer saysmówi
229
846910
4644
Pokażę wam, co komputer powiedział,
14:23
when it seeswidzi the pictureobrazek
230
851554
1975
kiedy zobaczył zdjęcia,
14:25
that the little girldziewczyna saw
at the beginningpoczątek of this talk.
231
853529
3830
które widziała dziewczynka
z początku tej prelekcji.
14:31
(VideoWideo) ComputerKomputera: A man is standingna stojąco
nextNastępny to an elephantsłoń.
232
859519
3344
(Wideo) Komputer:
Człowiek stoi obok słonia.
14:36
A largeduży airplanesamolot sittingposiedzenie on topTop
of an airportLotnisko runwaypas startowy.
233
864393
3634
Duży samolot na pasie startowym.
14:41
FFLFFL: Of coursekurs, we're still workingpracujący hardciężko
to improveulepszać our algorithmsalgorytmy,
234
869057
4212
FFL: Oczywiście ciągle pracujemy
nad poprawieniem naszych algorytmów
14:45
and it still has a lot to learnuczyć się.
235
873269
2596
i one muszą się jeszcze sporo nauczyć.
14:47
(ApplauseAplauz)
236
875865
2291
(Brawa)
14:51
And the computerkomputer still makesczyni mistakesbłędy.
237
879556
3321
Komputer nadal popełnia błędy.
(Wideo) Komputer:
Kot na łóżku zawinięty w koc.
14:54
(VideoWideo) ComputerKomputera: A catkot lyingkłamstwo
on a bedłóżko in a blanketkoc.
238
882877
3391
14:58
FFLFFL: So of coursekurs, when it seeswidzi
too manywiele catskoty,
239
886268
2553
FFL: Jeśli widział zbyt wiele kotów,
15:00
it thinksmyśli everything
mightmoc look like a catkot.
240
888821
2926
wszystko zaczyna mu przypominać kota.
15:05
(VideoWideo) ComputerKomputera: A youngmłody boychłopak
is holdingtrzymać a baseballbaseball batnietoperz.
241
893317
2864
(Wideo) Komputer:
Chłopczyk trzyma kij baseballowy.
15:08
(LaughterŚmiech)
242
896181
1765
(Śmiech)
15:09
FFLFFL: Or, if it hasn'tnie ma seenwidziany a toothbrushSzczoteczka do zębów,
it confusesmyli it with a baseballbaseball batnietoperz.
243
897946
4583
FFL: Jeśli nie widział
szczoteczki do zębów,
myli ją z kijem baseballowym.
15:15
(VideoWideo) ComputerKomputera: A man ridingjazda konna a horsekoń
down a streetulica nextNastępny to a buildingbudynek.
244
903309
3434
(Wideo) Komputer: Mężczyzna jadący
konno po ulicy obok budynku.
15:18
(LaughterŚmiech)
245
906743
2023
(Śmiech)
15:20
FFLFFL: We haven'tnie mam taughtnauczony ArtSztuka 101
to the computerskomputery.
246
908766
3552
FFL: Nie nauczyliśmy jeszcze
komputera podstaw sztuki.
15:25
(VideoWideo) ComputerKomputera: A zebraZebra standingna stojąco
in a fieldpole of grasstrawa.
247
913768
2884
(Wideo) Komputer: Zebra na pastwisku.
15:28
FFLFFL: And it hasn'tnie ma learnednauczyli to appreciatedoceniać
the stunningoszałamiający beautypiękno of natureNatura
248
916652
3367
FFL: Nie umie też doceniać piękna natury,
15:32
like you and I do.
249
920019
2438
jak my.
15:34
So it has been a long journeypodróż.
250
922457
2832
To była długa droga.
15:37
To get from agewiek zerozero to threetrzy was hardciężko.
251
925289
4226
Przejście od wieku zero
do 3 lat było trudne.
15:41
The realreal challengewyzwanie is to go
from threetrzy to 13 and fardaleko beyondpoza.
252
929515
5596
Ale prawdziwym wyzwaniem jest
przejście od 3 lat do 13 i dalej.
15:47
Let me remindprzypominać you with this pictureobrazek
of the boychłopak and the cakeciasto again.
253
935111
4365
Pozwólcie, że przypomnę wam
zdjęcie chłopca z tortem.
Dotąd uczyliśmy komputer
dostrzegać przedmioty,
15:51
So fardaleko, we have taughtnauczony
the computerkomputer to see objectsobiekty
254
939476
4064
15:55
or even tell us a simpleprosty storyfabuła
when seeingwidzenie a pictureobrazek.
255
943540
4458
a nawet opowiedzieć krótką historię
na podstawie zdjęcia.
15:59
(VideoWideo) ComputerKomputera: A personosoba sittingposiedzenie
at a tablestół with a cakeciasto.
256
947998
3576
(Wideo) Komputer:
Osoba przy stole z tortem
16:03
FFLFFL: But there's so much more
to this pictureobrazek
257
951574
2630
FFL: Ale na tym zdjęciu widać dużo więcej,
16:06
than just a personosoba and a cakeciasto.
258
954204
2270
niż tylko osobę i tort.
16:08
What the computerkomputer doesn't see
is that this is a specialspecjalny ItalianWłoski cakeciasto
259
956474
4467
Komputer nie widzi,
że ten tort to włoski przysmak,
16:12
that's only servedserwowane duringpodczas EasterWielkanoc time.
260
960941
3217
serwowany tylko na Wielkanoc.
16:16
The boychłopak is wearingma na sobie his favoriteulubiony t-shirtpodkoszulek
261
964158
3205
Chłopiec ma na sobie ulubioną koszulkę,
16:19
givendany to him as a giftprezent by his fatherojciec
after a tripwycieczka to SydneySydney,
262
967363
3970
którą dziadek przywiózł mu z Sydney.
16:23
and you and I can all tell how happyszczęśliwy he is
263
971333
3808
Widać, jak bardzo jest
w tym momencie szczęśliwy
16:27
and what's exactlydokładnie on his mindumysł
at that momentza chwilę.
264
975141
3203
i co mu właśnie chodzi po głowie.
16:31
This is my sonsyn LeoLeo.
265
979214
3125
To mój syn, Leo.
16:34
On my questQuest for visualwizualny intelligenceinteligencja,
266
982339
2624
Podczas zmagań z wizualną inteligencją
16:36
I think of LeoLeo constantlystale
267
984963
2391
myślę bez przerwy o Leo
16:39
and the futureprzyszłość worldświat he will liverelacja na żywo in.
268
987354
2903
i o przyszłym świecie,
w którym będzie żył.
16:42
When machinesmaszyny can see,
269
990257
2021
W którym maszyny będą umiały widzieć,
16:44
doctorslekarze and nursespielęgniarki will have
extradodatkowy pairspary of tirelessniestrudzony eyesoczy
270
992278
4712
lekarze i pielęgniarki będą mieli
dodatkową parę niezmęczonych oczu,
16:48
to help them to diagnoserozpoznać chorobę
and take careopieka of patientspacjenci.
271
996990
4092
które będą pomagać w leczeniu pacjentów.
16:53
CarsSamochody will runbiegać smartermądrzejszy
and saferbezpieczniejsze on the roadDroga.
272
1001082
4383
Samochody będą bezpieczniejsze.
16:57
RobotsRoboty, not just humansludzie,
273
1005465
2694
Roboty, nie tylko ludzie,
17:00
will help us to braveodważny the disasterkatastrofa zonesstref
to savezapisać the trappeduwięziony and woundedranny.
274
1008159
4849
będą pomagać w poszukiwaniu rannych
na obszarach dotkniętych przez katastrofy.
17:05
We will discoverodkryć newNowy speciesgatunki,
better materialsmateriały,
275
1013798
3796
Odkryjemy nowe gatunki, lepsze materiały
17:09
and explorebadać unseenskryte frontiersgranic
with the help of the machinesmaszyny.
276
1017594
4509
i przekroczymy nieznane dotąd granice
dzięki pomocy maszyn.
17:15
Little by little, we're givingdający sightwidok
to the machinesmaszyny.
277
1023113
4167
Powoli dajemy wzrok maszynom.
17:19
First, we teachnauczać them to see.
278
1027280
2798
Najpierw uczymy je widzieć.
17:22
Then, they help us to see better.
279
1030078
2763
Potem one pomogą nam lepiej widzieć.
17:24
For the first time, humanczłowiek eyesoczy
won'tprzyzwyczajenie be the only oneste
280
1032841
4165
Po raz pierwszy ludzkie oczy
nie będą jedynymi,
17:29
ponderingzastanawiając się and exploringodkrywanie our worldświat.
281
1037006
2934
które odkrywają świat.
17:31
We will not only use the machinesmaszyny
for theirich intelligenceinteligencja,
282
1039940
3460
Będziemy używać maszyn
nie tylko dla ich inteligencji.
17:35
we will alsorównież collaboratewspółpracować with them
in wayssposoby that we cannotnie może even imaginewyobrażać sobie.
283
1043400
6179
Naszą współpracę z nimi
trudno sobie teraz wyobrazić.
17:41
This is my questQuest:
284
1049579
2161
To moje zadanie:
17:43
to give computerskomputery visualwizualny intelligenceinteligencja
285
1051740
2712
dać komputerom wizualną inteligencję
17:46
and to createStwórz a better futureprzyszłość
for LeoLeo and for the worldświat.
286
1054452
5131
i stworzyć lepszą przyszłość
dla Leo i dla świata.
17:51
Thank you.
287
1059583
1811
Dziękuję.
17:53
(ApplauseAplauz)
288
1061394
3785
(Brawa)
Translated by Beata Wasylkiewicz-Jagoda
Reviewed by Rysia Wand

▲Back to top

ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com