Fei-Fei Li: How we're teaching computers to understand pictures
Fei-Fei Li: Jak uczymy komputery rozumienia obrazów
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio
Double-click the English transcript below to play the video.
siedzący na łóżku.
sitting in a bed.
that are going on an airplane.
a three-year-old child
in a series of photos.
to learn about this world,
at one very important task:
jest już ekspertem:
zaawansowane bardziej niż kiedykolwiek.
technologically advanced than ever.
we make phones that talk to us
tworzymy telefony, które rozmawiają z nami
that can play only music we like.
grała tylko naszą ulubioną muzykę.
machines and computers
zaawansowane komputery
z tym zadaniem.
to give you a progress report
in our research in computer vision,
widzenia komputerowego,
and potentially revolutionary
i potencjalnie rewolucyjnych
który jeździ sam,
that can drive by themselves,
they cannot really tell the difference
on the road, which can be run over,
po której można przejechać,
which should be avoided.
który trzeba ominąć.
o bardzo dużej rozdzielczości,
sight to the blind.
jak przywrócić wzrok niewidomym.
the changes of the rainforests.
w lasach deszczowych.
is drowning in a swimming pool.
jeśli dziecko topi się w basenie.
an integral part of global life.
integralną częścią naszego życia.
that's far beyond what any human,
przekracza możliwości odbiorcze
a nawet grupy ludzi.
to that at this TED.
do tego swoją cegiełkę.
is still struggling at understanding
nadal nie umie sobie poradzić
tak ogromną ilością danych.
collectively as a society,
machines are still blind.
wciąż nie widzą.
a two-dimensional array of numbers
w dwuwymiarowy szereg liczb,
the same as to listen,
the same as to see,
to nie to samo co widzieć.
we really mean understanding.
mam na myśli rozumienie.
zajęło Matce Naturze
540 million years of hard work
processing apparatus of our brains,
za przetwarzanie wizualne,
from my Ph.D. at Caltech
od doktoratu w Caltech,
collaborators and students
współpracownikami i studentami
computer vision and machine learning.
komputerowe i systemy uczące się.
of artificial intelligence.
the machines to see just like we do:
inferring 3D geometry of things,
wskazać ich położenie w przestrzeni,
actions and intentions.
działania i intencje.
of people, places and things
o ludziach, miejscach czy rzeczach
is to teach a computer to see objects,
komputer widzenia rzeczy,
imagine this teaching process
some training images
na przykład kotów,
from these training images.
na podstawie tych obrazów.
a collection of shapes and colors,
kształtów i kolorów.
in the early days of object modeling.
na początku modelowania obiektowego.
in a mathematical language
mówiliśmy algorytmowi komputerowemu,
a chubby body,
and viewpoint to the object model.
i punkt widzenia do modelu obiektu.
as a household pet
jak zwierzę domowe
of variations to the object model,
wersji modelowi obiektu,
changed my thinking.
mój sposób myślenia.
real-world experiences and examples.
doświadczanie świata.
about every 200 milliseconds,
hundreds of millions of pictures
dziecko może zobaczyć
on better and better algorithms,
na ulepszaniu algorytmów,
the kind of training data
podobne do tych,
poznające świat,
jak i jakościowym.
than we have ever had before,
Kai Li at Princeton University,
z uniwersytetu Princeton
a camera on our head
montować aparatu na głowie
that humans have ever created.
jaką człowiek kiedykolwiek stworzył.
like the Amazon Mechanical Turk platform
Amazon Mechanical Turk,
the biggest employers
najwięcej pracowników
of the imagery
in the early developmental years.
we wczesnych latach rozwoju.
may seem obvious now,
może wydawać się teraz oczywisty,
for quite a while.
byliśmy w tej podróży sami.
to do something more useful for my tenure,
żebym zrobiła coś bardziej użytecznego
for research funding.
z brakiem funduszy.
z moimi studentami,
my dry cleaner's shop to fund ImageNet.
żeby sfinansować ImageNet.
my college years.
sfinansowałam swoje studia.
of objects and things
obiektów i rzeczy
of domestic and wild cats.
z najróżniejszych gatunków.
to have put together ImageNet,
stworzeniem ImageNet,
to benefit from it,
mógł z tego projektu korzystać,
we opened up the entire data set
udostępniliśmy wszystkie dane
research community for free.
to nourish our computer brain,
komputerowego mózgu,
to the algorithms themselves.
of information provided by ImageNet
dostarczonych przez ImageNet
of machine learning algorithms
algorytmów systemów uczących się,
Geoff Hinton, and Yann LeCun
Geoffa Hintona oraz Yanna LeCuna
of billions of highly connected neurons,
połączonych ze sobą komórek nerwowych,
w sieci neuronowej
or even millions of nodes
to train our object recognition model,
to train such a humongous model,
procesorom CPU i GPU
in object recognition.
w dziedzinie rozpoznawania obrazów.
a boy and a teddy bear;
i pluszowego misia;
in the background;
railings, a lampost, and so on.
deskorolka, poręcz, latarnia.
is not so confident about what it sees,
nie jest pewien tego, co widzi,
instead of committing too much,
is remarkable at telling us
potrafi nad wyraz precyzyjnie określić,
i rok produkcji samochodu.
of Google Street View images
do milionów zdjęć z Google Street View
really interesting:
popularny pogląd
also correlate well
że ceny samochodów wiążą się też
or even surpassed human capabilities?
ludzkim możliwościom,
the computer to see objects.
widzieć przedmioty.
learning to utter a few nouns.
które nauczyło się pierwszych słów.
milestone will be hit,
to communicate in sentences.
this is a cat in the picture,
nie mówi, że na zdjęciu jest kot,
telling us this is a cat lying on a bed.
to see a picture and generate sentences,
patrzenia na zdjęcia i tworzenia zdań,
and machine learning algorithm
i algorytmu systemów uczących się
from both pictures
zarówno ze zdjęć,
vision and language,
that connects parts of visual things
który łączy fragmenty rzeczy,
computer vision models
widzenia komputerowego,
a human-like sentence
what the computer says
at the beginning of this talk.
z początku tej prelekcji.
next to an elephant.
Człowiek stoi obok słonia.
of an airport runway.
to improve our algorithms,
nad poprawieniem naszych algorytmów
Kot na łóżku zawinięty w koc.
on a bed in a blanket.
too many cats,
might look like a cat.
is holding a baseball bat.
Chłopczyk trzyma kij baseballowy.
it confuses it with a baseball bat.
szczoteczki do zębów,
down a street next to a building.
konno po ulicy obok budynku.
to the computers.
komputera podstaw sztuki.
in a field of grass.
the stunning beauty of nature
do 3 lat było trudne.
from three to 13 and far beyond.
przejście od 3 lat do 13 i dalej.
of the boy and the cake again.
zdjęcie chłopca z tortem.
dostrzegać przedmioty,
the computer to see objects
when seeing a picture.
na podstawie zdjęcia.
at a table with a cake.
Osoba przy stole z tortem
to this picture
is that this is a special Italian cake
że ten tort to włoski przysmak,
after a trip to Sydney,
w tym momencie szczęśliwy
at that moment.
w którym będzie żył.
extra pairs of tireless eyes
dodatkową parę niezmęczonych oczu,
and take care of patients.
and safer on the road.
to save the trapped and wounded.
na obszarach dotkniętych przez katastrofy.
better materials,
with the help of the machines.
dzięki pomocy maszyn.
to the machines.
won't be the only ones
nie będą jedynymi,
for their intelligence,
nie tylko dla ich inteligencji.
in ways that we cannot even imagine.
trudno sobie teraz wyobrazić.
for Leo and for the world.
dla Leo i dla świata.
ABOUT THE SPEAKER
Fei-Fei Li - Computer scientistAs Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.
Why you should listen
Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.
Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.
Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers.
Fei-Fei Li | Speaker | TED.com