Fei-Fei Li: How we're teaching computers to understand pictures
Fei-Fei Li: Si po i mësojmë kompjuterat të kuptojnë imazhet
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio
Double-click the English transcript below to play the video.
sitting in a bed.
mace e ulur në krevat.
that are going on an airplane.
një aeroplani.
a three-year-old child
tre-vjeçar
in a series of photos.
në një seri fotosh.
to learn about this world,
për të mësuar rreth botës,
at one very important task:
në një detyrë shumë të rëndësishme:
technologically advanced than ever.
avancuar teknologjikisht.
we make phones that talk to us
i bëjmë telefonat të komunikojnë me ne
that can play only music we like.
të luajnë muzikën që na pëlqen.
machines and computers
më të avancuar
to give you a progress report
një raport të ecurisë
in our research in computer vision,
në kërkimet tona në vizionin kompjuterik,
and potentially revolutionary
dhe potencialisht revolucionare
that can drive by themselves,
që vetë-drejtohen
they cannot really tell the difference
ato nuk mund ta gjejnë ndryshimin
on the road, which can be run over,
në rrugë, mbi të cilën mund të kalosh,
which should be avoided.
i cili duhet shmangur.
me rezolucion të lartë,
sight to the blind.
dhe mbi hapsira masive toke,
nuk është e mjaftueshme
the changes of the rainforests.
e pyjeve tropikale.
is drowning in a swimming pool.
është duke u mbytur në pishinë.
an integral part of global life.
e pandashme e jetës globale.
that's far beyond what any human,
shpejtë, sa është e pamundur që
t'i shohë të gjitha,
to that at this TED.
për këtë qëllim në TED.
is still struggling at understanding
e kanë të vështirë ta kuptojnë
informacioni.
collectively as a society,
bashkarisht si shoqëri,
machines are still blind.
janë akoma të verbra.
do të pyesnit ju.
a two-dimensional array of numbers
një matricë numrash
the same as to listen,
si ta kuptosh atë që dëgjon,
the same as to see,
njësoj si të shohësh,
we really mean understanding.
dhe të kuptuarin e asaj që shohim.
540 million years of hard work
540 milionë vjet
processing apparatus of our brains,
përpunimit vizual në trurin tonë,
from my Ph.D. at Caltech
doktoraturën në Caltech
në Stanford,
collaborators and students
dhe studentët e mi
computer vision and machine learning.
computer vision dhe machine learning.
of artificial intelligence.
inteligjencës artificiale.
the machines to see just like we do:
kompjuterat të shohin ashtu si vetë ne:
inferring 3D geometry of things,
njerëz, t'i shohin gjërat me 3 dimensione,
actions and intentions.
veprimet dhe qëllimet.
of people, places and things
mbi njerëz, vende dhe sende
is to teach a computer to see objects,
t'i mësojmë kompjuterat të shohin objekte,
imagine this teaching process
imagjinojeni këtë proces
some training images
disa imazhe të një objekti të caktuar
from these training images.
dhe mëson nga këto imazhe.
a collection of shapes and colors,
një grumbull formash dhe ngjyrash,
in the early days of object modeling.
të modelimit të objekteve.
in a mathematical language
për t'i treguar algoritmit kompjuterik
a chubby body,
një trup topolak,
and viewpoint to the object model.
dhe këndvështrim tjetër modelit të objektit.
(Të qeshura)
as a household pet
sa një kafshë shtëpiake
of variations to the object model,
për të krijuar modelin e objektit,
changed my thinking.
ndryshoi mënyrën time të të menduarit.
real-world experiences and examples.
dhe shembujve.
about every 200 milliseconds,
lëvizjes së syrit.
hundreds of millions of pictures
një fëmijë ka parë qindra miliona foto
on better and better algorithms,
përmirësimi i algoritmave,
the kind of training data
algoritmat me atë tip të dhënash
një grup të dhënash
than we have ever had before,
seç mund të kemi patur ndonjëherë,
Kai Li at Princeton University,
Kai Li të Universitetit Princeton,
a camera on our head
një aparat fotografik në kokë
that humans have ever created.
që njerëzit kanë krijuar ndonjëherë.
like the Amazon Mechanical Turk platform
e kontributit të përbashkët online
të na ndihmuar në etiketimin e imazheve.
the biggest employers
punëdhënësit më të mëdhenj
të klasifikonim dhe të etiketonim
of the imagery
shëmbëlltyrës
in the early developmental years.
në vitet e para të zhvillimit
të "big data"
may seem obvious now,
mund të duket e qartë tani,
nuk ishte kaq e qartë.
for quite a while.
për mjaft kohë.
to do something more useful for my tenure,
këshilluan të bëja diçka më të vlefshme,
for research funding.
për financimin e kërkimeve.
me studentët e diplomuar
my dry cleaner's shop to fund ImageNet.
pastrimit kimik për të financuar ImageNet.
my college years.
të financoj dhe studimet e mia.
of objects and things
objektesh dhe gjërash
në Anglishten e përditshme.
of domestic and wild cats.
apo të egra.
to have put together ImageNet,
nga puna e bërë me ImageNet,
to benefit from it,
të përfitonte nga rezultatet,
we opened up the entire data set
ne ia ofruam të dhënat falas
research community for free.
to nourish our computer brain,
për të ushqyer trurin e kompjuterit,
to the algorithms themselves.
of information provided by ImageNet
nga ImageNet
of machine learning algorithms
kategori të veçantë algoritmesh
convolutional neural network,
Geoff Hinton, and Yann LeCun
Fukushima, Geoff Hinton, dhe Yann LeCun
of billions of highly connected neurons,
neurone të lidhura ngushtë,
neuronesh (neural network)
të tjerave.
or even millions of nodes
madje edhe miliona nyje
to train our object recognition model,
trajnuar modelin për njohjen e objekteve,
to train such a humongous model,
për trajnimin e nje modeli kaq të madh,
(convolutional neural network)
in object recognition.
në identifikimin e objekteve.
përvec maceve,
duke na treguar
a boy and a teddy bear;
dhe një arush teddy;
in the background;
të vogël në sfond;
railings, a lampost, and so on.
kangjella, e kështu me rradhë.
is not so confident about what it sees,
mjaft i sigurt për atë që sheh,
instead of committing too much,
më të sigurt, në vend që t'ia fusë kot
is remarkable at telling us
i jashtëzakonshëm kur na tregon
kemi të bëjmë,
të makinave.
of Google Street View images
imazhe të Google Street View
really interesting:
thotë dhe logjika
në përpjestim të drejtë
also correlate well
sipas kodeve postare.
or even surpassed human capabilities?
nivel madje dhe më lart se njeriu?
the computer to see objects.
të shohë objekte.
learning to utter a few nouns.
duke mësuar ca emra.
milestone will be hit,
tjetër i madh zhvillimi,
to communicate in sentences.
me fjali.
this is a cat in the picture,
se këtu në foto është një mace,
telling us this is a cat lying on a bed.
treguar se macja është shtrirë në krevat.
to see a picture and generate sentences,
të shohë një foto dhe të gjenerojë fjali,
and machine learning algorithm
dhe algoritmit
from both pictures
edhe nga imazhet
vision and language,
shikimin me gjuhën,
that connects parts of visual things
që lidh pjesë vizuale të objekteve
computer vision models
të vizionit kompjuterik
a human-like sentence
të ngjashme me ato që thonë njerëzit
what the computer says
se cfare thotë kompjuteri
at the beginning of this talk.
në fillim të kësaj bisede.
next to an elephant.
pranë një elefanti.
of an airport runway.
në një pistë aeroporti.
to improve our algorithms,
për përmirësimin e algoritmave tanë,
on a bed in a blanket.
në një krevat në një batanije.
too many cats,
might look like a cat.
mund të duket si mace.
is holding a baseball bat.
duke mbajtur një shkop bejzbolli.
it confuses it with a baseball bat.
e ngatërron atë me një shkop bejzbolli
down a street next to a building.
mbi kalë në një rrugë pranë një ndërtese.
to the computers.
kompjuterave.
in a field of grass.
qëndruar në një fushë me bar
the stunning beauty of nature
bukurinë mahnitëse të natyrës
nga mosha zero në tre.
from three to 13 and far beyond.
nga tre në 13 e më tej.
of the boy and the cake again.
të djalit me tortën.
the computer to see objects
të shohin sende
when seeing a picture.
të thjeshta duke parë një foto.
at a table with a cake.
pranë tavolinës me një tortë.
to this picture
is that this is a special Italian cake
se kjo është një tortë e vecantë italiane
after a trip to Sydney,
pas një udhëtimi ne Sidney,
se sa i lumtur është ai
at that moment.
në ato momente.
ku ai do të jetojë.
extra pairs of tireless eyes
një palë sy të palodhur shtesë
and take care of patients.
dhe të kujdesen për pacientët.
and safer on the road.
më inteligjente dhe më të sigurtë
to save the trapped and wounded.
e fatkeqësive, të shpëtojmë të plagosurit
better materials,
materiale më të mira,
with the help of the machines.
me ndihmën e kompjuterave
to the machines.
aftësinë për të parë.
më mirë.
won't be the only ones
nuk do të jenë të vetmit
for their intelligence,
vetëm për inteligjencën,
in ways that we cannot even imagine.
në mënyra që as nuk mund t'i imagjinojmë.
inteligjencë vizuale
for Leo and for the world.
për Leon dhe botën.
ABOUT THE SPEAKER
Fei-Fei Li - Computer scientistAs Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.
Why you should listen
Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.
Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.
Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers.
Fei-Fei Li | Speaker | TED.com