Fei-Fei Li: How we're teaching computers to understand pictures
Fei-Fei Li: Come insegniamo ai computer a capire immagini
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio
Double-click the English transcript below to play the video.
sitting in a bed.
that are going on an airplane.
che salgono su un aereo.
a three-year-old child
che vede nelle foto.
in a series of photos.
to learn about this world,
at one very important task:
un compito importante:
società è più sviluppata che mai.
technologically advanced than ever.
creiamo cellulari che ci parlano
we make phones that talk to us
that can play only music we like.
per ascoltare la musica che ci piace.
machines and computers
e i dispositivi più avanzati
di svolgere questo compito.
un rapporto di avanzamento
to give you a progress report
in our research in computer vision,
ricerca sulla visione artificiale,
and potentially revolutionary
that can drive by themselves,
di auto che si guidano da sole,
they cannot really tell the difference
non riescono a distinguere fra
on the road, which can be run over,
strada che può essere investito
which should be avoided.
fotocamere con megapixel,
sight to the blind.
ancora ridato la vista ai ciechi.
grandi parti di terra,
the changes of the rainforests.
le variazioni delle foreste pluviali.
a circuito chiuso ovunque,
is drowning in a swimming pool.
un bambino sta affogando in una piscina.
an integral part of global life.
parte integrante della vita globale.
più veloce di quello che ogni uomo
that's far beyond what any human,
to that at this TED.
is still struggling at understanding
avanzato non riesce ancora a capire
collectively as a society,
intelligenti sono ancora cieche.
machines are still blind.
una matrice bidimensionale di numeri,
a two-dimensional array of numbers
the same as to listen,
the same as to see,
we really mean understanding.
540 million years of hard work
anni di duro lavoro a Madre Natura
dell'elaborazione ottica del cervello,
processing apparatus of our brains,
from my Ph.D. at Caltech
prima con il Ph.D al Caltech
mentori, collaboratori e studenti
collaborators and students
artificiale e apprendimento automatico.
computer vision and machine learning.
of artificial intelligence.
generale dell'intelligenza artificiale.
the machines to see just like we do:
alle macchine a vedere proprio come noi:
dedurre la geometria 3D degli oggetti,
inferring 3D geometry of things,
actions and intentions.
emozioni, azioni e intenzioni.
of people, places and things
di persone, luoghi e cose
is to teach a computer to see objects,
insegnare a un computer a vedere cose,
imagine this teaching process
questo processo d'insegnamento
some training images
from these training images.
impara da queste immagini.
un insieme di forme e colori,
a collection of shapes and colors,
in the early days of object modeling.
fase di realizzazione dei modelli.
con un linguaggio matematico
in a mathematical language
a chubby body,
faccia tonda, un corpo paffuto,
forma e punto di vista al modello.
and viewpoint to the object model.
as a household pet
come un animale domestico
of variations to the object model,
un numero infinito di variazioni,
changed my thinking.
e profonda ha cambiato il mio parere.
esperienze e esempi del mondo reale.
real-world experiences and examples.
about every 200 milliseconds,
un movimento dell'occhio.
vede centinaia di migliaia di immagini
hundreds of millions of pictures
solo su algoritmi sempre migliori,
on better and better algorithms,
agli algoritmi dati d'insegnamento
the kind of training data
un bambino ottiene con le esperienze
than we have ever had before,
Kai Li at Princeton University,
dell'Università di Princeton,
il progetto ImageNet nel 2007.
a camera on our head
montare una videocamera in testa
that humans have ever created.
che gli uomini abbiano mai creato.
quasi un miliardo d'immagini
like the Amazon Mechanical Turk platform
come Amazon Mechanical Turk
the biggest employers
uno dei maggiori datori di lavoro
pulire, smistare e etichettare
of the imagery
una frazione delle immagini
nei primi anni di sviluppo.
in the early developmental years.
may seem obvious now,
informatici forse oggi sembra ovvia,
stati soli in questo viaggio.
for quite a while.
fare qualcosa di più utile all'incarico
to do something more useful for my tenure,
difficoltà con il finanziamento.
for research funding.
la lavanderia per finanziare ImageNet.
my dry cleaner's shop to fund ImageNet.
ho finanziato i miei anni al college.
my college years.
of objects and things
di gatti domestici e selvatici.
of domestic and wild cats.
completamento di ImageNet,
to have put together ImageNet,
il mondo di ricerca ne beneficiasse,
to benefit from it,
aperto gratis tutto il set di dati
we opened up the entire data set
research community for free.
il cervello del nostro computer
to nourish our computer brain,
to the algorithms themselves.
d'informazioni di ImageNet
of information provided by ImageNet
di algoritmi di apprendimento automatico
of machine learning algorithms
Geoff Hinton, and Yann LeCun
Fukushima, Geoff Hinton e Yann LeCun
of billions of highly connected neurons,
di miliardi di neuroni ben collegati,
elementare in una rete neurale
di migliaia o persino milioni di nodi
or even millions of nodes
addestrare il modello di riconoscimento
to train our object recognition model,
per addestrare un modello così immenso,
to train such a humongous model,
che nessuno si aspettava.
in object recognition.
nel riconoscimento degli oggetti.
altre cose oltre ai gatti
un algoritmo informatico che ci dice
un ragazzo e un orsacchiotto;
a boy and a teddy bear;
un aquilone sullo sfondo;
in the background;
railings, a lampost, and so on.
ringhiere, un lampione e così via.
is not so confident about what it sees,
è tanto sicuro di quello che vede,
essere abbastanza intelligente
instead of committing too much,
sicura invece d'impegnarsi troppo,
dicono in modo eccezionale
is remarkable at telling us
anno delle macchine.
of Google Street View images
a tante immagini di Google Street View
una cosa molto interessante:
really interesting:
il nostro sapere comune
sono legati molto bene
delle auto siano legati bene anche
also correlate well
votazione con codici postali.
capacità dell'uomo o perfino migliori?
or even surpassed human capabilities?
the computer to see objects.
ai computer a vedere oggetti.
learning to utter a few nouns.
impara a pronunciare alcuni sostantivi.
milestone will be hit,
un'altra pietra miliare dello sviluppo
a comunicare con frasi.
to communicate in sentences.
this is a cat in the picture,
che c'è un gatto nella foto,
telling us this is a cat lying on a bed.
che è un gatto sdraiato sul letto.
to see a picture and generate sentences,
a vedere una foto e generare frasi,
and machine learning algorithm
algoritmo di apprendimento automatico
imparare sia dalle foto
from both pictures
vision and language,
integra lingua e visione,
that connects parts of visual things
che collega parti di oggetti ottici
modelli di visione artificiale
computer vision models
una frase tipo quella umana
a human-like sentence
una foto per la prima volta.
what the computer says
a mostrarvi cosa dice il computer
all'inizio di questa conferenza.
at the beginning of this talk.
vicino a un elefante.
next to an elephant.
sulla pista di un aeroporto.
of an airport runway.
per migliorare i nostri algoritmi
to improve our algorithms,
a letto con una coperta.
on a bed in a blanket.
too many cats,
somigli a un gatto.
might look like a cat.
is holding a baseball bat.
lo confonde con una mazza da baseball.
it confuses it with a baseball bat.
in una strada vicino a un edificio.
down a street next to a building.
insegnato l'Art. 101 ai computer.
to the computers.
in a field of grass.
la magnifica bellezza della natura
the stunning beauty of nature
all'età tre era faticoso.
da 3 a 13 e più lontano.
from three to 13 and far beyond.
of the boy and the cake again.
del bambino con la torta.
al computer a vedere oggetti
the computer to see objects
when seeing a picture.
storia quando vede un'immagine.
a tavola con una torta.
at a table with a cake.
to this picture
che è una torta italiana speciale
is that this is a special Italian cake
la sua t-shirt preferita
dopo un viaggio a Sidney,
after a trip to Sydney,
nella sua mente in quel momento.
at that moment.
dell'intelligenza ottica,
un paio extra di occhi instancabili
extra pairs of tireless eyes
and take care of patients.
con diagnosi e cura dei pazienti.
and safer on the road.
intelligenti e sicure sulla strada.
persone intrappolate e ferite.
to save the trapped and wounded.
specie, materiali migliori,
better materials,
with the help of the machines.
invisibili con l'aiuto delle macchine.
diamo la vista alle macchine.
to the machines.
won't be the only ones
gli occhi umani non saranno i soli
solo per la loro intelligenza,
for their intelligence,
in ways that we cannot even imagine.
in modi che neanche immaginiamo.
for Leo and for the world.
migliore per Leo e per il mondo.
ABOUT THE SPEAKER
Fei-Fei Li - Computer scientistAs Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.
Why you should listen
Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.
Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.
Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers.
Fei-Fei Li | Speaker | TED.com