Joseph Redmon: How computers learn to recognize objects instantly
Joseph Redmon: Come un computer impara a riconoscere gli oggetti istantaneamente
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
pensavano
thought that getting a computer
between a cat and a dog
un gatto e un cane
in the state of artificial intelligence.
nel campo dell'intelligenza artificiale.
greater than 99 percent accuracy.
di precisione superiore al 99 per cento.
classificazione d'immagini --
put a label to that image --
etichettate quell'immagine --
thousands of other categories as well.
anche migliaia di altre categorie.
at the University of Washington,
della University of Washington,
chiamato Darknet,
computer vision models.
i modelli di visione artificiale.
la previsione di un cane o di un gatto,
a prediction of dog or cat,
specific breed predictions.
della razza specifica.
of granularity we have now.
un Alaskan Malamute.
in image classification,
nella classificazione di immagini,
il nostro classificatore
when we run our classifier
with a pretty similar prediction.
con una predizione abbastanza simile.
there is a malamute in the image,
c'è un Alaskan Malamute sull'immagine,
we don't actually know that much
non ne sappiamo poi molto
di più potente.
called object detection,
chiamato riconoscimento di oggetti,
and try to find all of the objects,
e cerchiamo di trovare gli oggetti,
when we run a detector on this image.
su quest'immagine.
with our computer vision algorithms.
di visione artificiale.
that there's a cat and a dog.
che ci sono un gatto e un cane.
informazioni extra.
on top of computer vision,
basato sulla visione artificiale,
or a robotic system,
o un sistema robotico,
of information that you want.
you can interact with the physical world.
con il mondo fisico.
sul riconoscimento di oggetti,
on object detection,
to process a single image.
per processare una sola immagine.
speed is so important in this domain,
la velocità in questo settore,
di un rilevatore di oggetti
to process an image.
per processare un'immagine.
it makes predictions,
fa le sue predizioni
by another factor of 10,
a cinque immagini al secondo.
at five frames per second.
movimento significativo,
like this driving my car.
mentre guido.
di riconoscimento
running in real time on my laptop.
sul mio computer.
as I move around the frame,
mentre mi muovo sull'immagine,
of changes in size,
cambiano la taglia,
abbiamo davvero bisogno
on top of computer vision.
basati sulla visione artificiale.
a thousand times faster.
mille volte più veloce.
object detection systems
di riconoscimento di oggetti
un'immagine come questa
in un insieme di regioni
on each of these regions,
su ognuna di queste regioni,
detections in the image.
come riconoscimenti nell'immagine.
thousands of times over an image,
migliaia di volte su un'immagine,
to produce detection.
per produrre il riconoscimento.
to do all of detection for us.
a fare tutto il riconoscimento per noi.
and class probabilities simultaneously.
e ordina le probabilità simultaneamente.
at an image thousands of times
un'immagine migliaia di volte
the YOLO method of object detection.
del riconoscimento d'oggetti.
we're not just limited to images;
non limitarci alle immagini;
in tempo reale.
that cat and dog,
il cane e il gatto,
and interact with each other.
e interagire tra loro.
che abbiamo allenato
like spoon and fork, bowl,
e forchetta, ciotola,
out into the audience
possiamo identificare.
our threshold for detection a little bit,
la nostra soglia di riconoscimento,
out in the audience.
in mezzo al pubblico.
dei segnali di stop.
is happening in real time
avviene in tempo reale
di riconoscimento di oggetti
object detection system,
per qualsiasi settore di immagini.
con pilota automatico,
cellule cancerose
already using this technology
che stanno già usando questa tecnologia
like medicine, robotics.
come la medicina, la robotica.
of animals in Nairobi National Park
degli animali al Nairobi National Park
of this detection system.
nel sistema di riconoscimento.
free for anyone to use.
e chiunque può utilizzarlo liberamente.
even more accessible and usable,
ancora più accessibile e fruibile,
of model optimization,
di ottimizzazione del modello,
running on a phone.
che funziona su un telefono.
now we have a pretty powerful solution
abbiamo una soluzione piuttosto efficace
di computer di basso livello,
and build something with it.
e costruirci qualcosa.
che hanno accesso a questo software,
with access to this software,
will build with this technology.
con questa tecnologia.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com