Joseph Redmon: How computers learn to recognize objects instantly
Joseph Redmon: Jak komputer uczy się błyskawicznie rozpoznawać obiekty
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
sądzili, że nauczenie komputera
thought that getting a computer
between a cat and a dog
in the state of artificial intelligence.
rozwoju sztucznej inteligencji.
greater than 99 percent accuracy.
z dokładnością większą niż 99%.
put a label to that image --
przypisz do niego etykietę...
thousands of other categories as well.
tysiące innych kategorii.
at the University of Washington,
na Uniwersytecie Waszyngtońskim
sieci neuronowej
computer vision models.
modeli rozpoznawania obrazów.
a prediction of dog or cat,
czy to pies czy kot,
specific breed predictions.
jest teraz dostępny.
of granularity we have now.
in image classification,
w klasyfikacji obrazów,
when we run our classifier
jeśli wprowadzimy taki obraz?
with a pretty similar prediction.
there is a malamute in the image,
we don't actually know that much
nie można dowiedzieć się wiele
co dzieje się na zdjęciu.
czegoś bardziej zaawansowanego.
called object detection,
and try to find all of the objects,
znaleźć wszystkie obiekty,
when we run a detector on this image.
ten obraz do detektora.
stosując nasze algorytmy.
with our computer vision algorithms.
that there's a cat and a dog.
że na zdjęciu jest kot i pies.
on top of computer vision,
na rozpoznawaniu obrazu,
or a robotic system,
lub manipulator robotyczny,
of information that you want.
you can interact with the physical world.
ze światem fizycznym.
nad wykrywaniem obiektów,
on object detection,
to process a single image.
zajmowało 20 sekund.
speed is so important in this domain,
jest tak ważna w tej dziedzinie,
to process an image.
it makes predictions,
że zanim dokonał prognozy,
w zastosowaniu.
by another factor of 10,
przyspieszymy ten proces,
at five frames per second.
przy pięciu klatkach an sekundę.
like this driving my car.
prowadził mój samochód.
running in real time on my laptop.
działający w czasie rzeczywistym
as I move around the frame,
w trakcie poruszania się w ramie
of changes in size,
różnorodność zmian wielkości,
on top of computer vision.
na rozpoznawaniu obrazu.
a thousand times faster.
- tysiąc razy szybciej.
object detection systems
on each of these regions,
do klasyfikatora,
detections in the image.
thousands of times over an image,
do klasyfikatora tysiące razy,
to produce detection.
aby otrzymać wykrycie.
to do all of detection for us.
and class probabilities simultaneously.
i prawdopodobieństwa klasowe jednocześnie.
at an image thousands of times
analizować obraz
the YOLO method of object detection.
metodą wykrywania obrazów YOLO.
we're not just limited to images;
ograniczać się jedynie do obrazów.
w czasie rzeczywistym.
that cat and dog,
and interact with each other.
ich ruch i interakcję.
like spoon and fork, bowl,
na przykład łyżkę i widelec, miskę
bardziej egzotyczne obrazy:
out into the audience
our threshold for detection a little bit,
nasz próg wykrywalności,
out in the audience.
rozpoznać te znaki stopu.
is happening in real time
w czasie rzeczywistym
object detection system,
obiektów do użytku ogólnego,
dla dowolnej kategorii obrazów.
do znalezienia komórek rakowych
already using this technology
używają już tej technologii
like medicine, robotics.
takich jak medycyna, czy robotyka.
of animals in Nairobi National Park
w Parku Narodowym Nairobi
części systemu wykrywania obiektów.
of this detection system.
jest programem open source,
free for anyone to use.
do wolnego użytku.
even more accessible and usable,
było bardziej przystępne i przydatne,
of model optimization,
optymalizacji modelu,
running on a phone.
działające na telefonie.
now we have a pretty powerful solution
bo mamy potężne rozwiązanie problemu
na komputerach o niskiej wydajności
and build something with it.
i stworzyć coś przy jego użyciu.
with access to this software,
z dostępem do tego oprogramowania.
will build with this technology.
przy użyciu tej technologii.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com