Joseph Redmon: How computers learn to recognize objects instantly
Joseph Redmon: Máy tính nhận diện vật thể ngay lập tức như thế nào?
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio
Double-click the English transcript below to play the video.
thought that getting a computer
cho rằng để máy tính
between a cat and a dog
sự khác nhau giữa chó và mèo
in the state of artificial intelligence.
đáng kể về trí tuệ nhân tạo.
greater than 99 percent accuracy.
điều đó với hơn 99% độ chính xác.
put a label to that image --
dán nhãn cho hình ảnh đó
thousands of other categories as well.
hàng ngàn loại hình ảnh như vậy.
at the University of Washington,
computer vision models.
các mô hình thị giác máy tính
a prediction of dog or cat,
nhận được dự đoán về chó hay mèo
specific breed predictions.
loài cụ thể.
of granularity we have now.
một con Malamute.
in image classification,
vượt bậc trong phân lớp hình ảnh,
when we run our classifier
khi khởi động bộ phân lớp
with a pretty similar prediction.
với dự đoán tương tự như vậy.
there is a malamute in the image,
có một con malamute trong bức ảnh,
we don't actually know that much
chúng ta không thực sự hiểu rõ
trong bức ảnh đó.
called object detection,
được gọi là Nhận diện vật thể
and try to find all of the objects,
và cố tìm ra tất cả các đồ vật,
when we run a detector on this image.
with our computer vision algorithms.
that there's a cat and a dog.
một con chó và một con mèo
on top of computer vision,
dựa vào thị giác máy tính,
or a robotic system,
of information that you want.
you can interact with the physical world.
tương tác với thế giới thực.
on object detection,
to process a single image.
speed is so important in this domain,
quan trọng đến thế,
to process an image.
it makes predictions,
vào lúc nó đưa ra dự đoán xong
by another factor of 10,
at five frames per second.
like this driving my car.
điều khiển chiếc xe của mình.
running in real time on my laptop.
as I move around the frame,
of changes in size,
on top of computer vision.
dựa trên thị giác máy tính.
a thousand times faster.
nhanh gấp nghìn lần.
object detection systems
on each of these regions,
detections in the image.
thousands of times over an image,
hàng nghìn lần nhận diện trên một hình,
to produce detection.
để đi đến được kết quả.
to do all of detection for us.
tiến hành tất cả các nhận diện,
and class probabilities simultaneously.
các khả năng
at an image thousands of times
hàng ngàn lần
(Chỉ nhìn một lần)
the YOLO method of object detection.
we're not just limited to images;
chỉ trong Ảnh
that cat and dog,
and interact with each other.
like spoon and fork, bowl,
out into the audience
our threshold for detection a little bit,
out in the audience.
is happening in real time
trong thời gian thực
object detection system,
xe tự lái;
already using this technology
áp dụng công nghệ này
like medicine, robotics.
chế tạo robot.
of animals in Nairobi National Park
ở Công viên Quốc gia Nairobi
of this detection system.
nhận dạng.
free for anyone to use.
tất cả mọi người
even more accessible and usable,
trở nên dễ tiếp cận và dễ sử dụng hơn nữa
of model optimization,
running on a phone.
nhận diện vật thể bằng điện thoại.
now we have a pretty powerful solution
đã có một giải pháp hữu hiệu
and build something with it.
tạo nên những thứ khác nữa.
phụ thuộc vào các bạn
with access to this software,
qua việc truy cập vào phần mềm này
will build with this technology.
những gì sẽ được tạo ra từ công nghệ này.
ABOUT THE SPEAKER
Joseph Redmon - Computer scientistJoseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.
Why you should listen
Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.
Redmon is also internet-famous for his resume.
Joseph Redmon | Speaker | TED.com