Abe Davis: New video technology that reveals an object's hidden properties
Công nghệ video mới làm lộ diện các đặc tính của các vật dụng
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio
Double-click the English transcript below to play the video.
as a very visual thing.
là những thứ nhìn thấy được.
or gesture with my hands while I speak,
hay làm động tác tay khi nói,
that's too subtle for the human eye,
chuyển động quá tinh tế với mắt người.
even when humans can't.
ngay cả khi con người không thấy.
of a person's wrist,
of a sleeping infant,
that these were videos,
đó là những đoạn phim,
at two regular images,
nhìn vào hai bức ảnh thông thường,
almost completely still.
không có chuyển động.
of subtle motion going on here,
tinh vi đang xảy ra ở đây,
the wrist on the left,
the infant on the right,
and fall of her chest
a lot of significance,
mang rất nhiều ý nghĩa,
too subtle for us to see,
để chúng ta nhìn thấy được,
what they call a motion microscope,
mà họ gọi là "kính hiển vi chuyển động",
these subtle motions in video
những chuyển động tinh vi trong đoạn phim
become large enough for us to see.
mà chúng ta có thể thấy được.
on the left video,
cho đoạn phim bên trái,
this person's heart rate.
on the right video,
that this infant takes,
mỗi nhịp thở của em bé,
to monitor her breathing.
để theo dõi nhịp thở của bé.
because it takes these phenomena
bởi vì nó ghi nhận được các hiện tượng này
to experience through touch
and non-invasively.
mà không phải chạm tới vật đó.
with the folks that created that software,
với nhóm tạo ra phần mềm này,
đeo đuổi một ý tưởng điên rồ.
that we can use software
khi chúng tôi có thể dùng phần mềm
as a way to extend our sense of touch.
một cách để mở rộng cảm quan của chúng ta.
with our ability to hear?
điều tương tự đối với thính giác của chúng ta?
to capture the vibrations of sound,
để ghi lại những rung động của âm thanh,
into a microphone?
vào một cái micrô?
in perspective for you.
work by converting the motion
bằng cách chuyển các rung động
into an electrical signal,
thành tín hiệu điện,
to move readily with sound
chuyển động dễ dàng theo tiếng động,
and interpreted as audio.
và chuyển thành âm thanh.
too subtle and too fast for us to see.
quá nhỏ và quá nhanh để có thể nhìn thấy.
with a high-speed camera
bằng một máy quay tốc độ cao
to extract tiny motions
tách ra các chuyển động nhỏ
what sounds created them?
âm thanh nào tạo ra chúng?
into visual microphones from a distance.
thành một chiếc micro trực quan từ xa.
that you see on the right
mà các bạn có thể thấy ở bên phải
played this sound.
đang được mở bài hát này.
of frames per second,
just sitting there doing nothing,
by about a micrometer.
chúng khoảng 1 micro-mét.
a hundredth and a thousandth
perceptually invisible.
chuyển động bé như vậy.
can be perceptually invisible
dường như là vô hình
seemingly still video
trong đoạn phim
out of so little motion?
từ những chuyển động nhỏ đó?
move by just a single micrometer,
chỉ xê dịch 1 micro-mét,
by just a thousandth of a pixel.
of pixels in it,
of the tiny motions that we see
to something pretty significant.
when we figured this out.
khi khám phá ra được điều này.
a pretty important piece of the puzzle.
trong toàn bộ bức tranh.
that affect when and how well
ảnh hưởng tới hiệu quả
and the lens that you use;
and how loud your sound is.
và âm thanh phát ra lớn ra sao.
with our early experiments,
với những thí nghiệm ban đầu,
any of these factors wrong,
what the problem was.
experiments looked like this.
được thực hiện như sau.
see our high-speed camera,
by these bright lamps.
very careful in these early experiments,
cẩn thận với những thí nghiệm đầu,
Little lamb! Little lamb!
Con cừu nhỏ! Con cừu nhỏ!
looks completely ridiculous.
một cái bịch khoai tây.
we tried this on. (Laughter)
trong thí nghiệm đầu tiên. (Khán giả cười)
to recover this sound.
Little lamb! Little lamb!
Con cừu nhỏ! Con cừu nhỏ!
we recovered intelligible human speech
phục hồi giọng nói con người
to modify the experiment,
các thí nghiệm,
or moving the object further away,
hoặc dời các vật dụng ra xa,
the limits of our technique,
các giới hạn của kỹ thuật này
cách để cải thiện chúng,
to a bag of chips,
với bịch khoai tây,
about 15 feet away,
chuyển camera ra xa gần 15 feet (khoảng 5 mét),
by only natural sunlight.
bởi ánh sáng tự nhiên.
from inside, next to the bag of chips.
từ phía trong, gần bịch khoai tây.
whose fleece was white as snow,
lông nó trắng như tuyết,
that lamb was sure to go.
con cừu đó cũng sẽ theo.
to recover from our silent video
được từ đoạn phim im lặng của chúng tôi
whose fleece was white as snow,
lông nó trắng như tuyết,
that lamb was sure to go.
con cừu đó cũng sẽ theo.
that we can push these limits as well.
để chúng tôi mở rộng giới hạn.
plugged into a laptop computer,
được cắm vào máy tính để bàn,
the music that was playing on that laptop
khôi phục được bài hát đang được bật từ máy tính đó
by changing the hardware that we use.
bằng cách thay đổi các vật dụng.
I've shown you so far
a high-speed camera,
about a 100 times faster
to use this technique
ứng dụng công nghệ này
of what's called a rolling shutter.
record images one row at a time,
theo từng cột ngang tại một thời điểm,
during the recording of a single image,
between each row,
thời gian giữa các hàng,
is that by analyzing these artifacts,
bằng cách phân tích lỗi này,
using a modified version of our algorithm.
thuật toán đã được thay đổi của chúng tôi.
music from before,
store-bought camera,
dùng máy quay thông thường,
the sound that we recovered,
chúng tôi phục hồi lại được,
distorted this time,
recognize the music.
bạn còn nhận ra nó không.
is that we were able to do this
là ta có thể làm điều này
that you could literally run out
about surveillance.
this technology to spy on someone.
công nghệ này để do thám người khác.
a lot of very mature technology
rất nhiều kỹ thuật hiện đại
from a distance for decades.
từ vài thập kỷ trước.
to picture the vibrations of an object,
thu lại rung động của vật thể,
through which to look at the world,
mới để nhìn ra thế giới,
that cause an object to vibrate,
như âm thanh làm vật rung động
the ways that we use video,
chúng ta sử dụng một đoạn phim,
to look at things,
để nhìn các vật thể,
that we learn about the world:
để ta hiểu thêm về thế giới:
still won't let us do,
cho chúng ta thực hiện,
just a few months ago,
I've shown it to a public audience.
tôi cho ra mắt công chúng.
to use the vibrations in a video
dùng chuyển động trong đoạn phim
that will let us interact with them
giúp chúng ta tương tác với nó
in the shape of a human,
with just a regular camera.
chỉ bằng camera thông dụng.
about this camera.
with my cell phone before.
bằng cả điện thoại trước đó.
on the surface where it's resting
phía dưới khi nó đứng yên
of regular video,
một đoạn phim bình thường,
the vibrations in that video
những chuyển động trong đó
and material properties of our object,
cấu trúc và chất liệu của nó,
to create something new and interactive.
tạo ra một thứ có thể tương tác.
and it's not a video,
cũng không phải là một đoạn phim,
with the object.
that we've never seen before,
mà ta chưa từng chứng kiến,
five seconds of regular video.
way to look at the world,
để khảo sát thế giới,
how objects will respond
vật sẽ phản ứng ra sao
looking at an old bridge
ví dụ như, nhìn vào một cây cầu cổ
how would that bridge hold up
xem liệu nó có đứng vững
that you probably want to answer
across that bridge.
limitations to this technique,
của công nghệ này
with the visual microphone,
in a lot of situations
hoạt động tốt trong nhiều tình huống
here's a video that I captured
to create this simulation.
để tạo ra một mô phỏng như thế này.
to a film director,
đưa cái này cho đạo diễn phim,
in a shot after it's been recorded.
at a hanging curtain,
any motion in this video,
imperceptible motions and vibrations
to create this simulation.
this kind of interactivity
and 3D models,
from real objects in the real world
từ các vật trong thế giới thực
a lot of potential.
who worked with me on these projects.
đã làm việc với tôi trong dự án này.
is only the beginning.
mới chỉ là điểm khởi đầu.
with this kind of imaging,
with common, accessible technology.
bằng những công nghệ phổ biến.
really exciting to explore
ABOUT THE SPEAKER
Abe Davis - Computer scientistComputer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.
Why you should listen
MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument. In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.
Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.
Abe Davis | Speaker | TED.com