Abe Davis: New video technology that reveals an object's hidden properties
Abe Davis: Teknologi video baru yang mengungkapkan sifat benda yang tersembunyi
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio
Double-click the English transcript below to play the video.
as a very visual thing.
gerakan adalah hal yang bisa terlihat.
menggerakkan tangan sambil berbicara,
or gesture with my hands while I speak,
that's too subtle for the human eye,
terlalu halus untuk dilihat mata manusia,
even when humans can't.
yang tidak bisa dilihat mata manusia.
of a person's wrist,
pergelangan tangan seseorang,
of a sleeping infant,
seorang bayi yang sedang tidur,
that these were videos,
bahwa keduanya adalah video,
at two regular images,
yang Anda lihat hanyalah gambar,
almost completely still.
of subtle motion going on here,
yang sedang terjadi,
yang ada di kiri,
the wrist on the left,
the infant on the right,
di video sebelah kanan,
and fall of her chest
gerakan naik turun dadanya
a lot of significance,
yang sangat banyak,
too subtle for us to see,
untuk bisa kita lihat,
perbedaannya
melalui sentuhan.
what they call a motion microscope,
alat yang mereka sebut mikroskop gerakan,
these subtle motions in video
gerakan halus seperti ini pada video
become large enough for us to see.
sehingga dapat kita lihat.
on the left video,
pada video yang kiri,
di pergelangan tangan,
this person's heart rate.
on the right video,
pada video di sebelah kiri,
that this infant takes,
tiap tarikan nafas bayi ini,
to monitor her breathing.
memonitor nafas bayi dari jarak jauh.
because it takes these phenomena
karena bisa menangkap kejadian
lewat sentuhan
to experience through touch
and non-invasively.
dan tanpa sentuhan.
with the folks that created that software,
saya mulai bekerja sama
sesuatu yang lebih gila lagi.
that we can use software
kita bisa menggunakan piranti ini
seperti ini,
as a way to extend our sense of touch.
perpanjangan indra peraba kita.
with our ability to hear?
hal yang sama
indra pendengaran kita?
to capture the vibrations of sound,
untuk menangkap getaran suara,
satu bentuk gerakan,
into a microphone?
menjadi mikrofon?
in perspective for you.
work by converting the motion
mengubah gerakan
into an electrical signal,
menjadi sinyal listrik,
to move readily with sound
bergerak jika ada suara masuk
and interpreted as audio.
dan diterjemahkan menjadi suara.
semua benda bergetar.
too subtle and too fast for us to see.
dan terlalu cepat untuk bisa kita lihat.
with a high-speed camera
kamera berkecepatan tinggi,
to extract tiny motions
untuk memperbesar getaran halus
what sounds created them?
suara apa yang menimbulkan getaran itu?
into visual microphones from a distance.
bisa dilihat menjadi mikrofon jarak jauh.
that you see on the right
yang Anda lihat di sebelah kanan
kamera kecepatan tinggi
played this sound.
memainkan nada ini.
"Mary Had a Little Lamb")
of frames per second,
melihatnya,
just sitting there doing nothing,
by about a micrometer.
sekitar satu mikrometer.
satu sentimeter,
a hundredth and a thousandth
sampai seperseribu
perceptually invisible.
relatif tidak terlihat.
can be perceptually invisible
relatif tidak terlihat
seemingly still video
yang kelihatannya diam ini
"Mary Had a Little Lamb")
out of so little motion?
informasi dari gerakan yang begitu halus?
move by just a single micrometer,
sejauh satu mikrometer,
by just a thousandth of a pixel.
seperseribu pixel.
of pixels in it,
di dalamnya,
of the tiny motions that we see
gerakan kecil yang kita lihat
to something pretty significant.
ketika semuanya dikumpulkan.
when we figured this out.
ketika kami berhasil melakukannya.
algoritma yang tepat pun,
a pretty important piece of the puzzle.
yang masih hilang.
that affect when and how well
mempengaruhi kapan dan bagaimana
and the lens that you use;
and how loud your sound is.
besar volume suaranya.
yang tepat pun,
with our early experiments,
di awal percobaan kami,
any of these factors wrong,
yang salah,
what the problem was.
letak permasalahannya.
experiments looked like this.
seperti ini.
see our high-speed camera,
kamera kecepatan tinggi kami,
by these bright lamps.
lampu-lampu terang ini.
very careful in these early experiments,
harus berhati-hati sekali dalam percobaan,
Little lamb! Little lamb!
Kambing kecil! Kambing kecil!
looks completely ridiculous.
terlihat konyol.
we tried this on. (Laughter)
meleleh. (Tertawa)
terlihat konyol,
to recover this sound.
kembali suaranya.
Little lamb! Little lamb!
Kambing kecil! Kambing kecil!
kami berhasil mendapatkan
we recovered intelligible human speech
titik referensi,
to modify the experiment,
mengembangkan percobaan berikutnya,
or moving the object further away,
atau dengan menambah jarak kamera,
suara yang lebih halus.
yang kami lakukan
the limits of our technique,
yang dapat dicapai teknik ini,
batasan itu lebih jauh lagi.
seperti ini,
to a bag of chips,
saya berteriak pada sekantung keripik,
about 15 feet away,
4,5 meter dari keripik,
di balik jendela kedap suara
by only natural sunlight.
dari sinar matahari.
from inside, next to the bag of chips.
ruangan, dekat kantung keripik.
whose fleece was white as snow,
bulunya seputih salju,
that lamb was sure to go.
sang domba pasti mengikuti.
to recover from our silent video
dari video bisu tersebut
whose fleece was white as snow,
bulunya seputih salju,
that lamb was sure to go.
sang domba pasti mengikuti.
that we can push these limits as well.
batasan teknik ini.
suara yang lebih halus
plugged into a laptop computer,
yang terpasang pada laptop,
the music that was playing on that laptop
yang sedang diputar di laptop
dua earphone plastik ini,
dengan sangat baik
mengenali musiknya.
"Under Pressure" oleh Queen)
by changing the hardware that we use.
yang digunakan.
I've shown you so far
sudah saya tunjukkan sejauh ini
a high-speed camera,
about a 100 times faster
100 kali lebih cepat
to use this technique
menerapkan teknik ini
of what's called a rolling shutter.
yang disebut rana putar.
record images one row at a time,
per baris,
during the recording of a single image,
saat gambar diambil,
between each row,
antara setiap baris rekaman,
sedikit kesalahan gambar
is that by analyzing these artifacts,
dengan menganalisa kesalahan gambar ini,
using a modified version of our algorithm.
dengan memodifikasi algoritmanya.
music from before,
"Mary had a Little Lamb."
store-bought camera,
yang bisa dibeli di toko.
the sound that we recovered,
suara yang kami dapatkan,
distorted this time,
recognize the music.
apa Anda masih mengenali musiknya.
"Mary had a Little Lamb")
dari kantung permen]
is that we were able to do this
kita bisa menerapkan aplikasi ini
that you could literally run out
Anda dapatkan
about surveillance.
this technology to spy on someone.
bisa digunakan untuk memata matai.
a lot of very mature technology
teknologi siap pakai saat ini
memakai sinar laser
from a distance for decades.
to picture the vibrations of an object,
getaran dari sebuah objek,
through which to look at the world,
untuk memandang dunia,
untuk mempelajari
that cause an object to vibrate,
yang dapat membuat benda bergetar,
the ways that we use video,
mengubah cara kita menggunakan video.
to look at things,
video untuk melihat objek,
untuk mendengarkan sesuatu.
that we learn about the world:
tentang dunia:
dan mendorong benda.
melihat apa yang terjadi.
still won't let us do,
melalui video,
baru kami,
just a few months ago,
beberapa bulan yang lalu,
I've shown it to a public audience.
saya menunjukkannya pada umum.
to use the vibrations in a video
getaran dalam satu video
that will let us interact with them
sehingga kita bisa berinteraksi dengannya
in the shape of a human,
with just a regular camera.
about this camera.
with my cell phone before.
dengan kamera HP saya.
on the surface where it's resting
dimana ia terletak,
of regular video,
Lima detik rekaman video biasa,
the vibrations in that video
getaran dari video tersebut
and material properties of our object,
sifat struktural dan material objek ini.
to create something new and interactive.
yang baru dan interaktif.
and it's not a video,
juga bukan video,
with the object.
that we've never seen before,
five seconds of regular video.
video biasa berdurasi 5 detik.
way to look at the world,
how objects will respond
looking at an old bridge
jika kita melihat jembatan tua
how would that bridge hold up
jika mobil saya melintas di atasnya.
that you probably want to answer
mendapat jawabannya
across that bridge.
limitations to this technique,
with the visual microphone,
in a lot of situations
teknik ini bekerja baik
lebih panjang.
here's a video that I captured
terhadap semak-semak ini,
menggetarkan semak-semak
to create this simulation.
simulasi berikut.
to a film director,
memberikannya ke sutradara,
in a shot after it's been recorded.
setelah adegannya selesai direkam.
at a hanging curtain,
ke sebuah tirai yang tergantung,
any motion in this video,
dalam video ini,
imperceptible motions and vibrations
halus dan tak terlihat
to create this simulation.
untuk membuat simulasi ini.
this kind of interactivity
interaksi semacam ini
and 3D models,
model 3D lainnya,
from real objects in the real world
dari objek nyata
video biasa dan sederhana,
a lot of potential.
yang punya banyak potensi.
who worked with me on these projects.
saya dalam proyek ini.
is only the beginning.
hanyalah permulaan.
with this kind of imaging,
dengan pencitraan seperti ini,
with common, accessible technology.
perangkat yang lazim dan terjangkau.
untuk menggali
really exciting to explore
tentang dunia.
ABOUT THE SPEAKER
Abe Davis - Computer scientistComputer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.
Why you should listen
MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument. In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.
Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.
Abe Davis | Speaker | TED.com