Abe Davis: New video technology that reveals an object's hidden properties
Abe Davis: Nesnelerin gizli özelliklerini ortaya çıkaran yeni video teknolojisi
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio
Double-click the English transcript below to play the video.
as a very visual thing.
görsel bir şey olarak düşünürüz.
or gesture with my hands while I speak,
ya da konuşurken el hareketleri yapsam,
that's too subtle for the human eye,
belirsizlikte önemli hareketler dünyâsı vardır,
even when humans can't.
görebildiğini bulmaya başladık.
of a person's wrist,
videosunu görüyorsunuz,
of a sleeping infant,
videosunu görüyorsunuz,
that these were videos,
video olduğunu söylemesem,
at two regular images,
olduğunuzu sanabilirsiniz,
almost completely still.
hareketsiz görünüyor.
of subtle motion going on here,
birçok belirsiz hareketlenme var
the wrist on the left,
dokunacak olsanız,
the infant on the right,
tutuyor olsanız,
and fall of her chest
a lot of significance,
önemli bilgi taşır,
too subtle for us to see,
göremeyeceğimiz kadar belirsizdir,
what they call a motion microscope,
dedikleri mikroskobu geliştirdi,
these subtle motions in video
become large enough for us to see.
büyüten bir yazılımı.
on the left video,
onların yazılımını kullanırsak,
this person's heart rate.
bile bulabiliriz.
on the right video,
sağdaki videoda kullansak,
that this infant takes,
görmemizi sağlıyor
to monitor her breathing.
temassız bir yöntem olarak kullanabiliriz.
because it takes these phenomena
çünkü normalde dokunarak
to experience through touch
bütün bu durumları
and non-invasively.
elde etmemizi sağlıyor.
with the folks that created that software,
insanlarla çalışmaya başladım
gitmeye karar verdik.
that we can use software
küçücük hareketleri
kullanabilmemiz harika
as a way to extend our sense of touch.
bir uzantısı olarak düşünebilirsiniz.
with our ability to hear?
duyma yetimiz için de yapabilsek?
to capture the vibrations of sound,
elde etmek için kullanabilsek,
into a microphone?
mikrofona dönüştürebilsek?
in perspective for you.
bakış açısı kazandırmaya çalışayım.
work by converting the motion
içsel bir zara gelen
into an electrical signal,
dönüştürerek çalışır
to move readily with sound
hareket edecek şekilde tasarlanmıştır,
and interpreted as audio.
kaydedilebilir ve yorumlanabilir.
too subtle and too fast for us to see.
kadar belirsiz ve hızlıdır.
with a high-speed camera
bu titreşimleri kaydetsek
to extract tiny motions
küçücük hareketleri elde etmek için
what sounds created them?
oluşturduğunu anlamak için çözümlesek?
into visual microphones from a distance.
görsel mikrofonlara dönüştürmemizi sağlar.
that you see on the right
bu saksı bitkisini aldık
played this sound.
bu sesi çıkarırken kaydettik.
of frames per second,
bir hızda kaydettik,
just sitting there doing nothing,
by about a micrometer.
bir mikrometre kadar oynattı.
a hundredth and a thousandth
yüz ile binde biri arasındaki
gözlerinizi kısarak bakarsanız bakın
perceptually invisible.
algılanamayacak kadar görünmezdir.
can be perceptually invisible
algılanamayacak şekilde görünmez olabilir
seemingly still video
hareketsiz olan videoyu alıp
out of so little motion?
çok bilgiyi nasıl elde edebiliyoruz?
move by just a single micrometer,
hareket ettiğini varsayalım,
by just a thousandth of a pixel.
binde biri değiştirdiğini varsayalım.
of pixels in it,
of the tiny motions that we see
bütün küçücük hareketleri
to something pretty significant.
katkı sağlayabilir.
when we figured this out.
kafayı yedik.
a pretty important piece of the puzzle.
bir parçası eksikti.
that affect when and how well
ve nasıl çalışacağını etkileyecek
and the lens that you use;
ve lens var;
and how loud your sound is.
ve sesinizin yüksekliği var.
with our early experiments,
olmak zorundaydık,
any of these factors wrong,
herhangi birinde yanlışlık olursa,
what the problem was.
hiçbir yolu yoktu.
experiments looked like this.
şunun gibiydi.
see our high-speed camera,
bir kısmını görüyorsunuz,
by these bright lamps.
lambayla aydınlatılmış durumda.
very careful in these early experiments,
çok dikkâtli olmak zorundaydık,
Little lamb! Little lamb!
Küçük kuzu! Küçük kuzu!
looks completely ridiculous.
çok ama çok saçma görünüyor.
we tried this on. (Laughter)
gerçek anlamda erittik. (Gülüşmeler)
to recover this sound.
Little lamb! Little lamb!
Küçük kuzu! Küçük kuzu!
we recovered intelligible human speech
bir nesnenin sessiz bir videosundan
to modify the experiment,
değişiklikler yapmaya başlayabildik,
or moving the object further away,
nesneleri daha uzaktan kaydettik,
the limits of our technique,
anlayana dek çözümledik,
to a bag of chips,
karşı konuşuyorum,
about 15 feet away,
4,5 metre uzağa yerleştirdik,
by only natural sunlight.
doğal güneş ışığıyla aydınlatıldı.
from inside, next to the bag of chips.
oynatılan ses şöyle.
whose fleece was white as snow,
kürkü kar gibi beyazdı,
that lamb was sure to go.
kuzu peşinden giderdi.
to recover from our silent video
sessiz videodan kurtarmayı
whose fleece was white as snow,
kürkü kar gibi beyazdı,
that lamb was sure to go.
kuzu peşinden giderdi.
that we can push these limits as well.
başka yollar da var.
plugged into a laptop computer,
kulaklıkları kaydettik
the music that was playing on that laptop
dizüstünde çalan müziği
by changing the hardware that we use.
sınırlarımızı zorlayabiliriz.
I've shown you so far
gösterdiğim deneyler
a high-speed camera,
yapılmıştı,
about a 100 times faster
çoğu cep telefonundan
to use this technique
çoğu sıradan kamerayla da
of what's called a rolling shutter.
bir şeyden yararlanarak yapıyoruz.
record images one row at a time,
tek seferde tek satır olarak kaydeder
during the recording of a single image,
çekildiği anda kıpırdarsa,
between each row,
is that by analyzing these artifacts,
algoritmamızın değiştirilmiş
using a modified version of our algorithm.
sesi kurtarabileceğimizi bulduk.
music from before,
müziğini çalarken kaydettik,
store-bought camera,
sıradan bir kamera kullandık
the sound that we recovered,
size dinleteceğim
distorted this time,
bozuk bir ses çalacak,
recognize the music.
tanıyıp tanımayacağınızı görün.
is that we were able to do this
bunu, gerçekten gidip
that you could literally run out
aldığımız bir ürünle
about surveillance.
hakkında düşünüyorlar.
this technology to spy on someone.
kullanıldığını hayâl etmek zor değil.
a lot of very mature technology
hâli hazırda zâten gözetleme üzerine
from a distance for decades.
dinleme için onyıllardır kullanıyor.
to picture the vibrations of an object,
için bir yol bulmuş olmamızdır,
through which to look at the world,
yeni bir lens veriyor
that cause an object to vibrate,
öğrenmek için değil, nesnenin kendisi
the ways that we use video,
değiştirebileceğini düşünmek istiyorum,
to look at things,
bakmak için kullanırız
that we learn about the world:
önemli başka bir yol var:
still won't let us do,
izin vermediği bir şey,
göstermek istiyorum
just a few months ago,
önceki fikrime dayanıyor,
I've shown it to a public audience.
göstereceğim ilk an olacak.
to use the vibrations in a video
that will let us interact with them
bir şekilde yakalamamız
görmemizle ilgili.
in the shape of a human,
insan şeklinde bir telimiz var
with just a regular camera.
kaydedeceğiz.
about this camera.
with my cell phone before.
kendi cep telefonumla da yaptım.
on the surface where it's resting
kayıt sırasında
of regular video,
yüzeye vururkenki
the vibrations in that video
and material properties of our object,
özelliklerini öğrenmek için kullanacağız
to create something new and interactive.
bir şey oluşturmak için kullanacağız.
and it's not a video,
bir video da değil,
with the object.
that we've never seen before,
nasıl tepki verdiğinin benzetimidir
five seconds of regular video.
yalnızca beş sâniyesinden oluşturduk.
way to look at the world,
gerçekten güçlü bir yöntem,
how objects will respond
nasıl tepki vereceğini
looking at an old bridge
how would that bridge hold up
diye düşündüğünüzü
that you probably want to answer
üzerinde sürmeye başlamadan önce
across that bridge.
limitations to this technique,
sınırları olacak,
with the visual microphone,
in a lot of situations
birçok durumda
here's a video that I captured
apartmanımın dışındaki
to create this simulation.
yeterli titreşimi sağladı.
to a film director,
film yönetmenine verdiğinizi
in a shot after it's been recorded.
değiştirebildiğini hayâl edebilirsiniz.
at a hanging curtain,
asılı bir perdeye doğrulttuk
any motion in this video,
hareket göremiyorsunuz,
imperceptible motions and vibrations
hareket ve titreşimi sağladı
to create this simulation.
yetecek kadarını öğrendik.
this kind of interactivity
and 3D models,
3B modellerde alışkınız,
from real objects in the real world
gerçek dünyâdaki gerçek nesnelerden,
a lot of potential.
yeni bir şey.
who worked with me on these projects.
çalışan inanılmaz insanlar.
is only the beginning.
yalnızca başlangıç.
with this kind of imaging,
daha yalnızca yüzeyini kazıdık,
with common, accessible technology.
yeni bir yol sağlıyor.
really exciting to explore
söyleyebileceklerini keşfetmek
ABOUT THE SPEAKER
Abe Davis - Computer scientistComputer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.
Why you should listen
MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument. In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.
Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.
Abe Davis | Speaker | TED.com