Abe Davis: New video technology that reveals an object's hidden properties
Abe Davis: Nieuwe videotechnologie die de verborgen eigenschappen van voorwerpen zichtbaar maakt.
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio
Double-click the English transcript below to play the video.
as a very visual thing.
als iets zeer visueels.
or gesture with my hands while I speak,
of met mijn handen gebaar,
that's too subtle for the human eye,
even when humans can't.
zelfs wanneer de mens dat niet kan.
of a person's wrist,
van iemands pols,
of a sleeping infant,
that these were videos,
dat dit video's waren,
at two regular images,
dat je gewone foto’s zag,
almost completely still.
te zien is in beide video's.
of subtle motion going on here,
een heleboel subtiele beweging gaande.
the wrist on the left,
the infant on the right,
and fall of her chest
a lot of significance,
too subtle for us to see,
dat we ze niet kunnen zien.
door middel van aanraking.
what they call a motion microscope,
een ‘bewegingsmicroscoop’ ontwikkeld.
these subtle motions in video
bewegingen in video vindt
become large enough for us to see.
on the left video,
this person's heart rate.
van deze persoon.
on the right video,
kunnen we op de video rechts
that this infant takes,
to monitor her breathing.
haar ademhaling controleren.
because it takes these phenomena
want ze kan deze fenomenen,
to experience through touch
ervaren door aanraking,
and non-invasively.
with the folks that created that software,
met de mensen die die software creëerden.
een gek idee uit te werken.
that we can use software
om software te gebruiken
als deze te visualiseren
as a way to extend our sense of touch.
om onze tastzin uit te breiden.
with our ability to hear?
konden doen met ons gehoor?
to capture the vibrations of sound,
om geluidstrillingen op te nemen --
into a microphone?
een 'microfoon' konden maken.
in perspective for you.
work by converting the motion
door het omzetten van de beweging
into an electrical signal,
in een elektrisch signaal.
to move readily with sound
om gemakkelijk te bewegen met geluid,
and interpreted as audio.
kan worden geregistreerd
too subtle and too fast for us to see.
en te snel voor ons om te zien.
with a high-speed camera
met een hogesnelheidscamera
to extract tiny motions
om de kleine bewegingen
what sounds created them?
om de geluiden te achterhalen
into visual microphones from a distance.
als visuele microfoons.
that you see on the right
dit geluid speelde.
played this sound.
of frames per second,
just sitting there doing nothing,
by about a micrometer.
slechts ongeveer één micrometer.
van een centimeter,
a hundredth and a thousandth
en een duizendste
perceptually invisible.
om zichtbaar te zijn.
can be perceptually invisible
dat iets niet te zien kan zijn
seemingly still video
schijnbaar stille video
out of so little motion?
uit zo weinig beweging?
move by just a single micrometer,
slechts één enkele micrometer uitwijken,
by just a thousandth of a pixel.
van een pixel verschuift.
of pixels in it,
of the tiny motions that we see
van een pixel ineens
to something pretty significant.
behoorlijk in onze nopjes
when we figured this out.
a pretty important piece of the puzzle.
een vrij belangrijk stuk van de puzzel.
that affect when and how well
op wanneer en hoe goed
and the lens that you use;
and how loud your sound is.
en hoe hard het geluid is.
with our early experiments,
bij onze vroege experimenten,
any of these factors wrong,
verkeerd zat,
wat het probleem was.
what the problem was.
experiments looked like this.
zagen er zo uit.
see our high-speed camera,
onze hogesnelheidscamera,
by these bright lamps.
door sterke lampen.
very careful in these early experiments,
bij deze vroege experimenten,
Little lamb! Little lamb!
Little lamb! Little lamb!
looks completely ridiculous.
lijkt volstrekt belachelijk.
tegen een zak chips -
we tried this on. (Laughter)
(Gelach)
dit experiment ook lijkt,
to recover this sound.
konden herstellen.
Little lamb! Little lamb!
Little lamb! Little lamb!
we recovered intelligible human speech
spraak terugwonnen
van een object.
to modify the experiment,
het experiment wijzigen,
of van verder weg,
or moving the object further away,
the limits of our technique,
van onze techniek vonden.
hoe we ze konden oprekken.
to a bag of chips,
tegen een zak chips,
about 15 feet away,
ongeveer 5 meter er vandaan,
by only natural sunlight.
met natuurlijk zonlicht.
from inside, next to the bag of chips.
whose fleece was white as snow,
whose fleece was white as snow,
that lamb was sure to go.
that lamb was sure to go.
to recover from our silent video
uit onze stille video konden terugwinnen
whose fleece was white as snow,
whose fleece was white as snow,
that lamb was sure to go.
that lamb was sure to go.
om deze grenzen te verleggen.
that we can push these limits as well.
plugged into a laptop computer,
aangesloten op een laptop.
the music that was playing on that laptop
die op die laptop speelde,
konden ‘shazammen’.
by changing the hardware that we use.
ook verbeteren via de hardware.
tot nu toe heb laten zien
I've shown you so far
a high-speed camera,
about a 100 times faster
sneller video opnemen
om deze techniek te gebruiken
to use this technique
of what's called a rolling shutter.
van wat een ‘gordijnsluiter’ heet.
record images one row at a time,
beelden rij voor rij vast.
during the recording of a single image,
van één enkel beeld beweegt,
between each row,
tussen elke rij,
is that by analyzing these artifacts,
using a modified version of our algorithm.
van ons algoritme.
music from before,
store-bought camera,
een normale camera uit de winkel.
the sound that we recovered,
distorted this time,
recognize the music.
nog steeds kunt herkennen.
is that we were able to do this
dat we het doen
that you could literally run out
about surveillance.
je kan je best voorstellen
this technology to spy on someone.
om iemand te bespioneren.
a lot of very mature technology
goed ontwikkelde technologie
from a distance for decades.
om op afstand af te luisteren.
to picture the vibrations of an object,
om trillingen van een object op te nemen.
through which to look at the world,
om te kijken naar de wereld.
that cause an object to vibrate,
te leren over krachten
the ways that we use video,
om video te gebruiken.
to look at things,
om naar dingen te kijken,
that we learn about the world:
waarop we leren over de wereld:
en zien wat er gebeurt.
still won't let us do,
net een paar maanden geleden had.
just a few months ago,
I've shown it to a public audience.
dat ik ermee voor een publiek kom.
to use the vibrations in a video
that will let us interact with them
dat we met ze kunnen interageren
in the shape of a human,
gevormd als mens.
with just a regular camera.
met een gewone camera.
about this camera.
with my cell phone before.
op het oppervlak waarop het staat
on the surface where it's resting
slechts vijf seconden gewone video,
of regular video,
the vibrations in that video
in die video gebruiken
and material properties of our object,
en materiaaleigenschappen van ons object,
to create something new and interactive.
om iets nieuws en interactiefs te maken.
and it's not a video,
with the object.
that we've never seen before,
die we nog nooit eerder hebben gezien,
five seconds of regular video.
vijf seconden gewone video.
way to look at the world,
om naar de wereld te kijken.
how objects will respond
hoe objecten zullen reageren
looking at an old bridge
how would that bridge hold up
that you probably want to answer
across that bridge.
limitations to this technique,
natuurlijk zijn beperkingen
with the visual microphone,
in a lot of situations
dat het in veel situaties werkt
here's a video that I captured
dat genoeg trillingen veroorzaakte,
to create this simulation.
om deze simulatie te maken.
to a film director,
wat een filmregisseur
in a shot after it's been recorded.
van de wind
at a hanging curtain,
op een hangend gordijn.
any motion in this video,
van twee minuten video,
in deze kamer
imperceptible motions and vibrations
bewegingen en trillingen
to create this simulation.
deze simulatie konden creëren.
this kind of interactivity
aan dit soort interactiviteit
and 3D models,
from real objects in the real world
in de echte wereld kunnen vastleggen
a lot of potential.
dat veel mogelijkheden biedt.
who worked with me on these projects.
die met mij
is slechts het begin,
is only the beginning.
met dit soort beeldvorming.
with this kind of imaging,
with common, accessible technology.
toegankelijke technologie vast te leggen.
really exciting to explore
over onze wereld.
ABOUT THE SPEAKER
Abe Davis - Computer scientistComputer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.
Why you should listen
MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument. In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.
Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.
Abe Davis | Speaker | TED.com