Abe Davis: New video technology that reveals an object's hidden properties
Abe Davis: Ny videoteknik som avslöjar dolda egenskaper hos föremål
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio
Double-click the English transcript below to play the video.
as a very visual thing.
som en visuell sak.
or gesture with my hands while I speak,
eller gestikulerar medan jag talar,
that's too subtle for the human eye,
som är för små för det mänskliga ögat,
upptäckt att kameror
even when humans can't.
som människor inte kan.
of a person's wrist,
en film på en sovande bebis,
of a sleeping infant,
that these were videos,
att det var filmer,
det var stillbilder du såg,
at two regular images,
verkar filmerna nästan helt stilla.
almost completely still.
of subtle motion going on here,
handleden till vänster,
the wrist on the left,
the infant on the right,
and fall of her chest
röra sig när hon andades.
men är oftast för små för att synas.
a lot of significance,
too subtle for us to see,
ett så kallat rörelsemikroskop.
what they call a motion microscope,
these subtle motions in video
dessa små rörelser på film
become large enough for us to see.
on the left video,
på den vänstra filmen,
skulle vi veta hjärtfrekvensen.
this person's heart rate.
på den högra filmen,
on the right video,
som bebisen tar.
that this infant takes,
to monitor her breathing.
övervaka andningen.
för den tar dessa fenomen
because it takes these phenomena
uppleva genom beröring
to experience through touch
and non-invasively.
med dem som gjorde mjukvaran,
with the folks that created that software,
that we can use software
ett sätt att förlänga känseln.
as a way to extend our sense of touch.
på samma sätt med hörseln!
with our ability to hear?
för att fånga ljudets vibrationer,
to capture the vibrations of sound,
into a microphone?
som mikrofon.
låt mig sätta den i perspektiv.
in perspective for you.
work by converting the motion
till en elektrisk signal,
into an electrical signal,
för att enkelt röra sig med ljudet
to move readily with sound
and interpreted as audio.
för små och snabba för oss att se.
too subtle and too fast for us to see.
en höghastighetskamera
with a high-speed camera
pyttesmå rörelser från filmen,
to extract tiny motions
vilka ljud som åstadkom dem.
what sounds created them?
visuella mikrofoner på avstånd.
into visual microphones from a distance.
och här är ett av våra experiment.
och filmade med höghastighetskamera,
that you see on the right
spelade detta ljud.
played this sound.
tusentals bilder per sekund,
of frames per second,
ser du bara några blad
just sitting there doing nothing,
by about a micrometer.
bara ungefär en mikrometer.
en tusendels pixel i bilden.
a hundredth and a thousandth
så kan du inte uppfatta så små rörelser.
perceptually invisible.
omöjligt att uppfatta
can be perceptually invisible
denna tysta, till synes stilla film-
seemingly still video
från så lite rörelse?
out of so little motion?
move by just a single micrometer,
en enda mikrometer,
by just a thousandth of a pixel.
en tusendels pixel.
bildruta består av hundratusentals pixlar,
of pixels in it,
pyttesmå rörelser från hela bilden,
of the tiny motions that we see
till något ganska märkbart.
to something pretty significant.
when we figured this out.
rätt häpna när vi upptäckte det.
saknades en viktig bit av pusslet.
a pretty important piece of the puzzle.
that affect when and how well
den här metoden fungerar.
and the lens that you use;
and how loud your sound is.
och hur starkt ljudet är.
vid våra första experiment,
with our early experiments,
any of these factors wrong,
what the problem was.
vad som var problemet.
tidiga experiment ut så här.
experiments looked like this.
see our high-speed camera,
höghastighetskameran
by these bright lamps.
very careful in these early experiments,
vid dessa tidiga experiment.
Little lamb! Little lamb!
Little lamb! Little lamb!
looks completely ridiculous.
we tried this on. (Laughter)
bokstavligen smälte. (Skratt)
det var ett viktigt experiment.
to recover this sound.
Little lamb! Little lamb!
Little lamb! Little lamb!
som vi återskapade mänskligt tal
we recovered intelligible human speech
to modify the experiment,
förändra experimentet,
or moving the object further away,
the limits of our technique,
metodens begränsningar,
kunde vi räkna ut hur vi skulle tänja dem.
to a bag of chips,
about 15 feet away,
by only natural sunlight.
from inside, next to the bag of chips.
whose fleece was white as snow,
whose fleece was white as snow
that lamb was sure to go.
that lamb was sure to go.
to recover from our silent video
från den ljudlösa filmen
whose fleece was white as snow
whose fleece was white as snow,
that lamb was sure to go.
that lamb was sure to go.
tänja gränserna på.
that we can push these limits as well.
där vi filmade ett par hörlurar,
plugged into a laptop computer,
som spelades på datorn
the music that was playing on that laptop
på dessa små hörlurar.
by changing the hardware that we use.
genom att ändra utrustningen.
I've shown you so far
som jag har visat hittills
a high-speed camera,
about a 100 times faster
än de flesta mobiler.
to use this technique
använda metoden med vanliga kameror,
rullande slutare.
of what's called a rolling shutter.
record images one row at a time,
filmens bilder en pixelrad åt gången,
during the recording of a single image,
medan en enda bild spelas in
between each row,
mellan varje rad
som syns i varje bild i filmen.
is that by analyzing these artifacts,
analysera dessa artefakter,
using a modified version of our algorithm.
ändrad version av vår algoritm.
en godispåse medan en högtalare spelade
music from before,
store-bought camera,
the sound that we recovered,
ljudet vi återskapade,
distorted this time,
känna igen musiken.
recognize the music.
is that we were able to do this
vi fick detta resultat
that you could literally run out
köpa på Elgiganten.
tänker genast på övervakning.
about surveillance.
är det lätt att föreställa sig
this technology to spy on someone.
till att spionera.
gott om mogen teknik för att spionera.
a lot of very mature technology
via föremål på avstånd i decennier.
from a distance for decades.
avbilda vibrationer hos ett föremål,
to picture the vibrations of an object,
vi kan betrakta världen genom.
through which to look at the world,
that cause an object to vibrate,
som ljud, som orsakar vibrationer,
det kan ändra sättet vi använder film på.
the ways that we use video,
betrakta föremål,
to look at things,
kan användas för att lyssna på saker.
att undersöka omvärlden:
that we learn about the world:
kan göra med en film.
still won't let us do,
som jag fick för bara några månader sedan.
just a few months ago,
I've shown it to a public audience.
visar det för allmänheten.
to use the vibrations in a video
vibrationerna i en film
that will let us interact with them
så att vi kan interagera med dem,
av en människa,
in the shape of a human,
with just a regular camera.
vi har faktiskt använt min mobil förut.
about this camera.
with my cell phone before.
medan vi spelar in denna film.
on the surface where it's resting
medan vi slår på ytan,
of regular video,
the vibrations in that video
och materialens egenskaper i föremålet,
and material properties of our object,
för att skapa något nytt, interaktivt.
to create something new and interactive.
Det ser ut som en vanlig stillbild.
and it's not a video,
och det är ingen film.
och börja interagera med föremålet.
with the object.
hur föremålet
that we've never seen before,
som vi aldrig sett förut.
bara fem sekunder vanlig film.
five seconds of regular video.
way to look at the world,
att se på omvärlden,
kommer reagera på nya situationer,
how objects will respond
looking at an old bridge
att man tittar på en gammal bro
how would that bridge hold up
om jag skulle köra bil över den.
that you probably want to answer
vill besvara innan du kör över bron.
across that bridge.
begränsningar i tekniken,
limitations to this technique,
with the visual microphone,
i många oväntade situationer,
in a lot of situations
på en buske utanför mitt hus,
here's a video that I captured
förutom att filma den i en minut.
till den här simuleringen.
to create this simulation.
to a film director,
på en filmregissör,
in a shot after it's been recorded.
i en tagning efter att den blivit filmad.
at a hanging curtain,
mot ett hängande skynke,
men genom att filma i två minuter,
any motion in this video,
nog med omärkliga rörelser och vibrationer
imperceptible motions and vibrations
to create this simulation.
när det gäller virtuella föremål.
this kind of interactivity
and 3D models,
från verkliga föremål i omvärlden,
from real objects in the real world
a lot of potential.
who worked with me on these projects.
som arbetat med mig.
is only the beginning.
göra med denna typ av avbildning,
with this kind of imaging,
omgivning med vanlig, tillgänglig teknik.
with common, accessible technology.
really exciting to explore
kan lära oss om världen.
ABOUT THE SPEAKER
Abe Davis - Computer scientistComputer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.
Why you should listen
MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument. In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.
Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.
Abe Davis | Speaker | TED.com