Abe Davis: New video technology that reveals an object's hidden properties
Абе Давіс: Нова технологія, яка виявляє приховані властивості об'єкта
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio
Double-click the English transcript below to play the video.
as a very visual thing.
як візуальну категорію.
or gesture with my hands while I speak,
або жестикулюю під час промови,
that's too subtle for the human eye,
є непомітними для людського ока.
even when humans can't.
навіть коли люди їх не помічають.
of a person's wrist,
зап'ястка,
of a sleeping infant,
дитини, яка спить,
that these were videos,
at two regular images,
зображення,
almost completely still.
зовсім відсутнім.
of subtle motion going on here,
безліч ледь помітних рухів,
з відео ліворуч,
the wrist on the left,
the infant on the right,
відео праворуч,
and fall of her chest
її грудна клітка
a lot of significance,
too subtle for us to see,
Массачусетського технологічного інституту
what they call a motion microscope,
these subtle motions in video
знаходить ці непомітні рухи на відео
become large enough for us to see.
щоб ми змогли їх побачити.
забезпечення до відео ліворуч,
on the left video,
серцебиття тієї людини.
this person's heart rate.
до відео праворуч,
on the right video,
цієї дитини,
that this infant takes,
безконтактний спосіб контролю її дихання.
to monitor her breathing.
адже вона дає змогу такі феномени,
because it takes these phenomena
to experience through touch
and non-invasively.
з винахідниками цього ПЗ,
with the folks that created that software,
чудернацьку ідею.
використовувати ПО
that we can use software
як ось ці,
посилити наше чуття дотику.
as a way to extend our sense of touch.
with our ability to hear?
здатністю чути?
для захоплювання звукових вібрацій,
to capture the vibrations of sound,
що ми бачимо на мікрофон?
into a microphone?
in perspective for you.
продемонструвати її для вас.
конвертацію коливань
work by converting the motion
into an electrical signal,
в електричний сигнал,
to move readily with sound
рухатись під впливом звуку
і декодувати в аудіо формат.
and interpreted as audio.
зашвидкі для нашого ока.
too subtle and too fast for us to see.
високошвидкісної камери,
with a high-speed camera
відокремлення дрібних коливань
to extract tiny motions
ці коливання?
what sounds created them?
у візуальні мікрофони на відстані.
into visual microphones from a distance.
в горщику, ви її бачите тут праворуч,
that you see on the right
played this sound.
тисячі фреймів на секунду,
of frames per second,
just sitting there doing nothing,
by about a micrometer.
приблизно на мікрометр.
між сотою і тисячною пікселя
a hundredth and a thousandth
perceptually invisible.
непомітне для сприйняття.
може бути невидимим для сприйняття
can be perceptually invisible
значенням.
відповідного алгоритму
seemingly still video
out of so little motion?
з дрібних коливань?
зрушилося лише на мікрометр,
move by just a single micrometer,
відбулась на тисячну пікселя.
by just a thousandth of a pixel.
пікселів,
of pixels in it,
видимі дрібні коливання
of the tiny motions that we see
to something pretty significant.
коли зрозуміли це.
when we figured this out.
доволі важливого елемента пазлу.
a pretty important piece of the puzzle.
які впливають на те, коли і як добре
that affect when and how well
використовуєте;
and the lens that you use;
і наскільки гучний звук.
and how loud your sound is.
перших наших спробах,
with our early experiments,
any of these factors wrong,
в чому полягала проблема.
what the problem was.
були такими.
experiments looked like this.
високошвидкісну камеру,
see our high-speed camera,
потужними лампами.
by these bright lamps.
обережними в перших спробах,
very careful in these early experiments,
Три, два, один, почали.
Маленьке ягня! Маленьке ягня!
Little lamb! Little lamb!
дуже кумедно.
looks completely ridiculous.
we tried this on. (Laughter)
експериментальний пакет. (Сміх)
такий кумедний,
to recover this sound.
Маленьке ягня! Маленьке ягня!
Little lamb! Little lamb!
we recovered intelligible human speech
зрозуміле людське мовлення
to modify the experiment,
вносити зміни в експеримент,
або збільшуючи відстань до об'єктів,
or moving the object further away,
the limits of our technique,
нашого методу,
полягають, ми могли визначити,
на кшталт ось цого.
to a bag of chips,
пакета чіпсів,
about 15 feet away,
на 4,5 метри далі,
by only natural sunlight.
природнім сонячним світлом.
поруч з пакетом чіпсів.
from inside, next to the bag of chips.
з білим мов сніг кожушком,
whose fleece was white as snow,
ягня бігло за нею хвостом.
that lamb was sure to go.
з німого відеозапису,
to recover from our silent video
з білим мов сніг кожушком,
whose fleece was white as snow,
ягня бігло за нею хвостом.
that lamb was sure to go.
обмеження.
that we can push these limits as well.
ввімкнених у портативний комп'ютер.
plugged into a laptop computer,
записати музику, яка грала на комп'ютері,
the music that was playing on that laptop
результат в Shazam.
змінюючи обладнання, яке використовуємо.
by changing the hardware that we use.
I've shown you so far
високошвидкісної камери,
a high-speed camera,
швидше,
about a 100 times faster
використовувати цей метод
to use this technique
ефект зсуву зображення.
of what's called a rolling shutter.
зображення по одному рядку в час,
record images one row at a time,
об'єкта, який рухається,
during the recording of a single image,
між рядами,
between each row,
is that by analyzing these artifacts,
ми з'ясували те, що
using a modified version of our algorithm.
модифікованої версії нашого алгоритму.
music from before,
store-bought camera,
камеру, яку можна купити в магазині,
звук, який ми записали,
the sound that we recovered,
distorted this time,
recognize the music.
музику.
що ми зробили це
is that we were able to do this
that you could literally run out
about surveillance.
спостереження.
як можна використати цю технологію
this technology to spy on someone.
існує багато готових технологій
a lot of very mature technology
люди використовують лазер
from a distance for decades.
на відстані.
фотографувати вібрації об'єкта,
to picture the vibrations of an object,
through which to look at the world,
що змушують об'єкт вібрувати,
that cause an object to vibrate,
the ways that we use video,
використання відео.
для перегляду об'єктів,
to look at things,
як ми можемо його використати
that we learn about the world:
сприйняття світу:
встромляємо і проштрикуємо речі.
робити це
still won't let us do,
виникла в мене лише кілька місяців тому.
just a few months ago,
I've shown it to a public audience.
to use the vibrations in a video
вібрації на відео,
щоб взаємодіяти з ними,
that will let us interact with them
in the shape of a human,
в формі чоловічка.
за допомогою звичайної камери.
with just a regular camera.
about this camera.
допомогою свого мобільного телефону.
with my cell phone before.
як коливається об'єкт.
on the surface where it's resting
по поверхні, на якій він стоїть
of regular video,
звичайного відео,
the vibrations in that video
and material properties of our object,
і фізичних характеристик нашого об'єкта.
створити щось нове й інтерактивне.
to create something new and interactive.
and it's not a video,
with the object.
яких ми ніколи не бачили досі,
that we've never seen before,
five seconds of regular video.
звичайного відеозапису.
way to look at the world,
сприйняття світу,
спрогнозувати, як об'єкти реагуватимуть
how objects will respond
looking at an old bridge
дивлячись на старий міст
how would that bridge hold up
як він буде триматись,
ви хочете мати відповідь,
that you probably want to answer
across that bridge.
той міст.
обмеження,
limitations to this technique,
у візуального мікрофону.
with the visual microphone,
в багатьох ситуаціях,
in a lot of situations
відеозаписами.
яке я зробив
here's a video that I captured
цього відео
вібрацій,
і створити цю симуляцію.
to create this simulation.
фільму
to a film director,
в кадрі, який вже було відзнято.
in a shot after it's been recorded.
камеру перед шторою, яка висить,
at a hanging curtain,
коливань на цьому відео,
any motion in this video,
непомітних рухів і коливань,
imperceptible motions and vibrations
аби створити цю симуляцію.
to create this simulation.
this kind of interactivity
таку інтерактивність
і 3D-моделей,
and 3D models,
справжніх об'єктів в реальному світі
from real objects in the real world
a lot of potential.
зі мною в цих проектах.
who worked with me on these projects.
це тільки початок.
is only the beginning.
with this kind of imaging,
відтворення зображень.
новий спосіб
with common, accessible technology.
допомогою простої, доступної технології.
really exciting to explore
ABOUT THE SPEAKER
Abe Davis - Computer scientistComputer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.
Why you should listen
MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument. In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.
Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.
Abe Davis | Speaker | TED.com