Abe Davis: New video technology that reveals an object's hidden properties
Эйб Девис: Новая видеотехнология открывает незаметные свойства объектов
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio
Double-click the English transcript below to play the video.
что движение можно только видеть.
as a very visual thing.
or gesture with my hands while I speak,
или жестикулирую, пока говорю, —
that's too subtle for the human eye,
еле заметных человеческому глазу,
even when humans can't.
даже если их не видит человек.
of a person's wrist,
of a sleeping infant,
that these were videos,
что это видео,
at two regular images,
смотрите на два изображения.
almost completely still.
кажутся застывшими.
of subtle motion going on here,
много неуловимых движений,
the wrist on the left,
запястья на видео слева,
the infant on the right,
ребёнка на видео справа,
and fall of her chest
и опускается грудная клетка
a lot of significance,
большое значение,
too subtle for us to see,
слабы, что едва видимы.
с объектом, касаясь его.
мои коллеги из МИТа
what they call a motion microscope,
микроскоп движения —
these subtle motions in video
находит малозаметные движения на видео
become large enough for us to see.
становятся заметными для нас.
on the left video,
для видео слева,
this person's heart rate.
сердечных сокращений.
on the right video,
на видео справа,
that this infant takes,
который делает ребёнок,
to monitor her breathing.
контакта для проверки дыхания.
because it takes these phenomena
потому что использует процесс,
to experience through touch
через прикосновения,
and non-invasively.
зрительно, без вмешательства.
with the folks that created that software,
вместе с группой, создавшей эту программу,
that we can use software
использовать эту программу
as a way to extend our sense of touch.
это способ расширить наши способности.
with our ability to hear?
с нашей способностью слышать?
to capture the vibrations of sound,
видео, чтобы записать вибрации звука,
лишь одной из форм движения,
into a microphone?
видимые объекты в микрофон?
in perspective for you.
более развёрнуто.
work by converting the motion
чтобы преобразовывать движение
into an electrical signal,
в электрический сигнал,
to move readily with sound
чтобы двигаться под воздействием звука.
and interpreted as audio.
и воспроизводятся как звук.
too subtle and too fast for us to see.
чтобы их заметить.
with a high-speed camera
с помощью высокоскоростной камеры,
to extract tiny motions
извлечения незаметных движений
what sounds created them?
понять, какие звуки их вызывают?
into visual microphones from a distance.
удалённые видимые объекты в микрофоны.
that you see on the right
в горшке, его вы видите справа.
played this sound.
проигрывался звук.
[Эдисон тоже использовал её на фонографе]
of frames per second,
тысяча кадров в секунду.
just sitting there doing nothing,
совершенно не двигаются.
by about a micrometer.
листья на микрометр —
сантиметра,
a hundredth and a thousandth
одной сотой или тысячной
сколько хотите,
perceptually invisible.
что незаметно для глаза.
can be perceptually invisible
что настолько неуловимо,
seemingly still video
out of so little motion?
информации из столь малого движения?
move by just a single micrometer,
лишь на один микрометр,
by just a thousandth of a pixel.
изображение на тысячную пикселя.
of pixels in it,
of the tiny motions that we see
to something pretty significant.
из них что-то более заметное.
when we figured this out.
не сошли с ума, когда нашли это.
a pretty important piece of the puzzle.
важную деталь мозаики.
that affect when and how well
на то, когда и как хорошо
and the lens that you use;
and how loud your sound is.
и громкость звука.
with our early experiments,
с ранними экспериментами.
any of these factors wrong,
из факторов был упущен,
what the problem was.
experiments looked like this.
выглядели так.
see our high-speed camera,
высокоскоростных камер,
by these bright lamps.
very careful in these early experiments,
внимательными на первых этапах,
«Три, два, раз, запись».
Little lamb! Little lamb!
Маленький барашек! Маленький барашек!»
looks completely ridiculous.
we tried this on. (Laughter)
чипсов, пока записывали. (Смех)
to recover this sound.
восстановить звук.
Little lamb! Little lamb!
Маленький барашек! Маленький барашек!»
we recovered intelligible human speech
восстановили речь человека
to modify the experiment,
наш эксперимент,
и отодвигая их дальше от камеры,
or moving the object further away,
или используя более тихий звук.
эти эксперименты до тех пор,
the limits of our technique,
применения нашей методики,
to a bag of chips,
с упаковкой чипсов,
about 15 feet away,
камеру на 4,5 метра,
by only natural sunlight.
from inside, next to the bag of chips.
рядом с упаковкой чипсов.
whose fleece was white as snow,
Его шерсть была белой как снег,
that lamb was sure to go.
Барашек всегда следовал за ней».
to recover from our silent video
смогли восстановить из видео,
whose fleece was white as snow,
Его шерсть была белой как снег,
that lamb was sure to go.
Барашек всегда следовал за ней».
that we can push these limits as well.
plugged into a laptop computer,
подсоединённые к ноутбуку.
the music that was playing on that laptop
играющую в этом ноутбуке,
by changing the hardware that we use.
меняя аппаратуру для записи.
I've shown you so far
которые я показывал,
a high-speed camera,
высокоскоростную камеру,
about a 100 times faster
со скоростью в 100 раз больше,
сотовых телефонов.
to use this technique
применить наш метод
of what's called a rolling shutter.
record images one row at a time,
изображение объекта построчно,
during the recording of a single image,
во время записи,
between each row,
при записи строк,
is that by analyzing these artifacts,
что анализируя эти искажения,
using a modified version of our algorithm.
используя модификацию нашего алгоритма.
music from before,
был маленький барашек».
store-bought camera,
обычную камеру, купленную в магазине.
the sound that we recovered,
восстановленный звук,
distorted this time,
искажённым в этот раз,
recognize the music.
сможете ли вы узнать музыку.
is that we were able to do this
в этом то, что вы можете
that you could literally run out
буквально с камерой,
about surveillance.
this technology to spy on someone.
эту технологию для слежки.
a lot of very mature technology
технологии гораздо совершеннее
from a distance for decades.
для подслушивания.
заключается в том,
to picture the vibrations of an object,
мы снимаем вибрацию с объекта,
through which to look at the world,
с которого мы можем взглянуть на мир.
that cause an object to vibrate,
заставляющем объект вибрировать,
the ways that we use video,
привычное использование видео.
to look at things,
чтобы смотреть на вещи,
как использовать видео,
that we learn about the world:
как мы познаём мир:
чтобы понять, что произойдёт.
still won't let us do,
не даёт нам испытать,
just a few months ago,
у меня пару месяцев назад,
этой идей с широкой аудиторией.
I've shown it to a public audience.
чтобы использовать вибрации в видео
to use the vibrations in a video
that will let us interact with them
нам взаимодействовать с ним
in the shape of a human,
фигурка человека,
with just a regular camera.
обычной камерой.
about this camera.
в этой камере.
with my cell phone before.
это же с камерой в телефоне.
как объект вибрирует,
on the surface where it's resting
на которой он стоит,
of regular video,
обычного видео,
the vibrations in that video
вибрации объекта с видео,
and material properties of our object,
свойства и материал этого объекта
to create something new and interactive.
чтобы создать новый способ взаимодействия.
and it's not a video,
with the object.
that we've never seen before,
которые мы ранее не оказывали.
five seconds of regular video.
лишь 5 секунд обычного видео.
way to look at the world,
способ познания мира,
how objects will respond
как объект будет реагировать
looking at an old bridge
к примеру, смотря на старый мост
how would that bridge hold up
выдержит ли этот мост,
that you probably want to answer
захотели бы получить ответ до того,
across that bridge.
limitations to this technique,
в применении такого способа,
with the visual microphone,
с визуальным микрофоном.
in a lot of situations
работает во многих ситуациях,
более длинную по времени запись.
here's a video that I captured
на котором я заснял куст,
to create this simulation.
создания этой симуляции.
to a film director,
инструмент кинорежиссёру,
in a shot after it's been recorded.
в сцене, которую уже сняли.
at a hanging curtain,
any motion in this video,
каких-либо движений,
imperceptible motions and vibrations
движения и вибрации,
to create this simulation.
создать симуляцию.
this kind of interactivity
способу взаимодействия,
and 3D models,
from real objects in the real world
информацию от объектов реального мира,
a lot of potential.
и с большим потенциалом.
who worked with me on these projects.
с которыми я работал над этими проектами.
это только начало.
is only the beginning.
with this kind of imaging,
применяя такой подход.
простых и доступных технологий.
with common, accessible technology.
really exciting to explore
интересно узнать,
рассказать нам об окружающем мире.
ABOUT THE SPEAKER
Abe Davis - Computer scientistComputer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.
Why you should listen
MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument. In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.
Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.
Abe Davis | Speaker | TED.com