ABOUT THE SPEAKER
Abe Davis - Computer scientist
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.

Why you should listen

MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument.  In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.

Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.

More profile about the speaker
Abe Davis | Speaker | TED.com
TED2015

Abe Davis: New video technology that reveals an object's hidden properties

Эйб Девис: Новая видеотехнология открывает незаметные свойства объектов

Filmed:
1,482,525 views

Вокруг нас полно неуловимых движений, мельчайших колебаний, вызванных звуком. Новая технология позволяет использовать такие колебания, чтобы восстановить вызвавший их звук, используя лишь видео неподвижного объекта. Однако Эйб Девис не останавливается на этом. Смотрите презентацию программы, которая позволяет взаимодействовать со скрытыми свойствами объекта, снятого на обычное видео.
- Computer scientist
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio

Double-click the English transcript below to play the video.

Большинство из нас думают,
что движение можно только видеть.
00:13
MostНаиболее of us think of motionдвижение
as a very visualвизуальный thing.
0
1373
3349
00:17
If I walkходить acrossчерез this stageсцена
or gestureжест with my handsРуки while I speakговорить,
1
5889
5088
Когда я хожу по сцене
или жестикулирую, пока говорю, —
00:22
that motionдвижение is something that you can see.
2
10977
2261
это движение, которое вы видите.
00:26
But there's a worldМир of importantважный motionдвижение
that's too subtleтонкий for the humanчеловек eyeглаз,
3
14255
5482
Но есть и целый мир движений,
еле заметных человеческому глазу,
00:31
and over the pastмимо fewмало yearsлет,
4
19737
2041
и в течение последних лет
00:33
we'veмы в startedначал to find that camerasкамеры
5
21778
1997
мы узнали, что видеокамеры
00:35
can oftenдовольно часто see this motionдвижение
even when humansлюди can't.
6
23775
3410
могут заметить такие движения,
даже если их не видит человек.
Сейчас я покажу, что я имею ввиду.
00:40
So let me showпоказать you what I mean.
7
28305
1551
00:42
On the left here, you see videoвидео
of a person'sИндивидуальность человека wristзапястье,
8
30717
3622
Слева — видео запястья человека,
00:46
and on the right, you see videoвидео
of a sleepingспать infantмладенец,
9
34339
3147
а справа — видео спящего ребёнка.
00:49
but if I didn't tell you
that these were videosвидео,
10
37486
3146
Но если бы я не сказал вам,
что это видео,
00:52
you mightмог бы assumeпредполагать that you were looking
at two regularрегулярный imagesизображений,
11
40632
3761
вы могли бы подумать, что
смотрите на два изображения.
00:56
because in bothи то и другое casesслучаи,
12
44393
1672
Потому что в обоих случаях
00:58
these videosвидео appearпоявиться to be
almostпочти completelyполностью still.
13
46065
3047
изображения на видео
кажутся застывшими.
01:02
But there's actuallyна самом деле a lot
of subtleтонкий motionдвижение going on here,
14
50175
3885
На самом деле, там происходит
много неуловимых движений,
01:06
and if you were to touchпотрогать
the wristзапястье on the left,
15
54060
2392
и если вы могли бы коснуться
запястья на видео слева,
01:08
you would feel a pulseпульс,
16
56452
1996
то ощутили бы пульс,
01:10
and if you were to holdдержать
the infantмладенец on the right,
17
58448
2485
а если бы смогли подержать
ребёнка на видео справа,
01:12
you would feel the riseподъем
and fallпадать of her chestгрудь
18
60933
2391
то ощутили бы, как поднимается
и опускается грудная клетка
01:15
as she tookвзял eachкаждый breathдыхание.
19
63324
1390
с каждым вздохом.
01:17
And these motionsдвижения carryнести
a lot of significanceзначение,
20
65762
3576
И эти движения имеют
большое значение,
01:21
but they're usuallyкак правило
too subtleтонкий for us to see,
21
69338
3343
но они обычно настолько
слабы, что едва видимы.
01:24
so insteadвместо, we have to observeнаблюдать them
22
72681
2276
Так что мы можем ощутить их,
01:26
throughчерез directнепосредственный contactконтакт, throughчерез touchпотрогать.
23
74957
2900
непосредственно взаимодействуя
с объектом, касаясь его.
01:30
But a fewмало yearsлет agoтому назад,
24
78997
1265
Но несколько лет назад,
мои коллеги из МИТа
01:32
my colleaguesколлеги at MITMIT developedразвитая
what they call a motionдвижение microscopeмикроскоп,
25
80262
4405
создали так называемый
микроскоп движения —
01:36
whichкоторый is softwareпрограммного обеспечения that findsнаходки
these subtleтонкий motionsдвижения in videoвидео
26
84667
4384
это компьютерная программа, которая
находит малозаметные движения на видео
01:41
and amplifiesусиливается them so that they
becomeстали largeбольшой enoughдостаточно for us to see.
27
89051
3562
и усиливает их так, что они
становятся заметными для нас.
01:45
And so, if we use theirих softwareпрограммного обеспечения
on the left videoвидео,
28
93416
3483
Если мы применим программу
для видео слева,
01:48
it letsДавайте us see the pulseпульс in this wristзапястье,
29
96899
3250
то сможем увидеть пульс,
01:52
and if we were to countподсчитывать that pulseпульс,
30
100149
1695
и если мы посчитаем удары,
01:53
we could even figureфигура out
this person'sИндивидуальность человека heartсердце rateставка.
31
101844
2355
то сможем узнать частоту
сердечных сокращений.
01:57
And if we used the sameодна и та же softwareпрограммного обеспечения
on the right videoвидео,
32
105095
3065
Если мы используем программу
на видео справа,
02:00
it letsДавайте us see eachкаждый breathдыхание
that this infantмладенец takes,
33
108160
3227
то увидим каждый вдох,
который делает ребёнок,
02:03
and we can use this as a contact-freeБесконтактный way
to monitorмонитор her breathingдыхание.
34
111387
4137
мы можем видеть это без прямого
контакта для проверки дыхания.
02:08
And so this technologyтехнологии is really powerfulмощный
because it takes these phenomenaявления
35
116884
5348
Эта технология действительно мощная,
потому что использует процесс,
02:14
that we normallyкак обычно have
to experienceопыт throughчерез touchпотрогать
36
122232
2367
который мы привыкли ощущать
через прикосновения,
02:16
and it letsДавайте us captureзахватить them visuallyвизуально
and non-invasivelyнеинвазивно.
37
124599
2957
и позволяет воспринимать его
зрительно, без вмешательства.
02:21
So a coupleпара yearsлет agoтому назад, I startedначал workingза работой
with the folksлюди that createdсозданный that softwareпрограммного обеспечения,
38
129104
4411
Несколько лет назад я начал работу
вместе с группой, создавшей эту программу,
02:25
and we decidedприняли решение to pursueпреследовать a crazyпсих ideaидея.
39
133515
3367
и мы задумали проверить сумасшедшую идею.
02:28
We thought, it's coolкруто
that we can use softwareпрограммного обеспечения
40
136882
2693
Мы подумали: здорово, что можно
использовать эту программу
02:31
to visualizeвизуализировать tinyкрошечный motionsдвижения like this,
41
139575
3135
для визуализации незаметных движений
02:34
and you can almostпочти think of it
as a way to extendпростираться our senseсмысл of touchпотрогать.
42
142710
4458
и воспринимать их так, будто
это способ расширить наши способности.
02:39
But what if we could do the sameодна и та же thing
with our abilityспособность to hearзаслушивать?
43
147168
4059
А что, если мы могли бы сделать то же
с нашей способностью слышать?
02:44
What if we could use videoвидео
to captureзахватить the vibrationsвибрации of soundзвук,
44
152508
4665
Что, если мы могли бы использовать
видео, чтобы записать вибрации звука,
02:49
whichкоторый are just anotherдругой kindсвоего рода of motionдвижение,
45
157173
2827
что тоже является
лишь одной из форм движения,
02:52
and turnочередь everything that we see
into a microphoneмикрофон?
46
160000
3346
и превратить любые
видимые объекты в микрофон?
02:56
Now, this is a bitнемного of a strangeстранный ideaидея,
47
164236
1971
Это немного странная идея,
02:58
so let me try to put it
in perspectiveперспективы for you.
48
166207
2586
но давайте я поясню её
более развёрнуто.
03:01
Traditionalтрадиционный microphonesмикрофоны
work by convertingпреобразование the motionдвижение
49
169523
3488
Обычный микрофон устроен так,
чтобы преобразовывать движение
03:05
of an internalвнутренний diaphragmдиафрагма
into an electricalэлектрический signalсигнал,
50
173011
3599
внутренней мембраны
в электрический сигнал,
03:08
and that diaphragmдиафрагма is designedпредназначенный
to moveпереехать readilyлегко with soundзвук
51
176610
4318
и мембрана сделана так,
чтобы двигаться под воздействием звука.
03:12
so that its motionдвижение can be recordedзаписанный
and interpretedинтерпретированы as audioаудио.
52
180928
4807
Дальше эти вибрации записываются
и воспроизводятся как звук.
03:17
But soundзвук causesпричины all objectsобъекты to vibrateвибрировать.
53
185735
3668
Но звук заставляет все объекты колебаться.
03:21
Those vibrationsвибрации are just usuallyкак правило
too subtleтонкий and too fastбыстро for us to see.
54
189403
5480
Эти вибрации малы и слишком быстры,
чтобы их заметить.
03:26
So what if we recordзапись them
with a high-speedвысокоскоростной cameraкамера
55
194883
3738
А что, если мы запишем их
с помощью высокоскоростной камеры,
03:30
and then use softwareпрограммного обеспечения
to extractэкстракт tinyкрошечный motionsдвижения
56
198621
3576
и используем программу для
извлечения незаметных движений
03:34
from our high-speedвысокоскоростной videoвидео,
57
202197
2090
из полученного видео,
03:36
and analyzeанализировать those motionsдвижения to figureфигура out
what soundsзвуки createdсозданный them?
58
204287
4274
и обработаем движения, чтобы
понять, какие звуки их вызывают?
03:41
This would let us turnочередь visibleвидимый objectsобъекты
into visualвизуальный microphonesмикрофоны from a distanceрасстояние.
59
209859
5449
Это позволило бы нам превратить
удалённые видимые объекты в микрофоны.
03:49
And so we triedпытался this out,
60
217080
2183
Так что мы начали испытания.
03:51
and here'sвот one of our experimentsэксперименты,
61
219263
1927
Вот один из наших экспериментов,
03:53
where we tookвзял this pottedгоршечных plantрастение
that you see on the right
62
221190
2949
где мы использовали растение
в горшке, его вы видите справа.
03:56
and we filmedснят it with a high-speedвысокоскоростной cameraкамера
63
224139
2438
Мы снимали его на высокоскоростную камеру,
03:58
while a nearbyрядом, поблизости loudspeakerгромкоговоритель
playedиграл this soundзвук.
64
226577
3529
в то время как в динамике рядом
проигрывался звук.
(Музыка: «У Мэри был маленький барашек»)
[Эдисон тоже использовал её на фонографе]
04:02
(MusicМузыка: "MaryМэри Had a Little Lambягненок")
65
230275
8190
04:11
And so here'sвот the videoвидео that we recordedзаписанный,
66
239820
2824
Вот получившаяся видеозапись,
04:14
and we recordedзаписанный it at thousandsтысячи
of framesкадры perв secondвторой,
67
242644
3924
и мы записали её на скорости
тысяча кадров в секунду.
04:18
but even if you look very closelyтесно,
68
246568
2322
Но даже так, если вы всмотритесь,
04:20
all you'llВы будете see are some leavesлистья
69
248890
1951
то увидите только листья,
04:22
that are prettyСимпатичная much
just sittingсидящий there doing nothing,
70
250841
3065
которые, вероятней всего,
совершенно не двигаются.
04:25
because our soundзвук only movedпереехал those leavesлистья
by about a micrometerмикрометр.
71
253906
4806
Всё потому, что звук отклоняет
листья на микрометр —
04:31
That's one ten-thousandthдесятитысячная of a centimeterсантиметр,
72
259103
4276
это одна десятитысячная
сантиметра,
04:35
whichкоторый spansпролеты somewhereгде-то betweenмежду
a hundredthсотый and a thousandthтысячный
73
263379
4156
что равняется примерно
одной сотой или тысячной
04:39
of a pixelпиксель in this imageобраз.
74
267535
2299
от пикселя на этом изображении.
04:41
So you can squintкосоглазие all you want,
75
269881
2887
Так что вы можете вглядываться,
сколько хотите,
04:44
but motionдвижение that smallмаленький is prettyСимпатичная much
perceptuallyперцептивно invisibleневидимый.
76
272768
3335
но движение настолько мало,
что незаметно для глаза.
04:49
But it turnsвитки out that something
can be perceptuallyперцептивно invisibleневидимый
77
277667
4157
В то же время то,
что настолько неуловимо,
04:53
and still be numericallyчисленно significantзначительное,
78
281824
2809
может быть численно оценено.
04:56
because with the right algorithmsалгоритмы,
79
284633
2002
И используя подходящий алгоритм,
04:58
we can take this silentбесшумный,
seeminglyпо-видимому still videoвидео
80
286635
3687
мы можем из этого видео без звука
05:02
and we can recoverоправляться this soundзвук.
81
290322
1527
восстановить музыку.
05:04
(MusicМузыка: "MaryМэри Had a Little Lambягненок")
82
292690
7384
(Музыка: «У Мэри был маленький барашек»)
05:12
(ApplauseАплодисменты)
83
300074
5828
(Аплодисменты)
05:22
So how is this possibleвозможное?
84
310058
1939
Как же это возможно?
05:23
How can we get so much informationИнформация
out of so little motionдвижение?
85
311997
4344
Как нам удалось восстановить столько
информации из столь малого движения?
05:28
Well, let's say that those leavesлистья
moveпереехать by just a singleОдин micrometerмикрометр,
86
316341
5361
Допустим, эти листья двигаются
лишь на один микрометр,
05:33
and let's say that that shiftsсдвиги our imageобраз
by just a thousandthтысячный of a pixelпиксель.
87
321702
4308
и скажем, что это сдвигает наше
изображение на тысячную пикселя.
05:39
That mayмай not seemказаться like much,
88
327269
2572
Кажется, что этого мало,
05:41
but a singleОдин frameРамка of videoвидео
89
329841
1996
но на одном кадре такого видео
05:43
mayмай have hundredsсотни of thousandsтысячи
of pixelsпикселей in it,
90
331837
3257
могут быть сотни тысяч пикселей.
05:47
and so if we combineскомбинировать all
of the tinyкрошечный motionsдвижения that we see
91
335094
3454
Если мы соберём все микродвижения,
05:50
from acrossчерез that entireвсе imageобраз,
92
338548
2298
найденные на изображении,
05:52
then suddenlyвдруг, внезапно a thousandthтысячный of a pixelпиксель
93
340846
2623
то получим тысячи пикселей
05:55
can startНачало to addДобавить up
to something prettyСимпатичная significantзначительное.
94
343469
2775
и можем начать составлять
из них что-то более заметное.
05:58
On a personalличный noteзаметка, we were prettyСимпатичная psychedсвихнувшийся
when we figuredфигурный this out.
95
346870
3635
Честно говоря, мы чуть было
не сошли с ума, когда нашли это.
06:02
(LaughterСмех)
96
350505
2320
(Смех)
06:04
But even with the right algorithmалгоритм,
97
352825
3253
Но даже с хорошим алгоритмом
06:08
we were still missingотсутствует
a prettyСимпатичная importantважный pieceкусок of the puzzleголоволомка.
98
356078
3617
мы по-прежнему упускали
важную деталь мозаики.
06:11
You see, there are a lot of factorsфакторы
that affectаффект when and how well
99
359695
3604
Есть много факторов, влияющих
на то, когда и как хорошо
06:15
this techniqueтехника will work.
100
363299
1997
сработает эта методика.
06:17
There's the objectобъект and how farдалеко away it is;
101
365296
3204
Есть объект и расстояние до него;
06:20
there's the cameraкамера
and the lensобъектив that you use;
102
368500
2394
камера и используемые объективы;
06:22
how much lightлегкий is shiningблестящий on the objectобъект
and how loudгромкий your soundзвук is.
103
370894
4091
свет, попадающий на объект,
и громкость звука.
06:27
And even with the right algorithmалгоритм,
104
375945
3375
Даже применяя правильный алгоритм,
06:31
we had to be very carefulосторожный
with our earlyрано experimentsэксперименты,
105
379320
3390
нужно быть очень внимательным
с ранними экспериментами.
06:34
because if we got
any of these factorsфакторы wrongнеправильно,
106
382710
2392
Потому что если какой-то
из факторов был упущен,
06:37
there was no way to tell
what the problemпроблема was.
107
385102
2368
то нет способа сказать, какой именно.
06:39
We would just get noiseшум back.
108
387470
2647
Всё, что мы получим, — лишь шум.
06:42
And so a lot of our earlyрано
experimentsэксперименты lookedсмотрел like this.
109
390117
3320
Поэтому наши первые эксперименты
выглядели так.
06:45
And so here I am,
110
393437
2206
Вот я,
06:47
and on the bottomдно left, you can kindсвоего рода of
see our high-speedвысокоскоростной cameraкамера,
111
395643
4040
и слева внизу одна из наших
высокоскоростных камер,
06:51
whichкоторый is pointedзаостренный at a bagмешок of chipsчипсы,
112
399683
2183
которая направлена на пачку чипсов,
06:53
and the wholeвсе thing is litосвещенный
by these brightяркий lampsлампы.
113
401866
2949
место съёмки освещено яркими лампами.
06:56
And like I said, we had to be
very carefulосторожный in these earlyрано experimentsэксперименты,
114
404815
4365
И как я сказал, нужно было быть
внимательными на первых этапах,
07:01
so this is how it wentотправился down.
115
409180
2508
и вот как это происходило.
07:03
(Videoвидео) AbeAbe DavisДэвис: ThreeТри, two, one, go.
116
411688
3761
(Видео) Эйб Дейвис:
«Три, два, раз, запись».
07:07
MaryМэри had a little lambягненок!
Little lambягненок! Little lambягненок!
117
415449
5387
«У Мэри был маленький барашек!
Маленький барашек! Маленький барашек!»
07:12
(LaughterСмех)
118
420836
4500
(Смех)
07:17
ADОБЪЯВЛЕНИЕ: So this experimentэксперимент
looksвыглядит completelyполностью ridiculousсмешной.
119
425336
2814
ЭД: Да, эксперимент выглядит нелепым.
07:20
(LaughterСмех)
120
428150
1788
(Смех)
07:21
I mean, I'm screamingкричащий at a bagмешок of chipsчипсы --
121
429938
2345
То есть я кричу на пачку чипсов,
07:24
(LaughterСмех) --
122
432283
1551
(Смех)
07:25
and we're blastingвзрывные работы it with so much lightлегкий,
123
433834
2117
и свет настолько яркий,
07:27
we literallyбуквально meltedплавленый the first bagмешок
we triedпытался this on. (LaughterСмех)
124
435951
4479
что мы почти расплавили упаковку
чипсов, пока записывали. (Смех)
Но, несмотря на нелепость эксперимента,
07:32
But ridiculousсмешной as this experimentэксперимент looksвыглядит,
125
440525
3274
07:35
it was actuallyна самом деле really importantважный,
126
443799
1788
всё это было очень важно,
07:37
because we were ableв состоянии
to recoverоправляться this soundзвук.
127
445587
2926
потому что мы смогли
восстановить звук.
07:40
(Audioаудио) MaryМэри had a little lambягненок!
Little lambягненок! Little lambягненок!
128
448513
4712
(Аудио) «У Мэри был маленький барашек!
Маленький барашек! Маленький барашек!»
07:45
(ApplauseАплодисменты)
129
453225
4088
(Аплодисменты)
07:49
ADОБЪЯВЛЕНИЕ: And this was really significantзначительное,
130
457313
1881
ЭД: И это было действительно значимым,
07:51
because it was the first time
we recoveredвыздоровел intelligibleвразумительный humanчеловек speechречь
131
459194
4119
потому что впервые мы чётко
восстановили речь человека
из беззвучной съёмки объекта.
07:55
from silentбесшумный videoвидео of an objectобъект.
132
463424
2341
07:57
And so it gaveдал us this pointточка of referenceСправка,
133
465765
2391
Это дало нам точку отсчёта,
08:00
and graduallyпостепенно we could startНачало
to modifyмодифицировать the experimentэксперимент,
134
468156
3871
и мы могли начать изменять
наш эксперимент,
используя разные объекты
и отодвигая их дальше от камеры,
08:04
usingс помощью differentдругой objectsобъекты
or movingперемещение the objectобъект furtherв дальнейшем away,
135
472106
3805
08:07
usingс помощью lessМеньше lightлегкий or quieterтише soundsзвуки.
136
475911
2770
уменьшая освещённость
или используя более тихий звук.
Мы анализировали все
эти эксперименты до тех пор,
08:11
And we analyzedпроанализирован all of these experimentsэксперименты
137
479887
2874
08:14
untilдо we really understoodпонимать
the limitsпределы of our techniqueтехника,
138
482761
3622
пока не поняли границы
применения нашей методики,
08:18
because onceодин раз we understoodпонимать those limitsпределы,
139
486383
1950
а когда мы осознали эти границы,
08:20
we could figureфигура out how to pushОт себя them.
140
488333
2346
то смогли расширить их.
08:22
And that led to experimentsэксперименты like this one,
141
490679
3181
И мы провели следующий эксперимент:
08:25
where again, I'm going to speakговорить
to a bagмешок of chipsчипсы,
142
493860
2739
я снова разговаривал
с упаковкой чипсов,
08:28
but this time we'veмы в movedпереехал our cameraкамера
about 15 feetноги away,
143
496599
4830
но на этот раз мы отодвинули
камеру на 4,5 метра,
08:33
outsideза пределами, behindза a soundproofзвуконепроницаемый windowокно,
144
501429
2833
установив за звуконепроницаемым стеклом,
08:36
and the wholeвсе thing is litосвещенный
by only naturalнатуральный sunlightСолнечный лучик.
145
504262
2803
используя лишь естественное освещение.
И вот снятое нами видео.
08:40
And so here'sвот the videoвидео that we capturedзахваченный.
146
508529
2155
08:44
And this is what things soundedзвучало like
from insideвнутри, nextследующий to the bagмешок of chipsчипсы.
147
512450
4559
Вот звук, записанный
рядом с упаковкой чипсов.
08:49
(Audioаудио) MaryМэри had a little lambягненок
whoseчья fleeceруно was whiteбелый as snowснег,
148
517009
5038
(Аудио) «У Мэри был маленький барашек,
Его шерсть была белой как снег,
08:54
and everywhereвезде that MaryМэри wentотправился,
that lambягненок was sure to go.
149
522047
5619
И всюду, куда Мэри шла,
Барашек всегда следовал за ней».
08:59
ADОБЪЯВЛЕНИЕ: And here'sвот what we were ableв состоянии
to recoverоправляться from our silentбесшумный videoвидео
150
527666
4017
ЭД: А вот звук, который мы
смогли восстановить из видео,
09:03
capturedзахваченный outsideза пределами behindза that windowокно.
151
531683
2345
снятого за звуконепроницаемым стеклом.
09:06
(Audioаудио) MaryМэри had a little lambягненок
whoseчья fleeceруно was whiteбелый as snowснег,
152
534028
4435
(Аудио) «У Мэри был маленький барашек,
Его шерсть была белой как снег,
09:10
and everywhereвезде that MaryМэри wentотправился,
that lambягненок was sure to go.
153
538463
5457
И всюду, куда Мэри шла,
Барашек всегда следовал за ней».
09:15
(ApplauseАплодисменты)
154
543920
6501
(Аплодисменты)
09:22
ADОБЪЯВЛЕНИЕ: And there are other waysпути
that we can pushОт себя these limitsпределы as well.
155
550421
3542
ЭД: Есть другие пути расширения границ.
09:25
So here'sвот a quieterтише experimentэксперимент
156
553963
1798
Вот эксперимент с более тихим звуком,
09:27
where we filmedснят some earphonesнаушники
pluggedподключен into a laptopпортативный компьютер computerкомпьютер,
157
555761
4110
в котором мы снимали наушники,
подсоединённые к ноутбуку.
09:31
and in this caseдело, our goalЦель was to recoverоправляться
the musicМузыка that was playingиграть on that laptopпортативный компьютер
158
559871
4110
Наша цель была восстановить музыку,
играющую в этом ноутбуке,
09:35
from just silentбесшумный videoвидео
159
563981
2299
используя беззвучную съёмку
09:38
of these two little plasticпластик earphonesнаушники,
160
566280
2507
двух пластиковых наушников.
09:40
and we were ableв состоянии to do this so well
161
568787
2183
Нам удалось это настолько хорошо,
09:42
that I could even ShazamShazam our resultsРезультаты.
162
570970
2461
что даже Shazam может распознать музыку.
09:45
(LaughterСмех)
163
573431
2411
(Смех)
09:49
(MusicМузыка: "UnderПод Pressureдавление" by QueenКоролева)
164
577191
10034
(Музыка: «Under Pressure» группы «Queen»)
10:01
(ApplauseАплодисменты)
165
589615
4969
(Аплодисменты)
10:06
And we can alsoтакже pushОт себя things
by changingизменения the hardwareаппаратные средства that we use.
166
594584
4551
Мы смогли ещё дальше сдвинуть границы,
меняя аппаратуру для записи.
10:11
Because the experimentsэксперименты
I've shownпоказанный you so farдалеко
167
599135
2461
Все предыдущие эксперименты,
которые я показывал,
10:13
were doneсделанный with a cameraкамера,
a high-speedвысокоскоростной cameraкамера,
168
601596
2322
мы проводили, используя
высокоскоростную камеру,
10:15
that can recordзапись videoвидео
about a 100 timesраз fasterБыстрее
169
603918
2879
которая может записывать видео
со скоростью в 100 раз больше,
10:18
than mostбольшинство cellклетка phonesтелефоны,
170
606797
1927
чем камеры большинства
сотовых телефонов.
10:20
but we'veмы в alsoтакже foundнайденный a way
to use this techniqueтехника
171
608724
2809
Однако мы нашли способ
применить наш метод
10:23
with more regularрегулярный camerasкамеры,
172
611533
2230
с помощью обычных камер,
10:25
and we do that by takingпринятие advantageпреимущество
of what's calledназывается a rollingпрокатка shutterзатвор.
173
613763
4069
используя эффект сдвига изображения.
10:29
You see, mostбольшинство camerasкамеры
recordзапись imagesизображений one rowряд at a time,
174
617832
4798
Большинство камер записывают
изображение объекта построчно,
10:34
and so if an objectобъект movesдвижется
duringв течение the recordingзапись of a singleОдин imageобраз,
175
622630
5702
и если объект движется
во время записи,
10:40
there's a slightнезначительный time delayзадержка
betweenмежду eachкаждый rowряд,
176
628344
2717
происходит запаздывание
при записи строк,
10:43
and this causesпричины slightнезначительный artifactsартефакты
177
631061
3157
и это приводит к появлению искажений,
10:46
that get codedзакодированный into eachкаждый frameРамка of a videoвидео.
178
634218
3483
находящихся в каждом кадре видео.
10:49
And so what we foundнайденный
is that by analyzingанализирующая these artifactsартефакты,
179
637701
3806
Мы обнаружили,
что анализируя эти искажения,
10:53
we can actuallyна самом деле recoverоправляться soundзвук
usingс помощью a modifiedмодифицированный versionверсия of our algorithmалгоритм.
180
641507
4615
мы можем восстановить звук,
используя модификацию нашего алгоритма.
10:58
So here'sвот an experimentэксперимент we did
181
646122
1912
Мы провели следующий эксперимент,
11:00
where we filmedснят a bagмешок of candyконфеты
182
648034
1695
в котором снимали упаковку конфет,
11:01
while a nearbyрядом, поблизости loudspeakerгромкоговоритель playedиграл
183
649729
1741
а в динамиках рядом проигрывалась
11:03
the sameодна и та же "MaryМэри Had a Little Lambягненок"
musicМузыка from before,
184
651470
2972
всё та же музыка «У Мэри
был маленький барашек».
11:06
but this time, we used just a regularрегулярный
store-boughtпокупной cameraкамера,
185
654442
4203
Однако в этот раз мы использовали
обычную камеру, купленную в магазине.
11:10
and so in a secondвторой, I'll playиграть for you
the soundзвук that we recoveredвыздоровел,
186
658645
3174
Сейчас я проиграю
восстановленный звук,
11:13
and it's going to soundзвук
distortedискаженный this time,
187
661819
2050
и он будет немного
искажённым в этот раз,
11:15
but listen and see if you can still
recognizeпризнать the musicМузыка.
188
663869
2836
но послушайте и проверьте,
сможете ли вы узнать музыку.
(Аудио: «У Мэри был маленький барашек»)
11:19
(Audioаудио: "MaryМэри Had a Little Lambягненок")
189
667723
6223
11:37
And so, again, that soundsзвуки distortedискаженный,
190
685527
3465
И хотя звук искажён,
11:40
but what's really amazingудивительно here
is that we were ableв состоянии to do this
191
688992
4386
но по-настоящему удивительное
в этом то, что вы можете
11:45
with something
that you could literallyбуквально runбег out
192
693378
2626
проделать подобное
буквально с камерой,
11:48
and pickвыбирать up at a BestЛучший Buyкупить.
193
696004
1444
купленной в обычном магазине.
11:51
So at this pointточка,
194
699122
1363
В этот момент
11:52
a lot of people see this work,
195
700485
1974
многие из слушателей
11:54
and they immediatelyнемедленно think
about surveillanceнаблюдение.
196
702459
3413
начинают думать про слежку, прослушку.
11:57
And to be fairСправедливая,
197
705872
2415
По правде говоря,
12:00
it's not hardжесткий to imagineпредставить how you mightмог бы use
this technologyтехнологии to spyшпион on someoneкто то.
198
708287
4133
нетрудно представить, как использовать
эту технологию для слежки.
12:04
But keep in mindразум that there's alreadyуже
a lot of very matureзрелый technologyтехнологии
199
712420
3947
Но помните, что уже есть
технологии гораздо совершеннее
12:08
out there for surveillanceнаблюдение.
200
716367
1579
для подобной прослушки.
12:09
In factфакт, people have been usingс помощью lasersлазеры
201
717946
2090
Давно используются лазеры,
12:12
to eavesdropподслушивать on objectsобъекты
from a distanceрасстояние for decadesдесятилетия.
202
720036
2799
наведённые на отдалённый объект,
для подслушивания.
Но новое в этом,
12:15
But what's really newновый here,
203
723978
2025
12:18
what's really differentдругой,
204
726003
1440
принципиально отличное
заключается в том,
12:19
is that now we have a way
to pictureкартина the vibrationsвибрации of an objectобъект,
205
727443
4295
что этот способ, при помощи которого
мы снимаем вибрацию с объекта,
12:23
whichкоторый givesдает us a newновый lensобъектив
throughчерез whichкоторый to look at the worldМир,
206
731738
3413
даёт нам новый ракурс,
с которого мы можем взглянуть на мир.
12:27
and we can use that lensобъектив
207
735151
1510
Мы можем использовать его,
12:28
to learnучить not just about forcesсил like soundзвук
that causeпричина an objectобъект to vibrateвибрировать,
208
736661
4899
чтобы узнать не только о звуке,
заставляющем объект вибрировать,
12:33
but alsoтакже about the objectобъект itselfсам.
209
741560
2288
но и о самом объекте.
Вернёмся теперь немного назад
12:36
And so I want to take a stepшаг back
210
744975
1693
12:38
and think about how that mightмог бы changeизменение
the waysпути that we use videoвидео,
211
746668
4249
и подумаем, как это может изменить
привычное использование видео.
12:42
because we usuallyкак правило use videoвидео
to look at things,
212
750917
3553
Мы привыкли использовать видео,
чтобы смотреть на вещи,
12:46
and I've just shownпоказанный you how we can use it
213
754470
2322
а недавно я показал,
как использовать видео,
12:48
to listen to things.
214
756792
1857
чтобы услышать звук.
12:50
But there's anotherдругой importantважный way
that we learnучить about the worldМир:
215
758649
3971
Но есть и другой важный аспект того,
как мы познаём мир:
12:54
that's by interactingвзаимодействующий with it.
216
762620
2275
напрямую взаимодействуя с ним.
12:56
We pushОт себя and pullвытащить and pokeсовать and prodтычок things.
217
764895
3111
Мы толкаем, тянем, тычем в предметы.
13:00
We shakeвстряхивать things and see what happensпроисходит.
218
768006
3181
Мы трясём предметы,
чтобы понять, что произойдёт.
13:03
And that's something that videoвидео
still won'tне будет let us do,
219
771187
4273
И это именно то, что видео пока
не даёт нам испытать,
13:07
at leastнаименее not traditionallyпо традиции.
220
775460
2136
по крайне мере, в привычном виде.
13:09
So I want to showпоказать you some newновый work,
221
777596
1950
И я хочу показать вам новый проект,
13:11
and this is basedисходя из on an ideaидея I had
just a fewмало monthsмесяцы agoтому назад,
222
779546
2667
основанный на идее, возникшей
у меня пару месяцев назад,
так что это первый раз, когда я делюсь
этой идей с широкой аудиторией.
13:14
so this is actuallyна самом деле the first time
I've shownпоказанный it to a publicобщественности audienceаудитория.
223
782213
3301
Основная идея состоит в том,
чтобы использовать вибрации в видео
13:17
And the basicосновной ideaидея is that we're going
to use the vibrationsвибрации in a videoвидео
224
785514
5363
13:22
to captureзахватить objectsобъекты in a way
that will let us interactвзаимодействовать with them
225
790877
4481
таким образом, который бы позволил
нам взаимодействовать с ним
13:27
and see how they reactреагировать to us.
226
795358
1974
и видеть то, как предмет реагирует на нас.
13:31
So here'sвот an objectобъект,
227
799120
1764
Перед вами объект.
13:32
and in this caseдело, it's a wireпровод figureфигура
in the shapeформа of a humanчеловек,
228
800884
3832
На этот раз это проволочная
фигурка человека,
13:36
and we're going to filmфильм that objectобъект
with just a regularрегулярный cameraкамера.
229
804716
3088
и мы снимаем этот объект
обычной камерой.
13:39
So there's nothing specialособый
about this cameraкамера.
230
807804
2124
Так что нет ничего особенного
в этой камере.
13:41
In factфакт, I've actuallyна самом деле doneсделанный this
with my cellклетка phoneТелефон before.
231
809928
2961
В действительности, я проделывал
это же с камерой в телефоне.
13:44
But we do want to see the objectобъект vibrateвибрировать,
232
812889
2252
Нам необходимо увидеть,
как объект вибрирует,
13:47
so to make that happenслучаться,
233
815141
1133
и чтобы это сделать,
13:48
we're just going to bangбах a little bitнемного
on the surfaceповерхность where it's restingотдыха
234
816274
3346
мы просто постучим по той поверхности,
на которой он стоит,
13:51
while we recordзапись this videoвидео.
235
819620
2138
и запишем это на видео.
13:59
So that's it: just five5 secondsсекунд
of regularрегулярный videoвидео,
236
827398
3671
Вот и всё — пять секунд
обычного видео,
14:03
while we bangбах on this surfaceповерхность,
237
831069
2136
пока стучат по поверхности.
14:05
and we're going to use
the vibrationsвибрации in that videoвидео
238
833205
3513
Далее мы используем
вибрации объекта с видео,
14:08
to learnучить about the structuralструктурный
and materialматериал propertiesсвойства of our objectобъект,
239
836718
4544
чтобы понять конструктивные
свойства и материал этого объекта
14:13
and we're going to use that informationИнформация
to createСоздайте something newновый and interactiveинтерактивный.
240
841262
4834
и использовать эту информацию,
чтобы создать новый способ взаимодействия.
14:24
And so here'sвот what we'veмы в createdсозданный.
241
852866
2653
И вот что мы создали.
14:27
And it looksвыглядит like a regularрегулярный imageобраз,
242
855519
2229
Это выглядит как обычное изображение,
14:29
but this isn't an imageобраз,
and it's not a videoвидео,
243
857748
3111
но это не изображение, и не видео,
14:32
because now I can take my mouseмышь
244
860859
2368
потому что как только я беру мышь,
14:35
and I can startНачало interactingвзаимодействующий
with the objectобъект.
245
863227
2859
я могу воздействовать с объектом.
14:44
And so what you see here
246
872936
2357
То, что вы видите здесь, —
это симуляция того, как объект
14:47
is a simulationмоделирование of how this objectобъект
247
875389
2226
14:49
would respondотвечать to newновый forcesсил
that we'veмы в never seenвидели before,
248
877615
4458
будет реагировать на новые воздействия,
которые мы ранее не оказывали.
14:54
and we createdсозданный it from just
five5 secondsсекунд of regularрегулярный videoвидео.
249
882073
3633
И мы создали это, используя
лишь 5 секунд обычного видео.
(Аплодисменты)
14:59
(ApplauseАплодисменты)
250
887249
4715
15:09
And so this is a really powerfulмощный
way to look at the worldМир,
251
897421
3227
И это достаточно мощный
способ познания мира,
15:12
because it letsДавайте us predictпрогнозировать
how objectsобъекты will respondотвечать
252
900648
2972
потому что он может предсказывать,
как объект будет реагировать
15:15
to newновый situationsситуации,
253
903620
1823
на новые события.
15:17
and you could imagineпредставить, for instanceпример,
looking at an oldстарый bridgeмост
254
905443
3473
Вы можете представить ситуацию,
к примеру, смотря на старый мост
15:20
and wonderingинтересно what would happenслучаться,
how would that bridgeмост holdдержать up
255
908916
3527
и задаваясь вопросом: что произойдёт,
выдержит ли этот мост,
15:24
if I were to driveводить машину my carавтомобиль acrossчерез it.
256
912443
2833
если я проеду по нему на машине.
15:27
And that's a questionвопрос
that you probablyвероятно want to answerответ
257
915276
2774
И это — вопрос, на который вы
захотели бы получить ответ до того,
15:30
before you startНачало drivingвождение
acrossчерез that bridgeмост.
258
918050
2560
как проедете по мосту.
15:33
And of courseкурс, there are going to be
limitationsограничения to this techniqueтехника,
259
921988
3272
Конечно же, будут ограничения
в применении такого способа,
15:37
just like there were
with the visualвизуальный microphoneмикрофон,
260
925260
2462
так же как это было в экспериментах
с визуальным микрофоном.
15:39
but we foundнайденный that it worksработает
in a lot of situationsситуации
261
927722
3181
В то же время, мы поняли, что метод
работает во многих ситуациях,
15:42
that you mightмог бы not expectожидать,
262
930903
1875
где мы не ожидали успеха,
15:44
especiallyособенно if you give it longerдольше videosвидео.
263
932778
2768
особенно, если использовать
более длинную по времени запись.
15:47
So for exampleпример,
here'sвот a videoвидео that I capturedзахваченный
264
935546
2508
Вот, для примера, видео,
на котором я заснял куст,
15:50
of a bushкуст outsideза пределами of my apartmentквартира,
265
938054
2299
растущий во дворе дома.
15:52
and I didn't do anything to this bushкуст,
266
940353
3088
Я не делал ничего особенного с ним,
15:55
but by capturingотлов a minute-longминутный videoвидео,
267
943441
2705
а просто снимал 1 минуту.
15:58
a gentleнежный breezeветер causedвызванный enoughдостаточно vibrationsвибрации
268
946146
3378
Лёгкий ветерок создал вибрации,
16:01
that we could learnучить enoughдостаточно about this bushкуст
to createСоздайте this simulationмоделирование.
269
949524
3587
которых было достаточно для
создания этой симуляции.
16:07
(ApplauseАплодисменты)
270
955270
6142
(Аплодисменты)
16:13
And so you could imagineпредставить givingдающий this
to a filmфильм directorдиректор,
271
961412
2972
Можете представить, что даёте такой
инструмент кинорежиссёру,
16:16
and lettingсдача в аренду him controlконтроль, say,
272
964384
1719
и он сможет контролировать
16:18
the strengthпрочность and directionнаправление of windветер
in a shotвыстрел after it's been recordedзаписанный.
273
966103
4922
силу и направление ветра
в сцене, которую уже сняли.
16:24
Or, in this caseдело, we pointedзаостренный our cameraкамера
at a hangingподвешивание curtainзанавес,
274
972810
4535
А вот в этом случае мы снимали занавеску.
16:29
and you can't even see
any motionдвижение in this videoвидео,
275
977345
4129
Здесь вы не видите даже
каких-либо движений,
16:33
but by recordingзапись a two-minute-longдва-минутный videoвидео,
276
981474
2925
но за две минуты съёмок
16:36
naturalнатуральный airвоздух currentsтечения in this roomкомната
277
984399
2438
циркуляция воздуха в комнате,
16:38
createdсозданный enoughдостаточно subtleтонкий,
imperceptibleнезаметный motionsдвижения and vibrationsвибрации
278
986837
4412
создала лёгкие, едва заметные
движения и вибрации,
16:43
that we could learnучить enoughдостаточно
to createСоздайте this simulationмоделирование.
279
991249
2565
достаточные, чтобы мы смогли
создать симуляцию.
16:48
And ironicallyиронически,
280
996243
2366
Как ни парадоксально,
16:50
we're kindсвоего рода of used to havingимеющий
this kindсвоего рода of interactivityинтерактивность
281
998609
3088
но мы привыкли к такому
способу взаимодействия,
16:53
when it comesвыходит to virtualвиртуальный objectsобъекты,
282
1001697
2647
когда речь идёт о виртуальных объектах
16:56
when it comesвыходит to videoвидео gamesигры
and 3D modelsмодели,
283
1004344
3297
в видеоиграх и трёхмерных моделях.
16:59
but to be ableв состоянии to captureзахватить this informationИнформация
from realреальный objectsобъекты in the realреальный worldМир
284
1007641
4404
Но возможность получить такую же
информацию от объектов реального мира,
17:04
usingс помощью just simpleпросто, regularрегулярный videoвидео,
285
1012045
2817
используя простое, обычное видео, —
17:06
is something newновый that has
a lot of potentialпотенциал.
286
1014862
2183
это действительно что-то новое
и с большим потенциалом.
17:10
So here are the amazingудивительно people
who workedработал with me on these projectsпроектов.
287
1018410
4904
Вот замечательные люди,
с которыми я работал над этими проектами.
17:16
(ApplauseАплодисменты)
288
1024057
5596
(Аплодисменты)
И то, что я вам показал сегодня, —
это только начало.
17:24
And what I've shownпоказанный you todayCегодня
is only the beginningначало.
289
1032819
3057
17:27
We'veУ нас just startedначал to scratchцарапина the surfaceповерхность
290
1035876
2113
Мы только начали по-настоящему узнавать,
17:29
of what you can do
with this kindсвоего рода of imagingизображений,
291
1037989
2972
чего можно достигнуть,
применяя такой подход.
17:32
because it givesдает us a newновый way
292
1040961
2286
Это даёт нам новый способ
запечатлеть окружающее с помощью
простых и доступных технологий.
17:35
to captureзахватить our surroundingsокружение
with commonобщий, accessibleдоступной technologyтехнологии.
293
1043342
4724
17:40
And so looking to the futureбудущее,
294
1048066
1929
И заглядывая в будущее,
17:41
it's going to be
really excitingзахватывающе to exploreисследовать
295
1049995
2037
будет по-настоящему
интересно узнать,
17:44
what this can tell us about the worldМир.
296
1052032
1856
что эта технология сможет
рассказать нам об окружающем мире.
17:46
Thank you.
297
1054381
1204
Спасибо.
17:47
(ApplauseАплодисменты)
298
1055610
6107
(Аплодисменты)
Translated by Lirit Fuksman

▲Back to top

ABOUT THE SPEAKER
Abe Davis - Computer scientist
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.

Why you should listen

MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument.  In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.

Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.

More profile about the speaker
Abe Davis | Speaker | TED.com