ABOUT THE SPEAKER
Abe Davis - Computer scientist
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.

Why you should listen

MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument.  In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.

Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.

More profile about the speaker
Abe Davis | Speaker | TED.com
TED2015

Abe Davis: New video technology that reveals an object's hidden properties

Abe Davis: Neue Video-Technologie enthüllt versteckte Eigenschaften von Objekten

Filmed:
1,482,525 views

Um uns herum gibt es ständig kaum sichtbare Bewegungen, wie z. B. winzige Schwingungen, die durch Schall verursacht werden. Eine neue Technologie zeigt, dass wir diese Schwingungen aufzeichnen und Töne und Gespräche wiederherstellen können, und das nur aus einem Video eines scheinbar unbewegten Gegenstandes. Aber Abe Davis geht noch einen Schritt weiter: Sehen Sie sich seine Demonstration einer Software an, die jeden nur durch ein ganz normales Video mit versteckten Eigenschaften eines Objekts interagieren lässt.
- Computer scientist
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio

Double-click the English transcript below to play the video.

00:13
MostDie meisten of us think of motionBewegung
as a very visualvisuell thing.
0
1373
3349
Die meisten halten Bewegung
für etwas Visuelles.
00:17
If I walkgehen acrossüber this stageStufe
or gestureGeste with my handsHände while I speaksprechen,
1
5889
5088
Wenn ich über diese Bühne laufe
oder beim Sprechen
Gesten mit den Händen mache,
00:22
that motionBewegung is something that you can see.
2
10977
2261
ist das eine Bewegung,
die Sie sehen können.
00:26
But there's a worldWelt of importantwichtig motionBewegung
that's too subtlesubtil for the humanMensch eyeAuge,
3
14255
5482
Aber es gibt wichtige Bewegungen,
die das menschliche Auge nicht sieht.
00:31
and over the pastVergangenheit fewwenige yearsJahre,
4
19737
2041
In den letzten paar Jahren
haben wir herausgefunden,
00:33
we'vewir haben startedhat angefangen to find that camerasKameras
5
21778
1997
dass Kameras diese
Bewegungen sehen können,
00:35
can oftenhäufig see this motionBewegung
even when humansMenschen can't.
6
23775
3410
auch wenn es die Menschen nicht können.
00:40
So let me showShow you what I mean.
7
28305
1551
Ich möchte Ihnen zeigen,
was ich meine.
00:42
On the left here, you see videoVideo
of a person'sPerson wristHandgelenk,
8
30717
3622
Links sehen Sie
das Video eines Handgelenks
00:46
and on the right, you see videoVideo
of a sleepingSchlafen infantSäugling,
9
34339
3147
und rechts das Video
eines schlafenden Kleinkinds,
00:49
but if I didn't tell you
that these were videosVideos,
10
37486
3146
aber wenn ich Ihnen nicht gesagt hätte,
dass das Videos sind,
00:52
you mightMacht assumeannehmen that you were looking
at two regularregulär imagesBilder,
11
40632
3761
hätten Sie vielleicht angenommen,
Sie würden zwei normale Bilder anschauen,
00:56
because in bothbeide casesFälle,
12
44393
1672
denn in beiden Fällen
00:58
these videosVideos appearerscheinen to be
almostfast completelyvollständig still.
13
46065
3047
scheinen diese Videos
völlig still zu stehen.
01:02
But there's actuallytatsächlich a lot
of subtlesubtil motionBewegung going on here,
14
50175
3885
Aber in Wirklichkeit ist hier jede Menge
subtile Bewegung im Gange
und wenn Sie das Handgelenk
links berühren könnten,
01:06
and if you were to touchberühren
the wristHandgelenk on the left,
15
54060
2392
01:08
you would feel a pulseImpuls,
16
56452
1996
dann würden Sie den Pulsschlag spüren,
01:10
and if you were to holdhalt
the infantSäugling on the right,
17
58448
2485
und wenn Sie das Kleinkind
rechts halten würden,
01:12
you would feel the riseerhebt euch
and fallfallen of her chestBrust
18
60933
2391
dann würden Sie das Heben
seiner Brust spüren,
01:15
as she tookdauerte eachjede einzelne breathAtem.
19
63324
1390
wenn es atmet.
01:17
And these motionsAnträge carrytragen
a lot of significanceBedeutung,
20
65762
3576
Diese Bewegungen sind
von großer Bedeutung,
01:21
but they're usuallygewöhnlich
too subtlesubtil for us to see,
21
69338
3343
aber normalerweise
für uns nicht sichtbar.
01:24
so insteadstattdessen, we have to observebeobachten them
22
72681
2276
Also müssen wir sie
durch direkten Kontakt,
durch Berührung, feststellen.
01:26
throughdurch directdirekt contactKontakt, throughdurch touchberühren.
23
74957
2900
01:30
But a fewwenige yearsJahre agovor,
24
78997
1265
Aber vor ein paar Jahren
01:32
my colleaguesKollegen at MITMIT developedentwickelt
what they call a motionBewegung microscopeMikroskop,
25
80262
4405
haben meine Kollegen am MIT
ein sogenanntes
Bewegungs-Mikroskop entwickelt,
01:36
whichwelche is softwareSoftware that findsfindet
these subtlesubtil motionsAnträge in videoVideo
26
84667
4384
eine Software, die diese subtilen
Bewegungen in einem Video finden
01:41
and amplifiesverstärkt them so that they
becomewerden largegroß enoughgenug for us to see.
27
89051
3562
und verstärken kann, sodass sie groß genug
für das menschliche Auge sind.
Wenn wir also diese Software
auf das Video links anwenden,
01:45
And so, if we use theirihr softwareSoftware
on the left videoVideo,
28
93416
3483
01:48
it letsLasst uns us see the pulseImpuls in this wristHandgelenk,
29
96899
3250
können wir den Pulsschlag
am Handgelenk erkennen
und wenn wir den Puls zählen würden,
01:52
and if we were to countGraf that pulseImpuls,
30
100149
1695
01:53
we could even figureZahl out
this person'sPerson heartHerz ratePreis.
31
101844
2355
könnten wir sogar die Herzfrequenz
dieser Person herausfinden.
01:57
And if we used the samegleich softwareSoftware
on the right videoVideo,
32
105095
3065
Wenn wir die Software
auf das Video rechts anwenden würden,
02:00
it letsLasst uns us see eachjede einzelne breathAtem
that this infantSäugling takes,
33
108160
3227
können wir jeden Atemzug erkennen,
den das Kleinkind macht,
und wir könnten ohne Berührung
seine Atmung überwachen.
02:03
and we can use this as a contact-freeberührungslos way
to monitorMonitor her breathingAtmung.
34
111387
4137
02:08
And so this technologyTechnologie is really powerfulmächtig
because it takes these phenomenaPhänomene
35
116884
5348
Diese Technologie ist sehr beeindruckend,
da wir diese Phänomene,
die wir bisher durch
Berührung erfahren mussten,
02:14
that we normallynormalerweise have
to experienceErfahrung throughdurch touchberühren
36
122232
2367
02:16
and it letsLasst uns us captureErfassung them visuallyvisuell
and non-invasivelynicht-invasiv.
37
124599
2957
nun visuell non-invasiv erfassen können.
02:21
So a couplePaar yearsJahre agovor, I startedhat angefangen workingArbeiten
with the folksLeute that createderstellt that softwareSoftware,
38
129104
4411
Vor ein paar Jahren begann ich, mit
den Erfindern der Software zu arbeiten
02:25
and we decidedbeschlossen to pursueverfolgen a crazyverrückt ideaIdee.
39
133515
3367
und wir beschlossen,
eine verrückte Idee zu verfolgen.
02:28
We thought, it's coolcool
that we can use softwareSoftware
40
136882
2693
Wir fanden es cool,
mit Hilfe einer Software
02:31
to visualizevisualisieren tinysehr klein motionsAnträge like this,
41
139575
3135
winzige Bewegungen wie diese
sichtbar zu machen
02:34
and you can almostfast think of it
as a way to extenderweitern our senseSinn of touchberühren.
42
142710
4458
und es beinahe als eine Erweiterung
unseres Tastsinnes zu sehen.
02:39
But what if we could do the samegleich thing
with our abilityFähigkeit to hearhören?
43
147168
4059
Aber könnten wir auch das Gleiche
mit unserem Hörvermögen machen?
02:44
What if we could use videoVideo
to captureErfassung the vibrationsSchwingungen of soundklingen,
44
152508
4665
Was, wenn wir mit einem Video
Schallschwingungen aufzeichnen könnten,
02:49
whichwelche are just anotherein anderer kindArt of motionBewegung,
45
157173
2827
die einfach eine andere Form
von Bewegung sind,
02:52
and turnWende everything that we see
into a microphoneMikrofon?
46
160000
3346
und alles was wir sehen,
in ein Mikrofon verwandeln?
02:56
Now, this is a bitBit of a strangekomisch ideaIdee,
47
164236
1971
Das mag eine seltsame Idee sein,
02:58
so let me try to put it
in perspectivePerspektive for you.
48
166207
2586
also möchte ich
den Zusammenhang erklären.
03:01
TraditionalTraditionelle microphonesMikrofone
work by convertingkonvertierend the motionBewegung
49
169523
3488
Klassische Mikrofone konvertieren Bewegung
03:05
of an internalintern diaphragmMembran
into an electricalelektrisch signalSignal,
50
173011
3599
einer inneren Membran
in ein elektrisches Signal.
03:08
and that diaphragmMembran is designedentworfen
to moveBewegung readilyleicht with soundklingen
51
176610
4318
Diese Membran
bewegt sich bei jedem Laut,
03:12
so that its motionBewegung can be recordedverzeichnet
and interpretedinterpretiert as audioAudio-.
52
180928
4807
sodass seine Bewegung
als Ton aufgezeichnet werden kann.
03:17
But soundklingen causesUrsachen all objectsObjekte to vibratevibrieren.
53
185735
3668
Aber Schall regt alle Gegenstände
zur Vibration an.
03:21
Those vibrationsSchwingungen are just usuallygewöhnlich
too subtlesubtil and too fastschnell for us to see.
54
189403
5480
Diese Vibrationen sind gewöhnlich zu
subtil und schnell für unser Auge.
03:26
So what if we recordAufzeichnung them
with a high-speedschnelle Geschwindigkeit cameraKamera
55
194883
3738
Was aber, wenn wir sie mit einer
Hochgeschwindigkeitskamera aufzeichnen
03:30
and then use softwareSoftware
to extractExtrakt tinysehr klein motionsAnträge
56
198621
3576
und eine Software benutzen,
um winzige Bewegungen
03:34
from our high-speedschnelle Geschwindigkeit videoVideo,
57
202197
2090
aus unserem Video zu entnehmen
03:36
and analyzeanalysieren those motionsAnträge to figureZahl out
what soundsGeräusche createderstellt them?
58
204287
4274
und diese Bewegungen zu analysieren,
um den auslösenden Ton zu entdecken?
03:41
This would let us turnWende visiblesichtbar objectsObjekte
into visualvisuell microphonesMikrofone from a distanceEntfernung.
59
209859
5449
So könnten wir sichtbare Gegenstände
in visuelle Mikrofone umwandeln.
03:49
And so we triedversucht this out,
60
217080
2183
Also wir haben wir das ausprobiert
03:51
and here'shier ist one of our experimentsExperimente,
61
219263
1927
und das war eines unserer Experimente.
03:53
where we tookdauerte this pottedTopfpflanzen plantPflanze
that you see on the right
62
221190
2949
Wir filmten eine Topfpflanze,
die Sie hier rechts sehen,
03:56
and we filmedgefilmt it with a high-speedschnelle Geschwindigkeit cameraKamera
63
224139
2438
mit einer Hochgeschwindigkeitskamera,
03:58
while a nearbyin der Nähe loudspeakerLautsprecher
playedgespielt this soundklingen.
64
226577
3529
während aus einem Lautsprecher
das folgende Lied spielte:
04:02
(MusicMusik: "MaryMary Had a Little LambLamm")
65
230275
8190
(Musik: "Mary Had a Little Lamb")
04:11
And so here'shier ist the videoVideo that we recordedverzeichnet,
66
239820
2824
Das ist das Video,
das wir aufgezeichnet haben.
04:14
and we recordedverzeichnet it at thousandsTausende
of framesRahmen perpro secondzweite,
67
242644
3924
Wir haben es mit 1 000 Bildern
pro Sekunde aufgezeichnet,
04:18
but even if you look very closelyeng,
68
246568
2322
aber selbst wenn Sie
sehr genau hinschauen,
04:20
all you'lldu wirst see are some leavesBlätter
69
248890
1951
sehen sie nur ein paar Blätter,
04:22
that are prettyziemlich much
just sittingSitzung there doing nothing,
70
250841
3065
die einfach dort sind und nichts tun,
04:25
because our soundklingen only movedbewegt those leavesBlätter
by about a micrometerMikrometer.
71
253906
4806
weil unser Schall diese Blätter
gerade mal einen Mikrometer bewegt hat.
04:31
That's one ten-thousandthZehntausendstel of a centimeterZentimeter,
72
259103
4276
Das ist ein Zehntausendstel
eines Zentimeters,
04:35
whichwelche spansüberspannt somewhereirgendwo betweenzwischen
a hundredthHundertstel and a thousandthTausendstel
73
263379
4156
das umfasst etwas zwischen einem
Hundertstel und einem Tausendstel Pixel
04:39
of a pixelPixel in this imageBild.
74
267535
2299
in diesem Bild.
04:41
So you can squintSchielen all you want,
75
269881
2887
Sie können also so viel blinzeln
wie Sie wollen,
04:44
but motionBewegung that smallklein is prettyziemlich much
perceptuallyWahrnehmung invisibleunsichtbar.
76
272768
3335
aber diese kleine Bewegung
ist so gut wie unsichtbar.
04:49
But it turnswendet sich out that something
can be perceptuallyWahrnehmung invisibleunsichtbar
77
277667
4157
Aber in Wahrheit kann etwas unsichtbar
04:53
and still be numericallynumerisch significantsignifikant,
78
281824
2809
und dennoch numerisch bedeutend sein,
04:56
because with the right algorithmsAlgorithmen,
79
284633
2002
denn mit den richtigen Algorithmen
04:58
we can take this silentLeise,
seeminglyscheinbar still videoVideo
80
286635
3687
können wir bei diesem stummen,
scheinbar bewegungslosen Video
05:02
and we can recovererholen this soundklingen.
81
290322
1527
den Ton wiederherstellen.
05:04
(MusicMusik: "MaryMary Had a Little LambLamm")
82
292690
7384
(Musik: "Mary Had a Little Lamb")
05:12
(ApplauseApplaus)
83
300074
5828
(Applaus)
05:22
So how is this possiblemöglich?
84
310058
1939
Wie ist das möglich?
05:23
How can we get so much informationInformation
out of so little motionBewegung?
85
311997
4344
Wie können wir so viele Informationen
aus so wenig Bewegung herausbekommen?
05:28
Well, let's say that those leavesBlätter
moveBewegung by just a singleSingle micrometerMikrometer,
86
316341
5361
Nehmen wir an, dass diese Blätter sich
nur einen einzigen Mikrometer bewegen
05:33
and let's say that that shiftsVerschiebungen our imageBild
by just a thousandthTausendstel of a pixelPixel.
87
321702
4308
und dass das unser Bild nur
um ein tausendstel Pixel bewegt.
05:39
That maykann not seemscheinen like much,
88
327269
2572
Das mag nicht viel erscheinen,
05:41
but a singleSingle frameRahmen of videoVideo
89
329841
1996
doch ein einziges Bild eines Videos
05:43
maykann have hundredsHunderte of thousandsTausende
of pixelsPixel in it,
90
331837
3257
besteht aus hunderttausenden Pixeln
05:47
and so if we combinekombinieren all
of the tinysehr klein motionsAnträge that we see
91
335094
3454
und wenn wir all diese
winzigen Bewegungen
05:50
from acrossüber that entireganz imageBild,
92
338548
2298
aus dem ganzen Bild kombinieren,
05:52
then suddenlyplötzlich a thousandthTausendstel of a pixelPixel
93
340846
2623
kann sich ein tausendstel Pixel auf einmal
05:55
can startAnfang to addhinzufügen up
to something prettyziemlich significantsignifikant.
94
343469
2775
zu etwas Bedeutendem aufaddieren.
05:58
On a personalpersönlich noteHinweis, we were prettyziemlich psychedaufgedreht
when we figuredabgebildet this out.
95
346870
3635
Ehrlich gesagt waren wir bei
dieser Entdeckung völlig aus dem Häuschen.
06:02
(LaughterLachen)
96
350505
2320
(Gelächter)
06:04
But even with the right algorithmAlgorithmus,
97
352825
3253
Aber sogar mit dem richtigen Algorithmus
06:08
we were still missingfehlt
a prettyziemlich importantwichtig pieceStück of the puzzlePuzzle.
98
356078
3617
fehlte uns immer noch
ein sehr wichtiges Puzzlestück.
06:11
You see, there are a lot of factorsFaktoren
that affectbeeinflussen when and how well
99
359695
3604
Es gibt sehr viele Parameter,
die einen Einfluss darauf haben,
06:15
this techniqueTechnik will work.
100
363299
1997
wie gut diese Technik funktioniert.
06:17
There's the objectObjekt and how farweit away it is;
101
365296
3204
Es hängt von dem Gegenstand
und seiner Entfernung ab,
06:20
there's the cameraKamera
and the lensLinse that you use;
102
368500
2394
von der Kamera und der benutzten Linse,
06:22
how much lightLicht is shiningleuchtenden on the objectObjekt
and how loudlaut your soundklingen is.
103
370894
4091
wie viel Licht auf den Gegenstand fällt
und wie laut der Ton ist.
06:27
And even with the right algorithmAlgorithmus,
104
375945
3375
Und sogar mit dem richtigen Algorithmus
06:31
we had to be very carefulvorsichtig
with our earlyfrüh experimentsExperimente,
105
379320
3390
mussten wir sehr vorsichtig
in unseren ersten Experimenten sein,
06:34
because if we got
any of these factorsFaktoren wrongfalsch,
106
382710
2392
denn bei nur einem falsch
eingestellten Parameter
06:37
there was no way to tell
what the problemProblem was.
107
385102
2368
gibt es keine Möglichkeit,
die Fehlerquelle zu finden.
06:39
We would just get noiseLärm back.
108
387470
2647
Wir hätten nur Rauschen gehört.
06:42
And so a lot of our earlyfrüh
experimentsExperimente lookedsah like this.
109
390117
3320
Viele unserer ersten
Experimente sahen so aus.
06:45
And so here I am,
110
393437
2206
Hier bin ich
06:47
and on the bottomBoden left, you can kindArt of
see our high-speedschnelle Geschwindigkeit cameraKamera,
111
395643
4040
und unten links können Sie unsere
Hochgeschwindigkeitskamera sehen,
06:51
whichwelche is pointedspitz at a bagTasche of chipsChips,
112
399683
2183
die auf eine Tüte Chips zeigt
06:53
and the wholeganze thing is litzündete
by these brighthell lampsLampen.
113
401866
2949
und das Ganze wird
mit hellen Lampen beleuchtet.
06:56
And like I said, we had to be
very carefulvorsichtig in these earlyfrüh experimentsExperimente,
114
404815
4365
Wie bereits gesagt, mussten wir
zu Beginn sehr vorsichtig sein,
07:01
so this is how it wentging down.
115
409180
2508
und so ging es dann weiter:
07:03
(VideoVideo) AbeAbe DavisDavis: ThreeDrei, two, one, go.
116
411688
3761
(Video) Abe Davis: 3, 2, 1, los.
07:07
MaryMary had a little lambLamm!
Little lambLamm! Little lambLamm!
117
415449
5387
Mary had a little lamb!
Little lamb! Little lamb!
07:12
(LaughterLachen)
118
420836
4500
(Gelächter)
07:17
ADN. CHR.: So this experimentExperiment
lookssieht aus completelyvollständig ridiculouslächerlich.
119
425336
2814
Dieses Experiment
sieht völlig lächerlich aus.
07:20
(LaughterLachen)
120
428150
1788
(Gelächter)
07:21
I mean, I'm screamingschreiend at a bagTasche of chipsChips --
121
429938
2345
Also, ich schreie eine Tüte Chips an --
07:24
(LaughterLachen) --
122
432283
1551
(Gelächter)
07:25
and we're blastingSprengung it with so much lightLicht,
123
433834
2117
und wir strahlen sie mit so viel Licht an,
07:27
we literallybuchstäblich meltedgeschmolzen the first bagTasche
we triedversucht this on. (LaughterLachen)
124
435951
4479
dass wir die erste Tüte buchstäblich
geschmolzen haben.
07:32
But ridiculouslächerlich as this experimentExperiment lookssieht aus,
125
440525
3274
Aber so lächerlich das Experiment scheint,
07:35
it was actuallytatsächlich really importantwichtig,
126
443799
1788
es war tatsächlich sehr wichtig,
07:37
because we were ablefähig
to recovererholen this soundklingen.
127
445587
2926
denn wir waren in der Lage,
diese Laute wiederherzustellen.
07:40
(AudioAudio) MaryMary had a little lambLamm!
Little lambLamm! Little lambLamm!
128
448513
4712
(Ton) Mary had a little lamb!
Little lamb! Little lamb!
07:45
(ApplauseApplaus)
129
453225
4088
(Applaus)
07:49
ADN. CHR.: And this was really significantsignifikant,
130
457313
1881
Das war sehr bedeutend,
07:51
because it was the first time
we recoveredwiederhergestellt intelligibleverständliche humanMensch speechRede
131
459194
4119
weil wir zum ersten Mal
eine verständliche menschliche Sprache
aus einem stummen Video eines Gegenstandes
wiederherstellen konnten.
07:55
from silentLeise videoVideo of an objectObjekt.
132
463424
2341
07:57
And so it gavegab us this pointPunkt of referenceReferenz,
133
465765
2391
Das gab uns einen Anhaltspunkt
08:00
and graduallyallmählich we could startAnfang
to modifyändern the experimentExperiment,
134
468156
3871
und wir konnten das Experiment
schrittweise verändern,
08:04
usingmit differentanders objectsObjekte
or movingbewegend the objectObjekt furtherdes Weiteren away,
135
472106
3805
indem wir andere Gegenstände benutzten
oder sie weiter weg bewegten
08:07
usingmit lessWeniger lightLicht or quieterleiser soundsGeräusche.
136
475911
2770
und weniger Licht
oder leisere Töne benutzten.
08:11
And we analyzedanalysiert all of these experimentsExperimente
137
479887
2874
Wir analysierten alle diese Experimente,
08:14
untilbis we really understoodverstanden
the limitsGrenzen of our techniqueTechnik,
138
482761
3622
bis wir die Grenzen
unserer Technik begriffen,
08:18
because onceEinmal we understoodverstanden those limitsGrenzen,
139
486383
1950
denn dann wussten wir,
wie wir sie überschreiten konnten.
08:20
we could figureZahl out how to pushdrücken them.
140
488333
2346
08:22
And that led to experimentsExperimente like this one,
141
490679
3181
Das führte zu folgendem Experiment,
08:25
where again, I'm going to speaksprechen
to a bagTasche of chipsChips,
142
493860
2739
bei dem ich wieder
zu einer Tüte Chips spreche,
08:28
but this time we'vewir haben movedbewegt our cameraKamera
about 15 feetFüße away,
143
496599
4830
aber dieses Mal haben wir die Kamera
etwa 5 Meter wegbewegt,
08:33
outsidedraußen, behindhinter a soundproofschalldicht windowFenster,
144
501429
2833
nach draußen hinter
eine schalldichte Scheibe
08:36
and the wholeganze thing is litzündete
by only naturalnatürlich sunlightSonnenlicht.
145
504262
2803
und das Ganze wird nur
von Sonnenlicht beleuchtet.
08:40
And so here'shier ist the videoVideo that we capturedgefangen.
146
508529
2155
Hier das Video,
das wir aufgezeichnet haben.
08:44
And this is what things soundedklang like
from insideinnen, nextNächster to the bagTasche of chipsChips.
147
512450
4559
So hat es sich in der Nähe
der Tüte Chips angehört:
08:49
(AudioAudio) MaryMary had a little lambLamm
whosederen fleeceVlies was whiteWeiß as snowSchnee,
148
517009
5038
(Ton) Mary had a little lamb
whose fleece was white as snow,
08:54
and everywhereüberall that MaryMary wentging,
that lambLamm was sure to go.
149
522047
5619
and everywhere that Mary went,
that lamb was sure to go.
08:59
ADN. CHR.: And here'shier ist what we were ablefähig
to recovererholen from our silentLeise videoVideo
150
527666
4017
AD: Das haben wir aus dem
stummen Video wiedergewonnen,
09:03
capturedgefangen outsidedraußen behindhinter that windowFenster.
151
531683
2345
das wir außerhalb des Fensters
aufgezeichnet hatten.
09:06
(AudioAudio) MaryMary had a little lambLamm
whosederen fleeceVlies was whiteWeiß as snowSchnee,
152
534028
4435
(Ton) Mary had a little lamb
whose fleece was white as snow,
09:10
and everywhereüberall that MaryMary wentging,
that lambLamm was sure to go.
153
538463
5457
and everywhere that Mary went,
that lamb was sure to go.
09:15
(ApplauseApplaus)
154
543920
6501
(Applaus)
09:22
ADN. CHR.: And there are other waysWege
that we can pushdrücken these limitsGrenzen as well.
155
550421
3542
AD: Es gibt noch andere Möglichkeiten,
die Grenzen zu erweitern.
09:25
So here'shier ist a quieterleiser experimentExperiment
156
553963
1798
Das ist ein ruhigeres Experiment,
09:27
where we filmedgefilmt some earphonesKopfhörer
pluggedangeschlossen into a laptopLaptop computerComputer,
157
555761
4110
bei dem wir Kopfhörer filmten,
die in einen Laptop eingesteckt waren,
09:31
and in this caseFall, our goalTor was to recovererholen
the musicMusik- that was playingspielen on that laptopLaptop
158
559871
4110
mit dem Ziel, die Musik wieder
herzustellen, die auf dem Laptop lief,
09:35
from just silentLeise videoVideo
159
563981
2299
nur von diesem stummen Video
09:38
of these two little plasticKunststoff earphonesKopfhörer,
160
566280
2507
dieser zwei Mini-Kopfhörer.
09:40
and we were ablefähig to do this so well
161
568787
2183
Auch das gelang uns so gut,
09:42
that I could even ShazamShazam our resultsErgebnisse.
162
570970
2461
dass das Ergebnis sogar von
einer Musiksoftware erkannt wurde.
09:45
(LaughterLachen)
163
573431
2411
(Gelächter)
09:49
(MusicMusik: "UnderUnter PressureDruck" by QueenKönigin)
164
577191
10034
(Musik: "Under Pressure" von Queen)
10:01
(ApplauseApplaus)
165
589615
4969
(Applaus)
10:06
And we can alsoebenfalls pushdrücken things
by changingÄndern the hardwareHardware- that we use.
166
594584
4551
Wir können die Dinge vorantreiben,
in dem wir die Hardware ändern.
10:11
Because the experimentsExperimente
I've showngezeigt you so farweit
167
599135
2461
Denn die bisher gezeigten Experimente
10:13
were doneerledigt with a cameraKamera,
a high-speedschnelle Geschwindigkeit cameraKamera,
168
601596
2322
waren mit einer
Hochgeschwindigkeitskamera aufgezeichnet,
10:15
that can recordAufzeichnung videoVideo
about a 100 timesmal fasterschneller
169
603918
2879
die ein Video 100-mal schneller
aufzeichnen kann
10:18
than mostdie meisten cellZelle phonesTelefone,
170
606797
1927
als die meisten Handys,
10:20
but we'vewir haben alsoebenfalls foundgefunden a way
to use this techniqueTechnik
171
608724
2809
aber wir haben auch einen Weg gefunden,
diese Technik mit
normaleren Kameras zu nutzen.
10:23
with more regularregulär camerasKameras,
172
611533
2230
10:25
and we do that by takingunter advantageVorteil
of what's callednamens a rollingrollend shutterAuslöser.
173
613763
4069
Wir nutzen den sogenannten
Rolling-Shutter-Effekt aus.
10:29
You see, mostdie meisten camerasKameras
recordAufzeichnung imagesBilder one rowReihe at a time,
174
617832
4798
Die meisten Kameras zeichnen
Bilder zeilenweise auf
10:34
and so if an objectObjekt movesbewegt
duringwährend the recordingAufzeichnung of a singleSingle imageBild,
175
622630
5702
und wenn sich ein Objekt
gleichzeitig bewegt,
10:40
there's a slightleicht time delayverzögern
betweenzwischen eachjede einzelne rowReihe,
176
628344
2717
gibt es eine kurze Verzögerung
zwischen den einzelnen Zeilen,
10:43
and this causesUrsachen slightleicht artifactsArtefakte
177
631061
3157
was leichte Bildstörungen verursacht,
10:46
that get codedcodiert into eachjede einzelne frameRahmen of a videoVideo.
178
634218
3483
die in den Einzelbildern
eines Videos kodiert werden.
10:49
And so what we foundgefunden
is that by analyzingAnalyse these artifactsArtefakte,
179
637701
3806
Wir fanden heraus, dass wir beim
Analysieren der Bildstörungen
10:53
we can actuallytatsächlich recovererholen soundklingen
usingmit a modifiedgeändert versionVersion of our algorithmAlgorithmus.
180
641507
4615
den Ton mit einem angepassten Algorithmus
wiederherstellen können.
10:58
So here'shier ist an experimentExperiment we did
181
646122
1912
Das ist unser Experiment,
bei dem wir eine Tüte
Süßigkeiten gefilmt haben,
11:00
where we filmedgefilmt a bagTasche of candySüßigkeiten
182
648034
1695
11:01
while a nearbyin der Nähe loudspeakerLautsprecher playedgespielt
183
649729
1741
während ein Lautsprecher das Lied
11:03
the samegleich "MaryMary Had a Little LambLamm"
musicMusik- from before,
184
651470
2972
"Mary Had a Little Lamb" spielte.
Aber dieses Mal benutzen wir
nur eine alltägliche Kamera
11:06
but this time, we used just a regularregulär
store-boughtim Laden gekauften cameraKamera,
185
654442
4203
11:10
and so in a secondzweite, I'll playspielen for you
the soundklingen that we recoveredwiederhergestellt,
186
658645
3174
und ich werde Ihnen den Klang vorspielen,
den wir wiederherstellen konnten.
11:13
and it's going to soundklingen
distortedverzerrt this time,
187
661819
2050
Es wird dieses Mal verzerrt klingen,
11:15
but listen and see if you can still
recognizeerkenne the musicMusik-.
188
663869
2836
aber vielleicht können Sie
das Lied noch erkennen.
11:19
(AudioAudio: "MaryMary Had a Little LambLamm")
189
667723
6223
(Ton: "Mary Had a Little Lamb")
Zugegeben, es klingt verzerrt,
11:37
And so, again, that soundsGeräusche distortedverzerrt,
190
685527
3465
aber das Beeindruckende hier ist,
11:40
but what's really amazingtolle here
is that we were ablefähig to do this
191
688992
4386
dass wir das mit Geräten gemacht haben,
11:45
with something
that you could literallybuchstäblich runLauf out
192
693378
2626
die Sie ganz normal in einem
Elektronik-Fachgeschäft kaufen können.
11:48
and pickwähle up at a BestAm besten BuyKaufen.
193
696004
1444
An dieser Stelle
11:51
So at this pointPunkt,
194
699122
1363
sehen viele Leute diese Arbeit
11:52
a lot of people see this work,
195
700485
1974
und denken sofort an Überwachung.
11:54
and they immediatelysofort think
about surveillanceÜberwachung.
196
702459
3413
11:57
And to be fairMesse,
197
705872
2415
Und um ehrlich zu sein,
ist es leicht vorstellbar,
12:00
it's not hardhart to imaginevorstellen how you mightMacht use
this technologyTechnologie to spySpion on someonejemand.
198
708287
4133
wie man diese Technik
zum Ausspionieren nutzen könnte.
12:04
But keep in mindVerstand that there's alreadybereits
a lot of very matureReifen technologyTechnologie
199
712420
3947
Aber Sie sollten bedenken,
dass es bereits sehr gute
Überwachungstechniken gibt.
12:08
out there for surveillanceÜberwachung.
200
716367
1579
12:09
In factTatsache, people have been usingmit lasersLasern
201
717946
2090
Tatsächlich benutzt man
schon seit Jahrzehnten Laser,
12:12
to eavesdropbelauschen on objectsObjekte
from a distanceEntfernung for decadesJahrzehnte.
202
720036
2799
um Objekte aus Entfernung abzuhören.
Aber wirklich neu und anders
an dieser Technik ist,
12:15
But what's really newneu here,
203
723978
2025
12:18
what's really differentanders,
204
726003
1440
12:19
is that now we have a way
to pictureBild the vibrationsSchwingungen of an objectObjekt,
205
727443
4295
dass wir die Vibrationen eines
Gegenstandes verbildlichen können,
12:23
whichwelche givesgibt us a newneu lensLinse
throughdurch whichwelche to look at the worldWelt,
206
731738
3413
was uns eine neue Linse gibt,
durch die wir die Welt betrachten können.
Mit dieser Linse können wir
12:27
and we can use that lensLinse
207
735151
1510
12:28
to learnlernen not just about forcesKräfte like soundklingen
that causeUrsache an objectObjekt to vibratevibrieren,
208
736661
4899
nicht mehr nur über Kräfte wie Schall
lernen, die Gegenstände vibrieren lassen,
12:33
but alsoebenfalls about the objectObjekt itselfselbst.
209
741560
2288
sondern auch mehr
über den Gegenstand selbst.
12:36
And so I want to take a stepSchritt back
210
744975
1693
Deshalb möchte ich
einen Schritt zurückgehen
12:38
and think about how that mightMacht changeVeränderung
the waysWege that we use videoVideo,
211
746668
4249
und darüber nachdenken,
wie das unsere Nutzung von Videos
verändern könnte.
12:42
because we usuallygewöhnlich use videoVideo
to look at things,
212
750917
3553
Normalerweise verwenden wir Videos,
um Dinge anzuschauen,
und ich habe Ihnen gerade gezeigt,
12:46
and I've just showngezeigt you how we can use it
213
754470
2322
wie wir mit ihnen Dingen zuhören können.
12:48
to listen to things.
214
756792
1857
12:50
But there's anotherein anderer importantwichtig way
that we learnlernen about the worldWelt:
215
758649
3971
Aber wir lernen auch viel über die Welt,
indem wir mit ihr interagieren.
12:54
that's by interactinginteragierend with it.
216
762620
2275
12:56
We pushdrücken and pullziehen and pokePoke and prodProd things.
217
764895
3111
Wir ziehen, drücken,
stoßen und stupsen Dinge.
13:00
We shakeShake things and see what happensdas passiert.
218
768006
3181
Wir schütteln Dinge und
warten ab, was passiert.
Mit einem Video können wir das nicht tun,
13:03
And that's something that videoVideo
still won'tGewohnheit let us do,
219
771187
4273
zumindest nicht bisher.
13:07
at leastam wenigsten not traditionallytraditionell.
220
775460
2136
Deshalb möchte ich Ihnen
unsere neuste Arbeit zeigen,
13:09
So I want to showShow you some newneu work,
221
777596
1950
13:11
and this is basedbasierend on an ideaIdee I had
just a fewwenige monthsMonate agovor,
222
779546
2667
die auf einer Idee basiert, die
ich vor wenigen Monaten hatte
13:14
so this is actuallytatsächlich the first time
I've showngezeigt it to a publicÖffentlichkeit audiencePublikum.
223
782213
3301
und hier zum ersten Mal
in der Öffentlichkeit zeige.
13:17
And the basicBasic ideaIdee is that we're going
to use the vibrationsSchwingungen in a videoVideo
224
785514
5363
Die Grundidee ist, dass wir die
Vibrationen in einem Video nutzen,
um Objekte so aufzuzeichnen,
dass wir mit ihnen interagieren können
13:22
to captureErfassung objectsObjekte in a way
that will let us interactinteragieren with them
225
790877
4481
13:27
and see how they reactreagieren to us.
226
795358
1974
und sehen, wie sie auf uns reagieren.
Das hier ist ein Gegenstand,
13:31
So here'shier ist an objectObjekt,
227
799120
1764
in diesem Fall eine
menschenförmige Drahtfigur,
13:32
and in this caseFall, it's a wireDraht figureZahl
in the shapegestalten of a humanMensch,
228
800884
3832
13:36
and we're going to filmFilm that objectObjekt
with just a regularregulär cameraKamera.
229
804716
3088
und wir zeichnen den Gegenstand
mit einer normalen Kamera auf.
Die Kamera ist nichts Besonderes.
13:39
So there's nothing specialbesondere
about this cameraKamera.
230
807804
2124
Um ehrlich zu sein, habe ich das zuvor
mit meiner Handykamera gemacht.
13:41
In factTatsache, I've actuallytatsächlich doneerledigt this
with my cellZelle phoneTelefon before.
231
809928
2961
13:44
But we do want to see the objectObjekt vibratevibrieren,
232
812889
2252
Aber wir wollen den Gegenstand
schwingen sehen,
13:47
so to make that happengeschehen,
233
815141
1133
deshalb schlagen wir einfach leicht
auf die Oberfläche, auf der er steht,
13:48
we're just going to bangKnall a little bitBit
on the surfaceOberfläche where it's restingruhend
234
816274
3346
13:51
while we recordAufzeichnung this videoVideo.
235
819620
2138
während wir das Video aufzeichnen.
Das ist alles: fünf Sekunden
eines normalen Videos,
13:59
So that's it: just fivefünf secondsSekunden
of regularregulär videoVideo,
236
827398
3671
14:03
while we bangKnall on this surfaceOberfläche,
237
831069
2136
während wir auf die Oberfläche schlagen
14:05
and we're going to use
the vibrationsSchwingungen in that videoVideo
238
833205
3513
und wir nutzen
die Schwingungen im Video,
14:08
to learnlernen about the structuralstrukturell
and materialMaterial propertiesEigenschaften of our objectObjekt,
239
836718
4544
um etwas über die Eigenschaften
unseres Gegenstandes zu lernen,
und mit diesen Informationen schaffen wir
etwas Neues und Interaktives.
14:13
and we're going to use that informationInformation
to createerstellen something newneu and interactiveinteraktiv.
240
841262
4834
Das ist dabei herausgekommen.
14:24
And so here'shier ist what we'vewir haben createderstellt.
241
852866
2653
Es sieht wie ein gewöhnliches Bild aus,
14:27
And it lookssieht aus like a regularregulär imageBild,
242
855519
2229
aber es ist weder ein Bild noch ein Video,
14:29
but this isn't an imageBild,
and it's not a videoVideo,
243
857748
3111
denn ich kann jetzt meine Maus nehmen
14:32
because now I can take my mouseMaus
244
860859
2368
14:35
and I can startAnfang interactinginteragierend
with the objectObjekt.
245
863227
2859
und anfangen, mit dem Gegenstand
zu interagieren.
14:44
And so what you see here
246
872936
2357
Hier sehen Sie eine Simulation,
14:47
is a simulationSimulation of how this objectObjekt
247
875389
2226
wie dieses Objekt auf
neue Kräfte reagieren würde,
14:49
would respondreagieren to newneu forcesKräfte
that we'vewir haben never seengesehen before,
248
877615
4458
auf die es noch nie getroffen ist,
14:54
and we createderstellt it from just
fivefünf secondsSekunden of regularregulär videoVideo.
249
882073
3633
und all das haben wir nur aus
diesem 5-Sekunden-Video geschaffen.
(Applaus)
14:59
(ApplauseApplaus)
250
887249
4715
Dieser Blick auf die Welt
gibt uns viele Möglichkeiten,
15:09
And so this is a really powerfulmächtig
way to look at the worldWelt,
251
897421
3227
denn er erlaubt uns vorherzusagen,
15:12
because it letsLasst uns us predictvorhersagen
how objectsObjekte will respondreagieren
252
900648
2972
wie Gegenstände auf
neue Situationen reagieren werden.
15:15
to newneu situationsSituationen,
253
903620
1823
15:17
and you could imaginevorstellen, for instanceBeispiel,
looking at an oldalt bridgeBrücke
254
905443
3473
Es ist vorstellbar, dass man sich
bei einer alten Brücke fragt,
was passieren würde,
wie sie standhalten würde,
15:20
and wonderingwundernd what would happengeschehen,
how would that bridgeBrücke holdhalt up
255
908916
3527
15:24
if I were to driveFahrt my carAuto acrossüber it.
256
912443
2833
wenn ich mit meinem Auto darüber fahre.
Auf diese Frage wüssten Sie
vermutlich gerne die Antwort,
15:27
And that's a questionFrage
that you probablywahrscheinlich want to answerAntworten
257
915276
2774
15:30
before you startAnfang drivingFahren
acrossüber that bridgeBrücke.
258
918050
2560
bevor Sie über die Brücke fahren.
15:33
And of courseKurs, there are going to be
limitationsEinschränkungen to this techniqueTechnik,
259
921988
3272
Natürlich wird diese Technik
ihre Grenzen haben,
15:37
just like there were
with the visualvisuell microphoneMikrofon,
260
925260
2462
genauso wie bei dem visuellen Mikrofon,
aber wir fanden heraus, dass es
in vielen Situationen funktioniert,
15:39
but we foundgefunden that it worksWerke
in a lot of situationsSituationen
261
927722
3181
15:42
that you mightMacht not expecterwarten von,
262
930903
1875
in denen man es nicht erwarten würde,
15:44
especiallyinsbesondere if you give it longerlänger videosVideos.
263
932778
2768
besonders wenn man längere Videos benutzt.
15:47
So for exampleBeispiel,
here'shier ist a videoVideo that I capturedgefangen
264
935546
2508
Das ist zum Beispiel ein Video,
das ich von einem Busch vor
meiner Wohnung gefilmt habe,
15:50
of a bushBusch outsidedraußen of my apartmentWohnung,
265
938054
2299
15:52
and I didn't do anything to this bushBusch,
266
940353
3088
und ich habe nichts mit dem Busch gemacht,
außer dass ich ein einminütiges Video
aufgezeichnet habe.
15:55
but by capturingErfassung a minute-longMinute lang videoVideo,
267
943441
2705
15:58
a gentlesanft breezeBrise causedverursacht enoughgenug vibrationsSchwingungen
268
946146
3378
Ein leichtes Lüftchen hat genug
Schwingungen verursacht,
dass wir genug Informationen hatten,
um diese Simulation zu erstellen.
16:01
that we could learnlernen enoughgenug about this bushBusch
to createerstellen this simulationSimulation.
269
949524
3587
16:07
(ApplauseApplaus)
270
955270
6142
(Applaus)
Man könnte nun das Video
einem Filmregisseur geben,
16:13
And so you could imaginevorstellen givinggeben this
to a filmFilm directorDirektor,
271
961412
2972
damit er die Stärke und
Richtung des Windes
16:16
and lettingVermietung him controlsteuern, say,
272
964384
1719
16:18
the strengthStärke and directionRichtung of windWind
in a shotSchuss after it's been recordedverzeichnet.
273
966103
4922
nach einer Aufnahme steuern kann.
16:24
Or, in this caseFall, we pointedspitz our cameraKamera
at a hanginghängend curtainVorhang,
274
972810
4535
Oder in diesem Fall hier richteten
wir unsere Kamera auf einen Vorhang
16:29
and you can't even see
any motionBewegung in this videoVideo,
275
977345
4129
und man kann überhaupt
keine Bewegung im Video erkennen,
aber während des zweiminütigen Videos
16:33
but by recordingAufzeichnung a two-minute-longzwei Minuten lang videoVideo,
276
981474
2925
16:36
naturalnatürlich airLuft currentsStrömungen in this roomZimmer
277
984399
2438
sorgte normale Luftzirkulation
für ausreichend subtile,
16:38
createderstellt enoughgenug subtlesubtil,
imperceptiblenicht wahrnehmbar motionsAnträge and vibrationsSchwingungen
278
986837
4412
nicht wahrnehmbare
Bewegungen und Schwingungen,
16:43
that we could learnlernen enoughgenug
to createerstellen this simulationSimulation.
279
991249
2565
dass wir genug Informationen hatten,
um diese Simulation zu kreieren.
Und ironischerweise
16:48
And ironicallyironisch,
280
996243
2366
16:50
we're kindArt of used to havingmit
this kindArt of interactivityInteraktivität
281
998609
3088
sind wir es gewöhnt,
diese Art der Interaktion
bei virtuellen Gegenständen zu erleben,
16:53
when it comeskommt to virtualvirtuell objectsObjekte,
282
1001697
2647
zum Beispiel in Videospielen
und 3D-Modellen,
16:56
when it comeskommt to videoVideo gamesSpiele
and 3D modelsModelle,
283
1004344
3297
aber diese Informationen von einem
Gegenstand in der wirklichen Welt
16:59
but to be ablefähig to captureErfassung this informationInformation
from realecht objectsObjekte in the realecht worldWelt
284
1007641
4404
17:04
usingmit just simpleeinfach, regularregulär videoVideo,
285
1012045
2817
mit einem gewöhnlichen Video
aufzuzeichnen,
ist etwas Neues mit viel Potential.
17:06
is something newneu that has
a lot of potentialPotenzial.
286
1014862
2183
17:10
So here are the amazingtolle people
who workedhat funktioniert with me on these projectsProjekte.
287
1018410
4904
Das hier sind die beeindruckenden Leute,
die mit mir an diesen Projekten
gearbeitet haben.
17:16
(ApplauseApplaus)
288
1024057
5596
(Applaus)
17:24
And what I've showngezeigt you todayheute
is only the beginningAnfang.
289
1032819
3057
Was ich Ihnen heute gezeigt habe,
ist nur der Anfang.
Wir haben gerade begonnen,
an der Oberfläche dessen zu kratzen,
17:27
We'veWir haben just startedhat angefangen to scratchkratzen the surfaceOberfläche
290
1035876
2113
17:29
of what you can do
with this kindArt of imagingImaging,
291
1037989
2972
was man mit dieser Art der
Bildverarbeitung machen kann,
17:32
because it givesgibt us a newneu way
292
1040961
2286
da sie uns eine neue Möglichkeit bietet,
17:35
to captureErfassung our surroundingsUmgebung
with commonverbreitet, accessiblezugänglich technologyTechnologie.
293
1043342
4724
unsere Umgebung mit
gewöhnlicher Technik aufzuzeichnen.
17:40
And so looking to the futureZukunft,
294
1048066
1929
Mit Blick auf die Zukunft
17:41
it's going to be
really excitingaufregend to exploreerforschen
295
1049995
2037
wird es sehr aufregend sein zu entdecken,
was uns das über die Welt sagen kann.
17:44
what this can tell us about the worldWelt.
296
1052032
1856
Danke.
17:46
Thank you.
297
1054381
1204
17:47
(ApplauseApplaus)
298
1055610
6107
(Applaus)
Translated by Lesley-Ann Mathis
Reviewed by Johanna Pichler

▲Back to top

ABOUT THE SPEAKER
Abe Davis - Computer scientist
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.

Why you should listen

MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument.  In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.

Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.

More profile about the speaker
Abe Davis | Speaker | TED.com