ABOUT THE SPEAKER
Abe Davis - Computer scientist
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.

Why you should listen

MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument.  In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.

Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.

More profile about the speaker
Abe Davis | Speaker | TED.com
TED2015

Abe Davis: New video technology that reveals an object's hidden properties

Abe Davis: Új videotechnológia fedi fel a tárgyak rejtett tulajdonságait

Filmed:
1,482,525 views

Finom mozgások vesznek körbe minket folyamatosan, többek között a hang által okozott apró rezgések. Egy új technológia megmutatja, hogy felfigyelhetünk ezekre a rezgésekre, és újra előállíthatunk hangokat és beszélgetéseket, amihez mindössze egy videó kell, látszólag mozdulatlan tárgyakról. De Abe Davis most egy lépéssel továbbviszi mindezt: Nézd meg a bemutató szoftverét, ami mindenki számára lehetővé teszi, hogy interakcióba lépjen ezekkel a rejtett tulajdonságokkal, csupán egy egyszerű videó alapján.
- Computer scientist
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio

Double-click the English transcript below to play the video.

00:13
MostA legtöbb of us think of motionmozgás
as a very visualvizuális thing.
0
1373
3349
Többségünk úgy gondol a mozgásra,
mint egy nagyon vizuális dologra.
00:17
If I walkséta acrossát this stageszínpad
or gesturegesztus with my handskezek while I speakbeszél,
1
5889
5088
Ha keresztülsétálok ezen a színpadon,
vagy beszéd közben gesztikulálok,
00:22
that motionmozgás is something that you can see.
2
10977
2261
az egy olyan mozgás, amit látnak.
00:26
But there's a worldvilág of importantfontos motionmozgás
that's too subtleapró for the humanemberi eyeszem,
3
14255
5482
De van egy világ, tele olyan mozgásokkal,
amelyek túl finomak az emberi szemnek,
00:31
and over the pastmúlt fewkevés yearsévek,
4
19737
2041
és az elmúlt pár év során
00:33
we'vevoltunk startedindult to find that cameraskamerák
5
21778
1997
kezdtünk rájönni, hogy a kamerák
00:35
can oftengyakran see this motionmozgás
even when humansemberek can't.
6
23775
3410
gyakran látják ezt a mozgást,
még ha az emberek nem is.
00:40
So let me showelőadás you what I mean.
7
28305
1551
Hadd mutassam be, mire gondolok!
Bal oldalt láthatnak egy videót
egy ember csuklójáról
00:42
On the left here, you see videovideó-
of a person'sszemély wristcsukló,
8
30717
3622
00:46
and on the right, you see videovideó-
of a sleepingalvás infantcsecsemő,
9
34339
3147
és jobb oldalt egy videót
egy alvó csecsemőről,
00:49
but if I didn't tell you
that these were videosvideók,
10
37486
3146
de ha nem mondanám el önöknek,
hogy ezek videók,
azt feltételezhetnék,
hogy két hagyományos képet látnak,
00:52
you mightesetleg assumefeltételezni that you were looking
at two regularszabályos imagesképek,
11
40632
3761
mert mindkét esetben
00:56
because in bothmindkét casesesetek,
12
44393
1672
a videók teljes mértékben
mozdulatlannak tűnnek.
00:58
these videosvideók appearmegjelenik to be
almostmajdnem completelyteljesen still.
13
46065
3047
01:02
But there's actuallytulajdonképpen a lot
of subtleapró motionmozgás going on here,
14
50175
3885
De valójában rengeteg finom mozgás
van folyamatban itt,
01:06
and if you were to touchérintés
the wristcsukló on the left,
15
54060
2392
és ha megérinthetnék
a csuklót bal oldalt,
01:08
you would feel a pulseimpulzus,
16
56452
1996
éreznék a pulzust,
01:10
and if you were to holdtart
the infantcsecsemő on the right,
17
58448
2485
vagy ha karjukban tartanák
a jobb oldali csecsemőt,
01:12
you would feel the riseemelkedik
and fallesik of her chestmellkas
18
60933
2391
éreznék, ahogy a mellkasa
emelkedik és süllyed
01:15
as she tookvett eachminden egyes breathlehelet.
19
63324
1390
minden lélegzetvételénél.
01:17
And these motionsmozgások carryvisz
a lot of significancejelentőség,
20
65762
3576
És ezek a mozgások
hatalmas jelentőséggel bírnak,
01:21
but they're usuallyáltalában
too subtleapró for us to see,
21
69338
3343
de általában túl finomak ahhoz,
hogy észrevegyük őket,
01:24
so insteadhelyette, we have to observemegfigyelése them
22
72681
2276
ezért inkább közvetlen kapcsolattal,
01:26
throughkeresztül directközvetlen contactkapcsolatba lépni, throughkeresztül touchérintés.
23
74957
2900
azaz érintéssel tudjuk megfigyelni őket.
01:30
But a fewkevés yearsévek agoezelőtt,
24
78997
1265
De néhány éve
01:32
my colleagueskollégák at MITMIT developedfejlett
what they call a motionmozgás microscopeMikroszkóp,
25
80262
4405
MIT-s kollégáim kifejlesztettek
egy úgy nevezett mozgásmikroszkópot,
01:36
whichmelyik is softwareszoftver that findsleletek
these subtleapró motionsmozgások in videovideó-
26
84667
4384
egy olyan szoftvert, ami képes megtalálni
ezeket a finom mozgásokat egy videóban
01:41
and amplifiesfelerősíti a them so that they
becomeválik largenagy enoughelég for us to see.
27
89051
3562
és felerősíteni őket annyira,
hogy mi is láthassuk.
01:45
And so, if we use theirazok softwareszoftver
on the left videovideó-,
28
93416
3483
Így tehát ha használjuk a szoftvert
a bal oldali videón,
01:48
it letslehetővé teszi, us see the pulseimpulzus in this wristcsukló,
29
96899
3250
láthatóvá teszi számunkra a pulzust
01:52
and if we were to countszámol that pulseimpulzus,
30
100149
1695
és ha megszámolnánk a lüktetéseket,
01:53
we could even figureábra out
this person'sszemély heartszív ratearány.
31
101844
2355
még ki is számolhatnánk
az illető szívverését.
01:57
And if we used the sameazonos softwareszoftver
on the right videovideó-,
32
105095
3065
És ha ugyanezt a szoftvert alkalmazzuk
a jobb oldali videón,
02:00
it letslehetővé teszi, us see eachminden egyes breathlehelet
that this infantcsecsemő takes,
33
108160
3227
láthatóvá válik minden lélegzet,
amit a csecsemő vesz
02:03
and we can use this as a contact-freekapcsolat-mentes way
to monitormonitor her breathinglélegző.
34
111387
4137
és ezt használhatjuk légzésének
kontaktusmentes monitorozásra.
02:08
And so this technologytechnológia is really powerfulerős
because it takes these phenomenajelenségek
35
116884
5348
Tehát ez a technológia nagyon erőteljes,
mert lehetővé teszi,
hogy ezeket az általában érintéssel
megtapasztalt jelenségeket
02:14
that we normallynormális esetben have
to experiencetapasztalat throughkeresztül touchérintés
36
122232
2367
02:16
and it letslehetővé teszi, us captureelfog them visuallyvizuálisan
and non-invasivelynem-invazív.
37
124599
2957
vizuálisan, nem-invazív módon
ragadjuk meg.
02:21
So a couplepárosít yearsévek agoezelőtt, I startedindult workingdolgozó
with the folksemberek that createdkészítette that softwareszoftver,
38
129104
4411
Szóval, pár éve elkezdtem dolgozni
a szoftver készítőivel,
02:25
and we decidedhatározott to pursuefolytat a crazyőrült ideaötlet.
39
133515
3367
és egy őrült ötlet
megvalósítására adtuk a fejünket.
02:28
We thought, it's coolmenő
that we can use softwareszoftver
40
136882
2693
Arra gondoltunk, menő,
hogy a szoftver használatával
02:31
to visualizeláthatóvá tinyapró motionsmozgások like this,
41
139575
3135
vizualizálhatunk ilyen apró mozgásokat,
02:34
and you can almostmajdnem think of it
as a way to extendkiterjesztése our senseérzék of touchérintés.
42
142710
4458
és szinte felfoghatjuk ezt
a tapintás érzékünk kiterjesztéseként.
02:39
But what if we could do the sameazonos thing
with our abilityképesség to hearhall?
43
147168
4059
De mi lenne, ha meg tudnánk tenni
ugyanezt a hallásunkkal is?
02:44
What if we could use videovideó-
to captureelfog the vibrationsrezgések of soundhang,
44
152508
4665
Mi lenne, ha a videó segítségével
megragadhatnánk a hang rezgéseit,
02:49
whichmelyik are just anotheregy másik kindkedves of motionmozgás,
45
157173
2827
ami csupán egy másik fajta mozgás,
02:52
and turnfordulat everything that we see
into a microphonemikrofon?
46
160000
3346
és így mindent, amit látunk
mikrofonná változtathatnánk?
02:56
Now, this is a bitbit of a strangefurcsa ideaötlet,
47
164236
1971
Nos, ez egy kicsit furcsa ötlet,
02:58
so let me try to put it
in perspectivetávlati for you.
48
166207
2586
hadd próbáljam meg hát
perspektívába helyezni.
03:01
TraditionalHagyományos microphonesmikrofonok
work by convertingáttérés the motionmozgás
49
169523
3488
A hagyományos mikrofonok
azon az elven működnek,
03:05
of an internalbelső diaphragmrekeszizom
into an electricalelektromos signaljel,
50
173011
3599
hogy egy belső membrán mozgását
elektromos jellé konvertálják,
03:08
and that diaphragmrekeszizom is designedtervezett
to movemozog readilykészségesen with soundhang
51
176610
4318
és ez a membrán úgy van tervezve,
hogy a hangra könnyen rezdüljön,
03:12
so that its motionmozgás can be recordedfeljegyzett
and interpretedértelmezni as audiohang-.
52
180928
4807
így a mozgása felvehető
és hangként lefordítható lesz.
03:17
But soundhang causesokoz all objectstárgyak to vibraterezeg.
53
185735
3668
De a hang minden tárgyat
rezgésbe hoz.
03:21
Those vibrationsrezgések are just usuallyáltalában
too subtleapró and too fastgyors for us to see.
54
189403
5480
Ezek a rezgések általában túl finomak
és túl gyorsak, hogy láthassuk őket.
03:26
So what if we recordrekord them
with a high-speedMagassebesség camerakamera
55
194883
3738
Szóval, mi lenne, ha felvennénk őket
egy nagysebességű kamerával
03:30
and then use softwareszoftver
to extractkivonat tinyapró motionsmozgások
56
198621
3576
és aztán a szoftvert használnánk,
hogy kivonjuk az apró mozgásokat
03:34
from our high-speedMagassebesség videovideó-,
57
202197
2090
a nagysebességű videónkból,
03:36
and analyzeelemez those motionsmozgások to figureábra out
what soundshangok createdkészítette them?
58
204287
4274
és elemezzük azokat a mozgásokat,
hogy kiderüljön, milyen hang okozta őket?
03:41
This would let us turnfordulat visiblelátható objectstárgyak
into visualvizuális microphonesmikrofonok from a distancetávolság.
59
209859
5449
Így a látható tárgyakat távoli
vizuális mikrofonokká változtathatnánk.
03:49
And so we triedmegpróbálta this out,
60
217080
2183
Szóval kipróbáltuk ezt a dolgot,
és íme az egyik kísérletünk,
03:51
and here'sitt one of our experimentskísérletek,
61
219263
1927
ahol fogtuk ezt a cserepes növényt,
amit a jobb oldalon látnak
03:53
where we tookvett this pottedCserepes plantnövény
that you see on the right
62
221190
2949
03:56
and we filmedfilmre it with a high-speedMagassebesség camerakamera
63
224139
2438
és egy nagysebességű kamerával filmeztük,
03:58
while a nearbyKözeli loudspeakerhangszóró
playedDátum this soundhang.
64
226577
3529
miközben egy közeli hangszóró
ezt a hangot játszotta.
04:02
(MusicZene: "MaryMária Had a Little LambBárány")
65
230275
8190
[A szobában hangszórón játszott hang]
(Zene: "Mary Had a Little Lamb")
04:11
And so here'sitt the videovideó- that we recordedfeljegyzett,
66
239820
2824
És íme a videó, amit felvettünk,
04:14
and we recordedfeljegyzett it at thousandsTöbb ezer
of frameskeretek perper secondmásodik,
67
242644
3924
és ugyan másodpercenként
több ezer képkockát rögzítettünk,
04:18
but even if you look very closelyszorosan,
68
246568
2322
még ha nagyon közelről vizsgálják,
akkor is csupán néhány levél látható,
04:20
all you'llazt is megtudhatod see are some leaveslevelek
69
248890
1951
amik lényegében csak úgy vannak,
és nem csinálnak semmit,
04:22
that are prettyszép much
just sittingülés there doing nothing,
70
250841
3065
04:25
because our soundhang only movedköltözött those leaveslevelek
by about a micrometerMikrométer.
71
253906
4806
mert a hang ezeket a leveleket
alig pár mikrométernyit mozdította meg.
04:31
That's one ten-thousandthtízezred of a centimetercentiméter,
72
259103
4276
Ez egy centiméter egy-tízezrede,
04:35
whichmelyik spansível somewherevalahol betweenközött
a hundredthszázadik and a thousandthezred
73
263379
4156
ami nagyjából akkora kiterjedésű,
mint egy pixel százada vagy ezrede
04:39
of a pixelpixel in this imagekép.
74
267535
2299
ezen a képen.
04:41
So you can squintkancsal all you want,
75
269881
2887
Szóval hunyoroghatnak, amennyit akarnak,
04:44
but motionmozgás that smallkicsi is prettyszép much
perceptuallyperceptually invisibleláthatatlan.
76
272768
3335
de egy ilyen kis mértékű mozgás
lényegében érzékszervileg láthatatlan.
04:49
But it turnsmenetek out that something
can be perceptuallyperceptually invisibleláthatatlan
77
277667
4157
De kiderült, hogy valami lehet
érzékszervileg láthatatlan
04:53
and still be numericallyszámszerűen significantjelentős,
78
281824
2809
és mégis jelentős számtanilag,
04:56
because with the right algorithmsalgoritmusok,
79
284633
2002
mert a megfelelő algoritmusokat használva
04:58
we can take this silentcsendes,
seeminglylátszólag still videovideó-
80
286635
3687
foghatjuk és ebből a néma,
mozdulatlannak tűnő videóból
05:02
and we can recovervisszaszerez this soundhang.
81
290322
1527
visszanyerhetjük ezt a hangot.
05:04
(MusicZene: "MaryMária Had a Little LambBárány")
82
292690
7384
(Zene: "Mary Had a Little Lamb")
05:12
(ApplauseTaps)
83
300074
5828
(Taps)
05:22
So how is this possiblelehetséges?
84
310058
1939
Szóval hogyan is lehetséges ez?
05:23
How can we get so much informationinformáció
out of so little motionmozgás?
85
311997
4344
Hogyan szerezhetünk ilyen sok információt,
ilyen kicsi mozgásból?
05:28
Well, let's say that those leaveslevelek
movemozog by just a singleegyetlen micrometerMikrométer,
86
316341
5361
Nos, mondjuk, hogy azok a levelek
csupán egyetlen mikrométernyit mozdulnak,
05:33
and let's say that that shiftsműszakok our imagekép
by just a thousandthezred of a pixelpixel.
87
321702
4308
és mondjuk, hogy ez a képünket
csak egy pixel ezredével mozdítja el.
05:39
That maylehet not seemlátszik like much,
88
327269
2572
Ez talán nem tűnik soknak,
05:41
but a singleegyetlen framekeret of videovideó-
89
329841
1996
de egyetlen képkocka
05:43
maylehet have hundredsszáz of thousandsTöbb ezer
of pixelspixel in it,
90
331837
3257
több százezer pixelt foglalhat magába
05:47
and so if we combinekombájn all
of the tinyapró motionsmozgások that we see
91
335094
3454
és ha össze tudjuk rakni
az összes ilyen kis mozgást, amit látunk
05:50
from acrossát that entireteljes imagekép,
92
338548
2298
az egész kép területéről,
05:52
then suddenlyhirtelen a thousandthezred of a pixelpixel
93
340846
2623
akkor hirtelen egy pixel ezrede
05:55
can startRajt to addhozzáad up
to something prettyszép significantjelentős.
94
343469
2775
elkezdhet összeadódni
valami egészen jelentőssé.
05:58
On a personalszemélyes notejegyzet, we were prettyszép psychedindulva
when we figuredmintás this out.
95
346870
3635
Hadd áruljam el, hogy eléggé bezsongtunk,
amikor rájöttünk minderre.
06:02
(LaughterNevetés)
96
350505
2320
(Nevetés)
06:04
But even with the right algorithmalgoritmus,
97
352825
3253
De még a megfelelő algoritmussal is
06:08
we were still missinghiányzó
a prettyszép importantfontos piecedarab of the puzzlekirakós játék.
98
356078
3617
hiányzott egy elég fontos darabja
a kirakósnak.
06:11
You see, there are a lot of factorstényezők
that affectérint when and how well
99
359695
3604
Ugyanis rengeteg tényező befolyásolja,
mikor és mennyire jól fog
06:15
this techniquetechnika will work.
100
363299
1997
ez a technika működni.
06:17
There's the objecttárgy and how farmessze away it is;
101
365296
3204
Ott van a tárgy és hogy milyen messze van;
06:20
there's the camerakamera
and the lenslencse that you use;
102
368500
2394
ott a kamera és a lencsék,
amiket használunk;
06:22
how much lightfény is shiningcsillogó on the objecttárgy
and how loudhangos your soundhang is.
103
370894
4091
mennyi fény éri a tárgyat
és milyen hangos a hang.
06:27
And even with the right algorithmalgoritmus,
104
375945
3375
És még a megfelelő algoritmussal is
06:31
we had to be very carefulóvatos
with our earlykorai experimentskísérletek,
105
379320
3390
nagyon óvatosnak kellett lennünk
a korai kísérleteinkben,
06:34
because if we got
any of these factorstényezők wrongrossz,
106
382710
2392
mert ha ezen tényezők
akármelyikét elhibáztuk,
06:37
there was no way to tell
what the problemprobléma was.
107
385102
2368
esélytelen volt megmondani,
hogy mi is a probléma.
06:39
We would just get noisezaj back.
108
387470
2647
Csak zajt nyertünk vissza.
06:42
And so a lot of our earlykorai
experimentskísérletek lookednézett like this.
109
390117
3320
Ezért aztán rengeteg korai kísérletünk
festett valahogy így.
06:45
And so here I am,
110
393437
2206
Íme, itt vagyok én,
06:47
and on the bottomalsó left, you can kindkedves of
see our high-speedMagassebesség camerakamera,
111
395643
4040
és valamelyest látni a bal alsó sarokban
a nagysebességű kameránkat,
06:51
whichmelyik is pointedhegyes at a bagtáska of chipsjátékpénz,
112
399683
2183
ami egy zacskó chipsre szegeződik,
06:53
and the wholeegész thing is litmegvilágított
by these brightfényes lampslámpák.
113
401866
2949
és mindez ezekkel a ragyogó lámpákkal
van bevilágítva.
06:56
And like I said, we had to be
very carefulóvatos in these earlykorai experimentskísérletek,
114
404815
4365
Mint mondtam, az ilyen korai kísérleteknél
nagyon óvatosnak kellett lennünk,
07:01
so this is how it wentment down.
115
409180
2508
ezért így festett a dolog.
07:03
(VideoVideóinak) AbeAbe DavisDavis: ThreeHárom, two, one, go.
116
411688
3761
(Videó) Abe Davis: Három, kettő, egy, és!
07:07
MaryMária had a little lambBárány!
Little lambBárány! Little lambBárány!
117
415449
5387
Mary had a little lamb!
Little lamb! Little lamb!
07:12
(LaughterNevetés)
118
420836
4500
(Nevetés)
07:17
ADHIRDETÉS: So this experimentkísérlet
looksúgy néz ki, completelyteljesen ridiculousnevetséges.
119
425336
2814
AD: Szóval ez a kísérlet
teljes mértékben röhejesen fest.
07:20
(LaughterNevetés)
120
428150
1788
(Nevetés)
07:21
I mean, I'm screamingvisító at a bagtáska of chipsjátékpénz --
121
429938
2345
Úgy értem, egy zacskó chipsnek kiabálok...
07:24
(LaughterNevetés) --
122
432283
1551
(Nevetés)
07:25
and we're blastingrobbantás it with so much lightfény,
123
433834
2117
...amire annyi fényt nyomtunk,
07:27
we literallyszó szerint meltedolvasztott the first bagtáska
we triedmegpróbálta this on. (LaughterNevetés)
124
435951
4479
hogy az első zacskót, amin kipróbáltuk,
szó szerint megolvasztottuk. (Nevetés)
07:32
But ridiculousnevetséges as this experimentkísérlet looksúgy néz ki,,
125
440525
3274
De bármilyen röhejesnek
tűnik is ez a kísérlet,
07:35
it was actuallytulajdonképpen really importantfontos,
126
443799
1788
valójában nagyon fontos volt,
07:37
because we were ableképes
to recovervisszaszerez this soundhang.
127
445587
2926
mert sikerült visszanyernünk
ezt a hangot.
07:40
(AudioAudio) MaryMária had a little lambBárány!
Little lambBárány! Little lambBárány!
128
448513
4712
(Hang) Mary had a little lamb!
Little lamb! Little lamb!
07:45
(ApplauseTaps)
129
453225
4088
(Taps)
07:49
ADHIRDETÉS: And this was really significantjelentős,
130
457313
1881
AD: És ennek nagy jelentősége volt,
07:51
because it was the first time
we recoveredvisszanyert intelligibleérthető humanemberi speechbeszéd
131
459194
4119
mert ez volt az első, hogy
kivehető emberi hangot nyertünk vissza
07:55
from silentcsendes videovideó- of an objecttárgy.
132
463424
2341
egy tárgyról készült néma videóból.
07:57
And so it gaveadott us this pointpont of referencereferencia,
133
465765
2391
Ez adott nekünk egy viszonyítási pontot,
08:00
and graduallyfokozatosan we could startRajt
to modifymódosít the experimentkísérlet,
134
468156
3871
és fokozatosan elkezdhettük
módosítani a kísérletet
08:04
usinghasználva differentkülönböző objectstárgyak
or movingmozgó the objecttárgy furthertovábbi away,
135
472106
3805
különböző tárgyakat használtunk,
vagy messzebbre helyeztük őket,
08:07
usinghasználva lessKevésbé lightfény or quietercsendesebb soundshangok.
136
475911
2770
kevesebbet fényt vagy
halkabb hangot használtunk.
08:11
And we analyzedelemzett all of these experimentskísérletek
137
479887
2874
És elemeztük az összes ilyen kísérletet,
08:14
untilamíg we really understoodmegértett
the limitshatárok of our techniquetechnika,
138
482761
3622
amíg valóban megértettük
a technikánk korlátait;
mert amint megismertük
ezeket a korlátokat,
08:18
because onceegyszer we understoodmegértett those limitshatárok,
139
486383
1950
08:20
we could figureábra out how to pushnyom them.
140
488333
2346
kitalálhattuk, hogyan lehetne
feszegetni őket.
08:22
And that led to experimentskísérletek like this one,
141
490679
3181
És ez vezetett az olyan kísérletekhez,
mint ez is,
08:25
where again, I'm going to speakbeszél
to a bagtáska of chipsjátékpénz,
142
493860
2739
ahol ismét beszélni fogok
egy zacskó chipshez,
08:28
but this time we'vevoltunk movedköltözött our camerakamera
about 15 feetláb away,
143
496599
4830
de ezúttal a kamerát úgy
öt méterrel távolabb helyeztük el,
08:33
outsidekívül, behindmögött a soundproofhangszigetelt windowablak,
144
501429
2833
kívül, egy hangszigetelt üvegen túl,
08:36
and the wholeegész thing is litmegvilágított
by only naturaltermészetes sunlightnapfény.
145
504262
2803
és az egész csak természetes napfénnyel
volt megvilágítva.
08:40
And so here'sitt the videovideó- that we capturedelfogott.
146
508529
2155
Íme a videó, amit felvettünk.
08:44
And this is what things soundedhangzott like
from insidebelül, nextkövetkező to the bagtáska of chipsjátékpénz.
147
512450
4559
És így hangzott a dolog belül,
a zacskó chips mellett.
08:49
(AudioAudio) MaryMária had a little lambBárány
whoseakinek fleecegyapjú was whitefehér as snow,
148
517009
5038
(Hang) Mary had a little lamb
whose fleece was white as snow,
08:54
and everywheremindenhol that MaryMária wentment,
that lambBárány was sure to go.
149
522047
5619
and everywhere that Mary went,
that lamb was sure to go.
08:59
ADHIRDETÉS: And here'sitt what we were ableképes
to recovervisszaszerez from our silentcsendes videovideó-
150
527666
4017
AD: És ezt sikerült visszanyernünk
a néma videóból,
09:03
capturedelfogott outsidekívül behindmögött that windowablak.
151
531683
2345
amit kintről,
az üvegen túlról vettünk fel.
09:06
(AudioAudio) MaryMária had a little lambBárány
whoseakinek fleecegyapjú was whitefehér as snow,
152
534028
4435
(Hang) Mary had a little lamb
whose fleece was white as snow,
09:10
and everywheremindenhol that MaryMária wentment,
that lambBárány was sure to go.
153
538463
5457
and everywhere that Mary went,
that lamb was sure to go.
09:15
(ApplauseTaps)
154
543920
6501
(Taps)
09:22
ADHIRDETÉS: And there are other waysmódokon
that we can pushnyom these limitshatárok as well.
155
550421
3542
AD: Vannak más módjai is annak,
hogy ezeket a határokat feszegessük.
09:25
So here'sitt a quietercsendesebb experimentkísérlet
156
553963
1798
Itt van ez a csendesebb kísérlet,
09:27
where we filmedfilmre some earphonesfülhallgató
pluggedcsatlakoztatva van into a laptophordozható számítógép computerszámítógép,
157
555761
4110
ahol egy laptophoz csatlakoztatott
füldugót filmeztünk le,
09:31
and in this caseügy, our goalcél was to recovervisszaszerez
the musiczene that was playingjátszik on that laptophordozható számítógép
158
559871
4110
és ebben az esetben, a laptopon játszott
zenét akartuk visszanyerni
09:35
from just silentcsendes videovideó-
159
563981
2299
csupán egy néma videóból
09:38
of these two little plasticműanyag earphonesfülhallgató,
160
566280
2507
erről a két kis műanyag fülhallgatóról,
09:40
and we were ableképes to do this so well
161
568787
2183
és ez annyira jól sikerült,
hogy az eredményre még
a Shazamon is rá tudtam keresni.
09:42
that I could even ShazamShazam our resultstalálatok.
162
570970
2461
09:45
(LaughterNevetés)
163
573431
2411
(Nevetés)
09:49
(MusicZene: "UnderAlatt PressureNyomás" by QueenKirályné)
164
577191
10034
[Videóból visszanyert hang]
(Zene: "Under Pressure" a Queentől)
10:01
(ApplauseTaps)
165
589615
4969
(Taps)
10:06
And we can alsois pushnyom things
by changingváltozó the hardwarehardver that we use.
166
594584
4551
Próbálkozhatunk azzal is, hogy
más eszközöket használunk a felvételhez.
10:11
Because the experimentskísérletek
I've shownLátható you so farmessze
167
599135
2461
Mert azok a kísérletek,
amiket eddig mutattam,
10:13
were doneKész with a camerakamera,
a high-speedMagassebesség camerakamera,
168
601596
2322
mind nagy sebességű kamerával készültek
10:15
that can recordrekord videovideó-
about a 100 timesalkalommal fastergyorsabb
169
603918
2879
ami nagyjából százszor
gyorsabban tud felvenni,
10:18
than mosta legtöbb cellsejt phonestelefonok,
170
606797
1927
mint a legtöbb mobiltelefon,
10:20
but we'vevoltunk alsois foundtalál a way
to use this techniquetechnika
171
608724
2809
de arra is találtunk módot,
hogy ezt a technikát
10:23
with more regularszabályos cameraskamerák,
172
611533
2230
közönségesebb kamerákkal használjuk.
10:25
and we do that by takingbevétel advantageelőny
of what's calledhívott a rollinggördülő shutterredőny.
173
613763
4069
Tettük ezt úgy, hogy kihasználtuk
az úgy nevezett gördülő zárat.
10:29
You see, mosta legtöbb cameraskamerák
recordrekord imagesképek one rowsor at a time,
174
617832
4798
Ugyanis a legtöbb kamera
soronként rögzíti a képeket,
10:34
and so if an objecttárgy movesmozog
duringalatt the recordingfelvétel of a singleegyetlen imagekép,
175
622630
5702
így, ha egy tárgy elmozdul
egyetlen kép rögzítése közben,
10:40
there's a slightenyhe time delaykésleltetés
betweenközött eachminden egyes rowsor,
176
628344
2717
van egy kis időeltolódás
minden sor között,
10:43
and this causesokoz slightenyhe artifactsleletek
177
631061
3157
ez apró kis torzulásokat okoz,
10:46
that get codedkódolt into eachminden egyes framekeret of a videovideó-.
178
634218
3483
amik a videó minden képkockáján
kódolásra kerülnek.
10:49
And so what we foundtalál
is that by analyzingelemzése these artifactsleletek,
179
637701
3806
Arra jöttünk rá, hogy ezeket
a torzulásokat elemezve
10:53
we can actuallytulajdonképpen recovervisszaszerez soundhang
usinghasználva a modifiedmódosított versionváltozat of our algorithmalgoritmus.
180
641507
4615
képesek vagyunk visszanyerni a hangot,
az algoritmusunk módosított verziójával.
10:58
So here'sitt an experimentkísérlet we did
181
646122
1912
Tehát, itt az egyik kísérletünk,
11:00
where we filmedfilmre a bagtáska of candycukorka
182
648034
1695
ahol egy zacskó cukrot filmeztünk,
11:01
while a nearbyKözeli loudspeakerhangszóró playedDátum
183
649729
1741
miközben egy közeli hangszóró
11:03
the sameazonos "MaryMária Had a Little LambBárány"
musiczene from before,
184
651470
2972
ugyanazt a "Mary Had a Little Lamb"
zenét játszotta korábbról,
11:06
but this time, we used just a regularszabályos
store-boughtbolti camerakamera,
185
654442
4203
de ezúttal, csak egy általános,
boltban kapható kamerát használtunk,
11:10
and so in a secondmásodik, I'll playjáték for you
the soundhang that we recoveredvisszanyert,
186
658645
3174
és máris lejátszom önöknek
a hangot, amit visszanyertünk,
11:13
and it's going to soundhang
distortedtorz this time,
187
661819
2050
ezúttal egy kicsit
torzítottan fog hangzani,
11:15
but listen and see if you can still
recognizeelismerik the musiczene.
188
663869
2836
de hallgassák, hogy még
fel tudják-e ismerni a zenét.
11:19
(AudioAudio: "MaryMária Had a Little LambBárány")
189
667723
6223
(Hang: "Mary Had a Little Lamb")
[A zacskó cukorkából visszanyert hang]
11:37
And so, again, that soundshangok distortedtorz,
190
685527
3465
És igen, ez a hang ugyan torzított,
11:40
but what's really amazingelképesztő here
is that we were ableképes to do this
191
688992
4386
de ami igazán lenyűgöző,
hogy képesek voltunk ezt elérni,
11:45
with something
that you could literallyszó szerint runfuss out
192
693378
2626
egy olyan eszközzel,
amit könnyen beszerezhetnek,
11:48
and pickszed up at a BestLegjobb BuyVásárlás.
193
696004
1444
ha átugranak a Best Buy-ba.
11:51
So at this pointpont,
194
699122
1363
Szóval ezen a ponton,
11:52
a lot of people see this work,
195
700485
1974
rengeteg ember, aki látja ezt a munkát
11:54
and they immediatelyazonnal think
about surveillancefelügyelet.
196
702459
3413
rögtön a megfigyelésre gondol.
Hogy őszinte legyek,
11:57
And to be fairbecsületes,
197
705872
2415
12:00
it's not hardkemény to imagineKépzeld el how you mightesetleg use
this technologytechnológia to spykém on someonevalaki.
198
708287
4133
nem nehéz elképzelni, hogy lehetne
ezt a technológiát kémkedésre használni.
12:04
But keep in mindelme that there's alreadymár
a lot of very matureérett technologytechnológia
199
712420
3947
De tartsuk észben, hogy rengeteg
kiforrott technológia létezik már
12:08
out there for surveillancefelügyelet.
200
716367
1579
a megfigyelésre.
12:09
In facttény, people have been usinghasználva laserslézerek
201
717946
2090
Valójában az emberek évtizedek óta
12:12
to eavesdrophallgatózik on objectstárgyak
from a distancetávolság for decadesévtizedekben.
202
720036
2799
lézerek használatával hallgatnak le
tárgyakat a távolban.
12:15
But what's really newúj here,
203
723978
2025
De ami igazán új itt,
12:18
what's really differentkülönböző,
204
726003
1440
ami igazán különböző,
12:19
is that now we have a way
to picturekép the vibrationsrezgések of an objecttárgy,
205
727443
4295
hogy most már van egy módszerünk,
hogy elképzeljük egy tárgy rezgéseit,
12:23
whichmelyik givesad us a newúj lenslencse
throughkeresztül whichmelyik to look at the worldvilág,
206
731738
3413
ami egy új szempontot kínál,
ahonnan a világot szemlélhetjük,
12:27
and we can use that lenslencse
207
735151
1510
és ez nem csak arra jó,
12:28
to learntanul not just about forceserők like soundhang
that causeok an objecttárgy to vibraterezeg,
208
736661
4899
hogy megismerjük a hanghoz hasonló erőket,
ami egy tárgy rezgését okozza,
12:33
but alsois about the objecttárgy itselfmaga.
209
741560
2288
de magát a tárgyat is jobban megismerjük.
12:36
And so I want to take a steplépés back
210
744975
1693
Ezért tennék most egy lépést hátra
12:38
and think about how that mightesetleg changeváltozás
the waysmódokon that we use videovideó-,
211
746668
4249
és szeretnék elgondolkozni,
hogy változtat ez a videózás használatán,
12:42
because we usuallyáltalában use videovideó-
to look at things,
212
750917
3553
mert a videót általában arra használjuk,
hogy nézzük a dolgokat,
12:46
and I've just shownLátható you how we can use it
213
754470
2322
ám épp most mutattam meg,
hogy használható arra,
12:48
to listen to things.
214
756792
1857
hogy hallgassuk a dolgokat.
12:50
But there's anotheregy másik importantfontos way
that we learntanul about the worldvilág:
215
758649
3971
De van még egy fontos módszer,
ami által a világról tanulunk:
ha interakcióba lépünk vele.
12:54
that's by interactingkölcsönható with it.
216
762620
2275
12:56
We pushnyom and pullHúzni and pokelök and prodProd things.
217
764895
3111
Húzzuk és vonjuk a dolgokat,
böködjük és szurkáljuk.
13:00
We shakeráz things and see what happensmegtörténik.
218
768006
3181
Megrázzuk őket és figyeljük,
hogy mi történik.
13:03
And that's something that videovideó-
still won'tszokás let us do,
219
771187
4273
És ez olyasmi, amit a videó
még nem enged nekünk megtenni,
13:07
at leastlegkevésbé not traditionallyhagyományosan.
220
775460
2136
legalábbis hagyományosan nem.
13:09
So I want to showelőadás you some newúj work,
221
777596
1950
Ezért mutatnék egy új munkát önöknek,
13:11
and this is basedszékhelyű on an ideaötlet I had
just a fewkevés monthshónap agoezelőtt,
222
779546
2667
ami egy pár hónappal ezelőtti
ötletemen alapul,
13:14
so this is actuallytulajdonképpen the first time
I've shownLátható it to a publicnyilvános audienceközönség.
223
782213
3301
szóval igazából ez az első alkalom,
hogy megmutatom a nagyközönségnek.
13:17
And the basicalapvető ideaötlet is that we're going
to use the vibrationsrezgések in a videovideó-
224
785514
5363
Az alapvető ötlet, hogy felhasználjuk
a videón rögzített rezgéseket arra,
13:22
to captureelfog objectstárgyak in a way
that will let us interactegymásra hat with them
225
790877
4481
hogy a tárgyakat oly módon örökítsük meg,
ami lehetővé teszi velük az interkaciót
13:27
and see how they reactreagál to us.
226
795358
1974
és megmutatja, hogyan reagálnak ránk.
13:31
So here'sitt an objecttárgy,
227
799120
1764
Szóval itt van egy tárgy,
13:32
and in this caseügy, it's a wirehuzal figureábra
in the shapealak of a humanemberi,
228
800884
3832
ez éppen egy ember alakú drótfigura,
13:36
and we're going to filmfilm that objecttárgy
with just a regularszabályos camerakamera.
229
804716
3088
és fel fogjuk venni ezt a tárgyat
egy átlagos kamerával.
13:39
So there's nothing specialkülönleges
about this camerakamera.
230
807804
2124
Tehát a kamerában
nincsen semmi különleges.
13:41
In facttény, I've actuallytulajdonképpen doneKész this
with my cellsejt phonetelefon before.
231
809928
2961
Sőt, én már csináltam ilyet
a mobilommal is korábban.
13:44
But we do want to see the objecttárgy vibraterezeg,
232
812889
2252
De szeretnénk látni,
ahogy a tárgy rezeg,
13:47
so to make that happentörténik,
233
815141
1133
és hogy ezt elérjük,
13:48
we're just going to bangbumm a little bitbit
on the surfacefelület where it's restingpihenő
234
816274
3346
egy kicsit megütögetjük a felületet,
amin helyet foglal,
13:51
while we recordrekord this videovideó-.
235
819620
2138
miközben felvesszük ezt a videót.
13:59
So that's it: just fiveöt secondsmásodperc
of regularszabályos videovideó-,
236
827398
3671
Szóval ennyi: csak öt másodperc
átlagos videó,
14:03
while we bangbumm on this surfacefelület,
237
831069
2136
miközben ütögetjük a felületet,
14:05
and we're going to use
the vibrationsrezgések in that videovideó-
238
833205
3513
a videóban lévő rezgéseket
arra fogjuk használni,
14:08
to learntanul about the structuralszerkezeti
and materialanyag propertiestulajdonságok of our objecttárgy,
239
836718
4544
hogy többet tudjunk meg a tárgyunk
szerkezeti és anyagi tulajdonságairól,
14:13
and we're going to use that informationinformáció
to createteremt something newúj and interactiveinteraktív.
240
841262
4834
ennek az információnak a segítségével majd
valami újat és interaktívat hozunk létre.
14:24
And so here'sitt what we'vevoltunk createdkészítette.
241
852866
2653
Íme, amit létrehoztunk.
14:27
And it looksúgy néz ki, like a regularszabályos imagekép,
242
855519
2229
Úgy néz ki, mint egy közönséges kép,
14:29
but this isn't an imagekép,
and it's not a videovideó-,
243
857748
3111
de ez nem egy kép,
és nem is egy videó,
14:32
because now I can take my mouseegér
244
860859
2368
mert most foghatom az egeremet
14:35
and I can startRajt interactingkölcsönható
with the objecttárgy.
245
863227
2859
és elkezdhetek kapcsolatot teremteni
a tárggyal.
14:44
And so what you see here
246
872936
2357
És amit most itt látnak,
14:47
is a simulationtettetés of how this objecttárgy
247
875389
2226
az egy szimulációja annak,
14:49
would respondreagál to newúj forceserők
that we'vevoltunk never seenlátott before,
248
877615
4458
ahogy a tárgy reagálna új erőkre,
amiket még sosem láttunk,
14:54
and we createdkészítette it from just
fiveöt secondsmásodperc of regularszabályos videovideó-.
249
882073
3633
és ezt csak egy öt másodperces
egyszerű videóból készítettük.
14:59
(ApplauseTaps)
250
887249
4715
(Taps)
15:09
And so this is a really powerfulerős
way to look at the worldvilág,
251
897421
3227
Ez egy nagyon hatásos módja annak,
ahogy a világot szemléljük,
15:12
because it letslehetővé teszi, us predictmegjósolni
how objectstárgyak will respondreagál
252
900648
2972
mert általa megjósolhatjuk,
hogyan fognak a tárgyak reagálni
15:15
to newúj situationshelyzetek,
253
903620
1823
egy új helyzetre,
15:17
and you could imagineKépzeld el, for instancepélda,
looking at an oldrégi bridgehíd
254
905443
3473
és elképzelhetjük például,
ahogy nézünk egy régi hídra,
15:20
and wonderingcsodálkozó what would happentörténik,
how would that bridgehíd holdtart up
255
908916
3527
és azon gondolkozunk, mi történne,
hogyan tartana ki a híd,
15:24
if I were to drivehajtás my carautó acrossát it.
256
912443
2833
ha áthajtanánk rajta az autónkkal.
15:27
And that's a questionkérdés
that you probablyvalószínűleg want to answerválasz
257
915276
2774
Ez egy olyan kérdés,
amire jó lenne tudni a választ,
15:30
before you startRajt drivingvezetés
acrossát that bridgehíd.
258
918050
2560
mielőtt elkezdünk áthajtani
azon a hídon.
15:33
And of coursetanfolyam, there are going to be
limitationskorlátozások to this techniquetechnika,
259
921988
3272
És természetesen lesznek korlátai
ennek a technikának,
15:37
just like there were
with the visualvizuális microphonemikrofon,
260
925260
2462
mint ahogy voltak
a vizuális mikrofonnak is,
15:39
but we foundtalál that it worksművek
in a lot of situationshelyzetek
261
927722
3181
de azt vettük észre,
hogy sok helyzetben működik,
15:42
that you mightesetleg not expectelvár,
262
930903
1875
amiben talán nem is várnák,
15:44
especiallykülönösen if you give it longerhosszabb videosvideók.
263
932778
2768
különösen,
ha hosszabb videókkal dolgozunk.
15:47
So for examplepélda,
here'sitt a videovideó- that I capturedelfogott
264
935546
2508
Szóval például itt egy videó,
amit felvettem,
15:50
of a bushbokor outsidekívül of my apartmentlakás,
265
938054
2299
egy bokorról a lakásom előtt.
15:52
and I didn't do anything to this bushbokor,
266
940353
3088
Nem csináltam semmit a bokorral,
15:55
but by capturingbefogó a minute-longperc hosszú videovideó-,
267
943441
2705
de míg felvettem egy egyperces videót,
15:58
a gentlekedves breezeszellő causedokozott enoughelég vibrationsrezgések
268
946146
3378
egy kis szellő elég rezgést okozott,
16:01
that we could learntanul enoughelég about this bushbokor
to createteremt this simulationtettetés.
269
949524
3587
hogy eleget megtudjunk a bokorról,
és így létrehozhassuk ezt a szimulációt.
16:07
(ApplauseTaps)
270
955270
6142
(Taps)
16:13
And so you could imagineKépzeld el givingígy this
to a filmfilm directorrendező,
271
961412
2972
El tudják képzelni,
ahogy egy fimrendező kezébe adjuk ezt,
16:16
and lettingbérbeadása him controlellenőrzés, say,
272
964384
1719
hogy így kontrollálhassa, mondjuk
16:18
the strengtherő and directionirány of windszél
in a shotlövés after it's been recordedfeljegyzett.
273
966103
4922
a szél erejét és irányát
egy jelenetben, miután felvették azt.
16:24
Or, in this caseügy, we pointedhegyes our camerakamera
at a hangingfüggő curtainfüggöny,
274
972810
4535
Vagy, ebben az esetben, a kameránkat
egy felakasztott függönyre szegeztük.
16:29
and you can't even see
any motionmozgás in this videovideó-,
275
977345
4129
Nem látnak semmi mozgást
ezen a videón,
16:33
but by recordingfelvétel a two-minute-longkét perc hosszú videovideó-,
276
981474
2925
de egy kétperces videó felvételével,
16:36
naturaltermészetes airlevegő currentsáramok in this roomszoba
277
984399
2438
a szobában lévő
természetes légmozgások
16:38
createdkészítette enoughelég subtleapró,
imperceptibleészrevehetetlen motionsmozgások and vibrationsrezgések
278
986837
4412
elegendő finom, alig érzékelhető
mozgást és rezgést okoztak,
16:43
that we could learntanul enoughelég
to createteremt this simulationtettetés.
279
991249
2565
hogy eleget tudjunk
a szimuláció elkészítéséhez.
16:48
And ironicallyironikusan,
280
996243
2366
Ironikus módon,
16:50
we're kindkedves of used to havingamelynek
this kindkedves of interactivityinteraktivitás
281
998609
3088
eléggé hozzá vagyunk szokva
az ilyen fajta interaktivitáshoz,
16:53
when it comesjön to virtualtényleges objectstárgyak,
282
1001697
2647
ha virtuális tárgyakról van szó,
16:56
when it comesjön to videovideó- gamesjátékok
and 3D modelsmodellek,
283
1004344
3297
videó játékokról és 3D modellekről,
16:59
but to be ableképes to captureelfog this informationinformáció
from realigazi objectstárgyak in the realigazi worldvilág
284
1007641
4404
de a képesség, hogy ezt az információt
a valóság valós tárgyairól is megszerezzük
17:04
usinghasználva just simpleegyszerű, regularszabályos videovideó-,
285
1012045
2817
csupán egyszerű,
hagyományos videót használva,
17:06
is something newúj that has
a lot of potentiallehetséges.
286
1014862
2183
ez valami új,
ami nagyon sok lehetőséget rejt.
17:10
So here are the amazingelképesztő people
who workeddolgozott with me on these projectsprojektek.
287
1018410
4904
Szóval íme a lenyűgöző emberek,
akikkel ezeken a projekteken dolgoztam.
17:16
(ApplauseTaps)
288
1024057
5596
(Taps)
17:24
And what I've shownLátható you todayMa
is only the beginningkezdet.
289
1032819
3057
És amit ma megmutattam önöknek,
az csak a kezdet.
17:27
We'veMost már just startedindult to scratchkarcolás the surfacefelület
290
1035876
2113
Épp csak karcolgatjuk a felszínét annak,
17:29
of what you can do
with this kindkedves of imagingImaging,
291
1037989
2972
amit ezzel a képalkotással
megtehetünk,
17:32
because it givesad us a newúj way
292
1040961
2286
mert egy új módszert biztosít arra,
17:35
to captureelfog our surroundingskörnyéke
with commonközös, accessiblehozzáférhető technologytechnológia.
293
1043342
4724
hogy megörökítsük a környezetünket,
mindennapi, hozzáférhető technológiával.
17:40
And so looking to the futurejövő,
294
1048066
1929
Szóval a jövőbe nézve,
17:41
it's going to be
really excitingizgalmas to exploreFedezd fel
295
1049995
2037
nagyon izgalmas lesz felfedezni,
17:44
what this can tell us about the worldvilág.
296
1052032
1856
mit árulhat el ez nekünk a világról.
17:46
Thank you.
297
1054381
1204
Köszönöm!
17:47
(ApplauseTaps)
298
1055610
6107
(Taps)
Translated by Lúcia Sánta
Reviewed by Csaba Lóki

▲Back to top

ABOUT THE SPEAKER
Abe Davis - Computer scientist
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.

Why you should listen

MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument.  In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.

Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.

More profile about the speaker
Abe Davis | Speaker | TED.com

Data provided by TED.

This site was created in May 2015 and the last update was on January 12, 2020. It will no longer be updated.

We are currently creating a new site called "eng.lish.video" and would be grateful if you could access it.

If you have any questions or suggestions, please feel free to write comments in your language on the contact form.

Privacy Policy

Developer's Blog

Buy Me A Coffee