Abe Davis: New video technology that reveals an object's hidden properties
エイブ・デイヴィス: 物の隠れた性質を解き明かす新しい映像技術
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio
Double-click the English transcript below to play the video.
見えるものだと思っています
as a very visual thing.
or gesture with my hands while I speak,
話しながら身振り手振りをする
目に見えるものです
that's too subtle for the human eye,
重要な動きの世界があります
人の目には見えなくとも
even when humans can't.
注意を払うようになりました
説明しましょう
of a person's wrist,
of a sleeping infant,
赤ちゃんの映像です
that these were videos,
ビデオだと言わなければ
思ったことでしょう
at two regular images,
almost completely still.
of subtle motion going on here,
沢山の微細な動きがあります
手首に触れてみたなら
the wrist on the left,
the infant on the right,
抱きかかえたなら
and fall of her chest
上下するのを
a lot of significance,
大切なものですが
too subtle for us to see,
見ただけでは分からないため
what they call a motion microscope,
というのを作りました
these subtle motions in video
検出して拡大し
become large enough for us to see.
ソフトウェアです
on the left video,
左の映像に使うと
目に見えるようになり
ことだってできます
this person's heart rate.
on the right video,
右の映像に使ったなら
that this infant takes,
目に見えるようになり
to monitor her breathing.
モニタできるようになります
because it takes these phenomena
強力な技術です
分からない現象を
to experience through touch
捉えられるからです
and non-invasively.
with the folks that created that software,
考案した人たちと共同で研究するようになり
挑戦することにしました
that we can use software
as a way to extend our sense of touch.
できるのはすごいけど
with our ability to hear?
と思ったのです
to capture the vibrations of sound,
マイクに変えてしまうことはできないか?
into a microphone?
アイデアなので
in perspective for you.
説明しましょう
work by converting the motion
中にある振動板の動きを
into an electrical signal,
仕組みになっています
to move readily with sound
動くようにデザインされていて
and interpreted as audio.
記録できるようになっています
振動させます
too subtle and too fast for us to see.
目に見えないだけです
with a high-speed camera
高速度カメラで撮影して
to extract tiny motions
その小さな動きを取り出し
what sounds created them?
知ることはできないだろうか?
into visual microphones from a distance.
視覚的なマイクへと変えることができます
行った実験の1つで
that you see on the right
撮影しながら
played this sound.
こんな音を流しました
of frames per second,
撮っていますが
じっとしているようにしか
just sitting there doing nothing,
by about a micrometer.
1ミクロン程度だからです
a hundredth and a thousandth
百分の1から千分の1の間
目をこらしたところで
perceptually invisible.
目では捉えられないのです
can be perceptually invisible
感知できなくとも
有意な変化があり
seemingly still video
見えない映像から
取り出すことができます
可能なのか?
out of so little motion?
これほど多くの情報を取り出せるのか?
move by just a single micrometer,
ちょうど1ミクロンで
by just a thousandth of a pixel.
千分の1ピクセルだったとしましょう
見えますが
of pixels in it,
of the tiny motions that we see
積み重なって
to something pretty significant.
when we figured this out.
すごく興奮しましたね
a pretty important piece of the puzzle.
まだ欠けていました
that affect when and how well
影響する要因は
どれくらい離れているか
and the lens that you use;
レンズを使うか
and how loud your sound is.
音の大きさはどれくらいか
優れているにしても
with our early experiments,
慎重にやる必要がありました
any of these factors wrong,
何か1つでもまずいと
what the problem was.
出てくるだけだからです
experiments looked like this.
このような設定で行ったのです
see our high-speed camera,
設置されていて
向けられています
by these bright lamps.
照らされています
very careful in these early experiments,
非常に慎重を期して進めました
ヒツジ ヒツジ ヒツジ
Little lamb! Little lamb!
looks completely ridiculous.
馬鹿みたいに見える実験でした
大声を張り上げています
当てていたので
we tried this on. (Laughter)
熱で文字通り溶けてしまいました (笑)
見えようとも
重要なものでした
to recover this sound.
成功したからです
Little lamb! Little lamb!
Little lamb! Little lamb!
we recovered intelligible human speech
音声のない映像から
初めて復元できたからです
to modify the experiment,
実験を始めました
物をもっと離れたところに置く
or moving the object further away,
音を小さくする
分析して
the limits of our technique,
見極めました
分かるからです
たどり着きました
to a bag of chips,
音を流しますが
about 15 feet away,
5メートル離れていて
背後にあります
by only natural sunlight.
自然の太陽光です
撮影した映像です
from inside, next to the bag of chips.
ポテトチップの袋の横で流していた音です
whose fleece was white as snow,
(メリーさんは小さな羊を飼っていた 雪のように白い毛をして)
that lamb was sure to go.
(メリーさんの行くところは どこにでも付いてきた)
to recover from our silent video
窓の背後から撮した
取り出した音声です
whose fleece was white as snow,
whose fleece was white as snow,
that lamb was sure to go.
that lamb was sure to go.
that we can push these limits as well.
他にもあります
plugged into a laptop computer,
イヤホンを撮しています
the music that was playing on that laptop
無音の映像から
ということでした
うまくいって
Shazamで当てることさえできました
by changing the hardware that we use.
限界を押し広げることができます
I've shown you so far
a high-speed camera,
about a 100 times faster
カメラよりも
撮影することができます
to use this technique
普通のカメラで
見つけました
of what's called a rolling shutter.
利用しています
record images one row at a time,
画像を1行ずつ記録しています
during the recording of a single image,
撮影対象が動くと
between each row,
ズレがあるため
記録されることになります
is that by analyzing these artifacts,
using a modified version of our algorithm.
そこから音を復元できることが分かりました
music from before,
store-bought camera,
普通のカメラを使っています
the sound that we recovered,
お聞かせします
distorted this time,
recognize the music.
おわかりになると思います
is that we were able to do this
普通のカメラで
that you could literally run out
できたということです
about surveillance.
この技術を使うというのは
this technology to spy on someone.
a lot of very mature technology
スパイ活動に関しては多くの成熟した技術が
ということです
レーザーを照射するというのは
from a distance for decades.
行われています
本当に新しく
to picture the vibrations of an object,
手に入れたということで
through which to look at the world,
新しいレンズになります
that cause an object to vibrate,
学べるだけでなく
学ぶことができます
the ways that we use video,
いかに変えうるかを考えてみましょう
to look at things,
ビデオを使います
使えることを
that we learn about the world:
もう1つあります
つついたり 揺すったりして
still won't let us do,
できないことです
普通のビデオでは
最新の研究で
just a few months ago,
アイデアを元にしています
I've shown it to a public audience.
これが初めてです
to use the vibrations in a video
映像の中の振動をヒントに
that will let us interact with them
形にするということです
in the shape of a human,
針金人形です
with just a regular camera.
ビデオ撮影します
about this camera.
使いません
with my cell phone before.
使っていました
見たいので
on the surface where it's resting
台の上を
5秒間の普通のビデオで
of regular video,
the vibrations in that video
振動を使って
and material properties of our object,
学ぼうというのです
to create something new and interactive.
新たなインタラクティブな物を作ります
これです
画像に見えますが
and it's not a video,
ビデオでもありません
with the object.
できるんです
新しい働きかけに対して
that we've never seen before,
シミュレーションです
five seconds of regular video.
普通のビデオから作ったんです
way to look at the world,
新しい強力な方法です
how objects will respond
物がどう反応するかを
できるからです
looking at an old bridge
how would that bridge hold up
分かりかねているという状況を
that you probably want to answer
across that bridge.
知りたいはずです
limitations to this technique,
限界はあり
同じです
with the visual microphone,
in a lot of situations
多くの状況で使え
特にそうです
here's a video that I captured
藪を撮したビデオで
何もしていません
撮している間に
十分な振動を生み出してくれ
to create this simulation.
作れました
to a film director,
映画監督は
in a shot after it's been recorded.
使うかもしれません
at a hanging curtain,
カーテンを撮していて
any motion in this video,
対流で生じた
imperceptible motions and vibrations
微かな動きや振動から
to create this simulation.
十分な情報が得られます
this kind of interactivity
and 3D models,
from real objects in the real world
普通のビデオ映像を使って
引き出すというのは
a lot of potential.
大きな可能性があります
who worked with me on these projects.
素晴らしい仲間たちです
is only the beginning.
始まりにすぎません
可能になることの
with this kind of imaging,
触れたに過ぎません
手に入れられる道具だけで
with common, accessible technology.
可能にしてくれるからです
really exciting to explore
探求していくのは
思います
ABOUT THE SPEAKER
Abe Davis - Computer scientistComputer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.
Why you should listen
MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument. In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.
Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.
Abe Davis | Speaker | TED.com