Abe Davis: New video technology that reveals an object's hidden properties
آبه دیویس: تکنولوژی ویدیوهای جدید که پرده از خصوصیات مخفی اشیاء برمیدارد
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio
Double-click the English transcript below to play the video.
as a very visual thing.
یک موضوع بصری است.
or gesture with my hands while I speak,
و دستم را هنگام صحبت تکان بدم.
that's too subtle for the human eye,
که برای چشم انسان بسیار ناچیزند،
even when humans can't.
حتی اگر انسان نتواند آن را ببیند.
of a person's wrist,
of a sleeping infant,
that these were videos,
at two regular images,
به دو عکس معمولی نگاه میکنید،
almost completely still.
of subtle motion going on here,
the wrist on the left,
the infant on the right,
and fall of her chest
a lot of significance,
too subtle for us to see,
what they call a motion microscope,
یک میکروسکوپ برای حرکت ساختند،
these subtle motions in video
حرکات ریز را نشان میدهد
become large enough for us to see.
آنها را بزرگتر میکند
on the left video,
this person's heart rate.
on the right video,
از همان نرمافزار استفاده کنیم،
that this infant takes,
نوزاد میکشد به ما نشان دهد،
to monitor her breathing.
جدا ازبدن، برای مشاهده نفسهای او استفاده کنیم
because it takes these phenomena
چون این پدیدهها را می یابد.
to experience through touch
and non-invasively.
و بدون نیاز به تاخت و تاز، آنها را ببینیم.
with the folks that created that software,
این نرمافزار شروع بکار کردم،
that we can use software
as a way to extend our sense of touch.
برای تقویت حس لامسه نگاه کنید.
with our ability to hear?
اینکار را بکنیم چه میشود؟
to capture the vibrations of sound,
صدا استفاده کنیم چه میشود،
into a microphone?
به میکروفن تبدیل کنیم؟
in perspective for you.
work by converting the motion
into an electrical signal,
to move readily with sound
and interpreted as audio.
و بصورت شنیداری پخش میشد
too subtle and too fast for us to see.
که ما نمی توانیم آنها را ببینیم
with a high-speed camera
آنها را ضبط کنیم چه خواهد شد
to extract tiny motions
حرکات ریز استفاده کنیم
what sounds created them?
چه صداهایی آنها را ایجاد کرده اند؟
into visual microphones from a distance.
به میکروفونهای بصری تبدیل کنیم.
that you see on the right
که در سمت راست میبینید
played this sound.
of frames per second,
just sitting there doing nothing,
by about a micrometer.
a hundredth and a thousandth
میتوانید با ریز کردن چشمتان ببینید،
perceptually invisible.
با چشم غیر قابل درک است
can be perceptually invisible
میتواند غیر قابل مشاهده باشد
seemingly still video
بیحرکت و بیصدا را بگیریم
out of so little motion?
از یک حرکت کوچک بگیریم؟
move by just a single micrometer,
فقط به اندازه یک میکرومتر حرکت میکنند،
by just a thousandth of a pixel.
of pixels in it,
of the tiny motions that we see
باهم ترکیب کنیم
to something pretty significant.
when we figured this out.
وقتی آن را محاسبه کردیم.
a pretty important piece of the puzzle.
that affect when and how well
که به "چه وقت" و "چقدر" اثر میگذارند
and the lens that you use;
and how loud your sound is.
و صدا چقدر بلند است.
with our early experiments,
any of these factors wrong,
what the problem was.
مشکل از کجا بوده است.
experiments looked like this.
اولیه ما، مثل این بودند.
see our high-speed camera,
دوربین سرعت بالای ما را ببینید
by these bright lamps.
very careful in these early experiments,
خیلی دقت میکردیم
Little lamb! Little lamb!
looks completely ridiculous.
یک بسته چیپس داد میزنم.
we tried this on. (Laughter)
به امتحان ادامه دادیم.(خنده)
to recover this sound.
Little lamb! Little lamb!
we recovered intelligible human speech
to modify the experiment,
or moving the object further away,
the limits of our technique,
to a bag of chips,
about 15 feet away,
by only natural sunlight.
from inside, next to the bag of chips.
whose fleece was white as snow,
that lamb was sure to go.
to recover from our silent video
فیلم بیصدا بازسازی کنیم این است
whose fleece was white as snow,
که پشم آن مانند برف سفید بود
that lamb was sure to go.
that we can push these limits as well.
این محدودیتها را برداریم.
plugged into a laptop computer,
the music that was playing on that laptop
by changing the hardware that we use.
سخت افزارهایمان هل بدیم.
I've shown you so far
a high-speed camera,
about a 100 times faster
to use this technique
of what's called a rolling shutter.
چرخان نام دارد این کا را انجام دادیم.
record images one row at a time,
یک ردیف در زمان ضبط میکنند،
during the recording of a single image,
در طول فیلمبرداری یک تصویر حرکت کند
between each row,
is that by analyzing these artifacts,
با تحلیل این شبه تصاویر
using a modified version of our algorithm.
اصلاح شده الگوریتم بازسازی کنیم.
صدا پخش میکرد
music from before,
store-bought camera,
مغازه خریده بودیم استفاده کردیم
the sound that we recovered,
کردیم را برای شما پخش میکنم،
distorted this time,
recognize the music.
موسیقی رو تشخیص بدید.
is that we were able to do this
that you could literally run out
about surveillance.
this technology to spy on someone.
جاسوسی مردم را با این تکنولوژی کرد.
a lot of very mature technology
تکنولوژی های پیشرفته ای وجود دارند
from a distance for decades.
to picture the vibrations of an object,
through which to look at the world,
دنیا را با آنها نگاه کنیم،
that cause an object to vibrate,
لرزش اشیاء میشوند را بشناسیم،
the ways that we use video,
استفاده از ویدیو را تغییر دهد،
to look at things,
اشیاء استفاده می کنیم،
میتوانیم از آن استفاده کنیم
that we learn about the world:
برای شناختن دنیا وجود دارد:
still won't let us do,
اجازه انجام آن را به ما نمی دهد ،
just a few months ago,
چند ماه پیش داشتم
I've shown it to a public audience.
معرض دید عموم قرار میدهم.
to use the vibrations in a video
در ویدیو استفاده کنیم
that will let us interact with them
میدهند با آنها تعامل کنیم
in the shape of a human,
with just a regular camera.
فیلم خواهیم گرفت.
about this camera.
with my cell phone before.
این کار را انجام داده بودم
on the surface where it's resting
of regular video,
the vibrations in that video
and material properties of our object,
و موادی شیئ مان را بشناسیم
to create something new and interactive.
چیزی جدید و دارای کنش واکنش استفاده میکنیم.
and it's not a video,
with the object.
that we've never seen before,
five seconds of regular video.
معمولی تهیه کردیم.
way to look at the world,
how objects will respond
چگونگی پاسخ به اشیاء را پیش بینی کنیم
looking at an old bridge
به یک پل قدیمی را تصور کنید
how would that bridge hold up
یا چگونه پل تحمل میکند
that you probably want to answer
across that bridge.
limitations to this technique,
این تکنیک وجود خواهد داشت
with the visual microphone,
in a lot of situations
here's a video that I captured
to create this simulation.
بوته میدهد تا شبیه سازی آن ساخته بشود
to a film director,
این را به یک کارگردان بدهیم
in a shot after it's been recorded.
در یک قسمت فیلم، بعد اینکه ضبط شد.
at a hanging curtain,
یک پرده آویزان گرفتیم
any motion in this video,
imperceptible motions and vibrations
لرزشهای جزیی و کم ایجاد کرده
to create this simulation.
برای این شبیهسازی میدهد
this kind of interactivity
and 3D models,
from real objects in the real world
از اشیاء واقعی در دنیای واقعی
a lot of potential.
who worked with me on these projects.
که در این پروژه با من همکاری کردند.
is only the beginning.
with this kind of imaging,
تصویربرداری میتوانید انجام بدهید
with common, accessible technology.
درسترس و معمولی فیلم بگیریم.
really exciting to explore
ABOUT THE SPEAKER
Abe Davis - Computer scientistComputer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.
Why you should listen
MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument. In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.
Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.
Abe Davis | Speaker | TED.com