Abe Davis: New video technology that reveals an object's hidden properties
אייב דייויס: טכנולוגיית וידאו חדשה שמגלה את התכונות הנסתרות של עצמים
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio
Double-click the English transcript below to play the video.
as a very visual thing.
or gesture with my hands while I speak,
או אחווה בידיי בעודי מדבר,
that's too subtle for the human eye,
שהן עדינות מדי לעין האנושית,
even when humans can't.
את התנועה הזו אפילו כשאנשים לא.
of a person's wrist,
של פרק כף יד של אדם,
of a sleeping infant,
that these were videos,
at two regular images,
בשתי תמונות רגילות,
almost completely still.
of subtle motion going on here,
שמתרחשות שם,
the wrist on the left,
the infant on the right,
and fall of her chest
a lot of significance,
too subtle for us to see,
כדי שנוכל לראות אותן,
what they call a motion microscope,
מה שהם קוראים לו מיקרוסקופ תנועה,
these subtle motions in video
את התנועות העדינות האלו בסרטון
become large enough for us to see.
לגדולות מספיק כדי שנראה אותן.
on the left video,
על הסרטון השמאלי,
this person's heart rate.
on the right video,
על הסרטון הימני,
that this infant takes,
שהתינוקת הזו לוקחת,
to monitor her breathing.
נטולת מגע כדי לנטר את הנשימה שלה.
because it takes these phenomena
מפני שהיא לוקחת את התופעה הזו
to experience through touch
and non-invasively.
ויזואלית וללא פלישה.
with the folks that created that software,
עם האנשים שיצרו את התוכנה הזו,
that we can use software
להשתמש בתוכנה
as a way to extend our sense of touch.
כדרך להרחיב את חוש המגע שלנו.
with our ability to hear?
עם היכולת לשמוע?
to capture the vibrations of sound,
כדי ללכוד את הרעידות של הצלילים,
into a microphone?
in perspective for you.
work by converting the motion
על ידי המרת התנועה
into an electrical signal,
to move readily with sound
and interpreted as audio.
ומתורגמת לאודיו.
too subtle and too fast for us to see.
עדינות ומהירות מדי כדי שנוכל לראות אותן.
with a high-speed camera
to extract tiny motions
what sounds created them?
כדי להבין איזה צלילים יצרו אותן?
into visual microphones from a distance.
למיקרופונים ויזואליים ממרחק.
that you see on the right
played this sound.
of frames per second,
just sitting there doing nothing,
by about a micrometer.
בערך במיקרו מטר.
a hundredth and a thousandth
perceptually invisible.
היא בלתי נראית תפיסתית.
can be perceptually invisible
בלתי נראה תפיסתית
seemingly still video
שנראה דומם
out of so little motion?
מכל כך מעט תנועה?
move by just a single micrometer,
זזים במיקרומטר אחד בלבד,
by just a thousandth of a pixel.
רק באלפית פיקסל.
of pixels in it,
of the tiny motions that we see
התנועות הזעירות האלו שאנחנו רואים
to something pretty significant.
when we figured this out.
a pretty important piece of the puzzle.
that affect when and how well
שמשפיעים על מתי וכמה טוב
and the lens that you use;
and how loud your sound is.
with our early experiments,
עם הניסויים הראשונים,
any of these factors wrong,
what the problem was.
experiments looked like this.
see our high-speed camera,
את המצלמה המהירה שלנו,
by these bright lamps.
very careful in these early experiments,
מאוד זהירים בניסויים הראשונים האלה,
Little lamb! Little lamb!
looks completely ridiculous.
we tried this on. (Laughter)
שניסינו עליה את זה. (צחוק)
to recover this sound.
Little lamb! Little lamb!
טלה קטן! טלה קטן!
we recovered intelligible human speech
ששחזרנו דיבור אדם מובן
to modify the experiment,
or moving the object further away,
the limits of our technique,
to a bag of chips,
about 15 feet away,
by only natural sunlight.
from inside, next to the bag of chips.
whose fleece was white as snow,
שצמרו היה לבן כשלג,
that lamb was sure to go.
to recover from our silent video
לשחזר מהסרטון הדומם שלנו
whose fleece was white as snow,
שצמרו היה לבן כשלג,
that lamb was sure to go.
that we can push these limits as well.
אנחנו יכולים לדחוף את המגבלות.
plugged into a laptop computer,
the music that was playing on that laptop
את המוזיקה שנוגנה במחשב הנייד
by changing the hardware that we use.
על ידי שינוי החומרה בה אנחנו משתמשים.
I've shown you so far
a high-speed camera,
about a 100 times faster
במהירות גדולה פי 100 בערך
to use this technique
of what's called a rolling shutter.
מה שנקרא צמצם מתגלגל.
record images one row at a time,
מקליטות תמונות שורה אחת אחרי השניה,
during the recording of a single image,
between each row,
is that by analyzing these artifacts,
שעל ידי ניתוח הפגמים האלה,
using a modified version of our algorithm.
בשימוש בגרסה מעודכנת של האלגוריתם שלנו.
music from before,
"למרי היה טלה קטן" כמו מקודם,
store-bought camera,
במצלמה רגילה שנקנתה בחנות,
the sound that we recovered,
את הצליל ששחזרנו,
distorted this time,
recognize the music.
לזהות את המוזיקה.
is that we were able to do this
זה שהיינו מסוגלים לעשות זאת
that you could literally run out
about surveillance.
this technology to spy on someone.
להשתמש בטכנולוגיה הזו לרגל על מישהו.
a lot of very mature technology
from a distance for decades.
to picture the vibrations of an object,
through which to look at the world,
דרכה להסתכל על העולם,
that cause an object to vibrate,
כמו צליל שגורמים לעצם לנוע,
the ways that we use video,
את הדרך בה אנחנו משתמשים בסרטונים,
to look at things,
משתמשים בסרטונים כדי להביט בדברים,
that we learn about the world:
שאנחנו יכולים ללמוד על העולם:
ודוחפים וממששים עצמים.
still won't let us do,
קצת מהעבודה החדשה שלי,
just a few months ago,
שהיה לי רק לפני כמה חודשים,
I've shown it to a public audience.
שאני מראה את זה לציבור.
to use the vibrations in a video
להשתמש ברעידות בסרטון
that will let us interact with them
שתיתן לנו להשפיע עליהם
in the shape of a human,
with just a regular camera.
about this camera.
with my cell phone before.
עם מצלמת הסלולרי שלי לפני כן.
on the surface where it's resting
מעט על המשטח עליו הוא מונח
of regular video,
the vibrations in that video
and material properties of our object,
המבניות והחומריות של העצם שלנו,
to create something new and interactive.
כדי ליצור משהו חדש ואינטראקטיבי.
and it's not a video,
with the object.
that we've never seen before,
five seconds of regular video.
way to look at the world,
how objects will respond
looking at an old bridge
שתביטו בגשר ישן
how would that bridge hold up
that you probably want to answer
across that bridge.
limitations to this technique,
with the visual microphone,
in a lot of situations
here's a video that I captured
to create this simulation.
כדי ליצור את הדמייה הזו.
to a film director,
in a shot after it's been recorded.
בצילום לאחר שהוא הוקלט.
at a hanging curtain,
כיוונו את המצלמה לוילון תלוי,
any motion in this video,
תנועה בסרטון הזה,
imperceptible motions and vibrations
ובלתי נקלטות
to create this simulation.
כדי ליצור את ההדמיה הזו.
this kind of interactivity
את יכולת ההשפעה הזו
and 3D models,
from real objects in the real world
מעצמים אמיתיים בעולם האמיתי
a lot of potential.
who worked with me on these projects.
שעבדו איתי על הפרוייקטים האלה.
is only the beginning.
with this kind of imaging,
with common, accessible technology.
עם טכנולוגיה נפוצה ונגישה.
really exciting to explore
ABOUT THE SPEAKER
Abe Davis - Computer scientistComputer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.
Why you should listen
MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument. In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.
Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.
Abe Davis | Speaker | TED.com