ABOUT THE SPEAKER
Blaise Agüera y Arcas - Software architect
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces.

Why you should listen

Blaise Agüera y Arcas is principal scientist at Google, where he leads a team working on machine intelligence for mobile devices. His group works extensively with deep neural nets for machine perception and distributed learning, and it also investigates so-called "connectomics" research, assessing maps of connections within the brain.

Agüera y Arcas' background is as multidimensional as the visions he helps create. In the 1990s, he authored patents on both video compression and 3D visualization techniques, and in 2001, he made an influential computational discovery that cast doubt on Gutenberg's role as the father of movable type.

He also created Seadragon (acquired by Microsoft in 2006), the visualization technology that gives Photosynth its amazingly smooth digital rendering and zoom capabilities. Photosynth itself is a vastly powerful piece of software capable of taking a wide variety of images, analyzing them for similarities, and grafting them together into an interactive three-dimensional space. This seamless patchwork of images can be viewed via multiple angles and magnifications, allowing us to look around corners or “fly” in for a (much) closer look. Simply put, it could utterly transform the way we experience digital images.

He joined Microsoft when Seadragon was acquired by Live Labs in 2006. Shortly after the acquisition of Seadragon, Agüera y Arcas directed his team in a collaboration with Microsoft Research and the University of Washington, leading to the first public previews of Photosynth several months later. His TED Talk on Seadragon and Photosynth in 2007 is rated one of TED's "most jaw-dropping." He returned to TED in 2010 to demo Bing’s augmented reality maps.

Fun fact: According to the author, Agüera y Arcas is the inspiration for the character Elgin in the 2012 best-selling novel Where'd You Go, Bernadette?

More profile about the speaker
Blaise Agüera y Arcas | Speaker | TED.com
TED2007

Blaise Agüera y Arcas: How PhotoSynth can connect the world's images

ಬ್ಲೇಸ್ ಅಗ್ವೆರಾ ವೈ ಅರ್ಕಾಸ್‌ರ ಡೆಮೋಸ್ ಫೊಟೊಸಿಂತ್

Filmed:
5,831,957 views

ನಾವು ಡಿಜಿಟಲ್ ಇಮೇಜ್‌ಗಳ ಕಡೆ ನಾವು ನೋಡುವ ವಿಧಾನವನ್ನು ಪರಿವರ್ತಿಸಬಲ್ಲ ಫೊಟೊಸಿಂತ್‌ನ ಪ್ರಭಾವೀ ಡೆಮೊವನ್ನು ಬ್ಲೇಸ್ ಅಗ್ವೆರಾ ವೈ ಅರ್ಕಾಸ್ ತೋರಿಸುತ್ತಿದ್ದಾರೆ. ವೆಬ್‌ನಿಂದ ಪಡೆದ ಸ್ಟಿಲ್‌ ಫೋಟೊಗಳನ್ನು ಬಳಸಿ ಫೋಟೊಸಿಂತ್ ಸುಂದರ ಕನಸಿನ ತಾಣಗಳನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ ಮತ್ತು ನಾವು ಅಲ್ಲಿ ನೆವಿಗೇಟ್‌ ಮಾಡಬಹುದು.
- Software architect
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces. Full bio

Double-click the English transcript below to play the video.

00:25
What I'm going to show you first, as quickly as I can,
0
0
2000
ಎಷ್ಟು ಸಾಧ್ಯವೋ ಅಷ್ಟು ಬೇಗ ನಾನು ನಿಮಗೆ ಮೊದಲು ತೋರಿಸುವುದೇನೆಂದರೆ,
00:27
is some foundational work, some new technology
1
2000
4000
ಒಂದು ಅಡಿಪಾಯ ಹಾಕುವ ಕೆಲಸ, ಕೆಲವು ಹೊಸ ತಂತ್ರಜ್ಞಾನ
00:31
that we brought to Microsoft as part of an acquisition
2
6000
3000
ನಾವು ಮೈಕ್ರೋಸಾಫ್ಟ್‌‌ಗೆ ಅರ್ಜನೆಯ ಒಂದು ಭಾಗವಾಗಿ
00:34
almost exactly a year ago. This is Seadragon,
3
9000
3000
ಸುಮಾರು ಒಂದು ವರ್ಷದ ಹಿಂದೆ ತಂದದ್ದು. ಇದು ಸೀಡ್ರಾಗನ್.
00:37
and it's an environment in which you can either locally or remotely
4
12000
3000
ಅದು ನೀವು ಸ್ಥಳೀಯವಾಗಿ ಅಥವಾ ದೂರವರ್ತಿಯಾಗಿ
00:40
interact with vast amounts of visual data.
5
15000
3000
ಬೃಹತ್ ಮೊತ್ತದ ಮಾಹಿತಿಯ ಜೊತೆ ಸಂವಹನ ಮಾಡಬಹುದಾದ ವಾತಾವರಣ.
00:43
We're looking at many, many gigabytes of digital photos here
6
18000
3000
ನಾವು ಇಲ್ಲಿ ಹಲವು, ಹಲವು ಗಿಗಾಬೈಟ್‌‌ನಷ್ಟು ಡಿಜಿಟಲ್ ಫೋಟೊಗಳನ್ನು
00:46
and kind of seamlessly and continuously zooming in,
7
21000
3000
ಸರಾಗವಾಗಿ ಮತ್ತು ಸತತವಾಗಿ ನೋಡುತ್ತಿದ್ದೇವೆ.
00:50
panning through the thing, rearranging it in any way we want.
8
25000
2000
ಅದನ್ನು ತಿರುವಿ ಹಾಕುತ್ತಿದ್ದೇವೆ, ನಮಗೆ ಬೇಕಾದಂತೆ ಜೋಡಿಸುತ್ತಿದ್ದೇವೆ.
00:52
And it doesn't matter how much information we're looking at,
9
27000
4000
ನಾವು ಎಷ್ಟೊಂದು ಮಾಹಿತಿಯನ್ನು ನೋಡುತ್ತಿದ್ದೇವೆ.
00:56
how big these collections are or how big the images are.
10
31000
3000
ಈ ಶೇಖರಣೆ ಎಷ್ಟು ದೊಡ್ಡದು ಅಥವಾ ಈ ಚಿತ್ರಗಳು ಎಷ್ಟು ದೊಡ್ಡವು ಎಂಬುದು ಅಪ್ರಸ್ತುತ.
00:59
Most of them are ordinary digital camera photos,
11
34000
2000
ಇವುಗಳಲ್ಲಿ ಬಹಳಷ್ಟು ಸಾಮಾನ್ಯ ಡಿಜಿಟಲ್ ಕ್ಯಾಮೆರಾ ಚಿತ್ರಗಳು,
01:01
but this one, for example, is a scan from the Library of Congress,
12
36000
3000
ಆದರೆ ಇದು, ಉದಾಹರಣೆಗೆ, ಲೈಬ್ರೆರಿ ಆಫ್ ಕಾಂಗ್ರೆಸ್‌‌‌ನಿಂದ ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ್ದು,
01:05
and it's in the 300 megapixel range.
13
40000
2000
ಹಾಗೂ ಇದು 300 ಮೆಗಾಪಿಕ್ಸೆಲ್ ಗಾತ್ರವಿದೆ.
01:08
It doesn't make any difference
14
43000
1000
ಅದರಿಂದೇನೂ ವ್ಯತ್ಯಾಸವಾಗುವುದಿಲ್ಲ
01:09
because the only thing that ought to limit the performance
15
44000
3000
ಏಕೆಂದರೆ, ಒಂದು ಈ ತರಹದ ಸಿಸ್ಟಮ್ನ ಕಾರ್ಯವನ್ನು
01:12
of a system like this one is the number of pixels on your screen
16
47000
3000
ಸೀಮಿತಗೊಳಿಸುವ ಅಂಶವೆಂದರೆ ನಿಮ್ಮ ಸ್ಕ್ರೀನ್ನ ಪಿಕ್ಸೆಲ್ ಸಂಖ್ಯೆ
01:15
at any given moment. It's also very flexible architecture.
17
50000
3000
ಯಾವುದೇ ಸಮಯದಲ್ಲೂ ಇದು ನಿಜ. ಇದು ಕೂಡ ನಮ್ಯವಾದ ರಚನೆ.
01:18
This is an entire book, so this is an example of non-image data.
18
53000
3000
ಇದೊಂದು ಸಂಪೂರ್ಣ ಪುಸ್ತಕ, ಚಿತ್ರಗಳಿಲ್ಲದ ಮಾಹಿತಿಗೆ ಉದಾಹರಣೆ.
01:22
This is "Bleak House" by Dickens. Every column is a chapter.
19
57000
5000
ಇದು ಡಿಕನ್ಸ್‌‌ನ ಬ್ಲೀಕ್ ಹೌಸ್. ಪ್ರತಿ ಕಾಲಂ ಕೂಡ ಒಂದು ಅಧ್ಯಾಯ.
01:27
To prove to you that it's really text, and not an image,
20
62000
4000
ಇದು ನಿಜವಾಗಿಯೂ ಪಠ್ಯವಸ್ತು, ಹಾಗೂ ಚಿತ್ರವಲ್ಲ ಎಂದು ನಿಮಗೆ ನಿರೂಪಿಸಲು,
01:31
we can do something like so, to really show
21
66000
2000
ನಿಜವಾಗಿಯೂ ತೋರಿಸಬೇಕೆಂದರೆ ನಾವು ಒಂದು ಕೆಲಸ ಮಾಡಬಹುದು.
01:33
that this is a real representation of the text; it's not a picture.
22
68000
3000
ಇದು ನಿಜವಾಗಿಯೂ ಪಠ್ಯವಸ್ತುವಿನ ನೈಜ ಪ್ರಾತಿನಿಧಿಕ ರೂಪ, ಚಿತ್ರವಲ್ಲ.
01:37
Maybe this is a kind of an artificial way to read an e-book.
23
72000
2000
ಇದೊಂದು ಇ-ಪುಸ್ತಕ ಓದುವ ಕೃತಕ ವಿಧಾನವಿರಬಹುದು.
01:39
I wouldn't recommend it.
24
74000
1000
ಇದನ್ನು ನಾನು ಶಿಫಾರಸು ಮಾಡುವುದಿಲ್ಲ.
01:40
This is a more realistic case. This is an issue of The Guardian.
25
75000
3000
ಇದು ಒಂದು ಇನ್ನೂ ನೈಜ ಉದಾಹರಣೆ. ಇದು ದಿ ಗಾರ್ಡಿಯನ್‌‌ನ ಒಂದು ಸಂಚಿಕೆ.
01:43
Every large image is the beginning of a section.
26
78000
2000
ಪ್ರತಿಯೊಂದು ದೊಡ್ಡ ಚಿತ್ರವೂ ಒಂದು ವಿಭಾಗದ ಪ್ರಾರಂಭ.
01:45
And this really gives you the joy and the good experience
27
80000
3000
ಹಾಗೂ ಇದು ನಿಮಗೆ ನಿಜವಾಗಿಯೂ ಸಂತೋಷ ಮತ್ತು ಒಳ್ಳೆಯ ಅನುಭವ ನೀಡುತ್ತದೆ
01:48
of reading the real paper version of a magazine or a newspaper,
28
83000
5000
ಒಂದು ಪತ್ರಿಕೆ ಅಥವಾ ವೃತ್ತಪತ್ರಿಕೆಯ ನಿಜವಾದ ಆವೃತ್ತಿಯನ್ನು ಓದಲು,
01:54
which is an inherently multi-scale kind of medium.
29
89000
1000
ಒಂದು ರೀತಿಯ ಮಲ್ಟಿ-ಸ್ಕೇಲ್ ಮಾಧ್ಯಮವಿದ್ದಂತೆ.
01:56
We've also done a little something
30
91000
1000
ನಾವು ಇದರಲ್ಲಿ ಇನ್ನೂ ಒಂದು ಕೆಲಸ ಮಾಡಿದ್ದೇವೆ
01:57
with the corner of this particular issue of The Guardian.
31
92000
3000
ಈ ಒಂದು ದಿ ಗಾರ್ಡಿಯನ್ನ ನಿರ್ದಿಷ್ಟ ಸಂಚಿಕೆಯ ಮೂಲೆಗಳಲ್ಲಿ
02:00
We've made up a fake ad that's very high resolution --
32
95000
3000
ನಾವು ತುಂಬಾ ಹೆಚ್ಚು ರೆಸೊಲ್ಯೂಶನ್ ಇರುವ ಒಂದು ನಕಲಿ ಜಾಹಿರಾತು ಮಾಡಿದ್ದೇವೆ --
02:03
much higher than you'd be able to get in an ordinary ad --
33
98000
2000
ಇದು ಒಂದು ಸಾಮಾನ್ಯ ಜಾಹಿರಾತಿನ ರೆಸೊಲ್ಯುಷನ್‌ಗಿಂತ ಹೆಚ್ಚಾಗಿದೆ. --
02:05
and we've embedded extra content.
34
100000
2000
ಹಾಗೂ ನಾವು ಹೆಚ್ಚುವರಿ ವಿಷಯವನ್ನು ಇದಕ್ಕೆ ಸೇರಿಸಿದ್ದೇವೆ.
02:07
If you want to see the features of this car, you can see it here.
35
102000
2000
ನೀವು ಈ ಕಾರಿನ ಲಕ್ಷಣಗಳನ್ನು ನೋಡಬೇಕೆಂದರೆ, ನೀವು ಇಲ್ಲಿ ನೋಡಬಹುದು.
02:10
Or other models, or even technical specifications.
36
105000
4000
ಅಥವಾ ಇತರ ಮಾಡೆಲ್‌‌ಗಳು, ಅಥವಾ ತಾಂತ್ರಿಕ ವಿವರಗಳನ್ನು ಕೂಡ.
02:15
And this really gets at some of these ideas
37
110000
2000
ಹಾಗೂ ಈ ಕೆಲವು ಕಲ್ಪನೆಗಳನ್ನು ನಿಜಮಾಡಬಹುದು
02:18
about really doing away with those limits on screen real estate.
38
113000
4000
ಸ್ಕ್ರೀನ್ ವಿಸ್ತಾರದ ಮೇಲಿರುವ ಮಿತಿಗಳನ್ನು ತೊಡೆದುಹಾಕಬಹುದು.
02:22
We hope that this means no more pop-ups
39
117000
2000
ಅಂದರೆ, ನಾವು ಆಶಿಸುತ್ತೇವೆ ಇನ್ನು ಮುಂದೆ ಪಾಪಪ್‌‌ಗಳು ಇರುವುದಿಲ್ಲ
02:24
and other kind of rubbish like that -- shouldn't be necessary.
40
119000
2000
ಮತ್ತು ಇತರ ತರಹದ ಅಂತಹ ಕಸ -- ಅಗತ್ಯವಿರುವುದಿಲ್ಲ.
02:27
Of course, mapping is one of those really obvious applications
41
122000
2000
ಖಂಡಿತವಾಗಿಯೂ ಮ್ಯಾಪಿಂಗ್ ಇಂಥ ತಂತ್ರಜ್ಞಾನದ
02:29
for a technology like this.
42
124000
2000
ನೈಜ, ಸುಸ್ಪಷ್ಟ ಅಪ್ಲಿಕೇಶನ್‌‌ಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ.
02:31
And this one I really won't spend any time on,
43
126000
2000
ಹಾಗೆಯೇ ಇದು, ಇದರ ಮೇಲೆ ನಾನು ಹೆಚ್ಚು ಸಮಯ ವ್ಯಯ ಮಾಡುವುದಿಲ್ಲ,
02:33
except to say that we have things to contribute to this field as well.
44
128000
2000
ಆದರೆ ಒಂದು ವಿಷಯ ಹೇಳುತ್ತೇನೆ, ಈ ಕ್ಷೇತ್ರಕ್ಕೆ ನಾವು ಕೊಡುಗೆ ಕೊಡುವಂತಹ ವಿಷಯಗಳು ಇವೆ.
02:37
But those are all the roads in the U.S.
45
132000
2000
ಆದರೆ ಅವೆಲ್ಲಾ ಯು.ಎಸ್.ನಲ್ಲಿರುವ ರಸ್ತೆಗಳು
02:39
superimposed on top of a NASA geospatial image.
46
134000
4000
NASAದ ಭೂ ವಿಸ್ತಾರ ಚಿತ್ರದ ಮೇಲೆ ಇರಿಸಲಾಗಿದೆ.
02:44
So let's pull up, now, something else.
47
139000
2000
ಈಗ ನಾವು ಇನ್ನೋದನ್ನು ಹೊರತೆಗೆಯೋಣ.
02:46
This is actually live on the Web now; you can go check it out.
48
141000
3000
ಇದು ವಾಸ್ತವವಾಗಿ ವೆಬ್ ಮೇಲೆ ಈಗ ಜೀವಂತವಾಗಿದೆ, ನೀವು ಹಿಂದಿರುಗಿದಾಗ ಪರೀಕ್ಷಿಸಿಕೊಳ್ಳಬಹುದು.
02:49
This is a project called Photosynth,
49
144000
1000
ಇದೊಂದು ಫೋಟೋಸಿಂತ್ ಎಂದು ಕರೆಯುವ ಯೋಜನೆ,
02:51
which really marries two different technologies.
50
146000
1000
ಅದರ ನಿಜವಾದ ಅರ್ಥ ಎರಡು ಬೇರೆ ಬೇರೆ ತಂತ್ರಜ್ಞಾನಗಳ ಒಂದುಗೂಡುವಿಕೆ.
02:52
One of them is Seadragon
51
147000
1000
ಅದರಲ್ಲಿ ಒಂದು ಸೀಡ್ರಾಗನ್
02:54
and the other is some very beautiful computer vision research
52
149000
2000
ಹಾಗೂ ಇನ್ನೊಂದು ಯಾವುದೋ ಒಂದು ಸುಂದರ ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಕೋನ ಸಂಶೋಧನೆ
02:57
done by Noah Snavely, a graduate student at the University of Washington,
53
152000
2000
ವಾಷಿಂಗ್ಟನ್ ವಿಶ್ವವಿದ್ಯಾಲಯದ ಪದವಿ ವಿದ್ಯಾರ್ಥಿ ನೋವಾ ಸ್ನೇವ್ಲಿ ಮಾಡಿದ್ದು,
03:00
co-advised by Steve Seitz at U.W.
54
155000
2000
ಇದಕ್ಕೆ ಸಲಹೆ ನೀಡಿದ್ದು UWನ ಸ್ಟೀವ್ ಸೀತೆಟ್ಜ್
03:02
and Rick Szeliski at Microsoft Research. A very nice collaboration.
55
157000
4000
ಮತ್ತು ಮೈಕ್ರೊಸಾಫ್ಟ್ ರಿಸರ್ಚ್‌ನ ರಿಕ್ ಸೆಜೆಲಿಸ್ಕಿ. ತುಂಬ ಉತ್ತಮವಾದ ಸಹಯೋಗ.
03:07
And so this is live on the Web. It's powered by Seadragon.
56
162000
2000
ಇದು ವೆಬ್‌ನಲ್ಲಿ ಜೀವಂತವಾಗಿದೆ. ಅದಕ್ಕೆ ಶಕ್ತಿ ಕೊಡುವುದು ಸೀಡ್ರಾಗನ್.
03:09
You can see that when we kind of do these sorts of views,
57
164000
2000
ಈ ರೀತಿಯ ವ್ಯೂಗಳನ್ನು ನಾವು ಮಾಡುವಾಗ ನೀವು ನೋಡಬಹುದು,
03:12
where we can dive through images
58
167000
1000
ಇಲ್ಲಿ ನಾವು ಚಿತ್ರಗಳ ಮೂಲಕ ತೂರಿಕೊಂಡು ಹೋಗುತ್ತೇವೆ.
03:14
and have this kind of multi-resolution experience.
59
169000
1000
ಮತ್ತು ಇಂತಹ ಮಲ್ಟಿ-ರೆಸೊಲ್ಯೂಶನ್ ಅನುಭವ ಪಡೆಯಬಹುದಾಗಿದೆ.
03:16
But the spatial arrangement of the images here is actually meaningful.
60
171000
4000
ಆದರೆ, ಚಿತ್ರಗಳ ಅಚ್ಚುಕಟ್ಟಾದ ಜೋಡಣೆ ನಿಜಕ್ಕೂ ಅರ್ಥಗರ್ಭಿತವಾಗಿದೆ.
03:20
The computer vision algorithms have registered these images together
61
175000
3000
ಕಂಪ್ಯೂಟರ್ ವಿಶನ್ ವಿಧಾನ ಅಂಶಗಳು ಈ ಚಿತ್ರಗಳನ್ನು ಜೋಡಣೆ ಮಾಡಿವೆ,
03:23
so that they correspond to the real space in which these shots --
62
178000
4000
ಅವು ನಿಜವಾದ ವಿನ್ಯಾಸದ ಜೊತೆ ಹೊಂದಾಣಿಕೆಯಾಗುವಂತೆ, ಈ ಚಿತ್ರಗಳು --
03:27
all taken near Grassi Lakes in the Canadian Rockies --
63
182000
2000
ಎಲ್ಲವನ್ನೂ ಕೆನೇಡಿಯನ್ ರಾಕೀಸ್‌‌ನಲ್ಲಿ ಗ್ರಾಸ್ಸಿ ಲೇಕ್‌‌ಗಳ ಸಮೀಪ ತೆಗೆದದ್ದು.
03:31
all these shots were taken. So you see elements here
64
186000
2000
ಹಾಗಾಗಿ, ಇಲ್ಲಿ ನೀವು ಸ್ಥಿರವಾದ ಸ್ಲೈಡ್ ಶೋ ಅಂಶಗಳು
03:33
of stabilized slide-show or panoramic imaging,
65
188000
4000
ಅಥವಾ ವಿಸ್ತೃತ ಚಿತ್ರದರ್ಶನಗಳನ್ನು ನೋಡಬಹುದು
03:40
and these things have all been related spatially.
66
195000
2000
ಹಾಗೂ ಇವೆಲ್ಲವೂ ಸ್ಥಿತ್ಯಂತರ ಸಂಬಂಧ ಹೊಂದಿವೆ.
03:42
I'm not sure if I have time to show you any other environments.
67
197000
3000
ಬೇರೆ ಯಾವುದಾದರೂ ವಾತಾವರಣವನ್ನು ನಿಮಗೆ ತೋರಿಸಲು ನನ್ನ ಬಳಿ ಸಮಯ ಇದೆಯೆ ಎಂಬುದು ನನಗೆ ಖಚಿತವಿಲ್ಲ.
03:45
There are some that are much more spatial.
68
200000
1000
ಇನ್ನೂ ಹೆಚ್ಚು ಸ್ಥಿತ್ಯಂತರದಲ್ಲಿರುವ ಇನ್ನಷ್ಟು ಅಂಶಗಳಿವೆ.
03:47
I would like to jump straight to one of Noah's original data-sets --
69
202000
3000
ನಾನು ನೇರವಾಗಿ ನೋವಾನ ಮೂಲ ಮಾಹಿತಿ-ಕಟ್ಟುಗಳಲ್ಲಿ ಒಂದಕ್ಕೆ ಹೋಗುತ್ತೇನೆ --
03:50
and this is from an early prototype of Photosynth
70
205000
2000
ಹಾಗೂ ಇದು ಫೋಟೋಸಿಂತ್‌‌ನ ಒಂದು ಪ್ರಾರಂಭಿಕ ಮೂಲ ಮಾದರಿ
03:52
that we first got working in the summer --
71
207000
2000
ನಾವು ಬೇಸಿಗೆಯಲ್ಲಿ ಕೆಲಸಮಾಡುವಾಗ ದೊರೆತದ್ದು --
03:54
to show you what I think
72
209000
1000
ನಾನೇನು ಯೋಚಿಸುತ್ತಿದ್ದೇನೆಂದು ನಿಮಗೆ ತೋರಿಸಲು
03:55
is really the punch line behind this technology,
73
210000
3000
ಈ ತಂತ್ರಜ್ಞಾನದ ಹಿಂದಿರುವ ನಿಜವಾದ ಘೋಷಣೆ,
03:59
the Photosynth technology. And it's not necessarily so apparent
74
214000
2000
ಅಂದರೆ ಫೋಟೋಸಿಂತ್ ತಂತ್ರಜ್ಞಾನ. ಹಾಗೂ ನಾವು ವೆಬ್‌‌ಸೈಟ್‌‌ನಲ್ಲಿ ಹಾಕಿರುವ ವಾತಾವರಣಗಳನ್ನು
04:01
from looking at the environments that we've put up on the website.
75
216000
3000
ನೋಡಿದರೆ ಪೂರ್ತಿಯಾಗಿ ವ್ಯಕ್ತವಾಗಬೇಕಾದ ಅಗತ್ಯವೇನಿಲ್ಲ.
04:04
We had to worry about the lawyers and so on.
76
219000
2000
ನಾವು ಲಾಯರ್‌‌ಗಳ ಬಗ್ಗೆ ಹಾಗೂ ಇನ್ನಿತರ ವಿಷಯಗಳ ಬಗ್ಗೆ ತಲೆಕೆಡಿಸಿಕೊಳ್ಳಬೇಕಿತ್ತು.
04:07
This is a reconstruction of Notre Dame Cathedral
77
222000
1000
ಇದು ನೋಟ್ರೆ ಡೇಂ ಕ್ಯಾಥೆಡ್ರಲ್‌ನ ಪುನರ್ ನಿರ್ಮಾಣ
04:09
that was done entirely computationally
78
224000
2000
ಇದನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಕಂಪ್ಯೂಟರ್‌‌ನಲ್ಲಿ ಫ್ಲಿಕರ್‌‌ನಿಂದ
04:11
from images scraped from Flickr. You just type Notre Dame into Flickr,
79
226000
3000
ನುಣುಪು ಮಾಡಿದ ಚಿತ್ರಗಳಿಂದ ಮಾಡಲಾಯಿತು. ನೀವು ಸುಮ್ಮನೆ ಫ್ಲಿಕರ್ ನಲ್ಲಿ ನೋಟ್ರೆ ಡೇಮ್ ಎಂದು ಟೈಪ್ ಮಾಡಿ,
04:14
and you get some pictures of guys in t-shirts, and of the campus
80
229000
3000
ನಿಮಗೆ ಟಿ-ಶರ್ಟ್ ಧರಿಸಿರುವ ಹುಡುಗರು, ಕ್ಯಾಂಪಸ್ ಹಾಗೂ ಇನ್ನೂ ಕೆಲವು
04:17
and so on. And each of these orange cones represents an image
81
232000
4000
ಕಾಣಿಸುತ್ತವೆ. ಹಾಗೆಯೇ ಇಲ್ಲಿರುವ ಪ್ರತಿ ಕಿತ್ತಳೆ ಬಣ್ಣದ ಶಂಕುಗಳು ಚಿತ್ರಗಳನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತವೆ
04:22
that was discovered to belong to this model.
82
237000
2000
ಹಾಗೂ ಅವು ಈ ಮಾದರಿಗೆ ಸೇರಿದವೆಂದು ಕಂಡುಹಿಡಿಯಲಾಗಿದೆ.
04:26
And so these are all Flickr images,
83
241000
2000
ಹಾಗೂ ಇವೆಲ್ಲವೂ ಫ್ಲಿಕರ್ ಚಿತ್ರಗಳು,
04:28
and they've all been related spatially in this way.
84
243000
3000
ಅವೆಲ್ಲವೂ ಸ್ಥಿತ್ಯಂತರದಲ್ಲಿ ಈ ರೀತಿ ಸಂಬಂಧ ಹೊಂದಿವೆ.
04:31
And we can just navigate in this very simple way.
85
246000
2000
ಹಾಗೂ ನಾವು ಈ ರೀತಿ ಸರಳವಾಗಿ ಇವನ್ನು ನೆವಿಗೇಟ್‌ ಮಾಡಬಹುದು.
04:35
(Applause)
86
250000
9000
(ಚಪ್ಪಾಳೆ).
04:44
You know, I never thought that I'd end up working at Microsoft.
87
259000
2000
ನಿಮಗಿದು ಗೊತ್ತೆ, ನಾನು ಕೊನೆಗೆ ಮೈಕ್ರೊಸಾಫ್ಟ್‌‌ನಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತೇನೆಂದು ನಾನೆಂದೂ ಅಂದುಕೊಂಡಿರಲಿಲ್ಲ.
04:46
It's very gratifying to have this kind of reception here.
88
261000
4000
ಈ ರೀತಿಯ ಸ್ವಾಗತ ಇಲ್ಲಿ ದೊರಕಿರುವುದು ಆನಂದಕರ.
04:50
(Laughter)
89
265000
3000
(ನಗು).
04:53
I guess you can see
90
268000
3000
ನಿಮಗೆ ಕಾಣಿಸುತ್ತದೆ ಎಂದು ನಂಬಿದ್ದೇನೆ
04:56
this is lots of different types of cameras:
91
271000
2000
ಇಲ್ಲೆ ಬೇಕಾದಷ್ಟು ಬೇರೆ ಬೇರೆ ತರಹದ ಕ್ಯಾಮೆರಾಗಳಿವೆ:
04:58
it's everything from cell phone cameras to professional SLRs,
92
273000
3000
ಎಲ್ಲವೂ ಇವೆ, ಸೆಲ್ ಫೋನ್ ಕ್ಯಾಮರಾದಿಂದ ಪ್ರೊಫೆಶನಲ್ SLRಗಳ ವರೆಗೂ
05:02
quite a large number of them, stitched
93
277000
1000
ಬಹು ದೊಡ್ಡ ಸಂಖ್ಯೆಯಲ್ಲಿ, ಸೇರಿಸಿ ಟಾಕು ಹಾಕಿದೆ
05:03
together in this environment.
94
278000
1000
ಈ ವಾತಾವರಣದಲ್ಲಿ ಜೊತೆಗೂಡಿಸಲಾಗಿದೆ.
05:04
And if I can, I'll find some of the sort of weird ones.
95
279000
2000
ನನಗೆ ಸಾಧ್ಯವಾದರೆ, ಕೆಲವು ವಿಚಿತ್ರವಾದವುಗಳನ್ನು ವಿಂಗಡಿಸುತ್ತೇನೆ.
05:08
So many of them are occluded by faces, and so on.
96
283000
3000
ಇವುಗಳಲ್ಲಿ ಬಹಳಷ್ಟು ಮುಖಗಳಿಂದ ಮುಚ್ಚಿವೆ, ಇನ್ನೂ ಮುಂತಾದುವು.
05:13
Somewhere in here there are actually
97
288000
1000
ಇಲ್ಲಿ ಎಲ್ಲೋ ಒಂದು ಕಡೆ
05:15
a series of photographs -- here we go.
98
290000
1000
ಫೊಟೋಗಳ ಒಂದು ಸರಣಿಯೇ ಇದೆ -- ಪ್ರಾರಂಭಿಸೋಣ.
05:17
This is actually a poster of Notre Dame that registered correctly.
99
292000
3000
ಇದು ವಾಸ್ತವವಾಗಿ ನೋಟ್ರೆ ಡೇಮ್ ನ ಫೋಟೋ ಸರಿಯಾಗಿ ರಿಜಿಸ್ಟರ್ ಆಗಿದೆ.
05:21
We can dive in from the poster
100
296000
2000
ನಾವು ಪೋಸ್ಟರ್‌‌ನಿಂದ
05:24
to a physical view of this environment.
101
299000
3000
ಈ ವಾತಾವರಣದ ಭೌತಿಕ ನೋಟಕ್ಕೆ ಹೋಗೋಣ.
05:31
What the point here really is is that we can do things
102
306000
3000
ಇಲ್ಲಿ ವಾಸ್ತವವಾಗಿ ಇರುವ ಅಂಶವೆಂದರೆ ನಾವು ಹಲವು ಕೆಲಸಗಳನ್ನು
05:34
with the social environment. This is now taking data from everybody --
103
309000
5000
ಸಾಮಾಜಿಕ ವಾತಾವರಣದೊಂದಿಗೆ ಮಾಡಬಹುದಲ್ಲವೇ ಎಂಬುದು. ಇದು ಈಗ ಎಲ್ಲರಿಂದ ಮಾಹಿತಿ ತೆಗೆದುಕೊಳ್ಳುತ್ತಿದೆ --
05:39
from the entire collective memory
104
314000
1000
ಸಂಪೂರ್ಣ ಸಂಯುಕ್ತ ಮೆಮೊರಿಯಿಂದ ಇದನ್ನು ಮಾಡುತ್ತಿದೆ.
05:40
of, visually, of what the Earth looks like --
105
315000
2000
ಕಣ್ಣೋಟಕ್ಕೆ, ಭೂಮಿ ಹೇಗೆ ಕಾಣುತ್ತದೆ ಎಂಬುದನ್ನು --
05:43
and link all of that together.
106
318000
1000
ಹಾಗೂ ಅದೆಲ್ಲವನ್ನು ಒಂದಕ್ಕೊಂದು ಜೋಡಿಸಿ.
05:44
All of those photos become linked together,
107
319000
2000
ಈ ಎಲ್ಲ ಫೋಟೋಗಳೂ ಒಂದಕ್ಕೊಂದು ಜೋಡಣೆಯಾಗುತ್ತವೆ,
05:46
and they make something emergent
108
321000
1000
ಅದರಿಂದ ಉಂಟಾಗುವುದು
05:47
that's greater than the sum of the parts.
109
322000
2000
ಭಾಗಗಳ ಒಟ್ಟು ಮೊತ್ತಕ್ಕಿಂತ ದೊಡ್ಡದಾಗಿರುತ್ತದೆ.
05:49
You have a model that emerges of the entire Earth.
110
324000
2000
ಇಡೀ ಭೂಮಿಯೇ ಕಾಣುವಂತಹ ಮಾಡೆಲ್ ಉದ್ಭವಿಸುತ್ತದೆ.
05:51
Think of this as the long tail to Stephen Lawler's Virtual Earth work.
111
326000
5000
ಇದನ್ನು ಸ್ಟೀಫನ್ ಲಾವ್ಲರ್‌‌ನ ವರ್ಚುವಲ್ ಅರ್ತ್ನ ಉದ್ದ ಬಾಲದಂತೆ ಇದು ಎಂದುಕೊಳ್ಳಿ.
05:56
And this is something that grows in complexity
112
331000
2000
ಹಾಗೂ ಇದು ಬಹಳ ಸಂಕೀರ್ಣವಾಗಿ ಬೆಳೆಯುತ್ತದೆ
05:58
as people use it, and whose benefits become greater
113
333000
3000
ಜನ ಅದನ್ನು ಉಪಯೋಗಮಾಡಿದಂತೆ, ಅದನ್ನು ಉಪಯೋಗಿಸುವವರಿಗೆ
06:01
to the users as they use it.
114
336000
2000
ಅದರ ಲಾಭ ದೊಡ್ಡದಾಗುತ್ತದೆ.
06:03
Their own photos are getting tagged with meta-data
115
338000
2000
ಅವರದೇ ಫೋಟೋಗಳು ಯಾರೋ ಎಂಟರ್ ಮಾಡಿದ ಮೆಟಾ-ಡೇಟಾ
06:05
that somebody else entered.
116
340000
1000
ದೊಂದಿಗೆ ಸೇರಿಕೊಳ್ಳುತ್ತಿವೆ.
06:07
If somebody bothered to tag all of these saints
117
342000
3000
ಯಾರಾದರೂ ಈ ಎಲ್ಲಾ ಸಂತರ ಫೋಟೋಗಳನ್ನು ಒಂದಕ್ಕೊಂದು ಸೇರಿಸಿದರೆ
06:10
and say who they all are, then my photo of Notre Dame Cathedral
118
345000
3000
ಹಾಗೂ ಅವರೆಲ್ಲಾ ಯಾರೆಂದು ಹೇಳಿದರೆ, ಆಗ ನೋಟ್ರೆ ಡೇಮ್ ಕ್ಯಾಥೆಡ್ರಲ್ನ ನನ್ನ ಫೋಟೋ
06:13
suddenly gets enriched with all of that data,
119
348000
2000
ತಕ್ಷಣ ಎಲ್ಲ ಮಾಹಿತಿಯಿಂದ ಸಮೃದ್ಧವಾಗುತ್ತದೆ,
06:15
and I can use it as an entry point to dive into that space,
120
350000
3000
ಹಾಗೂ ಆ ಸ್ಥಿತಿ ಸ್ಥಾನಕ್ಕೆ ನಾನು ಹಾರಲು ಅದನ್ನು ಎಂಟ್ರಿ ಪಾಯಿಂಟ್ ಮಾಡಿಕೊಳ್ಳಬಹುದು,
06:18
into that meta-verse, using everybody else's photos,
121
353000
2000
ಆ ಮೆಟಾ-ವರ್ಸ್ ಒಳಕ್ಕೆ, ಇತರ ಎಲ್ಲರ ಫೋಟೋಗಳನ್ನೂ ಉಪಯೋಗಿಸಬಹುದು
06:21
and do a kind of a cross-modal
122
356000
2000
ಹಾಗೂ ಒಂದು ರೀತಿಯ ಕ್ರಾಸ್-ಮೋಡಲ್ ಮಾಡಬಹುದು
06:25
and cross-user social experience that way.
123
360000
3000
ಮತ್ತು ಆ ಮೂಲಕ ಕ್ರಾಸ್-ಯೂಸರ್ ಸಾಮಾಜಿಕ ಅನುಭವ ಪಡೆಯಬಹುದು.
06:28
And of course, a by-product of all of that
124
363000
1000
ಹಾಗೆಯೇ, ಇದರ ಉಪ-ಉತ್ಪನ್ನಗಳು ಎಂದರೆ
06:30
is immensely rich virtual models
125
365000
2000
ಅಗಾಧ ಶ್ರೀಮಂತ ವರ್ಚುವಲ್ ಮಾಡೆಲ್‌‌ಗಳು
06:32
of every interesting part of the Earth, collected
126
367000
2000
ಭೂಮಿಯ ಪ್ರತಿ ಆಸಕ್ತಿಕರ ಭಾಗಗಳ ಶೇಖರಣೆ
06:35
not just from overhead flights and from satellite images
127
370000
3000
ಕೇವಲ ಮೇಲೆ ಹಾರುವ ವಿಮಾನಗಳಿಂದ ಮತ್ತು ಉಪಗ್ರಹದಿಂದ ತೆಗೆದ ಚಿತ್ರಗಳಲ್ಲ
06:38
and so on, but from the collective memory.
128
373000
2000
ಬದಲಿಗೆ ಸಂಯುಕ್ತ ಮೆಮೊರಿಯಿಂದ ಶೇಖರಿಸುವುದು.
06:40
Thank you so much.
129
375000
2000
ತುಂಬಾ ಧನ್ಯವಾದಗಳು..
06:42
(Applause)
130
377000
11000
(ಚಪ್ಪಾಳೆ)
06:53
Chris Anderson: Do I understand this right? That what your software is going to allow,
131
388000
4000
ಕ್ರಿಸ್ ಆಂಡರ್‌ಸನ್: ನಾನು ಇದನ್ನು ಸರಿಯಾಗಿ ಅರ್ಥಮಾಡಿಕೊಂಡಿದ್ದೇನೆಯೆ? ನಿನ್ನ ಸಾಫ್ಟ್‌‌ವೇರ್ ಏನು ಮಾಡಲು ಅವಕಾಶ ಕೊಡುತ್ತದೆ ಎಂಬುದನ್ನು.
06:58
is that at some point, really within the next few years,
132
393000
2000
ಅಂದರೆ ಒಂದು ಹಂತದಲ್ಲಿ, ಇನ್ನು ಮುಂದಿನ ಕೆಲವು ವರ್ಷಗಳಲ್ಲಿ,
07:01
all the pictures that are shared by anyone across the world
133
396000
4000
ವಿಶ್ವಾದ್ಯಂತ ಯಾರೇ ಆಗಲಿ ಹಂಚಿಕೊಂಡಿರುವ ಚಿತ್ರಗಳನ್ನು
07:05
are going to basically link together?
134
400000
2000
ನಾವು ಮೂಲತಃ ಜೋಡಣೆ ಮಾಡುತ್ತೇವೆಯೇ?
07:07
BAA: Yes. What this is really doing is discovering.
135
402000
2000
BAA: ಹೌದು. ವಾಸ್ತವವಾಗಿ ಇದು ಏನು ಮಾಡುತ್ತಿದೆ ಎಂದರೆ ಕಂಡುಹಿಡಿಯುತ್ತಿದೆ.
07:09
It's creating hyperlinks, if you will, between images.
136
404000
3000
ಅದು ಹೈಪರ್ ಲಿಂಕ್‌ಗಳನ್ನು ಉಂಟುಮಾಡುತ್ತಿದೆ, ನಿಮಗೆ ಬೇಕೆಂದರೆ, ಚಿತ್ರಗಳ ನಡುವೆ.
07:12
And it's doing that
137
407000
1000
ಅದು ಅದನ್ನು ಚಿತ್ರಗಳೊಳಗಿನ
07:13
based on the content inside the images.
138
408000
1000
ಅಂಶದ ಆಧಾರದ ಮೇಲೆ ನಡೆಸುತ್ತಿದೆ.
07:14
And that gets really exciting when you think about the richness
139
409000
3000
ಹಾಗೂ ನೀವು ಅದರ ಶ್ರೀಮಂತಿಕೆ ಬಗ್ಗೆ ಯೋಚಿಸಿದಾಗ ಅದು ಇನ್ನೂ ರೋಚಕವಾಗುತ್ತದೆ
07:17
of the semantic information that a lot of those images have.
140
412000
2000
ಹಾಗೂ ಈ ಚಿತ್ರಗಳು ಹೊಂದಿರುವ ಭಾಷೆ ಮಾಹಿತಿ ಬಗ್ಗೆ ಯೋಚಿಸಿದಾಗಲೂ ಅಷ್ಟೇ.
07:19
Like when you do a web search for images,
141
414000
2000
ನೀವು ಚಿತ್ರಗಳಿಗಾಗಿ ಒಂದು ವೆಬ್ ಸರ್ಚ್ ಮಾಡಿದಂತೆ,
07:22
you type in phrases, and the text on the web page
142
417000
2000
ನೀವು ಪದಗಳನ್ನು ಟೈಪ್ ಮಾಡುತ್ತೀರ, ಹಾಗೂ ವೆಬ್ ಪೇಜ್ ಮೇಲೆ ಪಠ್ಯಗಳು
07:24
is carrying a lot of information about what that picture is of.
143
419000
3000
ಚಿತ್ರದ ಬಗ್ಗೆ ಸಾಕಷ್ಟು ಮಾಹಿತಿ ಹೊತ್ತು ಸಾಗುತ್ತಿವೆ.
07:27
Now, what if that picture links to all of your pictures?
144
422000
2000
ಈಗ, ಆ ಚಿತ್ರ ನಿಮ್ಮ ಎಲ್ಲ ಚಿತ್ರಗಳಿಗೆ ಸಂಪರ್ಕ ಕಲ್ಪಿಸಿದರೆ?
07:29
Then the amount of semantic interconnection
145
424000
2000
ಆಗ ಪಠ್ಯದ ಅಂತರ ಸಂಪರ್ಕದ ಪರಿಮಾಣ
07:31
and the amount of richness that comes out of that
146
426000
1000
ಹಾಗೂ ಅದರಿಂದ ಬರುವ ಸಾರವತ್ತತೆ
07:32
is really huge. It's a classic network effect.
147
427000
3000
ನಿಜವಾಗಲೂ ಬಹಳ ದೊಡ್ಡದು. ಇದೊಂದು ಶ್ರೇಷ್ಠವಾದ ನೆಟ್‌‌ವರ್ಕ್ ಪ್ರಭಾವ.
07:35
CA: Blaise, that is truly incredible. Congratulations.
148
430000
2000
CA: ಅದು ನಿಜವಾಗಲೂ ಅದ್ಭುತ. ಅಭಿನಂದನೆಗಳು.
07:37
BAA: Thanks so much.
149
432000
1000
BAA: ತುಂಬಾ ಧನ್ಯವಾದಗಳು.

▲Back to top

ABOUT THE SPEAKER
Blaise Agüera y Arcas - Software architect
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces.

Why you should listen

Blaise Agüera y Arcas is principal scientist at Google, where he leads a team working on machine intelligence for mobile devices. His group works extensively with deep neural nets for machine perception and distributed learning, and it also investigates so-called "connectomics" research, assessing maps of connections within the brain.

Agüera y Arcas' background is as multidimensional as the visions he helps create. In the 1990s, he authored patents on both video compression and 3D visualization techniques, and in 2001, he made an influential computational discovery that cast doubt on Gutenberg's role as the father of movable type.

He also created Seadragon (acquired by Microsoft in 2006), the visualization technology that gives Photosynth its amazingly smooth digital rendering and zoom capabilities. Photosynth itself is a vastly powerful piece of software capable of taking a wide variety of images, analyzing them for similarities, and grafting them together into an interactive three-dimensional space. This seamless patchwork of images can be viewed via multiple angles and magnifications, allowing us to look around corners or “fly” in for a (much) closer look. Simply put, it could utterly transform the way we experience digital images.

He joined Microsoft when Seadragon was acquired by Live Labs in 2006. Shortly after the acquisition of Seadragon, Agüera y Arcas directed his team in a collaboration with Microsoft Research and the University of Washington, leading to the first public previews of Photosynth several months later. His TED Talk on Seadragon and Photosynth in 2007 is rated one of TED's "most jaw-dropping." He returned to TED in 2010 to demo Bing’s augmented reality maps.

Fun fact: According to the author, Agüera y Arcas is the inspiration for the character Elgin in the 2012 best-selling novel Where'd You Go, Bernadette?

More profile about the speaker
Blaise Agüera y Arcas | Speaker | TED.com