ABOUT THE SPEAKER
Blaise Agüera y Arcas - Software architect
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces.

Why you should listen

Blaise Agüera y Arcas is principal scientist at Google, where he leads a team working on machine intelligence for mobile devices. His group works extensively with deep neural nets for machine perception and distributed learning, and it also investigates so-called "connectomics" research, assessing maps of connections within the brain.

Agüera y Arcas' background is as multidimensional as the visions he helps create. In the 1990s, he authored patents on both video compression and 3D visualization techniques, and in 2001, he made an influential computational discovery that cast doubt on Gutenberg's role as the father of movable type.

He also created Seadragon (acquired by Microsoft in 2006), the visualization technology that gives Photosynth its amazingly smooth digital rendering and zoom capabilities. Photosynth itself is a vastly powerful piece of software capable of taking a wide variety of images, analyzing them for similarities, and grafting them together into an interactive three-dimensional space. This seamless patchwork of images can be viewed via multiple angles and magnifications, allowing us to look around corners or “fly” in for a (much) closer look. Simply put, it could utterly transform the way we experience digital images.

He joined Microsoft when Seadragon was acquired by Live Labs in 2006. Shortly after the acquisition of Seadragon, Agüera y Arcas directed his team in a collaboration with Microsoft Research and the University of Washington, leading to the first public previews of Photosynth several months later. His TED Talk on Seadragon and Photosynth in 2007 is rated one of TED's "most jaw-dropping." He returned to TED in 2010 to demo Bing’s augmented reality maps.

Fun fact: According to the author, Agüera y Arcas is the inspiration for the character Elgin in the 2012 best-selling novel Where'd You Go, Bernadette?

More profile about the speaker
Blaise Agüera y Arcas | Speaker | TED.com
TED2007

Blaise Agüera y Arcas: How PhotoSynth can connect the world's images

Phác thảo của Blaise Aguera Y Arcas về công nghệ tổng hợp hình ảnh

Filmed:
5,831,957 views

Blaise Aguera y Arcas trình bày về công nghệ tổng hợp hình ảnh-Photosynth, một phần mềm có thể làm thay đổi cách nhìn nhận của chúng ta về công nghệ kỹ thuật số. Photosynnth cho phép xây dựng một hình ảnh hoàn hảo từ những bức ảnh đã được chọn lọc trên các trang web và có khả năng quản lý và tìm kiếm dễ dàng một số lớn các hình ảnh.
- Software architect
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces. Full bio

Double-click the English transcript below to play the video.

00:25
What I'm going to showchỉ you first, as quicklyMau as I can,
0
0
2000
Thứ mà tôi sẽ trình bày đến các bạn trước, một cách nhanh nhất có thể
00:27
is some foundationalnền tảng work, some newMới technologyCông nghệ
1
2000
4000
là một công trình cơ bản, một công nghệ mới
00:31
that we broughtđưa to MicrosoftMicrosoft as partphần of an acquisitionmua lại
2
6000
3000
mà chúng tôi đã mang đến Microsoft trong cuộc sát nhập
00:34
almosthầu hết exactlychính xác a yearnăm agotrước. This is SeadragonSeadragon,
3
9000
3000
cách đây một năm. Đây là Seadragon.
00:37
and it's an environmentmôi trường in which you can eitherhoặc locallycục bộ or remotelyđiều khiển từ xa
4
12000
3000
Là một môi trường mà bạn có thể tương tác trong phạm vi
00:40
interacttương tác with vastrộng lớn amountslượng of visualtrực quan datadữ liệu.
5
15000
3000
xa hoặc gần với nhiều loại dữ liệu hình ảnh.
00:43
We're looking at manynhiều, manynhiều gigabytesGigabyte of digitalkỹ thuật số photosảnh here
6
18000
3000
Chúng ta đang nhìn thấy rất nhiều Gb ảnh điện tử ở đây
00:46
and kindloại of seamlesslyliên tục and continuouslyliên tục zoomingphóng to in,
7
21000
3000
và gần như đang liên tục thu hẹp lại,
00:50
panninglướt throughxuyên qua the thing, rearrangingsắp xếp lại it in any way we want.
8
25000
2000
xoay trái phải, xếp đặt lại chúng bằng mọi cách mà ta muốn
00:52
And it doesn't mattervấn đề how much informationthông tin we're looking at,
9
27000
4000
Và không quan trọng chuyện lượng thông tin ta cần đến lớn bao nhiêu,
00:56
how biglớn these collectionsbộ sưu tập are or how biglớn the imageshình ảnh are.
10
31000
3000
những bộ sưu tập này và những hình ảnh đó lớn bao nhiêu.
00:59
MostHầu hết of them are ordinarybình thường digitalkỹ thuật số cameraMáy ảnh photosảnh,
11
34000
2000
Tất cả đều là những hình ảnh chụp từ máy ảnh số,
01:01
but this one, for examplethí dụ, is a scanquét from the LibraryThư viện of CongressQuốc hội Hoa Kỳ,
12
36000
3000
nhưng cái này chẳng hạn, là bản quét từ Thư viện Quốc hội,
01:05
and it's in the 300 megapixelmegapixel rangephạm vi.
13
40000
2000
và có khối lượng khoảng 300 mega điểm ảnh.
01:08
It doesn't make any differenceSự khác biệt
14
43000
1000
Những cũng chẳng có gì khác biệt
01:09
because the only thing that oughtnên to limitgiới hạn the performancehiệu suất
15
44000
3000
vì điều duy nhất làm giới hạn khả năng
01:12
of a systemhệ thống like this one is the numbercon số of pixelsđiểm ảnh on your screenmàn
16
47000
3000
của một hệ thống như thế này chính là số điểm ảnh trên màn hình của bạn
01:15
at any givenđược momentchốc lát. It's alsocũng thế very flexiblelinh hoạt architecturekiến trúc.
17
50000
3000
tại bất cứ thời điểm nào. Kiến trúc của nó cũng rất đa dạng.
01:18
This is an entiretoàn bộ booksách, so this is an examplethí dụ of non-image-image datadữ liệu.
18
53000
3000
Đây là một quyển sách, ví dụ về dữ liệu không hình ảnh.
01:22
This is "BleakẢm đạm HouseNgôi nhà" by DickensDickens. EveryMỗi columncột is a chapterchương.
19
57000
5000
Đây là quyển Ngôi nhà lạnh lẽo của Dickens. Mỗi cột là một chương.
01:27
To provechứng minh to you that it's really textbản văn, and not an imagehình ảnh,
20
62000
4000
Để chứng minh với các bạn rằng đây chính là một văn bản và không phải là hình ảnh,
01:31
we can do something like so, to really showchỉ
21
66000
2000
chúng ta có thể làm như thế này, để thực sự thấy rằng
01:33
that this is a realthực representationđại diện of the textbản văn; it's not a picturehình ảnh.
22
68000
3000
đây là phần trình bày của một văn bản; nó không phải là một bức tranh.
01:37
Maybe this is a kindloại of an artificialnhân tạo way to readđọc an e-booke-book.
23
72000
2000
Có thể đây là một cách để đọc một quyển sách điện tử
01:39
I wouldn'tsẽ không recommendgiới thiệu it.
24
74000
1000
Tôi không khuyến khích cách này.
01:40
This is a more realisticthực tế casetrường hợp. This is an issuevấn đề of The GuardianNgười giám hộ.
25
75000
3000
Đây là một trường hợp thực tế hơn. Đây là một số báo của tờ The Guardian.
01:43
EveryMỗi largelớn imagehình ảnh is the beginningbắt đầu of a sectionphần.
26
78000
2000
Mỗi bức ảnh to bắt đầu một mục.
01:45
And this really givesđưa ra you the joyvui sướng and the good experiencekinh nghiệm
27
80000
3000
Và nó thực sự mang lại cho bạn sự hứng khởi và vui vẻ
01:48
of readingđọc hiểu the realthực papergiấy versionphiên bản of a magazinetạp chí or a newspaperbáo chí,
28
83000
5000
khi đọc một tờ báo thực sự
01:54
which is an inherentlyvốn có multi-scalenhiều quy mô kindloại of mediumTrung bình.
29
89000
1000
và là một phương tiện đa dạng xuyên suốt.
01:56
We'veChúng tôi đã alsocũng thế donelàm xong a little something
30
91000
1000
Chúng tôi đã làm thay đổi một chút
01:57
with the cornergóc of this particularcụ thể issuevấn đề of The GuardianNgười giám hộ.
31
92000
3000
với góc của tờ báo The Guardian này.
02:00
We'veChúng tôi đã madethực hiện up a fakegiả mạo adquảng cáo that's very highcao resolutionđộ phân giải --
32
95000
3000
Chúng tôi đã tạo ra một mẩu quảng cáo với độ phân giải cao--
02:03
much highercao hơn than you'dbạn muốn be ablecó thể to get in an ordinarybình thường adquảng cáo --
33
98000
2000
cao hơn hẳn cái thường có ở quảng cáo thông thường --
02:05
and we'vechúng tôi đã embeddednhúng extrathêm contentNội dung.
34
100000
2000
và chúng tôi đính thêm nhiều nội dung khác.
02:07
If you want to see the featuresTính năng, đặc điểm of this carxe hơi, you can see it here.
35
102000
2000
Nếu bạn muốn xem các nét đặc trưng của chiếc xe này, bạn có thể xem ở đây.
02:10
Or other modelsmô hình, or even technicalkỹ thuật specificationsthông số kỹ thuật.
36
105000
4000
Cũng có thể xem các mẫu khác, thậm chí cả đặc tính kĩ thuật.
02:15
And this really getsđược at some of these ideasý tưởng
37
110000
2000
Và điều này mang đến một vài ý tưởng
02:18
about really doing away with those limitsgiới hạn on screenmàn realthực estatebất động sản.
38
113000
4000
về việc vượt qua giới hạn trên màn hình.
02:22
We hopemong that this meanscó nghĩa no more pop-upscửa sổ bật lên
39
117000
2000
Chúng tôi mong rằng điều này có nghĩa là sẽ không còn các quảng cáo dạng pop-up
02:24
and other kindloại of rubbishrác rưởi like that -- shouldn'tkhông nên be necessarycần thiết.
40
119000
2000
và các dạng tương tự -- chúng không cần thiết.
02:27
Of coursekhóa học, mappinglập bản đồ is one of those really obvioushiển nhiên applicationscác ứng dụng
41
122000
2000
Tất nhiên, bản đồ là một trong những ứng dụng thiết yếu
02:29
for a technologyCông nghệ like this.
42
124000
2000
cho công nghệ dạng này.
02:31
And this one I really won'tsẽ không spendtiêu any time on,
43
126000
2000
Và tôi sẽ không dành thời gian nói nhiều về nói
02:33
exceptngoại trừ to say that we have things to contributeGóp phần to this fieldcánh đồng as well.
44
128000
2000
ngoài việc nói rằng chúng tôi cũng đóng góp vào lĩnh vực này.
02:37
But those are all the roadsđường in the U.S.
45
132000
2000
Nhưng đó là những con đường ở nước Mỹ
02:39
superimposedchồng on tophàng đầu of a NASANASA geospatialkhông gian địa lý imagehình ảnh.
46
134000
4000
được xếp chồng trên bản đồ của NASA.
02:44
So let's pullkéo up, now, something elsekhác.
47
139000
2000
Nên hãy kéo lên, bây giờ, xem một thứ khác.
02:46
This is actuallythực ra livetrực tiếp on the WebWeb now; you can go checkkiểm tra it out.
48
141000
3000
Nó đã có ở trên trang web và bạn có thể tìm hiểu thêm.
02:49
This is a projectdự án calledgọi là PhotosynthPhotosynth,
49
144000
1000
Đây là một dự án tên gọi Photosynth,
02:51
which really marrieskết hôn two differentkhác nhau technologiescông nghệ.
50
146000
1000
kết hợp hai công nghệ khác nhau.
02:52
One of them is SeadragonSeadragon
51
147000
1000
Một trong số đó là Seadragon
02:54
and the other is some very beautifulđẹp computermáy vi tính visiontầm nhìn researchnghiên cứu
52
149000
2000
và công nghệ còn lại là một nghiên cứu tầm nhìn điện tử
02:57
donelàm xong by NoahNoah SnavelySnavely, a graduatetốt nghiệp studentsinh viên at the UniversityTrường đại học of WashingtonWashington,
53
152000
2000
bởi Noah Snavely, sinh viên cao học của trường đại học Washington,
03:00
co-advisedđồng tư vấn by SteveSteve SeitzSeitz at U.W.
54
155000
2000
đồng chỉ đạo bởi Steve Seitz ở UW
03:02
and RickRick SzeliskiSzeliski at MicrosoftMicrosoft ResearchNghiên cứu. A very nicetốt đẹp collaborationhợp tác.
55
157000
4000
và Rick Szeliski ở Trung tâm nghiên cứu Microsoft. Một sự hợp tác rất tuyệt vời.
03:07
And so this is livetrực tiếp on the WebWeb. It's poweredđược cung cấp by SeadragonSeadragon.
56
162000
2000
Dự án này đã có trên mạng. Được cấp nguồn bởi Seadragon.
03:09
You can see that when we kindloại of do these sortsloại of viewslượt xem,
57
164000
2000
Bạn có thể thấy khi chúng tôi tiến hành thử những góc nhìn này,
03:12
where we can divelặn throughxuyên qua imageshình ảnh
58
167000
1000
khi chúng tôi lướt qua các hình ảnh
03:14
and have this kindloại of multi-resolutionđộ phân giải đa experiencekinh nghiệm.
59
169000
1000
và có sự trải nghiệm về sự phân giải nhiều lớp.
03:16
But the spatialkhông gian arrangementsắp xếp of the imageshình ảnh here is actuallythực ra meaningfulcó ý nghĩa.
60
171000
4000
Nhưng sự sắp đặp không gian của các hình ảnh ở đây rất có ý nghĩa.
03:20
The computermáy vi tính visiontầm nhìn algorithmsthuật toán have registeredđăng ký these imageshình ảnh togethercùng với nhau
61
175000
3000
Các thuật toán máy tính đã xắp xếp những hình ảnh này cùng nhau.
03:23
so that they correspondtương ứng to the realthực spacekhông gian in which these shotsbức ảnh --
62
178000
4000
và chúng tương ứng với không gian thật, trong đó những bức hình này --
03:27
all takenLấy nearở gần GrassiGrassi LakesHồ nước in the CanadianNgười Canada RockiesRockies --
63
182000
2000
tất cả được chụp gần Grassi Lakes ở Canadian Rockies --
03:31
all these shotsbức ảnh were takenLấy. So you see elementscác yếu tố here
64
186000
2000
Giờ các bạn có thể thấy ở đây những yếu tố
03:33
of stabilizedổn định slide-showtrình chiếu slide or panoramictoàn cảnh imaginghình ảnh,
65
188000
4000
của slide-show được ổn định hoặc toàn bộ hình ảnh,
03:40
and these things have all been relatedliên quan spatiallytrong không gian.
66
195000
2000
và những thứ này được liên hệ không gian với nhau.
03:42
I'm not sure if I have time to showchỉ you any other environmentsmôi trường.
67
197000
3000
Tôi không chắc mình có đủ thời gian để trình bày về các môi trường khác.
03:45
There are some that are much more spatialkhông gian.
68
200000
1000
Có một vài môi trường với nhiều không gian hơn rất nhiều.
03:47
I would like to jumpnhảy straightthẳng to one of Noah'sNoah's originalnguyên data-setsbộ dữ liệu --
69
202000
3000
Tôi muốn đề cập thẳng đến một trong những bộ dữ liệu nguyên bản của Noah --
03:50
and this is from an earlysớm prototypenguyên mẫu of PhotosynthPhotosynth
70
205000
2000
có nguồn gốc từ một mẫu nguyên thủy của Photosynth
03:52
that we first got workingđang làm việc in the summermùa hè --
71
207000
2000
mà chúng tôi bắt đầu nghiên cứu lần đầu vào mùa hè --
03:54
to showchỉ you what I think
72
209000
1000
để trình bày cho các bạn những gì tôi nghĩ
03:55
is really the punchcú đấm linehàng behindphía sau this technologyCông nghệ,
73
210000
3000
là điểm nút đằng sau công nghệ này,
03:59
the PhotosynthPhotosynth technologyCông nghệ. And it's not necessarilynhất thiết so apparentrõ ràng
74
214000
2000
công nghệ Photosynth. Và nó thực sự không rõ rệt
04:01
from looking at the environmentsmôi trường that we'vechúng tôi đã put up on the websitetrang mạng.
75
216000
3000
nếu chỉ nhìn vào những môi trường được tạo dựng trên trang web.
04:04
We had to worrylo about the lawyersluật sư and so on.
76
219000
2000
Chúng tôi đã phải lo lắng về luật sư và những điều khác.
04:07
This is a reconstructionxây dựng lại of NotreNhà thờ Đức DameDame CathedralNhà thờ
77
222000
1000
Đây là bản tái thiết nhà thờ Notre Dame
04:09
that was donelàm xong entirelyhoàn toàn computationallycomputationally
78
224000
2000
đã được làm hoàn toàn bằng máy tính
04:11
from imageshình ảnh scrapedcạo from FlickrFlickr. You just typekiểu NotreNhà thờ Đức DameDame into FlickrFlickr,
79
226000
3000
từ những hình ảnh lấy từ Flickr. Bạn chỉ cần đánh "Notre Dame" vào Flickr,
04:14
and you get some picturesnhững bức ảnh of guys in t-shirtsáo thun, and of the campuskhuôn viên
80
229000
3000
và bạn có thể thấy hình ảnh những cậu sinh viên mặc áo phông, hoặc ảnh của trường
04:17
and so on. And eachmỗi of these orangetrái cam conesnón representsđại diện an imagehình ảnh
81
232000
4000
và nhiều nữa. Và mỗi hình nón màu cam này báo hiệu một hình ảnh
04:22
that was discoveredphát hiện ra to belongthuộc về to this modelmô hình.
82
237000
2000
được coi là thuộc mẫu hình này.
04:26
And so these are all FlickrFlickr imageshình ảnh,
83
241000
2000
Và đây là tất cả những hình ảnh lấy từ Flickr,
04:28
and they'vehọ đã all been relatedliên quan spatiallytrong không gian in this way.
84
243000
3000
và chúng được liên kết không gian theo cách này.
04:31
And we can just navigateđiều hướng in this very simpleđơn giản way.
85
246000
2000
Chúng ta chỉ cần tìm hiểu chúng một cách rất đơn giản.
04:35
(ApplauseVỗ tay)
86
250000
9000
(Vỗ tay).
04:44
You know, I never thought that I'd endkết thúc up workingđang làm việc at MicrosoftMicrosoft.
87
259000
2000
Bạn biết đấy, tôi chưa từng nghĩ rằng cuối cùng mình lại làm việc ở Microsoft.
04:46
It's very gratifyinglàm hài lòng to have this kindloại of receptiontiếp nhận here.
88
261000
4000
Và thật phấn khởi khi được đón nhận như thế này.
04:50
(LaughterTiếng cười)
89
265000
3000
(Cười).
04:53
I guessphỏng đoán you can see
90
268000
3000
Tôi nghĩ các bạn có thể thấy
04:56
this is lots of differentkhác nhau typesloại of camerasmáy ảnh:
91
271000
2000
ở đây có rất nhiều các loại máy ảnh:
04:58
it's everything from celltế bào phoneđiện thoại camerasmáy ảnh to professionalchuyên nghiệp SLRsMáy ảnh SLR,
92
273000
3000
nó có tất cả từ máy ảnh điện thoại đến máy SLR chuyên nghiệp,
05:02
quitekhá a largelớn numbercon số of them, stitchedkhâu
93
277000
1000
một số lớn trong chúng được cài vào
05:03
togethercùng với nhau in this environmentmôi trường.
94
278000
1000
trong môi trường này.
05:04
And if I can, I'll find some of the sortsắp xếp of weirdkỳ dị onesnhững người.
95
279000
2000
Và nếu có thể, tôi sẽ tìm những loại kì cục nhất.
05:08
So manynhiều of them are occludedkhối by faceskhuôn mặt, and so on.
96
283000
3000
Có rất nhiều loại được bít kín bởi các mặt, và nhiều hơn nữa.
05:13
SomewhereMột nơi nào đó in here there are actuallythực ra
97
288000
1000
Vài nơi trong này thực ra đã có một series
05:15
a seriesloạt of photographshình ảnh -- here we go.
98
290000
1000
các bức ảnh -- chúng ta bắt đầu.
05:17
This is actuallythực ra a posteráp phích of NotreNhà thờ Đức DameDame that registeredđăng ký correctlyđúng.
99
292000
3000
Đây là một bức ảnh của Notre Dame được đăng kí đúng.
05:21
We can divelặn in from the posteráp phích
100
296000
2000
Chúng ta có thể khám phá bức ảnh này
05:24
to a physicalvật lý viewlượt xem of this environmentmôi trường.
101
299000
3000
để có cái nhìn của môi trường này.
05:31
What the pointđiểm here really is is that we can do things
102
306000
3000
Ý chính ở đây là chúng ta có thể làm những điều tương tự
05:34
with the socialxã hội environmentmôi trường. This is now takinglấy datadữ liệu from everybodymọi người --
103
309000
5000
với môi trường xã hội. Giờ nó đang lấy dữ liệu từ tất cả mọi người --
05:39
from the entiretoàn bộ collectivetập thể memoryký ức
104
314000
1000
từ một bộ nhớ
05:40
of, visuallytrực quan, of what the EarthTrái đất looksnhìn like --
105
315000
2000
về hình ảnh trái đất
05:43
and linkliên kết all of that togethercùng với nhau.
106
318000
1000
và nối chúng lại với nhau.
05:44
All of those photosảnh becometrở nên linkedliên kết togethercùng với nhau,
107
319000
2000
Tất cả những bức ảnh đó được nối lại với nhau
05:46
and they make something emergentcấp cứu
108
321000
1000
và nó tạo nên những thứ
05:47
that's greaterlớn hơn than the sumtổng hợp of the partscác bộ phận.
109
322000
2000
còn tuyệt vời hơn tất cả các phần góp lại.
05:49
You have a modelmô hình that emergesxuất hiện of the entiretoàn bộ EarthTrái đất.
110
324000
2000
Giờ ta có một mẫu mô phỏng toàn bộ Trái đất.
05:51
Think of this as the long tailđuôi to StephenStephen Lawler'sCủa Lawler VirtualẢo EarthTrái đất work.
111
326000
5000
Hãy coi nó như bản thêm của chương trình Trái đất Ảo của Stepehn Lawler.
05:56
And this is something that growsmọc in complexityphức tạp
112
331000
2000
Và đây là thứ mà càng trở nên phức tạp
05:58
as people use it, and whose benefitslợi ích becometrở nên greaterlớn hơn
113
333000
3000
khi người ta sử dụng, và lợi ích từ nó càng trở nên lớn hơn
06:01
to the usersngười sử dụng as they use it.
114
336000
2000
cho người dùng.
06:03
TheirCủa họ ownsở hữu photosảnh are gettingnhận được taggedđược dán with meta-datasiêu dữ liệu
115
338000
2000
Những bức ảnh của người dùng sẽ được đính với dữ liệu dang meta
06:05
that somebodycó ai elsekhác enteredđã nhập.
116
340000
1000
khi một người khác nhập vào.
06:07
If somebodycó ai botheredlàm phiền to tagtừ khóa all of these saintsCác Thánh
117
342000
3000
Nếu có ai đó có thể tag tất cả những vị thánh này
06:10
and say who they all are, then my photohình chụp of NotreNhà thờ Đức DameDame CathedralNhà thờ
118
345000
3000
và điền thông tin về họ, thì bức ảnh về nhà thờ Notre Dame của tôi
06:13
suddenlyđột ngột getsđược enrichedlàm giàu with all of that datadữ liệu,
119
348000
2000
sẽ cập nhật những thông tin này luôn,
06:15
and I can use it as an entrynhập cảnh pointđiểm to divelặn into that spacekhông gian,
120
350000
3000
và tôi có thể dùng nó như điểm vào để lướt vào không gian đó,
06:18
into that meta-verseMeta-thơ, usingsử dụng everybodymọi người else'scủa người khác photosảnh,
121
353000
2000
dữ liệu đó, sử dụng hình ảnh của những người khác,
06:21
and do a kindloại of a cross-modalCross-phương thức
122
356000
2000
và thực hiện thao tác xuyên mô hình
06:25
and cross-userCross-người dùng socialxã hội experiencekinh nghiệm that way.
123
360000
3000
và xuyên mạng lưới người xử dụng.
06:28
And of coursekhóa học, a by-productsản phẩm of all of that
124
363000
1000
Và tất nhiên, sản phẩm đi kèm sau đó
06:30
is immenselyvô cùng richgiàu có virtualảo modelsmô hình
125
365000
2000
là những mô hình giàu tính hình ảnh
06:32
of everymỗi interestinghấp dẫn partphần of the EarthTrái đất, collectedthu thập
126
367000
2000
về những khu vực thú vị của thế giới, được thu thập
06:35
not just from overheadchi phí flightschuyến bay and from satellitevệ tinh imageshình ảnh
127
370000
3000
không chỉ từ những ảnh chụp từ trên máy bay hay vệ tinh
06:38
and so on, but from the collectivetập thể memoryký ức.
128
373000
2000
mà còn từ bộ nhớ có tính năng thu thập dữ liệu.
06:40
Thank you so much.
129
375000
2000
Cảm ơn các bạn rất nhiều.
06:42
(ApplauseVỗ tay)
130
377000
11000
(Vỗ tay)
06:53
ChrisChris AndersonAnderson: Do I understandhiểu không this right? That what your softwarephần mềm is going to allowcho phép,
131
388000
4000
Chris Anderson: Không biết tôi hiểu có đúng không? Rằng điều mà phần mềm của ngài đang cho phép,
06:58
is that at some pointđiểm, really withinbên trong the nextkế tiếp fewvài yearsnăm,
132
393000
2000
đó là tại một thời điểm nào đó, trong vòng vài năm tới,
07:01
all the picturesnhững bức ảnh that are sharedchia sẻ by anyonebất kỳ ai acrossbăng qua the worldthế giới
133
396000
4000
tất cả những bức ảnh được chia sẻ bởi bất cứ ai trên thế giới
07:05
are going to basicallyvề cơ bản linkliên kết togethercùng với nhau?
134
400000
2000
chúng sẽ được kết nối với nhau?
07:07
BAABAA: Yes. What this is really doing is discoveringkhám phá.
135
402000
2000
BAA: Đúng vậy. Những gì phầm mềm này là để khám phá.
07:09
It's creatingtạo hyperlinkssiêu liên kết, if you will, betweengiữa imageshình ảnh.
136
404000
3000
Nó tạo nên những siêu kết nối giữa những hình ảnh.
07:12
And it's doing that
137
407000
1000
Và nó làm điều đó
07:13
baseddựa trên on the contentNội dung insidephía trong the imageshình ảnh.
138
408000
1000
dựa trên nội dung bên trong bức ảnh.
07:14
And that getsđược really excitingthú vị when you think about the richnesssự giàu có
139
409000
3000
và điều đó làm bạn thực sự phấn khích khi nghĩ đến những
07:17
of the semanticngữ nghĩa informationthông tin that a lot of those imageshình ảnh have.
140
412000
2000
thông tin phong phú mà những hình ảnh này có.
07:19
Like when you do a webweb searchTìm kiếm for imageshình ảnh,
141
414000
2000
Chẳng hạn khi bạn thực hiện lệnh tìm kiếm hình ảnh trên mạng,
07:22
you typekiểu in phrasescụm từ, and the textbản văn on the webweb pagetrang
142
417000
2000
bạn gõ vào những cụm từ, và những từ khóa trên trang web
07:24
is carryingchở a lot of informationthông tin about what that picturehình ảnh is of.
143
419000
3000
chứa rất nhiều thông tin về bức ảnh đó.
07:27
Now, what if that picturehình ảnh linksliên kết to all of your picturesnhững bức ảnh?
144
422000
2000
Giờ, nếu bức ảnh đó được kết nối với tất cả những bức ảnh của bạn thì sao?
07:29
Then the amountsố lượng of semanticngữ nghĩa interconnectionkết nối
145
424000
2000
Thì khối lượng của liên kết ngữ nghĩa
07:31
and the amountsố lượng of richnesssự giàu có that comesđến out of that
146
426000
1000
và khối lượng thông tin phong phú kèm với nó
07:32
is really hugekhổng lồ. It's a classiccổ điển networkmạng effecthiệu ứng.
147
427000
3000
là rất lớn. Đây chính là hiệu ứng mạng lưới điển hình.
07:35
CACA: BlaiseBlaise, that is trulythực sự incredibleđáng kinh ngạc. CongratulationsChúc mừng.
148
430000
2000
CA: Blaise, điều này thực sự kì diệu. Xin chúc mừng.
07:37
BAABAA: ThanksCảm ơn so much.
149
432000
1000
BAA: Cảm ơn rất nhiều.

▲Back to top

ABOUT THE SPEAKER
Blaise Agüera y Arcas - Software architect
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces.

Why you should listen

Blaise Agüera y Arcas is principal scientist at Google, where he leads a team working on machine intelligence for mobile devices. His group works extensively with deep neural nets for machine perception and distributed learning, and it also investigates so-called "connectomics" research, assessing maps of connections within the brain.

Agüera y Arcas' background is as multidimensional as the visions he helps create. In the 1990s, he authored patents on both video compression and 3D visualization techniques, and in 2001, he made an influential computational discovery that cast doubt on Gutenberg's role as the father of movable type.

He also created Seadragon (acquired by Microsoft in 2006), the visualization technology that gives Photosynth its amazingly smooth digital rendering and zoom capabilities. Photosynth itself is a vastly powerful piece of software capable of taking a wide variety of images, analyzing them for similarities, and grafting them together into an interactive three-dimensional space. This seamless patchwork of images can be viewed via multiple angles and magnifications, allowing us to look around corners or “fly” in for a (much) closer look. Simply put, it could utterly transform the way we experience digital images.

He joined Microsoft when Seadragon was acquired by Live Labs in 2006. Shortly after the acquisition of Seadragon, Agüera y Arcas directed his team in a collaboration with Microsoft Research and the University of Washington, leading to the first public previews of Photosynth several months later. His TED Talk on Seadragon and Photosynth in 2007 is rated one of TED's "most jaw-dropping." He returned to TED in 2010 to demo Bing’s augmented reality maps.

Fun fact: According to the author, Agüera y Arcas is the inspiration for the character Elgin in the 2012 best-selling novel Where'd You Go, Bernadette?

More profile about the speaker
Blaise Agüera y Arcas | Speaker | TED.com