Blaise Agüera y Arcas: How computers are learning to be creative
Blaise Agüera y Arcas: Máy tính đang học cách sáng tạo như thế nào
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces. Full bio
Double-click the English transcript below to play the video.
that works on machine intelligence;
Trí tuệ nhân tạo tại Google;
of making computers and devices
công nghệ để máy tính và thiết bị
that brains do.
não người làm được.
interested in real brains
thấy hứng thú với não người thật
in the things that our brains do
mà não của chúng ta có thể
to the performance of computers.
has been perception,
chính là khả năng tri nhận,
out there in the world --
ở thế giới bên ngoài
for example, that our team makes,
cho máy mà nhóm tôi viết ra,
on Google Photos to become searchable,
được hình ảnh trên Google Photo,
out there into the world.
sản phẩm của thế giới.
nhân tạo mà nhóm tôi nghiên cứu
our work on machine perception
with the world of machine creativity
khả năng sáng tạo nhân tạo
had a penetrating insight
có một hiểu biết sâu sắc
between perception and creativity.
tri nhận và sáng tạo.
has a statue inside of it,
là bức tượng,
is to discover it."
khám phá ra nó."
Michelangelo was getting at
muốn nói đến chính là
is an act of imagination
là hành động tưởng tượng
and perceiving and imagining,
tri nhận và sáng tạo diễn ra,
with a brief bit of history
the heart or the intestines,
hay nội tạng,
about a brain by just looking at it,
chỉ bằng việc quan sát bộ não,
đầu tiên quan sát bộ não
of this thing all kinds of fanciful names,
của nó mọi cái tên thú vị,
nghĩa là "con tôm nhỏ".
doesn't tell us very much
cũng không nói được gì nhiều
diễn ra bên trong.
developed some kind of insight
phát triển hiểu biết thật sự
Santiago Ramón y Cajal,
Tây Ban Nha, Santiago Ramón y Cajal,
chất nhuộm màu đặc biệt
or render in very high contrast
từng tế bào trong não
their morphologies.
hình thái của chúng.
that he made of neurons
diễn tả các nơ-ron thần kinh
of different sorts of cells,
tế bào khác nhau,
was quite new at this point.
còn khá lạ lẫm với chúng.
very, very long distances --
những sợi dây điện.
to some people in the 19th century;
sẽ thấy chúng y như vậy;
were just getting underway.
khi ấy đang diễn ra.
of Ramón y Cajal's, like this one,
của Ramón y Cajal's, như ảnh này,
that Ramón y Cajal started.
mà Ramón y Cajal đã bắt đầu.
từ các cộng tác viên
of Neuroscience.
khoa học thần kinh Max Planck.
is about one cubic millimeter in size,
thật chỉ 1 mm khối,
very small piece of it here.
một mẩu rất rất nhỏ của nó.
1 micrômét (µm).
tiny block of tissue.
of hair is about 100 microns.
khoảng 100 µm.
nhỏ hơn rất rất nhiều
much, much smaller
electron microscopy slices,
kích thước hiển vi của hạt electron,
in 3D of neurons that look like these.
dựng lại cấu trúc nơron như thế này.
style as Ramón y Cajal.
giống với bản của Ramón y Cajal.
be able to see anything here.
thấy được gì hết.
one neuron to another.
tạo ra mạng lưới chằng chịt.
ahead of his time,
so với thời của mình,
over the next few decades.
những thập kỷ tiếp theo.
sử dụng điện để hoạt động,
was advanced enough
mới đủ tiên tiến
experiments on live neurons
thật sự trên nơron thật
when computers were being invented,
được phát minh,
of modeling the brain --
mô phỏng lại bộ não
as Alan Turing called it,
như cách mà Alan Turing gọi,
cho khoa học máy tính.
looked at Ramón y Cajal's drawing
quan sát bản vẽ của Ramón y Cajal
imagery that comes from the eye.
hình ảnh được mắt ghi nhận.
like a circuit diagram.
một sơ đồ mạch điện.
in McCulloch and Pitts's circuit diagram
bản vẽ của hai người
of computational elements
one to the next in a cascade,
qua mạch khác theo tầng,
visual information would need to do.
xử lý thông tin hình ảnh diễn ra.
quá trình tri nhận
for us to do with our brains.
ta thực hiện.
that for a computer,
máy tính hiểu được hình ảnh,
just a few years ago.
là chuyện bất khả thi.
this task is easy to do.
các điểm ảnh,
and the word "bird,"
và từ "con chim",
connected to each other
với các nơron nối với nhau
sinh học, nằm trong hai vỏ não thị giác,
inside our visual cortices,
to have the capability
on the computer.
như vậy trên máy tính.
that actually looks like.
nó trông thế nào.
about as a first layer of neurons,
là lớp nơron thứ nhất,
how it works in the eye --
mắt hoạt động
after another layer of neurons,
lớp nơron sau, từng lớp một,
of different weights.
có khối lượng khác nhau.
of all of those synapses.
của những sợi xi-náp.
properties of this network.
điện tử của mạng lưới này.
or a small group of neurons
gồm các sợi nơron
those three things --
in the neural network,
trong mạng lưới nơron,
these synapses in the neural network.
của toàn bộ xi-náp trong mạng nơron.
is just a simple formula,
đơn giản này:
going on there, of course,
đang thực sự diễn ra,
of mathematical operations.
các bài toán được giải.
that if you have one equation,
có 1 đẳng thức,
by knowing the other two things.
2 biến còn lại.
that the picture of a bird is a bird,
and w and x are known.
và W, X là 2 biến đã biết.
you know the pixels.
bạn biết số điểm ảnh.
a relatively straightforward problem.
khá dễ giải quyết.
and you're done.
là xong.
neuron nhân tạo
doing exactly that.
dựng lại hệt như vậy.
on a mobile phone,
một chiếc điện thoại di động,
amazing in its own right,
vốn có của chiếc điện thoại
billions and trillions of operations
hàng ngàn tỉ thao tác
một chiếc điện thoại
picture of a bird,
có hình chim,
"Yes, it's a bird,"
"Đúng rồi, đây là chim,"
with a network of this sort.
mạng lưới tương tự như bộ não.
and the y is the unknown.
và Y là ẩn.
difficult part, of course,
rất hóc búa, dĩ nhiên rồi,
do we figure out the w,
mà ta tìm được biến W.
làm được chuyện này sao?
những mô hình thế này bao giờ mà?
of solving for w,
cách giải ra W,
with the simple equation
với cách giải của đơn thức
it's the inverse to multiplication,
nó nghịch đảo với phép nhân,
là một phép nhân.
very non-linear operation;
vô cùng lắt léo;
to solve the equation
để giải biểu thức này
is fairly straightforward.
a little algebra trick,
môn đại số,
to the right-hand side of the equation.
đang dùng phép nhân.
about it as an error.
for w the right way,
to minimize the error,
lỗi có giá trị nhỏ nhất,
computers are very good at.
rất thành thạo.
chơi trò bịt mắt bắt dê,
sort of play Marco Polo,
gần chạm tới 0.
successive approximations to w.
chính xác, nhưng sau mười mấy lần,
but after about a dozen steps,
which is close enough.
là giá trị gần đúng nhất.
từ nãy đến giờ
a lot of known x's and known y's
giá trị đã biết của X và Y
through an iterative process.
thông qua quá trình lặp đi lặp lại.
that we do our own learning.
học tập của chúng ta.
xem rất nhiều hình ảnh và nói
this is not a bird."
for those neural connections.
giải được các kết nối nơron.
x and w fixed to solve for y;
cố định để tìm Y;
phương pháp luyện tập.
Alex Mordvintsev, on our team,
Alex Mordvinstev của nhóm tôi,
with what happens if we try solving for x,
chuyện gì xảy ra nếu ta cố tìm X,
that you've trained on birds,
của mình được dạy, đó là chim
the same error-minimization procedure,
như quá trình giảm thiểu lỗi,
trained to recognize birds,
generated entirely by a neural network
được tạo ra hoàn toàn từ 1 hệ thần kinh
rather than solving for y,
by Mike Tyka in our group,
Mike Tyka của nhóm tôi,
of William Kentridge's artworks,
của William Kentridge,
over the space of different animals,
thành nhiều loài thú khác nhau,
để nhận biết và phân biệt
to recognize and distinguish
morph from one animal to another.
biến hình động vật của hoạ sĩ Escher.
have tried reducing
out of the space of all things
mọi thứ khác nhau
over that entire surface,
you make a kind of map --
bạn có thể tạo ra
the network knows how to recognize.
mà mạng lưới nhận biết được.
"armadillo" is right in that spot.
"armadillo" ngay vị trí trung tâm.
of networks as well.
lưới khác nữa.
to recognize faces,
để nhận diện các khuôn mặt,
in a y that says, "me,"
có giá trị là "tôi",
psychedelic picture of me
vẽ tôi đang phê thuốc
multiple points of view at once
cùng một lúc là vì
to get rid of the ambiguity
để tránh sự mơ hồ khi nhận diện
so với khi nhìn ở góc khác,
or another pose,
another kind of lighting.
khác nhau.
this sort of reconstruction,
of different points of view,
là một bức hình rối mắt ở mọi góc nhìn,
his own face as a guide image
mặt mình làm hình ảnh mẫu
to reconstruct my own face.
để tái hiện gương mặt tôi.
that optimization process.
quá trình tái cấu trúc.
bức tranh một gương mặt liền mạch
more like a coherent face,
with a blank canvas
vẽ với tờ giấy trắng
that is itself already some other image.
bản thân nó đã là một hình.
that is designed to categorize
thiết kế để phân loại
man-made structures, animals ...
như công trình nhân tạo, động vật...
with just a picture of clouds,
những đám mây,
what it sees in the clouds.
đang xác định mấy đám mây có hình gì.
you spend looking at this,
will see in the clouds.
tạo ra từ những đám mây đó.
to hallucinate into this,
khuôn mặt để tạo ảo giác cho nền này,
có vài thí nghiệm nữa
zooms hallucinates, zooms.
phóng, rồi chỉnh, rồi lại phóng.
of the network, I suppose,
hệ thần kinh đang thấy lâng lâng,
is eating its own tail.
đang ăn cái đuôi của mình.
What do I think I see next?"
tôi sẽ nhìn thấy gì kế tiếp?"
called "Higher Education" --
"Giáo dục Cấp cao" ở Seattle xem
marijuana was legalized.
được hợp thức hoá.
is not constrained.
không có giới hạn.
because they're really fun to look at.
thị giác vì chúng nhìn vui mắt.
không chỉ thuần về thị giác.
Ross Goodwin,
a camera that takes a picture,
một camera chụp hình,
writes a poem using neural networks,
cậu ấy viết 1 bài thơ bằng mạng nơron,
hình ảnh ghi nhận.
has been trained
đã được học
về thơ ca thế kỷ 20.
are very intimately connected.
có liên quan mật thiết với nhau.
mà ta vừa thấy
để tiếp nhận, phân biệt,
khác nhau của thế giới,
things in the world,
Michelangelo really did see
thật sự nhìn ra
any being, any alien
thực thể nào, trong hay ngoài hành tinh
perceptual acts of that sort
machinery that's used in both cases.
hai quá trình ấy.
and creativity are by no means
và sáng tạo không thể nào
that can do exactly these sorts of things.
mẫu máy tính làm được những thứ này.
the brain is computational.
bộ não chính là bộ máy.
in designing intelligent machinery.
thiết kế trí tuệ nhân tạo.
có thể làm ra trì tuệ nhân tạo.
đã có thể hoàn thành
of those early pioneers,
is not just about accounting
tập trung cho việc tính toán,
hoặc những trò khác.
we modeled them after our minds.
theo hình mẫu là não người.
to understand our own minds better
về bộ não mình rõ hơn
ABOUT THE SPEAKER
Blaise Agüera y Arcas - Software architectBlaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces.
Why you should listen
Blaise Agüera y Arcas is principal scientist at Google, where he leads a team working on machine intelligence for mobile devices. His group works extensively with deep neural nets for machine perception and distributed learning, and it also investigates so-called "connectomics" research, assessing maps of connections within the brain.
Agüera y Arcas' background is as multidimensional as the visions he helps create. In the 1990s, he authored patents on both video compression and 3D visualization techniques, and in 2001, he made an influential computational discovery that cast doubt on Gutenberg's role as the father of movable type.
He also created Seadragon (acquired by Microsoft in 2006), the visualization technology that gives Photosynth its amazingly smooth digital rendering and zoom capabilities. Photosynth itself is a vastly powerful piece of software capable of taking a wide variety of images, analyzing them for similarities, and grafting them together into an interactive three-dimensional space. This seamless patchwork of images can be viewed via multiple angles and magnifications, allowing us to look around corners or “fly” in for a (much) closer look. Simply put, it could utterly transform the way we experience digital images.
He joined Microsoft when Seadragon was acquired by Live Labs in 2006. Shortly after the acquisition of Seadragon, Agüera y Arcas directed his team in a collaboration with Microsoft Research and the University of Washington, leading to the first public previews of Photosynth several months later. His TED Talk on Seadragon and Photosynth in 2007 is rated one of TED's "most jaw-dropping." He returned to TED in 2010 to demo Bing’s augmented reality maps.
Fun fact: According to the author, Agüera y Arcas is the inspiration for the character Elgin in the 2012 best-selling novel Where'd You Go, Bernadette?
Blaise Agüera y Arcas | Speaker | TED.com