Blaise Agüera y Arcas: How computers are learning to be creative
Blaise Agüera y Arcas: Como computadores estão aprendendo a ser criativos
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces. Full bio
Double-click the English transcript below to play the video.
that works on machine intelligence;
que lida com I.A.;
de fazer computadores e aparelhos
of making computers and devices
that brains do.
por cérebros reais
interested in real brains
in the things that our brains do
por coisas que nosso cérebro faz
à performance dos computadores.
to the performance of computers.
has been perception,
tem sido percepção,
out there in the world --
for example, that our team makes,
criados por nós, por exemplo,
do Google Fotos sejam pesquisáveis,
on Google Photos to become searchable,
em algo lá fora, para o mundo.
out there into the world.
nosso trabalho de percepção artificial
our work on machine perception
ao mundo da criatividade artificial
with the world of machine creativity
had a penetrating insight
teve um insight profundo
entre percepção e criatividade.
between perception and creativity.
has a statue inside of it,
tem uma escultura interna,
is to discover it."
Michelangelo was getting at
estava querendo dizer
é um ato de imaginação
is an act of imagination
and perceiving and imagining,
percepção e imaginação,
with a brief bit of history
com um pouquinho de história
the heart or the intestines,
e dos intestinos,
sobre o cérebro só olhando pra ele,
about a brain by just looking at it,
que observaram cérebros
todo tipo de nomes fantásticos,
of this thing all kinds of fanciful names,
significando "camarãozinho".
não nos diz muito
doesn't tell us very much
developed some kind of insight
que, de fato, desenvolveu algum insight
Santiago Ramón y Cajal,
Santiago Ramón y Cajal, no século 19,
ou converter em contraste muito elevado,
or render in very high contrast
a morfologia delas.
their morphologies.
that he made of neurons
que ele fez dos neurônios no século 19.
of different sorts of cells,
de diferentes tipos de células,
era recente nessa época.
was quite new at this point.
very, very long distances --
distâncias muito longas,
para algumas pessoas no século 19;
to some people in the 19th century;
estavam apenas começando.
were just getting underway.
of Ramón y Cajal's, like this one,
do Ramón y Cajal, como este,
that Ramón y Cajal started.
que Ramón y Cajal começou.
de nossos colaboradores
of Neuroscience.
partículas de tecido cerebral.
um milímetro cúbico,
is about one cubic millimeter in size,
minúscula dela aqui.
very small piece of it here.
tem em torno de um mícron.
tiny block of tissue.
é de aproximadamente 100 microns.
of hair is about 100 microns.
bem menor do que um simples fio de cabelo.
much, much smaller
electron microscopy slices,
microscópicas de elétrons de série,
neurônios em 3D, como estes.
in 3D of neurons that look like these.
do Ramón y Cajal.
style as Ramón y Cajal.
be able to see anything here.
não conseguiríamos ver nada aqui.
de neurônios comunicando-se entre si.
one neuron to another.
ahead of his time,
à frente de seu tempo,
através das décadas seguintes.
over the next few decades.
usavam eletricidade
a tecnologia avançou o suficiente
was advanced enough
experiments on live neurons
reais em neurônios vivos
when computers were being invented,
da invenção dos computadores,
da modelagem cerebral,
of modeling the brain --
como foi chamada por Alan Turing,
as Alan Turing called it,
observaram o desenho do córtex visual,
looked at Ramón y Cajal's drawing
que estou mostrando aqui.
as imagens captadas pelo olho.
imagery that comes from the eye.
like a circuit diagram.
um diagrama de circuito.
in McCulloch and Pitts's circuit diagram
no diagrama de McCulloch and Pitts
mas esta ideia básica
of computational elements
como uma série de elementos computacionais
um para o outro, em cascata,
one to the next in a cascade,
informações visuais precisaria fazer.
visual information would need to do.
for us to do with our brains.
com nosso cérebro.
que, para um computador,
that for a computer,
just a few years ago.
há alguns anos.
não é uma tarefa simples de ser realizada.
this task is easy to do.
and the word "bird,"
e a palavra "pássaro",
conectados uns aos outros,
connected to each other
inside our visual cortices,
em nosso córtex visual,
to have the capability
a ter a capacidade
no computador.
on the computer.
that actually looks like.
realmente se parecem.
uma primeira camada de neurônios,
about as a first layer of neurons,
são os neurônios na retina.
how it works in the eye --
after another layer of neurons,
de diferentes pesos.
of different weights.
of all of those synapses.
de todas aquelas sinapses.
properties of this network.
computacionais dessa rede.
or a small group of neurons
ou um grupo de neurônios,
those three things --
e as sinapses na rede neural,
in the neural network,
através de três variáveis: x, w e y.
um milhão de pixels nesta imagem.
estas sinapses na rede neural.
these synapses in the neural network.
de saídas que essa rede tem.
is just a simple formula,
seja apenas uma fórmula simples:
going on there, of course,
o que está acontecendo lá
of mathematical operations.
de operações matemáticas.
que se você tem uma equação,
that if you have one equation,
se souber os outros dois termos.
by knowing the other two things.
de um pássaro é um pássaro,
that the picture of a bird is a bird,
mas w e x são conhecidos.
and w and x are known.
você conhece os pixels.
you know the pixels.
relativamente simples.
a relatively straightforward problem.
and you're done.
doing exactly that.
fazendo exatamente isso.
on a mobile phone,
em tempo real em um celular,
amazing in its own right,
e trilhões de operações por segundo.
billions and trillions of operations
picture of a bird,
"Sim, é um pássaro",
"Yes, it's a bird,"
com uma rede deste tipo.
with a network of this sort.
and the y is the unknown.
e o y é desconhecido.
difficult part, of course,
do we figure out the w,
of solving for w,
de descobrir o w,
with the simple equation
nestas variáveis como números,
como resolvê-la: 6 = 2 x w,
é o inverso da multiplicação,
it's the inverse to multiplication,
de ser uma mentira aqui.
very non-linear operation;
muito complicada;
uma forma de resolver a equação
to solve the equation
é razoavelmente fácil.
is fairly straightforward.
a little algebra trick,
to the right-hand side of the equation.
about it as an error.
nele como um erro.
se acharmos o w da forma certa
for w the right way,
o erro será maior do que zero.
para diminuir os erros,
to minimize the error,
computadores fazem muito bem.
computers are very good at.
Bem, o erro será 6.
sort of play Marco Polo,
e diminuir o erro para próximo de zero.
sucessivas aproximações de w.
successive approximations to w.
mas depois de várias etapas,
but after about a dozen steps,
which is close enough.
o que é bem próximo.
a lot of known x's and known y's
através de um processo interativo.
through an iterative process.
nossa própria aprendizagem.
that we do our own learning.
this is not a bird."
isso não é um pássaro".
através da interação,
for those neural connections.
encontramos essas conexões neurais.
x and w fixed to solve for y;
para resolver y;
o que é muito mais difícil,
usando vários exemplos de treinamento.
Alex Mordvintsev, on our team,
Alex Mordvintsev, da nossa equipe,
se tentássemos encontrar x,
with what happens if we try solving for x,
that you've trained on birds,
que treinou com pássaros,
the same error-minimization procedure,
procedimento de minimização de erros,
para reconhecer pássaros
trained to recognize birds,
generated entirely by a neural network
totalmente gerada por uma rede neural,
para reconhecer pássaros,
rather than solving for y,
fazendo isso de forma interativa.
by Mike Tyka in our group,
de Mike Tyka, em nosso grupo,
de William Kentridge,
of William Kentridge's artworks,
sucessivamente, e cria um filme assim.
no espaço de diferentes animais,
over the space of different animals,
e distinguir diferentes animais.
to recognize and distinguish
de um animal para outro, estilo Escher.
morph from one animal to another.
have tried reducing
do espaço de todas as coisas
out of the space of all things
sobre essa superfície inteira,
over that entire surface,
você cria um mapa visual
you make a kind of map --
the network knows how to recognize.
que a rede consegue reconhecer.
o tatu está bem naquele canto.
"armadillo" is right in that spot.
of networks as well.
com outras redes.
para reconhecer faces,
to recognize faces,
parâmetros da minha própria face.
in a y that says, "me,"
ela gera essa imagem doida,
psychedelic picture of me
uma figura psicodélica de mim
de vista de uma só vez
multiple points of view at once
to get rid of the ambiguity
para conseguir se livrar da ambiguidade
or another pose,
another kind of lighting.
esse tipo de reconstrução,
this sort of reconstruction,
guia de imagem ou de estatística,
devido a diferentes pontos de vista,
of different points of view,
his own face as a guide image
sua própria face como guia de imagem
para reconstruir minha face.
to reconstruct my own face.
aquele processo de otimização.
that optimization process.
como uma face coerente,
more like a coherent face,
minha própria face como guia.
with a blank canvas
tela em branco ou com ruído branco.
that is itself already some other image.
que, por si só, já é outra imagem.
esta pequena demonstração.
that is designed to categorize
man-made structures, animals ...
criações humanas, animais...
com uma figura de nuvens,
with just a picture of clouds,
o que se vê nas nuvens.
what it sees in the clouds.
you spend looking at this,
will see in the clouds.
to hallucinate into this,
para ficar alucinado,
zooms hallucinates, zooms.
of the network, I suppose,
de estado de fuga da rede, suponho,
is eating its own tail.
"O que acho que verei agora?
O que acho que verei agora?"
What do I think I see next?"
called "Higher Education" --
que a maconha foi legalizada.
marijuana was legalized.
não está restrita.
is not constrained.
porque são divertidos de se ver.
because they're really fun to look at.
exclusivamente visual.
a camera that takes a picture,
uma câmera que tira a foto,
escreve um poema usando redes neurais,
writes a poem using neural networks,
tem sido treinada
has been trained
não é tão ruim, eu acho.
estão intimamente ligadas.
are very intimately connected.
treinadas para discriminar
things in the world,
em sentido contrário para produzir.
Michelangelo really did see
a escultura nos blocos de pedra,
qualquer ser, alienígena,
any being, any alien
atos de percepção desse tipo,
perceptual acts of that sort
machinery that's used in both cases.
usada nos dois casos.
não são exclusivamente humanas.
and creativity are by no means
that can do exactly these sorts of things.
de fazer justamente esse tipo de coisa,
pois o cérebro é computacional.
the brain is computational.
de planejar maquinaria inteligente.
in designing intelligent machinery.
ficarem inteligentes.
começando a cumprir
of those early pioneers,
e McCulloch e Pitts.
não é apenas números
is not just about accounting
segundo as nossas mentes.
we modeled them after our minds.
to understand our own minds better
de entender melhor nossa mente
ABOUT THE SPEAKER
Blaise Agüera y Arcas - Software architectBlaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces.
Why you should listen
Blaise Agüera y Arcas is principal scientist at Google, where he leads a team working on machine intelligence for mobile devices. His group works extensively with deep neural nets for machine perception and distributed learning, and it also investigates so-called "connectomics" research, assessing maps of connections within the brain.
Agüera y Arcas' background is as multidimensional as the visions he helps create. In the 1990s, he authored patents on both video compression and 3D visualization techniques, and in 2001, he made an influential computational discovery that cast doubt on Gutenberg's role as the father of movable type.
He also created Seadragon (acquired by Microsoft in 2006), the visualization technology that gives Photosynth its amazingly smooth digital rendering and zoom capabilities. Photosynth itself is a vastly powerful piece of software capable of taking a wide variety of images, analyzing them for similarities, and grafting them together into an interactive three-dimensional space. This seamless patchwork of images can be viewed via multiple angles and magnifications, allowing us to look around corners or “fly” in for a (much) closer look. Simply put, it could utterly transform the way we experience digital images.
He joined Microsoft when Seadragon was acquired by Live Labs in 2006. Shortly after the acquisition of Seadragon, Agüera y Arcas directed his team in a collaboration with Microsoft Research and the University of Washington, leading to the first public previews of Photosynth several months later. His TED Talk on Seadragon and Photosynth in 2007 is rated one of TED's "most jaw-dropping." He returned to TED in 2010 to demo Bing’s augmented reality maps.
Fun fact: According to the author, Agüera y Arcas is the inspiration for the character Elgin in the 2012 best-selling novel Where'd You Go, Bernadette?
Blaise Agüera y Arcas | Speaker | TED.com