Blaise Agüera y Arcas: How computers are learning to be creative
Blaise Agüera y Arcas: Hoe computers leren creatief te zijn
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces. Full bio
Double-click the English transcript below to play the video.
that works on machine intelligence;
naar machine-intelligentie bij Google.
of making computers and devices
en andere apparaten in staat wil stellen
that brains do.
die onze hersenen kunnen.
interested in real brains
in echte hersenen
in the things that our brains do
wat onze hersenen kunnen,
to the performance of computers.
nog veel te ingewikkeld is.
has been perception,
is altijd al waarneming geweest,
out there in the world --
in de buitenwereld,
veranderen in concepten.
van onze hersenen.
for example, that our team makes,
schrijven voor machines, bijvoorbeeld,
on Google Photos to become searchable,
op te zoeken in Google Photos,
is creativiteit.
out there into the world.
in iets in de echte wereld.
our work on machine perception
over machinewaarneming
with the world of machine creativity
met de wereld van machine-creativiteit,
had a penetrating insight
een diepzinnig inzicht
between perception and creativity.
tussen waarneming en creativiteit.
has a statue inside of it,
zit een standbeeld verborgen...
is to discover it."
om dat eruit te halen."
Michelangelo was getting at
zelf gaan creëren.
is an act of imagination
een manier van inbeelding is.
and perceiving and imagining,
voor de waarneming en inbeelding
with a brief bit of history
met een korte geschiedenis
the heart or the intestines,
about a brain by just looking at it,
als je er gewoon naar kijkt,
die de hersenen bestudeerden,
of this thing all kinds of fanciful names,
oppervlaktestructuren van de hersenen,
doesn't tell us very much
natuurlijk niet veel
developed some kind of insight
een eerste inzicht bracht
Santiago Ramón y Cajal,
Santiago Ramón y Cajal,
en speciale beitsen
or render in very high contrast
selectief konden opvullen
their morphologies.
that he made of neurons
die hij maakte van neuronen
of different sorts of cells,
aan soorten cellen.
was quite new at this point.
op dat moment.
very, very long distances --
die zeer uitgestrekt kunnen zijn.
to some people in the 19th century;
dit ook al in de negentiende eeuw.
were just getting underway.
en de bedrading waren in volle gang.
of Ramón y Cajal's, like this one,
van Ramón y Calal, zoals deze,
nog steeds onovertroffen.
that Ramón y Cajal started.
het werk van Ramón y Cajal verder.
van onze collega's
of Neuroscience.
of Neuroscience.
in beeld gebracht.
is about one cubic millimeter in size,
één kubieke millimeter groot.
very small piece of it here.
is ongeveer één micron groot.
tiny block of tissue.
of hair is about 100 microns.
zo'n honderd micron.
much, much smaller
electron microscopy slices,
microscopische beelden
in 3D of neurons that look like these.
die er dan als volgt uitzien:
style as Ramón y Cajal.
als Ramón y Cajals tekeningen.
be able to see anything here.
dat je niets meer ziet.
one neuron to another.
met elkaar verbindt.
ahead of his time,
van de hersenen
over the next few decades.
in de volgende decennia.
elektriciteit gebruikten.
was advanced enough
geavanceerd genoeg
experiments on live neurons
op levende neuronen,
when computers were being invented,
de computer uitgevonden.
dat het brein moduleerbaar is.
of modeling the brain --
as Alan Turing called it,
in termen van Alan Turing,
van de computerwetenschap.
looked at Ramón y Cajal's drawing
bestudeerden Ramón y Cayals tekening
imagery that comes from the eye.
die binnenkomen via het oog.
like a circuit diagram.
als een schakelschema.
in McCulloch and Pitts's circuit diagram
en Pitt bevat veel details
of computational elements
als een reeks computeronderdelen
one to the next in a cascade,
van één niveau naar het andere
visual information would need to do.
wil verwerken moet kunnen doen.
te kijken en te zeggen:
for us to do with our brains.
that for a computer,
dat tot voor enkele jaren geleden,
just a few years ago.
voor een computer.
this task is easy to do.
and the word "bird,"
en het woord 'vogel'?
connected to each other
met elkaar verbonden
inside our visual cortices,
binnen onze visuele cortex,
to have the capability
on the computer.
na te maken op de computer.
that actually looks like.
hoe dat eruitziet.
about as a first layer of neurons,
als de eerste laag neuronen.
how it works in the eye --
de werking van het oog.
in het netvlies.
after another layer of neurons,
of different weights.
van verschillende groottes.
of all of those synapses.
van al deze zenuwknopen.
properties of this network.
eigenschappen van dat netwerk.
or a small group of neurons
of een kleine groep neuronen
those three things --
in the neural network,
van het neuronennetwerk, of de input,
these synapses in the neural network.
in het neurale netwerk.
slechts vijf letters, niet?
is just a simple formula,
als een simpele formule:
going on there, of course,
gebeurt er natuurlijk
of mathematical operations.
wiskundige berekeningen.
that if you have one equation,
over twee variabelen beschikt
by knowing the other two things.
that the picture of a bird is a bird,
afleiden dat dit een vogel is,
and w and x are known.
en de w en x allebei gekend.
you know the pixels.
a relatively straightforward problem.
relatief eenvoudig is.
and you're done.
dat we gebouwd hebben
doing exactly that.
on a mobile phone,
op een mobiele telefoon.
amazing in its own right,
al verbazingwekkend,
billions and trillions of operations
en biljarden bewerkingen kan uitvoeren
picture of a bird,
verschijnen van vogels.
"Yes, it's a bird,"
with a network of this sort.
met dit type netwerk.
and the y is the unknown.
en was de y de onbekende.
difficult part, of course,
deel over, natuurlijk,
do we figure out the w,
in staat zijn?
of solving for w,
waarbij we de w willen oplossen,
with the simple equation
vergelijking gieten,
6 is gelijk aan 2 maal w.
het omgekeerde van vermenigvuldiging.
it's the inverse to multiplication,
very non-linear operation;
zeer non-lineaire bewerking,
to solve the equation
om die vergelijking op te lossen,
is fairly straightforward.
a little algebra trick,
to the right-hand side of the equation.
naar de rechterkant van de vergelijking.
about it as an error.
for w the right way,
als we de w juist oplossen,
de foutmarge zo klein mogelijk maken,
to minimize the error,
computers are very good at.
dan zou de marge 4 zijn.
sort of play Marco Polo,
successive approximations to w.
steeds dichter bij w.
but after about a dozen steps,
maar na zo'n twaalf stappen
which is close enough.
en dat is precies genoeg.
aan het doen zijn.
a lot of known x's and known y's
van die gekende x'en en y's genomen
through an iterative process.
mee achterhaald door een iteratief proces.
that we do our own learning.
this is not a bird."
Dat is geen vogel."
eindeloos herhalen
for those neural connections.
voor deze zenuwverbindingen.
x and w fixed to solve for y;
gekeken om de y te achterhalen.
want dat is leren.
hebben we veel voorbeelden nodig.
van ons team, Alex Mordvintsev,
Alex Mordvintsev, on our team,
with what happens if we try solving for x,
als we de x probeerden op te lossen
that you've trained on birds,
kunnen al vogels herkennen.
een afbeelding van een vogel?
the same error-minimization procedure,
foutenminimalisatie-procedure,
trained to recognize birds,
dat vogels kan herkennen,
generated entirely by a neural network
gegenereerd door een neuraal netwerk
rather than solving for y,
in plaats van naar de y
by Mike Tyka in our group,
van Mike Tyka in onze groep.
of William Kentridge's artworks,
aan William Kentridges' schilderijen.
en zo creëert hij een film.
van de verschillende dieren
over the space of different animals,
van elkaar kan onderscheiden.
to recognize and distinguish
overgang van het ene dier in het andere.
morph from one animal to another.
have tried reducing
om de y's terug te brengen
out of the space of all things
met daarop de ruimte van alle dingen
over that entire surface,
over die hele oppervlakte,
over het oppervlak,
you make a kind of map --
van alles wat het netwerk herkent.
the network knows how to recognize.
Dat daar is een gordeldier.
"armadillo" is right in that spot.
of networks as well.
to recognize faces,
om gezichten te herkennen,
in a y that says, "me,"
die mij vertegenwoordigt.
psychedelic picture of me
en psychedelisch beeld van mij,
perspectieven tegelijkertijd,
multiple points of view at once
dat het de dubbelzinnigheid tegengaat
to get rid of the ambiguity
or another pose,
another kind of lighting.
mogelijke belichtingen.
this sort of reconstruction,
of different points of view,
van 'n heleboel perspectieven,
his own face as a guide image
zijn eigen gezicht gebruikt als richtlijn
to reconstruct my own face.
om mijn gezicht te reconstrueren.
te optimaliseren.
that optimization process.
more like a coherent face,
wat meer lijkt op een gezicht,
with a blank canvas
met een wit doek,
die op zich al een afbeelding is.
that is itself already some other image.
that is designed to categorize
voorwerpen te categoriseren,
man-made structures, animals ...
with just a picture of clouds,
van een afbeelding van wolken.
what it sees in the clouds.
wat het kan zien in de wolken.
you spend looking at this,
will see in the clouds.
to hallucinate into this,
van het gezichtsnetwerk in verwerken.
andere experimenten uitgevoerd,
van de wolken neemt,
weer 'n hallucinatie toevoegt, inzoomt.
zooms hallucinates, zooms.
of the network, I suppose,
dissociatieve vlucht, denk ik,
is eating its own tail.
haar eigen staart opeet.
What do I think I see next?"
called "Higher Education" --
bij een lezing, genaamd 'Hoger Onderwijs'.
marijuana was legalized.
nog maar net gelegaliseerd.
is not constrained.
geen grenzen kent.
omdat die leuk zijn om naar te kijken.
because they're really fun to look at.
a camera that takes a picture,
waarbij hij foto's nam met een camera
writes a poem using neural networks,
mee te schrijven, met z'n computer,
has been trained
uit de 20e eeuw.
are very intimately connected.
zeer nauw met elkaar verbonden.
dat neurale netwerken
things in the world,
en kunst voortbrengen.
Michelangelo really did see
uit massieve blokken steen,
any being, any alien
van eender welke planeet
perceptual acts of that sort
machinery that's used in both cases.
hetzelfde mechanisme gebruikt.
and creativity are by no means
dat waarneming en creativiteit
that can do exactly these sorts of things.
kunnen deze dingen ook al.
ons brein is immers computationeel.
the brain is computational.
in designing intelligent machinery.
om intelligente machines te ontwikkelen.
gemaakt konden worden.
enkele van de beloftes waar te maken
of those early pioneers,
is not just about accounting
niet enkel draait om berekeningen,
we modeled them after our minds.
volgens onze hersenen.
to understand our own minds better
om onze hersenen beter te begrijpen
ABOUT THE SPEAKER
Blaise Agüera y Arcas - Software architectBlaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces.
Why you should listen
Blaise Agüera y Arcas is principal scientist at Google, where he leads a team working on machine intelligence for mobile devices. His group works extensively with deep neural nets for machine perception and distributed learning, and it also investigates so-called "connectomics" research, assessing maps of connections within the brain.
Agüera y Arcas' background is as multidimensional as the visions he helps create. In the 1990s, he authored patents on both video compression and 3D visualization techniques, and in 2001, he made an influential computational discovery that cast doubt on Gutenberg's role as the father of movable type.
He also created Seadragon (acquired by Microsoft in 2006), the visualization technology that gives Photosynth its amazingly smooth digital rendering and zoom capabilities. Photosynth itself is a vastly powerful piece of software capable of taking a wide variety of images, analyzing them for similarities, and grafting them together into an interactive three-dimensional space. This seamless patchwork of images can be viewed via multiple angles and magnifications, allowing us to look around corners or “fly” in for a (much) closer look. Simply put, it could utterly transform the way we experience digital images.
He joined Microsoft when Seadragon was acquired by Live Labs in 2006. Shortly after the acquisition of Seadragon, Agüera y Arcas directed his team in a collaboration with Microsoft Research and the University of Washington, leading to the first public previews of Photosynth several months later. His TED Talk on Seadragon and Photosynth in 2007 is rated one of TED's "most jaw-dropping." He returned to TED in 2010 to demo Bing’s augmented reality maps.
Fun fact: According to the author, Agüera y Arcas is the inspiration for the character Elgin in the 2012 best-selling novel Where'd You Go, Bernadette?
Blaise Agüera y Arcas | Speaker | TED.com