Blaise Agüera y Arcas: How computers are learning to be creative
Blaise Agüera y Arcas: Hogyan tanulnak a számítógépek alkotókészséget
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces. Full bio
Double-click the English transcript below to play the video.
foglalkozó részleget vezetem.
that works on machine intelligence;
of making computers and devices
és készülékeket tesz alkalmassá arra,
tevékenységet végezzenek.
that brains do.
interested in real brains
hogy az aggyal
in the things that our brains do
to the performance of computers.
has been perception,
az érzékelés folyamata,
out there in the world --
for example, that our team makes,
– csoportunk ezen dolgozik –
on Google Photos to become searchable,
lévő fotóit kereshetővé annak alapján,
az alkotókészség:
out there into the world.
our work on machine perception
2015-ben váratlanul
with the world of machine creativity
had a penetrating insight
nagyon is beleérzett
between perception and creativity.
közötti kettős viszonyba.
has a statue inside of it,
is to discover it."
Michelangelo was getting at
is an act of imagination
mint a képzelet folyamata
and perceiving and imagining,
és a képzelet irányítója
with a brief bit of history
szeretném kezdeni,
the heart or the intestines,
about a brain by just looking at it,
of this thing all kinds of fanciful names,
furcsa neveket adtak,
doesn't tell us very much
árulnak el arról,
developed some kind of insight
Santiago Ramón y Cajal,
a nagy spanyol ideganatómus volt
és különleges eljárást alkalmazott,
or render in very high contrast
megfesteni az egyes idegsejteket,
their morphologies.
that he made of neurons
az idegsejtekről
of different sorts of cells,
változatosak a különféle sejtek;
was quite new at this point.
a sejtelmélet is vadonatúj volt.
messze ki tudnak nyúlni,
very, very long distances --
to some people in the 19th century;
kézenfekvőnek tűnt:
were just getting underway.
és a villamosság forradalma.
of Ramón y Cajal's, like this one,
that Ramón y Cajal started.
a Cajal által megkezdett munkát.
Intézetből származnak.
of Neuroscience.
is about one cubic millimeter in size,
összességében is csupán 1 mm³,
very small piece of it here.
csak egy pici részét mutatom.
tiny block of tissue.
of hair is about 100 microns.
kb. 100 mikron.
much, much smaller
az sokkal-sokkal kisebb,
electron microscopy slices,
metszeteknek a sorozatából
in 3D of neurons that look like these.
valami ilyet kapunk.
style as Ramón y Cajal.
Ramón y Cajal képeire.
be able to see anything here.
one neuron to another.
ahead of his time,
csak lassan haladt
over the next few decades.
elektromosságot használják,
technológiánk elég fejlett volt ahhoz,
was advanced enough
experiments on live neurons
kísérleteket végezzünk
hogy működésüket megértsük.
when computers were being invented,
az agy működését alapul véve -
of modeling the brain --
az "értelmes szerkezetet",
as Alan Turing called it,
ahogy Alan Turing,
looked at Ramón y Cajal's drawing
megvizsgálta
imagery that comes from the eye.
a szemünkből érkező képeket.
like a circuit diagram.
mint egy kapcsolási rajz.
in McCulloch and Pitts's circuit diagram
és Pitts kapcsolási rajzán
of computational elements
mint számítási egységek sorozata,
one to the next in a cascade,
tovább az információt,
visual information would need to do.
információt földolgozó modellnek.
és jelentse ki:
for us to do with our brains.
that for a computer,
hogy a számítógép számára ez
just a few years ago.
this task is easy to do.
and the word "bird,"
lényegében annyi,
connected to each other
inside our visual cortices,
neuronhálózat a látókéregben,
to have the capability
on the computer.
kezdünk képesek lenni.
that actually looks like.
about as a first layer of neurons,
az idegsejtek első rétegeként,
how it works in the eye --
after another layer of neurons,
mindegyik a következőnek,
szinapszissal vannak összekötve.
of different weights.
of all of those synapses.
properties of this network.
számítási tulajdonságait.
or a small group of neurons
és azt mondják: madár.
those three things --
in the neural network,
az ideghálózat szinapszisait,
these synapses in the neural network.
szinapszisok súlyát jellemzi.
is just a simple formula,
az egyszerű képlet létezne:
going on there, of course,
of mathematical operations.
that if you have one equation,
by knowing the other two things.
ha ismerjük a másik kettőt.
that the picture of a bird is a bird,
hogy a madár képe egy madáré,
and w and x are known.
you know the pixels.
és a képpontokat.
a relatively straightforward problem.
viszonylag egyszerű.
and you're done.
a hárommal, és kész.
doing exactly that.
és ami pontosan ezt csinálja.
on a mobile phone,
amazing in its own right,
billions and trillions of operations
milliárdnyi vagy billiónyi
picture of a bird,
"Yes, it's a bird,"
hogy: "Igen, ez madár",
with a network of this sort.
a madárfajt is fölismeri.
and the y is the unknown.
difficult part, of course,
részeken, nevezetesen:
do we figure out the w,
of solving for w,
megoldás keresése w-re.
with the simple equation
miként kell a 6 = 2 * w -t megoldani.,
it's the inverse to multiplication,
mert ez a szorzás inverze,
very non-linear operation;
nemlineáris művelet;
to solve the equation
oldható meg az egyenlet
is fairly straightforward.
a little algebra trick,
to the right-hand side of the equation.
az egyenlet jobb oldalára.
about it as an error.
for w the right way,
oldjuk meg az egyenletet,
to minimize the error,
próbálgatnunk kell,
computers are very good at.
sort of play Marco Polo,
a Marco Polo-játékot,
successive approximations to w.
but after about a dozen steps,
de tucatnyi lépés után
which is close enough.
ami elég jó közelítés.
a lot of known x's and known y's
ismert x-et és ismert y-t,
through an iterative process.
w-re egy megoldást.
that we do our own learning.
tanulunk mi magunk is.
this is not a bird."
"Ez madár, ez nem madár."
for those neural connections.
az idegi kapcsolatokat.
x and w fixed to solve for y;
ismert az x és a w;
Alex Mordvintsev, on our team,
elhatározta, hogy kipróbálja,
with what happens if we try solving for x,
próbálunk megoldást keresni
that you've trained on birds,
be van tanítva madarakra,
the same error-minimization procedure,
a hibaminimalizáló eljárást alkalmazzuk
trained to recognize birds,
betanított hálózatra,
generated entirely by a neural network
fölismerésére betanított
hozta létre egyszerűen úgy,
rather than solving for y,
kerestük a megoldást
by Mike Tyka in our group,
of William Kentridge's artworks,
műalkotásaira emlékeztet:
over the space of different animals,
to recognize and distinguish
tervezett hálózaton.
morph from one animal to another.
tűnik át egyik állat a másikba.
have tried reducing
az összes y alapján
out of the space of all things
valamennyi tárgyat
over that entire surface,
you make a kind of map --
leképezést készítünk:
the network knows how to recognize.
amit a hálózat felismer.
"armadillo" is right in that spot.
ez itt az armadillo, azaz a tatu.
of networks as well.
másfajta hálózatokkal is.
to recognize faces,
arcfölismerésre hozták létre,
megkülönböztetni egymástól.
in a y that says, "me,"
psychedelic picture of me
multiple points of view at once
to get rid of the ambiguity
hogy megszabaduljon a félreértésektől,
or another pose,
another kind of lighting.
this sort of reconstruction,
valamilyen képet
of different points of view,
valami káosza keletkezik,
his own face as a guide image
tulajdon arcát használja
to reconstruct my own face.
az én arcom rekonstruálásához.
that optimization process.
more like a coherent face,
with a blank canvas
that is itself already some other image.
tartozó x-szel,
that is designed to categorize
pl. állatok, ember alkotta struktúrák -
man-made structures, animals ...
osztályba sorolására készült.
with just a picture of clouds,
what it sees in the clouds.
hogy mit lát bele a felhőkbe.
you spend looking at this,
will see in the clouds.
to hallucinate into this,
hogy arcokat lássunk bele,
zooms hallucinates, zooms.
zoomolt, értelmeztette, zoomolt...
of the network, I suppose,
disszociatív fugaállapotához jutunk,
is eating its own tail.
What do I think I see next?"
called "Higher Education" --
marijuana was legalized.
is not constrained.
beláthatatlanok.
because they're really fun to look at.
mert ezek nagyon mutatósak.
a camera that takes a picture,
amely készít egy fölvételt,
writes a poem using neural networks,
ihletet merítve verset ír.
has been trained
a 20.századi költészet
alapján hozták létre.
are very intimately connected.
szorosan összefügg.
neurális hálózatok,
hogy megkülönböztessenek
things in the world,
generálásra is képesek.
Michelangelo really did see
any being, any alien
lény, Földön kívüli,
perceptual acts of that sort
machinery that's used in both cases.
pontosan ugyanazon műveletek.
and creativity are by no means
és az alkotás semmi esetre sem
that can do exactly these sorts of things.
modellek, amelyek képesek ugyanerre.
the brain is computational.
egy sajátságos számítógép.
in designing intelligent machinery.
tett kísérletként indult.
of those early pioneers,
is not just about accounting
nem korlátozódik a könyvelésre,
we modeled them after our minds.
alapján modelleztük.
to understand our own minds better
ABOUT THE SPEAKER
Blaise Agüera y Arcas - Software architectBlaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces.
Why you should listen
Blaise Agüera y Arcas is principal scientist at Google, where he leads a team working on machine intelligence for mobile devices. His group works extensively with deep neural nets for machine perception and distributed learning, and it also investigates so-called "connectomics" research, assessing maps of connections within the brain.
Agüera y Arcas' background is as multidimensional as the visions he helps create. In the 1990s, he authored patents on both video compression and 3D visualization techniques, and in 2001, he made an influential computational discovery that cast doubt on Gutenberg's role as the father of movable type.
He also created Seadragon (acquired by Microsoft in 2006), the visualization technology that gives Photosynth its amazingly smooth digital rendering and zoom capabilities. Photosynth itself is a vastly powerful piece of software capable of taking a wide variety of images, analyzing them for similarities, and grafting them together into an interactive three-dimensional space. This seamless patchwork of images can be viewed via multiple angles and magnifications, allowing us to look around corners or “fly” in for a (much) closer look. Simply put, it could utterly transform the way we experience digital images.
He joined Microsoft when Seadragon was acquired by Live Labs in 2006. Shortly after the acquisition of Seadragon, Agüera y Arcas directed his team in a collaboration with Microsoft Research and the University of Washington, leading to the first public previews of Photosynth several months later. His TED Talk on Seadragon and Photosynth in 2007 is rated one of TED's "most jaw-dropping." He returned to TED in 2010 to demo Bing’s augmented reality maps.
Fun fact: According to the author, Agüera y Arcas is the inspiration for the character Elgin in the 2012 best-selling novel Where'd You Go, Bernadette?
Blaise Agüera y Arcas | Speaker | TED.com