Blaise Agüera y Arcas: How computers are learning to be creative
ბლეზ აგუერა ი არკასი: როგორ სწავლობენ კომპიუტერები შემოქმედებას
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces. Full bio
Double-click the English transcript below to play the video.
that works on machine intelligence;
რომელიც მანქანურ ინტელექტზე მუშაობს.
of making computers and devices
რომელიც კომპიუტერებს და მოწყობილობებს
that brains do.
interested in real brains
in the things that our brains do
to the performance of computers.
has been perception,
out there in the world --
მსოფლიოში არსებული
for example, that our team makes,
მანქანური აღქმის ალგორითმების მაგალითია,
on Google Photos to become searchable,
გამოსახულებითაა შესაძლებელი.
out there into the world.
our work on machine perception
with the world of machine creativity
had a penetrating insight
ორმხრივ დამოკიდებულებაზე
between perception and creativity.
მართლაც შორსმჭვრეტელი იყო.
has a statue inside of it,
is to discover it."
Michelangelo was getting at
is an act of imagination
and perceiving and imagining,
ფიქრობს, აღიქვამს და წარმოიდგენს
with a brief bit of history
the heart or the intestines,
about a brain by just looking at it,
მასზე ბევრს ვერაფერს იტყვით,
რომლებიც ტვინს აკვირდებოდნენ
of this thing all kinds of fanciful names,
სხვადასხვა უცნაურ სახელებს არქმევდნენ,
რაც "პატარა კრევეტს" ნიშნავს
doesn't tell us very much
ბევრს არაფერს გვეუბნება იმაზე,
developed some kind of insight
შეიქმნა რაღაც წარმოდგენა მაინც,
Santiago Ramón y Cajal,
სანტიაგო რამონ ი კახალი იყო,
და სპეციალური საღებავი გამოიყენა,
or render in very high contrast
შერჩევითად შეავსო
their morphologies.
that he made of neurons
of different sorts of cells,
არაჩვეულებრივ მრავალფეროვნებას ხედავთ,
was quite new at this point.
საკმაოდ ახალი ხილი იყო.
very, very long distances --
რომელიც ძალიან შორს მიდის,
to some people in the 19th century;
ზოგისთვის მე-19 საუკუნეში.
were just getting underway.
of Ramón y Cajal's, like this one,
ეს მიკრონატომიური გამოსახულებები
ჩვენ ჯერ კიდევ ვცდილობთ
that Ramón y Cajal started.
დაწყებული საქმის დასრულებას.
დაუმუშავებელი მონაცემებია,
of Neuroscience.
ნეირომეცნიერების ინსტიტუტიდან.
is about one cubic millimeter in size,
დაახლოებით 1 კუბური მილიმეტრია
very small piece of it here.
დაახლოებით 1 მიკრონია.
tiny block of tissue.
of hair is about 100 microns.
საშუალო დიამეტრი 100 მიკრონია.
much, much smaller
electron microscopy slices,
in 3D of neurons that look like these.
ნეირონის მსგავსი რეკონსტრუქციების აწყობა.
style as Ramón y Cajal.
რამონ ი კახალის ნახატებს ჰგავს.
be able to see anything here.
one neuron to another.
რომლებიც ერთ ნეირონს მეორესთან აერთებს
ahead of his time,
over the next few decades.
რომ ნეირონები ელექტრობას იყენებდნენ
was advanced enough
საკმარისად განვითარებული იყო იმისთვის,
experiments on live neurons
ელექტრო ექსპერიმენტები ჩატარებულიყო
როგორ მუშაობენ ისინი.
when computers were being invented,
როცა კომპიუტერები გამოიგონეს,
of modeling the brain --
ე.წ. "გონიერ მანქანაზე" დაფუძნებით,
as Alan Turing called it,
ერთ-ერთმა მამამ,
looked at Ramón y Cajal's drawing
შეხედეს რამონ ი კახალის ნახატებს,
imagery that comes from the eye.
გამოსახულებებს ამუშავებს
like a circuit diagram.
დიაგრამასავით იყო.
in McCulloch and Pitts's circuit diagram
of computational elements
როგორც გამოთვლითი ელემენტების სერია,
one to the next in a cascade,
კასკადურად გადასცემენ ინფორმაციას,
visual information would need to do.
დამუშავების მოდელმა
for us to do with our brains.
ტვინის გამოყენებით.
that for a computer,
რომ კომპიუტერისთვის
just a few years ago.
ეს პრაქტიკულად შეუძლებელი იყო.
this task is easy to do.
and the word "bird,"
და სიტყვა "ჩიტს" შორის,
connected to each other
რომლებიც ერთმანეთს
inside our visual cortices,
ბიოლოგიური, ჩვენ მხედველობის ქერქში,
to have the capability
on the computer.
კომპიუტერში შევქმნათ.
that actually looks like.
ეს როგორ გამოიყურება.
about as a first layer of neurons,
შეიძლება წარმოვიდგინოთ
how it works in the eye --
after another layer of neurons,
და შემდეგ შრეებს, ერთი მეორის მიყოლებით,
of different weights.
სხვადასხვა წონის სინაფსებით უკავშირდება.
of all of those synapses.
properties of this network.
თვისებებს ახასიათებენ.
or a small group of neurons
those three things --
in the neural network,
სინაფსები ნეირონული ქსელში
x, w და y.
these synapses in the neural network.
თითოეული სინაფსის წონას წარმოადგენს.
is just a simple formula,
going on there, of course,
სინამდვილეში ამ ადგილას,
of mathematical operations.
მათემატიკური ოპერაციების წყებაა.
that if you have one equation,
რომ თუ გვაქვს ერთი განტოლება,
by knowing the other two things.
თუ დანარჩენი ორი ცნობილია.
that the picture of a bird is a bird,
ჩიტია გამოსახული
and w and x are known.
you know the pixels.
და ვიცით პიქსელები.
a relatively straightforward problem.
ეს შედარებით სწორხაზოვანი ამოცანაა.
and you're done.
doing exactly that.
on a mobile phone,
amazing in its own right,
billions and trillions of operations
მილიარდობით და ტრილიონობით ოპერაციების
picture of a bird,
ერთი მეორის მიყოლებით
"Yes, it's a bird,"
with a network of this sort.
ადგენს მის სახეობას.
and the y is the unknown.
difficult part, of course,
ვტოვებ იმ ურთულეს ნაწილს,
do we figure out the w,
of solving for w,
with the simple equation
6 = 2 x w,
it's the inverse to multiplication,
რადგან ის გამრავლების საპირისპიროა,
very non-linear operation;
to solve the equation
is fairly straightforward.
საკმაოდ მარტივად შეიძლება.
a little algebra trick,
to the right-hand side of the equation.
მარჯვენა მხარეს გადავიტანოთ.
about it as an error.
მოდი ის "ცდომილებად" წარმოვიდგინოთ.
for w the right way,
w-ის მიმართ სწორად თუ ამოვხსნით,
to minimize the error,
შეგვიძლია ცდომილება მინიმუმზე დავიყვანოთ.
computers are very good at.
ძალიან ძლიერები.
sort of play Marco Polo,
"გამოცნობა" ითამაშოს
successive approximations to w.
but after about a dozen steps,
მაგრამ ათეული ბიჯის შემდეგ,
which is close enough.
რაც საკმარისი მიახლოებაა.
a lot of known x's and known y's
through an iterative process.
ვიგებთ w-ს.
that we do our own learning.
this is not a bird."
for those neural connections.
და ვაგებთ ნეიონულ კავშირებს.
x and w fixed to solve for y;
და შეგვიძლია y-სთვის ამოვხსნათ;
წვრთნის გამოყენებით,
Alex Mordvintsev, on our team,
ჩვენი გუნდის წევრმა, ალექს მორდვინცევმა,
with what happens if we try solving for x,
x-ის მიმართ ამოხსნის ექსპერიმენტი,
that you've trained on birds,
რომელსაც ჩიტების ამოცნობა შეუძლია,
the same error-minimization procedure,
შემამცირებელი პროცედურის გამოყენებით
trained to recognize birds,
ნეირონულ ქსელს გავუკეთოთ
generated entirely by a neural network
ისეთი ნეირონული ქსელის მიერაა შექმნილი,
rather than solving for y,
მხოლოდ y-ის ნაცვლად x მიმართ
by Mike Tyka in our group,
მაიკ ტაიკას გაკეთებულია.
of William Kentridge's artworks,
შემოქმედებას მაგონებს,
შემდეგ შლის,
over the space of different animals,
სხვადასხვა ცხოველების სივრცეზე
to recognize and distinguish
morph from one animal to another.
მორფულ გადასვლებს ცხოველებს შორის.
have tried reducing
ერთად სცადეს შეემცირებინათ
მხოლოდ ორგანზომილებიან სივრცეზე
out of the space of all things
ყველა ამოცნობადი ობიექტისგან
over that entire surface,
მთელ ზედაპირზე,
you make a kind of map --
თქვენ ქმნით გარკვეულ რუკას.
the network knows how to recognize.
რისი ამოცნობაც ქსელს შეუძლია.
"armadillo" is right in that spot.
"ჯავშნოსანი" ზუსტად ამ წერტილშია.
of networks as well.
სხვა სახის ქსელებშიც შეგიძლიათ.
to recognize faces,
in a y that says, "me,"
psychedelic picture of me
ფსიქოდელიურ სურათს,
multiple points of view at once
დანახულს იმიტომ ჰგავს,
to get rid of the ambiguity
გათავისუფლდეს იმ გაურკვევლობისგან,
or another pose,
another kind of lighting.
ყოფნას ახლავს.
this sort of reconstruction,
რეკონსტრუქციას აკეთებთ,
რაღაც ტიპის სურათს,
of different points of view,
his own face as a guide image
ჩემი სახის რეკონსტრუქციისთვის,
to reconstruct my own face.
საკუთარ სახეს გამოიყენებს.
that optimization process.
ოპტიმიზაციის პროცესის ოპტიმიზება.
more like a coherent face,
რაღაც უფრო გამოკვეთილი სახის მსგავსს,
with a blank canvas
that is itself already some other image.
რომელიც თავისთავად რაღაც გამოსახულებაა.
that is designed to categorize
man-made structures, animals ...
სტრუქტურების, ცხოველების კატეგორიზებისთვის
with just a picture of clouds,
what it sees in the clouds.
you spend looking at this,
will see in the clouds.
დაინახავთ ღრუბლებში.
სახის ამომცნობი ქსელი გამოიყენოთ
to hallucinate into this,
ღრუბლების გამოსახულებას,
zooms hallucinates, zooms.
აახლოვებსს, ჰალუცინირებს, აახლოვებს.
of the network, I suppose,
is eating its own tail.
What do I think I see next?"
რას დავინახავ შემდეგ?"
called "Higher Education" --
"უმაღლესი განათლება"...
marijuana was legalized.
is not constrained.
because they're really fun to look at.
იმიტომ რომ ისინი სახალისო სანახავია.
მხატვარმა, როს გუდუინმა,
a camera that takes a picture,
writes a poem using neural networks,
ნეირონული ქსელის გამოყენებით ლექსებს წერს,
შითავისის საფუძველზე.
has been trained
დიდ კრებულზეა გაწვრთნილი.
are very intimately connected.
ძალიან მჭიდროდაა დაკავშირებული.
things in the world,
სხვადასხვა ობიექტები მსოფლიოში.
და შექმნან.
Michelangelo really did see
რომ მიქელანჯელო მართლაც ხედავდა
any being, any alien
ნებისმიერი არსება, უცხოპლანეტელი,
perceptual acts of that sort
machinery that's used in both cases.
ზუსტად ერთნაირი მექანიზმი გამოიყენება.
and creativity are by no means
სულაც არ არის
that can do exactly these sorts of things.
რომლებსაც მსგავსი რამეების კეთება შეუძლიათ
the brain is computational.
ტვინიც ხომ ერთგვარი კომპიუტერია
in designing intelligent machinery.
შექმნის მცდელობად დაიწყო.
დიდწილად განსაზღვრა იდეამ,
მანქანები გახვადოთ გონიერი.
of those early pioneers,
ტიურინგის და ვონ ნოიმანის,
is not just about accounting
არა მხოლოდ გამოთვლაა,
ან რამე მსგავსის თამაში.
we modeled them after our minds.
ჩვენი ტვინის მიხედვით დავაპროექტეთ.
to understand our own minds better
როგორც ჩვენი ტვინი გავიგოთ უკეთ,
ABOUT THE SPEAKER
Blaise Agüera y Arcas - Software architectBlaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces.
Why you should listen
Blaise Agüera y Arcas is principal scientist at Google, where he leads a team working on machine intelligence for mobile devices. His group works extensively with deep neural nets for machine perception and distributed learning, and it also investigates so-called "connectomics" research, assessing maps of connections within the brain.
Agüera y Arcas' background is as multidimensional as the visions he helps create. In the 1990s, he authored patents on both video compression and 3D visualization techniques, and in 2001, he made an influential computational discovery that cast doubt on Gutenberg's role as the father of movable type.
He also created Seadragon (acquired by Microsoft in 2006), the visualization technology that gives Photosynth its amazingly smooth digital rendering and zoom capabilities. Photosynth itself is a vastly powerful piece of software capable of taking a wide variety of images, analyzing them for similarities, and grafting them together into an interactive three-dimensional space. This seamless patchwork of images can be viewed via multiple angles and magnifications, allowing us to look around corners or “fly” in for a (much) closer look. Simply put, it could utterly transform the way we experience digital images.
He joined Microsoft when Seadragon was acquired by Live Labs in 2006. Shortly after the acquisition of Seadragon, Agüera y Arcas directed his team in a collaboration with Microsoft Research and the University of Washington, leading to the first public previews of Photosynth several months later. His TED Talk on Seadragon and Photosynth in 2007 is rated one of TED's "most jaw-dropping." He returned to TED in 2010 to demo Bing’s augmented reality maps.
Fun fact: According to the author, Agüera y Arcas is the inspiration for the character Elgin in the 2012 best-selling novel Where'd You Go, Bernadette?
Blaise Agüera y Arcas | Speaker | TED.com