Blaise Agüera y Arcas: How computers are learning to be creative
Μπλέιζ Αγκέρα ι Άρκας: Πώς μαθαίνουν οι υπολογιστές να είναι δημιουργικοί
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces. Full bio
Double-click the English transcript below to play the video.
that works on machine intelligence;
που ερευνά τη μηχανική ευφυΐα.
of making computers and devices
που κάνει υπολογιστές και συσκευές
that brains do.
κάποια απ' όσα κάνει το μυαλό.
interested in real brains
για τους κανονικούς εγκεφάλους
in the things that our brains do
που κάνει το μυαλό μας
από τις επιδόσεις των υπολογιστών.
to the performance of computers.
has been perception,
ήταν η αντίληψη,
out there in the world --
τα πράγματα εκεί έξω στον κόσμο
για τον υπολογιστή.
for example, that our team makes,
αντίληψης που φτιάχνει η ομάδα μας
on Google Photos to become searchable,
στις φωτογραφίες του Google Photos
είναι η δημιουργικότητα:
out there into the world.
σε κάτι εκεί έξω στον κόσμο.
our work on machine perception
η εργασία μας πάνω στη μηχανική αντίληψη
with the world of machine creativity
και με τον κόσμο της δημιουργικότητας
had a penetrating insight
είδε πολύ διορατικά
between perception and creativity.
μεταξύ αντίληψης και δημιουργικότητας.
has a statue inside of it,
έχει μέσα του ένα άγαλμα
να το αποκαλύψει».
is to discover it."
Michelangelo was getting at
is an act of imagination
είναι μια πράξη φαντασίας
η δημιουργικότητα.
and perceiving and imagining,
αντιλαμβάνεται και φαντάζεται
with a brief bit of history
για τον εγκέφαλό μας.
από την καρδιά ή τα έντερα
the heart or the intestines,
about a brain by just looking at it,
για τον εγκέφαλο απλώς κοιτώντας τον
που εξέτασαν τον εγκέφαλο
of this thing all kinds of fanciful names,
κάθε είδους περίεργη ονομασία,
doesn't tell us very much
συμβαίνει στο εσωτερικό.
developed some kind of insight
Santiago Ramón y Cajal,
Σαντιάγο Ραμόν ι Καχάλ
και ειδικές χρωστικές
or render in very high contrast
και να χρωματίσουν με μεγάλη αντίθεση
their morphologies.
να καταλαβαίνουμε τη μορφολογία τους.
that he made of neurons
που έφτιαξε τον 19ο αιώνα.
of different sorts of cells,
από διάφορα είδη κελιών,
was quite new at this point.
ήταν αρκετά νέα εκείνον τον καιρό.
very, very long distances --
to some people in the 19th century;
κάποιοι άνθρωποι τον 19ο αιώνα -
were just getting underway.
ήταν μόλις στο ξεκίνημά τους.
of Ramón y Cajal's, like this one,
του Ραμόν ι Καχάλ, όπως αυτό,
με κάποιους τρόπους.
that Ramón y Cajal started.
αυτό που άρχισε ο Ραμόν ι Καχάλ.
Νευροεπιστήμης Μαξ Πλανκ.
of Neuroscience.
μικρά κομμάτια εγκεφαλικού ιστού.
is about one cubic millimeter in size,
ένα κυβικό χιλιοστό σε μέγεθος,
very small piece of it here.
είναι περίπου ένα μικρόμετρο.
tiny block of tissue.
of hair is about 100 microns.
είναι περίπου 100 μικρόμετρα.
much, much smaller
electron microscopy slices,
από ηλεκτρονικό μικροσκόπιο
in 3D of neurons that look like these.
νευρώνες που μοιάζουν έτσι.
style as Ramón y Cajal.
με αυτές του Ραμόν ι Καχάλ.
be able to see anything here.
να δούμε τίποτα εδώ.
one neuron to another.
τους νευρώνες μεταξύ τους.
ahead of his time,
μπροστά από την εποχή του
για την κατανόηση του εγκεφάλου
over the next few decades.
τις επόμενες λίγες δεκαετίες.
χρησιμοποιούν ηλεκτρισμό
was advanced enough
είχαμε κάνει αρκετή πρόοδο
σε νευρώνες υπό λειτουργία
experiments on live neurons
πώς δούλευαν.
when computers were being invented,
of modeling the brain --
στη δομή του εγκεφάλου -
as Alan Turing called it,
όπως τα αποκαλούσε ο Άλαν Τιούρινγκ,
looked at Ramón y Cajal's drawing
από τον φλοιό του εγκεφάλου
imagery that comes from the eye.
εικόνες που φτάνουν από το μάτι.
like a circuit diagram.
in McCulloch and Pitts's circuit diagram
στο διάγραμμα των ΜακΚάλοκ και Πιτς
of computational elements
σαν μια σειρά από υπολογιστικά στοιχεία
one to the next in a cascade,
συνεχώς ο ένας στον άλλον
visual information would need to do.
επεξεργασίας οπτικών πληροφοριών.
και να πει,
for us to do with our brains.
να κάνουμε με τον εγκέφαλό μας.
that for a computer,
ότι για έναν υπολογιστή,
just a few years ago.
πριν από λίγα χρόνια.
this task is easy to do.
αυτό που συμβαίνει με τα πίξελ,
and the word "bird,"
και τη λέξη «πουλί»,
connected to each other
σε ένα νευρωνικό δίκτυο,
μέσα στον εγκεφαλικό φλοιό,
inside our visual cortices,
to have the capability
αρχίζουμε να έχουμε την ικανότητα
on the computer.
τέτοια δίκτυα στον υπολογιστή.
that actually looks like.
about as a first layer of neurons,
ως το πρώτο επίπεδο νευρώνων,
how it works in the eye --
after another layer of neurons,
of different weights.
από συνάψεις διαφορετικών βαρών.
of all of those synapses.
όλων αυτών των συνάψεων.
ιδιότητες αυτού του δικτύου.
properties of this network.
or a small group of neurons
ή μια μικρή ομάδα νευρώνων
those three things --
αυτά τα τρία πράγματα -
in the neural network,
και τις συνάψεις στο νευρωνικό δίκτυο,
περίπου ένα εκατομμύριο x -
ή τρισεκατομμύρια w,
these synapses in the neural network.
όλων των συνάψεων του νευρωνικού δικτύου.
ένα μικρός αριθμός από y,
μόνο πέντε γράμματα, σωστά;
is just a simple formula,
ένας πολύ απλός μαθηματικός τύπος,
going on there, of course,
of mathematical operations.
μαθηματικές λειτουργίες.
that if you have one equation,
by knowing the other two things.
εάν γνωρίζεις τους άλλους δύο.
ότι πρόκειται για φωτογραφία πουλιού,
that the picture of a bird is a bird,
and w and x are known.
και οι w και x είναι γνωστοί.
γνωρίζετε και τα πίξελ.
you know the pixels.
a relatively straightforward problem.
ένα σχετικά ξεκάθαρο πρόβλημα.
and you're done.
doing exactly that.
να κάνει ακριβώς αυτό.
on a mobile phone,
σε κινητό τηλέφωνο,
amazing in its own right,
είναι αξιοθαύμαστο γεγονός,
billions and trillions of operations
και τρισεκατομμύρια λειτουργίες
picture of a bird,
φωτογραφίες από πουλιά,
"Yes, it's a bird,"
with a network of this sort.
με ένα τέτοιο νευρωνικό δίκτυο.
and the y is the unknown.
και ο y είναι ο άγνωστος.
difficult part, of course,
για το πολύ δύσκολο μέρος,
do we figure out the w,
να κάνει κάτι τέτοιο;
of solving for w,
να λύνουμε ως προς w,
with the simple equation
6 = 2 x w,
it's the inverse to multiplication,
ως το αντίθετο του πολλαπλασιασμού,
very non-linear operation;
μια εντελώς μη γραμμική λειτουργία,
to solve the equation
να λύσουμε την εξίσωση
is fairly straightforward.
είναι αρκετά ξεκάθαρος.
a little algebra trick,
ένα κόλπο της άλγεβρας
to the right-hand side of the equation.
στη δεξιά πλευρά της εξίσωσης.
about it as an error.
ας το σκεφτούμε σαν ένα σφάλμα.
for w the right way,
αν λύναμε σωστά ως προς w,
to minimize the error,
για να ελαχιστοποιήσουμε το σφάλμα,
computers are very good at.
sort of play Marco Polo,
δίνοντας διάφορες τιμές
successive approximations to w.
λαμβάνει διαδοχικές τιμές κοντά στο w.
but after about a dozen steps,
αλλά μετά από καμιά δεκαριά δοκιμές
which is close enough.
που είναι αρκετά κοντά.
a lot of known x's and known y's
και γνωστούς y
through an iterative process.
μέσω μιας επαναληπτικής μεθόδου.
that we do our own learning.
μαθαίνουμε κι εμείς.
this is not a bird."
αυτό δεν είναι πουλί».
for those neural connections.
λύνουμε αυτές τις νευρωνικές συνδέσεις.
x and w fixed to solve for y;
για να λύσουμε ως προς y,
Alex Mordvintsev, on our team,
ο Άλεξ Μόρντβιντσεφ της ομάδας μας
with what happens if we try solving for x,
με το τι θα γίνει αν λύσουμε ως προς x,
που του έχετε μάθει τα πουλιά,
that you've trained on birds,
the same error-minimization procedure,
διαδικασία ελαχιστοποίησης σφάλματος
που έχει μάθει να αναγνωρίζει τα πουλιά,
trained to recognize birds,
generated entirely by a neural network
που φτιάχτηκε εξολοκλήρου
που έμαθε να αναγνωρίζει πουλιά,
rather than solving for y,
αντί ως προς y,
by Mike Tyka in our group,
από την ομάδα μας.
of William Kentridge's artworks,
του Γουίλιαμ Κέντριτζ,
με διάφορα ζώα από μια ομάδα,
over the space of different animals,
να αναγνωρίζει και να διακρίνει
to recognize and distinguish
morph from one animal to another.
από ένα ζώο σε άλλο.
have tried reducing
προσπάθησαν να μειώσουν τα y
από τον χώρο όλων των πραγμάτων
out of the space of all things
σε ολόκληρη αυτή την επιφάνεια,
over that entire surface,
you make a kind of map --
φτιάχνετε ένα είδος χάρτη -
που το δίκτυο ξέρει να αναγνωρίζει.
the network knows how to recognize.
"armadillo" is right in that spot.
το αρμαντίλο είναι σε αυτή τη θέση.
of networks as well.
και με άλλα είδη δικτύων.
to recognize faces,
σχεδιασμένο να αναγνωρίζει πρόσωπα,
in a y that says, "me,"
psychedelic picture of me
ψυχεδελική εικόνα μου
πολλαπλές απόψεις ταυτόχρονα
multiple points of view at once
to get rid of the ambiguity
να απορρίπτει την αμφισημία
or another pose,
another kind of lighting.
σε διαφορετικό φωτισμό.
this sort of reconstruction,
μια τέτοια ανακατασκευή,
of different points of view,
από διαφορετικές απόψεις
his own face as a guide image
το δικό του πρόσωπο ως εικόνα-οδηγό
to reconstruct my own face.
στην ανακατασκευή του προσώπου μου.
της διαδικασίας βελτιστοποίησης.
that optimization process.
πολύ πιο συναφές ως πρόσωπο,
more like a coherent face,
το δικό μου πρόσωπο.
with a blank canvas
that is itself already some other image.
που είναι ήδη μια άλλη εικόνα το ίδιο.
that is designed to categorize
σχεδιασμένο να ταξινομεί
ανθρώπινες κατασκευές, ζώα...
man-made structures, animals ...
with just a picture of clouds,
με μια εικόνα από σύννεφα,
what it sees in the clouds.
τι βλέπει μέσα στα σύννεφα.
you spend looking at this,
βρίσκετε κι εσείς μέσα στα σύννεφα.
will see in the clouds.
to hallucinate into this,
με τα πρόσωπα να οραματιστεί εδώ,
zooms hallucinates, zooms.
οραματίζεται, ζουμάρει.
of the network, I suppose,
θα έλεγα σαν ένα είδος αντίστιξης,
is eating its own tail.
τρώει την ίδια του την ουρά.
μας κάνει να σκεφτόμαστε,
What do I think I see next?"
Τι νομίζω ότι βλέπω μετά;»
δημόσια σε μια ομάδα
called "Higher Education" --
που λεγόταν «Ανώτερη Εκπαίδευση» -
marijuana was legalized.
is not constrained.
ότι αυτή η τεχνολογία δεν περιορίζεται.
because they're really fun to look at.
επειδή είναι πιο ευχάριστα.
Ρος Γκούντγουιν,
a camera that takes a picture,
με μια κάμερα που παίρνει φωτογραφίες,
writes a poem using neural networks,
γράφει ποιήματα μέσα από νευρωνικά δίκτυα,
has been trained
έχει εκπαιδευτεί
are very intimately connected.
είναι πολύ στενά συνδεδεμένες.
να διακρίνουν,
things in the world,
διαφορετικά πράγματα στον κόσμο,
να δημιουργούν.
που συμπεραίνω από αυτό
Michelangelo really did see
any being, any alien
κάθε εξωγήινος,
perceptual acts of that sort
τέτοιου είδους πράξεις αντίληψης,
machinery that's used in both cases.
χρησιμοποιείται και στις δύο περιπτώσεις.
and creativity are by no means
και η δημιουργικότητα
αποκλειστικά κάτι ανθρώπινο.
that can do exactly these sorts of things.
που μπορούν να κάνουν ακριβώς το ίδιο.
the brain is computational.
το μυαλό κάνει υπολογισμούς.
in designing intelligent machinery.
στο σχεδιασμό ευφυών μηχανημάτων.
να κάνουμε τις μηχανές ευφυείς.
of those early pioneers,
εκείνων των πρωτοπόρων,
is not just about accounting
δεν αφορούν μόνο τα λογιστικά,
we modeled them after our minds.
κατ' εικόναν του μυαλού μας.
to understand our own minds better
να καταλάβουμε το μυαλό μας καλύτερα
ABOUT THE SPEAKER
Blaise Agüera y Arcas - Software architectBlaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces.
Why you should listen
Blaise Agüera y Arcas is principal scientist at Google, where he leads a team working on machine intelligence for mobile devices. His group works extensively with deep neural nets for machine perception and distributed learning, and it also investigates so-called "connectomics" research, assessing maps of connections within the brain.
Agüera y Arcas' background is as multidimensional as the visions he helps create. In the 1990s, he authored patents on both video compression and 3D visualization techniques, and in 2001, he made an influential computational discovery that cast doubt on Gutenberg's role as the father of movable type.
He also created Seadragon (acquired by Microsoft in 2006), the visualization technology that gives Photosynth its amazingly smooth digital rendering and zoom capabilities. Photosynth itself is a vastly powerful piece of software capable of taking a wide variety of images, analyzing them for similarities, and grafting them together into an interactive three-dimensional space. This seamless patchwork of images can be viewed via multiple angles and magnifications, allowing us to look around corners or “fly” in for a (much) closer look. Simply put, it could utterly transform the way we experience digital images.
He joined Microsoft when Seadragon was acquired by Live Labs in 2006. Shortly after the acquisition of Seadragon, Agüera y Arcas directed his team in a collaboration with Microsoft Research and the University of Washington, leading to the first public previews of Photosynth several months later. His TED Talk on Seadragon and Photosynth in 2007 is rated one of TED's "most jaw-dropping." He returned to TED in 2010 to demo Bing’s augmented reality maps.
Fun fact: According to the author, Agüera y Arcas is the inspiration for the character Elgin in the 2012 best-selling novel Where'd You Go, Bernadette?
Blaise Agüera y Arcas | Speaker | TED.com