Blaise Agüera y Arcas: How computers are learning to be creative
ブレイス・アグエラ・ヤルカス: コンピューターはこうしてクリエイティブになる
Blaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces. Full bio
Double-click the English transcript below to play the video.
開発チームを率いています
that works on machine intelligence;
of making computers and devices
いろいろな種類の端末に
持たせるための技術です
that brains do.
人間の脳の働きや
interested in real brains
in the things that our brains do
はるかに優れている領域に
to the performance of computers.
古くから認識されていたのは 知覚です
has been perception,
out there in the world --
本質的に備わっている能力ですが
機械知覚アルゴリズムは
for example, that our team makes,
on Google Photos to become searchable,
検索できるようにする技術です
創造性があります
何かの形で世に生み出すことです
out there into the world.
our work on machine perception
機械知覚への取り組みの中で
with the world of machine creativity
「機械芸術」の世界との
had a penetrating insight
先見の明があり
見ていたのだと思います
between perception and creativity.
has a statue inside of it,
その像を見出すことである」
is to discover it."
Michelangelo was getting at
創造しているということで
is an act of imagination
and perceiving and imagining,
with a brief bit of history
the heart or the intestines,
about a brain by just looking at it,
分からないことが多いからです
of this thing all kinds of fanciful names,
しゃれた名前を付けました
これは タツノオトシゴのことです
doesn't tell us very much
ほとんど何も示していません
本当の知見を初めて得たのは
developed some kind of insight
スペイン人神経解剖学者
Santiago Ramón y Cajal,
選択的に染める特殊な染料を使って
or render in very high contrast
非常にはっきりした形で
進むようになりました
their morphologies.
that he made of neurons
神経のイメージは
of different sorts of cells,
多様な細胞があります
was quite new at this point.
ごく新しいものでした
very, very long distances --
非常に長く伸びうるのですが
to some people in the 19th century;
一目瞭然だったかもしれません
were just getting underway.
配線が普及し始めた時代だったからです
of Ramón y Cajal's, like this one,
微細解剖学的な図は
完成させようと試み続けています
that Ramón y Cajal started.
生のデータです
of Neuroscience.
可視化するということです
is about one cubic millimeter in size,
1立方ミリメートルで
very small piece of it here.
そのごく一部です
1ミクロンです
バクテリアと同程度です
tiny block of tissue.
平均約100ミクロンです
of hair is about 100 microns.
much, much smaller
髪の毛の直径よりも
electron microscopy slices,
連続断面像から
再構成できます
in 3D of neurons that look like these.
したのと同じように
style as Ramón y Cajal.
be able to see anything here.
あまりに密集していて
one neuron to another.
時代の先を行っていて
ahead of his time,
ゆっくりと進んでいきました
over the next few decades.
電気を使っていることが発見され
was advanced enough
生きたニューロンを使って
experiments on live neurons
技術が進歩しました
when computers were being invented,
コンピューターも発明されましたが
アイデアに基づいていました
of modeling the brain --
as Alan Turing called it,
アラン・チューリングは
ウォルター・ピッツが
looked at Ramón y Cajal's drawing
視覚野の図に 目を向けました
imagery that comes from the eye.
処理する皮質です
like a circuit diagram.
回路図のように見えました
in McCulloch and Pitts's circuit diagram
細かい部分には
of computational elements
計算要素のように働き
one to the next in a cascade,
受け渡していくという概念は
visual information would need to do.
説明しようと思います
for us to do with our brains.
この処理を簡単にやってのけますが
that for a computer,
just a few years ago.
this task is easy to do.
and the word "bird,"
connected to each other
inside our visual cortices,
視覚野内に生物学的なものとして存在し
to have the capability
on the computer.
that actually looks like.
about as a first layer of neurons,
第1層を示しています
how it works in the eye --
次々と受け渡され
after another layer of neurons,
of different weights.
シナプスでつながれています
of all of those synapses.
強さによって変わり
properties of this network.
計算的特徴を決めます
or a small group of neurons
those three things --
in the neural network,
ニューラルネットワーク内のシナプス
「x」「w」「y」と置きましょう
these synapses in the neural network.
結合強度を表します
出力である
is just a simple formula,
成立すると仮定します
going on there, of course,
of mathematical operations.
数学的な計算だからです
that if you have one equation,
3つの変数のうち 2つの値が分かれば
by knowing the other two things.
that the picture of a bird is a bird,
ということでした
and w and x are known.
xとwが分かっています
you know the pixels.
与えられています
a relatively straightforward problem.
比較的単純な問題です
答えは出ます
and you're done.
ニューラルネットワークでは
doing exactly that.
on a mobile phone,
リアルタイムで処理をしています
amazing in its own right,
数十億~数兆の命令を
billions and trillions of operations
picture of a bird,
鳥の画像に対し
"Yes, it's a bird,"
「これは鳥だ」と言うだけでなく
with a network of this sort.
特定しているところです
and the y is the unknown.
difficult part, of course,
do we figure out the w,
どうやって求めたらいいのか
of solving for w,
wを解くという問題は
with the simple equation
この演算子です
it's the inverse to multiplication,
掛け算の逆演算だからです
very non-linear operation;
to solve the equation
is fairly straightforward.
a little algebra trick,
to the right-hand side of the equation.
about it as an error.
for w the right way,
to minimize the error,
推量をします
コンピューターは大得意です
computers are very good at.
sort of play Marco Polo,
successive approximations to w.
ありませんが
but after about a dozen steps,
which is close enough.
十分近い値が求まります
a lot of known x's and known y's
既知の xとyに対し
真ん中の wの値を求めるということです
through an iterative process.
that we do our own learning.
同じやり方です
たくさんの絵を見せられ
this is not a bird."
教わります
for those neural connections.
神経結合を作り出すんです
x and w fixed to solve for y;
y を求めるというのは
先ほど考えましたが
ずっと難しいことです
あるからです
Alex Mordvintsev, on our team,
アレックス・モードヴィンツェフは
with what happens if we try solving for x,
x の値を求めるとどうなるか
ニューラルネットが
that you've trained on birds,
ということです
同じ誤差最小化の手順が
the same error-minimization procedure,
trained to recognize birds,
分かりました
generated entirely by a neural network
ニューラルネットワークによって
rather than solving for y,
by Mike Tyka in our group,
作ってくれたものです
of William Kentridge's artworks,
思わせます
スケッチを描いては消し
yの値を変えていて
over the space of different animals,
to recognize and distinguish
設計された
morph from one animal to another.
動物が別の動物へと変形していきます
have tried reducing
協力して作ったもので
収めようと試みていて
out of the space of all things
全てを含む空間の
over that entire surface,
画面全体にわたって行うことで
you make a kind of map --
the network knows how to recognize.
視覚地図です
"armadillo" is right in that spot.
あそこにアルマジロがいますね
同様の処理が実行できます
of networks as well.
to recognize faces,
ネットワークです
in a y that says, "me,"
xの値を求めると
画像が作られます
psychedelic picture of me
サイケな感じの 私の絵です
1つにまとめています
1つになっている理由は
multiple points of view at once
設計になっているためです
to get rid of the ambiguity
or another pose,
見る角度によって変わり
another kind of lighting.
変わります
this sort of reconstruction,
統計値がないと
of different points of view,
his own face as a guide image
最適化プロセスで
to reconstruct my own face.
ガイドとして使っています
改善するために
that optimization process.
more like a coherent face,
顔をガイドとして使うことで
できるようになります
with a blank canvas
始める必要はありません
that is itself already some other image.
出発してもいいんです
お見せしましょう
that is designed to categorize
man-made structures, animals ...
設計されたネットワークです
with just a picture of clouds,
what it sees in the clouds.
「雲の中に何が見えるか」を探します
you spend looking at this,
will see in the clouds.
見えてきます
幻覚っぽい映像になります
to hallucinate into this,
zooms hallucinates, zooms.
of the network, I suppose,
自分の尻尾を食べています
is eating its own tail.
次のイメージのベースになっています
What do I think I see next?"
次に 何が見える?」という風に
このデモを 最初に披露したのは
called "Higher Education" --
「高等教育」と題した講演会で
直後のことでした
marijuana was legalized.
限定されないことを指摘しておきます
is not constrained.
because they're really fun to look at.
紹介しましたが
というわけではないんです
ロス・グッドウィンによる実験ですが
a camera that takes a picture,
writes a poem using neural networks,
背負っているコンピューターが
詩を書きます
has been trained
トレーニングされています
are very intimately connected.
密接に結びついているんです
ニューラルネットワークは
things in the world,
新しいものを作り出すこともできます
Michelangelo really did see
any being, any alien
地球外生命体だろうと
perceptual acts of that sort
machinery that's used in both cases.
できることだからです
and creativity are by no means
コンピューターモデルを作り始めています
that can do exactly these sorts of things.
the brain is computational.
脳もまた計算機械だからです
in designing intelligent machinery.
知的機械の設計から始まり
という発想から
夢見た世界を
of those early pioneers,
is not just about accounting
遊ぶだけのものではありません
人間の脳をモデルとしたものでしたが
we modeled them after our minds.
to understand our own minds better
よりよく理解するためにも
使えるのです
ABOUT THE SPEAKER
Blaise Agüera y Arcas - Software architectBlaise Agüera y Arcas works on machine learning at Google. Previously a Distinguished Engineer at Microsoft, he has worked on augmented reality, mapping, wearable computing and natural user interfaces.
Why you should listen
Blaise Agüera y Arcas is principal scientist at Google, where he leads a team working on machine intelligence for mobile devices. His group works extensively with deep neural nets for machine perception and distributed learning, and it also investigates so-called "connectomics" research, assessing maps of connections within the brain.
Agüera y Arcas' background is as multidimensional as the visions he helps create. In the 1990s, he authored patents on both video compression and 3D visualization techniques, and in 2001, he made an influential computational discovery that cast doubt on Gutenberg's role as the father of movable type.
He also created Seadragon (acquired by Microsoft in 2006), the visualization technology that gives Photosynth its amazingly smooth digital rendering and zoom capabilities. Photosynth itself is a vastly powerful piece of software capable of taking a wide variety of images, analyzing them for similarities, and grafting them together into an interactive three-dimensional space. This seamless patchwork of images can be viewed via multiple angles and magnifications, allowing us to look around corners or “fly” in for a (much) closer look. Simply put, it could utterly transform the way we experience digital images.
He joined Microsoft when Seadragon was acquired by Live Labs in 2006. Shortly after the acquisition of Seadragon, Agüera y Arcas directed his team in a collaboration with Microsoft Research and the University of Washington, leading to the first public previews of Photosynth several months later. His TED Talk on Seadragon and Photosynth in 2007 is rated one of TED's "most jaw-dropping." He returned to TED in 2010 to demo Bing’s augmented reality maps.
Fun fact: According to the author, Agüera y Arcas is the inspiration for the character Elgin in the 2012 best-selling novel Where'd You Go, Bernadette?
Blaise Agüera y Arcas | Speaker | TED.com