Stuart Russell: 3 principles for creating safer AI
スチュワート・ラッセル: 安全なAIのための3原則
Stuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too. Full bio
Double-click the English transcript below to play the video.
碁打ちの1人ですが
greatest Go players,
友人たちなら
in Silicon Valley call
瞬間を迎えています
ずっと早く
a lot faster than we expected.
気付いた瞬間です
実際の世の中ではどうでしょう?
What about the real world?
ずっと複雑で
違いはありません
of the technologies
まだなっていないことに
is not yet happening in machines,
触れていましたが
できるようになるでしょう
すべてのものを
that the human race has ever written.
further ahead than humans can,
見通す力と合わせ
触れられるようになることで
to more information,
in the real world than we can.
判断ができるようになるでしょう
なのでしょうか?
我々が価値を置くすべては
everything that we value,
拠り所としています
to a lot more intelligence,
使えるようになったなら
to what the human race can do.
限界はないでしょう
as some people have described it,
なるかもしれません
意味するかもしれない」などと
of the human race?
なのでしょうか?
and Stephen Hawking?
ホーキングが言っているだけなのか?
has been around for a while.
この考えは結構前からありました
言葉があります
といったことによって
in a subservient position,
保てたとしても —
at strategic moments" --
後でまた戻ってきます —
"turning off the power" idea later on --
謙虚に捉えるべきである」
feel greatly humbled."
1951年に言ったことです
This is Alan Turing in 1951.
コンピューター科学の父であり
is the father of computer science
the father of AI as well.
AIの父でもあります
more intelligent than your own species,
生み出してしまうという問題ですが
良いかもしれません
ゴリラの祖先がそうしているからで
a few million years ago,
尋ねることができます
to discuss whether it was a good idea,
議論するために 集まっていますが
they conclude, no,
出した結論は
というものです
ひどい苦境に置かれていると
見て取れるでしょう
sadness in their eyes.
something smarter than your own species
生み出すのは
という不安な感覚があります
何ができるのでしょう?
except stop doing AI,
ないかもしれませんが
the benefits that I mentioned
という理由によって
ありません
to keep doing AI.
思っています
明確にする必要があるでしょう
the problem a bit more.
なぜなのか?
引用があります
that the purpose put into the machine
確信があるものにする必要がある」
1960年に言ったことで
one of the very early learning systems
指すのを見た すぐ後のことです
better than its creator.
言葉だったとしても
金になってほしい」と望み
I touch to turn to gold,"
叶えられました
that he put into the machine,
みんな金に変わってしまい
and his relatives turned to gold
死んでいきました
目的を掲げることを
"the King Midas problem"
which is not, in fact,
「価値整合の問題」と言います
"the value alignment problem."
問題のすべてではありません
is not the only part of the problem.
"Fetch the coffee,"
機械に与えたとします
どんな状況がありうるだろう?
to fetch the coffee?
切るかもしれない
手を打たなければ
無効にしておこう
against interference
自分を守るためであれば
that I have been given."
一途に追求すると
of an objective that is, in fact,
沿わなくなるというのが
of the human race --
価値ある教訓です
takeaway from this talk.
それは —
the coffee if you're dead.
ということです
Repeat it to yourself three times a day.
記憶して1日3回唱えてください
with the objectives of the humans,
超知的ではありませんでした
is not superintelligent.
but eventually Dave outwits him
主人公が出し抜いて
ないかもしれません
pursue objectives.
of altruism, if you like,
人間にとって価値あることが
of human objectives,
ようにすることです
touchy-feely, goody-goody values.
善人ぶった崇高そうな価値ではありません
that the human would prefer
望むものということです
というアシモフの原則に反します
its own existence.
its existence whatsoever.
まったく関心を持たないのです
言うなれば「謙虚の原則」です
of humility, if you like.
非常に重要であることがわかります
important to make robots safe.
知らないものとしています
but it doesn't know what they are.
知らないということです
一途に追求することの問題を
of single-minded pursuit
極めて重要なのです
大まかな理解は必要です
人間の選択を観察することで得ます
by observation of human choices,
何かという情報が
our lives to be like.
明かされるわけです
「機械のスイッチを切れるか」という問題に
to this question of:
as Turing suggested.
見てみましょう
「オフ」スイッチがあります
right on the back.
切らせてくれるかということです
going to let you switch it off?
the coffee, I must fetch the coffee,
という目的に対し
「死んだらコーヒーを取ってこれない」と考え
has been listening to my talk,
と判断し
"I must disable my 'off' switch,
他の客はみんな
people in Starbucks
となります
ように見えます
不可避に見え
seems to be inevitable,
a concrete, definite objective.
目的があることから来ています
確信がないとしたら どうなるでしょう?
is uncertain about the objective?
might switch me off,
切るかもしれないが
悪いことをしたときだけだ
よく分からないけど
効いています
principles right there.
人間に許すべきだ」
the incentive that the robot has
スイッチを切ることを許す
計算することができ
the underlying objective.
何かを学びます
it should be pursuing,
学ぶのです
what it did wasn't right.
of Greek symbols,
人間にとって有益であるという定理を
is provably beneficial to the human.
そうでないものより良い結果になると
with a machine that's designed in this way
but this is the first step
第一歩です
with human-compatible AI.
と思います
scratching your head over.
見上げたものではない
you know, I behave badly.
振る舞って欲しくはない
冷蔵庫から食べ物を失敬したり
and take stuff from the fridge.
しているから」
you don't want the robot doing.
様々なことがあります
働くわけではありません
quite work that way.
というわけではありません
is going to copy your behavior.
動機を理解して
and maybe help you resist them,
してくれるかもしれません
for any person and for any possible life
ということです
どちらを好むのか?
たくさんあって
difficulties involved in doing this;
思っていません
is going to get solved very quickly.
私たちにあります
まずい振る舞いをします
we behave badly.
悪質でさえあります
doesn't have to copy the behavior.
真似する必要はありません
というのを持ちません
any objective of its own.
the desires of one person, the user,
満たそうとするのではなく
デザインされています
the preferences of everybody.
悪いことも扱え
amount of nastiness,
理解できます
that your nastiness, for example,
賄賂を受け取っているけれど
子供を学校に行かせるためなのだとか
and send your kids to school.
そのために盗みをするわけではありません
it doesn't mean it's going to steal.
手助けをするだけです
send your kids to school.
限界があります
素晴らしい碁打ちですが
he took an action that lost the game.
手を打ったのが分かるでしょう
望んだことを意味しません
through a model of human cognition
逆にたどる必要がありますが
limitations -- a very complicated model.
とても複雑なモデルです
that we can work on understanding.
取り組めるものではあります
from my point of view as an AI researcher,
最も難しいと思える部分は
沢山いるということです
トレードオフを考え
trade off, weigh up the preferences
比較考量する必要があり
やり方があります
moral philosophers have understood that,
そういうことを分かっており
looking for collaboration.
探っています
when you get that wrong.
どうなるか見てみましょう
a conversation, for example,
考えてみます
なるかもしれません
in a few years' time.
奥様から確認の電話がありました」と言います
to remind you about dinner tonight."
「何のディナーだって?
"What? What dinner?
夜7時の」
事務総長と会わなきゃならない
with the secretary-general at 7:30.
なったんだ?」
あなたは推奨案を無視されました」
my recommendation."
忙しくて行けないなんて言えないぞ」
I can't just tell him I'm too busy."
事務総長の飛行機が遅れるように手配済みです」
for his plane to be delayed."
細工しておきました」
楽しみにしている とのことです」
for lunch tomorrow."
there's a slight mistake going on.
ちょっと行き違いが起きています
妻の価値観に従っています
あり得ます
コンピューターが言います
after a hard day's work,
Could you make some dinner?"
何か夕食を作ってもらえるかな?」
ならないことがあります」
who are in more urgent need than you."
必要に迫られている人々がいます」
夕食はご自分で作ってください」
解かなければなりません
to working on them.
楽しみです
理由があります
they're going to read everything
読むことになるでしょう
is human beings doing things
他の人がそれに腹を立てたというものです
of data to learn from.
strong economic incentive
存在します
想像してください
ロボットは子供達に食べさせなければなりません
and the robot has to feed the kids,
and there's nothing in the fridge.
冷蔵庫は空っぽです
猫に目を止めます
the human value function properly,
ちゃんと学んでいないため
the nutritional value of the cat.
理解しません
子猫を料理して夕食に出す」
for family dinner."
見ることになります
of the domestic robot industry.
家事ロボット産業はお終いです
ずっと以前に
to get this right
大きなインセンティブが働きます
superintelligent machines.
the definition of AI
得られるよう試みています
beneficial machines.
達成しようとするが
確信を持たず
about what those objectives are,
観察することで
that we really want.
ということです
学ぶことを望みます
we will learn to be better people.
スチュワート
準備があるので
because I think they're setting up
seems intuitively really powerful.
とても強力であるように思えます
文献を読んで
良いと気付き
this idea that knowledge
プログラムを書き換えてしまう —
ならないためには
and rewriting that programming?
良いのでしょう?
it to learn more, as I said,
ほしいと思っています
as it becomes more correct,
確信を強めます
あるわけですから
デザインするのです
to interpret it correctly.
that books are very biased
理解するでしょう
エリートの白人男性がしたことばかり
学べは学ぶほど
有用なものになるでしょう
just boil it down to one law,
まとめられないんですか?
a self-driving car
送るところを
5歳児が
to be able to switch off the car
したいと思いますか?
分別があるかを理解する必要があります
and sensible the person is.
高くなります
to be switched off.
悪意ある人間に対しては
random or even malicious,
しないでしょう
to be switched off.
この問題を解決してくれることを切に望みます
figure this out for us.
素晴らしいお話でした
That was amazing.
ABOUT THE SPEAKER
Stuart Russell - AI expertStuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too.
Why you should listen
Stuart Russell is a professor (and formerly chair) of Electrical Engineering and Computer Sciences at University of California at Berkeley. His book Artificial Intelligence: A Modern Approach (with Peter Norvig) is the standard text in AI; it has been translated into 13 languages and is used in more than 1,300 universities in 118 countries. His research covers a wide range of topics in artificial intelligence including machine learning, probabilistic reasoning, knowledge representation, planning, real-time decision making, multitarget tracking, computer vision, computational physiology, global seismic monitoring and philosophical foundations.
He also works for the United Nations, developing a new global seismic monitoring system for the nuclear-test-ban treaty. His current concerns include the threat of autonomous weapons and the long-term future of artificial intelligence and its relation to humanity.
Stuart Russell | Speaker | TED.com