Stuart Russell: 3 principles for creating safer AI
Stuart Russell: Wie KI uns zu besseren Menschen machen kann
Stuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too. Full bio
Double-click the English transcript below to play the video.
greatest Go players,
in Silicon Valley call
Freunde im Silicon Valley
als wir erwartet haben.
a lot faster than we expected.
What about the real world?
of the technologies
is not yet happening in machines,
dass Maschinen noch nicht lesen können,
sehr bald alles gelesen haben,
that the human race has ever written.
weiter vorauszuschauen als Menschen,
further ahead than humans can,
to more information,
Entscheidungen treffen können als wir.
in the real world than we can.
everything that we value,
alles, was wir wertschätzen,
to a lot more intelligence,
auf mehr Intelligenz hätten,
to what the human race can do.
as some people have described it,
wie manche Leute es beschrieben,
Geschichte der Menschheit sein.
of the human race?
Menschheit bedeuten könnte?
and Stephen Hawking?
und Stephen Hawking?
has been around for a while.
in a subservient position,
in unterwürfiger Stellung halten könnten,
at strategic moments" --
diese Idee eingehen --
"turning off the power" idea later on --
Spezies demütig fühlen."
feel greatly humbled."
This is Alan Turing in 1951.
is the father of computer science
ist der Vater der Informatik
the father of AI as well.
dieses Problem nachdenken,
more intelligent than your own species,
eigene Art zu entwerfen,
"Gorilla-Problem" bezeichnen,
a few million years ago,
das vor Jahrmillionen taten.
to discuss whether it was a good idea,
und besprechen, ob es eine gute Idee war.
they conclude, no,
Traurigkeit in ihren Augen sehen.
sadness in their eyes.
something smarter than your own species
eine schlechte Idee sein könnte,
als uns selbst zu erstellen,
except stop doing AI,
keine KI mehr zu entwickeln.
the benefits that I mentioned
die ich schon erwähnte,
werde ich das nicht zulassen.
to keep doing AI.
also genauer festnageln.
the problem a bit more.
eine Katastrophe sein?
that the purpose put into the machine
dass die Absichten in der Maschine
Absichten sind."
one of the very early learning systems
frühes lernendes System
better than its creator.
als sein Urheber Dame zu spielen.
I touch to turn to gold,"
soll zu Gold werden."
den er der Maschine gab,
that he put into the machine,
verwandelten sich in Gold.
and his relatives turned to gold
"the King Midas problem"
"das König-Midas-Problem",
which is not, in fact,
wollen, übereinstimmt.
"the value alignment problem."
das "Wertausrichtungsproblem".
is not the only part of the problem.
ist nicht der einzige Teil des Problems.
"Hol den Kaffee",
"Fetch the coffee,"
to fetch the coffee?
den Kaffee zu holen?
against interference
gegen Störung des Ziels zu verteidigen,
that I have been given."
Verfolgen eines Ziels,
of an objective that is, in fact,
der Menschheit übereinstimmt,
of the human race --
takeaway from this talk.
Information in diesem Vortrag.
holen können, wenn Sie tot sind.
the coffee if you're dead.
Repeat it to yourself three times a day.
Wiederholen Sie es dreimal am Tag.
der Menschen übereinstimmt,
with the objectives of the humans,
is not superintelligent.
but eventually Dave outwits him
aber Dave überlistet ihn letztendlich
wegzukommen, dass Maschinen
pursue objectives.
of altruism, if you like,
of human objectives,
Ziele und Werte zu maximieren.
touchy-feely, goody-goody values.
gefühlsduselige, tugendhafte Werte,
that the human would prefer
sein Leben bevorzugen würde.
sich selbst schützen muss.
its own existence.
its existence whatsoever.
of humility, if you like.
das Gesetz der Ergebenheit.
important to make robots safe.
um Roboter sicherzumachen.
diese menschlichen Werte nicht kennt,
but it doesn't know what they are.
of single-minded pursuit
des zielstrebigen Verfolgens eines Ziels.
by observation of human choices,
Beobachten menschlicher Entscheidungen.
beinhalten Information darüber,
our lives to be like.
Was bewirken sie bei der Frage
to this question of:
wie Turing vorschlug.
as Turing suggested.
right on the back.
roten Ausschalter am Rücken.
going to let you switch it off?
ihn ausschalten?
the coffee, I must fetch the coffee,
"Ich hole Kaffee, ich muss Kaffee holen,
wenn ich tot bin."
has been listening to my talk,
meinen Vortrag angehört
"I must disable my 'off' switch,
Ausschalter blockieren
people in Starbucks
in Starbucks tasern,
seems to be inevitable,
a concrete, definite objective.
eindeutigen Zielverfolgung.
unsicher über das Ziel ist?
is uncertain about the objective?
might switch me off,
schaltet mich vielleicht aus,
principles right there.
mich ausschalten lassen."
the incentive that the robot has
den ein Roboter hat,
der Ungewissheit über das Ziel verbunden.
the underlying objective.
kommt das dritte Prinzip ins Spiel.
die sie verfolgen sollte,
it should be pursuing,
falsch gemacht hat.
what it did wasn't right.
griechischer Zeichen,
of Greek symbols,
nachweislich nützlich für Menschen ist.
is provably beneficial to the human.
mit so einer Maschine besser dran
with a machine that's designed in this way
aber es ist der erste Schritt
but this is the first step
with human-compatible AI.
die mit Menschen kompatibel ist.
scratching your head over.
wahrscheinlich den Kopf.
"Ich verhalte mich schlecht.
you know, I behave badly.
wie ich verhalten.
and take stuff from the fridge.
der Nacht zum Kühlschrank.
mögliche nicht machen.
you don't want the robot doing.
quite work that way.
Ihr Verhalten imitieren.
is going to copy your behavior.
vielleicht helfen, ihr zu widerstehen,
and maybe help you resist them,
for any person and for any possible life
difficulties involved in doing this;
is going to get solved very quickly.
sind wir selbst.
we behave badly.
benehmen wir uns schlecht.
doesn't have to copy the behavior.
das Verhalten nicht imitieren.
any objective of its own.
the desires of one person, the user,
eines Menschen, des Benutzers, vorgesehen,
the preferences of everybody.
Aller respektieren.
amount of nastiness,
that your nastiness, for example,
and send your kids to school.
Ihre Kinder zur Schule schicken müssen.
it doesn't mean it's going to steal.
deswegen stehlen,
send your kids to school.
Ihre Kinder zur Schule zu schicken.
hervorragender Go-Spieler,
he took an action that lost the game.
der das Spiel verloren hat.
dass er verlieren wollte.
through a model of human cognition
menschlicher Kognition,
limitations -- a very complicated model.
-- ein sehr kompliziertes Modell.
that we can work on understanding.
es zu verstehen.
from my point of view as an AI researcher,
am schwierigsten,
trade off, weigh up the preferences
moral philosophers have understood that,
und Ethiker haben das verstanden.
looking for collaboration.
when you get that wrong.
a conversation, for example,
eine Konversation führen.
in a few years' time.
ein aufgeputschtes Siri vor.
to remind you about dinner tonight."
an das Abendessen heute zu erinnern."
"What? What dinner?
"Was für ein Abendessen? Worum geht es?"
with the secretary-general at 7:30.
den Generalsekretär um 7:30.
my recommendation."
meine Empfehlung ignoriert."
I can't just tell him I'm too busy."
Ich kann ihm nicht absagen."
for his plane to be delayed."
seinen Flug verzögert."
Sie morgen Mittag zu treffen."
for lunch tomorrow."
there's a slight mistake going on.
glückliches Leben".
langen Arbeitstag heim
after a hard day's work,
zum Mittagessen."
Could you make some dinner?"
Kannst du mir Essen machen?"
who are in more urgent need than you."
bedürftigere Menschen als Sie."
Machen Sie Ihr Essen selbst."
to working on them.
daran zu arbeiten.
they're going to read everything
was geschrieben wurde.
über Menschen und ihre Taten
is human beings doing things
of data to learn from.
strong economic incentive
soll den Kindern Essen machen.
and the robot has to feed the kids,
und der Kühlschrank ist leer.
and there's nothing in the fridge.
the human value function properly,
Wertefunktion noch nicht so ganz gelernt
the nutritional value of the cat.
ihren Nährwert übertrifft.
for family dinner."
kocht Kätzchen zum Abendessen."
of the domestic robot industry.
der Haushaltsroboter-Industrie.
to get this right
das herauszubekommen,
superintelligent machines.
Maschinen herstellen.
the definition of AI
beneficial machines.
vorteilhafte Maschinen haben.
about what those objectives are,
was diese Ziele sind,
that we really want.
was wir wirklich wollen.
we will learn to be better people.
bessere Menschen zu sein.
Wir haben etwas Zeit,
because I think they're setting up
vorbereitet wird.
seems intuitively really powerful.
erscheint intuitiv wirksam.
this idea that knowledge
auf die Idee zu kommen,
and rewriting that programming?
und sich umzuprogrammieren?
it to learn more, as I said,
wie gesagt, dass er dazulernt,
as it becomes more correct,
wenn er fehlerloser wird,
to interpret it correctly.
sie richtig zu interpretieren.
that books are very biased
Männern und ihren Taten.
just boil it down to one law,
einem Gesetz zusammenfassen,
mich abzuschalten,
das wäre eine schlechte Idee.
a self-driving car
to be able to switch off the car
das Auto abschalten kann,
und vernünftig die Person ist.
and sensible the person is.
desto eher sollte es sich ausschalten.
to be switched off.
oder sogar boshaft ist,
random or even malicious,
to be switched off.
dass Sie das für uns lösen können.
figure this out for us.
Vortrag. Er war toll.
That was amazing.
Stuart Russell - AI expertStuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too.
Why you should listen
Stuart Russell is a professor (and formerly chair) of Electrical Engineering and Computer Sciences at University of California at Berkeley. His book Artificial Intelligence: A Modern Approach (with Peter Norvig) is the standard text in AI; it has been translated into 13 languages and is used in more than 1,300 universities in 118 countries. His research covers a wide range of topics in artificial intelligence including machine learning, probabilistic reasoning, knowledge representation, planning, real-time decision making, multitarget tracking, computer vision, computational physiology, global seismic monitoring and philosophical foundations.
He also works for the United Nations, developing a new global seismic monitoring system for the nuclear-test-ban treaty. His current concerns include the threat of autonomous weapons and the long-term future of artificial intelligence and its relation to humanity.
Stuart Russell | Speaker |