Stuart Russell: 3 principles for creating safer AI
סטוארט ראסל: איך בינה מלאכותית עשויה להפוך אותנו לאנשים טובים יותר
Stuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too. Full bio
Double-click the English transcript below to play the video.
greatest Go players,
in Silicon Valley call
שחבריי מעמק הסיליקון מכנים
a lot faster than we expected.
מתקדמת הרבה יותר מהר משציפינו.
What about the real world?
אבל מה עם העולם האמיתי?
of the technologies
is not yet happening in machines,
עדיין לא יודעות לקרוא,
that the human race has ever written.
כתבה אי פעם.
further ahead than humans can,
למה שבני האנוש מסוגלים לחזות,
to more information,
in the real world than we can.
מאיתנו בעולם האמיתי.
everything that we value,
to a lot more intelligence,
to what the human race can do.
שהאנושות תוכל לעשות.
as some people have described it,
כפי שאנשים מסוימים תיארו זאת,
of the human race?
and Stephen Hawking?
ביל גייטס וסטיבן הוקינג?
has been around for a while.
in a subservient position,
במכונות כבמשרתים בלבד,
at strategic moments" --
ברגעים קריטיים" --
"turning off the power" idea later on --
בהמשך --
feel greatly humbled."
This is Alan Turing in 1951.
אלן טורינג ב-1951.
is the father of computer science
the father of AI as well.
more intelligent than your own species,
a few million years ago,
עשו זאת לפני מיליוני שנה,
to discuss whether it was a good idea,
על טיב הדבר
they conclude, no,
sadness in their eyes.
את העצב הקיומי בעיניהן.
something smarter than your own species
שיצירת משהו שעולה עליך בחוכמתו
except stop doing AI,
חוץ מעצירת פיתוח ב''מ.
the benefits that I mentioned
to keep doing AI.
the problem a bit more.
את הבעיה טוב יותר.
עלולה להוות אסון?
that the purpose put into the machine
שהיעוד שאנחנו מטמיעים במכונה
one of the very early learning systems
באחת ממערכות הלמידה המוקדמות
better than its creator.
טוב מיוצרה.
I touch to turn to gold,"
שאגע בו יהפוך לזהב".
that he put into the machine,
and his relatives turned to gold
וכל קרוביו הפכו לזהב
"the King Midas problem"
which is not, in fact,
"the value alignment problem."
"בעיית תאום ערכים".
is not the only part of the problem.
אינה המרכיב היחיד של הבעיה.
"Fetch the coffee,"
"תביאי לי קפה",
to fetch the coffee?
להביא את הקפה?
against interference
כנגד מה שימנע ממני
that I have been given."
of an objective that is, in fact,
ביצוע המשימה, אשר
of the human race --
takeaway from this talk.
אותה אנו נקח מהרצאה זו.
the coffee if you're dead.
Repeat it to yourself three times a day.
שננו זאת לעצמכם שלוש פעמים ביום.
with the objectives of the humans,
משימות של בני האנוש,
is not superintelligent.
but eventually Dave outwits him
אבל לבסוף דייב מצליח להערים עליו
להיות ברי מזל באותה מידה.
pursue objectives.
לבצע משימות בצורה תבונתית.
of altruism, if you like,
of human objectives,
לערכים נשגבים של יפי נפש.
touchy-feely, goody-goody values.
that the human would prefer
its own existence.
על קיומו.
its existence whatsoever.
of humility, if you like.
הוא עקרון הענווה.
important to make robots safe.
ליצירת רובוטים בטוחים.
but it doesn't know what they are.
אבל הוא לא יודע מה הם.
of single-minded pursuit
by observation of human choices,
מצפיה בבחירות אנושיות,
our lives to be like.
to this question of:
as Turing suggested.
כפי שהציע טיורינג.
right on the back.
going to let you switch it off?
the coffee, I must fetch the coffee,
"אני חייב להביא את הקפה,
has been listening to my talk,
כמובן הקשיב להרצאתי
"I must disable my 'off' switch,
"אני חייב לנטרל את מתג הכיבוי שלי
people in Starbucks
בסטארבקס
seems to be inevitable,
a concrete, definite objective.
מוגדרת וסופית.
is uncertain about the objective?
לא בטוחה לגבי המשימה?
might switch me off,
עלול לכבות אותי,
principles right there.
העקרון הראשון והשני גם יחד.
לאפשר לבני אנוש לכבות אותי".
the incentive that the robot has
the underlying objective.
it should be pursuing,
שעליה לבצע,
what it did wasn't right.
היה לא נכון.
of Greek symbols,
is provably beneficial to the human.
הינו בהחלט מועיל לאנושות.
with a machine that's designed in this way
but this is the first step
אבל זה הצעד הראשון
with human-compatible AI.
עם ב''מ מותאמת אנושות.
scratching your head over.
you know, I behave badly.
"אני מתנהג לא כראוי.
and take stuff from the fridge.
ולוקח דברים מן המקרר.
you don't want the robot doing.
שהרובוט שלכם יעשה.
quite work that way.
is going to copy your behavior.
יעתיק את התנהגותכם.
and maybe help you resist them,
ואולי יעזור לכם להתנגד להם,
for any person and for any possible life
בעבור כל אדם ועבור כל מסלולי החיים
difficulties involved in doing this;
is going to get solved very quickly.
we behave badly.
doesn't have to copy the behavior.
להעתיק את התנהגותינו.
any objective of its own.
the desires of one person, the user,
של אדם אחד בלבד,המשתמש,
the preferences of everybody.
amount of nastiness,
רמה מסוימת של רוע,
that your nastiness, for example,
את ההתנהגות הרעה שלך.
לוקח שוחד בתור פקיד דרכונים,
and send your kids to school.
ולשלוח את ילדיך לביה''ס.
it doesn't mean it's going to steal.
אין זה אומר שהוא בעצמו יגנוב.
send your kids to school.
לשלוח את הילדים לב''ס.
he took an action that lost the game.
הוא עשה צעד שהוביל להפסד.
through a model of human cognition
limitations -- a very complicated model.
וזה מודל מסובך מאוד.
that we can work on understanding.
שאנחנו יכולים לנסות להבין.
from my point of view as an AI researcher,
trade off, weigh up the preferences
לנתב ולקחת בחשבון את העדפות
moral philosophers have understood that,
פילוסופים חוקרי מוסר הבינו זאת
looking for collaboration.
when you get that wrong.
כאשר לא מבינים את זה נכונה.
a conversation, for example,
in a few years' time.
to remind you about dinner tonight."
על ארוחת הערב".
"What? What dinner?
with the secretary-general at 7:30.
יש לי פגישה עם המנכ''ל ב- 19:30.
my recommendation."
I can't just tell him I'm too busy."
אני לא יכול פשוט לומר לו שאני עסוק."
for his plane to be delayed."
for lunch tomorrow."
there's a slight mistake going on.
גם לכיוון אחר.
after a hard day's work,
אחרי יום עבודה קשה
Could you make some dinner?"
who are in more urgent need than you."
שנזקקים הרבה יותר ממך."
to working on them.
they're going to read everything
is human beings doing things
of data to learn from.
שאפשר ללמוד ממנו.
strong economic incentive
and the robot has to feed the kids,
והרובוט חייב להאכיל את ילדיכם
and there's nothing in the fridge.
the human value function properly,
כיצד הערכים האנושיים עובדים,
the nutritional value of the cat.
רב על ערכו התזונתי.
for family dinner."
מבשל את החתול לארוחת ערב משפחתית".
of the domestic robot industry.
של תעשיית רובוטים ביתיים.
to get this right
superintelligent machines.
the definition of AI
beneficial machines.
about what those objectives are,
that we really want.
על מה שאנחנו רוצים באמת.
we will learn to be better people.
נלמד להיות אנשים טובים יותר.
זה כל כך מעניין, סטוארט.
because I think they're setting up
כי אני חושב שהמארגנים מתכוננים
seems intuitively really powerful.
מרגיש ממש עוצמתי.
this idea that knowledge
and rewriting that programming?
it to learn more, as I said,
כפי שאמרתי,
as it becomes more correct,
רק כשזה יהיה נכון יותר
to interpret it correctly.
that books are very biased
שעושים כל מיני דברים.
just boil it down to one law,
a self-driving car
to be able to switch off the car
לכבות את הרכב
and sensible the person is.
הנוסע נבון והגיוני.
to be switched off.
random or even malicious,
או אפילו זדוני,
to be switched off.
figure this out for us.
That was amazing.
זה היה מדהים.
ABOUT THE SPEAKER
Stuart Russell - AI expertStuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too.
Why you should listen
Stuart Russell is a professor (and formerly chair) of Electrical Engineering and Computer Sciences at University of California at Berkeley. His book Artificial Intelligence: A Modern Approach (with Peter Norvig) is the standard text in AI; it has been translated into 13 languages and is used in more than 1,300 universities in 118 countries. His research covers a wide range of topics in artificial intelligence including machine learning, probabilistic reasoning, knowledge representation, planning, real-time decision making, multitarget tracking, computer vision, computational physiology, global seismic monitoring and philosophical foundations.
He also works for the United Nations, developing a new global seismic monitoring system for the nuclear-test-ban treaty. His current concerns include the threat of autonomous weapons and the long-term future of artificial intelligence and its relation to humanity.
Stuart Russell | Speaker | TED.com