Stuart Russell: 3 principles for creating safer AI
Стюарт Рассел: Как мы можем стать лучше благодаря ИИ?
Stuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too. Full bio
Double-click the English transcript below to play the video.
greatest Go players,
игроков в го в мире,
in Silicon Valley call
которую мои друзья
называют «Мама дорогая!» —
a lot faster than we expected.
гораздо быстрее, чем мы ожидали.
Но как же реальный мир?
What about the real world?
что это не столь очевидно,
of the technologies
is not yet happening in machines,
что машины ещё не понимают
that the human race has ever written.
что когда-либо написали люди.
further ahead than humans can,
развитие событий лучше, чем люди;
to more information,
in the real world than we can.
решения лучше, чем мы.
everything that we value,
to a lot more intelligence,
to what the human race can do.
не было бы предела.
as some people have described it,
что некоторые называют
в истории человечества.
of the human race?
and Stephen Hawking?
Билла Гейтса и Стивена Хокинга?
has been around for a while.
Эта идея появилась довольно давно.
in a subservient position,
власть над машинами,
at strategic moments" --
отключить их в любой момент, —
"turning off the power" idea later on --
к этой идее отключения, —
feel greatly humbled."
довольно униженными».
This is Alan Turing in 1951.
Алан Тьюринг в 1951 году.
is the father of computer science
является отцом информатики,
the father of AI as well.
more intelligent than your own species,
более разумного, чем наш вид,
«проблемой гориллы»,
a few million years ago,
несколько миллионов лет назад,
to discuss whether it was a good idea,
была ли это хорошая идея,
they conclude, no,
пришли бы к заключению,
sadness in their eyes.
экзистенциальную печаль.
something smarter than your own species
except stop doing AI,
прекратить разработку ИИ.
the benefits that I mentioned
to keep doing AI.
the problem a bit more.
обсудить проблему более подробно.
обернуться катастрофой?
that the purpose put into the machine
что цели, заложенные в машину,
one of the very early learning systems
как одна из первых обучающихся систем
better than its creator.
лучше своего создателя.
I touch to turn to gold,"
превращалось в золото».
that he put into the machine,
and his relatives turned to gold
превратились в золото,
и голодной смертью.
"the King Midas problem"
which is not, in fact,
которая в действительности
"the value alignment problem."
проблемой согласования.
is not the only part of the problem.
лишь часть проблемы.
"Fetch the coffee,"
to fetch the coffee?
в приготовлении кофе?
against interference
от любых вмешательств
that I have been given."
поставленной мне задачи».
of an objective that is, in fact,
of the human race --
с первоначальной целью человечества —
takeaway from this talk.
the coffee if you're dead.
если вы покойник.
Repeat it to yourself three times a day.
Повторяйте себе это три раза в день.
заключается сюжет фильма
with the objectives of the humans,
is not superintelligent.
but eventually Dave outwits him
но в итоге Дэйв смог перехитрить
pursue objectives.
of altruism, if you like,
of human objectives,
к чему он стремится,
touchy-feely, goody-goody values.
не сентиментальные ценности,
that the human would prefer
its own existence.
должен защищать себя.
its existence whatsoever.
в сохранении своей жизни.
of humility, if you like.
important to make robots safe.
чтобы обезопасить нас от роботов.
к человеческим ценностям,
but it doesn't know what they are.
не зная, что они из себя представляют.
of single-minded pursuit
проблемы концентрации
общее понимание наших желаний.
by observation of human choices,
из решений, принимаемых людьми,
содержат информацию о том,
our lives to be like.
to this question of:
как они применяются к вопросу,
as Turing suggested.
«Можно ли отключить машину?»
right on the back.
есть красная кнопка «Выкл».
going to let you switch it off?
the coffee, I must fetch the coffee,
я должен варить кофе;
has been listening to my talk,
"I must disable my 'off' switch,
«Я должен сломать свой выключатель
people in Starbucks
невозможно избежать,
seems to be inevitable,
a concrete, definite objective.
is uncertain about the objective?
не будет чётко поставленной цели?
might switch me off,
principles right there.
разрешить людям отключить меня».
the incentive that the robot has
просчитать стимул, благодаря которому
the underlying objective.
it should be pursuing,
которые должна преследовать,
what it did wasn't right.
что сделала что-то не так.
of Greek symbols,
is provably beneficial to the human.
принесёт человеку пользу.
with a machine that's designed in this way
работать с машиной, которая разработана
but this is the first step
with human-compatible AI.
разработки робота-компаньона.
scratching your head over.
you know, I behave badly.
«Допустим, я поступаю плохо,
поступал так же, как я.
and take stuff from the fridge.
к холодильнику за едой.
you don't want the robot doing.
повторял за вами всё.
работает немного иначе.
quite work that way.
is going to copy your behavior.
and maybe help you resist them,
и, возможно, поможет вам противостоять им
for any person and for any possible life
все возможные варианты
difficulties involved in doing this;
с множеством затруднений.
is going to get solved very quickly.
можно справиться быстро.
заключается именно в нас.
we behave badly.
doesn't have to copy the behavior.
не нужно копировать поведение.
any objective of its own.
the desires of one person, the user,
потребностей своего пользователя,
the preferences of everybody.
amount of nastiness,
that your nastiness, for example,
работая паспортистом,
and send your kids to school.
и оплачивать обучение детей.
it doesn't mean it's going to steal.
что он будет воровать.
send your kids to school.
оплатить учёбу детей.
способности также ограничены.
he took an action that lost the game.
through a model of human cognition
человеческого познания, включающего
limitations -- a very complicated model.
и являющегося очень сложной моделью.
that we can work on understanding.
from my point of view as an AI researcher,
самым сложным в исследовании ИИ
trade off, weigh up the preferences
на компромисс, сопоставлять пожелания
moral philosophers have understood that,
нравственные философы поняли это,
looking for collaboration.
when you get that wrong.
если вы допу́стите ошибку.
a conversation, for example,
in a few years' time.
через несколько лет.
to remind you about dinner tonight."
чтобы напомнить о сегодняшнем вечере».
"What? What dinner?
«Что? Какой ужин?
with the secretary-general at 7:30.
с генеральным секретарём в 19:30.
my recommendation."
но вы проигнорировали мой совет».
I can't just tell him I'm too busy."
просто сказать ему, что занят».
for his plane to be delayed."
for lunch tomorrow."
there's a slight mistake going on.
в оценке приоритетов.
моей жены и её принципу
after a hard day's work,
после тяжёлого рабочего дня,
Could you make some dinner?"
Можешь приготовить ужин?»
who are in more urgent need than you."
в помощи больше, чем вы».
Готовьте себе ужин сами».
to working on them.
they're going to read everything
is human beings doing things
как одни люди что-либо делают,
of data to learn from.
данных для изучения.
strong economic incentive
and the robot has to feed the kids,
и робот должен накормить детей,
and there's nothing in the fridge.
потому что холодильник пуст.
the human value function properly,
человеческих ценностей
the nutritional value of the cat.
превосходит её питательную ценность.
for family dinner."
котёнка на семейный ужин».
of the domestic robot industry.
производству домашних роботов.
to get this right
сделать всё правильно
superintelligent machines.
суперумную машину.
the definition of AI
изменить определение ИИ,
beneficial machines.
были действительно полезными.
about what those objectives are,
that we really want.
we will learn to be better people.
because I think they're setting up
потому что, сейчас идёт подготовка
seems intuitively really powerful.
подсознательно кажется очень мощной.
this idea that knowledge
что на самом деле знания
and rewriting that programming?
и перепрограммировать себя?
it to learn more, as I said,
мы хотим, чтобы роботы узнали больше
as it becomes more correct,
лишь когда станут правильными,
to interpret it correctly.
that books are very biased
что книги описывают мир
которые делают свою работу.
узнавать о наших целях,
just boil it down to one law,
всё к одному закону,
попытается меня выключить,
a self-driving car
беспилотный автомобиль,
своего пятилетнего сына
to be able to switch off the car
мог отключить машину,
and sensible the person is.
рациональности и здравомыслия личности.
to be switched off.
на отключение.
random or even malicious,
или даже злоумышленник,
to be switched off.
figure this out for us.
That was amazing.
Это было потрясающе.
ABOUT THE SPEAKER
Stuart Russell - AI expertStuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too.
Why you should listen
Stuart Russell is a professor (and formerly chair) of Electrical Engineering and Computer Sciences at University of California at Berkeley. His book Artificial Intelligence: A Modern Approach (with Peter Norvig) is the standard text in AI; it has been translated into 13 languages and is used in more than 1,300 universities in 118 countries. His research covers a wide range of topics in artificial intelligence including machine learning, probabilistic reasoning, knowledge representation, planning, real-time decision making, multitarget tracking, computer vision, computational physiology, global seismic monitoring and philosophical foundations.
He also works for the United Nations, developing a new global seismic monitoring system for the nuclear-test-ban treaty. His current concerns include the threat of autonomous weapons and the long-term future of artificial intelligence and its relation to humanity.
Stuart Russell | Speaker | TED.com