Stuart Russell: 3 principles for creating safer AI
Stuart Russell: Comment l'intelligence artificielle peut-elle nous améliorer ?
Stuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too. Full bio
Double-click the English transcript below to play the video.
greatest Go players,
joueurs de go au monde,
in Silicon Valley call
de Silicon Valley appellent
a lot faster than we expected.
plus rapidement que prévu.
Qu'en est-il du monde réel ?
What about the real world?
bien plus grand,
of the technologies
is not yet happening in machines,
pas encore au point pour les machines,
that the human race has ever written.
ce que la race humaine a jamais écrit.
que les hommes ne le peuvent,
further ahead than humans can,
to more information,
in the real world than we can.
décisions dans le monde réel que nous.
everything that we value,
tout ce que nous apprécions,
to a lot more intelligence,
à une plus large intelligence,
to what the human race can do.
à ce que la race humaine peut faire.
as some people have described it,
comme certains l'ont décrit,
de l'histoire humaine.
racontent-ils des choses comme :
of the human race?
la fin de la race humaine ? »
and Stephen Hawking?
Bill Gates et Stephen Hawking ?
has been around for a while.
Cette idée existe depuis un moment.
in a subservient position,
machines dans une position subalterne,
l'énergie à des moments stratégiques... »
at strategic moments" --
"turning off the power" idea later on --
de « couper l'énergie » plus tard...
feel greatly humbled."
faire preuve d'humilité. »
This is Alan Turing in 1951.
C'est Alan Turing en 1951.
is the father of computer science
est le père de l'informatique
the father of AI as well.
le père de l'IA également.
more intelligent than your own species,
intelligent que notre propre espèce,
« le problème du gorille »,
a few million years ago,
il y a quelques millions d'années,
to discuss whether it was a good idea,
pour savoir si c'était une bonne idée
they conclude, no,
ils conclurent que non,
sadness in their eyes.
existentielle dans leurs yeux.
something smarter than your own species
quelque chose de plus intelligent
ce n'est peut-être pas une bonne idée...
except stop doing AI,
sauf abandonner l'IA.
the benefits that I mentioned
que j'ai mentionnés
to keep doing AI.
à travailler sur l'IA.
the problem a bit more.
un peu plus le problème.
pourrait être une catastrophe ?
that the purpose put into the machine
que l'objectif introduit dans la machine
Norbert Wienner en 1960,
one of the very early learning systems
l'un des premiers systèmes d'apprentissage
better than its creator.
que son créateur.
ce que je touche se transforme en or »
I touch to turn to gold,"
ce qu'il avait demandé.
that he put into the machine,
qu'il a introduit dans la machine,
and his relatives turned to gold
sa famille se sont alors changées en or.
"the King Midas problem"
« le problème du roi Midas »,
which is not, in fact,
qui n'est pas, en fait,
"the value alignment problem."
« un problème d'alignement de valeur ».
is not the only part of the problem.
n'est qu'une partie du problème.
dans une machine,
"Fetch the coffee,"
simple comme « acheter du café »,
to fetch the coffee?
à apporter du café ?
des mesures pour éviter cela.
against interference
contre les interférences
that I have been given."
qu'on m'a donné. »
envers un objectif qui n'est, en fait,
of an objective that is, in fact,
of the human race --
de la race humaine...
nous sommes confrontés.
takeaway from this talk.
à retenir de cette présentation.
chercher le café si vous êtes mort.
the coffee if you're dead.
Repeat it to yourself three times a day.
Répétez-le-vous trois fois par jour.
with the objectives of the humans,
avec les objectifs des êtres humains
is not superintelligent.
n'est pas super-intelligent.
but eventually Dave outwits him
mais finalement Dave le surpasse
de cette notion classique
pursue objectives.
leurs objectifs de manière intelligente.
of altruism, if you like,
si vous voulez.
of human objectives,
des objectifs des êtres humains,
touchy-feely, goody-goody values.
sentimentales ou sainte-nitouche.
that the human would prefer
les êtres humains voudraient
selon laquelle
its own existence.
sa propre existence.
its existence whatsoever.
à préserver son existence.
of humility, if you like.
si vous préférez.
important to make robots safe.
afin de rendre le robot inoffensif.
but it doesn't know what they are.
mais il ne sait pas ce qu'elles sont.
of single-minded pursuit
by observation of human choices,
par l'observation des choix humains.
our lives to be like.
pour notre vie.
à la question
to this question of:
as Turing suggested.
« Pouvez-vous éteindre la machine ? »
right on the back.
directement sur le dos.
« Va-t-il nous laisser l'éteindre ? »
going to let you switch it off?
the coffee, I must fetch the coffee,
« chercher du café,
je ne peux pas y aller si je suis mort. »
has been listening to my talk,
a écouté ma présentation
"I must disable my 'off' switch,
« Je dois désactiver mon interrupteur
people in Starbucks
personnes dans le Starbucks
seems to be inevitable,
semble être inévitable
a concrete, definite objective.
l'objectif concret et défini.
is uncertain about the objective?
ne connaît pas l'objectif ?
might switch me off,
« OK, l'humain pourrait m'éteindre,
ce qui est mal,
que je ne veux pas le faire. »
principles right there.
l'humain m'éteindre. »
the incentive that the robot has
l'incitation que le robot a
the underlying objective.
l'objectif sous-jacent.
entre en jeu.
les objectifs qu'elle doit poursuivre
it should be pursuing,
what it did wasn't right.
n'était pas bien.
of Greek symbols,
appropriée des symboles grecs,
is provably beneficial to the human.
est manifestement bénéfique pour l'humain.
with a machine that's designed in this way
avec une machine conçue de cette façon
mais c'est la première étape
but this is the first step
with human-compatible AI.
l'IA compatible avec les êtres humains.
de vous gratter la tête à ce sujet.
scratching your head over.
you know, I behave badly.
« Eh bien, vous savez, je me comporte mal.
se comporte comme moi.
and take stuff from the fridge.
et je picore dans le frigo.
you don't want the robot doing.
que vous ne voulez pas qu'un robot fasse.
quite work that way.
à vous copier.
is going to copy your behavior.
and maybe help you resist them,
et peut-être vous aider à résister,
en fait, c'est de permettre
for any person and for any possible life
pour toute personne et
difficulties involved in doing this;
beaucoup, beaucoup de difficultés.
résolvions cela très rapidement.
is going to get solved very quickly.
we behave badly.
nous nous comportons mal.
même foncièrement méchants.
doesn't have to copy the behavior.
obligé de copier ce comportement.
any objective of its own.
the desires of one person, the user,
les désirs d'une personne, l'utilisateur,
the preferences of everybody.
les préférences de tous.
amount of nastiness,
à une certaine négligence.
that your nastiness, for example,
votre malveillance, par exemple,
que préposé aux passeports
and send your kids to school.
et envoyer vos enfants à l'école.
signifie pas qu'il va se mettre à voler.
it doesn't mean it's going to steal.
send your kids to school.
à envoyer vos enfants à l'école.
par la puissance de calcul.
he took an action that lost the game.
une décision qui lui a coûté le match.
through a model of human cognition
un modèle de cognition humaine
limitations -- a very complicated model.
Un modèle très compliqué.
that we can work on understanding.
mais nous pouvons le comprendre.
from my point of view as an AI researcher,
de mon point de vue de chercheur en IA,
trade off, weigh up the preferences
évaluer les préférences
de personnes différentes
façons de le faire.
moral philosophers have understood that,
les philosophes l'ont bien compris
looking for collaboration.
leur collaboration.
when you get that wrong.
lorsque vous avez un problème.
a conversation, for example,
par exemple,
dans quelques années.
in a few years' time.
to remind you about dinner tonight."
pour vous rappeler le dîner de ce soir. »
"What? What dinner?
« Quoi ? Quel dîner ?
with the secretary-general at 7:30.
avec le secrétaire général à 19h30.
my recommendation."
mais vous avez ignoré mon avertissement. »
I can't just tell him I'm too busy."
peux pas lui dire que je suis occupé. »
en sorte que son avion ait du retard. »
for his plane to be delayed."
for lunch tomorrow."
demain pour le déjeuner. »
there's a slight mistake going on.
Il y a une légère erreur.
la philosophie de ma femme.
« femme heureuse, vie heureuse. »
aller autrement.
after a hard day's work,
après une dure journée
« Dure journée ? »
eu le temps de manger. »
Could you make some dinner?"
Tu peux me faire à dîner ? »
who are in more urgent need than you."
bien plus besoin de nourriture que toi. »
Fais-toi à dîner toi-même. »
to working on them.
de travailler là-dessus.
d'être optimistes.
they're going to read everything
j'ai dit que l'IA va lire tout
nous écrivons sur ce que les humains font
is human beings doing things
of data to learn from.
dans laquelle puiser.
strong economic incentive
incitation économique à cela.
et le robot doit nourrir les enfants,
and the robot has to feed the kids,
and there's nothing in the fridge.
et il n'y a rien dans le réfrigérateur.
the human value function properly,
les valeurs humaines,
the nutritional value of the cat.
l'emporte sur sa valeur nutritionnelle.
for family dinner."
de la famille pour le dîner. »
of the domestic robot industry.
de l'industrie du robot domestique.
to get this right
à régler cela
superintelligent machines.
aux machines supra-intelligentes.
the definition of AI
beneficial machines.
irréfutablement bénéfiques.
about what those objectives are,
quant à ces objectifs
that we really want.
ce que nous voulons vraiment.
we will learn to be better people.
apprendrons aussi à devenir meilleurs.
Très intéressant, Stuart.
because I think they're setting up
car je crois qu'ils préparent
seems intuitively really powerful.
semble intuitivement très puissante.
de la supra-intelligence,
this idea that knowledge
cette notion que la connaissance
and rewriting that programming?
en réécrivant cette programmation ?
it to learn more, as I said,
en apprenne davantage, comme je l'ai dit,
as it becomes more correct,
avec l'expérience,
to interpret it correctly.
correctement nos objectifs.
that books are very biased
que les livres sont très biaisés
que fait l'élite blanche.
sur nos objectifs,
résumer cela en une seule loi,
just boil it down to one law,
a self-driving car
une voiture sans chauffeur
votre enfant de cinq ans
puisse éteindre la voiture
to be able to switch off the car
and sensible the person is.
personne est rationnelle et raisonnable.
to be switched off.
random or even malicious,
ou même malveillante,
to be switched off.
un contrôle plus limité.
régler cela pour nous.
figure this out for us.
That was amazing.
C'était incroyable.
ABOUT THE SPEAKER
Stuart Russell - AI expertStuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too.
Why you should listen
Stuart Russell is a professor (and formerly chair) of Electrical Engineering and Computer Sciences at University of California at Berkeley. His book Artificial Intelligence: A Modern Approach (with Peter Norvig) is the standard text in AI; it has been translated into 13 languages and is used in more than 1,300 universities in 118 countries. His research covers a wide range of topics in artificial intelligence including machine learning, probabilistic reasoning, knowledge representation, planning, real-time decision making, multitarget tracking, computer vision, computational physiology, global seismic monitoring and philosophical foundations.
He also works for the United Nations, developing a new global seismic monitoring system for the nuclear-test-ban treaty. His current concerns include the threat of autonomous weapons and the long-term future of artificial intelligence and its relation to humanity.
Stuart Russell | Speaker | TED.com