Stuart Russell: 3 principles for creating safer AI
Stuart Russell: Miképp tehet jobbá a mesterséges intelligencia?
Stuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too. Full bio
greatest Go players,
Szilícium-völgyi barátaim csak úgy hívnak:
in Silicon Valley call
a lot faster than we expected.
mint amire számítottunk.
What about the real world?
De mi lesz a való életben?
of the technologies
is not yet happening in machines,
hogy a gépek még nem olvasnak,
that the human race has ever written.
amit az emberi faj valaha leírt.
further ahead than humans can,
mint amire az ember képes,
to more information,
in the real world than we can.
jobb döntéseket hozni nálunk.
everything that we value,
amit számunkra értéket képvisel,
to a lot more intelligence,
férnénk hozzá,
to what the human race can do.
az emberi faj előtt.
as some people have described it,
ahogy néhányan megfogalmazták -
of the human race?
and Stephen Hawking?
és Stephen Hawking gondolja így?
has been around for a while.
Ez már régebb óta kísértő elgondolás.
in a subservient position,
alárendelt szolgai szerepben tartani,
at strategic moments" --
kikapcsolnánk őket," -
"turning off the power" idea later on --
erre a kikapcsolás-ötletre -
feel greatly humbled."
éreznénk magunkat."
This is Alan Turing in 1951.
Alan Turing 1951-ben.
is the father of computer science
hogy a számítástudomány atyja,
the father of AI as well.
more intelligent than your own species,
teremtményeket hozunk létre,
a few million years ago,
néhány millió évvel ezelőtt,
to discuss whether it was a good idea,
hogy jó ötlet volt-e,
they conclude, no,
sadness in their eyes.
tükröződik a szemükben.
something smarter than your own species
okosabbat létrehozni,
ami felkavaró érzés -
except stop doing AI,
kivéve, ha leállítjuk a MI kutatást,
the benefits that I mentioned
to keep doing AI.
a MI fejlesztést.
the problem a bit more.
that the purpose put into the machine
hogy a gépbe táplált cél
one of the very early learning systems
egy nagyon korai tanuló rendszert,
better than its creator.
jobb volt a dámajátékban.
minden arannyá, amit megérintek",
I touch to turn to gold,"
that he put into the machine,
and his relatives turned to gold
és a rokonai is arannyá változtak,
"the King Midas problem"
"Midász király problémának",
which is not, in fact,
ami valójában
"the value alignment problem."
"érték-illesztési problémának" nevezzük.
is not the only part of the problem.
betáplálását jelenti.
"Fetch the coffee,"
"Hozd ide a kávét",
to fetch the coffee?
a kávé oda vitelében?"
against interference
az akadályok elhárításáért
that I have been given."
of an objective that is, in fact,
olyan cél felé viszi,
of the human race --
az emberi faj valós céljaihoz -
takeaway from this talk.
útravaló üzenete ennek az előadásnak.
the coffee if you're dead.
ha meghaltál.
Repeat it to yourself three times a day.
Ismételjék el naponta háromszor!
with the objectives of the humans,
is not superintelligent.
but eventually Dave outwits him
de végül Dave túljár az eszén,
ilyen szerencsések.
a klasszikus szemlélettől,
pursue objectives.
célokért küzdenek.
of altruism, if you like,
ha úgy tetszik:
of human objectives,
az emberi értékekhez igazodó
touchy-feely, goody-goody values.
szuper jó értékekre gondolok.
that the human would prefer
its own existence.
saját magát.
its existence whatsoever.
of humility, if you like.
az alázatosság törvénye.
important to make robots safe.
hogy a robotokat biztonságossá tegyük.
but it doesn't know what they are.
ám mégsem tudja, mik azok.
of single-minded pursuit
hogy mit is akarunk.
by observation of human choices,
megfigyeléséből szerzi,
our lives to be like.
az életünket.
a következő kérdésre:
to this question of:
as Turing suggested.
ahogy Turing javasolta.
right on the back.
piros "off" kapcsoló a hátán.
going to let you switch it off?
engedni fogja, hogy kikapcsoljuk?
the coffee, I must fetch the coffee,
hogy: "Hozd ide a kávét!",
nem tudom hozni, ha halott vagyok" -
has been listening to my talk,
"I must disable my 'off' switch,
"Le kell tiltanom az 'off' gombom,
mindenkit a Starbuksnál is,
people in Starbucks
seems to be inevitable,
elkerülhetetlennek látszik,
a concrete, definite objective.
meghatározott célból következik.
is uncertain about the objective?
nem biztos a céljában?
might switch me off,
"Talán kikapcsol az ember,
hogy olyat nem akarok tenni."
principles right there.
és a második alapelv.
hogy az ember kikapcsoljon."
the incentive that the robot has
a robotnak szükséges ösztönzést,
azzal van összefüggésben,
the underlying objective.
mennyire bizonytalan.
it should be pursuing,
amikért küzd,
what it did wasn't right.
nem volt helyes.
of Greek symbols,
egy halom görög betűvel.
is provably beneficial to the human.
garantáltan hasznos az ember számára.
with a machine that's designed in this way
amit így terveztek,
but this is the first step
de ez az első lépés abban,
with human-compatible AI.
hogy ember-kompatibilis MI-t alkossunk.
scratching your head over.
you know, I behave badly.
"Néha én nem viselkedek túl jól,
úgy viselkedjen, mint én.
and take stuff from the fridge.
you don't want the robot doing.
hogy a robot csináljon.
quite work that way.
is going to copy your behavior.
and maybe help you resist them,
és talán segít ellenállni a kísértésnek,
for any person and for any possible life
hogy bárkinek
difficulties involved in doing this;
is going to get solved very quickly.
hogy ez egyhamar megoldódik.
we behave badly.
csúnyán viselkedünk,
doesn't have to copy the behavior.
nem kell másolnia minket.
any objective of its own.
the desires of one person, the user,
egy ember kívánságait tartsa szem előtt,
the preferences of everybody.
tekintettel kell lennie.
amount of nastiness,
bizonyos mértékű galádsággal,
that your nastiness, for example,
renitens módon:
csúszópénzt fogadunk el,
and send your kids to school.
és fizetnünk a gyerekeink iskoláztatását.
de ez nem jelenti, hogy ő is lopni fog.
it doesn't mean it's going to steal.
send your kids to school.
a gyerekek beiskolázásában.
teljesítménye is korlátozott.
he took an action that lost the game.
volt egy lépése, ami miatt veszített.
through a model of human cognition
az emberi értelem modelljét,
limitations -- a very complicated model.
kapacitás - ez egy bonyolult modell.
that we can work on understanding.
van még mit dolgozni.
from my point of view as an AI researcher,
valószínűleg az a legnehezebb,
trade off, weigh up the preferences
és egyszerre optimalizálni
moral philosophers have understood that,
filozófusok rájöttek már erre,
looking for collaboration.
when you get that wrong.
ha nem jól alkalmazzuk az eddigieket.
a conversation, for example,
személyi asszisztensünkkel
in a few years' time.
to remind you about dinner tonight."
hogy figyelmeztessen a mai vacsorára."
"What? What dinner?
"Mi? Miféle vacsora?
with the secretary-general at 7:30.
7:30-kor a főtitkárral van találkozóm.
my recommendation."
de te máshogy döntöttél."
I can't just tell him I'm too busy."
Nem mondhatom neki, hogy sok a dolgom."
for his plane to be delayed."
Elintéztem, hogy késsen a gépe."
for lunch tomorrow."
a holnapi közös ebédet."
there's a slight mistake going on.
van egy kis megbicsaklás...
"Boldog feleség, boldog élet."
after a hard day's work,
Could you make some dinner?"
Készítenél valami vacsorát?"
who are in more urgent need than you."
nagyobb szükségük van az ételre."
Csinálj magadnak vacsorát!"
még meg kell oldanunk,
to working on them.
they're going to read everything
is human beings doing things
hogy emberek tesznek valamit,
of data to learn from.
amiből tanulni lehet.
strong economic incentive
gazdasági nyomás,
háztartási robotunkat.
and the robot has to feed the kids,
a robotnak kell megetetnie a gyerekeket.
and there's nothing in the fridge.
the human value function properly,
elég jól az emberi értékrendet,
the nutritional value of the cat.
túlmutat a tápértékén.
for family dinner."
vacsorára a család cicáját."
of the domestic robot industry.
a háztartási robotipar végét jelentené.
to get this right
hogy ügyesen kezeljük ezt,
superintelligent machines.
a szuperintelligens gépekig.
the definition of AI
a MI definícióját úgy,
beneficial machines.
levő gépeket jelentsenek.
elérésével foglalkoznak,
about what those objectives are,
that we really want.
we will learn to be better people.
mi is jobb emberekké válunk.
because I think they're setting up
seems intuitively really powerful.
elég hatékony dolognak tűnik.
this idea that knowledge
arra a felismerésre jusson,
and rewriting that programming?
hogy legyenek saját céljai?
it to learn more, as I said,
jobban meg kell ismerjük
as it becomes more correct,
amennyivel jobban átlátja a dolgokat,
to interpret it correctly.
hogy ezt jól értelmezze.
that books are very biased
hogy a könyvek nagyon elfogultak
és hercegekről szólnak,
megismeri a céljainkat,
just boil it down to one law,
egy szabályra egyszerűsíteni,
a self-driving car
hogy van egy önvezető autód,
az ötéves gyereked
to be able to switch off the car
hogy az ötéves képes legyen
and sensible the person is.
racionális és józan az adott ember.
hogy kikapcsolják.
to be switched off.
random or even malicious,
vagy akár ártó szándékú,
to be switched off.
hogy kikapcsolják.
csak annyit mondok,
figure this out for us.
hogy megoldod ezt nekünk.
That was amazing.
Lenyűgöző volt.
