Stuart Russell: 3 principles for creating safer AI
Stuart Russell: Yapay zeka bizleri nasıl daha iyi insanlar yapacak
Stuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too. Full bio
Double-click the English transcript below to play the video.
greatest Go players,
Go oyuncularından biri.
in Silicon Valley call
arkadaşlarımın deyişiyle
a lot faster than we expected.
anladığımız bir an.
Peki ya gerçek hayatta?
What about the real world?
çok daha karmaşık.
sorunu oluşturuyor.
bazı teknolojileri
of the technologies
is not yet happening in machines,
okuyamadığından bahsetti;
hemen ardından makineler,
that the human race has ever written.
insanlardan daha öteye
further ahead than humans can,
to more information,
in the real world than we can.
kararlar alabilecekler.
everything that we value,
zekamıza dayanıyor.
erişebilme şansı olsa
to a lot more intelligence,
bir sınırı olmayacak.
to what the human race can do.
as some people have described it,
tanımladığı gibi
olay olacaktır.
yapay zekanın insan türünün
of the human race?
and Stephen Hawking?
Musk, Bill Gates ve Stephen Hawking mi?
has been around for a while.
uzun zamandır var.
in a subservient position,
tutabiliyor olsak bile
at strategic moments" --
stratejik anlarda kapatarak-
"turning off the power" idea later on --
fikrine geri döneceğim)
feel greatly humbled."
çok aşağılanmış gibi hissedeceğiz."
This is Alan Turing in 1951.
1951 yılında Alan Turing.
is the father of computer science
bilgisayar biliminin
yapay zekanın da babasıdır.
the father of AI as well.
more intelligent than your own species,
problemi olarak düşünürsek,
diyebiliriz.
bunu birkaç milyon yıl önce yaptı:
a few million years ago,
to discuss whether it was a good idea,
ve bu fikri değerlendiriyorlar.
they conclude, no,
sadness in their eyes.
üzüntüyü görebiliyorsunuz.
something smarter than your own species
bir şey yaratmanın
dair tatsız bir his...
except stop doing AI,
bırakmaktan başka bir şey yapamayız.
the benefits that I mentioned
tüm yararlarından dolayı
olduğumdan,
to keep doing AI.
çalışmayı sürdürmek istiyorum.
yakından bakmalıyız.
the problem a bit more.
muhtemelen bir felaket olsun?
aslında bizlerin arzuladığı
that the purpose put into the machine
ilk öğrenim sistemlerinden birinin,
one of the very early learning systems
başardığını izledikten sonra söylemişti.
better than its creator.
tarafından da söylenmiş olabilirdi.
her şeyin altın olmasını istiyorum,''
I touch to turn to gold,"
that he put into the machine,
bu olduğu söylenebilir.
and his relatives turned to gold
ve akrabaları altına dönüştü.
"the King Midas problem"
which is not, in fact,
gerçekte uyuşmaması durumuna
"the value alignment problem."
''değer uyuşmazlığı problemi'' diyoruz.
yerleştirmekten ibaret değil.
is not the only part of the problem.
"Fetch the coffee,"
basit bir hedef olsa bile
başarısızlığa uğrayabilirim?
to fetch the coffee?
bir şeyler yapmalıyım.
dışı bırakacağım.
getirmemi engelleyebilecek
against interference
savunmak için ne gerekiyorsa yapacağım."
that I have been given."
gayet savunmacı bir moddaki
of an objective that is, in fact,
hedefleriyle örtüşmüyor.
of the human race --
bu konuşmanın en değerli dersi.
takeaway from this talk.
the coffee if you're dead.
getiremeyeceğiniz olmalı.
Repeat it to yourself three times a day.
Kendinize bunu günde üç kez tekrar edin.
hikayedir.
with the objectives of the humans,
is not superintelligent.
but eventually Dave outwits him
sonunda Dave onu atlatır
makinelerle ilgili
kurtulmamız için
pursue objectives.
tanımlamaya çalışıyorum.
of altruism, if you like,
denilebilecek bir ilke.
insanların hedeflerine,
of human objectives,
hitap etmek olması.
touchy-feely, goody-goody values.
değerleri kastetmiyorum.
that the human would prefer
nasıl olması gerektiği hakkındaki
gerektiği" kuralını çiğniyor.
its own existence.
its existence whatsoever.
korumakla ilgilenmez.
mütevazilikle ilgili olduğu söylenebilir.
of humility, if you like.
important to make robots safe.
büyük katkısı olduğu ortaya çıktı.
değerlerinin ne olduğunu
çalıştığını söylüyor.
but it doesn't know what they are.
arttırmaya çalışıyor.
problemini önler.
of single-minded pursuit
olduğu ortaya çıktı.
hakkında bir fikri olmalı.
by observation of human choices,
tercihlerini gözlemleyerek elde eder.
istediğimize ilişkin bilgi sunuyor.
our lives to be like.
to this question of:
''makineyi kapatabilir misin?''
as Turing suggested.
uygulandığını inceleyelim.
laboratuvarımızdaki PR2.
right on the back.
kırmızı bir ''kapat'' düğmesi var.
going to let you switch it off?
Onu kapatmanıza izin verecek mi?
yapacak olursak
the coffee, I must fetch the coffee,
kahveyi getirmeliyim,
amacını verirsek,
has been listening to my talk,
işlev dışı bırakmalıyım
"I must disable my 'off' switch,
müdahale etmeye çalışan
people in Starbucks
elektrikle şoklarım'' der.
görünüyor, değil mi?
seems to be inevitable,
kaçınılmaz görünüyor ve
a concrete, definite objective.
konulmasından kaynaklanıyor.
is uncertain about the objective?
emin değilse ne olur?
might switch me off,
''Peki, insan beni kapatabilir
tam bilmiyorum
istemediğimi biliyorum.''
principles right there.
ilkeleri görebiliyorsunuz.
kapatmasına izin vermeliyim.''
the incentive that the robot has
kendini kapatması için izin vermesindeki
the underlying objective.
it should be pursuing,
ilişkin bir şey öğrenir,
yanlış olduğunu öğrenir.
what it did wasn't right.
sıkça yaptığı gibi
of Greek symbols,
insanlara yararının kanıtlanabileceğini
is provably beneficial to the human.
with a machine that's designed in this way
bir makinenin varlığı,
sizi daha iyi kılacaktır.
but this is the first step
başarmaya çalıştığımız
with human-compatible AI.
yolunda ilk adımımızdır.
scratching your head over.
''Eğer ben yanlış hareket ediyorsam,
you know, I behave badly.
etmesini istemiyorum.
bişeyler aşırıyorum.
and take stuff from the fridge.
you don't want the robot doing.
birçok şey olabilir.
quite work that way.
is going to copy your behavior.
taklit edecek değil.
belki de direnmeniz için
and maybe help you resist them,
eğer uygunsa.
yaşayabilecekleri herhangi bir olası yaşam
for any person and for any possible life
öngörüler yapmalarını sağlamak:
difficulties involved in doing this;
çok fazla güçlük var.
çözüleceğini de sanmıyorum.
is going to get solved very quickly.
we behave badly.
kötü davranışlarımız var.
bazılarımız gerçekten kötü.
doesn't have to copy the behavior.
tekrarlamak zorunda değil.
any objective of its own.
the desires of one person, the user,
kullanıcının arzularını
tasarlanmış değil,
the preferences of everybody.
duymak için tasarlanırlar.
kötü davranışı algılayabilir
amount of nastiness,
ardındaki nedenleri de anlayabilir.
that your nastiness, for example,
alan bir pasaport memuruysanız,
göndermek için yaptığınızı anlayabilir.
and send your kids to school.
it doesn't mean it's going to steal.
anlamına gelmez.
gönderebilmeniz için size yardım edecek.
send your kids to school.
açısından sınırlıyız.
he took an action that lost the game.
neden olan bir hamle yaptı.
anlamına gelmiyor.
bizim hesaplama konusundaki
through a model of human cognition
modeli süzgecinden geçirmek gerek.
limitations -- a very complicated model.
çalışabileceğimiz bir kavram.
that we can work on understanding.
from my point of view as an AI researcher,
en zor olan kısım belki de
insanların tercihlerini
trade off, weigh up the preferences
analiz etmeliler.
moral philosophers have understood that,
filozoflar bunu anlamıştı
işbirliği arayışındayız.
looking for collaboration.
when you get that wrong.
neler olabileceğine bir bakalım.
a conversation, for example,
in a few years' time.
bir Siri düşünün.
to remind you about dinner tonight."
randevunuzu hatırlatmak için aradı.''
"What? What dinner?
''Ne? Ne yemeği?
20. yıldönümü yemeğiniz.''
with the secretary-general at 7:30.
Genel Sekreter ile buluşuyorum.
my recommendation."
ama önerimi çiğnediniz.''
I can't just tell him I'm too busy."
çok meşgul olduğumu söyleyemem.''
for his plane to be delayed."
sağlıyorum.''
Bunu yapabiliyor musun?''
iletiyor ve
görüşmeyi bekliyor.''
for lunch tomorrow."
there's a slight mistake going on.
Yanlış olan bir şeyler var.
değerlerini takip etmekte,
mutlu bir hayat'' oluyor.
after a hard day's work,
eve geldiğinizde,
gün müydü?'' diye soruyor.
bile vaktim olmadı.''
Could you make some dinner?"
Yiyecek bir şeyler hazırlayabilir misin?''
who are in more urgent need than you."
senden daha muhtaç insanlar var.''
Kendi yemeğini kendin yap.''
to working on them.
sabırsızlıkla bekliyorum.
sebeplerimiz var.
they're going to read everything
tarih boyunca yazdığı
söylemiştim.
insanların yaptığı şeyler ve
is human beings doing things
dolayı üzülmesi ile ilgili.
of data to learn from.
strong economic incentive
gerçekleştirmek için
evinizde olduğunu varsayın.
and the robot has to feed the kids,
robotun çocuklara yemek yedirmesi lazım.
and there's nothing in the fridge.
hiçbir şey yok.
the human value function properly,
öğrenemediğinden,
kedinin besin değerinden
the nutritional value of the cat.
için kediyi pişirdi.''
for family dinner."
of the domestic robot industry.
endüstrisinin sonu olurdu.
bunu hatasız yapmamız gerekiyor.
to get this right
superintelligent machines.
the definition of AI
değiştirmeye çalışıyorum,
beneficial machines.
makinelere sahip olabilelim.
ulaşmak istesinler.
about what those objectives are,
emin olmasınlar
that we really want.
ne istediğimizi anlasınlar.
daha iyi insanlar olmayı öğrenelim.
we will learn to be better people.
because I think they're setting up
çünkü sanırım bir sonraki konuşmacı
seems intuitively really powerful.
gibi duruyor.
this idea that knowledge
daha iyi olduğunu keşfetmesi
and rewriting that programming?
yazmasını ne durdurabilir?
aslında dediğim gibi
it to learn more, as I said,
as it becomes more correct,
biçimde tasarlayacağız.
kanıtlar açısından
to interpret it correctly.
that books are very biased
ve elit beyaz erkeklerin
just boil it down to one law,
kurala indirgeyemeyiz,
olduğunu varsayın
a self-driving car
to be able to switch off the car
arabayı kapatabilmesini ister miydiniz?
Yani bu durumda robotun,
and sensible the person is.
rasyonel olduğunu anlaması gerekiyor.
to be switched off.
kabul edersiniz.
random or even malicious,
ve hatta kötü niyetliyse
to be switched off.
daha az hevesli olursunuz.
sadece şunu söyleyebilirim.
figure this out for us.
That was amazing.
Muhteşemdi.
ABOUT THE SPEAKER
Stuart Russell - AI expertStuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too.
Why you should listen
Stuart Russell is a professor (and formerly chair) of Electrical Engineering and Computer Sciences at University of California at Berkeley. His book Artificial Intelligence: A Modern Approach (with Peter Norvig) is the standard text in AI; it has been translated into 13 languages and is used in more than 1,300 universities in 118 countries. His research covers a wide range of topics in artificial intelligence including machine learning, probabilistic reasoning, knowledge representation, planning, real-time decision making, multitarget tracking, computer vision, computational physiology, global seismic monitoring and philosophical foundations.
He also works for the United Nations, developing a new global seismic monitoring system for the nuclear-test-ban treaty. His current concerns include the threat of autonomous weapons and the long-term future of artificial intelligence and its relation to humanity.
Stuart Russell | Speaker | TED.com