Stuart Russell: 3 principles for creating safer AI
Stuart Russell: AI sẽ giúp chúng ta tốt hơn như thế nào
Stuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too. Full bio
Double-click the English transcript below to play the video.
giỏi nhất thế giới,
greatest Go players,
ở thung lũng Silicon gọi là
in Silicon Valley call
a lot faster than we expected.
nhanh hơn nhiều so với chúng ta mong đợi.
What about the real world?
Thế còn trong thế giới thực?
mang tính chọn lựa.
of the technologies
is not yet happening in machines,
máy móc vẫn chưa thể đọc,
that the human race has ever written.
những thứ mà loài người đã viết.
further ahead than humans can,
xa hơn con người,
to more information,
nhiều thông tin hơn,
in the real world than we can.
tốt hơn chúng ta trong thế giới thực.
everything that we value,
tất cả những thứ chúng ta coi trọng,
to a lot more intelligence,
nhiều trí tuệ hơn,
to what the human race can do.
sẽ không có giới hạn.
as some people have described it,
như nhiều người đã miêu tả nó,
Hãy tận hưởng hành trình của bạn]
những điều như thế này,
of the human race?
and Stephen Hawking?
Elon Musk, Bill Gates và Stephen Hawking?
has been around for a while.
in a subservient position,
máy móc như một công cụ,
at strategic moments" --
khi chúng ta muốn"--
"turning off the power" idea later on --
với khái niệm "tắt nguồn" sau --
feel greatly humbled."
This is Alan Turing in 1951.
là cha đẻ của khoa học máy tính,
is the father of computer science
the father of AI as well.
ông cũng là cha đẻ của AI.
more intelligent than your own species,
thông minh hơn loài của chính bạn,
a few million years ago,
đã làm việc này từ hàng triệu năm trước,
xem đây có phải là một ý tưởng hay,
to discuss whether it was a good idea,
they conclude, no,
chúng kết luận: Không,
hoàn cảnh rất khó khăn.
nỗi buồn hiện hữu trong mắt chúng.
sadness in their eyes.
something smarter than your own species
chính loài của chúng ta
except stop doing AI,
the benefits that I mentioned
mà tôi vừa kể ra
to keep doing AI.
cụ thể hóa vấn đề hơn một chút.
the problem a bit more.
đem lại nhiều tai họa?
that the purpose put into the machine
mục đích mà chúng ta đưa vào máy móc
thực sự mong muốn."
của Norbert Wiener năm 1960,
one of the very early learning systems
học tập thời đầu
better than its creator.
giỏi hơn người tạo ra nó.
I touch to turn to gold,"
trở thành vàng."
những gì ông muốn.
mà ông đã đưa vào máy móc,
that he put into the machine,
và người thân của ông đều biến thành vàng
and his relatives turned to gold
trong đau khổ và đói kém.
"vấn đề Vua Midas"
"the King Midas problem"
không trùng khớp với thứ chúng ta muốn.
which is not, in fact,
"vấn đề trùng khớp giá trị."
"the value alignment problem."
không phải là vấn đề duy nhất.
is not the only part of the problem.
"Fetch the coffee,"
như "đi lấy cà phê,"
to fetch the coffee?
làm việc đi lấy cà phê thất bại?"
against interference
đạt được mục đích đã được giao."
that I have been given."
đối với mục tiêu mà, thật ra,
of an objective that is, in fact,
mục đích chính của loài người --
of the human race --
được rút ra từ bài nói này.
takeaway from this talk.
the coffee if you're dead.
lấy được cà phê nếu bạn chết.
Repeat it to yourself three times a day.
with the objectives of the humans,
is not superintelligent.
một cỗ máy siêu trí tuệ.
but eventually Dave outwits him
không may mắn như thế.
tôi không thể làm điều đó được.]
pursue objectives.
mục tiêu một cách thông minh.
of altruism, if you like,
lòng vị tha, nếu bạn thích,
of human objectives,
mục tiêu của con người,
touchy-feely, goody-goody values.
sự nhạy cảm hay đạo đức giả.
that the human would prefer
cuộc sống của họ trở nên giống thế.
đã vi phạm luật của Asimov
sự tồn tại của nó.
its own existence.
its existence whatsoever.
sự tồn tại của mình bất kể thế nào.
of humility, if you like.
sự khiêm tốn, nếu bạn thích.
important to make robots safe.
robot trở nên an toàn.
but it doesn't know what they are.
nhưng không biết chúng là gì.
of single-minded pursuit
theo đuổi mục đích.
hóa ra lại rất quan trọng.
mà chúng ta muốn.
by observation of human choices,
bằng việc quan sát con người lựa chọn,
hé lộ thông tin
our lives to be like.
cuộc sống của mình trở nên như vậy.
câu hỏi này như thế nào:
to this question of:
như Turing đã đưa ra.
as Turing suggested.
right on the back.
going to let you switch it off?
Nó có để cho bạn tắt nó đi không?
the coffee, I must fetch the coffee,
has been listening to my talk,
"I must disable my 'off' switch,
"Tôi phải vô hiệu hóa nút "tắt" của mình,
people in Starbucks
những người trong Starbucks,
tránh khỏi, đúng không?
không thể tránh được,
seems to be inevitable,
a concrete, definite objective.
một mục tiêu rõ ràng.
is uncertain about the objective?
không chắc chắn với mục tiêu của mình?
might switch me off,
có thể sẽ tắt mình mất,
mình không muốn làm điều đó."
luật thứ nhất và thứ hai.
principles right there.
the incentive that the robot has
the underlying objective.
về các mục tiêu tiềm ẩn.
it should be pursuing,
mục tiêu mà nó cần theo đuổi,
what it did wasn't right.
mình đã làm là không đúng.
of Greek symbols,
các kí hiệu La Mã thích hợp,
chứng minh mệnh đề
is provably beneficial to the human.
có ích cho con người.
with a machine that's designed in this way
với chiếc máy được thiết kế như thế này
but this is the first step
nhưng đó là bước đầu tiên
with human-compatible AI.
AI hòa hợp với con người.
khiến bạn phải vò đầu bứt tai suốt.
scratching your head over.
you know, I behave badly.
cư xử giống tôi.
and take stuff from the fridge.
lấy đồ trong tủ lạnh.
bạn không muốn robot làm theo.
you don't want the robot doing.
quite work that way.
bắt chước hành vi của bạn.
is going to copy your behavior.
và có thể giúp bạn chống lại chúng,
and maybe help you resist them,
cho mỗi người và cho mỗi cuộc sống
for any person and for any possible life
difficulties involved in doing this;
trong việc này.
chúng sẽ được giải quyết nhanh chóng.
is going to get solved very quickly.
là chính chúng ta.
we behave badly.
thực sự đã mục nát.
không cần phải bắt chước các hành vi.
doesn't have to copy the behavior.
any objective of its own.
mục tiêu nào cho riêng chúng.
the desires of one person, the user,
của chỉ một cá nhân, một người dùng,
the preferences of everybody.
của tất cả mọi người.
amount of nastiness,
với một số hành vi xấu xa,
that your nastiness, for example,
với sự sai trái của bạn, ví dụ,
khi làm công việc hộ chiếu
and send your kids to school.
và cho con của bạn đi học.
it doesn't mean it's going to steal.
nó không có nghĩa là chúng sẽ ăn cắp.
send your kids to school.
giúp con bạn được đi học.
he took an action that lost the game.
anh ấy chấp nhận đã thua ván cờ.
through a model of human cognition
với mô hình nhận thức của con người
limitations -- a very complicated model.
tính toán của chúng ta.
that we can work on understanding.
khám phá và hiểu nó.
from my point of view as an AI researcher,
dưới góc nhìn là một nhà nghiên cứu AI,
trade off, weigh up the preferences
cân đong đo đếm các quan điểm
moral philosophers have understood that,
triết học đạo đức đã hiểu điều đó,
looking for collaboration.
tìm kiếm các sự hợp tác.
when you get that wrong.
khi bạn hiểu sai nó.
a conversation, for example,
in a few years' time.
trong vài năm tới.
nhưng ngoài đời thực.
to remind you about dinner tonight."
buổi ăn tối ngày mai."
"What? What dinner?
"Hả? Bữa tối nào?
lúc 7 giờ tối."
with the secretary-general at 7:30.
tổng thư ký lúc 7h30.
có thể xảy ra chứ?"
my recommendation."
nhưng anh đã lờ đi lời khuyên của tôi."
I can't just tell him I'm too busy."
Tôi không thể nói cô ấy là tôi quá bận."
for his plane to be delayed."
chuyến bay của anh ấy bị hoãn lại."
for lunch tomorrow."
gặp anh ở bữa trưa ngày mai."
there's a slight mistake going on.
có một chút sai lầm đã xảy ra.
theo một hướng khác.
after a hard day's work,
sau một ngày làm việc vất vả,
thời gian để ăn trưa."
Could you make some dinner?"
Bạn có thể làm bữa tối cho tôi không?"
who are in more urgent need than you."
sự trợ giúp khẩn cấp hơn anh nhiều."
Tự làm bữa tối của anh đi."
những vấn đề như thế này,
to working on them.
làm việc với chúng.
they're going to read everything
chúng sẽ đọc hết tất cả mọi thứ trên đời.
những việc làm của nhân loại
is human beings doing things
cảm thấy phiền lòng về nó.
of data to learn from.
khổng lồ dữ liệu để học tập.
strong economic incentive
and the robot has to feed the kids,
và robot phải nấu ăn cho bọn trẻ,
and there's nothing in the fridge.
và không còn thứ gì trong tủ lạnh.
the human value function properly,
về các giá trị của con người,
the nutritional value of the cat.
lớn hơn hẳn giá trị dinh dưỡng của nó.
for family dinner."
cho bữa tối của gia đình."
of the domestic robot industry.
sẽ chấm dứt ngành robot gia đình.
to get this right
để làm việc này đúng trong thời gian dài
superintelligent machines.
máy móc siêu thông minh.
the definition of AI
thay đổi định nghĩa về AI
beneficial machines.
được chứng minh là có hiệu quả.
about what those objectives are,
những mục tiêu này là gì,
that we really want.
chúng ta thực sự muốn.
we will learn to be better people.
ta cũng học hỏi để trở nên tốt đẹp hơn.
because I think they're setting up
cho diễn giả tiếp theo.
seems intuitively really powerful.
thông tin có vẻ như rất mạnh mẽ.
this idea that knowledge
và phát hiện ra ý tưởng là
tốt hơn là bị thiếu hụt
and rewriting that programming?
sau đó viết lại các chương trình?
it to learn more, as I said,
học hỏi nhiều hơn, như tôi đã nói,
as it becomes more correct,
khi nó làm đúng nhiều hơn,
to interpret it correctly.
để diễn dịch đúng đắn điều này.
that books are very biased
những quyển sách rất thiên vị
về mục tiêu của chúng ta,
càng có ích cho chúng ta.
just boil it down to one law,
rút gọn lại trong một luật,
a self-driving car
tới trường mẫu giáo.
to be able to switch off the car
tắt chiếc xe khi nó đang chạy không?
nhận thức của người đó.
and sensible the person is.
to be switched off.
bị tắt càng cao.
random or even malicious,
hay thậm chí là kẻ xấu,
to be switched off.
vấn đề này cho chúng ta.
figure this out for us.
Nó rất tuyệt vời.
That was amazing.
ABOUT THE SPEAKER
Stuart Russell - AI expertStuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too.
Why you should listen
Stuart Russell is a professor (and formerly chair) of Electrical Engineering and Computer Sciences at University of California at Berkeley. His book Artificial Intelligence: A Modern Approach (with Peter Norvig) is the standard text in AI; it has been translated into 13 languages and is used in more than 1,300 universities in 118 countries. His research covers a wide range of topics in artificial intelligence including machine learning, probabilistic reasoning, knowledge representation, planning, real-time decision making, multitarget tracking, computer vision, computational physiology, global seismic monitoring and philosophical foundations.
He also works for the United Nations, developing a new global seismic monitoring system for the nuclear-test-ban treaty. His current concerns include the threat of autonomous weapons and the long-term future of artificial intelligence and its relation to humanity.
Stuart Russell | Speaker | TED.com