Stuart Russell: 3 principles for creating safer AI
Στιούαρτ Ράσελ: Πώς η Τεχνητή Νοημοσύνη μπορεί να μας κάνει καλύτερους ανθρώπους
Stuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too. Full bio
Double-click the English transcript below to play the video.
παίκτες Γκο στον κόσμο,
greatest Go players,
in Silicon Valley call
στη Σίλικον Βάλλεϋ αποκαλούν
από ό,τι περιμέναμε.
a lot faster than we expected.
What about the real world?
Τι γίνεται όμως στον πραγματικό κόσμο;
είναι πολύ μεγαλύτερος
από το ταμπλό του Γκο.
μερικές από τις τεχνολογίες
of the technologies
is not yet happening in machines,
δεν έχουν ακόμα την ικανότητα ανάγνωσης,
έχει γραφτεί ποτέ από την ανθρωπότητα.
that the human race has ever written.
further ahead than humans can,
πιο μπροστά από τους ανθρώπους,
to more information,
σε περισσότερες πληροφορίες,
in the real world than we can.
στον πραγματικό κόσμο από εμάς.
everything that we value,
οτιδήποτε έχουμε σε εκτίμηση,
to a lot more intelligence,
σε πολύ περισσότερη ευφυΐα,
to what the human race can do.
στο τι μπορεί να κάνει η ανθρωπότητα.
as some people have described it,
όπως μερικοί το έχουν περιγράψει,
το τέλος της ανθρωπότητας;
of the human race?
and Stephen Hawking?
Μπιλ Γκέιτς και Στίβεν Χόκινγκ;
has been around for a while.
Η ιδέα αυτή κυκλοφορεί εδώ και καιρό.
τις μηχανές σε θέση υποταγής,
in a subservient position,
σε στρατηγικές στιγμές»
at strategic moments" --
"turning off the power" idea later on --
της «απενεργοποίησης» αργότερα-
ιδιαίτερα ταπεινωμένοι».
feel greatly humbled."
Ο Άλαν Τούρινγκ το 1951.
This is Alan Turing in 1951.
is the father of computer science
της επιστήμης υπολογιστών
the father of AI as well.
ο πατέρας της ΤΝ επίσης.
more intelligent than your own species,
πιο ευφυές από το είδος μας,
το έκαναν αυτό πριν εκατομμύρια χρόνια,
a few million years ago,
to discuss whether it was a good idea,
για να κουβεντιάσουν εάν ήταν καλή ιδέα,
they conclude, no,
sadness in their eyes.
την υπαρξιακή κρίση στα μάτια τους.
something smarter than your own species
ότι μάλλον δεν είναι καλή ιδέα
πιο έξυπνου από το είδος μας,
except stop doing AI,
να σταματήσουμε να φτιάχνουμε ΤΝ,
the benefits that I mentioned
που προανέφερα,
to keep doing AI.
την έρευνα της ΤΝ.
the problem a bit more.
καλύτερα το πρόβλημα.
πιθανώς μια καταστροφή;
that the purpose put into the machine
που θα αναθέσουμε σε μια μηχανή,
τον Νόρμπερτ Βίνερ το 1960,
one of the very early learning systems
συστήματα που μαθαίνουν μόνα τους
better than its creator.
από τον δημιουργό του.
I touch to turn to gold,"
«Θέλω ό,τι ακουμπώ να γίνεται χρυσάφι,»
that he put into the machine,
που ανέθεσε στη μηχανή,
and his relatives turned to gold
και οι συγγενείς του έγιναν χρυσάφι
"the King Midas problem"
which is not, in fact,
που στην πραγματικότητα
με αυτό που θέλουμε.
"the value alignment problem."
«πρόβλημα εναρμόνισης αξιών».
is not the only part of the problem.
δεν είναι το μόνο μέρος του προβλήματος.
"Fetch the coffee,"
«Φέρε τον καφέ»,
to fetch the coffee?
να μην συμβεί αυτό.
against interference
εναντίον παρεμβάσεων
that I have been given."
ενός σκοπού που πραγματικά
of an objective that is, in fact,
of the human race --
με τον αληθινό σκοπό των ανθρώπων,
takeaway from this talk.
το σημαντικότερο μήνυμα της ομιλίας μου.
τον καφέ, εάν είστε νεκροί.
the coffee if you're dead.
να το επαναλαμβάνετε τρεις φορές τη μέρα.
Repeat it to yourself three times a day.
«2001: Η Οδύσσεια του Διαστήματος»,
with the objectives of the humans,
με τους σκοπούς των ανθρώπων,
is not superintelligent.
αλλά εν τέλει ο Ντέιβ τον υπερνικά
but eventually Dave outwits him
να μην είμαστε τόσο τυχεροί.
την Τεχνητή Νοημοσύνη,
pursue objectives.
εάν μου επιτρέπετε,
of altruism, if you like,
of human objectives,
των ανθρώπινων σκοπών,
αθώες και συναισθηματικές αξίες.
touchy-feely, goody-goody values.
που οι άνθρωποι προτιμούν
that the human would prefer
ο νόμος του Ασίμωφ,
its own existence.
ενδιαφέρον στην διατήρηση της ύπαρξής του.
its existence whatsoever.
of humility, if you like.
της ταπεινοφροσύνης, εάν μου επιτρέπετε.
important to make robots safe.
για την δημιουργία ασφαλών ρομπότ.
but it doesn't know what they are.
χωρίς να γνωρίζει ποιες είναι.
of single-minded pursuit
by observation of human choices,
της παρατήρησης των ανθρώπινων επιλογών,
δίνουν πληροφορίες
our lives to be like.
να ζούμε τις ζωές μας.
«Μπορούμε να απενεργοποιήσουμε τη μηχανή;»
to this question of:
as Turing suggested.
right on the back.
απενεργοποίησης στην πλάτη.
να το απενεργοποιήσεις.
going to let you switch it off?
the coffee, I must fetch the coffee,
πρέπει να φέρω τον καφέ,
άμα είμαι κατεστραμμένος»,
has been listening to my talk,
παρακολουθεί την ομιλία μου,
"I must disable my 'off' switch,
το διακόπτη απενεργοποίησης
people in Starbucks
οποιονδήποτε στα Starbucks
seems to be inevitable,
φαίνεται αναπόφευκτη
a concrete, definite objective.
ενός σαφούς και ξεκάθαρου σκοπού.
is uncertain about the objective?
είναι αβέβαιη για το σκοπό;
might switch me off,
ίσως με απενεργοποιήσει,
principles right there.
και τη δεύτερη αρχή.
να με απενεργοποιήσει».
the incentive that the robot has
να εκτιμήσουμε ότι το κίνητρο του ρομπότ
να το απενεργοποιήσει,
the underlying objective.
it should be pursuing,
που πρέπει να ακολουθεί,
what it did wasn't right.
δεν ήταν σωστό.
of Greek symbols,
με κατάλληλη χρήση Ελληνικών συμβόλων,
is provably beneficial to the human.
είναι πιθανά χρήσιμο στον άνθρωπο.
with a machine that's designed in this way
σχεδιασμένη με αυτό τον τρόπο,
but this is the first step
που όμως είναι το πρώτο βήμα
with human-compatible AI.
με την ανθρωπίνως συμβατή ΤΝ.
scratching your head over.
που σας κινεί το ενδιαφέρον.
«Μάλλον, συμπεριφέρομαι άσχημα.
you know, I behave badly.
να συμπεριφέρεται σαν εμένα.
and take stuff from the fridge.
και παίρνω φαγητό από το ψυγείο.
you don't want the robot doing.
που δεν θέλω να κάνει το ρομπότ.
quite work that way.
συμπεριφέρεστε άσχημα,
is going to copy your behavior.
θα σας αντιγράψει.
και ίσως βοηθήσει να αντισταθείτε,
and maybe help you resist them,
να κάνουμε είναι
for any person and for any possible life
και για κάθε πιθανό τρόπο ζωής τους,
difficulties involved in doing this;
που εμπλέκονται σε αυτό,
is going to get solved very quickly.
στην ουσία, είμαστε εμείς.
we behave badly.
είμαστε ελεεινοί.
doesn't have to copy the behavior.
δεν χρειάζεται να μας αντιγράψει.
any objective of its own.
από μόνο του.
the desires of one person, the user,
μόνο τις επιθυμίες του χρήστη του,
the preferences of everybody.
τις επιλογές όλων.
amount of nastiness,
κάποια ποσότητα αθλιότητας,
that your nastiness, for example,
Για παράδειγμα,
ως ελεγκτής διαβατηρίων
and send your kids to school.
και να πάνε τα παιδιά σας σχολείο.
it doesn't mean it's going to steal.
οπότε δεν πρόκειται να κλέψει.
send your kids to school.
να τα στείλετε σχολείο.
καταπληκτικός παίκτης Γκο,
he took an action that lost the game.
έκανε μία που του στοίχισε το παιχνίδι.
τη συμπεριφορά του,
through a model of human cognition
μοντέλο κατανόησης της ανθρώπινης γνώσης
limitations -- a very complicated model.
περιορισμούς μας - ένα πολύπλοκο μοντέλο.
that we can work on understanding.
θα δουλέψουμε για να καταλάβουμε.
from my point of view as an AI researcher,
κατά τη γνώμη μου ως ερευνητής ΤΝ
πολλοί ερευνητές,
trade off, weigh up the preferences
κάπως να συμβιβάσει τις προτιμήσεις
moral philosophers have understood that,
και ηθικοί φιλόσοφοι το έχουν καταλάβει
looking for collaboration.
when you get that wrong.
όταν κάνεις λάθος σε αυτό.
a conversation, for example,
in a few years' time.
σε μερικά χρόνια.
to remind you about dinner tonight."
για να σου υπενθυμίσει το αποψινό δείπνο».
"What? What dinner?
Για ποιο πράγμα μιλάς;»
στις 7μμ».
with the secretary-general at 7:30.
τον γενικό γραμματέα στις 7:30.
my recommendation."
την πρότασή μου».
I can't just tell him I'm too busy."
να του πω ότι είμαι απασχολημένος».
for his plane to be delayed."
Κανόνισα να καθυστερήσει η πτήση του».
for lunch tomorrow."
για μεσημεριανό αύριο».
there's a slight mistake going on.
πως υπάρχει ένα μικρό λάθος.
οι σκοποί της γυναίκας μου,
«Χαρούμενη σύζυγος, Χαρούμενη ζωή».
after a hard day's work,
σκληρής δουλειάς
ούτε για μεσημεριανό».
Could you make some dinner?"
who are in more urgent need than you."
που έχουν περισσότερη ανάγκη από εσένα».
αυτά τα προβλήματα
to working on them.
τεράστιες ποσότητες δεδομένων.
they're going to read everything
πρόκειται να διαβάσουν
είναι για ανθρώπους να δρουν
is human beings doing things
δεδομένων από όπου θα μάθουν.
of data to learn from.
strong economic incentive
οικονομικό κίνητρο
αυτό πρέπει να ταΐσει τα παιδιά
and the robot has to feed the kids,
and there's nothing in the fridge.
και δεν υπάρχει τίποτα στο ψυγείο.
the human value function properly,
σωστά τη λειτουργία των ανθρώπινων αξιών
the nutritional value of the cat.
υπερισχύει της θρεπτικής της αξίας.
for family dinner."
γατάκι για οικογενειακό δείπνο».
of the domestic robot industry.
της βιομηχανίας οικιακών ρομπότ.
to get this right
για να επιτευχθεί σωστά η έρευνα
superintelligent machines.
στις υπερ-ευφυείς μηχανές.
the definition of AI
beneficial machines.
μόνο το δικό μας σκοπό
about what those objectives are,
για το ποιος είναι αυτός ο σκοπός
that we really want.
για το τι πραγματικά θέλουμε.
we will learn to be better people.
πώς να γίνουμε καλύτεροι άνθρωποι.
because I think they're setting up
για τον επόμενο ομιλητή.
seems intuitively really powerful.
φαίνεται ενστικτωδώς πολύ ισχυρή.
this idea that knowledge
και ανακαλύπτει την ιδέα
and rewriting that programming?
και ξαναγράψει τον κώδικά του;
it to learn more, as I said,
να μάθει περισσότερα, όπως είπα,
as it becomes more correct,
to interpret it correctly.
για να τα ερμηνεύει σωστά.
that books are very biased
ότι τα βιβλία είναι πολύ προκατειλημμένα
να κάνουν διάφορα.
για τους σκοπούς μας,
just boil it down to one law,
να το συμπτύξεις όλο σε ένα νόμο,
να με απενεργοποιήσει
a self-driving car
ένα αυτο-οδηγούμενο αυτοκίνητο
τον πεντάχρονο γιο σου
to be able to switch off the car
να μπορεί να το απενεργοποιήσει
and sensible the person is.
πόσο λογικό είναι ένα άτομο.
να το απενεργοποιήσεις.
to be switched off.
random or even malicious,
ασυνάρτητο ή κακόβουλο,
to be switched off.
να το απενεργοποιήσεις.
να βρεις τη λύση.
figure this out for us.
That was amazing.
(Χειροκρότημα)
ABOUT THE SPEAKER
Stuart Russell - AI expertStuart Russell wrote the standard text on AI; now he thinks deeply on AI's future -- and the future of us humans, too.
Why you should listen
Stuart Russell is a professor (and formerly chair) of Electrical Engineering and Computer Sciences at University of California at Berkeley. His book Artificial Intelligence: A Modern Approach (with Peter Norvig) is the standard text in AI; it has been translated into 13 languages and is used in more than 1,300 universities in 118 countries. His research covers a wide range of topics in artificial intelligence including machine learning, probabilistic reasoning, knowledge representation, planning, real-time decision making, multitarget tracking, computer vision, computational physiology, global seismic monitoring and philosophical foundations.
He also works for the United Nations, developing a new global seismic monitoring system for the nuclear-test-ban treaty. His current concerns include the threat of autonomous weapons and the long-term future of artificial intelligence and its relation to humanity.
Stuart Russell | Speaker | TED.com