ABOUT THE SPEAKER
Luis von Ahn - Computer scientist
Luis von Ahn builds systems that combine humans and computers to solve large-scale problems that neither can solve alone.

Why you should listen

Louis von Ahn is an associate professor of Computer Science at Carnegie Mellon University, and he's at the forefront of the crowdsourcing craze. His work takes advantage of the evergrowing Web-connected population to acheive collaboration in unprecedented numbers. His projects aim to leverage the crowd for human good. His company reCAPTCHA, sold to Google in 2009, digitizes human knowledge (books), one word at a time. His new project is Duolingo, which aims to get 100 million people translating the Web in every major language.

More profile about the speaker
Luis von Ahn | Speaker | TED.com
TEDxCMU

Luis von Ahn: Massive-scale online collaboration

Luis von Ahn: Online samenwerking op enorme schaal

Filmed:
1,740,008 views

Na het herwerken van CAPTCHA zodat elke door een mens getypte reactie boeken kon helpen digitaliseren, vroeg Luis von Ahn zich af op welke andere manier kleine bijdragen van velen op het internet voor het algemeen belang zijn te gebruiken. Op TEDxCMU vertelt hij hoe zijn nieuwe ambitieuze project, Duolingo, miljoenen mensen een nieuwe taal helpt leren door het Web snel en accuraat te vertalen - en dat allemaal gratis.
- Computer scientist
Luis von Ahn builds systems that combine humans and computers to solve large-scale problems that neither can solve alone. Full bio

Double-click the English transcript below to play the video.

00:15
How manyveel of you had to fillvullen out some sortsoort of webweb formformulier
0
0
2000
Hoeveel van jullie hebben al een webformulier moeten invullen
00:17
where you've been askedgevraagd to readlezen a distortedvervormd sequencevolgorde of characterstekens like this?
1
2000
2000
waar men je vroeg om zo’n vervormde reeks tekens te lezen?
00:19
How manyveel of you foundgevonden it really, really annoyingvervelend?
2
4000
2000
Hoeveel van jullie baalden daarvan?
00:21
Okay, outstandinguitstaande. So I inventeduitgevonden that.
3
6000
3000
Oké, uitstekend. Ik heb dat uitgevonden.
00:24
(LaughterGelach)
4
9000
2000
(Gelach)
00:26
Or I was one of the people who did it.
5
11000
2000
Of ik was toch er toch bij.
00:28
That thing is calledriep a CAPTCHACAPTCHA.
6
13000
2000
Dat ding heet een captcha.
00:30
And the reasonreden it is there is to make sure you, the entityentiteit fillingvulling out the formformulier,
7
15000
2000
Het verzekert dat het iets dat het formulier invult,
00:32
are actuallywerkelijk a humanmenselijk and not some sortsoort of computercomputer programprogramma
8
17000
3000
een mens is en niet een of ander computerprogramma
00:35
that was writtengeschreven to submitvoorleggen the formformulier millionsmiljoenen and millionsmiljoenen of timestijden.
9
20000
2000
dat is geschreven om het formulier miljoenen keren in te dienen.
00:37
The reasonreden it workswerken is because humansmensen,
10
22000
2000
De reden waarom het werkt, is omdat mensen,
00:39
at leastminst non-visually-impairedniet-visuele handicap humansmensen,
11
24000
2000
tenzij ze visueel gehandicapt zijn,
00:41
have no troublemoeite readinglezing these distortedvervormd squigglykronkelende characterstekens,
12
26000
2000
geen moeite hebben om deze vervormde kronkelige letters te lezen,
00:43
whereasterwijl computercomputer programsprogramma's simplyeenvoudigweg can't do it as well yetnog.
13
28000
3000
terwijl computerprogramma’s dat nog lang niet zo goed kunnen.
00:46
So for examplevoorbeeld, in the casegeval of TicketmasterTicketmaster,
14
31000
2000
Neem nu Ticketmaster,
00:48
the reasonreden you have to typetype these distortedvervormd characterstekens
15
33000
2000
daar moet je die vervormde tekens typen om te voorkomen
00:50
is to preventvoorkomen scalpersscalpers from writingschrift a programprogramma
16
35000
2000
dat herverkopers een programma schrijven
00:52
that can buykopen millionsmiljoenen of ticketskaartjes, two at a time.
17
37000
2000
dat miljoenen tickets per twee kan kopen.
00:54
CAPTCHAsCAPTCHA 's are used all over the InternetInternet.
18
39000
2000
Captcha's worden over het hele internet toegepast.
00:56
And sincesinds they're used so oftenvaak,
19
41000
2000
Omdat ze zo vaak gebruikt worden,
00:58
a lot of timestijden the precisenauwkeurig sequencevolgorde of randomwillekeurig characterstekens that is showngetoond to the usergebruiker
20
43000
2000
is de precieze volgorde van willekeurige karakters
01:00
is not so fortunateGelukkig.
21
45000
2000
die aan de gebruiker wordt getoond soms niet zo gelukkig.
01:02
So this is an examplevoorbeeld from the YahooYahoo registrationregistratie pagepagina.
22
47000
3000
Dit is een voorbeeld van de registratiepagina van Yahoo.
01:05
The randomwillekeurig characterstekens that happenedgebeurd to be showngetoond to the usergebruiker
23
50000
2000
De willekeurige tekens die toevallig aan de gebruiker werden getoond,
01:07
were W, A, I, T, whichwelke, of courseCursus, spellspell a wordwoord.
24
52000
3000
waren W, A, I, T, die natuurlijk een woord spellen.
01:10
But the bestbeste partdeel is the messagebericht
25
55000
3000
Maar het beste deel is de boodschap
01:13
that the YahooYahoo help deskbureau got about 20 minutesnotulen laterlater.
26
58000
3000
die de Yahoo helpdesk ongeveer 20 minuten later ontving.
01:16
TextTekst: "Help! I've been waitingaan het wachten for over 20 minutesnotulen, and nothing happensgebeurt."
27
61000
3000
Tekst: "Help, ik zit al meer dan 20 minuten te wachten en er gebeurt niets."
01:19
(LaughterGelach)
28
64000
4000
(Gelach)
01:23
This personpersoon thought they needednodig to wait.
29
68000
2000
Hij dacht dat hij moest wachten.
01:25
This of courseCursus, is not as badslecht as this poorarm personpersoon.
30
70000
3000
Dit is natuurlijk niet zo erg als voor deze sukkelaar.
01:28
(LaughterGelach)
31
73000
2000
(Gelach)
01:30
CAPTCHACAPTCHA ProjectProject is something that we did here at CarnegieCarnegie MelllonMelllon over 10 yearsjaar agogeleden,
32
75000
3000
Captcha werd meer dan 10 jaar geleden aan Carnegie Melllon ontwikkeld
01:33
and it's been used everywhereoveral.
33
78000
2000
en het wordt overal gebruikt.
01:35
Let me now tell you about a projectproject that we did a fewweinig yearsjaar laterlater,
34
80000
2000
Een paar jaar later namen we
01:37
whichwelke is sortsoort of the nextvolgende evolutionevolutie of CAPTCHACAPTCHA.
35
82000
3000
een volgende stap in de evolutie van captcha.
01:40
This is a projectproject that we call reCAPTCHAreCAPTCHA,
36
85000
2000
Dit noemen we recaptcha,
01:42
whichwelke is something that we startedbegonnen here at CarnegieCarnegie MellonMellon,
37
87000
2000
ook begonnen aan Carnegie Mellon,
01:44
then we turnedgedraaid it into a startupbeginnen companybedrijf.
38
89000
2000
maar nu een aparte onderneming.
01:46
And then about a yearjaar and a halfvoor de helft agogeleden,
39
91000
2000
Ongeveer anderhalf jaar geleden
01:48
GoogleGoogle actuallywerkelijk acquiredverworven this companybedrijf.
40
93000
2000
nam Google dit bedrijf over.
01:50
So let me tell you what this projectproject startedbegonnen.
41
95000
2000
Het startte
01:52
So this projectproject startedbegonnen from the followingvolgend realizationrealisatie:
42
97000
3000
vanuit de volgende idee:
01:55
It turnsbochten out that approximatelyongeveer 200 millionmiljoen CAPTCHAsCAPTCHA 's
43
100000
2000
elke dag worden over de hele wereld
01:57
are typedgetypt everydayelke dag by people around the worldwereld-.
44
102000
3000
door mensen ongeveer 200 miljoen captcha's getypt.
02:00
When I first heardgehoord this, I was quiteheel proudtrots of myselfmezelf.
45
105000
2000
Toen ik dit voor het eerst hoorde, was ik heel trots op mezelf.
02:02
I thought, look at the impactbotsing that my researchOnderzoek has had.
46
107000
2000
Kijk eens naar de impact die mijn onderzoek heeft gehad, dacht ik.
02:04
But then I startedbegonnen feelinggevoel badslecht.
47
109000
2000
Maar toen begon ik me slecht te voelen.
02:06
See here'shier is the thing, eachelk time you typetype a CAPTCHACAPTCHA,
48
111000
2000
Telkens je een captcha typt,
02:08
essentiallyin wezen you wasteverspilling 10 secondsseconden of your time.
49
113000
3000
verspil je 10 seconden van je tijd.
02:11
And if you multiplyvermenigvuldigen that by 200 millionmiljoen,
50
116000
2000
Vermenigvuldig dat met 200 miljoen dan zie je
02:13
you get that humanityde mensheid as a wholegeheel is wastingverspilling about 500,000 hoursuur everyelk day
51
118000
3000
dat de mensheid elke dag ongeveer 500.000 uren verspilt
02:16
typingtypen these annoyingvervelend CAPTCHAsCAPTCHA 's.
52
121000
2000
door het typen van die vervelende captcha’s.
02:18
So then I startedbegonnen feelinggevoel badslecht.
53
123000
2000
Toen begon ik me pas slecht te voelen.
02:20
(LaughterGelach)
54
125000
2000
(Gelach)
02:22
And then I startedbegonnen thinkinghet denken, well, of courseCursus, we can't just get ridbevrijden of CAPTCHAsCAPTCHA 's,
55
127000
3000
We kunnen natuurlijk niet zonder captcha's,
02:25
because the securityveiligheid of the WebWeb sortsoort of dependshangt af on them.
56
130000
2000
omdat de veiligheid van het Web er van afhangt.
02:27
But then I startedbegonnen thinkinghet denken, is there any way we can use this effortinspanning
57
132000
3000
Maar ik vroeg me af er geen manier was om deze inspanning te gebruiken
02:30
for something that is good for humanityde mensheid?
58
135000
2000
voor iets dat goed is voor de mensheid.
02:32
So see, here'shier is the thing.
59
137000
2000
Hier is het.
02:34
While you're typingtypen a CAPTCHACAPTCHA, duringgedurende those 10 secondsseconden,
60
139000
2000
Terwijl jullie een captcha typen,
02:36
your brainhersenen is doing something amazingverbazingwekkend.
61
141000
2000
doen tijdens die 10 seconden jullie hersenen iets geweldigs.
02:38
Your brainhersenen is doing something that computerscomputers cannotkan niet yetnog do.
62
143000
2000
Iets dat computers nog niet kunnen doen.
02:40
So can we get you to do usefulnuttig work for those 10 secondsseconden?
63
145000
3000
Kan dat omgezet worden in 10 seconden nuttig werk?
02:43
AnotherEen ander way of puttingzetten it is,
64
148000
2000
Om het anders te zeggen:
02:45
is there some humongousHumongous problemprobleem that we cannotkan niet yetnog get computerscomputers to solveoplossen,
65
150000
2000
is er een gigantisch probleem dat computers nog niet kunnen oplossen,
02:47
yetnog we can splitspleet into tinyklein 10-second chunksbrokken
66
152000
3000
maar dat we kunnen opsplitsen in brokjes van 10 seconden
02:50
suchzodanig that eachelk time somebodyiemand solvesLost a CAPTCHACAPTCHA
67
155000
2000
zodanig dat elke keer dat iemand een captcha oplost,
02:52
they solveoplossen a little bitbeetje of this problemprobleem?
68
157000
2000
ze een stukje van dit probleem oplossen?
02:54
And the answerantwoord to that is "yes," and this is what we're doing now.
69
159000
2000
Het antwoord is "ja" en daar zijn we nu mee bezig.
02:56
So what you maymei not know is that nowadaysvandaag de dag while you're typingtypen a CAPTCHACAPTCHA,
70
161000
3000
Terwijl je een captcha typt,
02:59
not only are you authenticatingverificatie yourselfjezelf as a humanmenselijk,
71
164000
2000
identificeer je je niet alleen als mens,
03:01
but in additiontoevoeging you're actuallywerkelijk helpinghelpen us to digitizedigitaliseren booksboeken.
72
166000
2000
maar help je ons om boeken te digitaliseren.
03:03
So let me explainuitleg geven how this workswerken.
73
168000
2000
Ik leg het uit.
03:05
So there's a lot of projectsprojecten out there tryingproberen to digitizedigitaliseren booksboeken.
74
170000
2000
Er zijn een heleboel projecten die boeken proberen te digitaliseren.
03:07
GoogleGoogle has one. The InternetInternet ArchiveArchief has one.
75
172000
3000
Google heeft er een. Het Internet Archive heeft er een.
03:10
AmazonAmazon, now with the KindleKindle, is tryingproberen to digitizedigitaliseren booksboeken.
76
175000
2000
Amazon, nu met de Kindle, probeert boeken te digitaliseren.
03:12
BasicallyIn principe the way this workswerken
77
177000
2000
Dit werkt als volgt:
03:14
is you startbegin with an oldoud bookboek.
78
179000
2000
je begint met een oud boek.
03:16
You've seengezien those things, right? Like a bookboek?
79
181000
2000
Je kent die dingen toch nog?
03:18
(LaughterGelach)
80
183000
2000
(Gelach)
03:20
So you startbegin with a bookboek, and then you scanscannen it.
81
185000
2000
Je begint met een boek, je scant het.
03:22
Now scanninghet scannen a bookboek
82
187000
2000
Nu is het scannen van een boek
03:24
is like takingnemen a digitaldigitaal photographfotograaf of everyelk pagepagina of the bookboek.
83
189000
2000
als het nemen van een digitale foto van elke pagina van het boek.
03:26
It givesgeeft you an imagebeeld for everyelk pagepagina of the bookboek.
84
191000
2000
Het geeft je een beeld voor elke pagina van het boek.
03:28
This is an imagebeeld with texttekst for everyelk pagepagina of the bookboek.
85
193000
2000
Dit is een afbeelding met tekst voor elke pagina van het boek.
03:30
The nextvolgende stepstap in the processwerkwijze
86
195000
2000
De volgende stap in het proces
03:32
is that the computercomputer needsbehoefte aan to be ablein staat to decipherontcijferen all of the wordstekst in this imagebeeld.
87
197000
3000
is dat de computer alle woorden in dit beeld moet kunnen ontcijferen.
03:35
That's usinggebruik makend van a technologytechnologie calledriep OCROCR,
88
200000
2000
Dat gaat door middel van de OCR-technologie,
03:37
for opticaloptische characterkarakter recognitionerkenning,
89
202000
2000
voor ‘optical character recognition’ (optische letterherkenning).
03:39
whichwelke takes a pictureafbeelding of texttekst
90
204000
2000
Die maakt een beeld van de tekst
03:41
and triesprobeert to figurefiguur out what texttekst is in there.
91
206000
2000
en probeert te achterhalen welke tekst er staat.
03:43
Now the problemprobleem is that OCROCR is not perfectperfect.
92
208000
2000
Het probleem is dat OCR niet perfect is.
03:45
EspeciallyMet name for olderouder booksboeken
93
210000
2000
Zeker bij oudere boeken,
03:47
where the inkinkt has fadedverschoten and the pagespagina's have turnedgedraaid yellowgeel,
94
212000
3000
waar de inkt vervaagd is en de pagina’s vergeeld zijn,
03:50
OCROCR cannotkan niet recognizeherken a lot of the wordstekst.
95
215000
2000
herkent OCR veel woorden niet.
03:52
For examplevoorbeeld, for things that were writtengeschreven more than 50 yearsjaar agogeleden,
96
217000
2000
Voor dingen die meer dan 50 jaar geleden zijn geschreven,
03:54
the computercomputer cannotkan niet recognizeherken about 30 percentprocent of the wordstekst.
97
219000
3000
kan de computer ongeveer 30 procent van de woorden niet herkennen.
03:57
So what we're doing now
98
222000
2000
Nu nemen we
03:59
is we're takingnemen all of the wordstekst that the computercomputer cannotkan niet recognizeherken
99
224000
2000
alle woorden die de computer niet kan herkennen
04:01
and we're gettingkrijgen people to readlezen them for us
100
226000
2000
en we laten ze mensen voor ons lezen
04:03
while they're typingtypen a CAPTCHACAPTCHA on the InternetInternet.
101
228000
2000
terwijl ze een captcha op het internet typen.
04:05
So the nextvolgende time you typetype a CAPTCHACAPTCHA, these wordstekst that you're typingtypen
102
230000
3000
Telkens je een captcha typt, komen de woorden die je typt
04:08
are actuallywerkelijk wordstekst that are comingkomt eraan from booksboeken that are beingwezen digitizedgedigitaliseerd
103
233000
3000
van boeken die worden gedigitaliseerd en
04:11
that the computercomputer could not recognizeherken.
104
236000
2000
die de computer niet kon herkennen.
04:13
And now the reasonreden we have two wordstekst nowadaysvandaag de dag insteadin plaats daarvan of one
105
238000
2000
Waarom staan er nu telkens twee woorden?
04:15
is because, you see, one of the wordstekst
106
240000
2000
Een van de woorden
04:17
is a wordwoord that the systemsysteem just got out of a bookboek,
107
242000
2000
is een woord uit een boek,
04:19
it didn't know what it was, and it's going to presentaanwezig it to you.
108
244000
3000
dat het systeem niet kent en aan je voorlegt.
04:22
But sincesinds it doesn't know the answerantwoord for it, it cannotkan niet graderang it for you.
109
247000
3000
Maar aangezien het systeem het antwoord niet kent, kan het je geen punten geven.
04:25
So what we do is we give you anothereen ander wordwoord,
110
250000
2000
Daarom krijg je nog een ander woord,
04:27
one for whichwelke the systemsysteem does know the answerantwoord.
111
252000
2000
een waarvoor het systeem het antwoord wel kent.
04:29
We don't tell you whichwelke one'séén is whichwelke, and we say, please typetype bothbeide.
112
254000
2000
We vertellen je niet welk dat is. Typ ze dus maar allebei.
04:31
And if you typetype the correctcorrect wordwoord
113
256000
2000
Als je dan het juiste woord typt
04:33
for the one for whichwelke the systemsysteem alreadynu al knowsweet the answerantwoord,
114
258000
2000
waarvoor het systeem het antwoord al weet,
04:35
it assumesgaat uit van you are humanmenselijk,
115
260000
2000
wordt verondersteld dat je een mens bent
04:37
and it alsoook getskrijgt some confidencevertrouwen that you typedgetypt the other wordwoord correctlycorrect.
116
262000
2000
en geeft dat wat vertrouwen dat je het andere woord juist hebt getypt.
04:39
And if we repeatherhaling this processwerkwijze to like 10 differentverschillend people
117
264000
3000
Als we dit proces herhalen voor 10 verschillende mensen
04:42
and all of them agreemee eens on what the newnieuwe wordwoord is,
118
267000
2000
en ze het allemaal eens zijn over het nieuwe woord,
04:44
then we get one more wordwoord digitizedgedigitaliseerd accuratelynauwkeurig.
119
269000
2000
dan hebben we er weer een nauwkeurig gedigitaliseerd woord bij.
04:46
So this is how the systemsysteem workswerken.
120
271000
2000
Zo werkt het systeem.
04:48
And basicallyeigenlijk, sincesinds we releasedvrijgelaten it about threedrie or fourvier yearsjaar agogeleden,
121
273000
3000
Sinds we er ongeveer drie of vier jaar geleden mee zijn gestart,
04:51
a lot of websiteswebsites have startedbegonnen switchingswitching
122
276000
2000
zijn veel websites begonnen over te schakelen
04:53
from the oldoud CAPTCHACAPTCHA where people wastedverspild theirhun time
123
278000
2000
van de oude captcha waar mensen hun tijd verspilden
04:55
to the newnieuwe CAPTCHACAPTCHA where people are helpinghelpen to digitizedigitaliseren booksboeken.
124
280000
2000
naar de nieuwe captcha waar mensen helpen om boeken te digitaliseren.
04:57
So for examplevoorbeeld, TicketmasterTicketmaster.
125
282000
2000
Ticketmaster bijvoorbeeld.
04:59
So everyelk time you buykopen ticketskaartjes on TicketmasterTicketmaster, you help to digitizedigitaliseren a bookboek.
126
284000
3000
Telkens je op Ticketmaster tickets koopt, help je bij het digitaliseren van een boek.
05:02
FacebookFacebook: EveryElke time you addtoevoegen a friendvriend or pokePoke somebodyiemand,
127
287000
2000
Facebook: elke keer als je een vriend toevoegt of iemand port,
05:04
you help to digitizedigitaliseren a bookboek.
128
289000
2000
help je bij het digitaliseren van een boek.
05:06
TwitterTwitter and about 350,000 other sitesplaatsen are all usinggebruik makend van reCAPTCHAreCAPTCHA.
129
291000
3000
Twitter en ongeveer 350.000 andere sites gebruiken allemaal recaptcha.
05:09
And in factfeit, the numberaantal of sitesplaatsen that are usinggebruik makend van reCAPTCHAreCAPTCHA is so highhoog
130
294000
2000
In feite is het aantal sites die gebruik maken van recaptcha zo hoog
05:11
that the numberaantal of wordstekst that we're digitizingdigitaliseren perper day is really, really largegroot.
131
296000
3000
dat het aantal woorden dat we per dag digitaliseren enorm is.
05:14
It's about 100 millionmiljoen a day,
132
299000
2000
Ongeveer 100 miljoen per dag,
05:16
whichwelke is the equivalentgelijkwaardig of about two and a halfvoor de helft millionmiljoen booksboeken a yearjaar.
133
301000
4000
dat is het equivalent van ongeveer twee en een half miljoen boeken per jaar.
05:20
And this is all beingwezen donegedaan one wordwoord at a time
134
305000
2000
Dit gebeurt allemaal woord per woord
05:22
by just people typingtypen CAPTCHAsCAPTCHA 's on the InternetInternet.
135
307000
2000
doordat mensen captcha’s typen op het internet.
05:24
(ApplauseApplaus)
136
309000
8000
(Applaus)
05:32
Now of courseCursus,
137
317000
2000
Natuurlijk kunnen er grappige dingen gebeuren
05:34
sincesinds we're doing so manyveel wordstekst perper day,
138
319000
2000
omdat we het
05:36
funnygrappig things can happengebeuren.
139
321000
2000
met zoveel woorden per dag doen.
05:38
And this is especiallyvooral truewaar because now we're givinggeven people
140
323000
2000
Vooral omdat we nu de mensen twee willekeurig gekozen
05:40
two randomlywillekeurig chosenuitgekozen EnglishEngels wordstekst nextvolgende to eachelk other.
141
325000
2000
Engelse woorden naast elkaar presenteren.
05:42
So funnygrappig things can happengebeuren.
142
327000
2000
Zo kunnen er grappige dingen gebeuren.
05:44
For examplevoorbeeld, we presentedgepresenteerd this wordwoord.
143
329000
2000
Zo presenteerden wij dit woord:
05:46
It's the wordwoord "ChristiansChristenen"; there's nothing wrongfout with it.
144
331000
2000
"Christenen". Niets mis mee.
05:48
But if you presentaanwezig it alonglangs with anothereen ander randomlywillekeurig chosenuitgekozen wordwoord,
145
333000
3000
Maar als je het samen met een ander willekeurig gekozen woord presenteert,
05:51
badslecht things can happengebeuren.
146
336000
2000
kan het fout gaan.
05:53
So we get this. (TextTekst: badslecht christiansChristenen)
147
338000
2000
We kregen dit. (Tekst: ‘slechte christenen’)
05:55
But it's even worseerger, because the particularbijzonder websitewebsite where we showedtoonden this
148
340000
3000
Maar het is nog erger, want de website waar we dit zagen, heette,
05:58
actuallywerkelijk happenedgebeurd to be calledriep The EmbassyAmbassade of the KingdomKoninkrijk of God.
149
343000
3000
echt gebeurd, 'De Ambassade van het Koninkrijk Gods'.
06:01
(LaughterGelach)
150
346000
2000
(Gelach)
06:03
OopsOeps.
151
348000
2000
Oeps.
06:05
(LaughterGelach)
152
350000
3000
(Gelach)
06:08
Here'sHier is anothereen ander really badslecht one.
153
353000
2000
Hier nog een die beter kon.
06:10
JohnEdwardsJohnEdwards.comcom
154
355000
2000
JohnEdwards.com
06:12
(TextTekst: DamnDamn liberalliberale)
155
357000
3000
(Tekst: ‘verdomde liberaal’)
06:15
(LaughterGelach)
156
360000
2000
(Gelach)
06:17
So we keep on insultingbeledigen people left and right everydayelke dag.
157
362000
3000
Elke dag krijgen we wel enkele van die ongewilde beledigingen.
06:20
Now, of courseCursus, we're not just insultingbeledigen people.
158
365000
2000
We zijn niet alleen maar bezig met het beledigen van mensen.
06:22
See here'shier is the thing, sincesinds we're presentingpresenteren two randomlywillekeurig chosenuitgekozen wordstekst,
159
367000
3000
Door het presenteren van twee willekeurig gekozen woorden
06:25
interestinginteressant things can happengebeuren.
160
370000
2000
kunnen interessante dingen gebeuren.
06:27
So this actuallywerkelijk has givengegeven risestijgen
161
372000
2000
Dit gaf aanleiding
06:29
to a really biggroot InternetInternet memememe
162
374000
3000
tot een grote internet-meme.
06:32
that tenstientallen of thousandsduizenden of people have participateddeelgenomen in,
163
377000
2000
Tienduizenden mensen namen eraan deel.
06:34
whichwelke is calledriep CAPTCHACAPTCHA artkunst.
164
379000
2000
Het heet captchakunst.
06:36
I'm sure some of you have heardgehoord about it.
165
381000
2000
Sommigen van jullie hebben er zeker al van gehoord.
06:38
Here'sHier is how it workswerken.
166
383000
2000
Zo werkt het.
06:40
ImagineStel je voor you're usinggebruik makend van the InternetInternet and you see a CAPTCHACAPTCHA
167
385000
2000
Stel je voor dat je het internet gebruikt en je ziet een captcha
06:42
that you think is somewhatenigszins peculiareigenaardige,
168
387000
2000
die je een beetje gek vindt,
06:44
like this CAPTCHACAPTCHA. (TextTekst: invisibleonzichtbaar toasterbroodrooster)
169
389000
2000
zoals deze captcha. (Tekst: ‘onzichtbare broodrooster’)
06:46
Then what you're supposedvermeend to do is you take a screenscherm shotschot of it.
170
391000
2000
Dan neem je er een screenshot van.
06:48
Then of courseCursus, you fillvullen out the CAPTCHACAPTCHA
171
393000
2000
Natuurlijk vul je ook de captcha in
06:50
because you help us digitizedigitaliseren a bookboek.
172
395000
2000
omdat je ons helpt bij het digitaliseren van een boek.
06:52
But then, first you take a screenscherm shotschot,
173
397000
2000
Maar eerst neem je een screenshot
06:54
and then you drawtrek something that is relatedverwant to it.
174
399000
2000
en dan teken je iets dat ermee te maken heeft.
06:56
(LaughterGelach)
175
401000
2000
(Gelach)
06:58
That's how it workswerken.
176
403000
3000
Zo werkt het.
07:01
There are tenstientallen of thousandsduizenden of these.
177
406000
3000
Er zijn er tienduizenden van.
07:04
Some of them are very cuteschattig. (TextTekst: clenchedgebalde it)
178
409000
2000
Sommigen zijn erg schattig. (Tekst: ‘balde het’)
07:06
(LaughterGelach)
179
411000
2000
(Gelach)
07:08
Some of them are funniergrappiger.
180
413000
2000
Sommigen van hen zijn grappiger.
07:10
(TextTekst: stonedgestenigd foundersoprichters)
181
415000
3000
(Tekst: ‘stoned stichters’)
07:13
(LaughterGelach)
182
418000
3000
(Gelach)
07:16
And some of them,
183
421000
2000
En sommige ervan,
07:18
like paleontologicalpaleontologische shvisleshvisle,
184
423000
3000
zoals paleontologische shvisle,
07:21
they containbevatten SnoopSnoop DoggDogg.
185
426000
2000
bevatten Snoop Dogg.
07:23
(LaughterGelach)
186
428000
3000
(Gelach)
07:26
Okay, so this is my favoritefavoriete numberaantal of reCAPTCHAreCAPTCHA.
187
431000
2000
Oké, dit is mijn favoriete getal van recaptcha.
07:28
So this is the favoritefavoriete thing that I like about this wholegeheel projectproject.
188
433000
3000
Hier hou ik van.
07:31
This is the numberaantal of distinctonderscheiden people
189
436000
2000
Het is het aantal verschillende mensen
07:33
that have helpedgeholpen us digitizedigitaliseren at leastminst one wordwoord out of a bookboek throughdoor reCAPTCHAreCAPTCHA:
190
438000
3000
die ons ten minste één woord uit een boek via recaptcha hebben helpen digitaliseren:
07:36
750 millionmiljoen,
191
441000
2000
750 miljoen,
07:38
whichwelke is a little over 10 percentprocent of the world's's werelds populationbevolking,
192
443000
2000
dat is iets meer dan 10 procent van de wereldbevolking,
07:40
has helpedgeholpen us digitizedigitaliseren humanmenselijk knowledgekennis.
193
445000
2000
heeft ons geholpen bij het digitaliseren van de menselijke kennis.
07:42
And it is numbersgetallen like these that motivatemotiveren my researchOnderzoek agendaagenda.
194
447000
3000
Dergelijke getallen motiveren mijn onderzoeksagenda.
07:45
So the questionvraag that motivatesmotiveert my researchOnderzoek is the followingvolgend:
195
450000
3000
De vraag die mijn onderzoek motiveert, is de volgende:
07:48
If you look at humanity'sde mensheid large-scalegrootschalig achievementsresultaten,
196
453000
2000
als je naar de grote successen van de mensheid kijkt,
07:50
these really biggroot things
197
455000
2000
de echt grote dingen
07:52
that humanityde mensheid has gottengekregen togethersamen and donegedaan historicallyhistorisch --
198
457000
3000
die de mensen voor mekaar hebben gekregen in de geschiedenis -
07:55
like for examplevoorbeeld, buildinggebouw the pyramidspiramides of EgyptEgypte
199
460000
2000
zoals bijvoorbeeld de piramides van Egypte
07:57
or the PanamaPanama CanalKanaal
200
462000
2000
of het Panamakanaal
07:59
or puttingzetten a man on the MoonMaan --
201
464000
2000
of een man op de maan zetten -
08:01
there is a curiousnieuwsgierig factfeit about them,
202
466000
2000
dan is het merkwaardig dat dat allemaal gebeurde
08:03
and it is that they were all donegedaan with about the samedezelfde numberaantal off people.
203
468000
2000
met telkens ongeveer hetzelfde aantal mensen.
08:05
It's weirdvreemd; they were all donegedaan with about 100,000 people.
204
470000
3000
Het is raar, maar het werd telkens gedaan met ongeveer 100.000 mensen.
08:08
And the reasonreden for that is because, before the InternetInternet,
205
473000
3000
En dat komt omdat, vóór het internet,
08:11
coordinatingcoördinatie van de more than 100,000 people,
206
476000
2000
het coördineren van meer dan 100.000 mensen,
08:13
let alonealleen payingbetalen them, was essentiallyin wezen impossibleonmogelijk.
207
478000
3000
laat staan ze betalen, in wezen onmogelijk was.
08:16
But now with the InternetInternet, I've just showngetoond you a projectproject
208
481000
2000
Maar nu met het internet, heb ik jullie een project getoond
08:18
where we'vewij hebben gottengekregen 750 millionmiljoen people
209
483000
2000
waar 750 miljoen mensen ons hielpen
08:20
to help us digitizedigitaliseren humanmenselijk knowledgekennis.
210
485000
2000
bij het digitaliseren van de menselijke kennis.
08:22
So the questionvraag that motivatesmotiveert my researchOnderzoek is,
211
487000
2000
De vraag die mijn onderzoek motiveert, is:
08:24
if we can put a man on the MoonMaan with 100,000,
212
489000
3000
“Als we met 100.000 een man op de maan kunnen brengen,
08:27
what can we do with 100 millionmiljoen?
213
492000
2000
wat kunnen we dan doen met 100 miljoen?”
08:29
So basedgebaseerde on this questionvraag,
214
494000
2000
Hiervan uitgaande
08:31
we'vewij hebben had a lot of differentverschillend projectsprojecten that we'vewij hebben been workingwerkend on.
215
496000
2000
hebben we een hoop verschillende projecten lopen.
08:33
Let me tell you about one that I'm mostmeest excitedopgewonden about.
216
498000
3000
Over het volgende ben ik het meest enthousiast.
08:36
This is something that we'vewij hebben been semi-quietlysemi-rustig workingwerkend on
217
501000
2000
Daar zijn we het laatste anderhalf jaar
08:38
for the last yearjaar and a halfvoor de helft or so.
218
503000
2000
af en toe mee bezig geweest.
08:40
It hasn'theeft niet yetnog been launchedgelanceerd. It's calledriep DuolingoDuolingo.
219
505000
2000
Het is nog niet van start gegaan. Het heet Duolingo.
08:42
SinceSinds it hasn'theeft niet been launchedgelanceerd, shhhhhShhhhh!
220
507000
2000
Aangezien het niet gelanceerd is: “Shhhhh!”
08:44
(LaughterGelach)
221
509000
2000
(Gelach)
08:46
Yeah, I can trustvertrouwen you'llje zult do that.
222
511000
2000
Ja, ik mag jullie vertrouwen.
08:48
So this is the projectproject. Here'sHier is how it startedbegonnen.
223
513000
2000
Zo begon het.
08:50
It startedbegonnen with me posingposeren a questionvraag to my graduateafstuderen studentstudent,
224
515000
2000
Het begon met een vraag aan mijn student,
08:52
SeverinSeverin HackerHacker.
225
517000
2000
Severin Hacker.
08:54
Okay, that's SeverinSeverin HackerHacker.
226
519000
2000
Dit is Severin Hacker.
08:56
So I posedstelde the questionvraag to my graduateafstuderen studentstudent.
227
521000
2000
Ik stelde de vraag aan mijn student.
08:58
By the way, you did hearhoren me correctlycorrect;
228
523000
2000
Tussen haakjes, jullie hebben me goed verstaan.
09:00
his last namenaam is HackerHacker.
229
525000
2000
Zijn achternaam is echt Hacker.
09:02
So I posedstelde this questionvraag to him:
230
527000
2000
Ik vroeg hem:
09:04
How can we get 100 millionmiljoen people
231
529000
2000
“Hoe kunnen we 100 miljoen mensen gratis het Web
09:06
translatingvertalen the WebWeb into everyelk majorgroot languagetaal for freegratis?
232
531000
3000
in iedere belangrijke taal laten vertalen?”
09:09
Okay, so there's a lot of things to say about this questionvraag.
233
534000
2000
Daar valt heel wat over te zeggen.
09:11
First of all, translatingvertalen the WebWeb.
234
536000
2000
In de eerste plaats, het vertalen van het Web.
09:13
So right now the WebWeb is partitionedgepartitioneerd into multiplemeerdere languagestalen.
235
538000
3000
Nu is het Web opgedeeld in meerdere talen.
09:16
A largegroot fractionfractie of it is in EnglishEngels.
236
541000
2000
Een groot deel daarvan is in het Engels.
09:18
If you don't know any EnglishEngels, you can't accesstoegang it.
237
543000
2000
Als je geen Engels kent, heb je er geen toegang toe.
09:20
But there's largegroot fractionsbreuken in other differentverschillend languagestalen,
238
545000
2000
Maar grote fracties zijn in andere talen,
09:22
and if you don't know those languagestalen, you can't accesstoegang it.
239
547000
3000
en als je die talen niet kent, heb je er geen toegang toe.
09:25
So I would like to translatevertalen all of the WebWeb, or at leastminst mostmeest of the WebWeb,
240
550000
3000
Ik zou graag het hele Web vertalen, of in ieder geval het grootste deel ervan,
09:28
into everyelk majorgroot languagetaal.
241
553000
2000
in elke grote taal.
09:30
So that's what I would like to do.
242
555000
2000
Dat is het wat ik zou willen doen.
09:32
Now some of you maymei say, why can't we use computerscomputers to translatevertalen?
243
557000
3000
Nu zullen sommigen van jullie misschien zeggen: “Waarom kunnen we daar geen computers voor gebruiken?
09:35
Why can't we use machinemachine translationvertaling?
244
560000
2000
Waarom geen automatische vertaling?
09:37
MachineMachine translationvertaling nowadaysvandaag de dag is startingbeginnend to translatevertalen some sentenceszinnen here and there.
245
562000
2000
Machinevertaling kan vandaag hier en daar enkele zinnen vertalen.
09:39
Why can't we use it to translatevertalen the wholegeheel WebWeb?
246
564000
2000
Waarom kunnen we dat niet gebruiken om het hele Web te vertalen?”
09:41
Well the problemprobleem with that is that it's not yetnog good enoughgenoeg
247
566000
2000
Het probleem is dat het nog niet goed genoeg is
09:43
and it probablywaarschijnlijk won'tzal niet be for the nextvolgende 15 to 20 yearsjaar.
248
568000
2000
en het dat waarschijnlijk ook niet zal zijn voor de komende 15 tot 20 jaar.
09:45
It makesmerken a lot of mistakesfouten.
249
570000
2000
De machine maakt veel fouten.
09:47
Even when it doesn't make a mistakevergissing,
250
572000
2000
Zelfs als ze geen fout maakt,
09:49
sincesinds it makesmerken so manyveel mistakesfouten, you don't know whetherof to trustvertrouwen it or not.
251
574000
3000
weet je niet of je ze kan vertrouwen omdat ze zo veel fouten maakt.
09:52
So let me showtonen you an examplevoorbeeld
252
577000
2000
Een voorbeeld
09:54
of something that was translatedvertaalde with a machinemachine.
253
579000
2000
van iets dat werd vertaald met een machine.
09:56
ActuallyEigenlijk it was a forumForum postpost.
254
581000
2000
Het stond op een forum.
09:58
It was somebodyiemand who was tryingproberen to askvragen a questionvraag about JavaScriptJavaScript.
255
583000
3000
Iemand probeerde een vraag over JavaScript te stellen.
10:01
It was translatedvertaalde from JapaneseJapans into EnglishEngels.
256
586000
3000
Het werd uit het Japans naar het Engels vertaald.
10:04
So I'll just let you readlezen.
257
589000
2000
Ik laat het je lezen.
10:06
This personpersoon startsstarts apologizingzich te verontschuldigen
258
591000
2000
Deze persoon begint met zich te verontschuldigen
10:08
for the factfeit that it's translatedvertaalde with a computercomputer.
259
593000
2000
voor het feit dat het vertaald werd met een computer.
10:10
So the nextvolgende sentencezin is is going to be the preamblepreambule to the questionvraag.
260
595000
3000
De volgende zin gaat aan de eigenlijke vraag vooraf.
10:13
So he's just explaininguitleggen something.
261
598000
2000
Hij legt alleen iets uit.
10:15
RememberVergeet niet, it's a questionvraag about JavaScriptJavaScript.
262
600000
3000
Vergeet niet dat het een vraag is over JavaScript.
10:19
(TextTekst: At oftenvaak, the goat-timegeit-tijd installinstalleren a errorfout is vomitbraaksel.)
263
604000
4000
(Tekst: ‘Op vaak, de geit-tijd installeren een fout is braaksel.’)
10:23
(LaughterGelach)
264
608000
4000
(Gelach)
10:27
Then comeskomt the first partdeel of the questionvraag.
265
612000
3000
Dan komt het eerste deel van de vraag.
10:30
(TextTekst: How manyveel timestijden like the windwind, a polepool, and the dragondraak?)
266
615000
4000
(Tekst: ‘Hoeveel keer als de wind, een paal, en de draak?’)
10:34
(LaughterGelach)
267
619000
2000
(Gelach)
10:36
Then comeskomt my favoritefavoriete partdeel of the questionvraag.
268
621000
3000
Dan komt mijn favoriete deel van de vraag.
10:39
(TextTekst: This insultbelediging to father'svader stonesstenen?)
269
624000
3000
(Tekst: ‘Dit belediging van vaders stenen?’)
10:42
(LaughterGelach)
270
627000
2000
(Gelach)
10:44
And then comeskomt the endingeinde, whichwelke is my favoritefavoriete partdeel of the wholegeheel thing.
271
629000
3000
Dan komt het einde, mijn favoriete deel.
10:47
(TextTekst: Please apologizeverontschuldigen for your stupiditydomheid. There are a manyveel thank you.)
272
632000
4000
(Tekst: ’Verontschuldig alsjeblieft je voor je domheid. Er zijn veel dank je wel.’)
10:51
(LaughterGelach)
273
636000
2000
(Gelach)
10:53
Okay, so computercomputer translationvertaling, not yetnog good enoughgenoeg.
274
638000
2000
Computervertaling is dus nog niet goed genoeg.
10:55
So back to the questionvraag.
275
640000
2000
Terug naar de vraag.
10:57
So we need people to translatevertalen the wholegeheel WebWeb.
276
642000
3000
We hebben mensen nodig om het hele Web te vertalen.
11:00
So now the nextvolgende questionvraag you maymei have is,
277
645000
2000
Nu zou jullie volgende vraag kunnen zijn:
11:02
well why can't we just paybetalen people to do this?
278
647000
2000
waarom kunnen we geen mensen betalen om dit te doen?
11:04
We could paybetalen professionalprofessioneel languagetaal translatorsvertalers to translatevertalen the wholegeheel WebWeb.
279
649000
3000
We zouden professionele vertalers kunnen betalen om het hele Web te vertalen.
11:07
We could do that.
280
652000
2000
We zouden dat kunnen doen.
11:09
UnfortunatelyHelaas, it would be extremelyuiterst expensiveduur.
281
654000
2000
Het zou helaas extreem duur zijn.
11:11
For examplevoorbeeld, translatingvertalen a tinyklein, tinyklein fractionfractie of the wholegeheel WebWeb, WikipediaWikipedia,
282
656000
3000
Bijvoorbeeld, het vertalen van een kleine, kleine fractie van het gehele Web, Wikipedia,
11:14
into one other languagetaal, SpanishSpaans.
283
659000
3000
in het Spaans.
11:17
WikipediaWikipedia existsbestaat in SpanishSpaans,
284
662000
2000
Wikipedia bestaat in het Spaans,
11:19
but it's very smallklein comparedvergeleken to the sizegrootte of EnglishEngels.
285
664000
2000
maar slechts een fractie van de omvang van het Engels.
11:21
It's about 20 percentprocent of the sizegrootte of EnglishEngels.
286
666000
2000
Zo’n 20 procent.
11:23
If we wanted to translatevertalen the other 80 percentprocent into SpanishSpaans,
287
668000
3000
Als we de andere 80 procent in het Spaans willen vertalen,
11:26
it would costkosten at leastminst 50 millionmiljoen dollarsdollars --
288
671000
2000
zou het minstens 50 miljoen dollar kosten -
11:28
and this is at even the mostmeest exploitedbenut, outsourcingOutsourcing countryland out there.
289
673000
3000
zelfs in het meest uitgebuite, outsourcing land dat er is.
11:31
So it would be very expensiveduur.
290
676000
2000
Het zou erg duur zijn.
11:33
So what we want to do is we want to get 100 millionmiljoen people
291
678000
2000
We willen 100 miljoen mensen
11:35
translatingvertalen the WebWeb into everyelk majorgroot languagetaal
292
680000
2000
het Web in iedere belangrijke taal
11:37
for freegratis.
293
682000
2000
laten vertalen, gratis.
11:39
Now if this is what you want to do,
294
684000
2000
Als je dat wil doen,
11:41
you prettymooi quicklysnel realizerealiseren you're going to runrennen into two prettymooi biggroot hurdleshorden,
295
686000
2000
realiseer je je vrij snel dat je tegen twee
11:43
two biggroot obstaclesobstakels.
296
688000
2000
nogal grote hindernissen gaat aanlopen.
11:45
The first one is a lackgebrek of bilingualstweetaligen.
297
690000
3000
De eerste is een gebrek aan tweetaligen.
11:48
So I don't even know
298
693000
2000
Ik weet niet eens
11:50
if there existsbestaat 100 millionmiljoen people out there usinggebruik makend van the WebWeb
299
695000
3000
of er 100 miljoen mensen op het Web zitten
11:53
who are bilingualtweetalige enoughgenoeg to help us translatevertalen.
300
698000
2000
die voldoende tweetalig zijn om ons te helpen vertalen.
11:55
That's a biggroot problemprobleem.
301
700000
2000
Dat is een groot probleem.
11:57
The other problemprobleem you're going to runrennen into is a lackgebrek of motivationmotivatie.
302
702000
2000
Het andere probleem dat je gaat tegenkomen, is een gebrek aan motivatie.
11:59
How are we going to motivatemotiveren people
303
704000
2000
Hoe gaan we mensen motiveren
12:01
to actuallywerkelijk translatevertalen the WebWeb for freegratis?
304
706000
2000
om het Web daadwerkelijk gratis te vertalen?
12:03
NormallyNormaal, you have to paybetalen people to do this.
305
708000
3000
Normaal gesproken moet je mensen betalen om dit te doen.
12:06
So how are we going to motivatemotiveren them to do it for freegratis?
306
711000
2000
Hoe gaan we hen motiveren om het gratis te doen?
12:08
Now when we were startingbeginnend to think about this, we were blockedgeblokkeerd by these two things.
307
713000
3000
Toen we daarover begonnen na te denken, hielden deze twee dingen ons tegen.
12:11
But then we realizedrealiseerde, there's actuallywerkelijk a way
308
716000
2000
Tot we ons realiseerden dat er eigenlijk een manier was
12:13
to solveoplossen bothbeide these problemsproblemen with the samedezelfde solutionoplossing.
309
718000
2000
om beide problemen ineens op te lossen.
12:15
There's a way to killdoden two birdsvogelstand with one stonesteen.
310
720000
2000
Er is een manier om twee vliegen in één klap te slaan.
12:17
And that is to transformtransformeren languagetaal translationvertaling
311
722000
3000
Door vertaling te transformeren
12:20
into something that millionsmiljoenen of people want to do,
312
725000
3000
in iets dat miljoenen mensen willen doen
12:23
and that alsoook helpshelpt with the problemprobleem of lackgebrek of bilingualstweetaligen,
313
728000
3000
en dat tegelijkertijd het gebrek aan tweetaligen oplost.
12:26
and that is languagetaal educationonderwijs.
314
731000
3000
Dat is taalonderwijs.
12:29
So it turnsbochten out that todayvandaag,
315
734000
2000
Het blijkt dat vandaag de dag
12:31
there are over 1.2 billionmiljard people learningaan het leren a foreignbuitenlands languagetaal.
316
736000
3000
meer dan 1,2 miljard mensen een vreemde taal leren.
12:34
People really, really want to learnleren a foreignbuitenlands languagetaal.
317
739000
2000
Mensen willen echt een vreemde taal leren.
12:36
And it's not just because they're beingwezen forcedgedwongen to do so in schoolschool-.
318
741000
3000
Niet alleen omdat het op school moet.
12:39
For examplevoorbeeld, in the UnitedVerenigd StatesStaten alonealleen,
319
744000
2000
Bijvoorbeeld, in de Verenigde Staten alleen al
12:41
there are over fivevijf millionmiljoen people who have paidbetaald over $500
320
746000
2000
zijn er meer dan vijf miljoen mensen die meer dan 500 dollar
12:43
for softwaresoftware to learnleren a newnieuwe languagetaal.
321
748000
2000
aan software hebben uitgegeven om een nieuwe taal te leren.
12:45
So people really, really want to learnleren a newnieuwe languagetaal.
322
750000
2000
Mensen willen echt een nieuwe taal te leren.
12:47
So what we'vewij hebben been workingwerkend on for the last yearjaar and a halfvoor de helft is a newnieuwe websitewebsite --
323
752000
3000
Het afgelopen anderhalf jaar hebben we aan
12:50
it's calledriep DuolingoDuolingo --
324
755000
2000
een nieuwe website, Duolingo, gewerkt.
12:52
where the basicbasis- ideaidee is people learnleren a newnieuwe languagetaal for freegratis
325
757000
3000
Het basisidee is dat mensen gratis een nieuwe taal leren
12:55
while simultaneouslygelijktijdig translatingvertalen the WebWeb.
326
760000
2000
terwijl ze tegelijkertijd het Web vertalen.
12:57
And so basicallyeigenlijk they're learningaan het leren by doing.
327
762000
2000
Leren door te doen, dus.
12:59
So the way this workswerken
328
764000
2000
Als beginner
13:01
is whenevertelkens als you're a just a beginnerbeginner, we give you very, very simpleeenvoudig sentenceszinnen.
329
766000
3000
krijg je zeer, zeer eenvoudige zinnen.
13:04
There's, of courseCursus, a lot of very simpleeenvoudig sentenceszinnen on the WebWeb.
330
769000
2000
Er zijn natuurlijk een groot aantal zeer eenvoudige zinnen op het Web.
13:06
We give you very, very simpleeenvoudig sentenceszinnen
331
771000
2000
Wij geven je zeer, zeer eenvoudige zinnen
13:08
alonglangs with what eachelk wordwoord meansmiddelen.
332
773000
2000
samen met wat elk woord betekent.
13:10
And as you translatevertalen them, and as you see how other people translatevertalen them,
333
775000
3000
Als je ze vertaalt, terwijl je kunt zien hoe andere mensen ze vertalen,
13:13
you startbegin learningaan het leren the languagetaal.
334
778000
2000
leer je al doende de taal.
13:15
And as you get more and more advancedgevorderd,
335
780000
2000
Naargelang je vordert,
13:17
we give you more and more complexcomplex sentenceszinnen to translatevertalen.
336
782000
2000
krijg je meer en meer complexe zinnen te vertalen.
13:19
But at all timestijden, you're learningaan het leren by doing.
337
784000
2000
Maar steeds leer je door te doen.
13:21
Now the crazygek thing about this methodmethode
338
786000
2000
Het gekke aan deze methode
13:23
is that it actuallywerkelijk really workswerken.
339
788000
2000
is dat ze echt werkt.
13:25
First of all, people are really, really learningaan het leren a languagetaal.
340
790000
2000
Ten eerste leren mensen echt een taal.
13:27
We're mostlymeestal donegedaan buildinggebouw it, and now we're testingtesting it.
341
792000
2000
We zijn bijna klaar met de site en zijn ze nu aan het testen.
13:29
People really can learnleren a languagetaal with it.
342
794000
2000
Mensen leren er echt een taal mee.
13:31
And they learnleren it about as well as the leadingleidend languagetaal learningaan het leren softwaresoftware.
343
796000
3000
Ongeveer even goed als met de toonaangevende software voor het leren van talen.
13:34
So people really do learnleren a languagetaal.
344
799000
2000
Ze leren een taal.
13:36
And not only do they learnleren it as well,
345
801000
2000
Niet alleen leren ze ze evengoed,
13:38
but actuallywerkelijk it's way more interestinginteressant.
346
803000
2000
maar eigenlijk is het nog interessanter.
13:40
Because you see with DuolingoDuolingo, people are actuallywerkelijk learningaan het leren with realecht contentinhoud.
347
805000
3000
Omdat mensen met Duolingo eigenlijk met echte inhoud leren.
13:43
As opposedgekant tegen to learningaan het leren with made-upgeconfectioneerde sentenceszinnen,
348
808000
2000
In tegenstelling tot het leren met verzonnen zinnen,
13:45
people are learningaan het leren with realecht contentinhoud, whichwelke is inherentlyinherent interestinginteressant.
349
810000
3000
leren mensen met echte inhoud, die uit zichzelf interessant is.
13:48
So people really do learnleren a languagetaal.
350
813000
2000
Mensen leren echt een taal.
13:50
But perhapsmisschien more surprisinglyverrassend,
351
815000
2000
Maar misschien nog verrassender is dat
13:52
the translationsvertalingen that we get from people usinggebruik makend van the siteplaats,
352
817000
3000
de vertalingen die we krijgen van die mensen,
13:55
even thoughhoewel they're just beginnersbeginners,
353
820000
2000
ook al zijn het nog beginners,
13:57
the translationsvertalingen that we get are as accurateaccuraat as those of professionalprofessioneel languagetaal translatorsvertalers,
354
822000
3000
net zo precies zijn als die van professionele vertalers.
14:00
whichwelke is very surprisingverrassend.
355
825000
2000
Dat is zeer verrassend.
14:02
So let me showtonen you one examplevoorbeeld.
356
827000
2000
Hier een voorbeeld.
14:04
This is a sentencezin that was translatedvertaalde from GermanDuits into EnglishEngels.
357
829000
2000
Dit is een zin die uit het Duits werd vertaald in het Engels.
14:06
The toptop is the GermanDuits.
358
831000
2000
Bovenaan de Duitse.
14:08
The middlemidden- is an EnglishEngels translationvertaling
359
833000
2000
De middelste is een Engelse vertaling
14:10
that was donegedaan by somebodyiemand who was a professionalprofessioneel EnglishEngels translatorvertaler
360
835000
2000
van een professionele vertaler Engels
14:12
who we paidbetaald 20 centscents a wordwoord for this translationvertaling.
361
837000
2000
die 20 cent per woord kreeg voor deze vertaling.
14:14
And the bottombodem is a translationvertaling by usersgebruikers of DuolingoDuolingo,
362
839000
3000
Onderaan een vertaling door gebruikers van Duolingo.
14:17
nonegeen of whomwie knewwist any GermanDuits
363
842000
2000
Geen ervan kende Duits
14:19
before they startedbegonnen usinggebruik makend van the siteplaats.
364
844000
2000
voordat ze begonnen met het gebruik van de site.
14:21
You can see, it's prettymooi much perfectperfect.
365
846000
2000
Je ziet dat het vrij perfect is.
14:23
Now of courseCursus, we playspelen a tricktruc here
366
848000
2000
We halen hier wel een kunstgreep uit
14:25
to make the translationsvertalingen as good as professionalprofessioneel languagetaal translatorsvertalers.
367
850000
2000
om de vertaling zo goed als te krijgen als van professionele vertalers.
14:27
We combinecombineren the translationsvertalingen of multiplemeerdere beginnersbeginners
368
852000
3000
We combineren de vertalingen van meerdere beginners
14:30
to get the qualitykwaliteit of a singlesingle professionalprofessioneel translatorvertaler.
369
855000
3000
om de kwaliteit van een professionele vertaler te krijgen.
14:33
Now even thoughhoewel we're combiningcombineren the translationsvertalingen,
370
858000
5000
Maar zelfs met het combineren van de vertalingen
14:38
the siteplaats actuallywerkelijk can translatevertalen prettymooi fastsnel.
371
863000
2000
kan de site snel vertalen.
14:40
So let me showtonen you,
372
865000
2000
Ik toon jullie onze schatting
14:42
this is our estimatesramingen of how fastsnel we could translatevertalen WikipediaWikipedia
373
867000
2000
van hoe snel we Wikipedia zouden kunnen vertalen
14:44
from EnglishEngels into SpanishSpaans.
374
869000
2000
van het Engels naar het Spaans.
14:46
RememberVergeet niet, this is 50 millionmiljoen dollars-worthdollar waard of valuewaarde.
375
871000
3000
Vergeet niet dat dit 50 miljoen dollar zou kosten.
14:49
So if we wanted to translatevertalen WikipediaWikipedia into SpanishSpaans,
376
874000
2000
Als we Wikipedia willen vertalen in het Spaans,
14:51
we could do it in fivevijf weeksweken with 100,000 activeactief usersgebruikers.
377
876000
3000
dan zou dat met 100.000 actieve gebruikers in vijf weken kunnen.
14:54
And we could do it in about 80 hoursuur with a millionmiljoen activeactief usersgebruikers.
378
879000
3000
En in ongeveer 80 uur met een miljoen actieve gebruikers.
14:57
SinceSinds all the projectsprojecten that my groupgroep has workedwerkte on so farver have gottengekregen millionsmiljoenen of usersgebruikers,
379
882000
3000
Omdat alle projecten van mijn groep tot nu toe miljoenen gebruikers hebben gekregen,
15:00
we're hopefulhoopvol that we'llgoed be ablein staat to translatevertalen
380
885000
2000
hopen we dat we met dit project
15:02
extremelyuiterst fastsnel with this projectproject.
381
887000
2000
extreem snel zullen kunnen vertalen.
15:04
Now the thing that I'm mostmeest excitedopgewonden about with DuolingoDuolingo
382
889000
3000
Waar ik met Duolingo nog het meest enthousiast over ben,
15:07
is I think this providesbiedt a faireerlijk businessbedrijf modelmodel- for languagetaal educationonderwijs.
383
892000
3000
is dat ik denk dat dit een eerlijk businessmodel voor taalonderwijs zal zijn.
15:10
So here'shier is the thing:
384
895000
2000
Waarom?
15:12
The currentactueel businessbedrijf modelmodel- for languagetaal educationonderwijs
385
897000
2000
Het huidige businessmodel voor taalonderwijs
15:14
is the studentstudent payspays,
386
899000
2000
is dat de student betaalt,
15:16
and in particularbijzonder, the studentstudent payspays RosettaRosetta StoneStone 500 dollarsdollars.
387
901000
2000
bijvoorbeeld 500 dollar voor de software van Rosetta Stone.
15:18
(LaughterGelach)
388
903000
2000
(Gelach)
15:20
That's the currentactueel businessbedrijf modelmodel-.
389
905000
2000
Dat is het huidige businessmodel.
15:22
The problemprobleem with this businessbedrijf modelmodel-
390
907000
2000
Het probleem met dit businessmodel
15:24
is that 95 percentprocent of the world's's werelds populationbevolking doesn't have 500 dollarsdollars.
391
909000
3000
is dat 95 procent van de wereldbevolking geen 500 dollar heeft.
15:27
So it's extremelyuiterst unfaironeerlijke towardsnaar the poorarm.
392
912000
3000
Het is erg oneerlijk tegenover de armen.
15:30
This is totallyhelemaal biasedvooringenomen towardsnaar the richrijk.
393
915000
2000
Het bevoordeelt de rijken onevenredig.
15:32
Now see, in DuolingoDuolingo,
394
917000
2000
Terwijl je
15:34
because while you learnleren
395
919000
2000
met Duolingo leert,
15:36
you're actuallywerkelijk creatinghet creëren van valuewaarde, you're translatingvertalen stuffspul --
396
921000
3000
creëer je waarde, vertaal je dingen -
15:39
whichwelke for examplevoorbeeld, we could chargein rekening brengen somebodyiemand for translationsvertalingen.
397
924000
3000
waarvoor we anders iemand zouden moeten betalen.
15:42
So this is how we could monetizeMonetize this.
398
927000
2000
Zo maken we dit ten gelde.
15:44
SinceSinds people are creatinghet creëren van valuewaarde while they're learningaan het leren,
399
929000
2000
Omdat mensen al lerend waarde creëren,
15:46
they don't have to paybetalen theirhun moneygeld, they paybetalen with theirhun time.
400
931000
3000
betalen ze niet met geld maar met hun tijd.
15:49
But the magicalmagisch thing here is that they're payingbetalen with theirhun time,
401
934000
3000
Het magische ding hier is dat ze betalen met tijd,
15:52
but that is time that would have had to have been spentdoorgebracht anywaysanyways
402
937000
2000
die ze anders toch zouden hebben besteed
15:54
learningaan het leren the languagetaal.
403
939000
2000
bij het leren van de taal.
15:56
So the niceleuk thing about DuolingoDuolingo is I think it providesbiedt a faireerlijk businessbedrijf modelmodel- --
404
941000
3000
Het mooie aan Duolingo is dat ik denk dat het zorgt voor een eerlijk businessmodel,
15:59
one that doesn't discriminatediscrimineren againsttegen poorarm people.
405
944000
2000
een dat arme mensen niet discrimineert.
16:01
So here'shier is the siteplaats. Thank you.
406
946000
2000
Hier is de site. Dank je.
16:03
(ApplauseApplaus)
407
948000
8000
(Applaus)
16:11
So here'shier is the siteplaats.
408
956000
2000
Hier is de site.
16:13
We haven'thebben niet yetnog launchedgelanceerd,
409
958000
2000
We zijn nog niet opgestart,
16:15
but if you go there, you can signteken up to be partdeel of our privateprivaat betabeta,
410
960000
3000
maar als je er naartoe gaat, kan je je aanmelden om deel te nemen aan onze privé-beta,
16:18
whichwelke is probablywaarschijnlijk going to startbegin in about threedrie or fourvier weeksweken.
411
963000
2000
die waarschijnlijk binnen ongeveer drie of vier weken van start gaat.
16:20
We haven'thebben niet yetnog launchedgelanceerd this DuolingoDuolingo.
412
965000
2000
We hebben Duolingo nog niet gelanceerd.
16:22
By the way, I'm the one talkingpratend here,
413
967000
2000
Tussen haakjes, ik sta het hier wel uit te leggen, maar Duolingo
16:24
but actuallywerkelijk DuolingoDuolingo is the work of a really awesomegeweldig teamteam, some of whomwie are here.
414
969000
3000
is eigenlijk het werk van een geweldig team, van wie sommigen hier aanwezig zijn.
16:27
So thank you.
415
972000
2000
Dank je wel.
16:29
(ApplauseApplaus)
416
974000
4000
(Applaus)
Translated by Rik Delaet
Reviewed by Els De Keyser

▲Back to top

ABOUT THE SPEAKER
Luis von Ahn - Computer scientist
Luis von Ahn builds systems that combine humans and computers to solve large-scale problems that neither can solve alone.

Why you should listen

Louis von Ahn is an associate professor of Computer Science at Carnegie Mellon University, and he's at the forefront of the crowdsourcing craze. His work takes advantage of the evergrowing Web-connected population to acheive collaboration in unprecedented numbers. His projects aim to leverage the crowd for human good. His company reCAPTCHA, sold to Google in 2009, digitizes human knowledge (books), one word at a time. His new project is Duolingo, which aims to get 100 million people translating the Web in every major language.

More profile about the speaker
Luis von Ahn | Speaker | TED.com