ABOUT THE SPEAKER
Luis von Ahn - Computer scientist
Luis von Ahn builds systems that combine humans and computers to solve large-scale problems that neither can solve alone.

Why you should listen

Louis von Ahn is an associate professor of Computer Science at Carnegie Mellon University, and he's at the forefront of the crowdsourcing craze. His work takes advantage of the evergrowing Web-connected population to acheive collaboration in unprecedented numbers. His projects aim to leverage the crowd for human good. His company reCAPTCHA, sold to Google in 2009, digitizes human knowledge (books), one word at a time. His new project is Duolingo, which aims to get 100 million people translating the Web in every major language.

More profile about the speaker
Luis von Ahn | Speaker | TED.com
TEDxCMU

Luis von Ahn: Massive-scale online collaboration

Luis von Ahn: Đóng góp trực tuyến phạm vi lớn

Filmed:
1,740,008 views

Sau khi khẳng định lại mục đích của CAPTCHA (Chương trình hiển thị các từ ngẫu nhiên bị làm nhiễu để bạn gõ lại khi đăng ký trên mạng nhằm mục đích xác định xem bạn là con người hay là một chương trình máy tính) là mỗi lần người nào đó gõ captcha là giúp điện tử hóa sách, Luis von Ahn tự hỏi làm cách nào để sử dụng các sự đóng góp nhỏ của nhiều người trên Internet cho một điều tốt đẹp hơn. Tại TEDxCMU, anh ta chia sẻ dự án mới đầy tham vọng của mình: Duolingo. Duolingo sẽ giúp hàng triệu người vừa học một ngôn ngữ mới vừa dịch nội dung các trang web nhanh chóng và chính xác -- mọi thứ đều miễn phí.
- Computer scientist
Luis von Ahn builds systems that combine humans and computers to solve large-scale problems that neither can solve alone. Full bio

Double-click the English transcript below to play the video.

00:15
How manynhiều of you had to filllấp đầy out some sortsắp xếp of webweb formhình thức
0
0
2000
Bao nhiêu trong các bạn phải điền một vài mẫu trang web nào đó
00:17
where you've been askedyêu cầu to readđọc a distortedméo sequencetrình tự of charactersnhân vật like this?
1
2000
2000
mà bạn được yêu cầu là đọc một chuỗi ký tự bị làm nhiễu như thế này?
00:19
How manynhiều of you foundtìm it really, really annoyinglàm phiền?
2
4000
2000
Bao nhiêu trong các bạn thấy là nó thật sự là rất phiền?
00:21
Okay, outstandingxuất sắc. So I inventedphát minh that.
3
6000
3000
Tuyệt. Vì tôi đã sáng chế ra nó đó.
00:24
(LaughterTiếng cười)
4
9000
2000
(Tiếng cười)
00:26
Or I was one of the people who did it.
5
11000
2000
Hay là tôi là một trong những người đã tạo ra nó.
00:28
That thing is calledgọi là a CAPTCHACAPTCHA.
6
13000
2000
Cái đó được gọi là CAPTCHA.
00:30
And the reasonlý do it is there is to make sure you, the entitythực thể fillingđổ đầy out the formhình thức,
7
15000
2000
Và lý do nó ở đó là để chắc chắn rằng bạn, thực thể đang điền cái biểu mẫu,
00:32
are actuallythực ra a humanNhân loại and not some sortsắp xếp of computermáy vi tính programchương trình
8
17000
3000
thực sự là con người mà không phải là một loại chương trình máy tính nào đó
00:35
that was writtenbằng văn bản to submitGửi đi the formhình thức millionshàng triệu and millionshàng triệu of timeslần.
9
20000
2000
được viết để điền biểu mẫu hàng triệu triệu lần.
00:37
The reasonlý do it workscông trinh is because humanscon người,
10
22000
2000
Và lý do nó hoạt động được vì con người,
00:39
at leastít nhất non-visually-impairedPhòng Không-khiếm humanscon người,
11
24000
2000
ít nhất là những người không bị khiếm thị,
00:41
have no troublerắc rối readingđọc hiểu these distortedméo squigglysquiggly charactersnhân vật,
12
26000
2000
không có vấn đề gì khi đọc những ký tự bị làm nhiễu,
00:43
whereastrong khi computermáy vi tính programschương trình simplyđơn giản can't do it as well yetchưa.
13
28000
3000
trong khi các chương trình máy tính đơn giản là không thể làm điều đó tốt được.
00:46
So for examplethí dụ, in the casetrường hợp of TicketmasterTicketmaster,
14
31000
2000
Ví dụ như là trang Ticketmaster (một trang bán vé đủ mọi thể loại của nước ngoài),
00:48
the reasonlý do you have to typekiểu these distortedméo charactersnhân vật
15
33000
2000
lý do bạn phải gõ những từ bị nhiễu kia
00:50
is to preventngăn chặn scalpersscalpers from writingviết a programchương trình
16
35000
2000
là để chống lại những kẻ đầu cơ vé viết các chương trình máy tính
00:52
that can buymua millionshàng triệu of tickets, two at a time.
17
37000
2000
có thể mua hàng triệu vé, 2 vé một lần.
00:54
CAPTCHAsCAPTCHA are used all over the InternetInternet.
18
39000
2000
CAPTCHA được dùng khắp Internet.
00:56
And sincekể từ they're used so oftenthường xuyên,
19
41000
2000
Và vì chúng được dùng quá thường xuyên,
00:58
a lot of timeslần the precisetóm lược sequencetrình tự of randomngẫu nhiên charactersnhân vật that is shownđược hiển thị to the userngười dùng
20
43000
2000
nhiều lần các chuỗi ký tự ngẫu nhiên được đưa ra cho người dùng gõ
01:00
is not so fortunatemay mắn.
21
45000
2000
không hay chút nào.
01:02
So this is an examplethí dụ from the YahooYahoo registrationđăng ký pagetrang.
22
47000
3000
Ví dụ này là từ trang đăng ký của Yahoo.
01:05
The randomngẫu nhiên charactersnhân vật that happenedđã xảy ra to be shownđược hiển thị to the userngười dùng
23
50000
2000
Chuỗi ký tự ngẫu nhiên xuất hiện
01:07
were W, A, I, T, which, of coursekhóa học, spellchính tả a wordtừ.
24
52000
3000
là W, A, I, T (wait nghĩa là chờ đợi trong tiếng Anh), mà đánh vần được một từ.
01:10
But the besttốt partphần is the messagethông điệp
25
55000
3000
Nhưng phần hay nhất là tin nhắn
01:13
that the YahooYahoo help deskbàn got about 20 minutesphút latermột lát sau.
26
58000
3000
mà ban trợ giúp của Yahoo nhận được 20 phút sau.
01:16
TextVăn bản: "Help! I've been waitingđang chờ đợi for over 20 minutesphút, and nothing happensxảy ra."
27
61000
3000
Tin nhắn: "Giúp tôi với! Tôi đã đợi hơn 20 phút, và không có gì xảy ra."
01:19
(LaughterTiếng cười)
28
64000
4000
(Tiếng cười)
01:23
This personngười thought they neededcần to wait.
29
68000
2000
Người đó nghĩ là anh ta phải đợi.
01:25
This of coursekhóa học, is not as badxấu as this poornghèo nàn personngười.
30
70000
3000
Điều đó tất nhiên là không tệ bằng người tội nghiệp này.
01:28
(LaughterTiếng cười)
31
73000
2000
(Tiếng cười)
01:30
CAPTCHACAPTCHA ProjectDự án is something that we did here at CarnegieCarnegie MelllonMelllon over 10 yearsnăm agotrước,
32
75000
3000
Dự án CAPTCHA là dự án mà chúng tôi đã làm ở Carnegie Mellon hơn 10 năm trước,
01:33
and it's been used everywheremọi nơi.
33
78000
2000
và nó được dùng khắp mọi nơi.
01:35
Let me now tell you about a projectdự án that we did a fewvài yearsnăm latermột lát sau,
34
80000
2000
Để tôi kể cho các bạn về dự án mà chúng tôi làm vài năm sau đó,
01:37
which is sortsắp xếp of the nextkế tiếp evolutionsự phát triển of CAPTCHACAPTCHA.
35
82000
3000
nó giống như là bước tiến hóa của CAPTCHA.
01:40
This is a projectdự án that we call reCAPTCHAreCAPTCHA,
36
85000
2000
Dự án này mà chúng tôi gọi là reCAPTCHA,
01:42
which is something that we startedbắt đầu here at CarnegieCarnegie MellonMellon,
37
87000
2000
là dự án mà chúng tôi đã bắt đầu ở Carnegie Mellon,
01:44
then we turnedquay it into a startupkhởi động companyCông ty.
38
89000
2000
rồi chúng tôi biến nó thành một công ty.
01:46
And then about a yearnăm and a halfmột nửa agotrước,
39
91000
2000
Và rồi khoảng một năm rưỡi sau,
01:48
GoogleGoogle actuallythực ra acquiredđã mua this companyCông ty.
40
93000
2000
Google thực sự mua lại công ty này.
01:50
So let me tell you what this projectdự án startedbắt đầu.
41
95000
2000
Vì vậy để kể các bạn nghe cái mà dự án này bắt đầu.
01:52
So this projectdự án startedbắt đầu from the followingtiếp theo realizationthực hiện:
42
97000
3000
Dự án này đã bắt đầu từ những nhận xét sau:
01:55
It turnslượt out that approximatelyxấp xỉ 200 milliontriệu CAPTCHAsCAPTCHA
43
100000
2000
Thống kê là khoảng 200 triệu CAPTCHA
01:57
are typedđánh máy everydaymỗi ngày by people around the worldthế giới.
44
102000
3000
được con người gõ mỗi ngày khắp thế giới.
02:00
When I first heardnghe this, I was quitekhá proudtự hào of myselfriêng tôi.
45
105000
2000
Khi tôi mới nghe điều này, tôi khá là tự hào về bản thân.
02:02
I thought, look at the impactva chạm that my researchnghiên cứu has had.
46
107000
2000
Tôi đã nghĩ là: nhìn xem sự ảnh hưởng của nghiên cứu của tôi như thế nào.
02:04
But then I startedbắt đầu feelingcảm giác badxấu.
47
109000
2000
Nhưng rồi tôi bắt đầu cảm thấy buồn.
02:06
See here'sđây là the thing, eachmỗi time you typekiểu a CAPTCHACAPTCHA,
48
111000
2000
Và đây là lý do: mỗi lần bạn gõ một CAPTCHA
02:08
essentiallybản chất you wastechất thải 10 secondsgiây of your time.
49
113000
3000
cơ bản là bạn phí phạm 10 giây thời gian của bạn.
02:11
And if you multiplynhân that by 200 milliontriệu,
50
116000
2000
Và nếu bạn nhân thời gian đó lên 200 triệu,
02:13
you get that humanitynhân loại as a wholetoàn thể is wastinglãng phí about 500,000 hoursgiờ everymỗi day
51
118000
3000
và bạn sẽ thấy là nhân loại, gộp lại, phí phạm khoảng 500.000 giờ mỗi ngày
02:16
typingđánh máy these annoyinglàm phiền CAPTCHAsCAPTCHA.
52
121000
2000
gõ những cái CAPTCHA phiền phức đó.
02:18
So then I startedbắt đầu feelingcảm giác badxấu.
53
123000
2000
Vì vậy tôi cảm thấy tồi tệ.
02:20
(LaughterTiếng cười)
54
125000
2000
(Tiếng cười)
02:22
And then I startedbắt đầu thinkingSuy nghĩ, well, of coursekhóa học, we can't just get ridthoát khỏi of CAPTCHAsCAPTCHA,
55
127000
3000
Và rồi tôi nghĩ: tất nhiên là chúng ta không thể bỏ CAPTCHA,
02:25
because the securityBảo vệ of the WebWeb sortsắp xếp of dependsphụ thuộc on them.
56
130000
2000
vì bảo mật trên Web dựa vào chúng.
02:27
But then I startedbắt đầu thinkingSuy nghĩ, is there any way we can use this effortcố gắng
57
132000
3000
Nhưng rồi tôi bắt đầu nghĩ, có cách nào mà chúng ta có thể dùng những lần gõ CAPTCHA đó
02:30
for something that is good for humanitynhân loại?
58
135000
2000
cho cái gì đó tốt cho nhân loại?
02:32
So see, here'sđây là the thing.
59
137000
2000
Chính vậy.
02:34
While you're typingđánh máy a CAPTCHACAPTCHA, duringsuốt trong those 10 secondsgiây,
60
139000
2000
Trong khi các bạn gõ CAPTCHA, trong 10 giây đó,
02:36
your brainóc is doing something amazingkinh ngạc.
61
141000
2000
não của các bạn đang làm điều gì đó phi thường.
02:38
Your brainóc is doing something that computersmáy vi tính cannotkhông thể yetchưa do.
62
143000
2000
Não của các bạn đang làm điều mà máy tính chưa thể làm được.
02:40
So can we get you to do usefulhữu ích work for those 10 secondsgiây?
63
145000
3000
Vì vậy chúng tôi có thể làm cho bạn làm một việc có ích trong 10 giây đó không?
02:43
AnotherKhác way of puttingđặt it is,
64
148000
2000
nói cách khác,
02:45
is there some humongoushumongous problemvấn đề that we cannotkhông thể yetchưa get computersmáy vi tính to solvegiải quyết,
65
150000
2000
có một vấn đề lớn mà chúng ta không thể làm cho máy tính giải được,
02:47
yetchưa we can splitphân chia into tinynhỏ bé 10-second chunksmiếng, mảnh nhỏ
66
152000
3000
nhưng chúng ta có thể chia nhỏ ra thành các phần 10 giây
02:50
suchnhư là that eachmỗi time somebodycó ai solvesgiải quyết a CAPTCHACAPTCHA
67
155000
2000
là thời gian mà một người nào đó gõ một cái CAPTCHA
02:52
they solvegiải quyết a little bitbit of this problemvấn đề?
68
157000
2000
họ giải một phần nhỏ của vấn đề?
02:54
And the answercâu trả lời to that is "yes," and this is what we're doing now.
69
159000
2000
Và câu trả lời là "có", và đây chính là cái mà chúng tôi đang làm.
02:56
So what you mayTháng Năm not know is that nowadaysngày nay while you're typingđánh máy a CAPTCHACAPTCHA,
70
161000
3000
Vì vậy cái mà các bạn không biết là hiện tại, trong khi các bạn đang gõ CAPTCHA,
02:59
not only are you authenticating yourselfbản thân bạn as a humanNhân loại,
71
164000
2000
không chỉ bạn đang chứng thực bạn là con người,
03:01
but in additionthêm vào you're actuallythực ra helpinggiúp us to digitizesố hoá bookssách.
72
166000
2000
mà hơn nữa bạn đang thực sự giúp đỡ chúng tôi điện tử hóa sách.
03:03
So let me explaingiải thích how this workscông trinh.
73
168000
2000
Để tôi giải thích nó hoạt động như thế nào.
03:05
So there's a lot of projectsdự án out there tryingcố gắng to digitizesố hoá bookssách.
74
170000
2000
Có nhiều dự án đang cố gắng số hóa sách.
03:07
GoogleGoogle has one. The InternetInternet ArchiveLưu trữ has one.
75
172000
3000
Google có một cái. The Internet Archive có một cái.
03:10
AmazonAmazon, now with the KindleKindle, is tryingcố gắng to digitizesố hoá bookssách.
76
175000
2000
Amazon, hiện tại với Kindle, đang cố gắng số hóa sách.
03:12
BasicallyVề cơ bản the way this workscông trinh
77
177000
2000
Cơ bản cách nó hoạt động
03:14
is you startkhởi đầu with an old booksách.
78
179000
2000
là bạn bắt đầu với một cuốn sách cũ.
03:16
You've seenđã xem those things, right? Like a booksách?
79
181000
2000
Bạn đã từng thấy rồi phải không? Một quyển sách ấy mà?
03:18
(LaughterTiếng cười)
80
183000
2000
(Tiếng cười)
03:20
So you startkhởi đầu with a booksách, and then you scanquét it.
81
185000
2000
Và các bạn bắt đầu với một cuốn sách, và rồi các bạn scan nó.
03:22
Now scanningquét a booksách
82
187000
2000
Bây giờ scan một cuốn sách
03:24
is like takinglấy a digitalkỹ thuật số photographảnh chụp of everymỗi pagetrang of the booksách.
83
189000
2000
giống như là chụp mỗi trang sách.
03:26
It givesđưa ra you an imagehình ảnh for everymỗi pagetrang of the booksách.
84
191000
2000
Nó tạo ra một tấm hình cho mỗi trang sách.
03:28
This is an imagehình ảnh with textbản văn for everymỗi pagetrang of the booksách.
85
193000
2000
Đây là hình ảnh với chữ cho mỗi trang sách.
03:30
The nextkế tiếp stepbậc thang in the processquá trình
86
195000
2000
Bước kế tiếp
03:32
is that the computermáy vi tính needsnhu cầu to be ablecó thể to deciphergiải mã all of the wordstừ ngữ in this imagehình ảnh.
87
197000
3000
là máy tính cần phải có thể giải mã tất cả các từ trong bức ảnh.
03:35
That's usingsử dụng a technologyCông nghệ calledgọi là OCROCR,
88
200000
2000
Bằng cách sử dụng một công nghệ gọi là OCR,
03:37
for opticalquang học charactertính cách recognitionsự công nhận,
89
202000
2000
viết tắt của nhận dạng ký tự quang học (Optical Character Recognition),
03:39
which takes a picturehình ảnh of textbản văn
90
204000
2000
nó nhận một bức ảnh có văn bản
03:41
and triescố gắng to figurenhân vật out what textbản văn is in there.
91
206000
2000
và cố gắng nhận dạng văn bản trong đó.
03:43
Now the problemvấn đề is that OCROCR is not perfecthoàn hảo.
92
208000
2000
Hiện tại vấn đề là OCR không hoàn hảo.
03:45
EspeciallyĐặc biệt là for olderlớn hơn bookssách
93
210000
2000
Đặc biệt là với các sách cũ
03:47
where the inkmực has fadedphai mờ and the pagestrang have turnedquay yellowmàu vàng,
94
212000
3000
mà mực đã phai màu và giấy đã ngã vàng,
03:50
OCROCR cannotkhông thể recognizenhìn nhận a lot of the wordstừ ngữ.
95
215000
2000
OCR không thể nhận diện được nhiều từ.
03:52
For examplethí dụ, for things that were writtenbằng văn bản more than 50 yearsnăm agotrước,
96
217000
2000
Ví dụ, với những cuốn sách được viết cách đây trên 50 năm,
03:54
the computermáy vi tính cannotkhông thể recognizenhìn nhận about 30 percentphần trăm of the wordstừ ngữ.
97
219000
3000
Máy tính không thể nhận diện được 30 phần trăm.
03:57
So what we're doing now
98
222000
2000
Vì vậy cái mà chúng tôi đang làm hiện tại
03:59
is we're takinglấy all of the wordstừ ngữ that the computermáy vi tính cannotkhông thể recognizenhìn nhận
99
224000
2000
là chúng tôi đang đem tất cả những từ mà máy tính không thể nhận diện
04:01
and we're gettingnhận được people to readđọc them for us
100
226000
2000
và chúng tôi để con người đọc chúng cho chúng tôi
04:03
while they're typingđánh máy a CAPTCHACAPTCHA on the InternetInternet.
101
228000
2000
trong khi họ đang gõ CAPTCHA trên Internet.
04:05
So the nextkế tiếp time you typekiểu a CAPTCHACAPTCHA, these wordstừ ngữ that you're typingđánh máy
102
230000
3000
Vì vậy lần tới khi bạn gõ CAPTCHA, những từ các bạn gõ
04:08
are actuallythực ra wordstừ ngữ that are comingđang đến from bookssách that are beingđang digitizedsố hóa
103
233000
3000
là những từ thật sự được lấy ra từ những cuốn sách đang được số hóa
04:11
that the computermáy vi tính could not recognizenhìn nhận.
104
236000
2000
mà máy tính không thể nhận diện
04:13
And now the reasonlý do we have two wordstừ ngữ nowadaysngày nay insteadthay thế of one
105
238000
2000
Và lý do hiện tại bạn thấy hai từ thay vì một từ
04:15
is because, you see, one of the wordstừ ngữ
106
240000
2000
là vì, bạn thấy, một trong hai từ
04:17
is a wordtừ that the systemhệ thống just got out of a booksách,
107
242000
2000
là từ mà hệ thống lấy ra từ một cuốn sách,
04:19
it didn't know what it was, and it's going to presenthiện tại it to you.
108
244000
3000
hệ thống không biết nó là cái gì, và nó đưa cho bạn.
04:22
But sincekể từ it doesn't know the answercâu trả lời for it, it cannotkhông thể gradecấp it for you.
109
247000
3000
Nhưng vì nó không biết câu trả lời, nó không thể kiểm tra bạn.
04:25
So what we do is we give you anotherkhác wordtừ,
110
250000
2000
Vì vậy cái mà chúng tôi làm là đưa bạn một từ khác,
04:27
one for which the systemhệ thống does know the answercâu trả lời.
111
252000
2000
từ mà hệ thống biết câu trả lời.
04:29
We don't tell you which one'scủa một người which, and we say, please typekiểu bothcả hai.
112
254000
2000
Chúng tôi không nói cho bạn biết cái nào là cái nào, xin hãy gõ cả hai.
04:31
And if you typekiểu the correctchính xác wordtừ
113
256000
2000
Và nếu bạn gõ một từ chính xác
04:33
for the one for which the systemhệ thống alreadyđã knowsbiết the answercâu trả lời,
114
258000
2000
cho từ mà hệ thống biết câu trả lời,
04:35
it assumesgiả sử you are humanNhân loại,
115
260000
2000
nó cho rằng bạn là con người,
04:37
and it alsocũng thế getsđược some confidencesự tự tin that you typedđánh máy the other wordtừ correctlyđúng.
116
262000
2000
và nó cũng tin tưởng rằng bạn gõ từ còn lại đúng.
04:39
And if we repeatnói lại this processquá trình to like 10 differentkhác nhau people
117
264000
3000
Và nếu chúng ta lặp lại quá trình này cho 10 người khác nhau
04:42
and all of them agreeđồng ý on what the newMới wordtừ is,
118
267000
2000
và tất cả họ đồng ý với từ mới,
04:44
then we get one more wordtừ digitizedsố hóa accuratelychính xác.
119
269000
2000
thì chúng ta có một từ được điện tử hóa đúng.
04:46
So this is how the systemhệ thống workscông trinh.
120
271000
2000
Và đó là cách mà hệ thống làm việc.
04:48
And basicallyvề cơ bản, sincekể từ we releasedphát hành it about threesố ba or fourbốn yearsnăm agotrước,
121
273000
3000
Và cơ bản, từ khi chúng tôi đưa nó vào hoạt động 3 hay 4 năm trước,
04:51
a lot of websitestrang web have startedbắt đầu switchingchuyển đổi
122
276000
2000
rất nhiều trang web đã bắt đầu chuyển
04:53
from the old CAPTCHACAPTCHA where people wastedlãng phí theirhọ time
123
278000
2000
từ CAPTCHA cũ, cái mà người ta phí phạm thời gian,
04:55
to the newMới CAPTCHACAPTCHA where people are helpinggiúp to digitizesố hoá bookssách.
124
280000
2000
sang dùng CAPTCHA mới, cái mà người ta giúp số hóa sách.
04:57
So for examplethí dụ, TicketmasterTicketmaster.
125
282000
2000
Ví dụ, Ticketmaster.
04:59
So everymỗi time you buymua tickets on TicketmasterTicketmaster, you help to digitizesố hoá a booksách.
126
284000
3000
Và mỗi lần bạn mua vé trên Ticketmaster, bạn đã giúp số hóa sách.
05:02
FacebookFacebook: EveryMỗi time you addthêm vào a friendngười bạn or pokepoke somebodycó ai,
127
287000
2000
Facebook: Mỗi lần bạn thêm bạn mới hay chọc ai đó,
05:04
you help to digitizesố hoá a booksách.
128
289000
2000
bạn giúp số hóa sách.
05:06
TwitterTwitter and about 350,000 other sitesđịa điểm are all usingsử dụng reCAPTCHAreCAPTCHA.
129
291000
3000
Twitter và khoảng 350.000 trang web khác tất cả đang sử dụng reCAPTCHA.
05:09
And in factthực tế, the numbercon số of sitesđịa điểm that are usingsử dụng reCAPTCHAreCAPTCHA is so highcao
130
294000
2000
Và thực sự, số lượng trang web đang sử dụng reCAPTCHA là rất cao
05:11
that the numbercon số of wordstừ ngữ that we're digitizingsố hoá permỗi day is really, really largelớn.
131
296000
3000
đến nỗi số lượng từ mà chúng tôi số hóa mỗi ngày thực sự rất lớn.
05:14
It's about 100 milliontriệu a day,
132
299000
2000
Khoảng 100 triệu từ một ngày,
05:16
which is the equivalenttương đương of about two and a halfmột nửa milliontriệu bookssách a yearnăm.
133
301000
4000
tương đương khoảng 2 triệu rưỡi quyển sách mỗi năm.
05:20
And this is all beingđang donelàm xong one wordtừ at a time
134
305000
2000
Và tất cả đều được làm từng từ một
05:22
by just people typingđánh máy CAPTCHAsCAPTCHA on the InternetInternet.
135
307000
2000
bằng những người gõ CAPTCHA trên Internet.
05:24
(ApplauseVỗ tay)
136
309000
8000
(Vỗ tay)
05:32
Now of coursekhóa học,
137
317000
2000
Tất nhiên,
05:34
sincekể từ we're doing so manynhiều wordstừ ngữ permỗi day,
138
319000
2000
vì chúng tôi làm quá nhiều từ mỗi ngày,
05:36
funnybuồn cười things can happenxảy ra.
139
321000
2000
những điều buồn cười có thể xảy ra.
05:38
And this is especiallyđặc biệt truethật because now we're givingtặng people
140
323000
2000
Và đây là điều có thật vì bây giờ chúng tôi đang đưa cho người ta
05:40
two randomlyngẫu nhiên chosenđã chọn EnglishTiếng Anh wordstừ ngữ nextkế tiếp to eachmỗi other.
141
325000
2000
2 từ tiếng Anh ngẫu nhiên cạnh nhau.
05:42
So funnybuồn cười things can happenxảy ra.
142
327000
2000
để những điều buồn cười có thể xảy ra.
05:44
For examplethí dụ, we presentedtrình bày this wordtừ.
143
329000
2000
Ví dụ, chúng tôi đã đưa ra từ này.
05:46
It's the wordtừ "ChristiansKitô hữu"; there's nothing wrongsai rồi with it.
144
331000
2000
Nó là từ "Christians" (nghĩa là người theo công giáo); không có gì sai ở đây.
05:48
But if you presenthiện tại it alongdọc theo with anotherkhác randomlyngẫu nhiên chosenđã chọn wordtừ,
145
333000
3000
Nhưng nếu bạn để nó cạnh một từ ngẫu nhiên,
05:51
badxấu things can happenxảy ra.
146
336000
2000
điều tồi tệ có thể xảy ra.
05:53
So we get this. (TextVăn bản: badxấu christiansKitô hữu)
147
338000
2000
Và chúng tôi có từ này. Trên màn hình: bad christians (nghĩa là người công giáo xấu xa)
05:55
But it's even worsetệ hơn, because the particularcụ thể websitetrang mạng where we showedcho thấy this
148
340000
3000
Nó thậm chí tồi tệ hơn, bởi vì trang web đưa ra từ này
05:58
actuallythực ra happenedđã xảy ra to be calledgọi là The EmbassyĐại sứ quán of the KingdomQuốc Anh of God.
149
343000
3000
tình cờ lại là trang The Embassy of the Kingdom of God (Một trang web về đạo công giáo).
06:01
(LaughterTiếng cười)
150
346000
2000
(Tiếng cười)
06:03
OopsRất tiếc.
151
348000
2000
Oops.
06:05
(LaughterTiếng cười)
152
350000
3000
(Tiếng cười)
06:08
Here'sĐây là anotherkhác really badxấu one.
153
353000
2000
Đây là một ví dụ rất tệ khác.
06:10
JohnEdwardsJohnEdwards.comcom
154
355000
2000
JohnEdwards.com (một trang ủng hộ cho chính trị gia này, ông này thuộc đảng dân chủ)
06:12
(TextVăn bản: DamnChết tiệt liberaltự do)
155
357000
3000
Màn hình: Damn liberal (nghĩa là Đảng dân chủ khốn kiếp)
06:15
(LaughterTiếng cười)
156
360000
2000
(Tiếng cười)
06:17
So we keep on insultingxúc phạm people left and right everydaymỗi ngày.
157
362000
3000
Và chúng tôi tiếp tục lăng mạ người ta mỗi ngày.
06:20
Now, of coursekhóa học, we're not just insultingxúc phạm people.
158
365000
2000
Và, tất nhiên, chúng tôi không chỉ lăng mạ người khác.
06:22
See here'sđây là the thing, sincekể từ we're presentingtrình bày two randomlyngẫu nhiên chosenđã chọn wordstừ ngữ,
159
367000
3000
Đây là vấn đề, vì chúng tôi đưa ra 2 từ ngẫu nhiên,
06:25
interestinghấp dẫn things can happenxảy ra.
160
370000
2000
điều thú vị có thể xảy ra.
06:27
So this actuallythực ra has givenđược risetăng lên
161
372000
2000
Và điều này thực sự tạo nên
06:29
to a really biglớn InternetInternet memememe
162
374000
3000
của một trào lưu trên Internet
06:32
that tenshàng chục of thousandshàng nghìn of people have participatedtham gia in,
163
377000
2000
mà hàng vạn người tham gia,
06:34
which is calledgọi là CAPTCHACAPTCHA artnghệ thuật.
164
379000
2000
được gọi là nghệ thuật CAPTCHA.
06:36
I'm sure some of you have heardnghe about it.
165
381000
2000
Tôi chắc rằng vài người trong số các bạn đã nghe tới nó.
06:38
Here'sĐây là how it workscông trinh.
166
383000
2000
Và cách nó hoạt động như sau.
06:40
ImagineHãy tưởng tượng you're usingsử dụng the InternetInternet and you see a CAPTCHACAPTCHA
167
385000
2000
Tưởng tượng bạn đang dùng Internet và bạn thấy một cái CAPTCHA
06:42
that you think is somewhatphần nào peculiarkỳ dị,
168
387000
2000
mà bạn nghĩ là nó thú vị,
06:44
like this CAPTCHACAPTCHA. (TextVăn bản: invisiblevô hình toasterLò nướng bánh)
169
389000
2000
giống như cái CAPTCHA này. Màn hình: máy nướng tàng hình (invisible toaster)
06:46
Then what you're supposedgiả định to do is you take a screenmàn shotbắn of it.
170
391000
2000
Rồi cái mà bạn làm là bạn chụp màn hình đó lại.
06:48
Then of coursekhóa học, you filllấp đầy out the CAPTCHACAPTCHA
171
393000
2000
Và dĩ nhiên, bạn điền cái CAPTCHA
06:50
because you help us digitizesố hoá a booksách.
172
395000
2000
vì bạn giúp chúng tôi số hóa sách.
06:52
But then, first you take a screenmàn shotbắn,
173
397000
2000
Nhưng đầu tiên là bạn chụp màn hình,
06:54
and then you drawvẽ tranh something that is relatedliên quan to it.
174
399000
2000
và rồi bạn vẽ vời cái gì đó liên quan tới cụm từ đó.
06:56
(LaughterTiếng cười)
175
401000
2000
(Tiếng cười)
06:58
That's how it workscông trinh.
176
403000
3000
Nó như vậy đó.
07:01
There are tenshàng chục of thousandshàng nghìn of these.
177
406000
3000
Có hàng vạn tác phẩm như vậy.
07:04
Some of them are very cuteDễ thương. (TextVăn bản: clenchedclenched it)
178
409000
2000
Vài tác phẩm rất dễ thương. Màn hình: Clenched it (nghiến nó)
07:06
(LaughterTiếng cười)
179
411000
2000
(Tiếng cười)
07:08
Some of them are funnierfunnier.
180
413000
2000
Vài tác phẩm buồn cười hơn.
07:10
(TextVăn bản: stonedném đá foundersngười sáng lập)
181
415000
3000
Văn bản: stoned founders (các nhà sáng lập hóa đá, founder ở đây ý nói những vị lãnh tựu thành lập nước Mỹ)
07:13
(LaughterTiếng cười)
182
418000
3000
(Tiếng cười)
07:16
And some of them,
183
421000
2000
Và cái,
07:18
like paleontologicalcổ shvisleshvisle,
184
423000
3000
như là "paleontological shvisle",
07:21
they containchứa SnoopSnoop DoggDogg.
185
426000
2000
chúng có "Snoop Dogg".
07:23
(LaughterTiếng cười)
186
428000
3000
(Tiếng cười)
07:26
Okay, so this is my favoriteyêu thích numbercon số of reCAPTCHAreCAPTCHA.
187
431000
2000
Và đây là còn số yêu thích của tôi về reCAPTCHA.
07:28
So this is the favoriteyêu thích thing that I like about this wholetoàn thể projectdự án.
188
433000
3000
Và đây là điều yêu thích của tôi về dự án này.
07:31
This is the numbercon số of distinctkhác biệt people
189
436000
2000
Đây là số lượng người khác nhau
07:33
that have helpedđã giúp us digitizesố hoá at leastít nhất one wordtừ out of a booksách throughxuyên qua reCAPTCHAreCAPTCHA:
190
438000
3000
đã giúp chúng tôi số hóa ít nhất một từ trong sách thông qua reCAPTCHA:
07:36
750 milliontriệu,
191
441000
2000
750 triệu,
07:38
which is a little over 10 percentphần trăm of the world'scủa thế giới populationdân số,
192
443000
2000
hơn 10% dân số thế giới một chút,
07:40
has helpedđã giúp us digitizesố hoá humanNhân loại knowledgehiểu biết.
193
445000
2000
đã giúp chúng tôi số hóa kiến thức nhân loại.
07:42
And it is numberssố like these that motivateđộng viên my researchnghiên cứu agendachương trình nghị sự.
194
447000
3000
Và những con số như vậy đã là động lực thúc đẩy công tác nghiên cứu của tôi.
07:45
So the questioncâu hỏi that motivatesthúc đẩy my researchnghiên cứu is the followingtiếp theo:
195
450000
3000
Vì vậy câu hỏi thúc đẩy nghiên cứu của tôi là:
07:48
If you look at humanity'snhân loại large-scalequy mô lớn achievementsthành tựu,
196
453000
2000
Nếu bạn nhìn vào các thành tựu lớn của nhân loại,
07:50
these really biglớn things
197
455000
2000
những cái thực sự lớn
07:52
that humanitynhân loại has gottennhận togethercùng với nhau and donelàm xong historicallylịch sử --
198
457000
3000
mà nhân loại đã tập hợp lại và cùng làm nên lịch sử --
07:55
like for examplethí dụ, buildingTòa nhà the pyramidskim tự tháp of EgyptAi Cập
199
460000
2000
ví dụ như là xây các kim tự tháp ở Ai Cập
07:57
or the PanamaPanama CanalKênh đào
200
462000
2000
hay là kênh đào Panama
07:59
or puttingđặt a man on the MoonMặt Trăng --
201
464000
2000
hay là đưa người lên mặt trăng --
08:01
there is a curiousHiếu kỳ factthực tế about them,
202
466000
2000
có một sự thật đáng tò mò về họ,
08:03
and it is that they were all donelàm xong with about the sametương tự numbercon số off people.
203
468000
2000
và đó chính là các điều đó được làm với số lượng người gần giống nhau.
08:05
It's weirdkỳ dị; they were all donelàm xong with about 100,000 people.
204
470000
3000
Nó thật lạ; tất cả điều đó được làm với khoảng 100.000 người.
08:08
And the reasonlý do for that is because, before the InternetInternet,
205
473000
3000
Và lý do là vì, trước khi có Internet,
08:11
coordinatingphối hợp more than 100,000 people,
206
476000
2000
điều hành hơn 100.000 người,
08:13
let alonemột mình payingtrả tiền them, was essentiallybản chất impossibleKhông thể nào.
207
478000
3000
đừng nói đến là cả trả lương họ, dường như là không tưởng rồi.
08:16
But now with the InternetInternet, I've just shownđược hiển thị you a projectdự án
208
481000
2000
Nhưng với Internet, chúng tôi chỉ mới cho các bạn xem một dự án
08:18
where we'vechúng tôi đã gottennhận 750 milliontriệu people
209
483000
2000
mà chúng tôi có 750 triệu người
08:20
to help us digitizesố hoá humanNhân loại knowledgehiểu biết.
210
485000
2000
giúp chúng tôi số hóa kiến thức nhân loại.
08:22
So the questioncâu hỏi that motivatesthúc đẩy my researchnghiên cứu is,
211
487000
2000
Vì vậy câu hỏi thúc đẩy nghiên cứu của tôi là,
08:24
if we can put a man on the MoonMặt Trăng with 100,000,
212
489000
3000
nếu chúng ta có thể đưa người lên mặt trăng với 100.000 người,
08:27
what can we do with 100 milliontriệu?
213
492000
2000
chúng ta sẽ có thể làm gì với 100 triệu?
08:29
So baseddựa trên on this questioncâu hỏi,
214
494000
2000
Và dựa trên câu hỏi này,
08:31
we'vechúng tôi đã had a lot of differentkhác nhau projectsdự án that we'vechúng tôi đã been workingđang làm việc on.
215
496000
2000
chúng tôi đã có nhiều dự án khác nhau mà chúng tôi đang làm.
08:33
Let me tell you about one that I'm mostphần lớn excitedbị kích thích about.
216
498000
3000
Để tôi kể các bạn về một cái mà tôi hứng thú nhất.
08:36
This is something that we'vechúng tôi đã been semi-quietlybán lặng lẽ workingđang làm việc on
217
501000
2000
Đây là cái mà chúng tôi đã làm một cách bán-lặng lẽ
08:38
for the last yearnăm and a halfmột nửa or so.
218
503000
2000
trong khoảng một năm rưỡi.
08:40
It hasn'tđã không yetchưa been launchedđưa ra. It's calledgọi là DuolingoDuolingo.
219
505000
2000
Nó vẫn chưa ra mắt. Nó được gọi là Duolingo.
08:42
SinceKể từ khi it hasn'tđã không been launchedđưa ra, shhhhhshhhhh!
220
507000
2000
Vì nó chưa ra mắt nên, suỵt!
08:44
(LaughterTiếng cười)
221
509000
2000
(Tiếng cười)
08:46
Yeah, I can trustLòng tin you'llbạn sẽ do that.
222
511000
2000
Vâng, tôi có thể tin tưởng các bạn.
08:48
So this is the projectdự án. Here'sĐây là how it startedbắt đầu.
223
513000
2000
Và dự án này, nó bắt đầu thế này.
08:50
It startedbắt đầu with me posingĐặt ra a questioncâu hỏi to my graduatetốt nghiệp studentsinh viên,
224
515000
2000
Nó bắt đầu bằng việc tôi đưa ra một câu hỏi cho sinh viên sau đại học của tôi,
08:52
SeverinSeverin HackerHacker.
225
517000
2000
Severin Hacker.
08:54
Okay, that's SeverinSeverin HackerHacker.
226
519000
2000
Vâng, đó là Severin Hacker.
08:56
So I posedĐặt ra the questioncâu hỏi to my graduatetốt nghiệp studentsinh viên.
227
521000
2000
Và tôi đă ra một câu hỏi cho sinh viên sau đại học của tôi.
08:58
By the way, you did hearNghe me correctlyđúng;
228
523000
2000
Các bạn nghe rõ chứ,
09:00
his last nameTên is HackerHacker.
229
525000
2000
họ của anh ta là Hacker.
09:02
So I posedĐặt ra this questioncâu hỏi to him:
230
527000
2000
Và tôi đưa ra câu hỏi này cho anh ta:
09:04
How can we get 100 milliontriệu people
231
529000
2000
Làm cách nào chúng ta có thể làm cho 100 triệu người
09:06
translatingdịch the WebWeb into everymỗi majorchính languagengôn ngữ for freemiễn phí?
232
531000
3000
dịch trang web sang tất cả các ngôn ngữ chính miễn phí?
09:09
Okay, so there's a lot of things to say about this questioncâu hỏi.
233
534000
2000
Vâng, có nhiều thứ để nói về câu hỏi này.
09:11
First of all, translatingdịch the WebWeb.
234
536000
2000
Đầu tiên, dịch trang web.
09:13
So right now the WebWeb is partitionedphân vùng into multiplenhiều languagesngôn ngữ.
235
538000
3000
Hiện tại web được phân vùng thành nhiều ngôn ngữ.
09:16
A largelớn fractionphân số of it is in EnglishTiếng Anh.
236
541000
2000
Phần lớn là Tiếng Anh.
09:18
If you don't know any EnglishTiếng Anh, you can't accesstruy cập it.
237
543000
2000
Nếu bạn không biết Tiếng Anh, bạn không thể sử dụng chúng được.
09:20
But there's largelớn fractionsphân số in other differentkhác nhau languagesngôn ngữ,
238
545000
2000
Nhưng có một phần lớn khác là các ngôn ngữ khác,
09:22
and if you don't know those languagesngôn ngữ, you can't accesstruy cập it.
239
547000
3000
và nếu bạn không biết những ngôn ngữ đó, bạn không thể sử dụng được.
09:25
So I would like to translatedịch all of the WebWeb, or at leastít nhất mostphần lớn of the WebWeb,
240
550000
3000
Vì vậy tôi muốn dịch tất cả trên Web, hay là ít nhất là phần lớn Web,
09:28
into everymỗi majorchính languagengôn ngữ.
241
553000
2000
sang tất cả ngôn ngữ chính.
09:30
So that's what I would like to do.
242
555000
2000
Và đó là cái mà tôi muốn làm.
09:32
Now some of you mayTháng Năm say, why can't we use computersmáy vi tính to translatedịch?
243
557000
3000
Vài người trong các bạn có thể nói, tại sao chúng ta không thể sử dụng máy tính để dịch?
09:35
Why can't we use machinemáy móc translationdịch?
244
560000
2000
Tại sao không dịch bằng máy?
09:37
MachineMáy translationdịch nowadaysngày nay is startingbắt đầu to translatedịch some sentencescâu here and there.
245
562000
2000
Dịch bằng máy hiện tại bắt đầu dịch vài câu lẻ tẻ.
09:39
Why can't we use it to translatedịch the wholetoàn thể WebWeb?
246
564000
2000
Tại sao chúng ta không dùng nó để dịch các trang web?
09:41
Well the problemvấn đề with that is that it's not yetchưa good enoughđủ
247
566000
2000
Thực ra vấn đề là dịch máy chưa đủ tốt
09:43
and it probablycó lẽ won'tsẽ không be for the nextkế tiếp 15 to 20 yearsnăm.
248
568000
2000
và nó có thể sẽ không đủ tốt trong 15 hay 20 năm tới.
09:45
It makeslàm cho a lot of mistakessai lầm.
249
570000
2000
Nó có nhiều sai lầm.
09:47
Even when it doesn't make a mistakesai lầm,
250
572000
2000
Thậm chí khi nó không mắc sai lầm,
09:49
sincekể từ it makeslàm cho so manynhiều mistakessai lầm, you don't know whetherliệu to trustLòng tin it or not.
251
574000
3000
vì nó mắc nhiều sai lầm, bạn không biết khi nào nên tin nó hay là không.
09:52
So let me showchỉ you an examplethí dụ
252
577000
2000
Để tôi lấy một ví dụ cho các bạn
09:54
of something that was translateddịch with a machinemáy móc.
253
579000
2000
về vài thứ đã được dịch bằng máy.
09:56
ActuallyTrên thực tế it was a forumdiễn đàn postbài đăng.
254
581000
2000
Thực ra nó là một bài đăng trên forum.
09:58
It was somebodycó ai who was tryingcố gắng to askhỏi a questioncâu hỏi about JavaScriptJavaScript.
255
583000
3000
Có ai đó muốn hỏi một câu hỏi về JavaScript.
10:01
It was translateddịch from JapaneseNhật bản into EnglishTiếng Anh.
256
586000
3000
Nó được dịch từ tiếng Nhật sang tiếng Anh.
10:04
So I'll just let you readđọc.
257
589000
2000
Và tôi sẽ để các bạn tự đọc.
10:06
This personngười startsbắt đầu apologizingXin lỗi
258
591000
2000
Người này bắt đầu bằng việc xin lỗi
10:08
for the factthực tế that it's translateddịch with a computermáy vi tính.
259
593000
2000
về việc bài đăng này được dịch với một máy tính.
10:10
So the nextkế tiếp sentencecâu is is going to be the preamblelời mở đầu to the questioncâu hỏi.
260
595000
3000
Và câu kế là phần mào đầu của câu hỏi.
10:13
So he's just explaininggiải thích something.
261
598000
2000
Và anh ta chỉ giải thích gì đó.
10:15
RememberHãy nhớ, it's a questioncâu hỏi about JavaScriptJavaScript.
262
600000
3000
Nên nhớ, nó là một câu hỏi về JavaScript.
10:19
(TextVăn bản: At oftenthường xuyên, the goat-timethời gian dê installcài đặt, dựng lên a errorlỗi is vomitnôn mửa.)
263
604000
4000
Chữ: Thường xuyên, thời gian dê cài đặt một lỗi là nôn (Máy tính dịch)
10:23
(LaughterTiếng cười)
264
608000
4000
(Tiếng cười)
10:27
Then comesđến the first partphần of the questioncâu hỏi.
265
612000
3000
Và rồi tới phần đầu của câu hỏi.
10:30
(TextVăn bản: How manynhiều timeslần like the windgió, a polecây sào, and the dragonrồng?)
266
615000
4000
Chữ: Làm thế nào nhiều lần như gió, trụ, và con rồng?
10:34
(LaughterTiếng cười)
267
619000
2000
(Tiếng cười)
10:36
Then comesđến my favoriteyêu thích partphần of the questioncâu hỏi.
268
621000
3000
Và rồi tới phần yêu thích nhất của tôi trong câu hỏi này.
10:39
(TextVăn bản: This insultsự xúc phạm to father'scha stonesđá?)
269
624000
3000
Chữ: Điều này xúc phạm đến đá của cha?
10:42
(LaughterTiếng cười)
270
627000
2000
(Tiếng cười)
10:44
And then comesđến the endingkết thúc, which is my favoriteyêu thích partphần of the wholetoàn thể thing.
271
629000
3000
Và rồi đến phần cuối, phần yêu thích nhất của tôi trong toàn bộ.
10:47
(TextVăn bản: Please apologizexin lỗi for your stupiditysự ngu ngốc. There are a manynhiều thank you.)
272
632000
4000
Chữ: Xin vui lòng xin lỗi cho sự ngu dốt của bạn. Có một rất nhiều cảm ơn bạn.
10:51
(LaughterTiếng cười)
273
636000
2000
(Tiếng cười)
10:53
Okay, so computermáy vi tính translationdịch, not yetchưa good enoughđủ.
274
638000
2000
Đó là tại sao dịch bằng máy chưa đủ tốt.
10:55
So back to the questioncâu hỏi.
275
640000
2000
Và quay lại câu hỏi.
10:57
So we need people to translatedịch the wholetoàn thể WebWeb.
276
642000
3000
Chúng tôi cần người để dịch toàn bộ Web.
11:00
So now the nextkế tiếp questioncâu hỏi you mayTháng Năm have is,
277
645000
2000
Và câu hỏi tiếp theo bạn có thể có là,
11:02
well why can't we just paytrả people to do this?
278
647000
2000
tại sao bạn không trả công cho người ta để dịch?
11:04
We could paytrả professionalchuyên nghiệp languagengôn ngữ translatorsPhiên dịch to translatedịch the wholetoàn thể WebWeb.
279
649000
3000
Chúng tôi có thể trả cho chuyên gia dịch thuật để dịch toàn bộ Web.
11:07
We could do that.
280
652000
2000
Chúng tôi có thể làm điều đó.
11:09
UnfortunatelyThật không may, it would be extremelyvô cùng expensiveđắt.
281
654000
2000
Nhưng không may là nó sẽ cực kỳ mắc.
11:11
For examplethí dụ, translatingdịch a tinynhỏ bé, tinynhỏ bé fractionphân số of the wholetoàn thể WebWeb, WikipediaWikipedia,
282
656000
3000
Ví dụ, dịch một phần nhỏ, rất nhỏ của toàn bộ Web, trang Wikipedia,
11:14
into one other languagengôn ngữ, SpanishTiếng Tây Ban Nha.
283
659000
3000
sang một ngôn ngữ khác, tiếng Tây Ban Nha chẳng hạn.
11:17
WikipediaWikipedia existstồn tại in SpanishTiếng Tây Ban Nha,
284
662000
2000
Wikipedia có phiên bản tiếng Tây Ban Nha,
11:19
but it's very smallnhỏ bé comparedso to the sizekích thước of EnglishTiếng Anh.
285
664000
2000
nhưng nó rất nhỏ so với phiên bản tiếng Anh.
11:21
It's about 20 percentphần trăm of the sizekích thước of EnglishTiếng Anh.
286
666000
2000
Nó khoảng 20 phần trăm kích thước của bản tiếng Anh.
11:23
If we wanted to translatedịch the other 80 percentphần trăm into SpanishTiếng Tây Ban Nha,
287
668000
3000
Nếu chúng ta muốn dịch 80 phần trăm kia sang tiếng Tây Ban Nha,
11:26
it would costGiá cả at leastít nhất 50 milliontriệu dollarsUSD --
288
671000
2000
nó sẽ tốn tối thiểu 50 triệu đô la Mỹ --
11:28
and this is at even the mostphần lớn exploitedkhai thác, outsourcinggia công phần mềm countryQuốc gia out there.
289
673000
3000
và thậm chí đây là một quốc gia nhận dịch thuật rẻ nhất (ý nói đến Mexico, không phải nói tới Tây Ban Nha)
11:31
So it would be very expensiveđắt.
290
676000
2000
Nó sẽ rất mắc.
11:33
So what we want to do is we want to get 100 milliontriệu people
291
678000
2000
Vì vậy cái mà chúng tôi muốn làm là có 100 triệu người
11:35
translatingdịch the WebWeb into everymỗi majorchính languagengôn ngữ
292
680000
2000
dịch Web sang mọi ngôn ngữ chính
11:37
for freemiễn phí.
293
682000
2000
miễn phí.
11:39
Now if this is what you want to do,
294
684000
2000
Hiện tại nếu đây là cái mà bạn muốn làm,
11:41
you prettyđẹp quicklyMau realizenhận ra you're going to runchạy into two prettyđẹp biglớn hurdlesvượt rào,
295
686000
2000
bạn sẽ sớm nhận ra bạn sẽ gặp phải 2 trở ngại khá lớn,
11:43
two biglớn obstacleschướng ngại vật.
296
688000
2000
2 trở ngại lớn.
11:45
The first one is a lackthiếu sót of bilingualsbilinguals.
297
690000
3000
Đầu tiên là thiếu người biết 2 thứ tiếng.
11:48
So I don't even know
298
693000
2000
Và tôi thậm chí không biết
11:50
if there existstồn tại 100 milliontriệu people out there usingsử dụng the WebWeb
299
695000
3000
nếu mà tồn tại 100 triệu người đang sử dụng Web
11:53
who are bilingualsong ngữ enoughđủ to help us translatedịch.
300
698000
2000
mà biết hai thử tiếng đủ để giúp chúng tôi dịch.
11:55
That's a biglớn problemvấn đề.
301
700000
2000
Đó là một vấn đề lớn.
11:57
The other problemvấn đề you're going to runchạy into is a lackthiếu sót of motivationđộng lực.
302
702000
2000
Vấn đề khác bạn sẽ gặp phải là thiếu động lực.
11:59
How are we going to motivateđộng viên people
303
704000
2000
Làm cách nào bạn thúc đẩy người ta
12:01
to actuallythực ra translatedịch the WebWeb for freemiễn phí?
304
706000
2000
dịch trang web miễn phí?
12:03
NormallyBình thường, you have to paytrả people to do this.
305
708000
3000
Bình thường bạn phải trả công cho người ta để làm điều này.
12:06
So how are we going to motivateđộng viên them to do it for freemiễn phí?
306
711000
2000
Vì vậy làm cách nào bạn thúc đẩy họ làm điều này miễn phí?
12:08
Now when we were startingbắt đầu to think about this, we were blockedbị chặn by these two things.
307
713000
3000
Khi mà chúng tôi bắt đầu nghĩ về điều này, chúng tôi đã bị vướng 2 điều trên.
12:11
But then we realizedthực hiện, there's actuallythực ra a way
308
716000
2000
Nhưng rồi chúng tôi nhận ra, thực sự có một cách
12:13
to solvegiải quyết bothcả hai these problemscác vấn đề with the sametương tự solutiondung dịch.
309
718000
2000
để giải quyết cả 2 vấn đề này với cùng một lời giải.
12:15
There's a way to killgiết chết two birdschim with one stoneCục đá.
310
720000
2000
Cố một cách mà một mũi tên bắn trúng 2 con nhạn.
12:17
And that is to transformbiến đổi languagengôn ngữ translationdịch
311
722000
3000
Đó là biến đổi dịch thuật
12:20
into something that millionshàng triệu of people want to do,
312
725000
3000
thành một thứ mà hàng triệu người muốn làm,
12:23
and that alsocũng thế helpsgiúp with the problemvấn đề of lackthiếu sót of bilingualsbilinguals,
313
728000
3000
và điều đó cũng giải quyết vấn đề thiếu người biết song ngữ,
12:26
and that is languagengôn ngữ educationgiáo dục.
314
731000
3000
và đó là dạy tiếng.
12:29
So it turnslượt out that todayhôm nay,
315
734000
2000
Hiện tại,
12:31
there are over 1.2 billiontỷ people learninghọc tập a foreignngoại quốc languagengôn ngữ.
316
736000
3000
có hang 1,2 tỉ người học tiếng nước ngoài.
12:34
People really, really want to learnhọc hỏi a foreignngoại quốc languagengôn ngữ.
317
739000
2000
Người ta rất, rất muốn học một ngoại ngữ.
12:36
And it's not just because they're beingđang forcedbuộc to do so in schooltrường học.
318
741000
3000
Và nó không chỉ vì họ bị bắt buộc phải học.
12:39
For examplethí dụ, in the UnitedVương StatesTiểu bang alonemột mình,
319
744000
2000
Ví dụ, chỉ ở đơn cử ở Mỹ,
12:41
there are over fivesố năm milliontriệu people who have paidđã thanh toán over $500
320
746000
2000
có hơn 5 triệu người đã trả hơn 500 đô la Mỹ
12:43
for softwarephần mềm to learnhọc hỏi a newMới languagengôn ngữ.
321
748000
2000
để mua phần mềm học ngoại ngữ.
12:45
So people really, really want to learnhọc hỏi a newMới languagengôn ngữ.
322
750000
2000
Vì người ta rất, rất muốn học ngoại ngữ.
12:47
So what we'vechúng tôi đã been workingđang làm việc on for the last yearnăm and a halfmột nửa is a newMới websitetrang mạng --
323
752000
3000
Vì vậy cái mà chúng tôi đang làm trong một năm rưỡi nay là một trang web mới --
12:50
it's calledgọi là DuolingoDuolingo --
324
755000
2000
nó được gọi là Duolingo --
12:52
where the basiccăn bản ideaý kiến is people learnhọc hỏi a newMới languagengôn ngữ for freemiễn phí
325
757000
3000
với ý tưởng cơ bản là mọi nguwofi học một ngôn ngữ mới miễn phí
12:55
while simultaneouslyđồng thời translatingdịch the WebWeb.
326
760000
2000
trong khi dịch Web.
12:57
And so basicallyvề cơ bản they're learninghọc tập by doing.
327
762000
2000
Và cơ bản là học học bằng cách làm.
12:59
So the way this workscông trinh
328
764000
2000
Và cách nó hoạt động
13:01
is wheneverbất cứ khi nào you're a just a beginnerngười mới bắt đầu, we give you very, very simpleđơn giản sentencescâu.
329
766000
3000
là khi bạn là một người mới học, chúng tôi cho các bạn những câu rất, rất đơn giản.
13:04
There's, of coursekhóa học, a lot of very simpleđơn giản sentencescâu on the WebWeb.
330
769000
2000
Và tất nhiên là có rất nhiều câu rất đơn giản trên Web.
13:06
We give you very, very simpleđơn giản sentencescâu
331
771000
2000
Chúng tôi cho các bạn những câu rất, rất đơn giản
13:08
alongdọc theo with what eachmỗi wordtừ meanscó nghĩa.
332
773000
2000
cùng với nghĩa của mỗi từ.
13:10
And as you translatedịch them, and as you see how other people translatedịch them,
333
775000
3000
Và trong khi các bạn dịch chúng, và thấy cách người khác dịch chúng,
13:13
you startkhởi đầu learninghọc tập the languagengôn ngữ.
334
778000
2000
bạn bắt đầu học ngoại ngữ đó.
13:15
And as you get more and more advancednâng cao,
335
780000
2000
Và càng ngày bạn càng tiến bộ,
13:17
we give you more and more complexphức tạp sentencescâu to translatedịch.
336
782000
2000
chúng tôi cho các bạn các câu phức tạp hơn để dịch.
13:19
But at all timeslần, you're learninghọc tập by doing.
337
784000
2000
Nhưng toàn bộ thời gian, các bạn học bằng cách làm.
13:21
Now the crazykhùng thing about this methodphương pháp
338
786000
2000
Và điều điên rồi về phương pháp này
13:23
is that it actuallythực ra really workscông trinh.
339
788000
2000
là nó thực sự khả thi.
13:25
First of all, people are really, really learninghọc tập a languagengôn ngữ.
340
790000
2000
Đầu tiên, người ta rất, rất muốn học ngoại ngữ.
13:27
We're mostlychủ yếu donelàm xong buildingTòa nhà it, and now we're testingthử nghiệm it.
341
792000
2000
Chúng tôi hầu như xây dựng xong nó, và chúng tôi đang thử nghiệm nó.
13:29
People really can learnhọc hỏi a languagengôn ngữ with it.
342
794000
2000
Người ta có thể thực sự học ngoại ngữ với nó.
13:31
And they learnhọc hỏi it about as well as the leadingdẫn đầu languagengôn ngữ learninghọc tập softwarephần mềm.
343
796000
3000
Và họ học nó tốt như là với các phần mềm ngôn ngữ hàng đầu.
13:34
So people really do learnhọc hỏi a languagengôn ngữ.
344
799000
2000
Vì vậy người ta thực sự học ngoại ngữ.
13:36
And not only do they learnhọc hỏi it as well,
345
801000
2000
Và không chỉ học nó,
13:38
but actuallythực ra it's way more interestinghấp dẫn.
346
803000
2000
mà còn học một cách thú vị.
13:40
Because you see with DuolingoDuolingo, people are actuallythực ra learninghọc tập with realthực contentNội dung.
347
805000
3000
Vì bạn thấy với Duolingo, người ta thực sự học với nội dung thực.
13:43
As opposedphản đối to learninghọc tập with made-upthực hiện lên sentencescâu,
348
808000
2000
Ngược lại với học bằng những câu nghĩ ra,
13:45
people are learninghọc tập with realthực contentNội dung, which is inherentlyvốn có interestinghấp dẫn.
349
810000
3000
người ta học với nội dung thật, những câu thực sự thú vị.
13:48
So people really do learnhọc hỏi a languagengôn ngữ.
350
813000
2000
Vì vậy họ thực sự học một ngôn ngữ.
13:50
But perhapscó lẽ more surprisinglythật ngạc nhiên,
351
815000
2000
Nhưng thậm chí bất ngờ hơn,
13:52
the translationsbản dịch that we get from people usingsử dụng the siteđịa điểm,
352
817000
3000
bản dịch mà chúng tôi lấy từ người dùng trang web,
13:55
even thoughTuy nhiên they're just beginnersngười mới bắt đầu,
353
820000
2000
thậm chí họ chỉ là người mới học,
13:57
the translationsbản dịch that we get are as accuratechính xác as those of professionalchuyên nghiệp languagengôn ngữ translatorsPhiên dịch,
354
822000
3000
bản dịch từ học chính xác như là những người dịch chuyên nghiệp,
14:00
which is very surprisingthật ngạc nhiên.
355
825000
2000
điều đó rất bất ngờ.
14:02
So let me showchỉ you one examplethí dụ.
356
827000
2000
Để tôi lấy một ví dụ cho bạn xem.
14:04
This is a sentencecâu that was translateddịch from GermanĐức into EnglishTiếng Anh.
357
829000
2000
Đây là một câu được dịch từ tiếng Đức sang tiếng Anh.
14:06
The tophàng đầu is the GermanĐức.
358
831000
2000
Trên cùng là tiếng Đức.
14:08
The middleở giữa is an EnglishTiếng Anh translationdịch
359
833000
2000
Ở giữa là bản dịch tiếng Anh
14:10
that was donelàm xong by somebodycó ai who was a professionalchuyên nghiệp EnglishTiếng Anh translatorngười phiên dịch
360
835000
2000
được dịch bởi một người dịch chuyên nghiệp
14:12
who we paidđã thanh toán 20 centsxu a wordtừ for this translationdịch.
361
837000
2000
được trả 20 xu cho mỗi từ mà anh ta dịch.
14:14
And the bottomđáy is a translationdịch by usersngười sử dụng of DuolingoDuolingo,
362
839000
3000
Và dưới cùng là câu được dịch bởi những người dùng Duoling,
14:17
nonekhông ai of whomai knewbiết any GermanĐức
363
842000
2000
không ai trong số họ từng biết tiếng Đức
14:19
before they startedbắt đầu usingsử dụng the siteđịa điểm.
364
844000
2000
trước khi họ dùng trang web.
14:21
You can see, it's prettyđẹp much perfecthoàn hảo.
365
846000
2000
Các bạn có thể thấy là nó khác là hoàn hảo.
14:23
Now of coursekhóa học, we playchơi a tricklừa here
366
848000
2000
Hiện tại, tất nhiên là chúng tôi dùng mẹo ở đây
14:25
to make the translationsbản dịch as good as professionalchuyên nghiệp languagengôn ngữ translatorsPhiên dịch.
367
850000
2000
để làm cho những bản dịch đó tốt như là người dịch chuyên nghiệp.
14:27
We combinephối hợp the translationsbản dịch of multiplenhiều beginnersngười mới bắt đầu
368
852000
3000
Chúng tôi kết hợp bản dịch của nhiều người mới học lại
14:30
to get the qualityphẩm chất of a singleĐộc thân professionalchuyên nghiệp translatorngười phiên dịch.
369
855000
3000
để tạo nên một bản dịch chất lượng cao.
14:33
Now even thoughTuy nhiên we're combiningkết hợp the translationsbản dịch,
370
858000
5000
Và thậm chí khi chúng tôi kết hợp các bản dịch,
14:38
the siteđịa điểm actuallythực ra can translatedịch prettyđẹp fastNhanh.
371
863000
2000
trang web vẫn thực sự dịch khá nhanh.
14:40
So let me showchỉ you,
372
865000
2000
Để tôi cho các bạn xem,
14:42
this is our estimatesước tính of how fastNhanh we could translatedịch WikipediaWikipedia
373
867000
2000
đây là ước lượng của chúng tôi về việc dịch Wikipedia nhanh như thế nào
14:44
from EnglishTiếng Anh into SpanishTiếng Tây Ban Nha.
374
869000
2000
từ tiếng Anh sang tiếng Tây Ban Nha.
14:46
RememberHãy nhớ, this is 50 milliontriệu dollars-worthđô la giá trị of valuegiá trị.
375
871000
3000
Nên nhớ, đây là một dự án đáng giá 50 triệu đô la Mỹ.
14:49
So if we wanted to translatedịch WikipediaWikipedia into SpanishTiếng Tây Ban Nha,
376
874000
2000
Và nếu chúng tôi muốn Wikipedia sang tiếng Tây Ban Nha,
14:51
we could do it in fivesố năm weekstuần with 100,000 activeđang hoạt động usersngười sử dụng.
377
876000
3000
chúng tôi có thể làm trong vòng 5 tuần với 100.000 người dùng.
14:54
And we could do it in about 80 hoursgiờ with a milliontriệu activeđang hoạt động usersngười sử dụng.
378
879000
3000
Và chúng tôi có thể làm trong vòng 80 giờ với một triệu người dùng.
14:57
SinceKể từ khi all the projectsdự án that my groupnhóm has workedđã làm việc on so farxa have gottennhận millionshàng triệu of usersngười sử dụng,
379
882000
3000
Vì tất cả các dự án nhóm chúng tôi từng làm tới hiện tại đều có hàng triệu người dùng,
15:00
we're hopefulhy vọng that we'lltốt be ablecó thể to translatedịch
380
885000
2000
chúng tôi hy vọng rằng chúng tôi sẽ có thể dịch
15:02
extremelyvô cùng fastNhanh with this projectdự án.
381
887000
2000
cực nhanh bằng dự án này.
15:04
Now the thing that I'm mostphần lớn excitedbị kích thích about with DuolingoDuolingo
382
889000
3000
Và điều mà tôi hứng thú nhất về Duolingo
15:07
is I think this providescung cấp a fairhội chợ businesskinh doanh modelmô hình for languagengôn ngữ educationgiáo dục.
383
892000
3000
là tôi nghĩ điều này cung cấp một hình mẫu kinh tế công bằng cho giáo dục ngoại ngữ.
15:10
So here'sđây là the thing:
384
895000
2000
Đó chính là:
15:12
The currenthiện hành businesskinh doanh modelmô hình for languagengôn ngữ educationgiáo dục
385
897000
2000
Hình mẫu kinh tế hiện tại của giáo dục ngoại ngữ
15:14
is the studentsinh viên paystrả tiền,
386
899000
2000
là học sinh trả tiền,
15:16
and in particularcụ thể, the studentsinh viên paystrả tiền RosettaRosetta StoneĐá 500 dollarsUSD.
387
901000
2000
và cụ thể là, học sinh trả cho Rosetta Stone 500 đô la Mỹ.
15:18
(LaughterTiếng cười)
388
903000
2000
(Tiếng cười)
15:20
That's the currenthiện hành businesskinh doanh modelmô hình.
389
905000
2000
Đó là hình mẫu kinh tế hiện tại.
15:22
The problemvấn đề with this businesskinh doanh modelmô hình
390
907000
2000
Vấn đề với hình mẫu kinh tế này
15:24
is that 95 percentphần trăm of the world'scủa thế giới populationdân số doesn't have 500 dollarsUSD.
391
909000
3000
là 95 phần trăm dân số thế giới không có 500 đô la Mỹ.
15:27
So it's extremelyvô cùng unfairkhông công bằng towardsvề hướng the poornghèo nàn.
392
912000
3000
Vì vậy nó cực kỳ bất công với người nghèo.
15:30
This is totallyhoàn toàn biasedcó thành kiến towardsvề hướng the richgiàu có.
393
915000
2000
Điều này hoàn toàn nghiên về người giàu.
15:32
Now see, in DuolingoDuolingo,
394
917000
2000
Và bây giờ, với Duolingo,
15:34
because while you learnhọc hỏi
395
919000
2000
vì trong khi bạn học
15:36
you're actuallythực ra creatingtạo valuegiá trị, you're translatingdịch stuffđồ đạc --
396
921000
3000
bạn thực sự đang tạo ra giá trị, bạn đang dịch web --
15:39
which for examplethí dụ, we could chargesạc điện somebodycó ai for translationsbản dịch.
397
924000
3000
và công việc đó, bạn có thể tính tiền ai đó cho việc dịch của bạn.
15:42
So this is how we could monetizekiếm tiền từ this.
398
927000
2000
Và đây chính là cách mà chúng tôi có thể lưu hành nó.
15:44
SinceKể từ khi people are creatingtạo valuegiá trị while they're learninghọc tập,
399
929000
2000
Vì người ta đang tạo ra giá trị trong khi họ đang học,
15:46
they don't have to paytrả theirhọ moneytiền bạc, they paytrả with theirhọ time.
400
931000
3000
họ không phải trả tiền, họ trả bằng thời gian của họ.
15:49
But the magicalhuyền diệu thing here is that they're payingtrả tiền with theirhọ time,
401
934000
3000
Nhưng điều kỳ diệu ở đây là họ trả với thời gian của họ,
15:52
but that is time that would have had to have been spentđã bỏ ra anywaysanyways
402
937000
2000
mà thời gian đó dù sao cũng phải dùng
15:54
learninghọc tập the languagengôn ngữ.
403
939000
2000
để học ngoại ngữ.
15:56
So the nicetốt đẹp thing about DuolingoDuolingo is I think it providescung cấp a fairhội chợ businesskinh doanh modelmô hình --
404
941000
3000
Vì vậy điều tuyệt diệu ở đây về Duolingo là tôi nghĩ nó cung cấp một hình mẫu kinh tế công bằng --
15:59
one that doesn't discriminatephân biệt đối xử againstchống lại poornghèo nàn people.
405
944000
2000
người ta không phân biệt đối xử với người nghèo.
16:01
So here'sđây là the siteđịa điểm. Thank you.
406
946000
2000
Và đây là trang web. Xin cảm ơn.
16:03
(ApplauseVỗ tay)
407
948000
8000
(Vỗ tay)
16:11
So here'sđây là the siteđịa điểm.
408
956000
2000
Và đây là trang web.
16:13
We haven'tđã không yetchưa launchedđưa ra,
409
958000
2000
Chúng tôi chưa ra mắt,
16:15
but if you go there, you can signký tên up to be partphần of our privateriêng tư betabeta,
410
960000
3000
nhưng nếu bạn vào, bạn đăng ký sử dụng bản thử nghiệm,
16:18
which is probablycó lẽ going to startkhởi đầu in about threesố ba or fourbốn weekstuần.
411
963000
2000
sẽ bắt đầu khoảng 3 hay 4 tuần nữa.
16:20
We haven'tđã không yetchưa launchedđưa ra this DuolingoDuolingo.
412
965000
2000
Chúng tôi vẫn chưa ra mắt Duolingo.
16:22
By the way, I'm the one talkingđang nói here,
413
967000
2000
Tiện thể, tôi là người đang nói ở đây,
16:24
but actuallythực ra DuolingoDuolingo is the work of a really awesometuyệt vời teamđội, some of whomai are here.
414
969000
3000
nhưng thực sự Duolingo là sản phẩm của một đội ngũ tuyệt vời, vài người trong số họ có mặt tại đây.
16:27
So thank you.
415
972000
2000
Xin cảm ơn.
16:29
(ApplauseVỗ tay)
416
974000
4000
(Vỗ tay)
Translated by Minh-Tuan Ta
Reviewed by Ha Thu Hai

▲Back to top

ABOUT THE SPEAKER
Luis von Ahn - Computer scientist
Luis von Ahn builds systems that combine humans and computers to solve large-scale problems that neither can solve alone.

Why you should listen

Louis von Ahn is an associate professor of Computer Science at Carnegie Mellon University, and he's at the forefront of the crowdsourcing craze. His work takes advantage of the evergrowing Web-connected population to acheive collaboration in unprecedented numbers. His projects aim to leverage the crowd for human good. His company reCAPTCHA, sold to Google in 2009, digitizes human knowledge (books), one word at a time. His new project is Duolingo, which aims to get 100 million people translating the Web in every major language.

More profile about the speaker
Luis von Ahn | Speaker | TED.com

Data provided by TED.

This site was created in May 2015 and the last update was on January 12, 2020. It will no longer be updated.

We are currently creating a new site called "eng.lish.video" and would be grateful if you could access it.

If you have any questions or suggestions, please feel free to write comments in your language on the contact form.

Privacy Policy

Developer's Blog

Buy Me A Coffee