ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com
TEDxCambridge

Sebastian Wernicke: How to use data to make a hit TV show

Sebastian Wernicke: Làm sao sử dụng dữ liệu để làm ra một chương trình TV xuất sắc

Filmed:
1,628,704 views

Liệu thi thập càng nhiều dữ liệu sẽ dẫn đến một quyết định tốt hơn? Mang tính cạnh tranh, các công ty dữ liệu hiểu biết như Amazon, Google và Netflix đã học được rằng, chỉ một mình phân tích dữ liệu không phải lúc nào cũng đưa đến một kết quả tối ưu. Trong buổi tọa đàm này nhà khoa học dữ liệu Sebastian Wernicke phân tích những sai lầm khi chúng ta đưa ra quyết định chỉ dự trên dữ liệu, và gợi ý cách sữ dụng chúng thông minh hơn.
- Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects. Full bio

Double-click the English transcript below to play the video.

00:12
RoyRoy PriceGiá is a man that mostphần lớn of you
have probablycó lẽ never heardnghe about,
0
820
4276
Roy Price là người mà phần lớn các bạn
có thể chưa từng nghe nói đến
00:17
even thoughTuy nhiên he mayTháng Năm have been responsiblechịu trách nhiệm
1
5120
2496
mặc dù anh ấy có thể đã từng
chịu trách nhiệm
00:19
for 22 somewhatphần nào mediocretầm thường
minutesphút of your life on AprilTháng tư 19, 2013.
2
7640
6896
cho 22 phút hơi tầm thường của đời bạn
trong ngày 19 tháng 4 năm 2013.
00:26
He mayTháng Năm have alsocũng thế been responsiblechịu trách nhiệm
for 22 very entertaininggiải trí minutesphút,
3
14560
3176
Anh ấy có lẽ còn chịu tránh nhiệm
cho mỗi 22 phút giải trí
00:29
but not very manynhiều of you.
4
17760
2256
nhưng không phải nhiều người
trong các bạn.
00:32
And all of that goesđi back to a decisionphán quyết
5
20040
1896
và tất cả đã dẫn đến một quyết định
00:33
that RoyRoy had to make
about threesố ba yearsnăm agotrước.
6
21960
2000
mà Roy phải thực hiện trong 3 năm
00:35
So you see, RoyRoy PriceGiá
is a seniorcao cấp executiveđiều hành with AmazonAmazon StudiosStudios.
7
23984
4832
Như mọi người biết, Roy Price là một
nhà điều hành cấp cao của Amazon Studios
00:40
That's the TVTRUYỀN HÌNH productionsản xuất
companyCông ty of AmazonAmazon.
8
28840
3016
Đây là công ty sản xuất chương trình TV
của Amazon
00:43
He's 47 yearsnăm old, slimmảnh khảnh, spikycó bông hairtóc,
9
31880
3256
Anh ấy 47 tuổi, nhỏ người,
tóc vuốt cao
00:47
describesmô tả himselfbản thân anh ấy on TwitterTwitter
as "moviesphim, TVTRUYỀN HÌNH, technologyCông nghệ, tacosTacos."
10
35160
4816
với mô tả trên Twitter: "phim ảnh, TV,
công nghệ, taco (món ăn Mexico)"
00:52
And RoyRoy PriceGiá has a very responsiblechịu trách nhiệm jobviệc làm,
because it's his responsibilitytrách nhiệm
11
40000
5176
Và Roy Price làm công việc mang tính
trách nhiệm cao, vì trách nhiệm của anh ấy
00:57
to pickchọn the showstrình diễn, the originalnguyên contentNội dung
that AmazonAmazon is going to make.
12
45200
4056
là chọn ra các show, nội dung gốc
mà Amazon sẽ thực hiện
01:01
And of coursekhóa học that's
a highlycao competitivecạnh tranh spacekhông gian.
13
49280
2336
Tất nhiên, đây là lĩnh vực rất cạnh tranh
01:03
I mean, there are so manynhiều
TVTRUYỀN HÌNH showstrình diễn alreadyđã out there,
14
51640
2736
Tôi muốn nói là, đã có quá nhiều
chương trình truyền hình
01:06
that RoyRoy can't just choosechọn any showchỉ.
15
54400
2176
Roy không thể chỉ chọn một show nào đó
01:08
He has to find showstrình diễn
that are really, really great.
16
56600
4096
Anh ấy phải tìm được những show thực sự
thật sự tuyệt vời
01:12
So in other wordstừ ngữ, he has to find showstrình diễn
17
60720
2816
Nói cách khác, anh ấy phải tìm ra
những chương trình
01:15
that are on the very right endkết thúc
of this curveđường cong here.
18
63560
2376
nắm ở phía cuối bên phải của
đường cong này.
01:17
So this curveđường cong here
is the ratingđánh giá distributionphân phối
19
65960
2656
Đường cong ở đây là phân bổ chỉ số
đánh giá
01:20
of about 2,500 TVTRUYỀN HÌNH showstrình diễn
on the websitetrang mạng IMDBIMDB,
20
68640
4376
của khoảng 2500 chương trình TV
trên trang web IMDB,
01:25
and the ratingđánh giá goesđi from one to 10,
21
73040
2896
và điểm đánh giá chạy từ 1 đến 10,
01:27
and the heightChiều cao here showstrình diễn you
how manynhiều showstrình diễn get that ratingđánh giá.
22
75960
2976
và đường cao này chỉ ra có bao nhiêu
chương trình được xếp hạng
01:30
So if your showchỉ getsđược a ratingđánh giá
of ninechín pointsđiểm or highercao hơn, that's a winnerngười chiến thắng.
23
78960
4696
Nếu chương trình của bạn có chỉ số người
xem là 9 hoặc cao nơi, đó là kẻ thắng cuộc
Bạn ở top 2% các chương trình
dẫn đầu.
01:35
Then you have a tophàng đầu two percentphần trăm showchỉ.
24
83680
1816
01:37
That's showstrình diễn like "BreakingPhá vỡ BadTồi,"
"GameTrò chơi of ThronesThrones," "The WireDây điện,"
25
85520
3896
Đó là những chương trình như "Breaking
Bad", "Game of Thrones", "The Wire"
01:41
so all of these showstrình diễn that are addictivegây nghiện,
26
89440
2296
tất cả những chương trình này đều
rất gây nghiện
01:43
whereafterwhereafter you've watchedđã xem a seasonMùa,
your brainóc is basicallyvề cơ bản like,
27
91760
3056
mỗi lần sau khi bạn coi xong một mùa,
não bạn cơ bản đều như là:
01:46
"Where can I get more of these episodestập phim?"
28
94840
2176
"Làm sao để xem thêm những tập mới?"
01:49
That kindloại of showchỉ.
29
97040
1200
Loại chương trình như thế đó.
01:50
On the left sidebên, just for claritytrong trẻo,
here on that endkết thúc,
30
98920
2496
Ở phía bên trái, để rõ ràng,
ở vị trí cuối này,
01:53
you have a showchỉ calledgọi là
"ToddlersTrẻ em and TiarasVương miện" --
31
101440
3176
bạn có một chương trình tên
"Toddlers and Tiaras"...
01:56
(LaughterTiếng cười)
32
104640
2656
(Cười)
01:59
-- which should tell you enoughđủ
33
107320
1536
...nó đủ nói cho bạn biết
02:00
about what's going on
on that endkết thúc of the curveđường cong.
34
108880
2191
những gì xảy ra ở điểm cuối của
đường cong này.
02:03
Now, RoyRoy PriceGiá is not worriedlo lắng about
gettingnhận được on the left endkết thúc of the curveđường cong,
35
111095
4161
Bây giờ, Roy Price không lo lắng mấy về
việc nằm ở vị trí cuối bên trái đường cong
02:07
because I think you would have to have
some seriousnghiêm trọng brainpowertrí tuệ
36
115280
2936
bởi vì tôi nghĩ bạn sẽ phải có
năng lực não rất mạnh
02:10
to undercutthịt phi lê "ToddlersTrẻ em and TiarasVương miện."
37
118240
1696
để cắt xén "Toddlers and Tiaras."
02:11
So what he's worriedlo lắng about
is this middleở giữa bulgephình here,
38
119960
3936
Vì thế điều anh ấy lo ngại chính là
chỗ phình ra ở giữa đây
02:15
the bulgephình of averageTrung bình cộng TVTRUYỀN HÌNH,
39
123920
1816
vị trí của các chương trình trung bình
bạn biết đấy, các chương trình không
hay cũng không dở
02:17
you know, those showstrình diễn
that aren'tkhông phải really good or really badxấu,
40
125760
2856
chúng không thật sự làm bạn phấn khích
02:20
they don't really get you excitedbị kích thích.
41
128639
1656
02:22
So he needsnhu cầu to make sure
that he's really on the right endkết thúc of this.
42
130320
4856
Vì vậy anh ấy cần đảm bảo rằng anh ấy
thật sự nằm ở điểm cuối bên phải này
02:27
So the pressuresức ép is on,
43
135200
1576
Vì thấy áp lực tăng lên,
02:28
and of coursekhóa học it's alsocũng thế the first time
44
136800
2176
và tất nhiên nó cũng là lần đầu tiên
02:31
that AmazonAmazon is even
doing something like this,
45
139000
2176
mà Amazon làm những thứ như thế này,
02:33
so RoyRoy PriceGiá does not want
to take any chancescơ hội.
46
141200
3336
cho nên Roy Price không muốn có
bất kì cơ hội nào
Anh ấy muốn sắp đặt sự thành công.
02:36
He wants to engineerkỹ sư successsự thành công.
47
144560
2456
Anh ấy cần một sự thành công chắc chắn
02:39
He needsnhu cầu a guaranteedđảm bảo successsự thành công,
48
147040
1776
02:40
and so what he does is,
he holdsgiữ a competitioncuộc thi.
49
148840
2576
và vì thế điều anh ấy làm là,
tổ chức một cuộc thi.
02:43
So he takes a bunch of ideasý tưởng for TVTRUYỀN HÌNH showstrình diễn,
50
151440
3136
Anh ấy tìm một loạt các ý tưởng cho
các chương trình TV,
02:46
and from those ideasý tưởng,
throughxuyên qua an evaluationđánh giá,
51
154600
2296
và từ những ý tưởng đó, trải qua đánh giá,
02:48
they selectlựa chọn eighttám candidatesứng cử viên for TVTRUYỀN HÌNH showstrình diễn,
52
156920
4096
Họ chọn ra 8 ứng cử viên cho các
chương trình TV
02:53
and then he just makeslàm cho the first episodeEpisode
of eachmỗi one of these showstrình diễn
53
161040
3216
và rồi họ chỉ làm tập đầu tiên cho
mỗi một chương trình đó
02:56
and putsđặt them onlineTrực tuyến for freemiễn phí
for everyonetất cả mọi người to watch.
54
164280
3136
và đăng chúng miễn phí lên mạng
để mọi người cùng xem.
02:59
And so when AmazonAmazon
is givingtặng out freemiễn phí stuffđồ đạc,
55
167440
2256
Và khi Amazon đưa ra thứ gì miễn phí,
03:01
you're going to take it, right?
56
169720
1536
bạn sẽ xem chúng đúng chứ?
03:03
So millionshàng triệu of viewersngười xem
are watchingxem those episodestập phim.
57
171280
5136
Thế nên hàng triệu người đã xem những
tập chương trình này.
03:08
What they don't realizenhận ra is that,
while they're watchingxem theirhọ showstrình diễn,
58
176440
3216
Điều họ không nhận ra là, trong khi
họ xem những chương trình đó,
03:11
actuallythực ra, they are beingđang watchedđã xem.
59
179680
2296
thật ra, họ cũng đang bị theo dõi.
03:14
They are beingđang watchedđã xem
by RoyRoy PriceGiá and his teamđội,
60
182000
2336
Họ bị theo dõi bởi Roy Price và
tổ là việc của anh
03:16
who recordghi lại everything.
61
184360
1376
họ đã ghi lại tất cả.
03:17
They recordghi lại when somebodycó ai pressesMáy ép playchơi,
when somebodycó ai pressesMáy ép pausetạm ngừng,
62
185760
3376
Họ ghi lại khi nào ai đó nhấn nút "play"
khi nào nhất nút "pause"
03:21
what partscác bộ phận they skipbỏ qua,
what partscác bộ phận they watch again.
63
189160
2536
phần nào nọ sẽ cho qua, phần nào họ sẽ
xem lại.
03:23
So they collectsưu tầm millionshàng triệu of datadữ liệu pointsđiểm,
64
191720
2256
Và họ thu thập hàng triệu dữ liệu,
03:26
because they want
to have those datadữ liệu pointsđiểm
65
194000
2096
vì họ muốn có những dữ liệu này
03:28
to then decidequyết định
which showchỉ they should make.
66
196120
2696
để sau đó quyết định xem họ
nên làm chương trình gì.
03:30
And sure enoughđủ,
so they collectsưu tầm all the datadữ liệu,
67
198840
2176
Và chắc chắn, họ thu thập tất cả dữ liệu,
03:33
they do all the datadữ liệu crunchingcrunching,
and an answercâu trả lời emergesxuất hiện,
68
201040
2576
họ phân tích tất cả dữ liệu,
và câu trả lời xuất hiện
03:35
and the answercâu trả lời is,
69
203640
1216
câu trả lời là,
03:36
"AmazonAmazon should do a sitcomphim sitcom
about fourbốn RepublicanĐảng Cộng hòa US SenatorsThượng nghị sĩ."
70
204880
5536
"Amazon nên làm một bộ sitcom về
4 thượng nghị sĩ của đảng Cộng hòa Mỹ"
03:42
They did that showchỉ.
71
210440
1216
Họ đã làm chương trình đó
03:43
So does anyonebất kỳ ai know the nameTên of the showchỉ?
72
211680
2160
Vậy có ai biết tên của
chương trình đó không?
03:46
(AudienceKhán giả: "AlphaAlpha HouseNgôi nhà.")
73
214720
1296
(Khán giả: "Alpha House")
03:48
Yes, "AlphaAlpha HouseNgôi nhà,"
74
216040
1456
Vâng, "Alpha House",
03:49
but it seemsdường như like not too manynhiều of you here
remembernhớ lại that showchỉ, actuallythực ra,
75
217520
4096
nhưng có vẻ không nhiều người ở đây
thực sự nhớ đến chương trình này
03:53
because it didn't turnxoay out that great.
76
221640
1856
bởi nó không đặc biệt
03:55
It's actuallythực ra just an averageTrung bình cộng showchỉ,
77
223520
1856
Nó thực sự chỉ là một show bình thường,
03:57
actuallythực ra -- literallynghĩa đen, in factthực tế, because
the averageTrung bình cộng of this curveđường cong here is at 7.4,
78
225400
4576
thật sự... theo nghĩa đen, sự thật là, vì
mức trung bình của đường cong này là 7.4
04:02
and "AlphaAlpha HouseNgôi nhà" landsvùng đất at 7.5,
79
230000
2416
và "Alpha House" nằm ở mức 7.5,
04:04
so a slightlykhinh bỉ aboveở trên averageTrung bình cộng showchỉ,
80
232440
2016
trên mức trung bình một chút,
04:06
but certainlychắc chắn not what RoyRoy PriceGiá
and his teamđội were aimingvới mục tiêu for.
81
234480
2920
nhưng chắc chắn không phải là điều
Roy Price và nhóm của anh hướng đến.
04:10
MeanwhileTrong khi đó, howeverTuy nhiên,
at about the sametương tự time,
82
238320
2856
Tuy nhiên trong khi đó, tại cùng
một thời điểm,
04:13
at anotherkhác companyCông ty,
83
241200
1576
ở một công ty khác,
04:14
anotherkhác executiveđiều hành did managequản lý
to landđất đai a tophàng đầu showchỉ usingsử dụng datadữ liệu analysisphân tích,
84
242800
4216
một nhà điều hành khác cũng muốn làm một chương
trình hàng đầu bằng phân tích dữ liệu
04:19
and his nameTên is TedTed,
85
247040
1576
và tên anh ấy là Ted,
04:20
TedTed SarandosSarandos, who is
the ChiefGiám đốc ContentNội dung OfficerSĩ quan of NetflixNetflix,
86
248640
3416
Ted Sarandos, giám đốc nội dung
của Netflix
và cũng như Roy, anh có 1 nhiệm vụ
thường xuyên
04:24
and just like RoyRoy,
he's on a constantkhông thay đổi missionsứ mệnh
87
252080
2136
04:26
to find that great TVTRUYỀN HÌNH showchỉ,
88
254240
1496
là tìm những chương trình hay,
04:27
and he usessử dụng datadữ liệu as well to do that,
89
255760
2016
và anh ấy cũng sử dụng dữ liệu để làm việc
04:29
exceptngoại trừ he does it
a little bitbit differentlykhác.
90
257800
2015
ngoại trừ anh ấy làm nó
có chút khác biệt.
04:31
So insteadthay thế of holdinggiữ a competitioncuộc thi,
what he did -- and his teamđội of coursekhóa học --
91
259839
3737
Thay vì tổ chức một cuộc thi, điều anh ấy
làm... và dĩ nhiên cả nhóm của anh...
04:35
was they lookednhìn at all the datadữ liệu
they alreadyđã had about NetflixNetflix viewersngười xem,
92
263600
3536
là nhìn vào tất cả dữ liệu và họ đã có
về khán giả của Netflix,
những đánh giá họ
đưa ra cho các chương trình
04:39
you know, the ratingsxếp hạng
they give theirhọ showstrình diễn,
93
267160
2096
04:41
the viewingxem historieslịch sử,
what showstrình diễn people like, and so on.
94
269280
2696
lịch sử xem, những chương trình nào
họ thích, v.v
04:44
And then they use that datadữ liệu to discoverkhám phá
95
272000
1896
Và họ dùng các dữ liệu đó để tìm ra
04:45
all of these little bitsbit and piecesmiếng
about the audiencethính giả:
96
273920
2616
tất cả những gì nhỏ nhất về các khán giả:
04:48
what kindscác loại of showstrình diễn they like,
97
276560
1456
loại chương trình gì họ thích,
04:50
what kindloại of producersnhà sản xuất,
what kindloại of actorsdiễn viên.
98
278040
2096
người sản xuất nào, loại diễn viên nào.
04:52
And onceMột lần they had
all of these piecesmiếng togethercùng với nhau,
99
280160
2576
Và một khi họ đã có được tất cả các
mảnh ghép
họ làm một bước nhảy vọt của lòng tin
04:54
they tooklấy a leapnhảy vọt of faithđức tin,
100
282760
1656
04:56
and they decidedquyết định to licensegiấy phép
101
284440
2096
họ quyết định cấp giấy phép
04:58
not a sitcomphim sitcom about fourbốn SenatorsThượng nghị sĩ
102
286560
2456
không phải cho một bộ sitcom về bốn
thượng nghị sĩ
05:01
but a dramakịch seriesloạt about a singleĐộc thân SenatorThượng nghị sĩ.
103
289040
2880
mà là một bộ phim truyền hình chỉ về
một thượng nghị sĩ.
05:04
You guys know the showchỉ?
104
292760
1656
Các bạn biết chương trình này chứ?
05:06
(LaughterTiếng cười)
105
294440
1296
(Cười)
05:07
Yes, "HouseNgôi nhà of CardsThẻ," and NetflixNetflix
of coursekhóa học, nailedđóng đinh it with that showchỉ,
106
295760
3736
Vâng, là "House of Cards", và Netflix
dĩ nhiên đóng đinh với chương trình đó
05:11
at leastít nhất for the first two seasonsmùa giải.
107
299520
2136
ít nhất là với 2 mùa đầu tiên.
05:13
(LaughterTiếng cười) (ApplauseVỗ tay)
108
301680
3976
(Cười) (Vỗ tay)
05:17
"HouseNgôi nhà of CardsThẻ" getsđược
a 9.1 ratingđánh giá on this curveđường cong,
109
305680
3176
"House of Cards" được đánh giá 9.1
trên đường cong,
05:20
so it's exactlychính xác
where they wanted it to be.
110
308880
3176
nó chính xác là những gì họ muốn
làm được.
05:24
Now, the questioncâu hỏi of coursekhóa học is,
what happenedđã xảy ra here?
111
312080
2416
Và giờ, câu hỏi đặt ra là
chuyện gì xảy ra ở đây?
05:26
So you have two very competitivecạnh tranh,
data-savvyam hiểu dữ liệu companiescác công ty.
112
314520
2656
Bạn có hai công ty rất cạnh tranh,
hiểu biết về dữ liệu
05:29
They connectkết nối all of these
millionshàng triệu of datadữ liệu pointsđiểm,
113
317200
2856
Họ kết nối hàng triệu
điểm dữ liệu
05:32
and then it workscông trinh
beautifullyđẹp for one of them,
114
320080
2376
và nó hoạt động tốt với 1 bên,
05:34
and it doesn't work for the other one.
115
322480
1856
còn với một bên thì nó không hoạt động
05:36
So why?
116
324360
1216
Tại sao?
05:37
Because logiclogic kindloại of tellsnói you
that this should be workingđang làm việc all the time.
117
325600
3456
Vì kiểu lí luận này luôn nói với bạn
rằng điều này luôn hiệu quả mọi lúc
05:41
I mean, if you're collectingthu gom
millionshàng triệu of datadữ liệu pointsđiểm
118
329080
2456
Nghĩa là, nếu bạn thu thập hết hàng triệu
điểm dữ liệu
05:43
on a decisionphán quyết you're going to make,
119
331560
1736
lên một quyết định bạn sẽ thực hiện,
05:45
then you should be ablecó thể
to make a prettyđẹp good decisionphán quyết.
120
333320
2616
bạn sẽ có thể đưa ra một quyết định
tuyệt vời.
05:47
You have 200 yearsnăm
of statisticssố liệu thống kê to relydựa on.
121
335960
2216
Bạn có thể dựa vào 200
năm dữ liệu thống kê
05:50
You're amplifyingkhuyếch đại it
with very powerfulquyền lực computersmáy vi tính.
122
338200
3016
Bạn mở rộng chúng với những máy tính
cực mạnh.
05:53
The leastít nhất you could expectchờ đợi
is good TVTRUYỀN HÌNH, right?
123
341240
3280
Ít nhất bạn cũng trông đợi vào một
chương trình TV tốt, đúng chứ?
05:57
And if datadữ liệu analysisphân tích
does not work that way,
124
345880
2720
Và nếu phân tích dữ liệu không
hoạt động theo cách này,
06:01
then it actuallythực ra getsđược a little scaryđáng sợ,
125
349520
2056
thì nó thật sự khá đáng sợ,
06:03
because we livetrực tiếp in a time
where we're turningquay to datadữ liệu more and more
126
351600
3816
Vì chúng ta sống trong thời điểm mà ta
chuyển sang dùng dữ liệu ngày càng nhiều
06:07
to make very seriousnghiêm trọng decisionsquyết định
that go farxa beyondvượt ra ngoài TVTRUYỀN HÌNH.
127
355440
4480
để đưa ra những quyết định rất quan trọng,
vượt xa hơn cả TV.
06:12
Does anyonebất kỳ ai here know the companyCông ty
Multi-HealthNhiều sức khỏe SystemsHệ thống?
128
360760
3240
Có ai ở đây biết về công ty Multi-Health
Systems?
06:17
No one. OK, that's good actuallythực ra.
129
365080
1656
Không ai cả. OK, rất tốt.
06:18
OK, so Multi-HealthNhiều sức khỏe SystemsHệ thống
is a softwarephần mềm companyCông ty,
130
366760
3216
Vâng, Multi-Health Systems là một công ty
phần mềm,
06:22
and I hopemong that nobodykhông ai here in this roomphòng
131
370000
2816
và tôi mong rằng không ai trong
khán phòng này
06:24
ever comesđến into contacttiếp xúc
with that softwarephần mềm,
132
372840
3176
từng tiếp xúc với phần mềm đó,
06:28
because if you do,
it meanscó nghĩa you're in prisonnhà tù.
133
376040
2096
vì nếu bạn làm vậy, nghĩa là bạn
đang ở tù
06:30
(LaughterTiếng cười)
134
378160
1176
(Cười)
06:31
If someonengười nào here in the US is in prisonnhà tù,
and they applyứng dụng for paroletạm tha,
135
379360
3536
Nếu một ai đó ở Mỹ đang ở trong tù,
và họ xin tạm tha,
06:34
then it's very likelycó khả năng that
datadữ liệu analysisphân tích softwarephần mềm from that companyCông ty
136
382920
4296
thì sẽ rất có khả năng phần mềm phân tích
dữ liệu của công ty này
06:39
will be used in determiningxác định
whetherliệu to grantban cho that paroletạm tha.
137
387240
3616
sẽ được sử dụng để quyết định xem
có nên cho phép tạm tha hay không
06:42
So it's the sametương tự principlenguyên tắc
as AmazonAmazon and NetflixNetflix,
138
390880
2576
Nó cũng là một nguyên lí giống
như Amazon và Netflix
06:45
but now insteadthay thế of decidingquyết định whetherliệu
a TVTRUYỀN HÌNH showchỉ is going to be good or badxấu,
139
393480
4616
nhưng bây giờ thay vì quyết định xem
chương trình TV này sẽ tốt hay dở
06:50
you're decidingquyết định whetherliệu a personngười
is going to be good or badxấu.
140
398120
2896
bạn sẽ xem xét xem người kia là tốt
hay là xấu
06:53
And mediocretầm thường TVTRUYỀN HÌNH, 22 minutesphút,
that can be prettyđẹp badxấu,
141
401040
5496
và chương trình TV tầm thường, 22 phút,
nó có thể khá tệ
06:58
but more yearsnăm in prisonnhà tù,
I guessphỏng đoán, even worsetệ hơn.
142
406560
2640
nhưng nhiều năm trong tù
tôi đoán là tệ hơn nhiều.
07:02
And unfortunatelykhông may, there is actuallythực ra
some evidencechứng cớ that this datadữ liệu analysisphân tích,
143
410360
4136
Và không may là, thật sự có vài bằng chứng
cho thấy phân tích dữ liệu này,
07:06
despitemặc dù havingđang có lots of datadữ liệu,
does not always producesản xuất optimumtối ưu resultscác kết quả.
144
414520
4216
mặc dù có rất nhiều dữ lệu, nhưng không
phải luôn luôn cho ra những kết quả tối ưu
07:10
And that's not because a companyCông ty
like Multi-HealthNhiều sức khỏe SystemsHệ thống
145
418760
2722
Và nó cũng không phải công ty như
Multi-Health Systems
07:13
doesn't know what to do with datadữ liệu.
146
421506
1627
không biết phải làm gì với dữ liệu.
07:15
Even the mostphần lớn data-savvyam hiểu dữ liệu
companiescác công ty get it wrongsai rồi.
147
423158
2298
Thậm chí hầu hết các công ty dữ liệu
đều làm sai
07:17
Yes, even GoogleGoogle getsđược it wrongsai rồi sometimesđôi khi.
148
425480
2400
Vâng, thậm chí Google đôi lúc cũng sai
07:20
In 2009, GoogleGoogle announcedđã thông báo
that they were ablecó thể, with datadữ liệu analysisphân tích,
149
428680
4496
Trong năm 2009, Google thông báo rằng,
với phân tích dữ liệu, họ có thể
07:25
to predicttiên đoán outbreaksbộc phát of influenzacúm,
the nastykhó chịu kindloại of flucúm,
150
433200
4136
dự đoán sự bùng phát của dịch cúm
một loại cúm nguy hiểm,
07:29
by doing datadữ liệu analysisphân tích
on theirhọ GoogleGoogle searchesTìm kiếm.
151
437360
3776
bằng cách thực hiện phân tích dữ liệu
trên "Google tìm kiếm" của họ.
07:33
And it workedđã làm việc beautifullyđẹp,
and it madethực hiện a biglớn splashgiật gân in the newsTin tức,
152
441160
3856
Và nó hoạt động hiệu quả, trở thành
tin giật gân trên mặt báo,
07:37
includingkể cả the pinnacleđỉnh cao
of scientificthuộc về khoa học successsự thành công:
153
445040
2136
bao gồm cả đỉnh cao thành công
của khoa học:
07:39
a publicationxuất bản in the journaltạp chí "NatureThiên nhiên."
154
447200
2456
một ấn phẩm trên tạp chí "Nature"
07:41
It workedđã làm việc beautifullyđẹp
for yearnăm after yearnăm after yearnăm,
155
449680
3616
Nó làm việc hiệu quả từ năm này
qua năm khác,
07:45
untilcho đến one yearnăm it failedthất bại.
156
453320
1656
cho đến một năm, nó thất bại.
07:47
And nobodykhông ai could even tell exactlychính xác why.
157
455000
2256
Và thậm chí chẳng ai giải thích nổi
tại sao.
07:49
It just didn't work that yearnăm,
158
457280
1696
Nó chỉ không hoạt động vào năm đó
và tất nhiên nó lại
trở thành tin giật gân
07:51
and of coursekhóa học that again madethực hiện biglớn newsTin tức,
159
459000
1936
07:52
includingkể cả now a retractionco rút
160
460960
1616
bây giờ bao gồm sự rút lại
07:54
of a publicationxuất bản
from the journaltạp chí "NatureThiên nhiên."
161
462600
2840
của một ấn phẩm từ tạp chí "Nature"
07:58
So even the mostphần lớn data-savvyam hiểu dữ liệu companiescác công ty,
AmazonAmazon and GoogleGoogle,
162
466480
3336
Cho nên đến cả những công ty giỏi nhất về
dữ liệu như Amazon và Google,
08:01
they sometimesđôi khi get it wrongsai rồi.
163
469840
2136
đôi lúc cũng mắc sai lầm.
08:04
And despitemặc dù all those failuresthất bại,
164
472000
2936
Và mặc cho những thất bại đó,
08:06
datadữ liệu is movingdi chuyển rapidlynhanh chóng
into real-lifecuộc sống thực decision-makingquyết định --
165
474960
3856
dữ liệu vẫn nhanh chóng tiếp cận vào việc
đưa ra quyết định trong đời thực,
08:10
into the workplacenơi làm việc,
166
478840
1816
nơi làm việc,
08:12
lawpháp luật enforcementthực thi,
167
480680
1816
thực thi pháp luật,
08:14
medicinedược phẩm.
168
482520
1200
y tế.
08:16
So we should better make sure
that datadữ liệu is helpinggiúp.
169
484400
3336
Chúng ta nên làm rõ là những dữ liệu này
rất hữu ích
Hiện nay, cá nhân tôi thường thấy bản thân
vật lộn rất nhiều với dữ liệu
08:19
Now, personallycá nhân I've seenđã xem
a lot of this struggleđấu tranh with datadữ liệu myselfriêng tôi,
170
487760
3136
08:22
because I work in computationaltính toán geneticsdi truyền học,
171
490920
1976
vì tôi làm việc ở ngành tính toán di truyền học
08:24
which is alsocũng thế a fieldcánh đồng
where lots of very smartthông minh people
172
492920
2496
đây cũng là ngành có rất nhiều người
cực kì thông minh
08:27
are usingsử dụng unimaginablekhông thể tưởng tượng được amountslượng of datadữ liệu
to make prettyđẹp seriousnghiêm trọng decisionsquyết định
173
495440
3656
sử dùng 1 lượng dữ liệu nhiều không
tưởng để đưa ra các quyết định quan trọng
08:31
like decidingquyết định on a cancerung thư therapytrị liệu
or developingphát triển a drugthuốc uống.
174
499120
3560
như quyết định về phương pháp chữa ung thư
hoặc phát triển thuốc.
08:35
And over the yearsnăm,
I've noticednhận thấy a sortsắp xếp of patternmẫu
175
503520
2376
Qua nhiều năm, tôi đã nhận thấy một
loại dấu hiệu
08:37
or kindloại of rulequi định, if you will,
about the differenceSự khác biệt
176
505920
2456
hay một kiểu quy luật, nếu bạn muốn,
về sự khác biệt
08:40
betweengiữa successfulthành công
decision-makingquyết định with datadữ liệu
177
508400
2696
giữa đưa ra quyết định thành công
với dữ liệu
08:43
and unsuccessfulkhông thành công decision-makingquyết định,
178
511120
1616
và đưa ra quyết định thất bại,
08:44
and I find this a patternmẫu worthgiá trị sharingchia sẻ,
and it goesđi something like this.
179
512760
3880
và tôi thấy đây là một mô hình đáng để
chia sẻ, và nó là một thứ gì đó như thế
Bất cứ khi nào bạn giải quyết
một vấn đề phức tạp,
08:50
So wheneverbất cứ khi nào you're
solvinggiải quyết a complexphức tạp problemvấn đề,
180
518520
2135
08:52
you're doing essentiallybản chất two things.
181
520679
1737
bạn đang thực hiện về cơ bản 2 điều.
08:54
The first one is, you take that problemvấn đề
apartxa nhau into its bitsbit and piecesmiếng
182
522440
3296
Thứ nhất là, bạn chia nhỏ vấn đề đó ra
thành những phần nhỏ lẻ
08:57
so that you can deeplysâu sắc analyzephân tích
those bitsbit and piecesmiếng,
183
525760
2496
để bạn có thể phấn tích kĩ lưỡng những
phần nhỏ đó,
09:00
and then of coursekhóa học
you do the secondthứ hai partphần.
184
528280
2016
và sau đó tất nhiện bạn sẽ làm
tiếp phần 2
09:02
You put all of these bitsbit and piecesmiếng
back togethercùng với nhau again
185
530320
2656
Bạn xếp những phần nhỏ đó lại với nhau
09:05
to come to your conclusionphần kết luận.
186
533000
1336
để đi đến kết luận cuối cùng
09:06
And sometimesđôi khi you
have to do it over again,
187
534360
2336
Và đôi khi bạn phải lặp lại nó lần nữa
09:08
but it's always those two things:
188
536720
1656
nhưng nó vẫn chỉ là 2 điều đó:
09:10
takinglấy apartxa nhau and puttingđặt
back togethercùng với nhau again.
189
538400
2320
chia nhỏ ra và sắp đặt lại lần nữa
09:14
And now the crucialquan trọng thing is
190
542280
1616
Và điều quan trọng bây giờ là
09:15
that datadữ liệu and datadữ liệu analysisphân tích
191
543920
2896
dữ liệu đó và phân tích dữ liệu
09:18
is only good for the first partphần.
192
546840
2496
chỉ tốt ở bước đầu tiên.
09:21
DataDữ liệu and datadữ liệu analysisphân tích,
no mattervấn đề how powerfulquyền lực,
193
549360
2216
dữ liệu và phân tích dữ liệu,
dù mạnh mẽ cỡ nào
09:23
can only help you takinglấy a problemvấn đề apartxa nhau
and understandinghiểu biết its piecesmiếng.
194
551600
4456
cũng chỉ có thể giúp bạn chia nhỏ vấn đề
và hiểu rõ từng phần của nó
09:28
It's not suitedphù hợp to put those piecesmiếng
back togethercùng với nhau again
195
556080
3496
Nó không phù hợp để đặt các phần nhỏ
lại 1 lần nữa
09:31
and then to come to a conclusionphần kết luận.
196
559600
1896
và cuối cùng đi đến kết luận.
Có 1 công cụ khác có thể làm việc đó,
và chúng ta đều có nó,
09:33
There's anotherkhác tooldụng cụ that can do that,
and we all have it,
197
561520
2736
09:36
and that tooldụng cụ is the brainóc.
198
564280
1296
nó chính là bộ não.
09:37
If there's one thing a brainóc is good at,
199
565600
1936
Nếu có 1 thứ mà bộ não rất giỏi,
thì đó chính là sắp xếp các phần nhỏ
lại với nhau,
09:39
it's takinglấy bitsbit and piecesmiếng
back togethercùng với nhau again,
200
567560
2256
09:41
even when you have incompletechưa hoàn thiện informationthông tin,
201
569840
2016
thậm chí cả khi bạn không có đủ thông tin,
09:43
and comingđang đến to a good conclusionphần kết luận,
202
571880
1576
và đi đến một kết luận tuyệt vời,
09:45
especiallyđặc biệt if it's the brainóc of an expertchuyên gia.
203
573480
2936
đặc biệt khi nó là bộ não của 1 chuyên gia
Đó là lí do vì sao tôi tin là Netflix
đã rất thành công,
09:48
And that's why I believe
that NetflixNetflix was so successfulthành công,
204
576440
2656
09:51
because they used datadữ liệu and brainsnão
where they belongthuộc về in the processquá trình.
205
579120
3576
Vì họ đã sử dụng dữ liệu và bộ não vào
đúng chỗ nó cần trong cả quá trình.
09:54
They use datadữ liệu to first understandhiểu không
lots of piecesmiếng about theirhọ audiencethính giả
206
582720
3536
Họ sử dụng dữ liệu trước tiên để hiểu rõ
nhiều phần nhỏ về khán giả của họ
09:58
that they otherwisenếu không thì wouldn'tsẽ không have
been ablecó thể to understandhiểu không at that depthchiều sâu,
207
586280
3416
nếu không họ sẽ không thể hiểu
tường tận đến thế,
10:01
but then the decisionphán quyết
to take all these bitsbit and piecesmiếng
208
589720
2616
nhưng quyết định để lấy hết
các phần nhỏ đó
10:04
and put them back togethercùng với nhau again
and make a showchỉ like "HouseNgôi nhà of CardsThẻ,"
209
592360
3336
và sắp xếp chúng lại rồi
thực hiện chương trình "House of Cards"
10:07
that was nowherehư không in the datadữ liệu.
210
595720
1416
nó không hề nằm trong dữ liệu
10:09
TedTed SarandosSarandos and his teamđội
madethực hiện that decisionphán quyết to licensegiấy phép that showchỉ,
211
597160
3976
Ted Sarandos và nhóm của anh ấy đã đưa ra
quyết định cấp phép cho chương trình đó,
10:13
which alsocũng thế meantý nghĩa, by the way,
that they were takinglấy
212
601160
2381
cũng có nghĩa là, bằng cách này, họ đã
đánh cược
10:15
a prettyđẹp biglớn personalcá nhân riskrủi ro
with that decisionphán quyết.
213
603565
2851
một rủi ro cá nhân khá lớn cho quyết định
này.
10:18
And AmazonAmazon, on the other handtay,
they did it the wrongsai rồi way around.
214
606440
3016
Và Amazon, mặt khác, họ đã đi sai đường.
10:21
They used datadữ liệu all the way
to drivelái xe theirhọ decision-makingquyết định,
215
609480
2736
Họ sử dụng dữ liệu trên cả con đường
đi đến quyết định,
10:24
first when they heldđược tổ chức
theirhọ competitioncuộc thi of TVTRUYỀN HÌNH ideasý tưởng,
216
612240
2416
đầu tiên khi họ tổ chức cuộc thi về
các ý tưởng TV
10:26
then when they selectedđã chọn "AlphaAlpha HouseNgôi nhà"
to make as a showchỉ.
217
614680
3696
tiếp đến là khi họ chọn "Alpha House"
để làm chương trình.
10:30
Which of coursekhóa học was
a very safean toàn decisionphán quyết for them,
218
618400
2496
Tất nhiên đó là một quyết định
an toàn cho họ,
Vì họ luôn có thể chỉ vào dữ liệu và nói
10:32
because they could always
pointđiểm at the datadữ liệu, sayingnói,
219
620920
2456
"Đây là những gì dữ liệu
nói cho chúng tôi"
10:35
"This is what the datadữ liệu tellsnói us."
220
623400
1696
10:37
But it didn't leadchì to the exceptionalđặc biệt
resultscác kết quả that they were hopinghi vọng for.
221
625120
4240
Nhưng nó không đưa đến một kết quả
chấp nhận được mà họ mong chờ
Cho nên dữ liệu dĩ nhiên là 1 công cụ cực
kì hữu hiệu để đưa ra quyết định tốt hơn,
10:42
So datadữ liệu is of coursekhóa học a massivelyồ ạt
usefulhữu ích tooldụng cụ to make better decisionsquyết định,
222
630120
4976
10:47
but I believe that things go wrongsai rồi
223
635120
2376
nhưng tôi tin là mọi thứ sẽ đi sai
10:49
when datadữ liệu is startingbắt đầu
to drivelái xe those decisionsquyết định.
224
637520
2576
khi dữ liệu bắt đầu điều khiến những
quyết định đó.
10:52
No mattervấn đề how powerfulquyền lực,
datadữ liệu is just a tooldụng cụ,
225
640120
3776
Mặc dù rất mạnh nhưng dữ liệu chỉ là
một công cụ,
10:55
and to keep that in mindlí trí,
I find this devicethiết bị here quitekhá usefulhữu ích.
226
643920
3336
và để ghi nhớ điều đó, tôi cho rằng
thiết bị này khá hữu dụng.
10:59
ManyNhiều of you will ...
227
647280
1216
Nhiều người trong các bạn cũng sẽ vậy...
11:00
(LaughterTiếng cười)
228
648520
1216
(Cười)
11:01
Before there was datadữ liệu,
229
649760
1216
Trước khi sử dụng dữ liệu
11:03
this was the decision-makingquyết định
devicethiết bị to use.
230
651000
2856
hãy sử dụng thiết bị đưa ra quyết định này
11:05
(LaughterTiếng cười)
231
653880
1256
(Cười)
Nhiều người trong các bạn sẽ biết nó
11:07
ManyNhiều of you will know this.
232
655160
1336
11:08
This toyđồ chơi here is calledgọi là the MagicMa thuật 8 BallQuả bóng,
233
656520
1953
Món đồ chơi này gọi là "The Magic 8 Ball"
11:10
and it's really amazingkinh ngạc,
234
658497
1199
và nó thật sự tuyệt vời,
11:11
because if you have a decisionphán quyết to make,
a yes or no questioncâu hỏi,
235
659720
2896
Vì khi bạn cần đưa ra quyết định,
một câu hỏi có hay không,
11:14
all you have to do is you shakelắc the balltrái bóng,
and then you get an answercâu trả lời --
236
662640
3736
những gì bạn phải làm là lắc quả banh,
sau đó bạn sẽ có câu trả lời
"Có khả năng cao"ngay tại đây, trong
của sổ này, ngay lúc này.
11:18
"MostHầu hết LikelyCó khả năng" -- right here
in this windowcửa sổ in realthực time.
237
666400
2816
11:21
I'll have it out latermột lát sau for techcông nghệ demostrình diễn.
238
669240
2096
Tôi sẽ đưa nó ra cho bản thử công nghệ sau
11:23
(LaughterTiếng cười)
239
671360
1216
(Cười)
11:24
Now, the thing is, of coursekhóa học --
so I've madethực hiện some decisionsquyết định in my life
240
672600
3576
Bây giờ, vấn đề là, dĩ nhiên..
tôi từng đưa ra những quyết định trong đời
11:28
where, in hindsighthindsight,
I should have just listenedlắng nghe to the balltrái bóng.
241
676200
2896
mà trong nhận thức đáng lẽ tôi nên
nghe theo quả banh này.
11:31
But, you know, of coursekhóa học,
if you have the datadữ liệu availablecó sẵn,
242
679120
3336
Nhưng, bạn biết đấy, dĩ nhiên nếu bạn
có dữ liệu sẵn đây,
11:34
you want to replacethay thế this with something
much more sophisticatedtinh vi,
243
682480
3056
bạn sẽ muốn thay thế nó cho thứ gì đó
tinh vi hơn,
11:37
like datadữ liệu analysisphân tích
to come to a better decisionphán quyết.
244
685560
3616
như phân tích dữ liệu, để đi đến
quyết định tốt hơn.
11:41
But that does not changethay đổi the basiccăn bản setupthiết lập.
245
689200
2616
nhưng nó không là thay đổi những
thiết lập cơ bản.
11:43
So the balltrái bóng mayTháng Năm get smarterthông minh hơn
and smarterthông minh hơn and smarterthông minh hơn,
246
691840
3176
Và quả banh có lẽ ngày càng thông minh,
thông minh hơn nữa,
11:47
but I believe it's still on us
to make the decisionsquyết định
247
695040
2816
nhưng tôi tin nó vẫn tùy vào chúng
ta để đưa ra quyết định
11:49
if we want to achieveHoàn thành
something extraordinarybất thường,
248
697880
3016
nếu chúng ta muốn đạt được điều gì đó
phi thường,
11:52
on the right endkết thúc of the curveđường cong.
249
700920
1936
ở phía cuối bên phải của đường cong.
11:54
And I find that a very encouragingkhuyến khích
messagethông điệp, in factthực tế,
250
702880
4496
Và tôi thấy nó thật sự là mội thông điệp
đầy khích lệ,
11:59
that even in the faceđối mặt
of hugekhổng lồ amountslượng of datadữ liệu,
251
707400
3976
rằng thậm chí khi đối mặt với một lượng
dữ liệu khổng lồ,
12:03
it still paystrả tiền off to make decisionsquyết định,
252
711400
4096
nó vẫn đáng để đưa ra quyết định
12:07
to be an expertchuyên gia in what you're doing
253
715520
2656
trở thành 1 chuyên gia trong những gì
mình đang làm
12:10
and take risksrủi ro.
254
718200
2096
và chấp nhận rủi ro.
12:12
Because in the endkết thúc, it's not datadữ liệu,
255
720320
2776
Bởi vì cuối cùng, đó không chỉ là dữ liệu,
12:15
it's risksrủi ro that will landđất đai you
on the right endkết thúc of the curveđường cong.
256
723120
3960
Nó là rủi ro sẽ đưa bạn đến phía cuối
bên phải của đường cong.
12:19
Thank you.
257
727840
1216
Cảm ơn
12:21
(ApplauseVỗ tay)
258
729080
3680
(Vỗ tay)

▲Back to top

ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com