ABOUT THE SPEAKER
Kenneth Cukier - Data Editor of The Economist
Kenneth Cukier is the Data Editor of The Economist. From 2007 to 2012 he was the Tokyo correspondent, and before that, the paper’s technology correspondent in London, where his work focused on innovation, intellectual property and Internet governance. Kenneth is also the co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think with Viktor Mayer-Schönberger in 2013, which was a New York Times Bestseller and translated into 16 languages.

Why you should listen

As Data Editor of The Economist and co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think, Kenneth Cukier has spent years immersed in big data, machine learning -- and the impact of both. What's the future of big data-driven technology and design? To find out, watch this talk.

More profile about the speaker
Kenneth Cukier | Speaker | TED.com
TEDSalon Berlin 2014

Kenneth Cukier: Big data is better data

Kenneth Cukier: Velká data jsou lepší data

Filmed:
1,663,038 views

Samořídící se auta jsou jen začátek. Jaká je budoucnost technologie a designu, poháněných velkými daty? Ve fascinující vědecké přednášce se Kenneth Cukier věnuje tomu, co dalšího nás čeká v oblasti strojového učení a lidského vědění.
- Data Editor of The Economist
Kenneth Cukier is the Data Editor of The Economist. From 2007 to 2012 he was the Tokyo correspondent, and before that, the paper’s technology correspondent in London, where his work focused on innovation, intellectual property and Internet governance. Kenneth is also the co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think with Viktor Mayer-Schönberger in 2013, which was a New York Times Bestseller and translated into 16 languages. Full bio

Double-click the English transcript below to play the video.

00:12
America'sAmeriky favoriteoblíbený piekoláč is?
0
787
3845
Který koláč je v Americe nejoblíbenější?
00:16
AudiencePublikum: AppleJablko.
KennethKenneth CukierCukier: AppleJablko. Of coursechod it is.
1
4632
3506
Publikum: Jablečný
Kenneth Cukier: Jablečný, samozřejmě.
00:20
How do we know it?
2
8138
1231
Jak to víme?
00:21
Because of datadata.
3
9369
2753
Díky datům.
00:24
You look at supermarketsupermarket salesodbyt.
4
12122
2066
Podíváte se na prodej v obchodech.
00:26
You look at supermarketsupermarket
salesodbyt of 30-centimeter-centimetr pieskoláče
5
14188
2866
Když se podíváte na 30 cm velké
mražené koláče,
00:29
that are frozenzamrzlý, and applejablko winsvyhraje, no contestsoutěž.
6
17054
4075
jablečné jednoznačně vítězí. Bezpochyby.
00:33
The majorityvětšina of the salesodbyt are applejablko.
7
21129
5180
Nejvíc se prodá jablečných koláčů.
00:38
But then supermarketssupermarkety startedzačal sellingprodejní
8
26309
2964
Jenže pak supermarkety začaly prodávat
00:41
smallermenší, 11-centimeter-centimetr pieskoláče,
9
29273
2583
menší 11cm koláče
00:43
and suddenlyNajednou, applejablko fellklesl to fourthČtvrtý or fifthpátý placemísto.
10
31856
4174
a najednou se jablečné propadly
na čtvrté nebo páté místo.
00:48
Why? What happenedStalo?
11
36030
2875
Proč? Co se stalo?
00:50
Okay, think about it.
12
38905
2818
Zamysleme se.
00:53
When you buyKoupit a 30-centimeter-centimetr piekoláč,
13
41723
3848
Když kupujete třiceticentimetrový koláč,
00:57
the wholeCelý familyrodina has to agreesouhlasit,
14
45571
2261
celá rodina se musí shodnout
00:59
and applejablko is everyone'svšichni jsou seconddruhý favoriteoblíbený.
15
47832
3791
a jablko je u všech druhé nejoblíbenější.
01:03
(LaughterSmích)
16
51623
1935
(smích)
01:05
But when you buyKoupit an individualindividuální 11-centimeter-centimetr piekoláč,
17
53558
3615
Ale když si kupujete vlastní 11cm koláč,
01:09
you can buyKoupit the one that you want.
18
57173
3745
můžete si koupit ten, který chcete vy.
01:12
You can get your first choicevýběr.
19
60918
4015
Můžete mít váš nejoblíbenější.
01:16
You have more datadata.
20
64933
1641
Získáváte více dat.
01:18
You can see something
21
66574
1554
Zjistíte věci,
01:20
that you couldn'tnemohl see
22
68128
1132
které nejsou patrné
01:21
when you only had smallermenší amountsmnožství of it.
23
69260
3953
s menším množstvím dat.
01:25
Now, the pointbod here is that more datadata
24
73213
2475
Jde o to, že s více daty,
01:27
doesn't just let us see more,
25
75688
2283
nejenže vyzkoumáme víc z toho,
01:29
more of the samestejný thing we were looking at.
26
77971
1854
co už sledujeme,
01:31
More datadata allowsumožňuje us to see newNový.
27
79825
3613
více dat nám umožní spatřit věci nově.
01:35
It allowsumožňuje us to see better.
28
83438
3094
Umožňuje nám to vidět věci lépe.
01:38
It allowsumožňuje us to see differentodlišný.
29
86532
3656
Vidět věci jinak.
01:42
In this casepouzdro, it allowsumožňuje us to see
30
90188
3173
V tomto případě nám umožňují zjistit,
01:45
what America'sAmeriky favoriteoblíbený piekoláč is:
31
93361
2913
že nejoblíbenější koláč v Americe
01:48
not applejablko.
32
96274
2542
není jablečný.
01:50
Now, you probablypravděpodobně all have heardslyšel the termobdobí bigvelký datadata.
33
98816
3614
Už jste asi slyšeli pojem velká data.
01:54
In factskutečnost, you're probablypravděpodobně sicknemocný of hearingsluch the termobdobí
34
102430
2057
Spíš se vám už dělá špatně,
když slyšíte termín velká data.
01:56
bigvelký datadata.
35
104487
1630
01:58
It is trueskutečný that there is a lot of hypeHype around the termobdobí,
36
106117
3330
Mluvit o velkých datech je v kurzu,
02:01
and that is very unfortunatenešťastný,
37
109447
2332
což je velmi nešťastné,
02:03
because bigvelký datadata is an extremelyvelmi importantdůležité toolnástroj
38
111779
3046
protože velká data jsou
extrémně důležitým nástrojem,
02:06
by whichkterý societyspolečnost is going to advancezáloha.
39
114825
3734
díky kterému společnost postoupí dál.
02:10
In the pastminulost, we used to look at smallmalý datadata
40
118559
3561
V minulosti jsme zkoumali malá data
02:14
and think about what it would mean
41
122120
1704
a přemýšleli, co znamenají
02:15
to try to understandrozumět the worldsvět,
42
123824
1496
pro naše porozumění světu
02:17
and now we have a lot more of it,
43
125320
1991
Teď jich máme mnohem více,
02:19
more than we ever could before.
44
127311
2722
více než kdykoli předtím.
02:22
What we find is that when we have
45
130033
1877
Když máme velké množství dat,
02:23
a largevelký bodytělo of datadata, we can fundamentallyzásadně do things
46
131910
2724
můžeme s nimi dělat věci,
02:26
that we couldn'tnemohl do when we
only had smallermenší amountsmnožství.
47
134634
3276
které jsme s menším množstvím
nemohli dělat.
02:29
BigVelké datadata is importantdůležité, and bigvelký datadata is newNový,
48
137910
2641
Velká data jsou důležitá a nová.
02:32
and when you think about it,
49
140551
1777
A když se nad tím zamyslíte,
02:34
the only way this planetplaneta is going to dealobchod
50
142328
2216
jediný způsob, jak se planeta vypořádá
02:36
with its globalglobální challengesproblémy
51
144544
1789
se svými globálními problémy -
02:38
to feedkrmivo people, supplyzásobování them with medicallékařský carepéče,
52
146333
3537
nakrmit lidi, dát jim zdravotní péči,
02:41
supplyzásobování them with energyenergie, electricityelektřina,
53
149870
2810
dát jim energii, elektřinu,
zajistit, abychom se nespálili na uhel
02:44
and to make sure they're not burntSpálený to a crispCrisp
54
152680
1789
02:46
because of globalglobální warmingoteplování
55
154469
1238
vlivem globálního oteplování -
02:47
is because of the effectiveefektivní use of datadata.
56
155707
4195
je efektivním využitím dat.
02:51
So what is newNový about bigvelký
datadata? What is the bigvelký dealobchod?
57
159902
3870
Co nového přináší velká data?
Proč ten poprask?
02:55
Well, to answerOdpovědět that questionotázka, let's think about
58
163772
2517
Pro odpověď se zamysleme nad tím,
02:58
what informationinformace lookedpodíval se like,
59
166289
1896
jak informace v minulosti
03:00
physicallyfyzicky lookedpodíval se like in the pastminulost.
60
168185
3034
vypadaly fyzicky.
03:03
In 1908, on the islandostrov of CreteKréta,
61
171219
3611
V roce 1908 na ostrově Kréta
03:06
archaeologistsArcheologové discoveredobjevil a clayjíl discdisk.
62
174830
4735
archeologové objevili hliněný disk.
03:11
They dateddatováno it from 2000 B.C., so it's 4,000 yearsroky oldstarý.
63
179565
4059
Byl vyroben 2 tisíce let před Kristem,
je 4 tisíce let starý.
03:15
Now, there's inscriptionsnápisy on this discdisk,
64
183624
2004
Na tom disku jsou nápisy,
o kterých nevíme co znamenají.
03:17
but we actuallyvlastně don't know what it meansprostředek.
65
185628
1327
03:18
It's a completekompletní mysterytajemství, but the pointbod is that
66
186955
2098
Je to záhada.
Podstatné ale je to,
03:21
this is what informationinformace used to look like
67
189053
1928
jak informace vypadaly
03:22
4,000 yearsroky agopřed.
68
190981
2089
před 4 tisíci lety.
03:25
This is how societyspolečnost storedUloženo
69
193070
2548
Tak společnost uchovávala
03:27
and transmittedpřenášeny informationinformace.
70
195618
3524
a přenášela informace.
03:31
Now, societyspolečnost hasn'tnení advancedpokročilý all that much.
71
199142
4160
Současná společnost
zase tak moc nepokročila.
03:35
We still storeobchod informationinformace on discsdisky,
72
203302
3474
Pořád skladujeme informace na discích,
03:38
but now we can storeobchod a lot more informationinformace,
73
206776
3184
ale můžeme informací uchovat
mnohem více než kdy dříve.
03:41
more than ever before.
74
209960
1260
03:43
SearchingHledání it is easiersnadnější. CopyingKopírování it easiersnadnější.
75
211220
3093
Je snazší jejich hledání, kopírování,
03:46
SharingSdílení it is easiersnadnější. ProcessingZpracování it is easiersnadnější.
76
214313
3500
sdílení i zpracování - vše je jednodušší.
03:49
And what we can do is we can reuseopětovné použití this informationinformace
77
217813
2766
Také můžeme tyto informace využít
03:52
for usespoužití that we never even imaginedpředstavoval
78
220579
1834
způsoby nepředstavitelnými v době,
03:54
when we first collectedshromážděno the datadata.
79
222413
3195
kdy jsme data začali sbírat.
03:57
In this respectrespekt, the datadata has gonepryč
80
225608
2252
V tomto ohledu se data proměnila
03:59
from a stockskladem to a flowtok,
81
227860
3532
ze soupisu na tok,
04:03
from something that is stationarystacionární and staticstatické
82
231392
3938
z něčeho, co je nehybné a stálé,
04:07
to something that is fluidkapalina and dynamicdynamický.
83
235330
3609
na něco tekutého a dynamického.
04:10
There is, if you will, a liquiditylikvidita to informationinformace.
84
238939
4023
Mají tak trochu tekutou povahu.
04:14
The discdisk that was discoveredobjevil off of CreteKréta
85
242962
3474
Disk, který byl objeven na Krétě,
04:18
that's 4,000 yearsroky oldstarý, is heavytěžký,
86
246436
3764
starý 4 tisíce let, je těžký,
04:22
it doesn't storeobchod a lot of informationinformace,
87
250200
1962
neobsahuje mnoho informací
04:24
and that informationinformace is unchangeablenelze změnit.
88
252162
3116
a tyto informace jsou neměnné.
04:27
By contrastkontrast, all of the filessoubory
89
255278
4011
Naproti tomu všechny soubory,
které vzal Edward Snowden
04:31
that EdwardEdward SnowdenSnowden tookvzal
90
259289
1861
z Národní bezpečnostní agentury
Spojených států,
04:33
from the NationalNárodní SecurityBezpečnost
AgencyAgentura in the UnitedVelká StatesStáty
91
261150
2621
04:35
fitsse hodí on a memoryPaměť sticklepit
92
263771
2419
se vejdou na flash disk
velikosti nehtu.
04:38
the sizevelikost of a fingernailnehet,
93
266190
3010
04:41
and it can be sharedsdílené at the speedRychlost of lightsvětlo.
94
269200
4745
A mohou být sdílena rychlostí světla.
04:45
More datadata. More.
95
273945
5255
Více dat. Více.
Jedním z důvodů, proč máme
dnes na světě tolik dat,
04:51
Now, one reasondůvod why we have
so much datadata in the worldsvět todaydnes
96
279200
1974
04:53
is we are collectingshromažďování things
97
281174
1432
je to, že sledujeme věci,
04:54
that we'vejsme always collectedshromážděno informationinformace on,
98
282606
3280
o kterých jsme vždy informace měli,
04:57
but anotherdalší reasondůvod why is we're takingpřijmout things
99
285886
2656
ale druhým důvodem je,
že sledujeme věci,
05:00
that have always been informationalinformační
100
288542
2812
které vždy nesly informace,
ale nebyly převedeny do datového formátu
05:03
but have never been renderedvykreslení into a datadata formatformát
101
291354
2486
05:05
and we are puttinguvedení it into datadata.
102
293840
2419
ale teď o nich data ukládáme.
Například taková poloha.
05:08
Think, for examplepříklad, the questionotázka of locationumístění.
103
296259
3308
Vezměte si třeba Martina Luthera.
05:11
Take, for examplepříklad, MartinMartin LutherLuther.
104
299567
2249
Kdybychom kolem roku 1500 chtěli vědět,
05:13
If we wanted to know in the 1500s
105
301816
1597
05:15
where MartinMartin LutherLuther was,
106
303413
2667
kde se Martin Luther nachází,
museli bychom jej stále sledovat,
05:18
we would have to follownásledovat him at all timesčasy,
107
306080
2092
05:20
maybe with a featherylehoučký quillBRK and an inkwellInkwell,
108
308172
2137
možná s brkem a kalamářem
a zapisovat to.
05:22
and recordzáznam it,
109
310309
1676
Ale zamyslete se, jak to funguje dnes.
05:23
but now think about what it looksvzhled like todaydnes.
110
311985
2183
Víte, že někde,
05:26
You know that somewhereněkde,
111
314168
2122
05:28
probablypravděpodobně in a telecommunicationstelekomunikace carrier'sdopravce databasedatabáze,
112
316290
2446
pravděpodobně v databázi operátora,
je tabulka nebo alespoň záznam v databázi,
05:30
there is a spreadsheettabulky or at leastnejméně a databasedatabáze entryvstup
113
318736
3036
který zaznamenávaná informace o tom,
kde jste kdy byli.
05:33
that recordsevidence your informationinformace
114
321772
2088
05:35
of where you've been at all timesčasy.
115
323860
2063
Máte-li mobilní telefon,
který má GPS,
05:37
If you have a cellbuňka phonetelefon,
116
325923
1360
05:39
and that cellbuňka phonetelefon has GPSGPS,
but even if it doesn't have GPSGPS,
117
327283
2847
- ale i když GPS nemá -
může zaznamenávat polohu.
05:42
it can recordzáznam your informationinformace.
118
330130
2385
V tomto ohledu byla poloha
převedena do formy dat.
05:44
In this respectrespekt, locationumístění has been datafieddatafied.
119
332515
4084
Teď si vezměte třeba takové držení těla,
05:48
Now think, for examplepříklad, of the issueproblém of posturedržení těla,
120
336599
4601
způsob, jakým teď všichni sedíte,
05:53
the way that you are all sittingsedící right now,
121
341200
1285
05:54
the way that you sitsedět,
122
342485
2030
jak sedíte vy,
05:56
the way that you sitsedět, the way that you sitsedět.
123
344515
2771
vy a vy.
Liší se to vlivem délky vašich nohou,
05:59
It's all differentodlišný, and it's a functionfunkce of your legnoha lengthdélka
124
347286
2077
06:01
and your back and the contoursobrysy of your back,
125
349363
2093
vašich zad a jejich tvaru.
06:03
and if I were to put sensorssenzory,
maybe 100 sensorssenzory
126
351456
2531
Kdybych do všech vašich židlí
06:05
into all of your chairsžidle right now,
127
353987
1766
nyní dal třeba 100 senzorů,
06:07
I could createvytvořit an indexindex that's fairlyspravedlivě uniqueunikátní to you,
128
355753
3600
mohl bych vytvořit záznam
unikátní pro každého z vás,
06:11
sorttřídění of like a fingerprintotisk prstu, but it's not your fingerprst.
129
359353
4409
něco jako otisk prstu,
ale nejde o váš prst.
06:15
So what could we do with this?
130
363762
2969
Co bychom s tím mohli udělat?
06:18
ResearchersVýzkumní pracovníci in TokyoTokio are usingpoužitím it
131
366731
2397
Vědci v Tokiu jej využívají
jako možné opatření proti krádeži aut.
06:21
as a potentialpotenciál anti-theftproti krádeži devicepřístroj in carsauta.
132
369128
4388
Jde o to, že zloděj usedne za volant,
06:25
The ideaidea is that the carjackerCarJacker sitssedí behindza the wheelkolo,
133
373516
2924
snaží se odjet, ale auto pozná,
06:28
trieszkoušky to streamproud off, but the carauto recognizesuznává
134
376440
2104
že za volantem sedí neoprávněný řidič
06:30
that a non-approvedneschválené driverŘidič is behindza the wheelkolo,
135
378544
2362
06:32
and maybe the enginemotor just stopszastávky, unlesspokud není you
136
380906
2164
a auto třeba vypne motor,
06:35
typetyp in a passwordheslo into the dashboardřídicí panel
137
383070
3177
dokud na palubní desce nezadáte
správné heslo,
06:38
to say, "Hey, I have authorizationautorizace to driveřídit." Great.
138
386247
4658
čímž řeknete:
„Hele, jsem oprávněný to řídit.“ Paráda.
Co kdyby každé auto v Evropě
06:42
What if everykaždý singlesingl carauto in EuropeEvropa
139
390905
2553
06:45
had this technologytechnika in it?
140
393458
1457
mělo takovou technologii?
06:46
What could we do then?
141
394915
3165
Co bychom dělali pak?
06:50
Maybe, if we aggregatedagregované the datadata,
142
398080
2240
Možná, kdybychom dali data dohromady,
06:52
maybe we could identifyidentifikovat telltalekontrolka signsznamení
143
400320
3814
možná bychom mohli rozpoznat signály,
které by předvídaly,
06:56
that bestnejlepší predictpředpovědět that a carauto accidentnehoda
144
404134
2709
že se v příštích 5 sekundách
stane dopravní nehoda.
06:58
is going to take placemísto in the nextdalší fivePět secondssekundy.
145
406843
5893
07:04
And then what we will have datafieddatafied
146
412736
2557
Tak bychom mohli pomocí dat
07:07
is driverŘidič fatigueúnava,
147
415293
1783
odhalit únavu řidiče
07:09
and the serviceservis would be when the carauto sensessmysly
148
417076
2334
a když by auto poznalo,
že se řidič sune do určité pozice,
07:11
that the personosoba slumpspropady into that positionpozice,
149
419410
3437
automaticky to rozezná
a spustí uvnitř poplach,
07:14
automaticallyautomaticky knows, hey, setsoubor an internalvnitřní alarmpoplach
150
422847
3994
může to být vibrace volantu
nebo klakson v autě,
07:18
that would vibratevibrovat the steeringřízení wheelkolo, honkHonk insideuvnitř
151
426841
2025
07:20
to say, "Hey, wakeprobudit up,
152
428866
1721
a tím řekne: „Hele, vzbuď se,
07:22
payplatit more attentionPozor to the roadsilnice."
153
430587
1904
dávej pozor na cestu!“
07:24
These are the sortstřídění of things we can do
154
432491
1853
Tyhle věci můžeme udělat,
07:26
when we datafydatafy more aspectsaspekty of our livesživoty.
155
434344
2821
když převedeme na data
více aspektů našeho života.
07:29
So what is the valuehodnota of bigvelký datadata?
156
437165
3675
Jaká je tedy hodnota velkých dat?
07:32
Well, think about it.
157
440840
2190
Inu, zamysleme se.
Máte více informací.
07:35
You have more informationinformace.
158
443030
2412
Můžete dělat věci,
které jste předtím nemohli.
07:37
You can do things that you couldn'tnemohl do before.
159
445442
3341
Jednou z nejpůsobivějších oblastí,
07:40
One of the mostvětšina impressiveimpozantní areasoblasti
160
448783
1676
07:42
where this conceptpojem is takingpřijmout placemísto
161
450459
1729
kde se tento koncept uplatňuje
07:44
is in the areaplocha of machinestroj learningučení se.
162
452188
3307
je v oblasti strojového učení.
Strojové učení je
odvětví umělé inteligence,
07:47
MachineStroj learningučení se is a branchvětev of artificialumělý intelligenceinteligence,
163
455495
3077
07:50
whichkterý itselfsám is a branchvětev of computerpočítač scienceVěda.
164
458572
3378
které patří do počítačových věd.
Hlavní myšlenkou je, že místo toho,
07:53
The generalVšeobecné ideaidea is that insteadmísto toho of
165
461950
1543
07:55
instructinginstrukce a computerpočítač what do do,
166
463493
2117
že řekneme počítači, co má dělat,
07:57
we are going to simplyjednoduše throwhod datadata at the problemproblém
167
465610
2620
jednoduše mu dáme všechna data
související s problémem
08:00
and tell the computerpočítač to figurepostava it out for itselfsám.
168
468230
3206
a řekneme mu,
aby problém vyřešil sám.
08:03
And it will help you understandrozumět it
169
471436
1777
Lépe to pochopíte,
08:05
by seeingvidění its originspůvodů.
170
473213
3552
když víte, jak to vzniklo.
V 50. letech Arthur Samuel,
počítačový vědec v IBM,
08:08
In the 1950s, a computerpočítač scientistvědec
171
476765
2388
08:11
at IBMIBM namedpojmenovaný ArthurArthur SamuelSamuel likedLíbí se mi to playhrát si checkersšachovnice,
172
479153
3592
rád hrál piškvorky,
takže napsal počítačový program,
08:14
so he wrotenapsal a computerpočítač programprogram
173
482745
1402
08:16
so he could playhrát si againstproti the computerpočítač.
174
484147
2813
aby mohl hrát s počítačem.
Hrál.
08:18
He playedhrál. He wonvyhrál.
175
486960
2711
A vyhrál.
08:21
He playedhrál. He wonvyhrál.
176
489671
2103
Hrál.
A vyhrál.
Hrál a vyhrál.
08:23
He playedhrál. He wonvyhrál,
177
491774
3015
Protože počítač uměl jen tahy,
08:26
because the computerpočítač only knewvěděl
178
494789
1778
08:28
what a legalprávní movehýbat se was.
179
496567
2227
které ho naučil.
Arthur Samuel uměl něco jiného.
08:30
ArthurArthur SamuelSamuel knewvěděl something elsejiný.
180
498794
2087
08:32
ArthurArthur SamuelSamuel knewvěděl strategystrategie.
181
500881
4629
Arthur Samuel znal strategii.
Takže napsal podprogram,
08:37
So he wrotenapsal a smallmalý sub-programdílčí program alongsidevedle it
182
505510
2396
08:39
operatingprovozní in the backgroundPozadí, and all it did
183
507906
1974
který běžel na pozadí
08:41
was scoreskóre the probabilitypravděpodobnost
184
509880
1817
a po každém tahu
počítal pravděpodobnost,
08:43
that a givendané boarddeska configurationKonfigurace would likelypravděpodobně leadVést
185
511697
2563
s jakou uspořádání na hracím poli
08:46
to a winningvítězný boarddeska versusproti a losingztrácí boarddeska
186
514260
2910
povede k vítěznému tahu nebo prohře.
08:49
after everykaždý movehýbat se.
187
517170
2508
08:51
He playshraje the computerpočítač. He winsvyhraje.
188
519678
3150
Takže hraje s počítačem. A vyhrává.
08:54
He playshraje the computerpočítač. He winsvyhraje.
189
522828
2508
Hraje s počítačem a vyhrává.
Hraje s počítačem a vyhrává.
08:57
He playshraje the computerpočítač. He winsvyhraje.
190
525336
3731
Pak Arthur Samuel nechá počítač,
09:01
And then ArthurArthur SamuelSamuel leaveslisty the computerpočítač
191
529067
2277
aby si hrál sám.
09:03
to playhrát si itselfsám.
192
531344
2227
09:05
It playshraje itselfsám. It collectsshromažďuje more datadata.
193
533571
3509
Hraje si sám. Sbírá více dat.
Sbírá informace.
Zvýší spolehlivost svého odhadu.
09:09
It collectsshromažďuje more datadata. It increaseszvyšuje
the accuracypřesnost of its predictionpředpověď.
194
537080
4309
09:13
And then ArthurArthur SamuelSamuel goesjde back to the computerpočítač
195
541389
2104
Pak se Arthur Samuel vrátí k počítači
09:15
and he playshraje it, and he losesztrácí,
196
543493
2318
a hraje s ním. A prohraje.
Hraje s ním a prohraje,
09:17
and he playshraje it, and he losesztrácí,
197
545811
2069
09:19
and he playshraje it, and he losesztrácí,
198
547880
2047
hraje s ním a prohraje.
09:21
and ArthurArthur SamuelSamuel has createdvytvořeno a machinestroj
199
549927
2599
A tak Arthur Samuel vytvořil stroj,
09:24
that surpassespředčí his abilityschopnost in a taskúkol that he taughtvyučován it.
200
552526
6288
který překonal jeho schopnosti v úloze,
kterou jej naučil.
09:30
And this ideaidea of machinestroj learningučení se
201
558814
2498
Myšlenka strojového učení
je přítomná všude.
09:33
is going everywherevšude.
202
561312
3927
09:37
How do you think we have self-drivingautomaticky řízené carsauta?
203
565239
3149
Odkud myslíte, že máme auta,
která se sama řídí?
09:40
Are we any better off as a societyspolečnost
204
568388
2137
Vede si naše společnost lépe díky tomu,
09:42
enshriningzakotvení all the rulespravidel of the roadsilnice into softwaresoftware?
205
570525
3285
že všechna pravidla silničního provozu
nasypeme do softwaru? Ne.
09:45
No. MemoryPaměť is cheaperlevnější. No.
206
573810
2598
Paměť je levnější? Ne.
Algoritmy jsou rychlejší? Ne.
Procesory jsou lepší? Ne.
09:48
AlgorithmsAlgoritmy are fasterrychleji. No. ProcessorsProcesory are better. No.
207
576408
3994
Na tom vše záleží, ale to není ten důvod.
09:52
All of those things matterhmota, but that's not why.
208
580402
2772
Je to proto,
že jsme změnili povahu problému.
09:55
It's because we changedzměněna the naturePříroda of the problemproblém.
209
583174
3141
09:58
We changedzměněna the naturePříroda of the problemproblém from one
210
586315
1530
Z problému, kde jsme se zevrubně
09:59
in whichkterý we triedpokusil se to overtlyotevřeně and explicitlyvýslovně
211
587845
2245
a doslovně snažili
vysvětlit počítači jak má jezdit,
10:02
explainvysvětlit to the computerpočítač how to driveřídit
212
590090
2581
na úkol, kdy mu řekneme:
10:04
to one in whichkterý we say,
213
592671
1316
„Tady máš spoustu dat z okolí vozu.
10:05
"Here'sTady je a lot of datadata around the vehiclevozidlo.
214
593987
1876
10:07
You figurepostava it out.
215
595863
1533
Vyřeš to.
Uvědom si, že toto je semafor,
10:09
You figurepostava it out that that is a trafficprovoz lightsvětlo,
216
597396
1867
na tom semaforu je červená
a ne zelená,
10:11
that that trafficprovoz lightsvětlo is redČervené and not greenzelená,
217
599263
2081
že to znamená, že bys měl zastavit
10:13
that that meansprostředek that you need to stop
218
601344
2014
a nepokračovat dál.“
10:15
and not go forwardvpřed."
219
603358
3083
Strojové učení je základem mnoha věcí,
10:18
MachineStroj learningučení se is at the basiszáklad
220
606441
1518
které využíváme online:
10:19
of manymnoho of the things that we do onlineonline:
221
607959
1991
vyhledávače,
10:21
searchVyhledávání enginesmotory,
222
609950
1857
algoritmus personalizace v Amazonu,
10:23
Amazon'sAmazon personalizationindividuální nastavení algorithmalgoritmus,
223
611807
3801
počítačový překlad,
10:27
computerpočítač translationpřeklad,
224
615608
2212
10:29
voicehlas recognitionuznání systemssystémy.
225
617820
4290
systém rozpoznání hlasu.
10:34
ResearchersVýzkumní pracovníci recentlynedávno have lookedpodíval se at
226
622110
2835
Vědci nyní řeší otázky biopsií,
10:36
the questionotázka of biopsiesbiopsie,
227
624945
3195
rakovinových biopsií.
10:40
cancerousrakovinné biopsiesbiopsie,
228
628140
2767
Požádali počítač,
10:42
and they'veoni mají askedzeptal se the computerpočítač to identifyidentifikovat
229
630907
2315
aby zjistil z dat a statistik o přežití,
10:45
by looking at the datadata and survivalpřežití ratesceny
230
633222
2471
10:47
to determineurčit whetherzda cellsbuněk are actuallyvlastně
231
635693
4667
jestli jsou buňky skutečně
zhoubné nebo ne.
10:52
cancerousrakovinné or not,
232
640360
2544
Když dostal data pomocí
algoritmu strojového učení,
10:54
and sure enoughdost, when you throwhod the datadata at it,
233
642904
1778
10:56
throughpřes a machine-learningstrojové učení algorithmalgoritmus,
234
644682
2047
počítač byl schopný identifikovat
12 znaků nejlépe určujících,
10:58
the machinestroj was ableschopný to identifyidentifikovat
235
646729
1877
11:00
the 12 telltalekontrolka signsznamení that bestnejlepší predictpředpovědět
236
648606
2262
zda buňky z biopsie rakoviny prsu
jsou skutečně zhoubné.
11:02
that this biopsybiopsii of the breastprsa cancerrakovina cellsbuněk
237
650868
3299
11:06
are indeedVskutku cancerousrakovinné.
238
654167
3218
Problém byl, že odborná lékařská
literatura uváděla jenom 9 z nich.
11:09
The problemproblém: The medicallékařský literatureliteratura
239
657385
2498
11:11
only knewvěděl ninedevět of them.
240
659883
2789
Tři z těchto znaků lidé nehledali,
ale stroj je našel.
11:14
ThreeTři of the traitsznaků were onesty
241
662672
1800
11:16
that people didn't need to look for,
242
664472
2975
11:19
but that the machinestroj spottedskvrnitý.
243
667447
5531
11:24
Now, there are darktemný sidesstranách to bigvelký datadata as well.
244
672978
5925
Velká data mají i své stinné stránky.
Mohou zlepšit naše životy,
ale jsou zde věci, o kterých musíme vědět.
11:30
It will improvezlepšit our livesživoty, but there are problemsproblémy
245
678903
2074
11:32
that we need to be consciousvědomí of,
246
680977
2640
11:35
and the first one is the ideaidea
247
683617
2623
První je možnost,
že můžeme být potrestáni za předpovědi;
11:38
that we maysmět be punishedpotrestán for predictionspředpovědi,
248
686240
2686
11:40
that the policepolicie maysmět use bigvelký datadata for theirjejich purposesúčely,
249
688926
3870
že policie může využít
velká data pro své účely
tak trochu jako ve filmu Minority report.
11:44
a little bitbit like "MinorityMenšina ReportZpráva."
250
692796
2351
11:47
Now, it's a termobdobí calledvolal predictiveprediktivní psaní policingpolicejní práce,
251
695147
2441
Říká se tomu prediktivní kontrola
nebo algoritmová kriminologie
11:49
or algorithmicalgoritmické criminologykriminologie,
252
697588
2363
a základem je, že když vezmeme hodně dat,
11:51
and the ideaidea is that if we take a lot of datadata,
253
699951
2036
11:53
for examplepříklad where pastminulost crimeszločiny have been,
254
701987
2159
třeba kde se staly zločiny v minulosti,
víte, kam poslat hlídky.
11:56
we know where to sendposlat the patrolshlídky.
255
704146
2543
To dává smysl, ale problémem je,
že se to nezastaví u údajů o poloze,
11:58
That makesdělá sensesmysl, but the problemproblém, of coursechod,
256
706689
2115
12:00
is that it's not simplyjednoduše going to stop on locationumístění datadata,
257
708804
4544
12:05
it's going to go down to the levelúroveň of the individualindividuální.
258
713348
2959
ale dojde i na údaje o osobách.
Proč nevyužít údaje
o výsledcích ze střední školy?
12:08
Why don't we use datadata about the person'sosobě
259
716307
2250
12:10
highvysoký schoolškola transcriptpřepis?
260
718557
2228
Možná bychom měli využít data o tom,
zda lidé mají práci, data o dluzích
12:12
Maybe we should use the factskutečnost that
261
720785
1561
12:14
they're unemployedbez práce or not, theirjejich creditkredit scoreskóre,
262
722346
2028
nebo co dělají na internetu;
zda ponocují.
12:16
theirjejich web-surfingprocházení webu behaviorchování,
263
724374
1552
12:17
whetherzda they're up latepozdě at night.
264
725926
1878
Jejich fitness náramky (fitbit),
přečtou jejich biochemické údaje
12:19
TheirJejich FitbitFitbit, when it's ableschopný
to identifyidentifikovat biochemistriesbiochemie,
265
727804
3161
a zjistí, zda mají agresivní myšlenky.
12:22
will showshow that they have aggressiveagresivní thoughtsmyšlenky.
266
730965
4236
Můžeme mít algoritmy,
které jsou schopny předpovědět,
12:27
We maysmět have algorithmsalgoritmy that are likelypravděpodobně to predictpředpovědět
267
735201
2221
12:29
what we are about to do,
268
737422
1633
co se chystáme udělat
12:31
and we maysmět be helddržený accountableodpovědný
269
739055
1244
a my můžeme být zodpovědní už před tím,
než začneme jednat.
12:32
before we'vejsme actuallyvlastně actedjednala.
270
740299
2590
Soukromí bylo výzvou v éře malých dat.
12:34
PrivacySoukromí was the centralcentrální challengevýzva
271
742889
1732
12:36
in a smallmalý datadata eraéra.
272
744621
2880
12:39
In the bigvelký datadata agestáří,
273
747501
2149
V éře velkých dat bude výzvou
ochrana svobodné vůle,
12:41
the challengevýzva will be safeguardingOchrana freevolný, uvolnit will,
274
749650
4523
12:46
moralmorální choicevýběr, humančlověk volitionvůle,
275
754173
3779
ochrana morální volby, lidské vůle,
lidského jednání.
12:49
humančlověk agencyagentura.
276
757952
3068
12:54
There is anotherdalší problemproblém:
277
762540
2225
Pak je zde další problém.
12:56
BigVelké datadata is going to stealukrást our jobspracovní místa.
278
764765
3556
Velká data nám vezmou práci.
13:00
BigVelké datadata and algorithmsalgoritmy are going to challengevýzva
279
768321
3512
V 21. století velká data a algoritmy
13:03
whitebílý collarlímec, professionalprofesionální knowledgeznalost work
280
771833
3061
vyzvou na souboj
bílé límečky a odbornou práci,
13:06
in the 21stSvatý centurystoletí
281
774894
1653
13:08
in the samestejný way that factorytovárna automationautomatizace
282
776547
2434
stejně jako automatizace ve výrobě
a výrobní linky
13:10
and the assemblyshromáždění linečára
283
778981
2189
změnily práci modrých límečků
ve 20. století.
13:13
challengedzpochybněna bluemodrý collarlímec laborpráce in the 20thth centurystoletí.
284
781170
3026
Vezměte si laboratorního technika,
13:16
Think about a lablaboratoř techniciantechnik
285
784196
2092
který v mikroskopu
zkoumá biopsii a určuje,
13:18
who is looking throughpřes a microscopemikroskop
286
786288
1409
13:19
at a cancerrakovina biopsybiopsii
287
787697
1624
zda jde o rakovinu nebo ne.
13:21
and determiningurčení whetherzda it's cancerousrakovinné or not.
288
789321
2637
Ten člověk chodil na univerzitu,
koupil si dům,
13:23
The personosoba wentšel to universityuniverzita.
289
791958
1972
13:25
The personosoba buysnakupuje propertyvlastnictví.
290
793930
1430
13:27
He or she voteshlasů.
291
795360
1741
chodí k volbám,
je platným členem společnosti.
13:29
He or she is a stakeholderzúčastněných stran in societyspolečnost.
292
797101
3666
Ale práce tohoto člověka,
stejně jako celé řady
13:32
And that person'sosobě jobpráce,
293
800767
1394
13:34
as well as an entirecelý fleetVozový park
294
802161
1609
13:35
of professionalsprofesionálů like that personosoba,
295
803770
1969
jemu podobných odborníků,
se radikálně změní
13:37
is going to find that theirjejich jobspracovní místa are radicallyradikálně changedzměněna
296
805739
3150
13:40
or actuallyvlastně completelyzcela eliminatedvyloučeno.
297
808889
2357
nebo dokonce přestane být vůbec potřeba.
13:43
Now, we like to think
298
811246
1284
Rádi bychom si mysleli,
13:44
that technologytechnika createsvytváří jobspracovní místa over a perioddoba of time
299
812530
3187
že technologie vytvoří
jiná pracovní místa,
13:47
after a shortkrátký, temporarydočasný perioddoba of dislocationdislokace,
300
815717
3465
po krátkém, dočasném období změn
a pro období, ve kterém žijeme,
je to pravda,
13:51
and that is trueskutečný for the framerám of referenceodkaz
301
819182
1941
13:53
with whichkterý we all livežít, the IndustrialPrůmyslové RevolutionRevoluce,
302
821123
2142
v průmyslové revoluci se přesně to stalo.
13:55
because that's preciselypřesně what happenedStalo.
303
823265
2328
Ale zapomínáme na to,
13:57
But we forgetzapomenout something in that analysisanalýza:
304
825593
2333
že některé typy prací
13:59
There are some categoriesKategorie of jobspracovní místa
305
827926
1830
jednoduše zmizely a nikdy se nevrátily.
14:01
that simplyjednoduše get eliminatedvyloučeno and never come back.
306
829756
3420
Průmyslová revoluce nebyla moc dobrá,
14:05
The IndustrialPrůmyslové RevolutionRevoluce wasn'tnebyl very good
307
833176
2004
14:07
if you were a horsekůň.
308
835180
4002
když jste byli kůň.
Takže musíme být opatrní
14:11
So we're going to need to be carefulopatrně
309
839182
2055
a využívat velká data pro naše potřeby,
14:13
and take bigvelký datadata and adjustupravit it for our needspotřeby,
310
841237
3514
14:16
our very humančlověk needspotřeby.
311
844751
3185
naše lidské potřeby.
Musíme technologii vládnout,
ne jí sloužit.
14:19
We have to be the mastermistr of this technologytechnika,
312
847936
1954
14:21
not its servantslužebník.
313
849890
1656
Jsme právě na prahu éry velkých dat
a upřímně,
14:23
We are just at the outsetpočátku of the bigvelký datadata eraéra,
314
851546
2958
14:26
and honestlyupřímně řečeno, we are not very good
315
854504
3150
zacházení se všemi údaji,
které nyní sbíráme, nám moc nejde.
14:29
at handlingzacházení all the datadata that we can now collectsbírat.
316
857654
4207
Není to jen problém NSA.
(Národní bezpečnostní agentury)
14:33
It's not just a problemproblém for
the NationalNárodní SecurityBezpečnost AgencyAgentura.
317
861861
3330
14:37
BusinessesPodniky collectsbírat lots of
datadata, and they misusezneužití it too,
318
865191
3038
I firmy sbírají mnoho údajů
a také je zneužívají,
14:40
and we need to get better at
this, and this will take time.
319
868229
3667
musíme se s tím naučit zacházet,
což zabere nějaký čas.
14:43
It's a little bitbit like the challengevýzva that was facedtváří v tvář
320
871896
1822
Je to trochu jako výzva,
14:45
by primitiveprimitivní man and fireoheň.
321
873718
2407
které čelili pralidé s ohněm.
14:48
This is a toolnástroj, but this is a toolnástroj that,
322
876125
1885
Je to užitečný nástroj,
14:50
unlesspokud není we're carefulopatrně, will burnhořet us.
323
878010
3559
ale když si nedáme pozor, popálí nás.
14:56
BigVelké datadata is going to transformpřeměnit how we livežít,
324
884008
3120
Velká data změní to, jak žijeme,
jak pracujeme a jak myslíme.
14:59
how we work and how we think.
325
887128
2801
Pomohou nám lépe řídit naše kariéry
15:01
It is going to help us managespravovat our careerskariéry
326
889929
1889
15:03
and leadVést livesživoty of satisfactionspokojenost and hopenaděje
327
891818
3634
a žít spokojený život
v naději, štěstí a zdraví.
15:07
and happinessštěstí and healthzdraví,
328
895452
2992
Ale v minulosti jsme se často dívali
na informační technologie
15:10
but in the pastminulost, we'vejsme oftenčasto
lookedpodíval se at informationinformace technologytechnika
329
898444
3306
15:13
and our eyesoči have only seenviděno the T,
330
901750
2208
a viděli jsme jen to T
- technologii, hardware,
15:15
the technologytechnika, the hardwareHardware,
331
903958
1686
protože to bylo fyzické.
15:17
because that's what was physicalfyzický.
332
905644
2262
Nyní zaostříme na I
15:19
We now need to recastpřepracování our gazepohled at the I,
333
907906
2924
- informace,
15:22
the informationinformace,
334
910830
1380
které jsou méně zjevné,
15:24
whichkterý is lessméně apparentZdánlivá,
335
912210
1373
ale v řadě věcí důležitější.
15:25
but in some wayszpůsoby a lot more importantdůležité.
336
913583
4109
15:29
HumanityLidstvo can finallyKonečně learnUčit se from the informationinformace
337
917692
3465
Lidstvo se konečně může učit z informací,
15:33
that it can collectsbírat,
338
921157
2418
které může sbírat
na nekonečné cestě
15:35
as partčást of our timelessTimeless questQuest
339
923575
2115
k porozumění světu a našemu místu v něm.
15:37
to understandrozumět the worldsvět and our placemísto in it,
340
925690
3159
15:40
and that's why bigvelký datadata is a bigvelký dealobchod.
341
928849
5631
Proto jsou velká data tak důležitá.
(potlesk)
15:46
(ApplausePotlesk)
342
934480
3568
Translated by Katerina Jaburkova
Reviewed by Karel Čížek

▲Back to top

ABOUT THE SPEAKER
Kenneth Cukier - Data Editor of The Economist
Kenneth Cukier is the Data Editor of The Economist. From 2007 to 2012 he was the Tokyo correspondent, and before that, the paper’s technology correspondent in London, where his work focused on innovation, intellectual property and Internet governance. Kenneth is also the co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think with Viktor Mayer-Schönberger in 2013, which was a New York Times Bestseller and translated into 16 languages.

Why you should listen

As Data Editor of The Economist and co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think, Kenneth Cukier has spent years immersed in big data, machine learning -- and the impact of both. What's the future of big data-driven technology and design? To find out, watch this talk.

More profile about the speaker
Kenneth Cukier | Speaker | TED.com