ABOUT THE SPEAKER
Kenneth Cukier - Data Editor of The Economist
Kenneth Cukier is the Data Editor of The Economist. From 2007 to 2012 he was the Tokyo correspondent, and before that, the paper’s technology correspondent in London, where his work focused on innovation, intellectual property and Internet governance. Kenneth is also the co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think with Viktor Mayer-Schönberger in 2013, which was a New York Times Bestseller and translated into 16 languages.

Why you should listen

As Data Editor of The Economist and co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think, Kenneth Cukier has spent years immersed in big data, machine learning -- and the impact of both. What's the future of big data-driven technology and design? To find out, watch this talk.

More profile about the speaker
Kenneth Cukier | Speaker | TED.com
TEDSalon Berlin 2014

Kenneth Cukier: Big data is better data

Kenneth Cukier: Big data är bättre data

Filmed:
1,663,038 views

Självstyrande bilar var bara början. Hur ser framtiden ut för teknik och design som styrs av big data? I en spännande vetenskapsföreläsning tittar Kenneth Cukier på vad som är på gång inom maskininlärning - och mänsklig kunskap.
- Data Editor of The Economist
Kenneth Cukier is the Data Editor of The Economist. From 2007 to 2012 he was the Tokyo correspondent, and before that, the paper’s technology correspondent in London, where his work focused on innovation, intellectual property and Internet governance. Kenneth is also the co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think with Viktor Mayer-Schönberger in 2013, which was a New York Times Bestseller and translated into 16 languages. Full bio

Double-click the English transcript below to play the video.

00:12
America'sUSA: s favoritefavorit- piePie is?
0
787
3845
Vilken är USA:s favoritpaj?
Publiken: Äpple.
Kenneth Cukier: Äpple såklart.
00:16
AudienceMålgrupp: AppleApple.
KennethKenneth CukierCukier: AppleApple. Of coursekurs it is.
1
4632
3506
00:20
How do we know it?
2
8138
1231
Hur vet vi det?
00:21
Because of datadata.
3
9369
2753
Tack vare data.
00:24
You look at supermarketmataffär salesförsäljning.
4
12122
2066
Om man ser på stormarknadsförsäljning.
00:26
You look at supermarketmataffär
salesförsäljning of 30-centimeter-centimeter piespajer
5
14188
2866
Om man ser på säljsiffror
för 30 centimeters frysta pajer
00:29
that are frozenfrysta, and appleäpple winssegrar, no contesttävling.
6
17054
4075
så vinner äpple utan konkurrens.
00:33
The majoritymajoritet of the salesförsäljning are appleäpple.
7
21129
5180
Majoriteten av försäljningen är äpple.
00:38
But then supermarketssnabbköp startedsatte igång sellingförsäljning
8
26309
2964
Men sen började stormarknader
sälja mindre, 11 cm:s pajer,
00:41
smallermindre, 11-centimeter-centimeter piespajer,
9
29273
2583
och plötsligt föll äpple
00:43
and suddenlyplötsligt, appleäpple fellföll to fourthfjärde or fifthfemte placeplats.
10
31856
4174
till fjärde eller femte plats.
00:48
Why? What happenedhände?
11
36030
2875
Varför? Vad hände?
00:50
Okay, think about it.
12
38905
2818
OK, fundera på det.
00:53
When you buyköpa a 30-centimeter-centimeter piePie,
13
41723
3848
När man köper en 30 centimeters paj
00:57
the wholehela familyfamilj has to agreehålla med,
14
45571
2261
så behöver hela familjen samsas,
00:59
and appleäpple is everyone'sallas secondandra favoritefavorit-.
15
47832
3791
och äpple är då allas andrahandsval.
01:03
(LaughterSkratt)
16
51623
1935
(Skratt)
01:05
But when you buyköpa an individualenskild 11-centimeter-centimeter piePie,
17
53558
3615
Men när man köper
en enskild 11 centimeters paj
01:09
you can buyköpa the one that you want.
18
57173
3745
så kan man köpa den man vill ha.
01:12
You can get your first choiceval.
19
60918
4015
Du kan få ditt förstahandsval.
01:16
You have more datadata.
20
64933
1641
Vi har mer data
01:18
You can see something
21
66574
1554
Vi kan se något som vi inte kunde se
01:20
that you couldn'tkunde inte see
22
68128
1132
när vi hade mindre mängder av det.
01:21
when you only had smallermindre amountsmängder of it.
23
69260
3953
01:25
Now, the pointpunkt here is that more datadata
24
73213
2475
Poängen här är att mer data
01:27
doesn't just let us see more,
25
75688
2283
inte bara låter oss se mera,
01:29
more of the samesamma thing we were looking at.
26
77971
1854
mer av samma sak vi tittar på.
01:31
More datadata allowstillåter us to see newny.
27
79825
3613
Mer data låter oss att se nytt.
01:35
It allowstillåter us to see better.
28
83438
3094
Det låter oss att se bättre.
01:38
It allowstillåter us to see differentannorlunda.
29
86532
3656
Det låter oss att se annorlunda.
01:42
In this casefall, it allowstillåter us to see
30
90188
3173
I detta fall, så låter det oss att se
01:45
what America'sUSA: s favoritefavorit- piePie is:
31
93361
2913
vad USA:s favoritpaj är:
inte äpple.
01:48
not appleäpple.
32
96274
2542
01:50
Now, you probablyförmodligen all have heardhört the termtermin bigstor datadata.
33
98816
3614
Ni har troligen hört termen big data.
Ni är troligen trötta på
att höra termen big data.
01:54
In factfaktum, you're probablyförmodligen sicksjuk of hearinghörsel the termtermin
34
102430
2057
01:56
bigstor datadata.
35
104487
1630
Det är sant att termen har blivit trendig
01:58
It is truesann that there is a lot of hypehype around the termtermin,
36
106117
3330
02:01
and that is very unfortunateolyckligt,
37
109447
2332
och det är väldigt synd,
02:03
because bigstor datadata is an extremelyytterst importantViktig toolverktyg
38
111779
3046
för big data är
ett väldigt viktigt verktyg
02:06
by whichsom societysamhälle is going to advanceförskott.
39
114825
3734
för samhällsutvecklingen.
02:10
In the pastdåtid, we used to look at smallsmå datadata
40
118559
3561
Tidigare har vi tittat på mindre data
02:14
and think about what it would mean
41
122120
1704
och funderat på vad den betyder
för att försöka förstå världen,
02:15
to try to understandförstå the worldvärld,
42
123824
1496
02:17
and now we have a lot more of it,
43
125320
1991
och nu har vi mycket mer av det,
02:19
more than we ever could before.
44
127311
2722
mer än vi någonsin hade innan.
02:22
What we find is that when we have
45
130033
1877
Vad vi upptäcker när vi har
02:23
a largestor bodykropp of datadata, we can fundamentallyfundamentalt do things
46
131910
2724
en stor mängd med data,
är att vi kan i grunden göra saker
02:26
that we couldn'tkunde inte do when we
only had smallermindre amountsmängder.
47
134634
3276
som inte gick när vi hade mindre mängder.
02:29
BigStora datadata is importantViktig, and bigstor datadata is newny,
48
137910
2641
Big data är viktigt
och big data är nytt,
02:32
and when you think about it,
49
140551
1777
och när du tänker på det
02:34
the only way this planetplanet is going to dealhandla
50
142328
2216
är det enda sättet som planeten
kommer hantera
02:36
with its globalglobal challengesutmaningar
51
144544
1789
sina globala utmaningar på -
02:38
to feedutfodra people, supplytillförsel them with medicalmedicinsk carevård,
52
146333
3537
att ge människor mat,
förse dem med sjukvård,
02:41
supplytillförsel them with energyenergi, electricityelektricitet,
53
149870
2810
förse dem med energi, elektricitet,
02:44
and to make sure they're not burntbränd to a crispCrisp
54
152680
1789
se till att dom inte blir knaperstekta
på grund av global uppvärmning -
02:46
because of globalglobal warminguppvärmningen
55
154469
1238
02:47
is because of the effectiveeffektiv use of datadata.
56
155707
4195
är med hjälp av effektiv dataanvändning.
02:51
So what is newny about bigstor
datadata? What is the bigstor dealhandla?
57
159902
3870
Så vad är nytt med big data?
Vad är den stora grejen?
02:55
Well, to answersvar that questionfråga, let's think about
58
163772
2517
För att besvara frågan, fundera på
02:58
what informationinformation lookedtittade like,
59
166289
1896
hur information såg ut fysiskt,
03:00
physicallyfysiskt lookedtittade like in the pastdåtid.
60
168185
3034
hur den såg ut förr i tiden.
03:03
In 1908, on the islandö of CreteCrete,
61
171219
3611
1908, på ön Kreta
03:06
archaeologistsarkeologer discoveredupptäckt a claylera discskiva.
62
174830
4735
hittade arkeologer en lerskiva.
03:11
They dateddaterad it from 2000 B.C., so it's 4,000 yearsår oldgammal.
63
179565
4059
Dom daterade skivan till 2 000 år f.Kr.,
så den är 4 000 år gammal.
03:15
Now, there's inscriptionsinskrifter on this discskiva,
64
183624
2004
Det finns inskriptioner på skivan,
men vi vet inte vad de betyder.
03:17
but we actuallyfaktiskt don't know what it meansbetyder.
65
185628
1327
03:18
It's a completekomplett mysterymysterium, but the pointpunkt is that
66
186955
2098
Det är ett mysterium, men poängen är
03:21
this is what informationinformation used to look like
67
189053
1928
att så här brukade information se ut
03:22
4,000 yearsår agosedan.
68
190981
2089
för 4 000 år sedan.
03:25
This is how societysamhälle storedlagrade
69
193070
2548
Detta är hur samhället lagrade
03:27
and transmittedöverförda informationinformation.
70
195618
3524
och överförde information.
03:31
Now, societysamhälle hasn'thar inte advancedAvancerad all that much.
71
199142
4160
Samhället har inte utvecklats så mycket.
03:35
We still storeLagra informationinformation on discsskivor,
72
203302
3474
Vi lagrar fortfarande
information på skivor,
03:38
but now we can storeLagra a lot more informationinformation,
73
206776
3184
men nu kan vi lagra
väldigt mycket mera information,
03:41
more than ever before.
74
209960
1260
mer än någonsin tidigare.
03:43
SearchingSöka it is easierlättare. CopyingKopiera it easierlättare.
75
211220
3093
Det är lättare att söka och kopiera den.
03:46
SharingDela it is easierlättare. ProcessingBearbetning it is easierlättare.
76
214313
3500
Det är lättare att dela och bearbeta den.
03:49
And what we can do is we can reuseåteranvändning this informationinformation
77
217813
2766
Och vi kan återanvända informationen
03:52
for usesanvändningar that we never even imaginedinbillade
78
220579
1834
inom områden vi inte ens drömt om
03:54
when we first collectedsamlade in the datadata.
79
222413
3195
när vi först samlade informationen.
03:57
In this respectrespekt, the datadata has goneborta
80
225608
2252
I detta avseende så har data gått
03:59
from a stockstock to a flowflöde,
81
227860
3532
från ett lager till ett flöde,
04:03
from something that is stationarystationära and staticstatiska
82
231392
3938
från att vara stationärt och statiskt
04:07
to something that is fluidvätska and dynamicdynamisk.
83
235330
3609
till att vara flytande och dynamiskt.
Man kan säga att information
har blivit mer flytande.
04:10
There is, if you will, a liquiditylikviditet to informationinformation.
84
238939
4023
04:14
The discskiva that was discoveredupptäckt off of CreteCrete
85
242962
3474
Skivan som upptäcktes nära Kreta,
04:18
that's 4,000 yearsår oldgammal, is heavytung,
86
246436
3764
som är 4 000 år gammal, är tung,
den lagrar inte så mycket information,
04:22
it doesn't storeLagra a lot of informationinformation,
87
250200
1962
04:24
and that informationinformation is unchangeableoföränderlig.
88
252162
3116
och den informationen är oföränderlig.
04:27
By contrastkontrast, all of the filesfiler
89
255278
4011
Som kontrast kunde alla filerna
04:31
that EdwardEdward SnowdenSnowden tooktog
90
259289
1861
som Edward Snowden tog
04:33
from the NationalNationella SecuritySäkerhet
AgencyByrå in the UnitedUnited StatesStaterna
91
261150
2621
från National Security Agency i USA
04:35
fitspassar on a memoryminne stickpinne
92
263771
2419
få plats på en minnessticka
04:38
the sizestorlek of a fingernailnageln,
93
266190
3010
lika stor som en fingernagel
och den kan delas med ljusets hastighet.
04:41
and it can be shareddelad at the speedfart of lightljus.
94
269200
4745
04:45
More datadata. More.
95
273945
5255
Mer data, mer.
En orsak till att vi har
så mycket data i världen i dag
04:51
Now, one reasonanledning why we have
so much datadata in the worldvärld todayi dag
96
279200
1974
är att vi samlar på saker
04:53
is we are collectingsamlar things
97
281174
1432
04:54
that we'vevi har always collectedsamlade in informationinformation on,
98
282606
3280
som vi alltid samlat information om
04:57
but anotherannan reasonanledning why is we're takingtar things
99
285886
2656
men en annan anledning är att vi tar saker
05:00
that have always been informationalinformativt
100
288542
2812
som alltid haft mycket information
05:03
but have never been renderedåterges into a datadata formatformatera
101
291354
2486
men som aldrig har gjorts i ett dataformat
05:05
and we are puttingsätta it into datadata.
102
293840
2419
och vi lägger till det bland våra data.
05:08
Think, for exampleexempel, the questionfråga of locationplats.
103
296259
3308
Tänk till exempel på frågan om plats.
05:11
Take, for exampleexempel, MartinMartin LutherLuther.
104
299567
2249
Ta till exempel Martin Luther.
05:13
If we wanted to know in the 1500s
105
301816
1597
Om vi på 1500-talet ville veta
05:15
where MartinMartin LutherLuther was,
106
303413
2667
var Martin Luther var,
05:18
we would have to followFölj him at all timesgånger,
107
306080
2092
så behöver vi följa efter honom hela tiden
05:20
maybe with a featheryfjäderlätt quillQuill and an inkwellbläckhorn,
108
308172
2137
kanske med en fjäderpenna
och ett bläckhorn, för att skriva ner det,
05:22
and recordspela in it,
109
310309
1676
men tänk nu på hur det ser ut idag.
05:23
but now think about what it looksutseende like todayi dag.
110
311985
2183
05:26
You know that somewherenågonstans,
111
314168
2122
Du vet att någonstans,
05:28
probablyförmodligen in a telecommunicationstelekommunikationer carrier'sFlygbolagets databasedatabas,
112
316290
2446
antagligen i en teleoperatörs databas,
05:30
there is a spreadsheetkalkylark or at leastminst a databasedatabas entryinträde
113
318736
3036
finns det ett kalkylblad,
eller minst en databaspost
05:33
that recordsuppgifter your informationinformation
114
321772
2088
som sparar din information
05:35
of where you've been at all timesgånger.
115
323860
2063
om var du varit hela tiden.
05:37
If you have a cellcell phonetelefon,
116
325923
1360
Om du har en mobiltelefon
05:39
and that cellcell phonetelefon has GPSGPS,
but even if it doesn't have GPSGPS,
117
327283
2847
och mobiltelefonen har GPS,
men även om den inte har GPS,
05:42
it can recordspela in your informationinformation.
118
330130
2385
så kan den spara din information.
05:44
In this respectrespekt, locationplats has been datafieddatafied.
119
332515
4084
I detta avseende har plats
blivit digitaliserat.
05:48
Now think, for exampleexempel, of the issueproblem of posturehållning,
120
336599
4601
Tänk till exempel på frågan
om kroppshållning,
det sätt som ni alla sitter på just nu,
05:53
the way that you are all sittingSammanträde right now,
121
341200
1285
05:54
the way that you sitsitta,
122
342485
2030
hur du sitter,
05:56
the way that you sitsitta, the way that you sitsitta.
123
344515
2771
hur du sitter, hur du sitter.
Alla sätt är olika
och de beror på din benlängd
05:59
It's all differentannorlunda, and it's a functionfungera of your legbenet lengthlängd
124
347286
2077
06:01
and your back and the contourskonturer of your back,
125
349363
2093
och din rygg och din ryggs konturer,
06:03
and if I were to put sensorssensorer,
maybe 100 sensorssensorer
126
351456
2531
och om jag skulle sätta sensorer,
kanske 100 sensorer
06:05
into all of your chairsstolar right now,
127
353987
1766
på alla era stolar just nu,
06:07
I could createskapa an indexindex that's fairlyganska uniqueunik to you,
128
355753
3600
så skulle jag kunna skapa ett index
som är ganska unikt för dig,
ungefär som ett fingeravtryck,
men som inte är ditt finger.
06:11
sortsortera of like a fingerprintfingeravtryck, but it's not your fingerfinger.
129
359353
4409
06:15
So what could we do with this?
130
363762
2969
Så vad kan vi göra med detta?
06:18
ResearchersForskare in TokyoTokyo are usinganvänder sig av it
131
366731
2397
Forskare i Tokyo använder det
som ett potentiellt stöldskydd till bilar.
06:21
as a potentialpotential anti-theftstöldskydd deviceanordning in carsbilar.
132
369128
4388
06:25
The ideaaning is that the carjackerCarjacker sitssitter behindBakom the wheelhjul,
133
373516
2924
Idén är att biltjuven sitter bakom ratten,
06:28
triesförsök to streamströmma off, but the carbil recognizeskänner igen
134
376440
2104
försöker köra iväg, men bilen känner igen
06:30
that a non-approvedicke godkända driverförare is behindBakom the wheelhjul,
135
378544
2362
att en icke-godkänd förare
sitter bakom ratten,
06:32
and maybe the enginemotor just stopsstopp, unlesssåvida inte you
136
380906
2164
kanske stannar motorn, fram tills du
06:35
typetyp in a passwordlösenord into the dashboardinstrumentpanelen
137
383070
3177
skriver in ett lösenord
på instrumentbrädan
06:38
to say, "Hey, I have authorizationtillstånd to drivekör." Great.
138
386247
4658
för att säga: "Hej,
jag har rätt att köra".
Bra.
Tänk om varje bil i Europa
06:42
What if everyvarje singleenda carbil in EuropeEuropa
139
390905
2553
06:45
had this technologyteknologi in it?
140
393458
1457
hade den här tekniken?
06:46
What could we do then?
141
394915
3165
Vad skulle vi kunna göra då?
06:50
Maybe, if we aggregatedaggregerade the datadata,
142
398080
2240
Om vi kombinerade all data
kanske vi kunde
identifiera varningstecknen
06:52
maybe we could identifyidentifiera telltalekontrollampa signstecken
143
400320
3814
06:56
that bestbäst predictförutspå that a carbil accidentolycka
144
404134
2709
som bäst förutsäger att en bilolycka
06:58
is going to take placeplats in the nextNästa fivefem secondssekunder.
145
406843
5893
kommer att ske inom fem sekunder.
07:04
And then what we will have datafieddatafied
146
412736
2557
Och vad vi då har fastställt
är förartrötthet,
07:07
is driverförare fatiguetrötthet,
147
415293
1783
07:09
and the serviceservice would be when the carbil senseskänner
148
417076
2334
och tjänsten skulle handla om
att bilen känner av
07:11
that the personperson slumpsnedgångar into that positionplacera,
149
419410
3437
att personen tappar sin hållning,
07:14
automaticallyautomatiskt knowsvet, hey, setuppsättning an internalinre alarmlarm
150
422847
3994
automatiskt vet och ställer in
ett internt alarm
som får ratten att vibrera
och tutar inuti bilen för att säga,
07:18
that would vibratevibrera the steeringstyrning wheelhjul, honkHonk insideinuti
151
426841
2025
07:20
to say, "Hey, wakevakna up,
152
428866
1721
"Hallå, vakna upp,
fokusera mera på vägen."
07:22
paybetala more attentionuppmärksamhet to the roadväg."
153
430587
1904
07:24
These are the sortssorterar of things we can do
154
432491
1853
Detta är den typ av saker vi kan göra
07:26
when we datafydatafy more aspectsaspekter of our livesliv.
155
434344
2821
när vi digitaliserar
fler delar av våra liv.
07:29
So what is the valuevärde of bigstor datadata?
156
437165
3675
Så vad är värdet av big data?
07:32
Well, think about it.
157
440840
2190
Tja, tänk på det.
07:35
You have more informationinformation.
158
443030
2412
Vi har mer information.
Vi kan göra saker som inte gick tidigare.
07:37
You can do things that you couldn'tkunde inte do before.
159
445442
3341
07:40
One of the mostmest impressiveimponerande areasområden
160
448783
1676
Ett av det mest imponerande ställen
där detta begrepp vinner mark
07:42
where this conceptbegrepp is takingtar placeplats
161
450459
1729
07:44
is in the areaområde of machinemaskin learninginlärning.
162
452188
3307
är inom området för maskininlärning.
Maskininlärning är den gren
av artificiell intelligens,
07:47
MachineMaskin learninginlärning is a branchgren of artificialartificiell intelligenceintelligens,
163
455495
3077
07:50
whichsom itselfsig is a branchgren of computerdator sciencevetenskap.
164
458572
3378
som i sig är en gren av datavetenskap.
Det går ut på
07:53
The generalallmän ideaaning is that insteadistället of
165
461950
1543
att istället för att instruera en dator
om vad den ska göra,
07:55
instructinginstruera a computerdator what do do,
166
463493
2117
07:57
we are going to simplyhelt enkelt throwkasta datadata at the problemproblem
167
465610
2620
ger vi den helt enkelt data om ett problem
08:00
and tell the computerdator to figurefigur it out for itselfsig.
168
468230
3206
och säger åt datorn
att lista ut lösningen själv.
08:03
And it will help you understandförstå it
169
471436
1777
Det hjälper er att förstå det
08:05
by seeingseende its originsursprung.
170
473213
3552
genom att se källan.
08:08
In the 1950s, a computerdator scientistforskare
171
476765
2388
En datavetare på IBM på 50-talet
08:11
at IBMIBM namedsom heter ArthurArthur SamuelSamuel likedtyckte om to playspela checkerspjäser,
172
479153
3592
som hette Arthur Samuel
gillade att spela dam,
08:14
so he wroteskrev a computerdator programprogram
173
482745
1402
så han skrev ett dataprogram
08:16
so he could playspela againstmot the computerdator.
174
484147
2813
så han kunde spela mot datorn.
08:18
He playedspelade. He wonvann.
175
486960
2711
Han spelade. Han vann.
08:21
He playedspelade. He wonvann.
176
489671
2103
Han spelade. Han vann.
08:23
He playedspelade. He wonvann,
177
491774
3015
Han spelade. Han vann,
08:26
because the computerdator only knewvisste
178
494789
1778
eftersom datorn visste bara
08:28
what a legalrättslig moveflytta was.
179
496567
2227
vad ett giltigt drag var.
08:30
ArthurArthur SamuelSamuel knewvisste something elseannan.
180
498794
2087
Arthur Samuel kunde något annat.
08:32
ArthurArthur SamuelSamuel knewvisste strategystrategi.
181
500881
4629
Arthur Samuel kunde använda strategi.
08:37
So he wroteskrev a smallsmå sub-programdelprogram alongsidetillsammans med it
182
505510
2396
Så han skrev ett mindre underprogram
som arbetade i bakgrunden,
och allt det gjorde var
08:39
operatingrörelse in the backgroundbakgrund, and all it did
183
507906
1974
08:41
was scoregöra the probabilitysannolikhet
184
509880
1817
att poängsätta sannolikheten
08:43
that a givengiven boardstyrelse configurationkonfiguration would likelytroligt leadleda
185
511697
2563
att en viss brädkonfiguration
sannolikt skulle leda
08:46
to a winningvinnande boardstyrelse versusmot a losingförlorande boardstyrelse
186
514260
2910
till ett vinnande bräde
jämfört med ett förlorande bräde
08:49
after everyvarje moveflytta.
187
517170
2508
efter varje drag.
08:51
He playspjäser the computerdator. He winssegrar.
188
519678
3150
Han spelade mot datorn. Han vinner.
08:54
He playspjäser the computerdator. He winssegrar.
189
522828
2508
Han spelade mot datorn. Han vinner.
08:57
He playspjäser the computerdator. He winssegrar.
190
525336
3731
Han spelade mot datorn. Han vinner.
09:01
And then ArthurArthur SamuelSamuel leaveslöv the computerdator
191
529067
2277
Sedan lämnar Arthur Samuel datorn
09:03
to playspela itselfsig.
192
531344
2227
så den spelar mot sig själv.
09:05
It playspjäser itselfsig. It collectssamlar more datadata.
193
533571
3509
Den spelar själv. Den samlar mer data.
09:09
It collectssamlar more datadata. It increasesökar
the accuracynoggrannhet of its predictionförutsägelse.
194
537080
4309
Den samlar mer data.
Den ökar noggrannheten
i dess förutsägelser.
Sedan går Arthur Samuel
tillbaka till datorn
09:13
And then ArthurArthur SamuelSamuel goesgår back to the computerdator
195
541389
2104
09:15
and he playspjäser it, and he losesförlorar,
196
543493
2318
och spelar själv mot den,
och han förlorar.
09:17
and he playspjäser it, and he losesförlorar,
197
545811
2069
och han spelar, och han förlorar,
09:19
and he playspjäser it, and he losesförlorar,
198
547880
2047
och han spelar, och han förlorar,
09:21
and ArthurArthur SamuelSamuel has createdskapad a machinemaskin
199
549927
2599
och Arthur Samuel har skapat en maskin
09:24
that surpassesöverträffar his abilityförmåga in a taskuppgift that he taughtlärde it.
200
552526
6288
som överträffar hans förmåga
i en uppgift som han lärde den.
09:30
And this ideaaning of machinemaskin learninginlärning
201
558814
2498
Och maskininlärning
09:33
is going everywhereöverallt.
202
561312
3927
kommer att finnas överallt.
09:37
How do you think we have self-drivingsjälvkörande carsbilar?
203
565239
3149
Hur tror du att vi har fått
självkörande bilar?
09:40
Are we any better off as a societysamhälle
204
568388
2137
Är vi ett bättre samhälle
09:42
enshriningförankra all the rulesregler of the roadväg into softwareprogramvara?
205
570525
3285
för att vi lägger in
alla trafikregler i mjukvara? Nej.
09:45
No. MemoryMinne is cheaperbilligare. No.
206
573810
2598
Minne är billigt. Nej.
09:48
AlgorithmsAlgoritmer are fastersnabbare. No. ProcessorsProcessorer are better. No.
207
576408
3994
Algoritmerna är snabbare. Nej.
Processorerna är bättre. Nej.
Dom sakerna gör skillnad,
men det är inte därför.
09:52
All of those things mattermateria, but that's not why.
208
580402
2772
09:55
It's because we changedändrats the naturenatur of the problemproblem.
209
583174
3141
Det är för att vi ändrat problemets natur.
Vi ändrade problemets art
från en där vi försökt
09:58
We changedändrats the naturenatur of the problemproblem from one
210
586315
1530
09:59
in whichsom we triedförsökte to overtlyöppet and explicitlyuttryckligen
211
587845
2245
att öppet och tydligt förklara
för datorn hur man kör
10:02
explainförklara to the computerdator how to drivekör
212
590090
2581
till en där vi säger,
10:04
to one in whichsom we say,
213
592671
1316
10:05
"Here'sHär är a lot of datadata around the vehiclefordon.
214
593987
1876
"Här är en massa data om fordonet.
10:07
You figurefigur it out.
215
595863
1533
Du kan räkna ut det.
10:09
You figurefigur it out that that is a traffictrafik lightljus,
216
597396
1867
Räkna ut att det finns ett trafikljus,
10:11
that that traffictrafik lightljus is redröd and not greengrön,
217
599263
2081
att trafikljuset är rött och inte grönt,
att det betyder att du måste stanna
10:13
that that meansbetyder that you need to stop
218
601344
2014
10:15
and not go forwardfram-."
219
603358
3083
och inte köra framåt."
10:18
MachineMaskin learninginlärning is at the basisgrund
220
606441
1518
Maskininlärning är grunden
10:19
of manymånga of the things that we do onlineuppkopplad:
221
607959
1991
till många saker vi gör online:
10:21
searchSök enginesmotorer,
222
609950
1857
sökmotorer,
10:23
Amazon'sAmazons personalizationpersonalisering algorithmalgoritm,
223
611807
3801
Amazons algoritm för personalisering,
10:27
computerdator translationöversättning,
224
615608
2212
datoröversättning,
röstigenkänningssystem.
10:29
voiceröst recognitionerkännande systemssystem.
225
617820
4290
10:34
ResearchersForskare recentlynyligen have lookedtittade at
226
622110
2835
Forskare har nyligen kollat på
10:36
the questionfråga of biopsiesbiopsier,
227
624945
3195
frågan om biopsier,
cancerbiopsier
10:40
cancerouscancerogena biopsiesbiopsier,
228
628140
2767
och dom bad en dator att identifiera,
10:42
and they'vede har askedfrågade the computerdator to identifyidentifiera
229
630907
2315
10:45
by looking at the datadata and survivalöverlevnad ratespriser
230
633222
2471
genom att se på data
och överlevnadsstatistik
10:47
to determinebestämma whetherhuruvida cellsceller are actuallyfaktiskt
231
635693
4667
för att bedöma om celler är
10:52
cancerouscancerogena or not,
232
640360
2544
drabbade av cancer eller inte,
och visst, när man kastar data på den
10:54
and sure enoughtillräckligt, when you throwkasta the datadata at it,
233
642904
1778
genom en algoritm för maskininlärning
10:56
throughgenom a machine-learningMaskininlärning algorithmalgoritm,
234
644682
2047
10:58
the machinemaskin was ablestånd to identifyidentifiera
235
646729
1877
så kunde datorn identifiera
de 12 varningssignalerna
som bäst förutspådde
11:00
the 12 telltalekontrollampa signstecken that bestbäst predictförutspå
236
648606
2262
11:02
that this biopsybiopsi of the breastbröst cancercancer cellsceller
237
650868
3299
att biopsin av bröstcancerceller
11:06
are indeedverkligen cancerouscancerogena.
238
654167
3218
verkligen är cancer.
11:09
The problemproblem: The medicalmedicinsk literaturelitteratur
239
657385
2498
Problemet var att medicinsk facklitteratur
11:11
only knewvisste ninenio of them.
240
659883
2789
bara kände till nio av dom.
11:14
ThreeTre of the traitsdrag were onesettor
241
662672
1800
Tre av egenskaperna var sådana
11:16
that people didn't need to look for,
242
664472
2975
som folk inte behövde leta efter,
men som datorn upptäckte.
11:19
but that the machinemaskin spottedFläckig.
243
667447
5531
11:24
Now, there are darkmörk sidessidor to bigstor datadata as well.
244
672978
5925
Men det finns också
mörka sidor av big data
Den förbättrar våra liv,
men det finns problem
11:30
It will improveförbättra our livesliv, but there are problemsproblem
245
678903
2074
11:32
that we need to be consciousmedveten of,
246
680977
2640
som vi måste vara medvetna om,
och den första är tanken
11:35
and the first one is the ideaaning
247
683617
2623
att vi kan straffas för förutsägelser,
11:38
that we mayMaj be punishedstraffas for predictionsförutsägelser,
248
686240
2686
11:40
that the policepolis mayMaj use bigstor datadata for theirderas purposessyften,
249
688926
3870
att polisen får använda
big data för sina syften,
11:44
a little bitbit like "MinorityMinoriteten ReportRapport."
250
692796
2351
lite som i "Minority Report."
Det finns en term som kallas
för prediktivt polisarbete,
11:47
Now, it's a termtermin calledkallad predictiveprediktiva policingpolisarbete,
251
695147
2441
11:49
or algorithmicalgoritmisk criminologykriminologi,
252
697588
2363
eller algoritmisk kriminologi,
och idén är att om vi tar en massa data,
11:51
and the ideaaning is that if we take a lot of datadata,
253
699951
2036
11:53
for exampleexempel where pastdåtid crimesbrott have been,
254
701987
2159
till exempel om
var tidigare brott har skett,
11:56
we know where to sendskicka the patrolspatruller.
255
704146
2543
vet vi vart vi ska skicka patruller.
11:58
That makesgör sensekänsla, but the problemproblem, of coursekurs,
256
706689
2115
Det är vettigt, men problemet
är naturligtvis
12:00
is that it's not simplyhelt enkelt going to stop on locationplats datadata,
257
708804
4544
att det inte bara kommer
att stanna vid platsuppgifter,
12:05
it's going to go down to the levelnivå of the individualenskild.
258
713348
2959
det kommer att gå ner till individnivå.
12:08
Why don't we use datadata about the person'spersons
259
716307
2250
Varför använder vi inte uppgifter
om personens gymnasiebetyg?
12:10
highhög schoolskola transcriptavskrift?
260
718557
2228
Vi kanske ska använda det faktum
12:12
Maybe we should use the factfaktum that
261
720785
1561
att de är arbetslösa eller inte,
deras kreditvärdering,
12:14
they're unemployedarbetslös or not, theirderas creditkreditera scoregöra,
262
722346
2028
12:16
theirderas web-surfingweb-surfing behaviorbeteende,
263
724374
1552
deras beteende på internet,
12:17
whetherhuruvida they're up latesent at night.
264
725926
1878
huruvida de är uppe sent på natten.
Deras fitnessklocka,
när den kan kontrollera biokemin,
12:19
TheirDeras FitbitFitbit, when it's ablestånd
to identifyidentifiera biochemistrieslevervärden,
265
727804
3161
12:22
will showshow that they have aggressiveaggressiv thoughtstankar.
266
730965
4236
kommer visa att de har
aggressiva tankar.
Vi kan ha algoritmer
som sannolikt kommer förutse
12:27
We mayMaj have algorithmsalgoritmer that are likelytroligt to predictförutspå
267
735201
2221
12:29
what we are about to do,
268
737422
1633
vad vi kommer att göra,
12:31
and we mayMaj be heldhållen accountableansvarig
269
739055
1244
och vi kan hållas ansvariga
innan vi faktiskt har agerat.
12:32
before we'vevi har actuallyfaktiskt actedagerat.
270
740299
2590
Sekretess var den centrala utmaningen
12:34
PrivacySekretess was the centralcentral challengeutmaning
271
742889
1732
12:36
in a smallsmå datadata eraepok.
272
744621
2880
i eran av små datamängder.
12:39
In the bigstor datadata ageålder,
273
747501
2149
I big data-åldern är utmaningen
12:41
the challengeutmaning will be safeguardingskydda freefri will,
274
749650
4523
att värna om den fria viljan,
12:46
moralmoralisk choiceval, humanmänsklig volitionVolition,
275
754173
3779
moraliskt val, mänsklig vilja,
12:49
humanmänsklig agencybyrå.
276
757952
3068
mänsklig inverkan.
12:54
There is anotherannan problemproblem:
277
762540
2225
Det finns ett problem till:
12:56
BigStora datadata is going to stealstjäla our jobsjobb.
278
764765
3556
Big data kommer att stjäla våra jobb.
13:00
BigStora datadata and algorithmsalgoritmer are going to challengeutmaning
279
768321
3512
Big data och algoritmer kommer att utmana
13:03
whitevit collarkrage, professionalprofessionell knowledgekunskap work
280
771833
3061
tjänstemäns yrkesmässiga kunskapsarbete
13:06
in the 21stst centuryårhundrade
281
774894
1653
på 2000-talet
på samma sätt som fabriksautomation
13:08
in the samesamma way that factoryfabrik automationAutomation
282
776547
2434
13:10
and the assemblyhopsättning linelinje
283
778981
2189
och monteringslinjen
13:13
challengedutmanade blueblå collarkrage laborarbetskraft in the 20thth centuryårhundrade.
284
781170
3026
utmanade industriarbetaren på 1900-talet.
13:16
Think about a lablabb techniciantekniker
285
784196
2092
Tänk på labbteknikern
13:18
who is looking throughgenom a microscopemikroskopet
286
786288
1409
som tittar genom ett mikroskop
13:19
at a cancercancer biopsybiopsi
287
787697
1624
på en cancerbiopsi
13:21
and determiningbestämmande whetherhuruvida it's cancerouscancerogena or not.
288
789321
2637
och bestämmer om det är cancer eller inte.
13:23
The personperson wentåkte to universityuniversitet.
289
791958
1972
Personen har gått på universitetet.
13:25
The personperson buysköper propertyfast egendom.
290
793930
1430
Personen köper egendom.
13:27
He or she votesröster.
291
795360
1741
Han eller hon röstar.
13:29
He or she is a stakeholderintressenter in societysamhälle.
292
797101
3666
Han eller hon är nu en samhällsaktör.
13:32
And that person'spersons jobjobb,
293
800767
1394
Och den personens jobb,
13:34
as well as an entirehel fleetflotta
294
802161
1609
samt en hel flotta
13:35
of professionalsyrkesverksamma like that personperson,
295
803770
1969
av proffs som den personen,
13:37
is going to find that theirderas jobsjobb are radicallyradikalt changedändrats
296
805739
3150
kommer att finna att deras jobb
har förändrats radikalt
13:40
or actuallyfaktiskt completelyfullständigt eliminatedutslagen.
297
808889
2357
eller faktiskt helt elimineras.
13:43
Now, we like to think
298
811246
1284
Vi vill gärna tro
13:44
that technologyteknologi createsskapar jobsjobb over a periodperiod of time
299
812530
3187
att tekniken skapar arbetstillfällen
under en tid efter
13:47
after a shortkort, temporarytemporär periodperiod of dislocationdislokation,
300
815717
3465
en kort, tillfällig period av störning,
13:51
and that is truesann for the frameram of referencereferens
301
819182
1941
och det är sant för den referensram
som vi alla lever i,
den industriella revolutionen,
13:53
with whichsom we all liveleva, the IndustrialIndustriella RevolutionRevolutionen,
302
821123
2142
13:55
because that's preciselyexakt what happenedhände.
303
823265
2328
för det är precis vad som hände.
Men vi glömmer något i den analysen:
13:57
But we forgetglömma something in that analysisanalys:
304
825593
2333
13:59
There are some categorieskategorier of jobsjobb
305
827926
1830
Det finns vissa kategorier av jobb
14:01
that simplyhelt enkelt get eliminatedutslagen and never come back.
306
829756
3420
som helt enkelt försvinner
och aldrig kommer tillbaka.
Den industriella revolutionen
14:05
The IndustrialIndustriella RevolutionRevolutionen wasn'tvar inte very good
307
833176
2004
var inte särskilt bra för hästar.
14:07
if you were a horsehäst.
308
835180
4002
14:11
So we're going to need to be carefulförsiktig
309
839182
2055
Så vi måste vara försiktiga
14:13
and take bigstor datadata and adjustjustera it for our needsbehov,
310
841237
3514
och ta big data och anpassa den
efter våra behov,
14:16
our very humanmänsklig needsbehov.
311
844751
3185
våra väldigt mänskliga behov.
14:19
We have to be the masterbemästra of this technologyteknologi,
312
847936
1954
Vi måste vara herre över denna teknik,
14:21
not its servanttjänare.
313
849890
1656
inte dess tjänare.
Vi är bara i början av big data-eran,
14:23
We are just at the outsetbörjan of the bigstor datadata eraepok,
314
851546
2958
14:26
and honestlyärligt, we are not very good
315
854504
3150
och ärligt talat så är vi inte så bra
14:29
at handlinghantering all the datadata that we can now collectsamla.
316
857654
4207
på att hantera all den data
som vi nu samlar in.
Det är inte bara ett problem
för National Security Agency.
14:33
It's not just a problemproblem for
the NationalNationella SecuritySäkerhet AgencyByrå.
317
861861
3330
14:37
BusinessesFöretag collectsamla lots of
datadata, and they misusemissbruk it too,
318
865191
3038
Företagen samlar massor av data,
och de missbrukar den också,
14:40
and we need to get better at
this, and this will take time.
319
868229
3667
och vi måste bli bättre på detta,
och det kommer att ta tid.
14:43
It's a little bitbit like the challengeutmaning that was facedinför
320
871896
1822
Det är lite som utmaningen
när den primitiva människan mötte eld.
14:45
by primitiveprimitiv man and firebrand.
321
873718
2407
Detta är ett verktyg, men ett verktyg
14:48
This is a toolverktyg, but this is a toolverktyg that,
322
876125
1885
som om det inte hanteras försiktigt
kommer att skada oss.
14:50
unlesssåvida inte we're carefulförsiktig, will burnbränna us.
323
878010
3559
14:56
BigStora datadata is going to transformomvandla how we liveleva,
324
884008
3120
Big data kommer omvandla hur vi lever,
14:59
how we work and how we think.
325
887128
2801
hur vi arbetar och hur vi tänker.
15:01
It is going to help us managehantera our careerskarriärer
326
889929
1889
Det kommer hjälpa oss hantera våra karriär
15:03
and leadleda livesliv of satisfactiontillfredsställelse and hopehoppas
327
891818
3634
och leva liv som innehåller
tillfredsställelse och hopp,
15:07
and happinesslycka and healthhälsa,
328
895452
2992
lycka och hälsa,
15:10
but in the pastdåtid, we'vevi har oftenofta
lookedtittade at informationinformation technologyteknologi
329
898444
3306
men i det förflutna har vi ofta
sett på informationsteknik
15:13
and our eyesögon have only seensett the T,
330
901750
2208
och vi har bara sett T:et,
15:15
the technologyteknologi, the hardwarehårdvara,
331
903958
1686
tekniken, hårdvaran,
15:17
because that's what was physicalfysisk.
332
905644
2262
eftersom det är vad som fanns fysiskt
Nu måste vi rikta blicken mot I:et,
15:19
We now need to recastomarbetning our gazeblicken at the I,
333
907906
2924
15:22
the informationinformation,
334
910830
1380
informationen,
vilken är mindre uppenbart,
15:24
whichsom is lessmindre apparentuppenbara,
335
912210
1373
15:25
but in some wayssätt a lot more importantViktig.
336
913583
4109
men på vissa sätt mycket viktigare.
15:29
HumanityMänskligheten can finallytill sist learnlära sig from the informationinformation
337
917692
3465
Mänskligheten kan äntligen
lära sig saker från informationen
15:33
that it can collectsamla,
338
921157
2418
som den samlar in,
15:35
as partdel of our timelesstidlös questQuest
339
923575
2115
som en del i ett tidlöst uppdrag
15:37
to understandförstå the worldvärld and our placeplats in it,
340
925690
3159
att förstå världen och vår plats i den,
15:40
and that's why bigstor datadata is a bigstor dealhandla.
341
928849
5631
och det är därför big data är en stor sak.
(Applåder)
15:46
(ApplauseApplåder)
342
934480
3568
Translated by Annika Bidner
Reviewed by Lisbeth Pekkari

▲Back to top

ABOUT THE SPEAKER
Kenneth Cukier - Data Editor of The Economist
Kenneth Cukier is the Data Editor of The Economist. From 2007 to 2012 he was the Tokyo correspondent, and before that, the paper’s technology correspondent in London, where his work focused on innovation, intellectual property and Internet governance. Kenneth is also the co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think with Viktor Mayer-Schönberger in 2013, which was a New York Times Bestseller and translated into 16 languages.

Why you should listen

As Data Editor of The Economist and co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think, Kenneth Cukier has spent years immersed in big data, machine learning -- and the impact of both. What's the future of big data-driven technology and design? To find out, watch this talk.

More profile about the speaker
Kenneth Cukier | Speaker | TED.com