ABOUT THE SPEAKER
Shyam Sankar - Data Intelligence Agent
An advocate of human-computer symbiosis, Shyam Sankar looks for clues in big and disparate data sets.

Why you should listen

Shyam Sankar is a Director at Palantir Technologies, a secretive Silicon Valley company where he oversees deployments of the company's core technology, which helps law enforcement teams and corporations analyze giant, unrelated databases for clues to potential ... anything. Palantir technologies has been used to find missing children, to detect banking fraud, and to uncover the Shadow Network, a cyber-spy ring that stooped so low as to hack the Dalai Lama's email.

As part of his work, Sankar thinks deeply about the place where human and machine intelligence meet. While artificial intelligence (AI) is the dominant paradigm, he is an advocate of JCR Licklider's "intelligence augmentation" (IA) approach, where algorithms and brains work together to solve problems.

More profile about the speaker
Shyam Sankar | Speaker | TED.com
TEDGlobal 2012

Shyam Sankar: The rise of human-computer cooperation

希亚姆·桑卡尔:人机合作的崛起

Filmed:
947,418 views

计算力的蛮力不能单独解决世界上的问题。数据挖掘技术的创新者希亚姆·桑卡尔解释了为什么解决重大问题(如恐怖分子或识别隐藏的巨大的发展趋势)不等同于寻找一个正确的算法,而是寻求正确的计算机和人类创造力之间的共生关系。
- Data Intelligence Agent
An advocate of human-computer symbiosis, Shyam Sankar looks for clues in big and disparate data sets. Full bio

Double-click the English transcript below to play the video.

00:16
I'd like to tell you about two games游戏 of chess.
0
512
2556
我想告诉你们两场象棋比赛。
00:18
The first happened发生 in 1997, in which哪一个 Garry加里 Kasparov卡斯帕罗夫,
1
3068
3864
一场发生在1997年,卡斯帕罗夫,
00:22
a human人的, lost丢失 to Deep Blue蓝色, a machine.
2
6932
3716
一个人类, 输给了‘深蓝’,一部机器。
00:26
To many许多, this was the dawn黎明 of a new era时代,
3
10648
2240
对许多人来说,这是一个新时代的黎明,
00:28
one where man would be dominated占主导地位 by machine.
4
12888
2779
一个人被机器统治的时代。
00:31
But here we are, 20 years年份 on, and the greatest最大 change更改
5
15667
3334
但现在的我们,20年已经过去了,而最能改变
00:34
in how we relate涉及 to computers电脑 is the iPadiPad的,
6
19001
2690
我们与电脑之间关系的是IPAD,
00:37
not HALHAL.
7
21691
2045
不是 HAL。
00:39
The second第二 game游戏 was a freestyle自由泳 chess tournament比赛
8
23736
2648
第二场是自由式国际象棋锦标赛
00:42
in 2005, in which哪一个 man and machine could enter输入 together一起
9
26384
2969
在2005年,人类与机器可以一起进入比赛
00:45
as partners伙伴, rather than adversaries对手, if they so chose选择.
10
29353
4666
以合作伙伴的身份,而不是敌人,如果他们这样选择。
00:49
At first, the results结果 were predictable可预测.
11
34019
1851
起初,结果是可以预测的。
00:51
Even a supercomputer超级计算机 was beaten殴打 by a grandmaster棋圣
12
35870
2497
即使是一台超级计算机也会输给特级大师
00:54
with a relatively相对 weak laptop笔记本电脑.
13
38367
2312
和一台相对较弱的便携式计算机。
00:56
The surprise came来了 at the end结束. Who won韩元?
14
40679
2985
可结局令人惊讶。谁赢了?
00:59
Not a grandmaster棋圣 with a supercomputer超级计算机,
15
43664
2776
不是使用超级计算机的大师,
01:02
but actually其实 two American美国 amateurs业余
16
46440
1493
而实际上是两个美国业余选手
01:03
using运用 three relatively相对 weak laptops笔记本电脑.
17
47933
3822
和他们使用的三台相对较弱的笔记本电脑。
01:07
Their ability能力 to coach教练 and manipulate操作 their computers电脑
18
51755
2596
他们有能力知道和操纵他们的计算机
01:10
to deeply explore探索 specific具体 positions位置
19
54351
2435
从而深入探索具体的位置
01:12
effectively有效 counteracted抵消 the superior优越 chess knowledge知识
20
56786
2390
以有效的方法抵消
01:15
of the grandmasters特级大师 and the superior优越 computational计算 power功率
21
59176
2609
大师和卓越计算的优越的国际象棋知识
01:17
of other adversaries对手.
22
61785
1909
和其他对手。
01:19
This is an astonishing惊人 result结果: average平均 men男人,
23
63694
2905
这是一个令人吃惊的结果: 普通男性,
01:22
average平均 machines beating跳动 the best最好 man, the best最好 machine.
24
66599
4081
一般的计算机击败最好的人和最好的机器。
01:26
And anyways无论如何, isn't it supposed应该 to be man versus machine?
25
70680
3199
不管怎么说,不应该是机器于人对战吗?
01:29
Instead代替, it's about cooperation合作, and the right type类型 of cooperation合作.
26
73879
4152
相反,它是关于合作和正确的合作方式。
01:33
We've我们已经 been paying付款 a lot of attention注意 to Marvin马文 Minsky's明斯基
27
78031
2857
近 50 年,我们一直集中大量的精力到 Marvin Minsky
01:36
vision视力 for artificial人造 intelligence情报 over the last 50 years年份.
28
80888
3242
的人工智能的愿景。
01:40
It's a sexy性感的 vision视力, for sure. Many许多 have embraced拥抱 it.
29
84130
2262
它是一个性感的远景,这是肯定的。很多人已经接受它了。
01:42
It's become成为 the dominant优势 school学校 of thought in computer电脑 science科学.
30
86392
2753
它已成为计算机科学的主流学派。
01:45
But as we enter输入 the era时代 of big data数据, of network网络 systems系统,
31
89145
3072
但是,当我们进入了大数据的时代、 网络系统、
01:48
of open打开 platforms平台, and embedded嵌入式 technology技术,
32
92217
2698
开放平台和嵌入式技术,
01:50
I'd like to suggest建议 it's time to reevaluate重新评估 an alternative替代 vision视力
33
94915
3392
我想建议是重新评估另一个的远景的时候了
01:54
that was actually其实 developed发达 around the same相同 time.
34
98307
3070
这实际上是大约在同一时间进行开发的。
01:57
I'm talking about J.C.R. Licklider's利克莱德的 human-computer人机 symbiosis合作关系,
35
101377
3332
我讨论的是 J.C.R.Licklider 的人机共生,
02:00
perhaps也许 better termed被称为 "intelligence情报 augmentation增强," I.A.
36
104709
3808
或许更好地被称为"智能强化"一I.A.
02:04
Licklider利克莱德 was a computer电脑 science科学 titan泰坦 who had a profound深刻
37
108517
2640
Licklider 是一位计算机科学巨人
02:07
effect影响 on the development发展 of technology技术 and the Internet互联网.
38
111157
3006
他对技术和互联网发展有非常深刻的影响。
02:10
His vision视力 was to enable启用 man and machine to cooperate合作
39
114163
2868
他的设想是,使人与机器进行合作
02:12
in making制造 decisions决定, controlling控制 complex复杂 situations情况
40
117031
3590
从而作出决定,控制复杂的情况
02:16
without the inflexible呆板 dependence依赖
41
120621
1770
而不是死板的依赖
02:18
on predetermined预定 programs程式.
42
122391
2533
于预先设定的程序。
02:20
Note注意 that word "cooperate合作."
43
124924
2498
请注意,这个词语"合作"。
02:23
Licklider利克莱德 encourages鼓励 us not to take a toaster烤面包机
44
127422
2747
Licklider 鼓励我们不是用一个烤面包机
02:26
and make it Data数据 from "Star Trek跋涉,"
45
130169
2284
并使其变成《 星际迷航 》中的科技,
02:28
but to take a human人的 and make her more capable.
46
132453
3535
而要采取一个人,并使她更有能力。
02:31
Humans人类 are so amazing惊人 -- how we think,
47
135988
1911
人类如此惊人 — 我们的思维
02:33
our non-linear非线性 approaches方法, our creativity创造力,
48
137899
2618
我们的非线形方法,我们的创造力,
02:36
iterative迭代 hypotheses假设, all very difficult if possible可能 at all
49
140517
2131
迭代的假设,都很难
02:38
for computers电脑 to do.
50
142648
1345
让计算机做到类似的事。
02:39
Licklider利克莱德 intuitively直观地 realized实现 this, contemplating考虑 humans人类
51
143993
2452
Licklider 直观地认识了这一点,考虑人类
02:42
setting设置 the goals目标, formulating制定 the hypotheses假设,
52
146445
2327
设定目标,提出假说,
02:44
determining决定 the criteria标准, and performing执行 the evaluation评测.
53
148772
3376
确定的标准,并进行评价。
02:48
Of course课程, in other ways方法, humans人类 are so limited有限.
54
152148
1775
当然,在其他方面,人类是如此有限。
02:49
We're terrible可怕 at scale规模, computation计算 and volume.
55
153923
3235
我们在大规模、 计算和容量方面做得很遭。
02:53
We require要求 high-end高端 talent天赋 management管理
56
157158
1836
我们需要高端的人才管理
02:54
to keep the rock band together一起 and playing播放.
57
158994
2064
以保持摇滚乐队一起演奏。
02:56
Licklider利克莱德 foresaw预见 computers电脑 doing all the routinizableroutinizable work
58
161058
2204
Licklider 预见到所有的程序化的工作可以由计算机完成
02:59
that was required需要 to prepare准备 the way for insights见解 and decision决定 making制造.
59
163262
3276
这需要预先准备目标和决策的方法。
03:02
Silently默默, without much fanfare大张旗鼓,
60
166538
2224
安静得,没有大张旗鼓,
03:04
this approach途径 has been compiling编译 victories胜利 beyond chess.
61
168762
3354
这种做法已经超越了象棋的胜利。
03:08
Protein蛋白 folding折页, a topic话题 that shares分享 the incredible难以置信 expansiveness豪爽 of chess
62
172116
3356
蛋白质排列,一个同样令人难以置信的广阔的国际象棋的话题 — —
03:11
there are more ways方法 of folding折页 a protein蛋白 than there are atoms原子 in the universe宇宙.
63
175472
3042
蛋白质排列方式要比在宇宙中的原子更多。
03:14
This is a world-changing改变世界的 problem问题 with huge巨大 implications启示
64
178514
2353
这对改变世界问题启示了
03:16
for our ability能力 to understand理解 and treat对待 disease疾病.
65
180867
2308
我们有能力了解和治疗疾病。
03:19
And for this task任务, supercomputer超级计算机 field领域 brute畜生 force simply只是 isn't enough足够.
66
183175
4248
而对于这个任务,只有超级计算机的蛮力还不够。
03:23
Foldit折起来, a game游戏 created创建 by computer电脑 scientists科学家们,
67
187423
2384
Foldit,计算机科学家创建的一个游戏,
03:25
illustrates说明 the value of the approach途径.
68
189807
2502
说明了这个方法的价值。
03:28
Non-technical非技术, non-biologist非生物学家 amateurs业余 play a video视频 game游戏
69
192309
3041
非技术性、 非生物学家业余玩的视频游戏
03:31
in which哪一个 they visually视觉 rearrange改编 the structure结构体 of the protein蛋白,
70
195350
3073
在其中他们直观地重新排列蛋白质的结构,
03:34
allowing允许 the computer电脑 to manage管理 the atomic原子 forces军队
71
198423
1499
允许此计算机管理原子的力量
03:35
and interactions互动 and identify鉴定 structural结构 issues问题.
72
199922
2957
和互动,并识别结构问题。
03:38
This approach途径 beat击败 supercomputers超级计算机 50 percent百分 of the time
73
202879
3023
这种方法以50%的几率击败了超级计算机
03:41
and tied 30 percent百分 of the time.
74
205902
2584
以30%的几率战平。
03:44
Foldit折起来 recently最近 made制作 a notable显着 and major重大的 scientific科学 discovery发现
75
208486
3137
Foldit最近取得一个显著并重大的科学发现
03:47
by deciphering破译 the structure结构体 of the Mason-Pfizer梅森辉瑞 monkey virus病毒.
76
211623
3160
它破译梅森辉瑞猴病毒的结构。
03:50
A protease蛋白酶 that had eluded躲避 determination决心 for over 10 years年份
77
214783
3015
一种躲避测定十多年的蛋白酶
03:53
was solved解决了 was by three players玩家 in a matter of days,
78
217798
2626
被三名球员在仅仅几天时间就解决了,
03:56
perhaps也许 the first major重大的 scientific科学 advance提前
79
220424
2025
也许这是第一次重大科学进展
03:58
to come from playing播放 a video视频 game游戏.
80
222449
2323
源于玩视频游戏。
04:00
Last year, on the site现场 of the Twin双胞胎 Towers,
81
224772
2181
去年,该站点的双子塔,
04:02
the 9/11 memorial纪念馆 opened打开.
82
226953
1473
9/11 纪念馆开幕。
04:04
It displays显示器 the names of the thousands数千 of victims受害者
83
228426
2721
它显示了数千名受害者的名称
04:07
using运用 a beautiful美丽 concept概念 called "meaningful富有意义的 adjacency邻接."
84
231147
3063
通过一个美丽的概念称为"有意义的邻接"。
04:10
It places地方 the names next下一个 to each other based基于 on their
85
234210
2166
它把他们的名字彼此相邻的安排在一起,根据
04:12
relationships关系 to one another另一个: friends朋友, families家庭, coworkers合作伙伴.
86
236376
2213
从一个到另一个人的关系: 朋友、 家人、 同事。
04:14
When you put it all together一起, it's quite相当 a computational计算
87
238589
3028
当你把它放在一起时,这是相当大的计算
04:17
challenge挑战: 3,500 victims受害者, 1,800 adjacency邻接 requests要求,
88
241617
4223
挑战:3,500名 受害者、 1,800名邻接请求,
04:21
the importance重要性 of the overall总体 physical物理 specifications规格
89
245840
3092
整体物理属性的重要性
04:24
and the final最后 aesthetics美学.
90
248932
2137
和最后的审美。
04:26
When first reported报道 by the media媒体, full充分 credit信用 for such这样 a feat功绩
91
251069
2615
当第一次被媒体报道时,这件壮举完全归功
04:29
was given特定 to an algorithm算法 from the New York纽约 City
92
253684
1892
给了纽约
04:31
design设计 firm公司 Local本地 Projects项目. The truth真相 is a bit more nuanced细致入微.
93
255576
4001
本地的设计公司设计的运算法则。事实真相更为微妙。
04:35
While an algorithm算法 was used to develop发展 the underlying底层 framework骨架,
94
259577
2871
虽然一种运算法则被用来开发基本框架,
04:38
humans人类 used that framework骨架 to design设计 the final最后 result结果.
95
262448
3008
人类利用这一框架来设计最终的结果。
04:41
So in this case案件, a computer电脑 had evaluated评估 millions百万
96
265456
2225
所以在这种情况下,计算机已评估了数百万种
04:43
of possible可能 layouts布局, managed管理 a complex复杂 relational相关的 system系统,
97
267681
3335
可能的布局, 管理一个复杂的关系系统,
04:46
and kept不停 track跟踪 of a very large set of measurements测量
98
271016
2414
和跟踪大量测量数据
04:49
and variables变量, allowing允许 the humans人类 to focus焦点
99
273430
2410
和变量,使人类能够专注于
04:51
on design设计 and compositional成分 choices选择.
100
275840
2802
设计和组合的选择。
04:54
So the more you look around you,
101
278642
1036
所以你越常环顾你的周围,
04:55
the more you see Licklider's利克莱德的 vision视力 everywhere到处.
102
279678
1962
在各个地方,您越常看到 Licklider 的愿景。
04:57
Whether是否 it's augmented增强 reality现实 in your iPhone苹果手机 or GPS全球定位系统 in your car汽车,
103
281640
3304
无论是已经现实在你的iPhone的技术或在你车上的GPS的技术,
05:00
human-computer人机 symbiosis合作关系 is making制造 us more capable.
104
284944
2970
人机共生使我们更有能力。
05:03
So if you want to improve提高 human-computer人机 symbiosis合作关系,
105
287914
1655
因此,如果您想要改善人机共生
05:05
what can you do?
106
289569
1429
你可以做什么?
05:06
You can start开始 by designing设计 the human人的 into the process处理.
107
290998
2452
您可以从将人设计到过程中开始。
05:09
Instead代替 of thinking思维 about what a computer电脑 will do to solve解决 the problem问题,
108
293450
2204
而不是思考如何让计算机解决问题,
05:11
design设计 the solution around what the human人的 will do as well.
109
295654
3869
围绕着人去设计结局方案。
05:15
When you do this, you'll你会 quickly很快 realize实现 that you spent花费
110
299523
1937
当您执行此操作时,您很快就会发现你花了
05:17
all of your time on the interface接口 between之间 man and machine,
111
301460
2879
你所有的时间上在人和机器之间的接口上,
05:20
specifically特别 on designing设计 away the friction摩擦 in the interaction相互作用.
112
304339
3099
特别是关于设计互动中的摩擦。
05:23
In fact事实, this friction摩擦 is more important重要 than the power功率
113
307438
2766
事实上,这种冲突比
05:26
of the man or the power功率 of the machine
114
310204
2052
人或机器的力量更重要,
05:28
in determining决定 overall总体 capability能力.
115
312256
1931
从整体能力上讲。
05:30
That's why two amateurs业余 with a few少数 laptops笔记本电脑
116
314187
1977
这就是为什么几个笔记本电脑和两个业余选手
05:32
handily便利地 beat击败 a supercomputer超级计算机 and a grandmaster棋圣.
117
316164
2456
轻松击败了一台超级计算机和特级大师。
05:34
What Kasparov卡斯帕罗夫 calls电话 process处理 is a byproduct副产品 of friction摩擦.
118
318620
3005
卡斯帕罗夫称这个过程是摩擦的副产品。
05:37
The better the process处理, the less the friction摩擦.
119
321625
2401
越好的过程,摩擦越少。
05:39
And minimizing减少 friction摩擦 turns out to be the decisive决定性 variable变量.
120
324026
4256
尽量减少摩擦原来是决定性变量。
05:44
Or take another另一个 example: big data数据.
121
328282
2243
或再举一个例子: 海量数据。
05:46
Every一切 interaction相互作用 we have in the world世界 is recorded记录
122
330525
1906
我们在世界上每个互动都被记录着
05:48
by an ever growing生长 array排列 of sensors传感器: your phone电话,
123
332431
3059
由与日俱增的传感器:您的电话,
05:51
your credit信用 card, your computer电脑. The result结果 is big data数据,
124
335490
2373
您的信用卡,您的计算机。其结果是大量的数据,
05:53
and it actually其实 presents礼物 us with an opportunity机会
125
337863
1742
同时它实际上提供了我们一个机会
05:55
to more deeply understand理解 the human人的 condition条件.
126
339605
2662
去更深入地理解人类的特点。
05:58
The major重大的 emphasis重点 of most approaches方法 to big data数据
127
342267
2305
处理海量数据的主要方法
06:00
focus焦点 on, "How do I store商店 this data数据? How do I search搜索
128
344572
2215
是集中在,"如何存储这些数据?如何搜索
06:02
this data数据? How do I process处理 this data数据?"
129
346787
2276
这些数据?如何处理这些数据?"
06:04
These are necessary必要 but insufficient不足 questions问题.
130
349063
2204
这些都是必要但不完全的问题。
06:07
The imperative势在必行 is not to figure数字 out how to compute计算,
131
351267
2471
当务之急是不弄清楚如何计算,
06:09
but what to compute计算. How do you impose强加 human人的 intuition直觉
132
353738
2184
但用什么来计算。如何加入的人类直觉
06:11
on data数据 at this scale规模?
133
355922
1791
在这种规模的数据上?
06:13
Again, we start开始 by designing设计 the human人的 into the process处理.
134
357713
3499
又一次,我们开始设计把人类引入这一进程。
06:17
When PayPal贝宝 was first starting开始 as a business商业, their biggest最大
135
361212
2812
PayPal 作为一家企业,当他们第一次启动时,他们最大的
06:19
challenge挑战 was not, "How do I send发送 money back and forth向前 online线上?"
136
364024
2804
挑战不是,"如何在线转账?"
06:22
It was, "How do I do that without being存在 defrauded骗取 by organized有组织的 crime犯罪?"
137
366828
3872
而是,"如何避免有组织犯罪的诈骗?"
06:26
Why so challenging具有挑战性的? Because while computers电脑 can learn学习
138
370700
2088
为什么如此具有挑战性?因为虽然计算机能学到
06:28
to detect检测 and identify鉴定 fraud舞弊 based基于 on patterns模式,
139
372788
3144
探测和识别基于模式的欺诈,
06:31
they can't learn学习 to do that based基于 on patterns模式
140
375932
1479
他们学不会做基于模式
06:33
they've他们已经 never seen看到 before, and organized有组织的 crime犯罪
141
377411
2116
之外的判断,这同有组织犯罪
06:35
has a lot in common共同 with this audience听众: brilliant辉煌 people,
142
379527
2709
有很多共同点: 聪明,
06:38
relentlessly无情 resourceful足智多谋, entrepreneurial创业 spirit精神 — (Laughter笑声) —
143
382236
3640
足智多谋、 有创业精神 —(笑声)—
06:41
and one huge巨大 and important重要 difference区别: purpose目的.
144
385876
2712
还有一个重大的区别:目的。
06:44
And so while computers电脑 alone单独 can catch抓住 all but the cleverest
145
388588
2832
所以在单独的计算机可以捕获所有得同时,最聪明
06:47
fraudsters骗子, catching the cleverest is the difference区别
146
391420
2253
的诈骗犯捕捉最聪明的,区别就是
06:49
between之间 success成功 and failure失败.
147
393673
2545
成功与失败。
06:52
There's a whole整个 class of problems问题 like this, ones那些 with
148
396218
2221
像这类的问题有很多,都是
06:54
adaptive自适应 adversaries对手. They rarely很少 if ever present当下 with a
149
398439
2575
相互适应。他们很少显示出
06:56
repeatable重复 pattern模式 that's discernable辨别 to computers电脑.
150
401014
2736
可以辨认到计算机的可重复执行的模式。
06:59
Instead代替, there's some inherent固有 component零件 of innovation革新 or disruption瓦解,
151
403750
3993
相反,有一些继承下来的创新或中断的部分
07:03
and increasingly日益 these problems问题 are buried隐藏 in big data数据.
152
407743
2735
同时这些问题越来越多地被藏在了大量的数据中。
07:06
For example, terrorism恐怖主义. Terrorists恐怖分子 are always adapting适应
153
410478
2500
例如,恐怖主义。恐怖分子总可以适应这种
07:08
in minor次要 and major重大的 ways方法 to new circumstances情况, and despite尽管
154
412978
2052
次要和主要方式的新环境,而且即使
07:10
what you might威力 see on TV电视, these adaptations改编,
155
415030
3094
在电视上,你可能会看到这些适应能力,
07:14
and the detection发现 of them, are fundamentally从根本上 human人的.
156
418124
2293
和对他们的检测,基本上都是人类。
07:16
Computers电脑 don't detect检测 novel小说 patterns模式 and new behaviors行为,
157
420417
3117
计算机不会检测新的模式和新的行为,
07:19
but humans人类 do. Humans人类, using运用 technology技术, testing测试 hypotheses假设,
158
423534
3235
但人类可以。人类,利用技术、 测试假设,
07:22
searching搜索 for insight眼光 by asking machines to do things for them.
159
426769
4620
通过机器为他们寻找目标。
07:27
Osama乌萨马 bin箱子 Laden拉登 was not caught抓住 by artificial人造 intelligence情报.
160
431389
2320
本 · 拉登不是被人工智能抓住的。
07:29
He was caught抓住 by dedicated专用, resourceful足智多谋, brilliant辉煌 people
161
433709
2553
他被抓住是因为专注、足智多谋和聪明的
07:32
in partnerships伙伴关系 with various各个 technologies技术.
162
436262
4269
人与各种技术的合作。
07:36
As appealing吸引人的 as it might威力 sound声音, you cannot不能 algorithmically算法
163
440531
2818
这听起来颇具吸引力,你不能通过计算
07:39
data数据 mine your way to the answer回答.
164
443349
1601
数据的方式来挖掘你的答案。
07:40
There is no "Find Terrorist恐怖分子" button按键, and the more data数据
165
444950
2855
没有"找到恐怖分子"的按钮,同时越多的数据
07:43
we integrate整合 from a vast广大 variety品种 of sources来源
166
447805
2302
,整合的来源越多,
07:46
across横过 a wide variety品种 of data数据 formats格式 from very
167
450107
2133
格式的种类越广,形成了一个非常
07:48
disparate不同 systems系统, the less effective有效 data数据 mining矿业 can be.
168
452240
3309
迥异的系统,数据挖掘也更加低效。
07:51
Instead代替, people will have to look at data数据
169
455549
2024
相反,人们还要参考数据
07:53
and search搜索 for insight眼光, and as Licklider利克莱德 foresaw预见 long ago,
170
457573
3456
和搜索目标,Licklider 很久以前预见到的,
07:56
the key to great results结果 here is the right type类型 of cooperation合作,
171
461029
2685
成功的关键是正确的合作,
07:59
and as Kasparov卡斯帕罗夫 realized实现,
172
463714
1524
正如卡斯帕罗夫意识到的,
08:01
that means手段 minimizing减少 friction摩擦 at the interface接口.
173
465238
3031
这意味着,尽量减少操作界面的摩擦。
08:04
Now this approach途径 makes品牌 possible可能 things like combing梳理
174
468269
2758
现在这种方法使得梳理
08:06
through通过 all available可得到 data数据 from very different不同 sources来源,
175
471027
3386
所有可用且来源非常不同的数据成为了可能,
08:10
identifying识别 key relationships关系 and putting them in one place地点,
176
474413
2792
确定关键的关系,并将它们放在一个地方,
08:13
something that's been nearly几乎 impossible不可能 to do before.
177
477205
2928
之前看似几乎不可能完成的东西。
08:16
To some, this has terrifying可怕的 privacy隐私 and civil国内 liberties自由
178
480133
1942
对某些人来说,这会影响隐私和公民自由
08:17
implications启示. To others其他 it foretells预言 of an era时代 of greater更大
179
482075
3410
的实行。对其他人来说,这预示了的一个更加伟大的时代
08:21
privacy隐私 and civil国内 liberties自由 protections保护,
180
485485
1909
对于保护隐私和公民自由,
08:23
but privacy隐私 and civil国内 liberties自由 are of fundamental基本的 importance重要性.
181
487394
2936
但隐私和公民自由是根本也是最重要的。
08:26
That must必须 be acknowledged承认, and they can't be swept风靡 aside在旁边,
182
490330
2193
必须承认,他们不能被抛在一边,
08:28
even with the best最好 of intents意图.
183
492523
2530
即使是出于好意。
08:30
So let's explore探索, through通过 a couple一对 of examples例子, the impact碰撞
184
495053
2518
让我们探讨,通过几个例子,
08:33
that technologies技术 built内置 to drive驾驶 human-computer人机 symbiosis合作关系
185
497571
2406
科技构建驱动人机共生
08:35
have had in recent最近 time.
186
499977
2919
最近产生的影响。
08:38
In October十月, 2007, U.S. and coalition联盟 forces军队 raided搜查
187
502896
3416
2007 年 10 月,美国和盟军部队突袭了
08:42
an al Qaeda凯达 safe安全 house in the city of Sinjar辛贾尔
188
506312
2416
一个在辛贾尔市的基地组织的安全屋
08:44
on the Syrian叙利亚的 border边境 of Iraq伊拉克.
189
508728
1934
位于叙利亚的伊拉克边界。
08:46
They found发现 a treasure宝藏 trove宝库 of documents文件:
190
510662
2376
他们发现一份宝贵的文档:
08:48
700 biographical传记 sketches素描 of foreign国外 fighters战士.
191
513038
2335
700个外国战士的小传草稿。
08:51
These foreign国外 fighters战士 had left their families家庭 in the Gulf海湾,
192
515373
2584
这些外国战士在海湾地区,他们离开他们
08:53
the Levant黎凡特 and North Africa非洲 to join加入 al Qaeda凯达 in Iraq伊拉克.
193
517957
3146
南欧和北非的家,加入在伊拉克境内的基地组织。
08:57
These records记录 were human人的 resource资源 forms形式.
194
521103
1616
这些记录是人力资源管理的形式。
08:58
The foreign国外 fighters战士 filled填充 them out as they joined加盟 the organization组织.
195
522719
2855
外国战士填写这些之后加入该组织。
09:01
It turns out that al Qaeda凯达, too,
196
525574
1211
事实证明,基地组织,也,
09:02
is not without its bureaucracy官僚. (Laughter笑声)
197
526785
2597
并不是没有其官僚作风。(笑声)
09:05
They answered回答 questions问题 like, "Who recruited应征 you?"
198
529382
2098
他们回答类似的问题,"谁聘请的你?"
09:07
"What's your hometown家乡?" "What occupation占用 do you seek寻求?"
199
531480
2854
"你的家乡是哪儿?""你要求从事什么职业呢?"
09:10
In that last question, a surprising奇怪 insight眼光 was revealed透露.
200
534334
3169
这个最后的问题,据透露出十分惊人的洞察力。
09:13
The vast广大 majority多数 of foreign国外 fighters战士
201
537503
2400
绝大多数的外国战士
09:15
were seeking to become成为 suicide自杀 bombers轰炸机 for martyrdom殉教 --
202
539903
2400
在谋求成为自爆烈士 — —
09:18
hugely巨大 important重要, since以来 between之间 2003 and 2007, Iraq伊拉克
203
542303
4338
极其重要的是,自 2003 年至 2007 年,伊拉克
09:22
had 1,382 suicide自杀 bombings爆炸, a major重大的 source资源 of instability不稳定.
204
546641
4244
有 1,382 自杀性爆炸,不稳定的主要根源。
09:26
Analyzing分析 this data数据 was hard. The originals原件 were sheets床单
205
550885
2058
分析这些数据是困难的。原始的表格
09:28
of paper in Arabic阿拉伯 that had to be scanned扫描 and translated翻译.
206
552943
2742
是阿拉伯语的,必须要扫描和翻译。
09:31
The friction摩擦 in the process处理 did not allow允许 for meaningful富有意义的
207
555685
2192
这过程中的摩擦不允许有意义的
09:33
results结果 in an operational操作 time frame using运用 humans人类, PDFsPDF文件
208
557877
3350
运用时间构架人类的结果,PDFs
09:37
and tenacity韧性 alone单独.
209
561227
2218
和独立的坚韧。
09:39
The researchers研究人员 had to lever杠杆 up their human人的 minds头脑
210
563445
1953
研究者们不得不撬动了他们人类的思维
09:41
with technology技术 to dive潜水 deeper更深, to explore探索 non-obvious非显而易见性
211
565398
2345
并运用科技去潜得更深,去探索非显而易见
09:43
hypotheses假设, and in fact事实, insights见解 emerged出现.
212
567743
3218
的假说,事实上,目标实现了。
09:46
Twenty二十 percent百分 of the foreign国外 fighters战士 were from Libya利比亚,
213
570961
2644
20 % 的外国战士来自利比亚,
09:49
50 percent百分 of those from a single town in Libya利比亚,
214
573605
2968
50%的人来自利比亚的同一个镇,
09:52
hugely巨大 important重要 since以来 prior statistics统计 put that figure数字 at
215
576573
2450
非常重要,因为以前的统计数字显示,
09:54
three percent百分. It also helped帮助 to hone磨练 in on a figure数字
216
579023
2383
是3%。它还帮助找出
09:57
of rising升起 importance重要性 in al Qaeda凯达, Abu阿布 Yahya叶海亚 al-LibiAL-礼毕,
217
581406
2977
了基地组织新的重要人物,阿布叶海亚 · 阿尔-利比亚,
10:00
a senior前辈 cleric牧师 in the Libyan利比亚 Islamic清真 fighting战斗 group.
218
584383
2631
利比亚伊斯兰战斗组中的高级官员。
10:02
In March游行 of 2007, he gave a speech言语, after which哪一个 there was
219
587014
2664
2007 年 3 月,他给过一个演讲, 之后
10:05
a surge浪涌 in participation参与 amongst其中包括 Libyan利比亚 foreign国外 fighters战士.
220
589678
3466
来自利比亚的外国战士数量激增。
10:09
Perhaps也许 most clever聪明 of all, though虽然, and least最小 obvious明显,
221
593144
3106
也许最聪明的是,而且,最不明显的是,
10:12
by flipping翻转 the data数据 on its head, the researchers研究人员 were
222
596250
2073
通过整理其有关数据,研究人员
10:14
able能够 to deeply explore探索 the coordination协调 networks网络 in Syria叙利亚
223
598323
2900
能够深入的探索了叙利亚的协调网络,
10:17
that were ultimately最终 responsible主管 for receiving接收 and
224
601223
2517
它负责接收和
10:19
transporting传输 the foreign国外 fighters战士 to the border边境.
225
603740
2464
运送外国战士到边境。
10:22
These were networks网络 of mercenaries雇佣兵, not ideologues空想家,
226
606204
2633
这些都是网络的雇佣军,不是空想,
10:24
who were in the coordination协调 business商业 for profit利润.
227
608837
2398
同过协调生意赚取利润。
10:27
For example, they charged带电 Saudi沙特 foreign国外 fighters战士
228
611235
1904
例如,他们收取沙特外国战士的钱
10:29
substantially基本上 more than Libyans利比亚, money that would have
229
613139
2199
大大超过利比亚的,钱
10:31
otherwise除此以外 gone走了 to al Qaeda凯达.
230
615338
2320
最终会去向基地组织。
10:33
Perhaps也许 the adversary对手 would disrupt破坏 their own拥有 network网络
231
617658
2045
敌人可能会破坏他们的网络
10:35
if they knew知道 they cheating作弊 would-be将会 jihadists圣战者.
232
619703
3035
如果他们知道他们作弊是为了圣战。
10:38
In January一月, 2010, a devastating破坏性的 7.0 earthquake地震 struck来袭 Haiti海地,
233
622738
3745
2010 年 1 月,破坏性的 7.0级地震袭击了海地,
10:42
third第三 deadliest致命 earthquake地震 of all time, left one million百万 people,
234
626483
2916
有史以来第三次惨重的地震灾害,100 万人,
10:45
10 percent百分 of the population人口, homeless无家可归.
235
629399
2584
10%的人口,无家可归。
10:47
One seemingly似乎 small aspect方面 of the overall总体 relief浮雕 effort功夫
236
631983
3137
一个看似小规模的整体救灾工作
10:51
became成为 increasingly日益 important重要 as the delivery交货 of food餐饮
237
635120
2176
变得越来越重要,从提供粮食
10:53
and water started开始 rolling压延.
238
637296
2160
和水开始。
10:55
January一月 and February二月 are the dry months个月 in Haiti海地,
239
639456
1458
在海地,一月和二月是干燥的月份
10:56
yet然而 many许多 of the camps营地 had developed发达 standing常设 water.
240
640914
2942
然而许多难民的帐篷都被水淹了。
10:59
The only institution机构 with detailed详细 knowledge知识 of Haiti's海地
241
643856
2122
唯一拥有海地详细信息的机构
11:01
floodplains漫滩 had been leveled夷为平地
242
645978
1297
已经被洪水淹没了
11:03
in the earthquake地震, leadership领导 inside.
243
647275
3008
在地震中,包括领导。
11:06
So the question is, which哪一个 camps营地 are at risk风险,
244
650283
2575
所以,问题是,哪些营地处于危险之中,
11:08
how many许多 people are in these camps营地, what's the
245
652858
1921
在这些营地有多少人,
11:10
timeline时间线 for flooding洪水, and given特定 very limited有限 resources资源
246
654779
2311
洪水的时间是什么时候,给予有限的资源和时间
11:12
and infrastructure基础设施, how do we prioritize优先 the relocation搬迁?
247
657090
3384
和基础设施,我们如何排定搬迁呢?
11:16
The data数据 was incredibly令人难以置信 disparate不同. The U.S. Army军队 had
248
660474
2344
数据得出迥然不同的结论。美国陆军曾
11:18
detailed详细 knowledge知识 for only a small section部分 of the country国家.
249
662818
2929
有一小部分这个国家详细资料。
11:21
There was data数据 online线上 from a 2006 environmental环境的 risk风险
250
665747
2511
在线数据源于2006年环境风险
11:24
conference会议, other geospatial地理空间 data数据, none没有 of it integrated集成.
251
668258
2664
会议,其他的地理空间数据,没有其它的集成。
11:26
The human人的 goal目标 here was to identify鉴定 camps营地 for relocation搬迁
252
670922
2958
在这里,人的目标是要确定可以搬迁的营地
11:29
based基于 on priority优先 need.
253
673880
2395
基于优先级别的需要。
11:32
The computer电脑 had to integrate整合 a vast广大 amount of geospacial地理空间
254
676275
2440
计算机不得不把大量的空间地理
11:34
information信息, social社会 media媒体 data数据 and relief浮雕 organization组织
255
678715
2584
信息、 社交媒体数据和救援组织
11:37
information信息 to answer回答 this question.
256
681299
3480
信息集成后来回答这个问题。
11:40
By implementing实施 a superior优越 process处理, what was otherwise除此以外
257
684779
2415
通过实施一个优秀的程序,要不然
11:43
a task任务 for 40 people over three months个月 became成为
258
687194
2608
这是一个需要40 人超过三个月才能完成的任务
11:45
a simple简单 job工作 for three people in 40 hours小时,
259
689802
3176
现在简化到三个人用40小时就能完成的工作,
11:48
all victories胜利 for human-computer人机 symbiosis合作关系.
260
692978
2628
这是人机共生所取得的胜利。
11:51
We're more than 50 years年份 into Licklider's利克莱德的 vision视力
261
695606
2054
Licklider 的梦想, 50 年之后
11:53
for the future未来, and the data数据 suggests提示 that we should be
262
697660
2242
的未来,数据表明我们应该
11:55
quite相当 excited兴奋 about tackling抢断 this century's世纪 hardest最难 problems问题,
263
699902
3030
很兴奋的解决这个世纪最困难的问题,
11:58
man and machine in cooperation合作 together一起.
264
702932
2947
人与机器在一起合作。
12:01
Thank you. (Applause掌声)
265
705879
2197
谢谢。(掌声)
12:03
(Applause掌声)
266
708076
2505
(掌声)
Translated by Yi Zong
Reviewed by Chunting Guo

▲Back to top

ABOUT THE SPEAKER
Shyam Sankar - Data Intelligence Agent
An advocate of human-computer symbiosis, Shyam Sankar looks for clues in big and disparate data sets.

Why you should listen

Shyam Sankar is a Director at Palantir Technologies, a secretive Silicon Valley company where he oversees deployments of the company's core technology, which helps law enforcement teams and corporations analyze giant, unrelated databases for clues to potential ... anything. Palantir technologies has been used to find missing children, to detect banking fraud, and to uncover the Shadow Network, a cyber-spy ring that stooped so low as to hack the Dalai Lama's email.

As part of his work, Sankar thinks deeply about the place where human and machine intelligence meet. While artificial intelligence (AI) is the dominant paradigm, he is an advocate of JCR Licklider's "intelligence augmentation" (IA) approach, where algorithms and brains work together to solve problems.

More profile about the speaker
Shyam Sankar | Speaker | TED.com