ABOUT THE SPEAKER
Yaniv Erlich - Computational geneticist
Yaniv Erlich is fascinated by the connection between DNA and data.

Why you should listen

As a professor and researcher at Columbia University and as CSO of MyHeritage.com, Yaniv Erlich has performed foundational work in genetic privacy and large-scale studies of crowdsourced genomic data. Dubbed a "genome hacker" by the journal Nature, Erlich and his team discovered a privacy loophole enabling reidentification of allegedly anonymous male research participants using just internet searches and their Y chromosome. Later, he discovered that 60 percent of all US individuals with European descent can be identified by forensic genetics using open genetic genealogy databases, which Science magazine called one of the top 10 breakthroughs of 2018.

Erlich is also responsible for the construction of the world's largest family tree, comprising 13 million people, as well as the development of the website DNA.land, which has compiled the genotypes of more than 150,000 donors. He has also worked to discover the genetic bases for several conditions in Israeli families. His team has demonstrated stable DNA data storage, reaching a density of 215 petabyte per gram of DNA. He's been awarded numerous prizes, has published more than 45 papers and authored seven patents.

More profile about the speaker
Yaniv Erlich | Speaker | TED.com
TEDMED 2018

Yaniv Erlich: How we're building the world's largest family tree

亞尼夫 · 厄里奇: 我們如何建造世界上最大的家譜樹

Filmed:
1,507,766 views

計算遺傳學家亞尼夫 · 厄里奇 (Yaniv Erlich) 協助打造了世界上最大的家譜——上面有一千三百萬人,可追溯到五百年前。他與我們分享這個迷人的人類家譜圖騰——裡面涵蓋著我們的愛情生活、健康,甚至數十年未破的刑事案件——並說明眾包的系譜學資料庫如何不只能照亮過去,也能照亮未來。
- Computational geneticist
Yaniv Erlich is fascinated by the connection between DNA and data. Full bio

Double-click the English transcript below to play the video.

00:12
People use the internet互聯網
for various各個 reasons原因.
0
817
3452
人們因各種原因使用網際網路。
00:17
It turns out that one of the most
popular流行 categories類別 of website網站
1
5765
3804
結果發現,最熱門的網站類型之一
00:21
is something that people
typically一般 consume消耗 in private私人的.
2
9593
2872
是人們私下瀏覽的東西。
00:25
It involves涉及 curiosity好奇心,
3
13639
2510
它和好奇心有關,
00:28
non-insignificant非顯著性 levels水平
of self-indulgence自我放縱
4
16173
3796
和看不太出來但又明顯的
放蕩不羈程度有關,
00:31
and is centered中心 around recording記錄
the reproductive生殖 activities活動
5
19993
3260
整天沉浸在記錄別人
繁殖活動的圈圈裡。
00:35
of other people.
6
23277
1309
00:36
(Laughter笑聲)
7
24610
1032
(笑聲)
00:37
Of course課程, I'm talking about genealogy家譜 --
8
25666
2250
當然,我在說的是家譜學——
00:39
(Laughter笑聲)
9
27940
1214
(笑聲)
00:41
the study研究 of family家庭 history歷史.
10
29178
1702
家族史的研究。
00:43
When it comes to detailing詳細 family家庭 history歷史,
11
31353
2037
說到詳細的家族歷史,
00:45
in every一切 family家庭, we have this person
that is obsessed痴迷 with genealogy家譜.
12
33414
3943
在每個家庭中,都會
有一個人特別迷戀家譜。
00:49
Let's call him Uncle叔叔 Bernie伯尼.
13
37381
1713
咱們就稱他為柏尼叔叔吧。
00:51
Uncle叔叔 Bernie伯尼 is exactly究竟 the last person
you want to sit next下一個 to
14
39118
3782
感恩節晚餐時,你最不希望
坐到的位子
就是柏尼叔叔的旁邊,
00:54
in Thanksgiving感恩 dinner晚餐,
15
42924
1599
00:56
because he will bore you to death死亡
with peculiar奇特 details細節
16
44547
2814
因為他會一直講某個
古老親戚的獨特細節,
00:59
about some ancient relatives親戚們.
17
47385
1966
講到讓你無聊死。
01:02
But as you know,
18
50462
1262
但,各位都知道,
01:03
there is a scientific科學 side for everything,
19
51748
2872
凡事都有科學的一面,
01:06
and we found發現 that Uncle叔叔 Bernie's伯尼的 stories故事
20
54644
2978
而我們發現,柏尼叔叔的故事
01:09
have immense巨大 potential潛在
for biomedical生物醫藥 research研究.
21
57646
3168
非常有潛力可以用在
生物醫學研究上。
01:13
We let Uncle叔叔 Bernie伯尼
and his fellow同伴 genealogists系譜
22
61306
2714
我們讓柏尼叔叔
和他的家譜學者夥伴們
01:16
document文件 their family家庭 trees樹木 through通過
a genealogy家譜 website網站 called geniGENI.comCOM.
23
64044
4668
透過家譜網站 geni.com
來記錄他們的家譜。
01:21
When users用戶 upload上載
their trees樹木 to the website網站,
24
69198
2128
當使用者將他們的家譜
上傳到該網站,
01:23
it scans掃描 their relatives親戚們,
25
71350
1690
網站會掃描他們的親戚,
01:25
and if it finds認定 matches火柴 to existing現有 trees樹木,
26
73064
2075
如果發現和既有的家譜樹有吻合,
01:27
it merges合併 the existing現有
and the new tree together一起.
27
75163
3610
就會把既有的家譜
和那新的家譜合併起來。
01:31
The result結果 is that large
family家庭 trees樹木 are created創建,
28
79768
2950
結果就是建造出了很大的家譜,
01:34
beyond the individual個人 level水平
of each genealogist系譜專家.
29
82742
3479
超越了家譜學者
個人能做到的程度。
01:38
Now, by repeating重複 this process處理
with millions百萬 of people
30
86808
4129
如今,針對全世界數百萬人
重覆這個流程,
01:42
all over the world世界,
31
90961
1817
01:44
we can crowdsource眾包 the construction施工
of a family家庭 tree of all humankind人類.
32
92802
5532
我們就能將全人類的家譜
外包給群眾來做。
01:51
Using運用 this website網站,
33
99292
1584
我們用這個網站,
01:52
we were able能夠 to connect 125 million百萬 people
34
100900
4813
將一億兩千五百萬人連結起來,
01:57
into a single family家庭 tree.
35
105737
2521
成為單一家譜樹。
02:00
I cannot不能 draw the tree
on the screens屏幕 over here
36
108967
2788
我無法在這裡的螢幕上
畫出這個家譜樹,
02:03
because they have less pixels像素
37
111779
2165
因為這個家譜樹中的人數
02:05
than the number of people in this tree.
38
113968
2513
比螢幕的畫素還要多。
02:08
But here is an example of a subset子集
of 6,000 individuals個人.
39
116505
5010
但,可以取其中一部分
六千人的家譜給各位看。
02:14
Each green綠色 node節點 is a person.
40
122159
2362
每個綠色節點代表一個人。
02:17
The red nodes節點 represent代表 marriages婚姻,
41
125060
2849
紅色節點代表婚姻關係,
02:19
and the connections連接 represent代表 parenthood父母.
42
127933
2258
連線則代表親子關係。
02:22
In the middle中間 of this tree,
you see the ancestors祖先.
43
130557
2372
在家譜的中間可以看到祖先。
02:24
And as we go to the periphery周邊,
you see the descendants後人.
44
132953
2604
在外圍則是後代。
這個家譜樹大約涵蓋了七個世代。
02:27
This tree has seven
generations, approximately.
45
135581
3102
02:31
Now, this is what happens發生
when we increase增加 the number of individuals個人
46
139692
3234
當我們把人數增加到七萬人時,
02:34
to 70,000 people --
47
142950
1828
就會變成這樣——
02:36
still a tiny subset子集
of all the data數據 that we have.
48
144802
4330
相對我們所有的資料,
這仍然只是冰山一角。
02:41
Despite儘管 that, you can already已經 see
the formation編隊 of gigantic巨大 family家庭 trees樹木
49
149629
4813
儘管如此,各位已經可以
看出有巨大的家譜樹形成了,
02:46
with many許多 very distant遙遠 relatives親戚們.
50
154466
2655
當中有許多遠親。
02:49
Thanks謝謝 to the hard work
of our genealogists系譜,
51
157610
3134
仰賴家譜學者的努力,
02:52
we can go back in time
hundreds數以百計 of years年份 ago.
52
160768
3103
我們可以回到數百年前。
02:56
For example, here is Alexander亞歷山大 Hamilton漢密爾頓,
53
164418
3441
比如,這是亞歷山大 · 漢密爾頓,
02:59
who was born天生 in 1755.
54
167883
2475
生於 1755 年。
03:02
Alexander亞歷山大 was the first
US Secretary秘書 of the Treasury金庫,
55
170872
3764
亞歷山大是美國第一位財政部長,
03:06
but mostly大多 known已知 today今天
due應有 to a popular流行 Broadway百老匯 musical音樂.
56
174660
3831
但主要由於一部流行的
百老匯音樂劇而廣為人知。
03:11
We found發現 that Alexander亞歷山大 has deeper更深
connections連接 in the showbiz演藝圈 industry行業.
57
179137
4922
我們發現亞歷山大
在娛樂圈有更深厚的人脈。
03:16
In fact事實, he's a blood血液 relative相對的 of ...
58
184083
2111
事實上,他是……
03:18
Kevin凱文 Bacon培根!
59
186781
1220
凱文貝肯的血親!
03:20
(Laughter笑聲)
60
188025
2032
(笑聲)
03:22
Both of them are descendants後人
of a lady淑女 from Scotland蘇格蘭
61
190081
2606
他們兩人都是十三世紀
03:24
who lived生活 in the 13th century世紀.
62
192711
2314
一位蘇格蘭女子的後裔。
03:27
So you can say that Alexander亞歷山大 Hamilton漢密爾頓
63
195049
3102
所以,可以說亞歷山大漢密爾頓
03:30
is 35 degrees of Kevin凱文 Bacon培根 genealogy家譜.
64
198175
3188
是凱文貝肯的三十五度宗譜。
(改自「六度分離」)
03:33
(Laughter笑聲)
65
201387
1441
(笑聲)
03:34
And our tree has millions百萬
of stories故事 like that.
66
202852
3230
我們的家譜樹有數百萬個
像這樣的故事。
03:40
We invested投資 significant重大 efforts努力
to validate驗證 the quality質量 of our data數據.
67
208113
4890
我們投入許多心力
去驗證我們資料的品質。
03:45
Using運用 DNA脫氧核糖核酸, we found發現 that .3 percent百分 of
the mother-child母子 connections連接 in our data數據
68
213027
5391
利用 DNA,我們發現,
我們的資料中有 0.3% 的
母子關係是錯的,
03:50
are wrong錯誤,
69
218442
1250
03:51
which哪一個 could match比賽 the adoption採用 rate
in the US pre-Second第二秒前 World世界 War戰爭.
70
219716
3591
這很符合在二次大戰之前
美國的領養率。
03:56
For the father's父親的 side,
71
224847
1785
就父系的這一面來說,
03:58
the news新聞 is not as good:
72
226656
1961
狀況就沒這麼好了:
04:02
1.9 percent百分 of the father-child父親-兒童
connections連接 in our data數據 are wrong錯誤.
73
230149
5600
我們的資料中,1.9% 的
父子關係是錯的。
04:07
And I see some people smirk傻笑 over here.
74
235773
2363
我看到這邊有些人在笑。
04:10
It is what you think --
75
238160
1717
就如各位所想的——
04:11
there are many許多 milkmen送奶員 out there.
76
239901
1789
世界上有很多師奶殺手級的男人。
04:13
(Laughter笑聲)
77
241714
1064
(笑聲)
04:14
However然而, this 1.9 percent百分 error錯誤 rate
in patrilineal父系 connections連接
78
242802
3989
然而,這 1.9% 的父子關係錯誤率
不是我們數據獨有的 。
04:18
is not unique獨特 to our data數據.
79
246815
1769
04:20
Previous以前 studies學習 found發現
a similar類似 error錯誤 rate
80
248608
3069
過去用臨床等級家譜所做的研究,
04:23
using運用 clinical-grade臨床級 pedigrees家譜.
81
251701
2021
也有發現近似的錯誤率。
04:26
So the quality質量 of our data數據 is good,
82
254254
2525
所以我們的資料品質算不錯,
04:28
and that should not be a surprise.
83
256803
2133
那並不讓人意外。
04:30
Our genealogists系譜 have
a profound深刻, vested既得利益 interest利益
84
258960
3776
我們的系譜學家對正確記錄
他們的家族史有著濃厚的興趣。
04:34
in correctly正確地 documenting文檔化
their family家庭 history歷史.
85
262760
3668
04:40
We can leverage槓桿作用 this data數據 to learn學習
quantitative information信息 about humanity人性,
86
268594
4591
我們可以善用這些資料,
來了解人類的量化資訊,
04:45
for example, questions問題 about demography人口統計學.
87
273209
2596
比如,人口統計相關的問題。
04:47
Here is a look at all our profiles型材
on the map地圖 of the world世界.
88
275829
3857
這是我們的資料在世界地圖上的樣子。
04:52
Each pixel像素 is a person
that lived生活 at some point.
89
280250
4481
每一個畫素就是
活在某個時點的一個人。
04:56
And since以來 we have so much data數據,
90
284755
1680
因為我們有非常多資料,
04:58
you can see the contours輪廓
of many許多 countries國家,
91
286459
2781
各位可以看見許多國家的輪廓,
05:01
especially特別 in the Western西 world世界.
92
289264
2099
特別是西方世界的國家。
05:03
In this clip, we stratified分層
the map地圖 that I've showed顯示 you
93
291387
3548
在這段影片中,我們根據
1400~1900 年間出生的人,
05:06
based基於 on the year of births出生 of individuals個人
from 1400 to 1900,
94
294959
5072
將剛才那張地圖做分層,
05:12
and we compared相比 it
to known已知 migration移民 events事件.
95
300055
2766
再將結果和已知的
移民事件做比對。
05:15
The clip is going to show顯示 you
that the deepest最深 lineages譜系 in our data數據
96
303482
3165
這支影片會讓各位看到,
我們資料中最深遠的連結,
05:18
go all the way back to the UK聯合王國,
97
306671
1627
會一路連到記錄
保存得比較好的英國,
05:20
where they had better record記錄 keeping保持,
98
308322
1808
05:22
and then they spread傳播 along沿
the routes路線 of Western西 colonialism殖民主義.
99
310154
3282
接著再隨西方殖民路線散播出去。
05:25
Let's watch this.
100
313460
1322
咱們來看看影片。
05:27
(Music音樂)
101
315143
1609
(音樂)
05:28
[Year of birth分娩: ]
102
316776
2341
〔出生年:〕
05:31
[1492 - Columbus哥倫布 sails the ocean海洋 blue藍色]
103
319705
1836
〔1492 年:哥倫布藍色海洋航行時期〕
05:35
[1620 - Mayflower五月花 lands土地 in Massachusetts馬薩諸塞]
104
323661
2000
〔1620 年:五月花號在麻州靠岸〕
05:38
[1652 - Dutch荷蘭人 settle解決 in South Africa非洲]
105
326726
1775
〔1652 年:荷蘭人在南非定居〕
05:44
[1788 - Great Britain英國 penal刑事
transportation運輸 to Australia澳大利亞 starts啟動]
106
332321
3186
〔1788 年:英國開始將受刑者運往澳洲〕
05:47
[1836 - First migrants移民 use Oregon俄勒岡 Trail落後]
107
335531
1927
〔1836 年:奧勒岡小徑
初次被移民使用〕
05:50
[all activity活動]
108
338149
3183
〔所有活動〕
05:55
I love this movie電影.
109
343851
1543
我很愛這支影片。
05:57
Now, since以來 these migration移民 events事件
are giving the context上下文 of families家庭,
110
345418
5093
既然有這些移民事件
作為家族的脈絡,
06:02
we can ask questions問題 such這樣 as:
111
350535
2183
我們就能問像這樣的問題:
06:04
What is the typical典型 distance距離
between之間 the birth分娩 locations地點
112
352742
3470
先生和太太的出生地,
06:08
of husbands丈夫 and wives妻子?
113
356236
2812
通常距離多遠?
06:11
This distance距離 plays播放
a pivotal關鍵的 role角色 in demography人口統計學,
114
359072
3677
在人口統計學上,
這距離扮演很關鍵的角色,
06:14
because the patterns模式 in which哪一個
people migrate遷移 to form形成 families家庭
115
362773
3681
因為人們遷移建構家庭的模式
06:18
determine確定 how genes基因 spread傳播
in geographical地理 areas.
116
366478
3713
會決定基因在地理
區域上如何散播。
06:22
We analyzed分析 this distance距離 using運用 our data數據,
117
370706
2328
我們用我們的資料
來分析這個距離,
06:25
and we found發現 that in the old days,
118
373058
2290
我們發現,在過去
用的方式並不困難。
06:27
people had it easy簡單.
119
375372
1230
06:28
They just married已婚 someone有人
in the village nearby附近.
120
376626
2594
他們只會和鄰近村落的人結婚。
06:31
But the Industrial產業 Revolution革命
really complicated複雜 our love life.
121
379958
3705
但,工業革命讓我們的
愛情生活變複雜了。
06:35
And today今天, with affordable實惠 flights航班
and online線上 social社會 media媒體,
122
383687
4560
現今,機票大家可以付擔得起,
再加上線上社群媒體,
06:40
people typically一般 migrate遷移 more than
100 kilometers公里 from their place地點 of birth分娩
123
388271
4828
人們通常從出生地遷移一百多公里,
06:45
to find their soul靈魂 mate伴侶.
124
393123
1504
去尋找靈魂伴侶。
現在各位可能會問:
好吧,從一個地方遷移到另一個地方
06:48
So now you might威力 ask:
125
396524
1187
06:49
OK, but who does the hard work
of migrating遷移 from places地方 to places地方
126
397735
4496
去建構家庭的苦差事是誰在做呢?
06:54
to form形成 families家庭?
127
402255
1269
06:55
Are these the males男性 or the females女性?
128
403548
3727
是男方或女方?
06:59
We used our data數據 to address地址 this question,
129
407752
2155
我們用我們的資料來解這個問題,
07:01
and at least最小 in the last 300 years年份,
130
409931
2594
至少,在過去三百年間,
07:04
we found發現 that the ladies女士們 do the hard work
131
412549
3883
我們發現從一地移民到另一地
去組成家庭的苦差事是女方在做。
07:08
of migrating遷移 from places地方
to places地方 to form形成 families家庭.
132
416456
2996
07:11
Now, these results結果
are statistically統計學 significant重大,
133
419476
3101
這些結果在統計上是顯著的,
07:14
so you can take it as scientific科學 fact事實
that males男性 are lazy.
134
422601
3471
所以男人比較懶是有科學根據的。
07:18
(Laughter笑聲)
135
426096
3156
(笑聲)
07:21
We can move移動 from questions問題
about demography人口統計學
136
429276
2536
我們可以從人口統計相關的問題
07:23
and ask questions問題 about human人的 health健康.
137
431836
2913
換到詢問人類健康相關的問題。
07:26
For example, we can ask
138
434773
1487
比如,我們可以問
07:28
to what extent程度 genetic遺傳 variations變化
account帳戶 for differences分歧 in life span跨度
139
436284
4963
人與人之間的壽命差異,
受到遺傳變異的影響有多大?
07:33
between之間 individuals個人.
140
441271
1194
07:34
Previous以前 studies學習 analyzed分析 the correlation相關
of longevity長壽 between之間 twins雙胞胎
141
442988
4530
過去有研究分析
雙胞胎壽命的相關性
07:39
to address地址 this question.
142
447542
1442
來解答這個問題。
07:41
They estimated預計 that the genetic遺傳
variations變化 account帳戶 for
143
449411
2667
他們估計,人與人
之間的壽命差異,
07:44
about a quarter25美分硬幣 of the differences分歧
in life span跨度 between之間 individuals個人.
144
452102
4040
有四分之一是來自遺傳變異。
07:48
But twins雙胞胎 can be correlated相關
due應有 to so many許多 reasons原因,
145
456688
2598
但,雙胞胎之間的關聯性
有許多可能成因,
07:51
including包含 various各個 environmental環境的 effects效果
146
459310
2304
包括各種環境的影響,
07:53
or a shared共享 household家庭.
147
461638
1622
或共同的家庭。
07:56
Large family家庭 trees樹木 give us the opportunity機會
to analyze分析 both close relatives親戚們,
148
464411
3753
大型家譜樹讓我們有機會
分析這些近親,
08:00
such這樣 as twins雙胞胎,
149
468188
1207
比如雙胞胎,
08:01
all the way to distant遙遠 relatives親戚們,
even fourth第四 cousins表兄弟.
150
469419
2917
到遠房親戚,甚至第四代表親。
08:04
This way we can build建立 robust強大的 models楷模
151
472749
2689
這樣我們就能建立穩健的模型,
08:07
that can tease apart距離 the contribution貢獻
of genetic遺傳 variations變化
152
475462
3708
從環境因素中
分離出遺傳變異的貢獻來。
08:11
from environmental環境的 factors因素.
153
479194
1717
08:13
We conducted進行 this analysis分析 using運用 our data數據,
154
481379
2899
我們用我們的資料進行這項分析,
08:16
and we found發現 that genetic遺傳 variations變化
explain說明 only 15 percent百分
155
484302
5791
我們發現,遺傳變異只解釋了
15% 的個體壽命差異 。
08:22
of the differences分歧 in life span跨度
between之間 individuals個人.
156
490117
2806
08:26
That is five years年份, on average平均.
157
494760
2756
平均而言,就是五年之差。
08:30
So genes基因 matter less than
what we thought before to life span跨度.
158
498316
4708
所以,基因對壽命的影響
沒有我們以前想的那麼大。
08:35
And I find it great news新聞,
159
503675
2136
我認為這是大好消息,
08:38
because it means手段 that
our actions行動 can matter more.
160
506438
3293
因為那就表示我們的行為
與壽命有較大的關係。
08:42
Smoking抽煙, for example, determines確定
10 years年份 of our life expectancy期待 --
161
510533
4274
比如,抽菸就能影響
十年的壽命——
08:46
twice兩次 as much as what genetics遺傳學 determines確定.
162
514831
2646
是基因影響的兩倍。
08:50
We can even have more surprising奇怪 findings發現
163
518236
2289
我們還有更驚人的發現,
08:52
as we move移動 from family家庭 trees樹木
164
520549
1492
就在我們從做家譜樹到
08:54
and we let our genealogists系譜
document文件 and crowdsource眾包 DNA脫氧核糖核酸 information信息.
165
522065
4732
請家譜學家幫我們整理 DNA 資訊
並做眾包後發現的。
08:58
And the results結果 can be amazing驚人.
166
526821
2024
結果很驚人。
09:01
It might威力 be hard to imagine想像,
but Uncle叔叔 Bernie伯尼 and his friends朋友
167
529255
3915
可能很難想像,
但柏尼叔叔和他的朋友
09:05
can create創建 DNA脫氧核糖核酸 forensic法庭的 capabilities功能
168
533194
2646
所創造出來的 DNA 法醫鑑定能力
09:07
that even exceed超過
what the FBI聯邦調查局 currently目前 has.
169
535864
3559
甚至比目前的聯邦調查局還要強。
09:12
When you place地點 the DNA脫氧核糖核酸
on a large family家庭 tree,
170
540862
2404
當你把 DNA 放入大型的家譜樹中,
09:15
you effectively有效 create創建 a beacon烽火
171
543290
2117
就能有效地創造出
如燈塔般的光束,
從 DNA 的源頭者放射出與
09:17
that illuminates點亮 the hundreds數以百計
of distant遙遠 relatives親戚們
172
545431
2634
09:20
that are all connected連接的 to the person
that originated起源 the DNA脫氧核糖核酸.
173
548089
3490
數百名遠親的連結光束。
09:24
By placing配售 multiple beacons信標
on a large family家庭 tree,
174
552505
2913
在家譜中放入數個燈塔,
09:27
you can now triangulate三角 the DNA脫氧核糖核酸
of an unknown未知 person,
175
555442
3720
就能針對一個未知的人
做 DNA 三角定位,
09:31
the same相同 way that the GPS全球定位系統 system系統
uses使用 multiple satellites衛星
176
559186
3938
原理和 GPS 使用多個衛星
來定位一個地點的方法相同。
09:35
to find a location位置.
177
563148
1324
09:37
The prime主要 example
of the power功率 of this technique技術
178
565226
3624
有個主要的例子可以說明
這項技術有多強大,
09:40
is capturing捕獲 the Golden金色 State Killer兇手,
179
568874
2675
那就是追捕金州(加州)殺手,
09:44
one of the most notorious臭名昭著 criminals罪犯
in the history歷史 of the US.
180
572612
4528
他是美國史上
最惡名昭彰的罪犯之一。
09:49
The FBI聯邦調查局 had been searching搜索
for this person for over 40 years年份.
181
577164
5892
聯邦調查局尋找這個人
已經超過四十年。
09:55
They had his DNA脫氧核糖核酸,
182
583588
1835
他們有他的 DNA,
09:57
but he never showed顯示 up
in any police警察 database數據庫.
183
585447
3350
但他從來沒有出現在
任何警方資料庫中。
10:01
About a year ago, the FBI聯邦調查局
consulted諮詢 a genetic遺傳 genealogist系譜專家,
184
589447
4712
大約一年前,聯邦調查局
去諮詢了一位基因系譜學家,
10:06
and she suggested建議 that they submit提交
his DNA脫氧核糖核酸 to a genealogy家譜 service服務
185
594183
3950
她建議他們將他的 DNA
上傳到一項家譜服務中,
10:10
that can locate定位 distant遙遠 relatives親戚們.
186
598157
2398
這項服務能找出遠親。
10:13
They did that,
187
601117
1156
他們照做了,
10:14
and they found發現 a third第三 cousin表姐
of the Golden金色 State Killer兇手.
188
602297
3692
找到了金州殺手的第三代表親。
10:18
They built內置 a large family家庭 tree,
189
606013
2344
他們建立了一個很大的家譜樹,
10:20
scanned掃描 the different不同
branches分支機構 of that tree,
190
608381
2102
掃描樹狀圖上的不同分支,
直到他們找到完美匹配
10:22
until直到 they found發現 a profile輪廓
that exactly究竟 matched匹配
191
610507
2565
金州殺手資訊的檔案。
10:25
what they knew知道 about
the Golden金色 State Killer兇手.
192
613096
2581
10:27
They obtained獲得 DNA脫氧核糖核酸 from this person
and found發現 a perfect完善 match比賽
193
615701
3592
他們從這個人身上取得 DNA
並發現跟他們手上的 DNA 相匹配。
10:31
to the DNA脫氧核糖核酸 they had in hand.
194
619317
2025
10:33
They arrested被捕 him
and brought him to justice正義
195
621366
2350
他們逮捕了這個人,
這麼多年後終於將他繩之以法。
10:35
after all these years年份.
196
623740
1424
10:38
Since以來 then, genetic遺傳 genealogists系譜
have started開始 working加工 with
197
626172
3241
從那之後,基因系譜學家就開始
和美國執法單位合作,
10:41
local本地 US law enforcement強制 agencies機構
198
629437
2668
10:44
to use this technique技術
in order訂購 to capture捕獲 criminals罪犯.
199
632129
3362
使用這項技術來抓罪犯。
10:47
And only in the past過去 six months個月,
200
635521
2681
光是在過去六個月,
10:50
they were able能夠 to solve解決
over 20 cold cases with this technique技術.
201
638226
4296
他們就用這項技術破了
超過二十件長年未破的案件。
10:56
Luckily, we have people like Uncle叔叔
Bernie伯尼 and his fellow同伴 genealogists系譜
202
644203
4636
很幸運,我們有柏尼叔叔
和他的家譜學家夥伴們。
11:01
These are not amateurs業餘
with a self-serving自顧自 hobby愛好.
203
649045
2994
這些人不只是業餘愛好者。
11:04
These are citizen公民 scientists科學家們
with a deep passion to tell us who we are.
204
652602
6419
他們還是滿懷熱情
能說「我們是誰」的公民科學家,
11:11
And they know that the past過去
can hold保持 a key to the future未來.
205
659065
4458
他們知道過去是通向未來的鑰匙。
11:16
Thank you very much.
206
664067
1183
感謝各位。
11:17
(Applause掌聲)
207
665314
3469
(掌聲)
Translated by Lilian Chiu
Reviewed by Yi-Fan Yu

▲Back to top

ABOUT THE SPEAKER
Yaniv Erlich - Computational geneticist
Yaniv Erlich is fascinated by the connection between DNA and data.

Why you should listen

As a professor and researcher at Columbia University and as CSO of MyHeritage.com, Yaniv Erlich has performed foundational work in genetic privacy and large-scale studies of crowdsourced genomic data. Dubbed a "genome hacker" by the journal Nature, Erlich and his team discovered a privacy loophole enabling reidentification of allegedly anonymous male research participants using just internet searches and their Y chromosome. Later, he discovered that 60 percent of all US individuals with European descent can be identified by forensic genetics using open genetic genealogy databases, which Science magazine called one of the top 10 breakthroughs of 2018.

Erlich is also responsible for the construction of the world's largest family tree, comprising 13 million people, as well as the development of the website DNA.land, which has compiled the genotypes of more than 150,000 donors. He has also worked to discover the genetic bases for several conditions in Israeli families. His team has demonstrated stable DNA data storage, reaching a density of 215 petabyte per gram of DNA. He's been awarded numerous prizes, has published more than 45 papers and authored seven patents.

More profile about the speaker
Yaniv Erlich | Speaker | TED.com