ABOUT THE SPEAKER
Riccardo Sabatini - Scientist, entrepreneur
Riccardo Sabatini applies his expertise in numerical modeling and data to projects ranging from material science to computational genomics and food market predictions.

Why you should listen

Data scientist Riccardo Sabatini harnesses numerical methods for a surprising variety of fields, from material science research to the study of food commodities (as a past director of the EU research project FoodCAST). His most recent research centers on computational genomics and how to crack the code of life.

In addition to his data research, Sabatini is deeply involved in education for entrepreneurs. He is the founder and co-director of the Quantum ESPRESSO Foundation, an advisor in several data-driven startups, and funder of The HUB Trieste, a social impact accelerator.

More profile about the speaker
Riccardo Sabatini | Speaker | TED.com
TED2016

Riccardo Sabatini: How to read the genome and build a human being

里卡多.薩巴提尼: 如何讀懂基因組並建造人類

Filmed:
1,834,677 views

秘密、疾病及美麗就寫在我們的人類基因裡,建立人類需要完整的基因操作手冊。在這場演講當中,身為科學家兼企業家的里卡多.薩巴提尼(Riccardo Sabatini )將向我們展示,我們有能力可以閱讀這複雜的密碼、預測身高、眼睛顏色、年紀,甚至是臉部結構——全都只要透過一小瓶血液。薩巴提尼說,很快的,我們對基因的認識,將可以讓我們客製化我們的個人醫療,例如癌症這種疾病。我們將有能力改變我們所認識的生命。我們要如何使用這個能力呢?
- Scientist, entrepreneur
Riccardo Sabatini applies his expertise in numerical modeling and data to projects ranging from material science to computational genomics and food market predictions. Full bio

Double-click the English transcript below to play the video.

00:12
For the next下一個 16 minutes分鐘,
I'm going to take you on a journey旅程
0
612
2762
接下來的16分鐘,
我要帶各位進行一段冒險之旅,
00:15
that is probably大概
the biggest最大 dream夢想 of humanity人性:
1
3398
3086
這大概是人類最大的夢想:
00:18
to understand理解 the code of life.
2
6508
2015
了解生命的密碼。
00:21
So for me, everything started開始
many許多, many許多 years年份 ago
3
9072
2743
對我而言,這一切的開始,
要拉回到好幾好幾年前,
00:23
when I met會見 the first 3D printer打印機.
4
11839
2723
當我第一次遇上3D印表機時。
00:26
The concept概念 was fascinating迷人.
5
14586
1674
它的概念真的很棒。
00:28
A 3D printer打印機 needs需求 three elements分子:
6
16284
2022
3D印表機需要三個元素:
00:30
a bit of information信息, some
raw生的 material材料, some energy能源,
7
18330
4134
少量的資訊、一些原物料、
再加上點能量,
00:34
and it can produce生產 any object目的
that was not there before.
8
22488
3334
這樣它就可以製造出
以前從未存在過的任何東西。
00:38
I was doing physics物理,
I was coming未來 back home
9
26517
2137
我當時研究的是物理學,
有天回到家裡時,
00:40
and I realized實現 that I actually其實
always knew知道 a 3D printer打印機.
10
28678
3438
我突然意識到,我家裡
就有一台 3D 印表機。
00:44
And everyone大家 does.
11
32140
1336
而且每個人家裡都有一台。
00:45
It was my mom媽媽.
12
33500
1158
那就是我媽嗎。
00:46
(Laughter笑聲)
13
34682
1001
(笑聲)
00:47
My mom媽媽 takes three elements分子:
14
35707
2414
我媽也有三個元素:
00:50
a bit of information信息, which哪一個 is between之間
my father父親 and my mom媽媽 in this case案件,
15
38145
3973
少量的資訊:我這個例子,
指的是我媽跟我爸之間的投入,
00:54
raw生的 elements分子 and energy能源
in the same相同 media媒體, that is food餐飲,
16
42142
4157
食物就是原物料及能量的來源,
00:58
and after several一些 months個月, produces產生 me.
17
46323
2508
然後,幾個月後,生下了我。
01:00
And I was not existent存在 before.
18
48855
1812
而我以前也是不存的。
01:02
So apart距離 from the shock休克 of my mom媽媽
discovering發現 that she was a 3D printer打印機,
19
50691
3762
所以,除了我發現我媽
就是一台3D列印機之外,
01:06
I immediately立即 got mesmerized如醉如痴
by that piece,
20
54477
4738
我突然間也被
這個吸引注了,
01:11
the first one, the information信息.
21
59239
1717
那邊的第一項,資訊。
01:12
What amount of information信息 does it take
22
60980
2251
要有多少這樣的資訊
01:15
to build建立 and assemble集合 a human人的?
23
63255
1936
才能建構並組裝出一個人來呢?
01:17
Is it much? Is it little?
24
65215
1574
要很多嗎?還是只要一點點?
01:18
How many許多 thumb拇指 drives驅動器 can you fill?
25
66813
2180
要多少隨身碟存取這些資訊呢?
01:21
Well, I was studying研究 physics物理
at the beginning開始
26
69017
2624
我一開始是研究物理學的,
01:23
and I took this approximation近似 of a human人的
as a gigantic巨大 Lego樂高玩具 piece.
27
71665
5597
我喜歡把人類比喻成
一個大型的樂高玩具,
01:29
So, imagine想像 that the building建造
blocks are little atoms原子
28
77286
3785
你可以想像,每一個
樂高積木就是一個原子,
01:33
and there is a hydrogen here,
a carbon here, a nitrogen here.
29
81095
4653
氫原子在這,碳原子在這,
氮原子在這。
01:37
So in the first approximation近似,
30
85772
1571
按照最初的估算想法,
01:39
if I can list名單 the number of atoms原子
that compose撰寫 a human人的 being存在,
31
87367
4343
如果我可以列出
人類的原子清單的數量,
01:43
I can build建立 it.
32
91734
1387
我就可以把它建造出來。
01:45
Now, you can run some numbers數字
33
93145
2029
現在,請各位算一下,
01:47
and that happens發生 to be
quite相當 an astonishing驚人 number.
34
95198
3277
這想必是個驚人的數字。
01:50
So the number of atoms原子,
35
98499
2757
所以,存在這隨身碟裡面
01:53
the file文件 that I will save保存 in my thumb拇指
drive駕駛 to assemble集合 a little baby寶寶,
36
101280
4755
可以組合出來一個小寶寶的檔案,
裡面的原子數數量,
01:58
will actually其實 fill an entire整個 Titanic泰坦尼克號
of thumb拇指 drives驅動器 --
37
106059
4667
實際上若用樂高玩具
組裝起一個人類,
它的大小足足有
2000台鐵達尼號這麼大。
02:02
multiplied乘以 2,000 times.
38
110750
2718
02:05
This is the miracle奇蹟 of life.
39
113957
3401
這就是生命的奇蹟啊!
02:09
Every一切 time you see from now on
a pregnant lady淑女,
40
117382
2612
從現在起,你每次
看到懷孕的婦女,
02:12
she's assembling組裝 the biggest最大
amount of information信息
41
120018
2856
她就是那個正在組裝
你這輩子所遇到的最大量資訊。
02:14
that you will ever encounter遭遇.
42
122898
1556
02:16
Forget忘記 big data數據, forget忘記
anything you heard聽說 of.
43
124478
2950
忘了大數據吧!
忘了你曾聽過的。
02:19
This is the biggest最大 amount
of information信息 that exists存在.
44
127452
2881
這就是現存的
最大數據資料。
02:22
(Applause掌聲)
45
130357
3833
(笑聲)
但...好在大自然比一位
年輕的物理學家還聰明,
02:26
But nature性質, fortunately幸好, is much smarter聰明
than a young年輕 physicist物理學家,
46
134214
4644
02:30
and in four billion十億 years年份, managed管理
to pack this information信息
47
138882
3576
這40億年來,大自然中
負責管理包裹這個資訊的
02:34
in a small crystal水晶 we call DNA脫氧核糖核酸.
48
142482
2705
小晶體--我們稱之為DNA。
02:37
We met會見 it for the first time in 1950
when Rosalind羅莎琳德 Franklin富蘭克林,
49
145605
4312
我們在1950年第一次認識了它,
當時有一位了不起的女科學家
--羅莎琳.富蘭克林--
02:41
an amazing驚人 scientist科學家, a woman女人,
50
149941
1556
02:43
took a picture圖片 of it.
51
151521
1389
給 DNA 拍了張照。
02:44
But it took us more than 40 years年份
to finally最後 poke inside a human人的 cell細胞,
52
152934
5188
但我們花了40年的時間,
最後才戳進人類細胞裡
02:50
take out this crystal水晶,
53
158146
1602
取出這個晶體,
02:51
unroll it, and read it for the first time.
54
159772
3080
才首次把它伸展開來閱讀。
02:55
The code comes out to be
a fairly相當 simple簡單 alphabet字母,
55
163615
3241
而密碼也就是大家所孰知的
02:58
four letters: A, T, C and G.
56
166880
3772
四個字母:A、T、C、G。
03:02
And to build建立 a human人的,
you need three billion十億 of them.
57
170676
3490
而建造一個人類,
你需要30億個字母。
03:06
Three billion十億.
58
174933
1179
30億。
03:08
How many許多 are three billion十億?
59
176136
1579
30億有多少?
03:09
It doesn't really make
any sense as a number, right?
60
177739
2762
我們對這個數字
真的很沒有概念,對吧?
03:12
So I was thinking思維 how
I could explain說明 myself better
61
180525
4085
所以,我在想,這麼大的數字
我要怎麼解釋
才讓人比較容易了解。
03:16
about how big and enormous巨大 this code is.
62
184634
3050
03:19
But there is -- I mean,
I'm going to have some help,
63
187708
3054
但,我的意思是...
我最好找個人來幫忙,
03:22
and the best最好 person to help me
introduce介紹 the code
64
190786
3227
而能幫我介紹基因密碼
的最佳人選,
03:26
is actually其實 the first man
to sequence序列 it, Dr博士. Craig克雷格 Venter腹部.
65
194037
3522
想當然就是第一個定序的人,
克萊格.凡特博士。
03:29
So welcome歡迎 onstage在舞台上, Dr博士. Craig克雷格 Venter腹部.
66
197583
3390
所以,讓我們歡迎
克萊格.凡特博士上台。
03:32
(Applause掌聲)
67
200997
6931
(掌聲)
03:39
Not the man in the flesh,
68
207952
2256
當然不是活生生的人,
03:43
but for the first time in history歷史,
69
211448
2345
但這是史上第一次
03:45
this is the genome基因組 of a specific具體 human人的,
70
213817
3462
特定人類的基因組被
03:49
printed印刷的 page-by-page頁逐頁, letter-by-letter逐個字母:
71
217303
3760
一頁接著一頁,一個字
接著一個字地列印出來:
03:53
262,000 pages網頁 of information信息,
72
221087
3996
262,000頁的資料,
03:57
450 kilograms公斤, shipped
from the United聯合的 States狀態 to Canada加拿大
73
225107
4364
450公斤、從美國運到加拿大,
04:01
thanks謝謝 to Bruno布魯諾 Bowden鮑登,
Lulu露露.comCOM, a start-up啟動, did everything.
74
229495
4843
感謝新創公司Lulu.com的布魯諾.鮑登,
他們幫我做的這一切。
04:06
It was an amazing驚人 feat功績.
75
234362
1463
這是個很棒的饗宴。
04:07
But this is the visual視覺 perception知覺
of what is the code of life.
76
235849
4297
但這只是對生命密碼
的視覺感受。
04:12
And now, for the first time,
I can do something fun開玩笑.
77
240170
2478
現在,為了慶祝第一次,
我要做件有趣的事。
04:14
I can actually其實 poke inside it and read.
78
242672
2547
我真的可以從裡面
挑一段來讀一讀。
04:17
So let me take an interesting有趣
book ... like this one.
79
245243
4625
所以,讓我來找一本有趣的....
書兒,比如這本。
04:25
I have an annotation註解;
it's a fairly相當 big book.
80
253077
2534
我做了個註記;這書太厚了。
04:27
So just to let you see
what is the code of life.
81
255635
3727
讓各位看一下甚麼是生命密碼。
04:32
Thousands成千上萬 and thousands數千 and thousands數千
82
260566
3391
數以百萬、千萬、
04:35
and millions百萬 of letters.
83
263981
2670
億個字母。
04:38
And they apparently顯然地 make sense.
84
266675
2396
它們當然都有意義。
04:41
Let's get to a specific具體 part部分.
85
269095
1757
讓我來找一段特別的
04:43
Let me read it to you:
86
271571
1362
讀給各位聽:
04:44
(Laughter笑聲)
87
272957
1021
(笑聲)
04:46
"AAGAAG, AATAAT, ATAATA."
88
274002
4006
"AAG, AAT, ATA."
你們可能覺得像是在聽天書,
04:50
To you it sounds聲音 like mute靜音 letters,
89
278965
2067
04:53
but this sequence序列 gives
the color顏色 of the eyes眼睛 to Craig克雷格.
90
281056
4041
但這段序列,決定了
克萊格的眼睛顏色。
04:57
I'll show顯示 you another另一個 part部分 of the book.
91
285633
1932
我再展示另一段給各位看。
04:59
This is actually其實 a little
more complicated複雜.
92
287589
2094
這段實際上稍微複雜些。
05:02
Chromosome染色體 14, book 132:
93
290983
2647
14 號染色體,第132 號書:
05:05
(Laughter笑聲)
94
293654
2090
(笑聲)
05:07
As you might威力 expect期望.
95
295768
1277
如你所望!
05:09
(Laughter笑聲)
96
297069
3466
(笑聲)
05:14
"ATTATT, CTTCTT, GATTGATT."
97
302857
4507
"ATT, CTT, GATT."
05:20
This human人的 is lucky幸運,
98
308329
1687
這個人很幸運,
05:22
because if you miss小姐 just
two letters in this position位置 --
99
310040
4517
因為如果你在這個位置
剛好漏掉兩個字母--
05:26
two letters of our three billion十億 --
100
314581
1877
30億個字母,只漏掉兩個--
05:28
he will be condemned譴責
to a terrible可怕 disease疾病:
101
316482
2019
你就等同於被宣判
得了一個恐佈的疾病:
05:30
cystic囊性 fibrosis纖維化.
102
318525
1440
囊性纖維化。
05:31
We have no cure治愈 for it,
we don't know how to solve解決 it,
103
319989
3413
目前我們沒有治療的方式,
我們不知道如何解決,
05:35
and it's just two letters
of difference區別 from what we are.
104
323426
3755
僅僅就這兩個字母上
的差異而已。
05:39
A wonderful精彩 book, a mighty威武 book,
105
327585
2705
這本偉大的書,
05:43
a mighty威武 book that helped幫助 me understand理解
106
331115
1998
這本偉大的書,
可以幫助我了解,也能讓各位
看到一些嘆為觀止的事情。
05:45
and show顯示 you something quite相當 remarkable卓越.
107
333137
2753
05:48
Every一切 one of you -- what makes品牌
me, me and you, you --
108
336480
4435
在場的每一個人,
成就你我不同的地方
05:52
is just about five million百萬 of these,
109
340939
2954
就這五百萬個
字母的差異,
05:55
half a book.
110
343917
1228
半本書。
05:58
For the rest休息,
111
346015
1663
剩下的,
05:59
we are all absolutely絕對 identical相同.
112
347702
2562
我們絕對都長一樣。
06:03
Five hundred pages網頁
is the miracle奇蹟 of life that you are.
113
351008
4018
就是這 500 頁的字母,
行塑了你是甚麼樣的人,
06:07
The rest休息, we all share分享 it.
114
355050
2531
剩下的,我們都一樣。
06:09
So think about that again
when we think that we are different不同.
115
357605
2909
所以,當我們在討論彼此差異的時候,
讓我們再反思一下,
06:12
This is the amount that we share分享.
116
360538
2221
其實我們共同的地方
真的有這麼多。
06:15
So now that I have your attention注意,
117
363441
3429
所以,我問一下各位,
06:18
the next下一個 question is:
118
366894
1359
接下來的問題:
06:20
How do I read it?
119
368277
1151
我要怎麼讀它?
06:21
How do I make sense out of it?
120
369452
1509
我要怎麼搞懂它?
06:23
Well, for however然而 good you can be
at assembling組裝 Swedish瑞典 furniture家具,
121
371409
4240
其實,無論你多麼會
看說明書組裝瑞典的家具,
這本安裝手冊也沒辦法
教你如何破解你的人生。
06:27
this instruction指令 manual手冊
is nothing you can crack裂紋 in your life.
122
375673
3563
06:31
(Laughter笑聲)
123
379260
1603
(笑聲)
06:32
And so, in 2014, two famous著名 TEDstersTEDsters,
124
380887
3112
2014年,兩位出名的 TED 演講者,
06:36
Peter彼得 Diamandis迪曼蒂斯 and Craig克雷格 Venter腹部 himself他自己,
125
384023
2540
彼得.戴曼迪斯和
克雷格.文特爾本人,
06:38
decided決定 to assemble集合 a new company公司.
126
386587
1927
他們決定創立一家新公司。
06:40
Human人的 Longevity長壽 was born天生,
127
388538
1412
《人類長壽公司》誕生了,
06:41
with one mission任務:
128
389974
1370
並賦予一個使命:
06:43
trying everything we can try
129
391368
1861
竭盡所能的,
06:45
and learning學習 everything
we can learn學習 from these books圖書,
130
393253
2759
從這些書上,嘗試每樣東西,
學習每樣東西,
06:48
with one target目標 --
131
396036
1705
就為了一個目標——
06:50
making製造 real真實 the dream夢想
of personalized個性化 medicine醫學,
132
398862
2801
讓個人化醫療的美夢可以成真,
06:53
understanding理解 what things
should be doneDONE to have better health健康
133
401687
3767
了解需要做哪些事
才能更健康,
06:57
and what are the secrets秘密 in these books圖書.
134
405478
2283
以及了解這些書
裡面的秘密。
07:00
An amazing驚人 team球隊, 40 data數據 scientists科學家們
and many許多, many許多 more people,
135
408329
4250
一個令人驚豔的團隊,40 個數據科學家,
還有其他很多、很多的人,
07:04
a pleasure樂趣 to work with.
136
412603
1350
一起為團隊努力。
07:05
The concept概念 is actually其實 very simple簡單.
137
413977
2253
這概念其實很簡單。
07:08
We're going to use a technology技術
called machine learning學習.
138
416254
3158
我們將要使用一種叫
「機械自主學習」的概念。
07:11
On one side, we have genomes基因組 --
thousands數千 of them.
139
419436
4539
一方面,我們有
成千上萬的基因組——
07:15
On the other side, we collected
the biggest最大 database數據庫 of human人的 beings眾生:
140
423999
3997
另一方面,我們收集了
人類最大的資料庫:
07:20
phenotypes表型, 3D scan掃描, NMRNMR --
everything you can think of.
141
428020
4296
生物特性、3D掃描、核磁共振——
你能想到的每樣東西。
07:24
Inside there, on these two opposite對面 sides雙方,
142
432340
2899
這兩方面的資料,
被自主翻譯出來後
07:27
there is the secret秘密 of translation翻譯.
143
435263
2442
就可以解開很多的祕密。
07:29
And in the middle中間, we build建立 a machine.
144
437729
2472
在這兩個中間,
我們建立了一台機器。
07:32
We build建立 a machine
and we train培養 a machine --
145
440801
2385
我建立它,訓練它——
07:35
well, not exactly究竟 one machine,
many許多, many許多 machines --
146
443210
3210
當然,並不只一台機器啦!
是很多很多台機器——
07:38
to try to understand理解 and translate翻譯
the genome基因組 in a phenotype表型.
147
446444
4544
嘗試去了解並翻譯
基因組的生物特徵表象。
07:43
What are those letters,
and what do they do?
148
451362
3340
這些字母代表甚麼?
它們有甚麼作用?
07:46
It's an approach途徑 that can
be used for everything,
149
454726
2747
這個方法可以運用在每件事上,
07:49
but using運用 it in genomics基因組學
is particularly尤其 complicated複雜.
150
457497
2993
但用在基因學上,
它就特別複雜。
07:52
Little by little we grew成長 and we wanted
to build建立 different不同 challenges挑戰.
151
460514
3276
在一點一滴的慢慢累積後,
我們想建立不一樣的挑戰。
07:55
We started開始 from the beginning開始,
from common共同 traits性狀.
152
463814
2732
我們從共同的特徵開始。
07:58
Common共同 traits性狀 are comfortable自在
because they are common共同,
153
466570
2603
談共同特徵比較輕鬆,
因為它們都很普遍。
08:01
everyone大家 has them.
154
469197
1184
每個人都有。
08:02
So we started開始 to ask our questions問題:
155
470405
2494
我們從這個問題開始問:
08:04
Can we predict預測 height高度?
156
472923
1380
我們可以預測身高嗎?
08:06
Can we read the books圖書
and predict預測 your height高度?
157
474985
2177
我們可以光看書
就可以知道你的身高嗎?
08:09
Well, we actually其實 can,
158
477186
1151
沒錯,我們真的可以,
08:10
with five centimeters公分 of precision精確.
159
478361
1793
預測的誤差在五公分內。
08:12
BMIBMI is fairly相當 connected連接的 to your lifestyle生活方式,
160
480178
3135
身體質量指數與
你的生活形式有關,
08:15
but we still can, we get in the ballpark球場,
eight kilograms公斤 of precision精確.
161
483337
3864
但我們仍然可以,相當精準地
將預測誤差控制在 8 公斤以內。
08:19
Can we predict預測 eye color顏色?
162
487225
1231
那我們可以預測眼睛顏色嗎?
08:20
Yeah, we can.
163
488480
1158
是的,我們可以。
08:21
Eighty八十 percent百分 accuracy準確性.
164
489662
1324
精準度高達80%。
08:23
Can we predict預測 skin皮膚 color顏色?
165
491466
1858
我們可以預測皮膚顏色嗎?
08:25
Yeah we can, 80 percent百分 accuracy準確性.
166
493348
2441
是的,可以,80%的準確率。
08:27
Can we predict預測 age年齡?
167
495813
1340
年齡呢?
08:30
We can, because apparently顯然地,
the code changes變化 during your life.
168
498121
3739
可以,因為隨著年紀,
你的基因碼也會更著改變。
08:33
It gets得到 shorter, you lose失去 pieces,
it gets得到 insertions插入.
169
501884
3282
它會變短、消失或被插入。
08:37
We read the signals信號, and we make a model模型.
170
505190
2555
我們可以讀到那個訊號,
並把它模擬出來。
08:40
Now, an interesting有趣 challenge挑戰:
171
508438
1475
現在,有一項有趣的挑戰:
08:41
Can we predict預測 a human人的 face面對?
172
509937
1729
我們可以預測一個人的臉嗎?
08:45
It's a little complicated複雜,
173
513014
1278
這有點複雜,
08:46
because a human人的 face面對 is scattered疏散
among其中 millions百萬 of these letters.
174
514316
3191
因為人臉上散播了
上百萬個這種字母。
08:49
And a human人的 face面對 is not
a very well-defined明確 object目的.
175
517531
2629
而人臉不太容易預測。
08:52
So, we had to build建立 an entire整個 tier一線 of it
176
520184
2051
所以,我們必須建立一個
完整的堆疊系統,
08:54
to learn學習 and teach
a machine what a face面對 is,
177
522259
2710
去學習並教會機器
人臉是甚麼,
08:56
and embed and compress壓縮 it.
178
524993
2037
然後把它嵌進去並壓縮。
08:59
And if you're comfortable自在
with machine learning學習,
179
527054
2248
如果你很懂機器自主學習,
09:01
you understand理解 what the challenge挑戰 is here.
180
529326
2284
你會懂得這邊的挑戰是甚麼。
09:04
Now, after 15 years年份 -- 15 years年份 after
we read the first sequence序列 --
181
532108
5991
15年後--整整15年後--
我們讀取到第一個序列--
09:10
this October十月, we started開始
to see some signals信號.
182
538123
2902
今年10月,我們開始看到一些訊號。
09:13
And it was a very emotional情緒化 moment時刻.
183
541049
2455
真的是令人感動的時刻。
09:15
What you see here is a subject學科
coming未來 in our lab實驗室.
184
543528
3745
你現在看到的是一個
進來我們實驗室的實驗對象。
09:19
This is a face面對 for us.
185
547619
1928
這是一個我們人類的臉。
09:21
So we take the real真實 face面對 of a subject學科,
we reduce減少 the complexity複雜,
186
549571
3631
所以我們拿一個真實的臉當作實驗對象,
我們減少了複雜度,
09:25
because not everything is in your face面對 --
187
553226
1970
因為不是每樣東西都會在
你的臉上原貌呈現出來--
09:27
lots of features特徵 and defects缺陷
and asymmetries不對稱 come from your life.
188
555220
3786
有很多的特徵、缺陷及不對稱
來自於你後天的生活方式。
09:31
We symmetrize對稱化 the face面對,
and we run our algorithm算法.
189
559030
3469
我們把臉對稱好後,
拿去跑我們的演算法。
09:35
The results結果 that I show顯示 you right now,
190
563245
1898
我現在展示給各位看的結果,
09:37
this is the prediction預測 we have
from the blood血液.
191
565167
3372
是由血液演算出來的預測結果。
09:41
(Applause掌聲)
192
569596
1524
(掌聲)
09:43
Wait a second第二.
193
571144
1435
稍等一下。
09:44
In these seconds, your eyes眼睛 are watching觀看,
left and right, left and right,
194
572603
4692
在這短短的幾秒鐘,你的眼睛會
左看看、右看看做比較,
09:49
and your brain wants
those pictures圖片 to be identical相同.
195
577319
3930
而你的大腦會希望
這些照片是一致的。
09:53
So I ask you to do
another另一個 exercise行使, to be honest誠實.
196
581273
2446
所以,我要求各位做另一項活動,
這次要誠實。
09:55
Please search搜索 for the differences分歧,
197
583743
2287
請找出他們不一樣的地方,
09:58
which哪一個 are many許多.
198
586054
1361
有很多喔。
09:59
The biggest最大 amount of signal信號
comes from gender性別,
199
587439
2603
最多的訊號來自性別,
10:02
then there is age年齡, BMIBMI,
the ethnicity種族 component零件 of a human人的.
200
590066
5201
然後是年齡、身體質量指數、
人類種族族群。
10:07
And scaling縮放 up over that signal信號
is much more complicated複雜.
201
595291
3711
把這些訊號擴大是相當複雜的。
10:11
But what you see here,
even in the differences分歧,
202
599026
3250
但即使你現在看到有點不同,
10:14
lets讓我們 you understand理解
that we are in the right ballpark球場,
203
602300
3595
還是要讓各位知道,
我們預測還算不錯,
10:17
that we are getting得到 closer接近.
204
605919
1348
已經很接近了。
10:19
And it's already已經 giving you some emotions情緒.
205
607291
2349
這已經讓你有點激動了。
10:21
This is another另一個 subject學科
that comes in place地點,
206
609664
2703
這裡有另外一個例子,
10:24
and this is a prediction預測.
207
612391
1409
這是預測的結果。
10:25
A little smaller face面對, we didn't get
the complete完成 cranial structure結構體,
208
613824
4596
有點小的臉,我們雖然沒有
跑完整個頭蓋骨結構,
10:30
but still, it's in the ballpark球場.
209
618444
2651
但,還是很精準。
10:33
This is a subject學科 that comes in our lab實驗室,
210
621634
2224
這是另一個實驗對象,
10:35
and this is the prediction預測.
211
623882
1443
這是預測結果。
10:38
So these people have never been seen看到
in the training訓練 of the machine.
212
626056
4676
這些人從未在我們
訓練的機器裡面出現過。
10:42
These are the so-called所謂 "held-out伸出" set.
213
630756
2837
也就是說這些從
外面隨機取樣的。
10:45
But these are people that you will
probably大概 never believe.
214
633617
3740
但也許各位不相信。
10:49
We're publishing出版 everything
in a scientific科學 publication出版物,
215
637381
2676
我們已經在科學期刊上
發表這一切了,
10:52
you can read it.
216
640081
1151
你可以找到。
10:53
But since以來 we are onstage在舞台上,
Chris克里斯 challenged挑戰 me.
217
641256
2344
但自從知道我們要上台後,
克里斯就挑戰我說,
10:55
I probably大概 exposed裸露 myself
and tried試著 to predict預測
218
643624
3626
我也許可以自己上陣
10:59
someone有人 that you might威力 recognize認識.
219
647274
2831
並嘗試預測你們可能認識的人。
11:02
So, in this vial小瓶 of blood血液 --
and believe me, you have no idea理念
220
650470
4425
所以,在這一瓶血液裡面--
相信我,你們絕對不知道
11:06
what we had to do to have
this blood血液 now, here --
221
654919
2880
我們去哪裡搞來這一瓶血的,
11:09
in this vial小瓶 of blood血液 is the amount
of biological生物 information信息
222
657823
3901
這瓶血就擁有
全部的生物資訊,
11:13
that we need to do a full充分 genome基因組 sequence序列.
223
661748
2277
夠我們跑完全部的基因組定序。
11:16
We just need this amount.
224
664049
2070
我們只需要這麼多。
11:18
We ran this sequence序列,
and I'm going to do it with you.
225
666528
3205
我們已經把它拿去定序,
下次再做給大家看。
11:21
And we start開始 to layer up
all the understanding理解 we have.
226
669757
3979
然後開始堆疊出
所有我們知道的東西,
11:25
In the vial小瓶 of blood血液,
we predicted預料到的 he's a male.
227
673760
3350
從這瓶血液裡,
我們預測出他是位男士。
11:29
And the subject學科 is a male.
228
677134
1364
而實驗對象是男士。
11:30
We predict預測 that he's a meter儀表 and 76 cm厘米.
229
678996
2438
我們預測他身高176公分。
11:33
The subject學科 is a meter儀表 and 77 cm厘米.
230
681458
2392
實際上他身高177公分。
11:35
So, we predicted預料到的 that he's 76;
the subject學科 is 82.
231
683874
4110
我們預測他的體重是76公斤;
實際上是82公斤。
11:40
We predict預測 his age年齡, 38.
232
688701
2632
我們預測他的年齡是38歲。
11:43
The subject學科 is 35.
233
691357
1904
實際上是35歲。
11:45
We predict預測 his eye color顏色.
234
693851
2124
我們預測眼睛的顏色是這樣。
11:48
Too dark黑暗.
235
696824
1211
太暗了。
11:50
We predict預測 his skin皮膚 color顏色.
236
698059
1555
我們預測他的皮膚顏色。
11:52
We are almost幾乎 there.
237
700026
1410
幾乎很接近了。
11:53
That's his face面對.
238
701899
1373
這是他的臉。
11:57
Now, the reveal揭示 moment時刻:
239
705172
3269
現在,真相要大白的時刻了:
12:00
the subject學科 is this person.
240
708465
1770
他長這樣。
12:02
(Laughter笑聲)
241
710259
1935
(笑聲)
12:04
And I did it intentionally故意地.
242
712218
2058
我故意這樣做的。
12:06
I am a very particular特定
and peculiar奇特 ethnicity種族.
243
714300
3692
我是一個非常特別的奇特種族。
12:10
Southern南部的 European歐洲的, Italians意大利 --
they never fit適合 in models楷模.
244
718016
2950
南歐洲人、義大利人——
他們從來不會跟我們的預測相符。
12:12
And it's particular特定 -- that ethnicity種族
is a complex複雜 corner case案件 for our model模型.
245
720990
5130
這個種族在我們的模式下,
就是一個很複雜的特殊案例。
12:18
But there is another另一個 point.
246
726144
1509
但有另外一個重點。
12:19
So, one of the things that we use
a lot to recognize認識 people
247
727677
3477
我們用很多工具
來辨認人的特徵,
12:23
will never be written書面 in the genome基因組.
248
731178
1722
但絕對不會把這些特徵
寫到基因組裡面。
12:24
It's our free自由 will, it's how I look.
249
732924
2317
因為這是我們的自由意志,
我就是長這樣。
12:27
Not my haircut理髮 in this case案件,
but my beard鬍子 cut.
250
735265
3229
在這個案例中,重點不是我的髮型,
而是我的鬍鬚。
12:30
So I'm going to show顯示 you, I'm going to,
in this case案件, transfer轉讓 it --
251
738518
3553
所以,我要秀給各位看,
我會把它轉變一下--
12:34
and this is nothing more
than PhotoshopPhotoshop中, no modeling造型 --
252
742095
2765
就僅是用Photoshop上個鬍子,
12:36
the beard鬍子 on the subject學科.
253
744884
1713
沒有調整其他的。
12:38
And immediately立即, we get
much, much better in the feeling感覺.
254
746621
3472
突然間,感覺就比較像了。
12:42
So, why do we do this?
255
750955
2709
所以,我們為什麼要做這個?
12:47
We certainly當然 don't do it
for predicting預測 height高度
256
755938
5140
我們絕對不是為了預測高度
12:53
or taking服用 a beautiful美麗 picture圖片
out of your blood血液.
257
761102
2372
或拍一張你血液的美麗照片。
12:56
We do it because the same相同 technology技術
and the same相同 approach途徑,
258
764390
4018
我們這樣做的原因是,
這些科技、方法、
13:00
the machine learning學習 of this code,
259
768432
2520
機器自主學習程式,
13:02
is helping幫助 us to understand理解 how we work,
260
770976
3137
可以幫助我們了解
我們要如何進行工作、
13:06
how your body身體 works作品,
261
774137
1486
你的身體是如何運作、
13:07
how your body身體 ages年齡,
262
775647
1665
你的身體如何老化、
13:09
how disease疾病 generates生成 in your body身體,
263
777336
2769
你身上的疾病是如何造成的、
13:12
how your cancer癌症 grows成長 and develops發展,
264
780129
2972
你的癌症是如何成長和擴散的、
13:15
how drugs毒品 work
265
783125
1783
藥物如何運作、
13:16
and if they work on your body身體.
266
784932
2314
以及這些藥物在你身上是否有作用。
13:19
This is a huge巨大 challenge挑戰.
267
787713
1667
這是一個很大的挑戰。
13:21
This is a challenge挑戰 that we share分享
268
789894
1638
這是我們全世界的
研究人員共同的挑戰。
13:23
with thousands數千 of other
researchers研究人員 around the world世界.
269
791556
2579
13:26
It's called personalized個性化 medicine醫學.
270
794159
2222
它叫做個人化醫療。
13:29
It's the ability能力 to move移動
from a statistical統計 approach途徑
271
797125
3460
這種醫療能力是從
傳統的統計方法,
13:32
where you're a dot in the ocean海洋,
272
800609
2032
讓你大海撈針亂吃藥,
13:34
to a personalized個性化 approach途徑,
273
802665
1813
轉成個人客製化的方法,
13:36
where we read all these books圖書
274
804502
2185
都是從閱讀這些書裡面,
13:38
and we get an understanding理解
of exactly究竟 how you are.
275
806711
2864
讓我們了解真正的你。
13:42
But it is a particularly尤其
complicated複雜 challenge挑戰,
276
810260
3362
但這是充滿了複雜的挑戰,
13:45
because of all these books圖書, as of today今天,
277
813646
3998
因為到目前為止,這些書,
13:49
we just know probably大概 two percent百分:
278
817668
2642
我們僅大概了解2%:
13:53
four books圖書 of more than 175.
279
821027
3653
四本書又175頁。
13:58
And this is not the topic話題 of my talk,
280
826021
3206
但這不是我演講的主題,
14:02
because we will learn學習 more.
281
830145
2598
因為我們還有很多要學。
14:05
There are the best最好 minds頭腦
in the world世界 on this topic話題.
282
833378
2669
全世界最聰明的智慧
就在這個主題裡面。
14:09
The prediction預測 will get better,
283
837048
1834
預測會越來越改善,
14:10
the model模型 will get more precise精確.
284
838906
2253
模式會越來越精準。
14:13
And the more we learn學習,
285
841183
1858
我們學得越多,
14:15
the more we will
be confronted面對 with decisions決定
286
843065
4830
我們克服從未面對過
的決策的能力就越強,
14:19
that we never had to face面對 before
287
847919
3021
有關於生命、
14:22
about life,
288
850964
1435
14:24
about death死亡,
289
852423
1674
死亡、
14:26
about parenting育兒.
290
854121
1603
養育的決策。
14:32
So, we are touching接觸 the very
inner detail詳情 on how life works作品.
291
860626
4746
所以,我們正接觸到
生命如何運作的內部細節。
14:38
And it's a revolution革命
that cannot不能 be confined受限
292
866118
3158
而且這個革命不能只侷限在
14:41
in the domain of science科學 or technology技術.
293
869300
2659
主流科學或技術上。
14:44
This must必須 be a global全球 conversation會話.
294
872960
2244
我們需要一個全球性的對話。
14:47
We must必須 start開始 to think of the future未來
we're building建造 as a humanity人性.
295
875798
5217
我們必須開始思考,
我們要建構的人類未來。
14:53
We need to interact相互作用 with creatives創意,
with artists藝術家, with philosophers哲學家,
296
881039
4064
我們需要與創意人才、
藝術家、哲學家
14:57
with politicians政治家.
297
885127
1510
政治家相互配合。
14:58
Everyone大家 is involved參與,
298
886661
1158
每個人都要參與其中,
14:59
because it's the future未來 of our species種類.
299
887843
2825
因為這是我們人類的未來。
15:03
Without沒有 fear恐懼, but with the understanding理解
300
891273
3968
不需要害怕,但需要包容
15:07
that the decisions決定
that we make in the next下一個 year
301
895265
3871
明年我們所做的決定,
15:11
will change更改 the course課程 of history歷史 forever永遠.
302
899160
3789
將永遠地改變歷史。
15:15
Thank you.
303
903732
1160
謝謝各位!
15:16
(Applause掌聲)
304
904916
10159
(掌聲)
Translated by Yi-Fan Yu
Reviewed by Tiana Zhao

▲Back to top

ABOUT THE SPEAKER
Riccardo Sabatini - Scientist, entrepreneur
Riccardo Sabatini applies his expertise in numerical modeling and data to projects ranging from material science to computational genomics and food market predictions.

Why you should listen

Data scientist Riccardo Sabatini harnesses numerical methods for a surprising variety of fields, from material science research to the study of food commodities (as a past director of the EU research project FoodCAST). His most recent research centers on computational genomics and how to crack the code of life.

In addition to his data research, Sabatini is deeply involved in education for entrepreneurs. He is the founder and co-director of the Quantum ESPRESSO Foundation, an advisor in several data-driven startups, and funder of The HUB Trieste, a social impact accelerator.

More profile about the speaker
Riccardo Sabatini | Speaker | TED.com