ABOUT THE SPEAKER
Riccardo Sabatini - Scientist, entrepreneur
Riccardo Sabatini applies his expertise in numerical modeling and data to projects ranging from material science to computational genomics and food market predictions.

Why you should listen

Data scientist Riccardo Sabatini harnesses numerical methods for a surprising variety of fields, from material science research to the study of food commodities (as a past director of the EU research project FoodCAST). His most recent research centers on computational genomics and how to crack the code of life.

In addition to his data research, Sabatini is deeply involved in education for entrepreneurs. He is the founder and co-director of the Quantum ESPRESSO Foundation, an advisor in several data-driven startups, and funder of The HUB Trieste, a social impact accelerator.

More profile about the speaker
Riccardo Sabatini | Speaker | TED.com
TED2016

Riccardo Sabatini: How to read the genome and build a human being

리카르도 사바티니 (Riccardo Sabatini): 유전자를 읽고 사람을 만드는 방법

Filmed:
1,834,677 views

유전자는 사람을 구성하는 모든 유전 정보의 모음입니다. 유전자에는 비밀, 질병, 아름다움의 정보가 공존합니다. 과학자이자 기업가인 리카르도 사바티니는 이 복잡한 암호를 읽어내어 키, 눈의 색깔, 나이 심지어 얼굴 형태를 알아내는 것을 보여줍니다. 피 한 병만 가지구요. 그리고 그는 곧 유전자의 이해가 더 진보하여 암과 같은 질병에 대한 맞춤형 의약이 개발될 것이라고 합니다. 인류는 지금 우리가 아는 형태의 삶을 바꿀 수 있는 힘을 갖게 되는 것입니다. 이 힘을 어떻게 사용해야 할까요?
- Scientist, entrepreneur
Riccardo Sabatini applies his expertise in numerical modeling and data to projects ranging from material science to computational genomics and food market predictions. Full bio

Double-click the English transcript below to play the video.

00:12
For the next다음 것 16 minutes의사록,
I'm going to take you on a journey여행
0
612
2762
앞으로 16분 동안 저는 여러분께
00:15
that is probably아마
the biggest가장 큰 dream of humanity인류:
1
3398
3086
인류의 가장 큰 소원을 향한
여행을 보여드리겠습니다.
00:18
to understand알다 the code암호 of life.
2
6508
2015
생명의 암호를 이해하는 것입니다.
00:21
So for me, everything started시작한
many많은, many많은 years연령 ago...전에
3
9072
2743
모든 것의 시작은 아주 아주 오래전
00:23
when I met만난 the first 3D printer인쇄기.
4
11839
2723
최초의 3D 프린터를 본 것이었습니다.
00:26
The concept개념 was fascinating매혹적인.
5
14586
1674
제겐 이 장치가 놀라웠습니다.
00:28
A 3D printer인쇄기 needs필요 three elements집단:
6
16284
2022
3D 프린터엔 세 가지가 필요합니다.
00:30
a bit비트 of information정보, some
raw노골적인 material자료, some energy에너지,
7
18330
4134
대상의 정보, 출력을 위한 재료,
그리고 에너지만 있으면
00:34
and it can produce생기게 하다 any object목적
that was not there before.
8
22488
3334
이전에는 없었던 것을
만들어 낼 수 있습니다.
00:38
I was doing physics물리학,
I was coming오는 back home
9
26517
2137
물리를 공부하던 저는
집으로 오는 길에
00:40
and I realized깨달은 that I actually사실은
always knew알고 있었다 a 3D printer인쇄기.
10
28678
3438
제 주변에 3D 프린터가
있었다는 것을 깨달았습니다.
00:44
And everyone각자 모두 does.
11
32140
1336
모두 압니다.
00:45
It was my mom엄마.
12
33500
1158
바로 어머니입니다.
00:46
(Laughter웃음)
13
34682
1001
(웃음)
00:47
My mom엄마 takes three elements집단:
14
35707
2414
어머니도 세 가지가 필요합니다.
00:50
a bit비트 of information정보, which어느 is between중에서
my father아버지 and my mom엄마 in this case케이스,
15
38145
3973
먼저 대상의 정보는
부모님이 함께 주시고
00:54
raw노골적인 elements집단 and energy에너지
in the same같은 media미디어, that is food식품,
16
42142
4157
출력 재료와 에너지는
음식에서 나오죠.
00:58
and after several수개 months개월, produces생산하다 me.
17
46323
2508
그리고 몇 달을 거쳐
제가 태어납니다.
01:00
And I was not existent현존하는 before.
18
48855
1812
저는 이전까진 존재하지 않았죠.
01:02
So apart떨어져서 from the shock충격 of my mom엄마
discovering발견 that she was a 3D printer인쇄기,
19
50691
3762
제 어머니가 알고 보니
3D 프린터라는 충격은 둘째 치고요.
01:06
I immediately바로 got mesmerized최면술을 걸친
by that piece조각,
20
54477
4738
저는 세 가지 요소 중 첫 번째인
01:11
the first one, the information정보.
21
59239
1717
대상의 정보에 매혹됐습니다.
01:12
What amount of information정보 does it take
22
60980
2251
사람 한 명을 만들려면
01:15
to build짓다 and assemble모으다 a human인간의?
23
63255
1936
정보가 얼마나 필요할까요?
01:17
Is it much? Is it little?
24
65215
1574
많이? 적게?
01:18
How many많은 thumb무지 drives드라이브 can you fill가득 따르다?
25
66813
2180
USB 메모리론 몇 개일까요?
01:21
Well, I was studying공부하는 physics물리학
at the beginning처음
26
69017
2624
물리를 전공한 사람으로서
01:23
and I took~했다 this approximation근사 of a human인간의
as a gigantic거인 같은 Lego레고 piece조각.
27
71665
5597
저는 사람을 거대한
레고 작품이라고 가정했습니다.
01:29
So, imagine상상하다 that the building건물
blocks블록들 are little atoms원자
28
77286
3785
여기서 블록들을
작은 원자라고 생각하세요.
01:33
and there is a hydrogen수소 here,
a carbon탄소 here, a nitrogen질소 here.
29
81095
4653
여기엔 수소가 있고,
탄소가 있고, 질소도 있겠죠.
01:37
So in the first approximation근사,
30
85772
1571
가정에 의하면
01:39
if I can list명부 the number번호 of atoms원자
that compose짓다 a human인간의 being존재,
31
87367
4343
제가 사람을 구성하는 원자들을
나열할 수 있다면
01:43
I can build짓다 it.
32
91734
1387
사람을 만들 수도 있겠지요.
01:45
Now, you can run운영 some numbers번호
33
93145
2029
여기서 약간 계산을 해보면
01:47
and that happens일이 to be
quite아주 an astonishing놀라운 number번호.
34
95198
3277
천문학적으로 큰 수가 나옵니다.
01:50
So the number번호 of atoms원자,
35
98499
2757
아기 한 명을 만들기 위해
01:53
the file파일 that I will save구하다 in my thumb무지
drive드라이브 to assemble모으다 a little baby아가,
36
101280
4755
필요한 원자의 수를
USB 드라이브에 저장하면
01:58
will actually사실은 fill가득 따르다 an entire완전한 Titanic거대한
of thumb무지 drives드라이브 --
37
106059
4667
드라이브들로 타이타닉 한 척을 채우고
02:02
multiplied곱한 2,000 times타임스.
38
110750
2718
2,000척을 더
채울 수 있습니다.
02:05
This is the miracle기적 of life.
39
113957
3401
이것이 생명의 신비입니다.
02:09
Every마다 time you see from now on
a pregnant충만한 lady레이디,
40
117382
2612
여러분들은 앞으로 임산부를 볼 때마다
02:12
she's assembling조립 the biggest가장 큰
amount of information정보
41
120018
2856
우리가 평생 볼 최대의 정보를
그녀가 처리하는 것을
02:14
that you will ever encounter교전.
42
122898
1556
보게 되는 것입니다.
02:16
Forget잊다 big data데이터, forget잊다
anything you heard들었던 of.
43
124478
2950
빅데이터나 다른 것들은 모두 잊으세요.
02:19
This is the biggest가장 큰 amount
of information정보 that exists존재하다.
44
127452
2881
이것은 존재하는
가장 많은 양의 정보입니다.
02:22
(Applause박수 갈채)
45
130357
3833
(박수)
02:26
But nature자연, fortunately다행히도, is much smarter똑똑한
than a young어린 physicist물리학 자,
46
134214
4644
다행히 자연은 저 같은
물리학자보단 훨씬 현명해서
02:30
and in four billion십억 years연령, managed관리되는
to pack this information정보
47
138882
3576
40억 년의 시간을 들여 이 정보들을
02:34
in a small작은 crystal결정 we call DNADNA.
48
142482
2705
DNA라 불리는 작은
결정으로 압축했습니다.
02:37
We met만난 it for the first time in 1950
when Rosalind로잘린트 Franklin프랭클린,
49
145605
4312
처음으로 DNA가 알려진 것은
1950년 놀라운 과학자이자
02:41
an amazing놀랄 만한 scientist과학자, a woman여자,
50
149941
1556
여성이었던 로잘린 프랭클린이
02:43
took~했다 a picture그림 of it.
51
151521
1389
사진을 찍어서였습니다.
02:44
But it took~했다 us more than 40 years연령
to finally마침내 poke찌름 inside내부 a human인간의 cell세포,
52
152934
5188
하지만 이로부터 40년이 넘는
시간이 지나서야 우리는 인체 세포에서
02:50
take out this crystal결정,
53
158146
1602
이 결정을 분리하고
02:51
unroll풀다 it, and read독서 it for the first time.
54
159772
3080
분석하여 내용을 읽을 수 있었습니다.
02:55
The code암호 comes온다 out to be
a fairly simple단순한 alphabet알파벳,
55
163615
3241
암호는 간단하게
알파벳 4개로 이루어졌습니다.
02:58
four letters편지: A, T, C and G.
56
166880
3772
A, T, C, G로요.
03:02
And to build짓다 a human인간의,
you need three billion십억 of them.
57
170676
3490
사람을 만들기 위해서는
알파벳이 30억 개 필요합니다.
03:06
Three billion십억.
58
174933
1179
30억입니다.
03:08
How many많은 are three billion십억?
59
176136
1579
느낌이 오시나요?
03:09
It doesn't really make
any sense감각 as a number번호, right?
60
177739
2762
숫자로 말하니 느낌이 안 오시죠?
03:12
So I was thinking생각 how
I could explain설명 myself자기 better
61
180525
4085
그래서 저는 어떻게 하면
03:16
about how big and enormous거대한 this code암호 is.
62
184634
3050
이 암호의 거대함, 방대함을
이해할지 고민해보았습니다.
03:19
But there is -- I mean,
I'm going to have some help,
63
187708
3054
도움을 받으면 방법이 있긴 합니다.
03:22
and the best베스트 person사람 to help me
introduce끼워 넣다 the code암호
64
190786
3227
그리고 이에 가장 적절한 분은
03:26
is actually사실은 the first man
to sequence순서 it, Dr박사. Craig크레이그 Venter.
65
194037
3522
최초로 DNA 순서를 밝혀낸
크레이그 벤터 박사님이십니다.
03:29
So welcome환영 onstage무대 위에, Dr박사. Craig크레이그 Venter.
66
197583
3390
올라오세요, 크레이그 벤터 박사님!
03:32
(Applause박수 갈채)
67
200997
6931
(박수)
03:39
Not the man in the flesh육체,
68
207952
2256
본인이 오시진 않았지만
03:43
but for the first time in history역사,
69
211448
2345
인류 역사 최초로
03:45
this is the genome게놈 of a specific특유한 human인간의,
70
213817
3462
한 특정인의 유전자 전체를
03:49
printed인쇄 된 page-by-page페이지 별, letter-by-letter편지로 편지:
71
217303
3760
페이지마다 알파벳으로 채워서
인쇄한 책입니다.
03:53
262,000 pages페이지들 of information정보,
72
221087
3996
장수는 262,000장에,
무게는 450kg입니다.
03:57
450 kilograms킬로그램, shipped선적 된
from the United유나이티드 States to Canada캐나다
73
225107
4364
미국에서 캐나다까지 운반하는 데에는
04:01
thanks감사 to Bruno브루노 Bowden보우 든,
Lulu룰루.comcom, a start-up창업, did everything.
74
229495
4843
신진 기업 Lulu.com의
브루노 보우덴 님이 고생해주셨습니다.
04:06
It was an amazing놀랄 만한 feat위업.
75
234362
1463
큰 도움을 받았습니다.
04:07
But this is the visual시각적 인 perception지각
of what is the code암호 of life.
76
235849
4297
이것이 바로 생명의 암호를
시각적으로 나타낸 것입니다.
04:12
And now, for the first time,
I can do something fun장난.
77
240170
2478
이제 저는 역사 최초로
놀이를 할 수 있습니다.
04:14
I can actually사실은 poke찌름 inside내부 it and read독서.
78
242672
2547
꺼내서 아무 부분이나 읽어보는 거죠.
04:17
So let me take an interesting재미있는
book도서 ... like this one.
79
245243
4625
여기 이 책은 제가 좋아하는 책입니다.
04:25
I have an annotation주석;
it's a fairly big book도서.
80
253077
2534
워낙에 책이 방대해서
주석도 좀 달았습니다.
04:27
So just to let you see
what is the code암호 of life.
81
255635
3727
생명의 암호를 살짝 보여드리죠.
04:32
Thousands수천 and thousands수천 and thousands수천
82
260566
3391
많고도 많고도 많은
산더미 같은 글자들입니다.
04:35
and millions수백만 of letters편지.
83
263981
2670
04:38
And they apparently분명히 make sense감각.
84
266675
2396
그리고 모든 부분은 의미가 있어요.
04:41
Let's get to a specific특유한 part부품.
85
269095
1757
이 부분을 한 번 봅시다.
04:43
Let me read독서 it to you:
86
271571
1362
제가 읽어드릴게요.
04:44
(Laughter웃음)
87
272957
1021
(웃음)
04:46
"AAGAAG, AATAAT, ATAATA."
88
274002
4006
"AAG, AAT, ATA."
04:50
To you it sounds소리 like mute묵자 letters편지,
89
278965
2067
그냥 글자의 배열로 들리시겠지만
04:53
but this sequence순서 gives주는
the color색깔 of the eyes to Craig크레이그.
90
281056
4041
이 부분은 크레이그의 눈에
색깔을 부여합니다.
04:57
I'll show보여 주다 you another다른 part부품 of the book도서.
91
285633
1932
다른 부분도 보여드리지요.
04:59
This is actually사실은 a little
more complicated복잡한.
92
287589
2094
이 구절은 조금 더 복잡합니다.
05:02
Chromosome염색체 14, book도서 132:
93
290983
2647
132권, 염색체 14의 내용입니다.
05:05
(Laughter웃음)
94
293654
2090
(웃음)
05:07
As you might expect배고 있다.
95
295768
1277
예상하신 분도 계시겠죠.
05:09
(Laughter웃음)
96
297069
3466
(웃음)
05:14
"ATTATT, CTTCTT, GATT갓트."
97
302857
4507
"ATT, CTT, GATT."
05:20
This human인간의 is lucky운이 좋은,
98
308329
1687
이 사람은 운이 좋습니다.
05:22
because if you miss미스... just
two letters편지 in this position위치 --
99
310040
4517
왜냐면 이 부분에서 두 자만 빠지면
05:26
two letters편지 of our three billion십억 --
100
314581
1877
30억 자에서 두 자만 빠져도
05:28
he will be condemned저주 받은
to a terrible무서운 disease질병:
101
316482
2019
낭포성 섬유증이란
끔찍한 질병에 걸리기 때문입니다.
05:30
cystic낭성의 fibrosis섬유증.
102
318525
1440
05:31
We have no cure치료법 for it,
we don't know how to solve풀다 it,
103
319989
3413
치료법도 없고
해결법도 모릅니다.
05:35
and it's just two letters편지
of difference from what we are.
104
323426
3755
모두 두 자의 차이만으로
생기는 일입니다.
05:39
A wonderful훌륭한 book도서, a mighty거대한 book도서,
105
327585
2705
매혹적이고, 강렬한 책이지요.
05:43
a mighty거대한 book도서 that helped도움이 된 me understand알다
106
331115
1998
제가 생명을 이해하는 것을 돕고
05:45
and show보여 주다 you something quite아주 remarkable주목할 만한.
107
333137
2753
여러분께 알려드리게 해준 책입니다.
05:48
Every마다 one of you -- what makes~을 만든다
me, me and you, you --
108
336480
4435
우리 모두를 저는 저로,
여러분은 여러분으로 만드는 부분은
05:52
is just about five다섯 million백만 of these,
109
340939
2954
500만 글자로
한권의 절반 정도입니다.
05:55
half절반 a book도서.
110
343917
1228
05:58
For the rest휴식,
111
346015
1663
책의 나머지 부분은 정확히 같습니다.
05:59
we are all absolutely전혀 identical같은.
112
347702
2562
06:03
Five다섯 hundred pages페이지들
is the miracle기적 of life that you are.
113
351008
4018
여러분을 만드는 기적은
단 500페이지 안에서 벌어집니다.
06:07
The rest휴식, we all share it.
114
355050
2531
나머지는 똑같이 일치합니다.
06:09
So think about that again
when we think that we are different다른.
115
357605
2909
그러니 서로가 다르다는 생각이
들 때 떠올리십시오.
06:12
This is the amount that we share.
116
360538
2221
우리는 이만큼이나 같습니다.
06:15
So now that I have your attention주의,
117
363441
3429
흥미가 생긴 분이 많아진 것 같군요.
06:18
the next다음 것 question문제 is:
118
366894
1359
다음 문제는
이 책을 어떻게 읽느냐입니다.
06:20
How do I read독서 it?
119
368277
1151
06:21
How do I make sense감각 out of it?
120
369452
1509
어떻게 이해해야 할까요?
06:23
Well, for however하나 good you can be
at assembling조립 Swedish스웨덴어 furniture가구,
121
371409
4240
여러분이 스웨덴산 가구를
얼마나 잘 조립하는지와 상관없이
06:27
this instruction교수 manual조작
is nothing you can crack갈라진 금 in your life.
122
375673
3563
이것은 일생을 바쳐도
풀 수 없을 겁니다.
06:31
(Laughter웃음)
123
379260
1603
(웃음)
06:32
And so, in 2014, two famous유명한 TEDstersTEDsters,
124
380887
3112
그래서 2014년
유명한 TED 강연자이신
06:36
Peter베드로 Diamandis디아 만 디스 and Craig크레이그 Venter himself그 자신,
125
384023
2540
피터 다이아맨디스와 크레이그 벤터는
06:38
decided결정적인 to assemble모으다 a new새로운 company회사.
126
386587
1927
회사를 설립하기로 했습니다.
06:40
Human인간 Longevity장수 was born타고난,
127
388538
1412
‘Human Longevity’는
한 목적 만을 위해 생겼습니다.
06:41
with one mission사명:
128
389974
1370
06:43
trying견딜 수 없는 everything we can try
129
391368
1861
필요한 모든 수단을 이용하여
06:45
and learning배우기 everything
we can learn배우다 from these books서적,
130
393253
2759
이 책에서 가능한 한
모든 것을 배우는 것입니다.
06:48
with one target목표 --
131
396036
1705
맞춤형 의약의 현실화란
한 목적을 위해서요.
06:50
making만들기 real레알 the dream
of personalized개인화 된 medicine의학,
132
398862
2801
06:53
understanding이해 what things
should be done끝난 to have better health건강
133
401687
3767
이를 위해 인류의
건강을 위한 과제를 찾고
06:57
and what are the secrets기미 in these books서적.
134
405478
2283
책에 숨겨진 비밀을 찾는 것입니다.
07:00
An amazing놀랄 만한 team, 40 data데이터 scientists과학자들
and many많은, many많은 more people,
135
408329
4250
저희 팀은 40명의 데이터 과학자와
더 많은 사람으로 이루어졌습니다.
07:04
a pleasure to work with.
136
412603
1350
모두 존경스러운 분들이죠.
07:05
The concept개념 is actually사실은 very simple단순한.
137
413977
2253
저희의 접근법은 사실
굉장히 간단합니다.
07:08
We're going to use a technology과학 기술
called전화 한 machine기계 learning배우기.
138
416254
3158
저희는 기계 학습이라는
기술을 사용합니다.
07:11
On one side측면, we have genomes게놈 --
thousands수천 of them.
139
419436
4539
먼저 유전자를 수천 개 채취하고
07:15
On the other side측면, we collected모은
the biggest가장 큰 database데이터 베이스 of human인간의 beings존재들:
140
423999
3997
동시에 인간에 관한
모든 정보를 조사합니다.
07:20
phenotypes표현형, 3D scan주사, NMRNMR --
everything you can think of.
141
428020
4296
표현형, 3D 스캔, NMR을
포함한 모든 것을요.
07:24
Inside내부 there, on these two opposite반대말 sides양쪽,
142
432340
2899
이 두 개 사이에 유전자를
읽기 위한 비밀이 있겠죠.
07:27
there is the secret비밀 of translation번역.
143
435263
2442
07:29
And in the middle중간, we build짓다 a machine기계.
144
437729
2472
그리고 이 단계에서 기계가 사용됩니다.
07:32
We build짓다 a machine기계
and we train기차 a machine기계 --
145
440801
2385
기계를 만들고, 훈련합니다.
07:35
well, not exactly정확하게 one machine기계,
many많은, many많은 machines기계들 --
146
443210
3210
한 개가 아닌 엄청난 수의 기계들을
07:38
to try to understand알다 and translate옮기다
the genome게놈 in a phenotype표현형.
147
446444
4544
유전자의 내용으로부터
표현형을 찾도록 훈련합니다.
07:43
What are those letters편지,
and what do they do?
148
451362
3340
각 DNA 알파벳은 무엇이고
어떤 역할을 하는지 조사하도록 말이죠.
07:46
It's an approach접근 that can
be used for everything,
149
454726
2747
기계 학습은 모든 분야에서 사용되지만,
07:49
but using~을 사용하여 it in genomics유전체학
is particularly특별히 complicated복잡한.
150
457497
2993
유전체학에서 사용하는 것은
특히 어렵습니다.
07:52
Little by little we grew자랐다 and we wanted
to build짓다 different다른 challenges도전.
151
460514
3276
조금씩 성과를 내면서
저희는 과제들을 확장해갔습니다.
07:55
We started시작한 from the beginning처음,
from common공유지 traits형질.
152
463814
2732
먼저 인간의 일반적 특징부터
해독했습니다.
07:58
Common공유지 traits형질 are comfortable편안
because they are common공유지,
153
466570
2603
일반적 특징은
모두가 가진 특징이어서
08:01
everyone각자 모두 has them.
154
469197
1184
다루기 편해서이죠.
08:02
So we started시작한 to ask청하다 our questions질문들:
155
470405
2494
과제들은 다음과 같았습니다.
08:04
Can we predict예측하다 height신장?
156
472923
1380
키를 예측할 수 있을까?
08:06
Can we read독서 the books서적
and predict예측하다 your height신장?
157
474985
2177
이 책에서 사람의 키를 알 수 있을까?
08:09
Well, we actually사실은 can,
158
477186
1151
정말 가능한 일이더군요.
08:10
with five다섯 centimeters센티미터 of precision정도.
159
478361
1793
5cm 오차로요.
08:12
BMIBMI is fairly connected연결된 to your lifestyle라이프 스타일,
160
480178
3135
체질량지수는
생활습관에 좌우됩니다만
08:15
but we still can, we get in the ballpark야구장,
eight여덟 kilograms킬로그램 of precision정도.
161
483337
3864
여전히 8kg 오차로 얼추 맞더군요.
08:19
Can we predict예측하다 eye color색깔?
162
487225
1231
눈 색깔도 알까요?
08:20
Yeah, we can.
163
488480
1158
가능합니다. 80%로요.
08:21
Eighty여든 percent퍼센트 accuracy정확성.
164
489662
1324
08:23
Can we predict예측하다 skin피부 color색깔?
165
491466
1858
피부 색깔은요?
08:25
Yeah we can, 80 percent퍼센트 accuracy정확성.
166
493348
2441
역시 80%로 가능합니다.
08:27
Can we predict예측하다 age나이?
167
495813
1340
나이도 될까요?
08:30
We can, because apparently분명히,
the code암호 changes변화들 during...동안 your life.
168
498121
3739
그럼요. 세월이 지나면서
암호가 바뀌거든요.
08:33
It gets도착 shorter더 짧은, you lose잃다 pieces조각들,
it gets도착 insertions삽입.
169
501884
3282
짧아지고, 내용이 빠지고,
들어가기도 하지요.
08:37
We read독서 the signals신호들, and we make a model모델.
170
505190
2555
이런 징후를 찾아서
모델화하면 가능합니다.
08:40
Now, an interesting재미있는 challenge도전:
171
508438
1475
이제 재밌는 내용이 나옵니다.
08:41
Can we predict예측하다 a human인간의 face얼굴?
172
509937
1729
사람의 얼굴을 알 수 있을까요?
08:45
It's a little complicated복잡한,
173
513014
1278
이 과제가 어려운 이유는
08:46
because a human인간의 face얼굴 is scattered뿔뿔이 흩어진
among사이에 millions수백만 of these letters편지.
174
514316
3191
얼굴을 이루는 부분이
책 곳곳에 퍼져있기 때문입니다.
08:49
And a human인간의 face얼굴 is not
a very well-defined잘 정의 된 object목적.
175
517531
2629
얼굴이란 개념 자체가
명확하지 않기도 하고요.
08:52
So, we had to build짓다 an entire완전한 tier of it
176
520184
2051
그래서 먼저 얼굴을 정의해서
08:54
to learn배우다 and teach가르치다
a machine기계 what a face얼굴 is,
177
522259
2710
기계에 가르치고
08:56
and embed깊숙이 박다 and compress압박 붕대 it.
178
524993
2037
코딩, 압축하는 일을
모두 해야 했습니다.
08:59
And if you're comfortable편안
with machine기계 learning배우기,
179
527054
2248
기계 학습을 잘 아시는 분이시면
09:01
you understand알다 what the challenge도전 is here.
180
529326
2284
이 과정이 얼마나 힘들지 아실 겁니다.
09:04
Now, after 15 years연령 -- 15 years연령 after
we read독서 the first sequence순서 --
181
532108
5991
그리고 인류가 DNA 배열을
알아낸 지 15년이 지나서
09:10
this October십월, we started시작한
to see some signals신호들.
182
538123
2902
올해 10월부터 실마리가
보이기 시작했습니다.
09:13
And it was a very emotional정서적 인 moment순간.
183
541049
2455
아주 감동적인 순간이었습니다.
09:15
What you see here is a subject제목
coming오는 in our lab.
184
543528
3745
이 얼굴은 우리 연구원
한 명의 얼굴입니다.
09:19
This is a face얼굴 for us.
185
547619
1928
기계로 예측해야 할 얼굴이죠.
09:21
So we take the real레알 face얼굴 of a subject제목,
we reduce줄이다 the complexity복잡성,
186
549571
3631
실제 사진을 찍고
단순화 과정을 조금 거쳤습니다.
09:25
because not everything is in your face얼굴 --
187
553226
1970
얼굴에 있는 많은 특징,
흠, 비대칭 구조가
09:27
lots of features풍모 and defects결함
and asymmetries비대칭 come from your life.
188
555220
3786
생후에 생긴 것이기 때문이죠.
09:31
We symmetrize대칭 the face얼굴,
and we run운영 our algorithm연산.
189
559030
3469
얼굴을 대칭 구조로 편집한 후
알고리즘을 실행합니다.
09:35
The results결과들 that I show보여 주다 you right now,
190
563245
1898
지금 보여드리는 이미지는
09:37
this is the prediction예측 we have
from the blood.
191
565167
3372
혈액에서 얼굴을 예상한 결과입니다.
09:41
(Applause박수 갈채)
192
569596
1524
(박수)
09:43
Wait a second둘째.
193
571144
1435
잠시만요.
09:44
In these seconds, your eyes are watching보고있다,
left and right, left and right,
194
572603
4692
여러분들은 지금 두 이미지를
좌우로 번갈아 보면서
09:49
and your brain wants
those pictures영화 to be identical같은.
195
577319
3930
속으로 두 사진이 당연히
같을 것이라 여길 수 있습니다.
09:53
So I ask청하다 you to do
another다른 exercise운동, to be honest정직한.
196
581273
2446
저는 여러분이 정직하게
보시길 바랍니다.
09:55
Please search수색 for the differences차이점들,
197
583743
2287
차이점들을 찾아보시기 바랍니다.
09:58
which어느 are many많은.
198
586054
1361
09:59
The biggest가장 큰 amount of signal신호
comes온다 from gender성별,
199
587439
2603
비슷한지를 판단하는 기준은 성별,
10:02
then there is age나이, BMIBMI,
the ethnicity민족 component구성 요소 of a human인간의.
200
590066
5201
나이, 체질량지수,
민족성으로 크게 나뉘겠죠.
10:07
And scaling스케일링 up over that signal신호
is much more complicated복잡한.
201
595291
3711
그 사이에서 중요도를 따지는 것은
더 복잡할 것입니다.
10:11
But what you see here,
even in the differences차이점들,
202
599026
3250
하지만 차이들을 생각해도 결과를 보시면
10:14
lets~시키다 you understand알다
that we are in the right ballpark야구장,
203
602300
3595
저희가 목표로 제대로 가고 있고
10:17
that we are getting점점 closer더 가까운.
204
605919
1348
근접해감을 아실 겁니다.
10:19
And it's already이미 giving주는 you some emotions감정.
205
607291
2349
감동을 하신 분도 계실 것입니다.
10:21
This is another다른 subject제목
that comes온다 in place장소,
206
609664
2703
다른 실험대상의 사진과
예상결과입니다.
10:24
and this is a prediction예측.
207
612391
1409
10:25
A little smaller더 작은 face얼굴, we didn't get
the complete완전한 cranial두개의 structure구조,
208
613824
4596
얼굴이 좀 작게 나왔고
두상이 완전하지는 않지만
10:30
but still, it's in the ballpark야구장.
209
618444
2651
여전히 대체로 같습니다.
10:33
This is a subject제목 that comes온다 in our lab,
210
621634
2224
다른 연구원의 사진과 예상결과입니다.
10:35
and this is the prediction예측.
211
623882
1443
10:38
So these people have never been seen
in the training훈련 of the machine기계.
212
626056
4676
저희는 기계를 훈련하면서
이 얼굴들을 보여주지 않았습니다.
10:42
These are the so-called소위 "held-out밖으로 나가는" set세트.
213
630756
2837
이렇게 테스트와 훈련이 분리된 것을
“헬드 아웃”이라 합니다.
10:45
But these are people that you will
probably아마 never believe.
214
633617
3740
하지만 모르는 사람들의 얼굴만
봐서는 믿음이 안 가시겠죠.
10:49
We're publishing출판 everything
in a scientific과학적 publication출판,
215
637381
2676
저희는 저널에 관련정보를
모두 기고하고 있으니
10:52
you can read독서 it.
216
640081
1151
읽어보실 수 있습니다.
10:53
But since이후 we are onstage무대 위에,
Chris크리스 challenged도전 한 me.
217
641256
2344
그래서 크리스가 제게 제안을 하더군요.
10:55
I probably아마 exposed드러난 myself자기
and tried시도한 to predict예측하다
218
643624
3626
강연에서 여러분이 아는 사람의
분석 결과를 비교해보라고요.
10:59
someone어떤 사람 that you might recognize인정하다.
219
647274
2831
11:02
So, in this vial유리 병 of blood --
and believe me, you have no idea생각
220
650470
4425
자, 여기 혈액 한 병이 있고
지금 여러분은 이게 누구 것인지
전혀 모르십니다.
11:06
what we had to do to have
this blood now, here --
221
654919
2880
11:09
in this vial유리 병 of blood is the amount
of biological생물학의 information정보
222
657823
3901
이 한 병에는 저희가 유전자 분석을
11:13
that we need to do a full완전한 genome게놈 sequence순서.
223
661748
2277
완벽하게 할 수 있는 양의
생물학적 정보가 있습니다.
11:16
We just need this amount.
224
664049
2070
이 양이면 충분합니다.
11:18
We ran달렸다 this sequence순서,
and I'm going to do it with you.
225
666528
3205
분석 결과를 여러분께 보여드리겠습니다.
11:21
And we start스타트 to layer up
all the understanding이해 we have.
226
669757
3979
결과들을 하나씩 살펴봅시다.
11:25
In the vial유리 병 of blood,
we predicted예언 된 he's a male남성.
227
673760
3350
혈액에서 대상이
남성일 것이라 예상했습니다.
11:29
And the subject제목 is a male남성.
228
677134
1364
맞아요. 남성이죠.
11:30
We predict예측하다 that he's a meter미터 and 76 cm센티미터.
229
678996
2438
키를 1m 76cm라 예상했네요.
11:33
The subject제목 is a meter미터 and 77 cm센티미터.
230
681458
2392
실제 대상은 1m 77cm에요.
11:35
So, we predicted예언 된 that he's 76;
the subject제목 is 82.
231
683874
4110
예상은 76kg이었고
실제는 82kg에요.
11:40
We predict예측하다 his age나이, 38.
232
688701
2632
나이는 38세로 나왔군요.
11:43
The subject제목 is 35.
233
691357
1904
사실은 35세죠.
11:45
We predict예측하다 his eye color색깔.
234
693851
2124
눈의 색깔 예상 결과입니다.
11:48
Too dark어두운.
235
696824
1211
좀 어둡네요.
11:50
We predict예측하다 his skin피부 color색깔.
236
698059
1555
예상한 피부색입니다.
11:52
We are almost거의 there.
237
700026
1410
거의 근접했네요.
11:53
That's his face얼굴.
238
701899
1373
예상한 얼굴입니다.
11:57
Now, the reveal창틀 moment순간:
239
705172
3269
이제 정답을 공개합니다.
12:00
the subject제목 is this person사람.
240
708465
1770
대상은 이 사람이었습니다.
12:02
(Laughter웃음)
241
710259
1935
(웃음)
12:04
And I did it intentionally의도적으로.
242
712218
2058
저를 택한 건 의도적이었습니다.
12:06
I am a very particular특별한
and peculiar독특한 ethnicity민족.
243
714300
3692
먼저 저는 매우 특별한 민족에
속해있습니다.
12:10
Southern남부 지방 사투리 European유럽 ​​사람, Italians이탈리아 사람 --
they never fit적당한 in models모델.
244
718016
2950
남유럽, 이탈리아인은
모델에 잘 맞지 않습니다.
12:12
And it's particular특별한 -- that ethnicity민족
is a complex복잡한 corner모서리 case케이스 for our model모델.
245
720990
5130
남유럽인은 저희 모델의
난점 중 하나입니다.
12:18
But there is another다른 point포인트.
246
726144
1509
다른 이유도 있습니다.
12:19
So, one of the things that we use
a lot to recognize인정하다 people
247
727677
3477
사실 저희가 사람을 알아볼 때는
12:23
will never be written in the genome게놈.
248
731178
1722
유전자의 배열을 고려하진 않죠.
12:24
It's our free비어 있는 will, it's how I look.
249
732924
2317
바로 보이는 그대로 판단하죠.
12:27
Not my haircut이발 in this case케이스,
but my beard수염 cut절단.
250
735265
3229
제 경우엔 제 특이한 수염에
집중하게 되죠.
12:30
So I'm going to show보여 주다 you, I'm going to,
in this case케이스, transfer이전 it --
251
738518
3553
그래서 조금 이미지를 편집해서
보여드리겠습니다.
12:34
and this is nothing more
than Photoshop포토샵, no modeling모델링 --
252
742095
2765
별건 아니고 포토샵으로 작업해서
12:36
the beard수염 on the subject제목.
253
744884
1713
수염을 합성한 겁니다.
12:38
And immediately바로, we get
much, much better in the feeling감각.
254
746621
3472
한순간에 훨씬 더 비슷하게 변했죠.
12:42
So, why do we do this?
255
750955
2709
저희는 왜 이런 일을 할까요?
12:47
We certainly확실히 don't do it
for predicting예측하는 height신장
256
755938
5140
혈액으로부터 키를 예측하거나
12:53
or taking취득 a beautiful아름다운 picture그림
out of your blood.
257
761102
2372
놀라운 사진을 만들기 위해선 아닙니다.
12:56
We do it because the same같은 technology과학 기술
and the same같은 approach접근,
258
764390
4018
그 이유는 이 과정과 같은
기술과 접근법을 가지고
13:00
the machine기계 learning배우기 of this code암호,
259
768432
2520
같은 기계 학습 코드로
13:02
is helping거들기 us to understand알다 how we work,
260
770976
3137
어떻게 우리가 작동하는지
13:06
how your body신체 works공장,
261
774137
1486
어떻게 몸이 작동하고
13:07
how your body신체 ages나이,
262
775647
1665
어떻게 나이가 들고
13:09
how disease질병 generates생성하다 in your body신체,
263
777336
2769
어떻게 병이 들고
13:12
how your cancer grows자라다 and develops발전하다,
264
780129
2972
어떻게 암이 퍼지고
13:15
how drugs약제 work
265
783125
1783
약이 어떻게 몸에 작용하는지
알 수 있기 때문입니다.
13:16
and if they work on your body신체.
266
784932
2314
13:19
This is a huge거대한 challenge도전.
267
787713
1667
이건 몹시 어려운 과제입니다.
13:21
This is a challenge도전 that we share
268
789894
1638
이 과제는 세계 전역에서
13:23
with thousands수천 of other
researchers연구원 around the world세계.
269
791556
2579
수천 명이 함께 답을 찾고 있습니다.
13:26
It's called전화 한 personalized개인화 된 medicine의학.
270
794159
2222
맞춤형 의약이라는 과제입니다.
13:29
It's the ability능력 to move움직임
from a statistical통계상의 approach접근
271
797125
3460
이것은 의약의 통계적인
접근에서, 말하자면
13:32
where you're a dot in the ocean대양,
272
800609
2032
여러분 각각은 작은 의미뿐인 방법에서
13:34
to a personalized개인화 된 approach접근,
273
802665
1813
개개인에 맞춘 접근으로
13:36
where we read독서 all these books서적
274
804502
2185
이 책에 쓰인 내용을 토대로
13:38
and we get an understanding이해
of exactly정확하게 how you are.
275
806711
2864
우리가 정확히 여러분의 상태를
이해하는 능력인 것입니다.
13:42
But it is a particularly특별히
complicated복잡한 challenge도전,
276
810260
3362
이 과정은 매우 복잡합니다.
13:45
because of all these books서적, as of today오늘,
277
813646
3998
실제로 모든 책에서 오늘까지
우리가 이해하는 부분은
13:49
we just know probably아마 two percent퍼센트:
278
817668
2642
2%에 불과합니다.
13:53
four books서적 of more than 175.
279
821027
3653
175권 중 4권 분량이죠.
13:58
And this is not the topic이야기 of my talk,
280
826021
3206
이는 제가 하고싶은 이야기는 아니지만
14:02
because we will learn배우다 more.
281
830145
2598
앞으로 연구하면서
더 알게 될 것입니다.
14:05
There are the best베스트 minds마음
in the world세계 on this topic이야기.
282
833378
2669
세계 최고의 석학들이
연구하고 있습니다.
14:09
The prediction예측 will get better,
283
837048
1834
예상은 더 잘 맞고
14:10
the model모델 will get more precise정확한.
284
838906
2253
모델은 더 정확해질 것입니다.
14:13
And the more we learn배우다,
285
841183
1858
더 다양한 지식을 쌓을수록
14:15
the more we will
be confronted마주 친 with decisions결정들
286
843065
4830
인류는 이전까지는 선택할 수 없었던
14:19
that we never had to face얼굴 before
287
847919
3021
삶, 죽음, 육아에 관한 선택을
할 수 있게 될 것입니다.
14:22
about life,
288
850964
1435
14:24
about death죽음,
289
852423
1674
14:26
about parenting육아.
290
854121
1603
저희는 삶이 작동하는 원리의
핵심에 다가가고 있습니다.
14:32
So, we are touching만지고있는 the very
inner안의 detail세부 묘사 on how life works공장.
291
860626
4746
14:38
And it's a revolution혁명
that cannot~ 할 수 없다. be confined갇힌
292
866118
3158
이렇게 큰 혁명을 일으킬 발견을
14:41
in the domain도메인 of science과학 or technology과학 기술.
293
869300
2659
과학기술의 영역에만
가두어선 안 됩니다.
14:44
This must절대로 필요한 것 be a global글로벌 conversation대화.
294
872960
2244
전 영역의 소통이 필요합니다.
14:47
We must절대로 필요한 것 start스타트 to think of the future미래
we're building건물 as a humanity인류.
295
875798
5217
저희는 한 인류로서 함께
만들어갈 미래를 생각해야 합니다.
14:53
We need to interact상호 작용하다 with creatives광고 문안,
with artists예술가들, with philosophers철학자,
296
881039
4064
작가, 예술가, 철학가, 정치인이
협력해야 합니다.
14:57
with politicians정치인.
297
885127
1510
14:58
Everyone각자 모두 is involved뒤얽힌,
298
886661
1158
모두 함께여야 합니다.
14:59
because it's the future미래 of our species.
299
887843
2825
이것은 인류의 미래이기 때문입니다.
15:03
Without없이 fear무서움, but with the understanding이해
300
891273
3968
두려움을 떨쳐내고
15:07
that the decisions결정들
that we make in the next다음 것 year
301
895265
3871
앞으로 우리가 내릴 선택이
역사를 영원히 바꿀 것이란
책임감을 느끼고 나아가야 합니다.
15:11
will change변화 the course코스 of history역사 forever영원히.
302
899160
3789
15:15
Thank you.
303
903732
1160
감사합니다.
15:16
(Applause박수 갈채)
304
904916
10159
(박수)
Translated by Bill Kil
Reviewed by Seon-gyu Choi

▲Back to top

ABOUT THE SPEAKER
Riccardo Sabatini - Scientist, entrepreneur
Riccardo Sabatini applies his expertise in numerical modeling and data to projects ranging from material science to computational genomics and food market predictions.

Why you should listen

Data scientist Riccardo Sabatini harnesses numerical methods for a surprising variety of fields, from material science research to the study of food commodities (as a past director of the EU research project FoodCAST). His most recent research centers on computational genomics and how to crack the code of life.

In addition to his data research, Sabatini is deeply involved in education for entrepreneurs. He is the founder and co-director of the Quantum ESPRESSO Foundation, an advisor in several data-driven startups, and funder of The HUB Trieste, a social impact accelerator.

More profile about the speaker
Riccardo Sabatini | Speaker | TED.com