TEDxVienna
Dina Zielinski: How we can store digital data in DNA
디나 질린스키(Dina Zielinski): 디지털 데이터를 DNA에 저장하는 방법
Filmed:
Readability: 4.4
1,777,866 views
플로피 디스크부터 USB 메모리까지 데이터를 저장하는 모든 방법은 결국 쓸모없어지게 됩니다. 만약 이 세상의 모든 데이터를 영원히 저장하는 방법을 찾는다면 어떻게 될까요? 생물정보학자 디나 질린스키가 그 과학적 해법에 대해 이야기 합니다. 수십억 년 전부터 이미 존재해 온 그 해법은 바로, DNA입니다.
Dina Zielinski - Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA. Full bio
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA. Full bio
Double-click the English transcript below to play the video.
00:12
I could fit all movies ever made
inside of this tube.
inside of this tube.
0
652
5196
저는 지금껏 만들어진 모든 영화를
이 시험관에 넣을 수 있습니다.
이 시험관에 넣을 수 있습니다.
00:17
If you can't see it,
that's kind of the point.
that's kind of the point.
1
5872
2253
여러분이 볼 수 없다는 것.
바로 그게 문제죠.
바로 그게 문제죠.
00:20
(Laughter)
2
8149
1016
(웃음)
00:21
Before we understand how this is possible,
3
9189
3243
이것이 어떻게 가능한지 알기 전에
00:24
it's important to understand
the value of this feat.
the value of this feat.
4
12456
3746
이 업적의 가치를
이해하는 것이 중요합니다.
이해하는 것이 중요합니다.
00:29
All of our thoughts
and actions these days,
and actions these days,
5
17075
2266
오늘날 우리의 모든 생각과 행동들
00:31
through photos and videos --
6
19365
1986
사진과 영상
00:33
even our fitness activities --
7
21375
1879
심지어 신체활동까지
00:35
are stored as digital data.
8
23278
2133
모든 게 디지털 데이터로 저장됩니다.
00:38
Aside from running out of space
9
26109
1517
우리 핸드폰 용량이
부족하다는 것 말고는
부족하다는 것 말고는
00:39
on our phones,
10
27650
1151
00:40
we rarely think about
our digital footprint.
our digital footprint.
11
28825
2314
그 디지털 발자취에 대해서는
별로 생각하지 않죠.
별로 생각하지 않죠.
00:43
But humanity has collectively
generated more data
generated more data
12
31536
3528
하지만 지난 몇 년간 우리 인류는
더 많은 데이터를 생산하고 있습니다.
더 많은 데이터를 생산하고 있습니다.
00:47
in the last few years
13
35088
1873
00:48
than all of preceding human history.
14
36985
2530
이전의 모든 인류 역사가
생산한 양에 비해서 말이죠.
생산한 양에 비해서 말이죠.
00:51
Big data has become a big problem.
15
39902
2898
많은 데이터는 큰 문젯거리가 되었습니다.
00:55
Digital storage is really expensive,
16
43229
2817
디지털 저장장치는 매우 비싸고
00:58
and none of these devices that we have
really stand the test of time.
really stand the test of time.
17
46070
3723
이 장치들 중 어느 것도
세월이 지나도 건재하지 않습니다.
세월이 지나도 건재하지 않습니다.
01:03
There's this nonprofit website
called the Internet Archive.
called the Internet Archive.
18
51256
3750
여기 인터넷 아카이브라는
비영리 웹사이트가 있습니다.
비영리 웹사이트가 있습니다.
01:07
In addition to free books and movies,
19
55030
2645
무료 책과 영화는 물론이고
01:09
you can access web pages
as far back as 1996.
as far back as 1996.
20
57699
4364
1996년부터의 웹페이지 기록을
볼 수 있는 사이트입니다.
볼 수 있는 사이트입니다.
01:14
Now, this is very tempting,
21
62087
1684
정말 솔깃하지요.
01:15
but I decided to go back and look at
the TED website's very humble beginnings.
the TED website's very humble beginnings.
22
63795
5989
그래서 저는 TED 홈페이지의
초라한 시작점을 돌아보고 싶었습니다.
초라한 시작점을 돌아보고 싶었습니다.
01:21
As you can see, it's changed
quite a bit in the last 30 years.
quite a bit in the last 30 years.
23
69808
3912
보시는 것처럼 지난 30년간
꽤 많이 변모했습니다.
꽤 많이 변모했습니다.
01:26
So this led me to the first-ever TED,
24
74720
2824
이를 통해 최초의 TED를
접할 수 있었어요.
접할 수 있었어요.
01:29
back in 1984,
25
77568
2180
1984년으로 돌아가봤죠.
01:31
and it just so happened
to be a Sony executive
to be a Sony executive
26
79772
2525
마침 소니 경영진의 강연을 보게 됐고
01:34
explaining how a compact disk works.
27
82321
3058
그는 CD가 어떻게 작동하는지
설명하고 있었습니다.
설명하고 있었습니다.
01:37
(Laughter)
28
85403
1079
(웃음)
01:38
Now, it's really incredible
to be able to go back in time
to be able to go back in time
29
86506
4264
과거로 돌아갈 수 있다는 것은
정말 놀랍습니다.
정말 놀랍습니다.
01:42
and access this moment.
30
90794
2286
그 순간을 접할 수 있다는 것도 말이죠.
01:45
It's also really fascinating
that after 30 years, after that first TED,
that after 30 years, after that first TED,
31
93548
5363
정말 흥미로운 점은
최초의 TED 이후에
30년이 지난 지금도
30년이 지난 지금도
01:50
we're still talking about digital storage.
32
98935
2779
여전히 디지털 저장장치에 대해
이야기하고 있다는 것입니다.
이야기하고 있다는 것입니다.
01:54
Now, if we look back another 30 years,
33
102827
2787
이제 30년을 더 되돌아 가보면
01:57
IBM released the first-ever hard drive
34
105638
3185
IBM이 최초의 하드 드라이브를
출시했습니다.
출시했습니다.
02:00
back in 1956.
35
108847
2127
1956년의 일이죠.
02:02
Here it is being loaded for shipping
in front of a small audience.
in front of a small audience.
36
110998
4197
이것은 몇몇 사람들 앞에서
그 장치를 배에 싣고 있는 모습입니다.
그 장치를 배에 싣고 있는 모습입니다.
02:07
It held the equivalent of one MP3 song
37
115569
3110
이 장치에는 MP3 파일
하나를 저장할 수 있었고
하나를 저장할 수 있었고
02:11
and weighed over one ton.
38
119354
2004
무게는 1톤이 넘었습니다.
02:14
At 10,000 dollars a megabyte,
39
122100
2651
1 메가 바이트당 비용이
10,000 달러였죠.
10,000 달러였죠.
02:16
I don't think anyone in this room
would be interested in buying this thing,
would be interested in buying this thing,
40
124775
3587
여기 계시는 그 누구도
이걸 사려고 하실 분은 없을 거예요.
이걸 사려고 하실 분은 없을 거예요.
02:20
except maybe as a collector's item.
41
128386
1760
수집 목적이 아니고서 말이죠.
02:22
But it's the best we could do at the time.
42
130817
2988
하지만 당시에는 이것이 최선이었습니다.
02:26
We've come such a long way
in data storage.
in data storage.
43
134832
3116
우리는 데이터 저장장치 분야에서
긴 여정을 거쳐왔습니다.
긴 여정을 거쳐왔습니다.
02:29
Devices have evolved dramatically.
44
137972
2898
장치들은 급격하게 발전했죠.
02:32
But all media eventually wear out
or become obsolete.
or become obsolete.
45
140894
4024
하지만 모든 저장수단은 결국
소멸하거나 쓸모없게 됩니다.
소멸하거나 쓸모없게 됩니다.
02:37
If someone handed you a floppy drive today
to back up your presentation,
to back up your presentation,
46
145401
4417
만약 오늘 누군가 발표자료를 저장하라고
여러분에게 플로피 디스크를 건넸다면
여러분에게 플로피 디스크를 건넸다면
02:41
you'd probably look at them
kind of strange, maybe laugh,
kind of strange, maybe laugh,
47
149842
2940
그를 이상한 눈으로 봤을 거예요.
혹은 비웃었을지도 모르죠.
혹은 비웃었을지도 모르죠.
02:44
but you'd have no way
to use the damn thing.
to use the damn thing.
48
152806
2415
게다가 그 고물을 쓸 방법도 없어요.
02:47
These devices can no longer meet
our storage needs,
our storage needs,
49
155854
3141
이 저장장치는 우리의 저장 수요를
더이상 충족할 수 없습니다.
더이상 충족할 수 없습니다.
02:51
although some of them can be repurposed.
50
159019
2702
다른 용도로 쓸 수는 있겠네요.
02:54
All technology eventually dies or is lost,
51
162682
3109
모든 기술은 결국
사라지거나 소실됩니다.
사라지거나 소실됩니다.
02:57
along with our data,
52
165815
1851
정보는 물론이고
02:59
all of our memories.
53
167690
1540
우리 기억도 마찬가지죠.
03:02
There's this illusion that
the storage problem has been solved,
the storage problem has been solved,
54
170210
4116
저장 문제가 해결되었다고
착각하기도 합니다.
착각하기도 합니다.
03:06
but really, we all just externalize it.
55
174350
2493
하지만 표면적으로는
그렇게 보일 뿐입니다.
그렇게 보일 뿐입니다.
03:08
We don't worry about storing
our emails and our photos.
our emails and our photos.
56
176867
3477
이메일이나 사진을 저장하는 건
걱정거리가 아닙니다.
걱정거리가 아닙니다.
03:12
They're just in the cloud.
57
180368
1723
클라우드 안에 다 있으니까요.
03:15
But behind the scenes,
storage is problematic.
storage is problematic.
58
183231
2937
하지만 그 이면에는
저장 방법에 문제가 있습니다.
저장 방법에 문제가 있습니다.
03:18
After all, the cloud is just
a lot of hard drives.
a lot of hard drives.
59
186192
3980
결국, 클라우드도 그저
많은 하드 드라이브일 뿐이니까요.
많은 하드 드라이브일 뿐이니까요.
03:23
Now, most digital data,
we could argue, is not really critical.
we could argue, is not really critical.
60
191156
4040
자, 대부분의 데이터는 그리
중요하지 않다고 주장할 수도 있습니다.
중요하지 않다고 주장할 수도 있습니다.
03:27
Surely, we could just delete it.
61
195220
2123
그런 것들은 그냥 삭제하면 되겠죠.
03:29
But how can we really know
what's important today?
what's important today?
62
197957
3535
하지만 지금 무엇이 중요한지
어떻게 알 수 있을까요?
어떻게 알 수 있을까요?
03:34
We've learned so much about human history
63
202132
2536
우리는 인류 역사에서
정말 많은 것을 배웠습니다.
정말 많은 것을 배웠습니다.
03:36
from drawings and writings in caves,
64
204692
2826
동굴 안의 벽화와 글
03:39
from stone tablets.
65
207542
1614
석판에서 말이죠.
03:41
We've deciphered languages
from the Rosetta Stone.
from the Rosetta Stone.
66
209180
3397
우리는 로제타 석판의 언어를
해독하기도 했습니다.
해독하기도 했습니다.
03:45
You know, we'll never really have
the whole story, though.
the whole story, though.
67
213841
3609
하지만 그 전체 이야기를
알 수는 없을 것입니다.
알 수는 없을 것입니다.
03:49
Our data is our story,
68
217474
1894
우리의 데이터는 우리의 이야기입니다.
03:51
even more so today.
69
219392
1735
심지어 오늘날에는 더욱 그렇죠.
03:53
We won't have our record
recorded on stone tablets.
recorded on stone tablets.
70
221508
3261
이제는 우리에 대한 기록을
석판에 새기지 않습니다.
석판에 새기지 않습니다.
03:57
But we don't have to choose
what is important now.
what is important now.
71
225692
2698
그러나 이제 무엇이 중요한지
선택하지 않아도 됩니다.
선택하지 않아도 됩니다.
04:00
There's a way to store it all.
72
228847
1893
모든 걸 저장할 방법이 있으니까요.
04:03
It turns out that there's
a solution that's been around
a solution that's been around
73
231519
2598
알고보니 해결책이 이미
우리 주위에 있었습니다.
우리 주위에 있었습니다.
04:06
for a few billion years,
74
234141
2443
수십억 년 전부터 말이죠.
04:08
and it's actually in this tube.
75
236608
1840
그리고 그게 이 시험관 안에 있습니다.
04:12
DNA is nature's oldest storage device.
76
240044
3722
DNA는 자연의 가장 오래된
저장장치입니다.
저장장치입니다.
04:15
After all, it contains
all the information necessary
all the information necessary
77
243790
3371
여기에는 모든 정보가 담겨 있습니다.
우리 인간을 만들고 유지하는 데
필요한 모든 정보가 들어있죠.
필요한 모든 정보가 들어있죠.
04:19
to build and maintain a human being.
78
247185
2830
04:22
But what makes DNA so great?
79
250583
2204
DNA가 어떻게 그렇게
대단한 일을 할 수 있을까요?
대단한 일을 할 수 있을까요?
04:25
Well, let's take our own genome
80
253493
1756
우리 인간의 게놈을 예를 들어보죠.
04:27
as an example.
81
255273
1560
04:28
If we were to print out
all three billion A's, T's, C's and G's
all three billion A's, T's, C's and G's
82
256857
4770
30억 개의 A, T, C, G를
출력한다고 생각해보세요.
출력한다고 생각해보세요.
04:33
on a standard font, standard format,
83
261651
3631
기본 글꼴, 기본 서식으로요.
04:37
and then we were
to stack all of those papers,
to stack all of those papers,
84
265306
2740
그렇게 출력된 종이를 모두 쌓으면
04:40
it would be about 130 meters high,
85
268070
2660
높이가 130m 쯤 될 것입니다.
04:42
somewhere between the Statue of Liberty
and the Washington Monument.
and the Washington Monument.
86
270754
3659
자유의 여신상과 워싱턴 기념비의
중간 정도가 되겠군요.
중간 정도가 되겠군요.
04:46
Now, if we converted
all those A's, T's, C's and G's
all those A's, T's, C's and G's
87
274437
2447
이제, 모든 A, T, C, G를
디지털 형태인 0과 1로 바꾼다면
디지털 형태인 0과 1로 바꾼다면
04:48
to digital data, to zeroes and ones,
88
276898
2556
04:51
it would total a few gigs.
89
279478
1769
총 몇 기가 바이트가 될 것입니다.
04:53
And that's in each cell of our body.
90
281786
2339
바로 그게 우리 몸의
각 세포에 들어 있는 것이죠.
각 세포에 들어 있는 것이죠.
04:56
We have more than 30 trillion cells.
91
284516
2838
우리 몸에는 30조개가 넘는
세포가 있습니다.
세포가 있습니다.
04:59
You get the idea:
92
287757
1500
한번 생각해보세요.
05:01
DNA can store a ton of information
in a minuscule space.
in a minuscule space.
93
289281
4675
DNA는 엄청난 양의 정보를
아주 작은 공간에 저장할 수 있습니다.
아주 작은 공간에 저장할 수 있습니다.
05:07
DNA is also very durable,
94
295620
1825
DNA는 튼튼할 뿐만 아니라
05:09
and it doesn't even require
electricity to store it.
electricity to store it.
95
297469
2834
저장하는 데에 전기조차도
필요하지 않습니다.
필요하지 않습니다.
05:12
We know this because scientists
have recovered DNA from ancient humans
have recovered DNA from ancient humans
96
300327
4276
과학자들이 고대인류의 DNA를
복원했기에 이 사실을 알아냈습니다.
복원했기에 이 사실을 알아냈습니다.
05:16
that lived hundreds
of thousands of years ago.
of thousands of years ago.
97
304627
2752
수십만 년전에 살았던 고대인류죠.
05:19
One of those is Ötzi the Iceman.
98
307739
2627
그 중 하나가 아이스맨 "외치"입니다.
05:22
Turns out, he's Austrian.
99
310390
1683
그는 오스트리아인으로 밝혀졌죠.
05:24
(Laughter)
100
312097
1600
(웃음)
05:25
He was found high, well-preserved,
101
313721
1630
이탈리아와 오스트리아 사이의 산에서
매우 잘 보존된 상태로 발견되었습니다.
매우 잘 보존된 상태로 발견되었습니다.
05:27
in the mountains
between Italy and Austria,
between Italy and Austria,
102
315375
2814
05:30
and it turns out that he has living
genetic relatives here in Austria today.
genetic relatives here in Austria today.
103
318213
3984
그의 유전적 친척이 오늘날 여기
오스트리아에 산다는 것도 밝혀졌습니다.
오스트리아에 산다는 것도 밝혀졌습니다.
05:34
So one of you could be a cousin of Ötzi.
104
322221
2342
그러니까 여러분 중 누군가는
외치의 사촌일 수도 있는 것이죠.
외치의 사촌일 수도 있는 것이죠.
05:36
(Laughter)
105
324587
1055
(웃음)
05:38
The point is that we have a better chance
of recovering information
of recovering information
106
326043
3853
핵심은 고대 인류로부터 정보를
복구할 수 있었다는 사실입니다.
복구할 수 있었다는 사실입니다.
05:41
from an ancient human
107
329920
1225
05:43
than we do from an old phone.
108
331169
2042
오래된 핸드폰보다 더 낫죠.
05:45
It's also much less likely
that we'll lose the ability to read DNA
that we'll lose the ability to read DNA
109
333783
4645
DNA를 읽어낼 방법이 없어질
가능성 또한 적습니다.
가능성 또한 적습니다.
05:50
than any single man-made device.
110
338452
2434
인간이 만든 그 어떤
저장장치에 비해서 말이죠.
저장장치에 비해서 말이죠.
05:53
Every single new storage format
requires a new way to read it.
requires a new way to read it.
111
341567
4112
모든 새로운 저장 형식은
새로운 방법으로 읽어야 합니다.
새로운 방법으로 읽어야 합니다.
05:57
We'll always be able to read DNA.
112
345703
2133
DNA는 언제든 읽을 수 있죠.
05:59
If we can no longer sequence,
we have bigger problems
we have bigger problems
113
347860
3068
만약 그걸 해독할 수 없게 된다면
더 큰 문제가 될 것입니다.
더 큰 문제가 될 것입니다.
06:02
than worrying about data storage.
114
350952
2281
데이터 저장장치 자체를
염려하는 것 이상으로요.
염려하는 것 이상으로요.
06:05
Storing data on DNA is not new.
115
353725
3071
DNA에 데이터를 저장하는 것은
새롭지 않습니다.
새롭지 않습니다.
06:08
Nature's been doing it
for several billion years.
for several billion years.
116
356820
3099
자연이 수십억 년간 해온 일이니까요.
06:11
In fact, every living thing
is a DNA storage device.
is a DNA storage device.
117
359943
3892
실제로, 모든 생물은
DNA 저장장치입니다.
DNA 저장장치입니다.
06:16
But how do we store data on DNA?
118
364397
2786
하지만 어떻게 DNA에
데이터를 저장할 수 있을까요?
데이터를 저장할 수 있을까요?
06:19
This is Photo 51.
119
367725
1791
51번 사진입니다.
06:21
It's the first-ever photo of DNA,
120
369540
2627
DNA를 찍은 최초의 사진이죠.
06:24
taken about 60 years ago.
121
372191
2252
60년 전에 찍은 것입니다.
06:26
This is around the time that
that same hard drive was released by IBM.
that same hard drive was released by IBM.
122
374467
4382
IBM이 하드 드라이브를
출시할 때와 비슷한 시기죠.
출시할 때와 비슷한 시기죠.
06:31
So really, our understanding of digital
storage and of DNA have coevolved.
storage and of DNA have coevolved.
123
379246
5492
디지털 저장장치와 DNA에 대한 이해가
동시에 발전한 것입니다.
동시에 발전한 것입니다.
06:37
We first learned to sequence, or read DNA,
124
385600
3316
우리는 DNA의 염기서열을 밝히고
그걸 해독하는 법을 먼저 알아냈습니다.
그걸 해독하는 법을 먼저 알아냈습니다.
06:40
and very soon after, how to write it,
125
388940
2012
그 다음에는 정보가 어떻게 기록되고
또는 어떻게 합성하는지 알아냈죠.
또는 어떻게 합성하는지 알아냈죠.
06:42
or synthesize it.
126
390976
1559
06:44
This is much like how we learn
a new language.
a new language.
127
392559
3564
이것은 새로운 언어를
배우는 과정과 비슷합니다.
배우는 과정과 비슷합니다.
06:48
And now we have the ability
to read, write and copy DNA.
to read, write and copy DNA.
128
396812
4613
이제 우리는 DNA를 읽고,
쓰고, 복제할 수 있습니다.
쓰고, 복제할 수 있습니다.
06:53
We do it in the lab all the time.
129
401449
2080
연구실에서 늘 이런 일을 하죠.
06:56
So anything, really anything,
that can be stored as zeroes and ones
that can be stored as zeroes and ones
130
404283
3882
그러니까 무엇이든
0과 1로 저장 가능한
정말로 그 어떤 것도
정말로 그 어떤 것도
07:00
can be stored in DNA.
131
408189
1719
DNA에 저장할 수 있습니다.
07:02
To store something digitally,
like this photo,
like this photo,
132
410579
3195
무언가를 이 사진처럼
디지털 방식으로 저장하려면
디지털 방식으로 저장하려면
07:05
we convert it to bits, or binary digits.
133
413798
3306
그것을 '비트'라고 하는
2진 숫자로 변환해야 합니다.
2진 숫자로 변환해야 합니다.
07:09
Each pixel in a black-and-white photo
is simply a zero or a one.
is simply a zero or a one.
134
417128
4211
흑백 사진의 각 화소는
간단히 0 또는 1이 되죠.
간단히 0 또는 1이 되죠.
07:13
And we can write DNA much like an inkjet
printer can print letters on a page.
printer can print letters on a page.
135
421849
4824
또한 종이에 글자를 출력하듯이
DNA에 정보를 쓸 수도 있습니다.
DNA에 정보를 쓸 수도 있습니다.
07:18
We just have to convert our data,
all of those zeroes and ones,
all of those zeroes and ones,
136
426697
3824
그러려먼 먼저 데이터를 변환해야 하죠.
0과 1로 되어 있는 것을
A, T, C, 그리고 G로 바꾸어
A, T, C, 그리고 G로 바꾸어
07:22
to A's, T's, C's and G's,
137
430545
2138
07:24
and then we send this
to a synthesis company.
to a synthesis company.
138
432707
2258
DNA 합성 업체로 보냅니다.
07:26
So we write it, we can store it,
139
434989
1947
그러면 그걸 DNA에 기록해서
저장할 수 있습니다.
저장할 수 있습니다.
07:28
and when we want to recover our data,
we just sequence it.
we just sequence it.
140
436960
3234
데이터를 복구하고 싶을 때는
염기서열을 해독하면 되고요.
염기서열을 해독하면 되고요.
07:32
Now, the fun part of all of this
is deciding what files to include.
is deciding what files to include.
141
440218
4081
이제 가장 흥미로운 부분은
어떤 파일을 담느냐는 것입니다.
어떤 파일을 담느냐는 것입니다.
07:36
We're serious scientists,
so we had to include a manuscript
so we had to include a manuscript
142
444323
3377
우리는 진지한 과학자이니까
우선 논문을 담기로 했습니다.
우선 논문을 담기로 했습니다.
07:39
for good posterity.
143
447724
1743
후손을 위해서요.
07:41
We also included a $50 Amazon gift card --
144
449491
2833
50달러짜리 아마존 상품권도 담았죠.
07:44
don't get too excited, it's already
been spent, someone decoded it --
been spent, someone decoded it --
145
452348
3531
해독한 사람이 이미 썼을 테니
너무 흥분하지는 마시고요.
너무 흥분하지는 마시고요.
07:47
as well as an operating system,
146
455903
2210
운영체계도 추가하고
07:50
one of the first movies ever made
147
458137
2371
최초로 만들어진 영화도 담고
07:52
and a Pioneer plaque.
148
460532
1738
파이어니어 금속판도 담았습니다.
07:54
Some of you might have seen this.
149
462294
1669
그걸 보신 분도 계실 텐데요.
07:55
It has a depiction of a typical --
apparently -- male and female,
apparently -- male and female,
150
463987
3456
남성과 여성의 전형적인 외모가
묘사되어 있고
묘사되어 있고
07:59
and our approximate location
in the Solar System,
in the Solar System,
151
467467
2562
태양계에서 우리의 대략적
위치도 기록되어 있습니다.
위치도 기록되어 있습니다.
08:02
in case the Pioneer spacecraft
ever encounters extraterrestrials.
ever encounters extraterrestrials.
152
470053
4002
파이오니어 우주선이 외계인과
마주칠 때를 대비해서 말이죠.
마주칠 때를 대비해서 말이죠.
08:06
So once we decided what sort of files
we want to encode,
we want to encode,
153
474861
2929
그러니까 어떤 파일을 암호화할지 정하고
08:09
we package up the data,
154
477814
1468
데이터를 정리해서
08:11
convert those zeroes and ones
to A's, T's, C's and G's,
to A's, T's, C's and G's,
155
479306
3654
0과 1을 A, T, C, G로 변환한 뒤에
08:14
and then we just send this file off
to a synthesis company.
to a synthesis company.
156
482984
3277
DNA 합성 업체로
그 파일을 보냈습니다.
그 파일을 보냈습니다.
08:18
And this is what we got back.
157
486285
1770
그리고 이것을 돌려받았죠.
08:20
Our files were in this tube.
158
488079
1919
우리가 보낸 파일들이
이 시험관에 담겨 있습니다.
이 시험관에 담겨 있습니다.
08:22
All we had to do was sequence it.
159
490022
2098
우리가 이걸 해독하기만 하면 되죠.
08:24
This all sounds pretty straightforward,
160
492525
2531
이게 정말 간단한 것 같지만
08:27
but the difference between
a really cool, fun idea
a really cool, fun idea
161
495080
2978
정말로 멋지고 재밌는 아이디어와
08:30
and something we can actually use
162
498082
2155
실제로 활용할 수 있는 것의 차이점은
08:32
is overcoming these practical challenges.
163
500261
2496
여러 현실적인 어려움을
극복해야 한다는 것입니다.
극복해야 한다는 것입니다.
08:35
Now, while DNA is more robust
than any man-made device,
than any man-made device,
164
503453
3972
DNA가 어느 장치보다 견고하다 해도
08:39
it's not perfect.
165
507449
1285
완벽하지는 않습니다.
08:40
It does have some weaknesses.
166
508758
1950
몇 가지 약점이 있지요.
08:43
We recover our message
by sequencing the DNA,
by sequencing the DNA,
167
511364
3431
DNA를 해독해서 메시지를 복구하고
08:46
and every time data is retrieved,
168
514819
2013
데이터를 검색할 때마다
08:48
we lose the DNA.
169
516856
1786
DNA는 사라집니다.
08:50
That's just part
of the sequencing process.
of the sequencing process.
170
518666
2414
단지 해독하는 과정에서 말이죠.
08:53
We don't want to run out of data,
171
521104
1935
우리는 데이터가 없어지는 것은
원하지 않아요.
원하지 않아요.
08:55
but luckily, there's a way to copy the DNA
172
523063
3096
하지만 다행히도,
DNA를 복제하는 방법이 있습니다.
DNA를 복제하는 방법이 있습니다.
08:58
that's even cheaper and easier
than synthesizing it.
than synthesizing it.
173
526183
4585
DNA를 합성하는 것보다
싸고 쉬운 방법이에요.
싸고 쉬운 방법이에요.
09:03
We actually tested a way to make
200 trillion copies of our files,
200 trillion copies of our files,
174
531275
4858
실제로 파일을 200조 개
복제하는 방법을 시험해보았더니
복제하는 방법을 시험해보았더니
09:08
and we recovered
all the data without error.
all the data without error.
175
536157
2732
오류 없이 모든 데이터를
복구할 수 있었습니다.
복구할 수 있었습니다.
09:11
So sequencing also introduces
errors into our DNA,
errors into our DNA,
176
539556
3867
그런데 해독하는 과정에서도
DNA에 오류가 생기기도 합니다.
DNA에 오류가 생기기도 합니다.
09:15
into the A's, T's, C's and G's.
177
543447
2307
A, T, C, G에 말이죠.
09:18
Nature has a way
to deal with this in our cells.
to deal with this in our cells.
178
546135
2978
자연의 세포는 이 문제를
해결할 방법을 갖고 있지만
해결할 방법을 갖고 있지만
09:21
But our data is stored
in synthetic DNA in a tube,
in synthetic DNA in a tube,
179
549137
5890
우리 자료는 시험관 속의
합성 DNA에 저장되어 있죠.
합성 DNA에 저장되어 있죠.
09:27
so we had to find our own way
to overcome this problem.
to overcome this problem.
180
555051
3252
그래서 이 문제를 극복할
방법을 찾아야 했습니다.
방법을 찾아야 했습니다.
09:30
We decided to use an algorithm
that was used to stream videos.
that was used to stream videos.
181
558724
4243
우리는 인터넷으로 영상을 볼 때 쓰는
알고리즘을 쓰기로 했습니다.
알고리즘을 쓰기로 했습니다.
09:35
When you're streaming a video,
182
563452
1453
인터넷으로 동영상을 볼 때
09:36
you're essentially trying to recover
the original video, the original file.
the original video, the original file.
183
564929
4461
여러분은 영상 및 파일 원본을
복구하려고 합니다.
복구하려고 합니다.
09:41
When we're trying to recover
our original files,
our original files,
184
569414
2909
우리가 파일 원본을 복구하고자 하면
09:44
we're simply sequencing.
185
572347
1848
단순히 해독하기만 하면 됩니다.
09:46
But really, both of these processes are
about recovering enough zeroes and ones
about recovering enough zeroes and ones
186
574219
4088
그러나 사실, 이 두 과정은 0과 1을
복구하는 것에 지나지 않습니다.
복구하는 것에 지나지 않습니다.
09:50
to put our data back together.
187
578331
1793
자료를 다시 통합하기 위해서요.
09:52
And so, because of our coding strategy,
188
580711
2041
그래서 우리가 만든
암호화 기법을 통해서
암호화 기법을 통해서
09:54
we were able to package up all of our data
189
582776
2551
모든 자료를 하나로 통합했습니다.
09:57
in a way that allowed us to make
millions and trillions of copies
millions and trillions of copies
190
585351
3772
수많은 복제품을 만들었을 때와
같은 방식으로 말이죠.
같은 방식으로 말이죠.
10:01
and still always recover
all of our files back.
all of our files back.
191
589147
2976
그러면 항상 모든 자료를
복구할 수 있습니다.
복구할 수 있습니다.
10:04
This is the movie we encoded.
192
592708
1750
이건 우리가 암호화한 영화입니다.
10:06
It's one of the first movies ever made,
193
594482
2580
최초로 만들어진 영화 중 하나죠.
10:09
and now the first to be copied
more than 200 trillion times on DNA.
more than 200 trillion times on DNA.
194
597086
4759
처음 만든 파일이 200조 번 넘게
DNA에 복제될 것입니다.
DNA에 복제될 것입니다.
10:14
Soon after our work was published,
195
602377
2130
이 연구 업적이 발표된 직후
10:16
we participated in an "Ask Me Anything"
on the website reddit.
on the website reddit.
196
604531
3747
레딧이라는 사이트에서
"뭐든지 물어보세요"에 참여했는데요.
"뭐든지 물어보세요"에 참여했는데요.
10:20
If you're a fellow nerd,
you're very familiar with this website.
you're very familiar with this website.
197
608302
3175
저희 같은 마니아분들은
어떤 사이트인지 잘 아실 거예요.
어떤 사이트인지 잘 아실 거예요.
10:23
Most questions were thoughtful.
198
611501
1945
질문 대부분이 조심스러웠죠.
10:25
Some were comical.
199
613470
1872
재밌는 질문도 있었고요.
10:27
For example, one user wanted to know
when we would have a literal thumb drive.
when we would have a literal thumb drive.
200
615366
4128
예를 들어, 한 사용자가 물었죠.
실제 엄지 드라이브는 언제 나오는지요.
실제 엄지 드라이브는 언제 나오는지요.
10:32
Now, the thing is,
201
620091
2276
있는 그대로 말씀드리면
10:34
our DNA already stores everything
needed to make us who we are.
needed to make us who we are.
202
622391
4142
DNA는 우리를 구성하는
모든 것을 저장합니다.
모든 것을 저장합니다.
10:38
It's a lot safer to store data on DNA
203
626557
3818
데이터를 DNA에 저장하는 것이
훨씬 안전합니다.
훨씬 안전합니다.
10:42
in synthetic DNA in a tube.
204
630399
2821
이 시험관의 합성 DNA에 말이죠.
10:46
Writing and reading data from DNA
is obviously a lot more time-consuming
is obviously a lot more time-consuming
205
634704
5426
DNA에 데이터를 쓰고 읽는 건
명백히 시간이 많이 걸립니다.
명백히 시간이 많이 걸립니다.
10:52
than just saving all your files
on a hard drive --
on a hard drive --
206
640154
3095
하드 디스크에 파일을
저장하는 것에 비해서요.
저장하는 것에 비해서요.
10:55
for now.
207
643273
1291
지금은 그렇죠.
10:57
So initially, we should focus
on long-term storage.
on long-term storage.
208
645159
3781
그래서 처음부터 장기간 저장에
초점을 두었습니다.
초점을 두었습니다.
11:02
Most data are ephemeral.
209
650630
2310
대부분의 데이터는 일시적입니다.
11:04
It's really hard to grasp
what's important today,
what's important today,
210
652964
2588
무엇이 중요한지
지금은 파악하기 힘듭니다.
지금은 파악하기 힘듭니다.
11:07
or what will be important
for future generations.
for future generations.
211
655576
3252
미래 세대에 무엇이 중요할지도요.
11:10
But the point is,
we don't have to decide today.
we don't have to decide today.
212
658852
2563
그러나 핵심은, 오늘 결정하지
않아도 된다는 것입니다.
않아도 된다는 것입니다.
11:14
There's this great program by UNESCO
called the "Memory of the World" program.
called the "Memory of the World" program.
213
662065
4988
여기 "세계기록유산"이라는
유네스코의 훌륭한 프로그램이 있습니다.
유네스코의 훌륭한 프로그램이 있습니다.
11:19
It's been created to preserve
historical materials
historical materials
214
667077
3267
역사적 자료를 보존하고자
만든 프로그램이죠.
만든 프로그램이죠.
11:22
that are considered of value
to all of humanity.
to all of humanity.
215
670368
3127
모든 인류에게 가치있다고
여겨지는 자료 말입니다.
여겨지는 자료 말입니다.
11:26
Items are nominated
to be added to the collection,
to be added to the collection,
216
674210
2977
그 대상에 여러 가지가 추천되었습니다.
11:29
including that film that we encoded.
217
677211
2255
우리가 암호화한 그 영화를 포함해서요.
11:32
While a wonderful way
to preserve human heritage,
to preserve human heritage,
218
680188
3582
인류의 문화 유산을 보존하자는
멋진 일을 하면서
멋진 일을 하면서
11:35
it doesn't have to be a choice.
219
683794
1912
그 대상을 선택할 필요는 없습니다.
11:38
Instead of asking
the current generation -- us --
the current generation -- us --
220
686088
3454
현 세대의 우리에게 물을 것이 아니라
11:41
what might be important in the future,
221
689566
2222
미래에 무엇이 중요할지를 봐야죠.
11:43
we could store everything in DNA.
222
691812
2334
DNA에 모든 것을 저장하면 됩니다.
11:47
Storage is not just about how many bytes
223
695543
2440
저장은 단순히 용량이 문제가 아니라
11:50
but how well we can actually
store the data and recover it.
store the data and recover it.
224
698007
3501
데이터를 실제로 어떻게 잘 저장하고
복구할 수 있는지가 중요합니다.
복구할 수 있는지가 중요합니다.
11:53
There's always been this tension
between how much data we can generate
between how much data we can generate
225
701940
3431
얼마나 많은 데이터가 생산되는지
그에 대한 갈등은 늘 있었습니다.
그에 대한 갈등은 늘 있었습니다.
11:57
and how much we can recover
226
705395
1715
얼마나 복구할 수 있는지
11:59
and how much we can store.
227
707134
1769
얼마나 저장할 수 있는지에 대해서도요.
12:01
Every advance in writing data
has required a new way to read it.
has required a new way to read it.
228
709841
4039
데이터를 기록하는 방식의 발전은
그걸 읽는 새로운 방식도 요구했습니다.
그걸 읽는 새로운 방식도 요구했습니다.
12:05
We can no longer read old media.
229
713904
2343
우리는 더이상 예전의
저장 매체를 읽지 못합니다.
저장 매체를 읽지 못합니다.
12:08
How many of you even have
a disk drive in your laptop,
a disk drive in your laptop,
230
716271
3741
여기 계신 분들 중에 몇 분이나
컴퓨터에 디스크 드라이브가 있을까요?
컴퓨터에 디스크 드라이브가 있을까요?
12:12
never mind a floppy drive?
231
720036
1724
하물며 플로피 드라이브는요?
12:14
This will never be the case with DNA.
232
722151
2552
DNA의 경우에는
이런 일이 일어나지 않을 것입니다.
이런 일이 일어나지 않을 것입니다.
12:16
As long as we're around, DNA is around,
233
724727
3177
우리가 있는 한 DNA가 있고
12:19
and we'll find a way to sequence it.
234
727928
2180
그것을 해독하는 방법을 찾겠지요.
12:23
Archiving the world around us
is part of human nature.
is part of human nature.
235
731214
3459
세상의 일을 기록, 보관하려는 건
인류의 본성입니다.
인류의 본성입니다.
12:27
This is the progress we've made
in digital storage in 60 years,
in digital storage in 60 years,
236
735172
4624
지난 60년간 디지털 저장장치에
많은 발전이 있었습니다.
많은 발전이 있었습니다.
12:31
at a time when we were only
beginning to understand DNA.
beginning to understand DNA.
237
739820
3376
같은 기간 동안 우리는 이제 막
DNA를 이해하기 시작했죠.
DNA를 이해하기 시작했죠.
12:35
Yet, we've made similar progress
in half that time with DNA sequencers,
in half that time with DNA sequencers,
238
743725
4845
하지만 DNA 분석기에 있어서는
30년 만에 비슷한 발전을 거두었습니다.
30년 만에 비슷한 발전을 거두었습니다.
12:40
and as long as we're around,
DNA will never be obsolete.
DNA will never be obsolete.
239
748594
4943
우리가 존재하는 한, DNA가
쓸모없어지지는 않을 것입니다.
쓸모없어지지는 않을 것입니다.
12:46
Thank you.
240
754107
1181
감사합니다.
12:47
(Applause)
241
755312
4981
(박수)
ABOUT THE SPEAKER
Dina Zielinski - Bench scientist, bioinformaticianDina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA.
Why you should listen
Dina Zielinski is a bench scientist and bioinformatician with broad experience in genetics and genomics. Her current projects are in developmental biology and neurology, but she is motivated to keep learning and using her skills to answer scientific questions that challenge our deepest knowledge.
Dina Zielinski | Speaker | TED.com