TEDxVienna
Dina Zielinski: How we can store digital data in DNA
Dina Zielinski: Làm cách nào để lưu trữ dữ liệu số trong DNA
Filmed:
Readability: 4.4
1,777,866 views
Từ ổ đĩa mềm đến USB, mọi phương pháp lưu trữ dữ liệu cuối cùng sẽ lạc hậu. Liệu chúng ta có thể tìm ra phương pháp để lưu trữ dữ liệu toàn cầu vĩnh cửu không? Nhà tin sinh học Dina Zielinski sẽ chia sẻ cơ chế khoa học của một giải pháp đã ở bên cạnh chúng ta hàng tỉ năm: DNA.
Dina Zielinski - Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA. Full bio
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA. Full bio
Double-click the English transcript below to play the video.
00:12
I could fit all movies ever made
inside of this tube.
inside of this tube.
0
652
5196
Tôi có thể lưu trữ toàn bộ những bộ phim
từng được sản xuất vào cái ống này.
từng được sản xuất vào cái ống này.
Nếu bạn không thể thấy nó,
đó chính là điều tôi muốn nói.
đó chính là điều tôi muốn nói.
00:17
If you can't see it,
that's kind of the point.
that's kind of the point.
1
5872
2253
00:20
(Laughter)
2
8149
1016
(Cười)
00:21
Before we understand how this is possible,
3
9189
3243
Trước khi chúng ta hiểu làm thế nào
mà điều đó xảy ra,
mà điều đó xảy ra,
00:24
it's important to understand
the value of this feat.
the value of this feat.
4
12456
3746
chúng ta cần phải
hiểu được lợi ích của điều này.
hiểu được lợi ích của điều này.
Mọi suy nghĩ và hành động
của chúng ta hiện nay,
của chúng ta hiện nay,
00:29
All of our thoughts
and actions these days,
and actions these days,
5
17075
2266
00:31
through photos and videos --
6
19365
1986
thông qua ảnh và video --
00:33
even our fitness activities --
7
21375
1879
cả những hoạt động thể chất --
00:35
are stored as digital data.
8
23278
2133
đều được lưu dưới dạng
dữ liệu kĩ thuật số.
dữ liệu kĩ thuật số.
00:38
Aside from running out of space
9
26109
1517
Ngoài việc hết dung lượng
00:39
on our phones,
10
27650
1151
của điện thoại,
00:40
we rarely think about
our digital footprint.
our digital footprint.
11
28825
2314
chúng ta hiếm khi quan tâm đến
dấu chân điện tử của mình.
00:43
But humanity has collectively
generated more data
generated more data
12
31536
3528
Nhưng loài người đã chung tay
tạo ra dữ liệu
tạo ra dữ liệu
00:47
in the last few years
13
35088
1873
vào một vài năm trở lại đây
00:48
than all of preceding human history.
14
36985
2530
nhiều hơn quãng thời gian trước đó
của lịch sử loài người.
của lịch sử loài người.
00:51
Big data has become a big problem.
15
39902
2898
Dữ liệu lớn đã trở thành một vấn đề lớn.
00:55
Digital storage is really expensive,
16
43229
2817
Lưu trữ kĩ thuật số thực sự rất đắt đỏ,
00:58
and none of these devices that we have
really stand the test of time.
really stand the test of time.
17
46070
3723
và không có thiết bị nào của chúng ta
tồn tại vĩnh viễn.
tồn tại vĩnh viễn.
01:03
There's this nonprofit website
called the Internet Archive.
called the Internet Archive.
18
51256
3750
Có một trang web phi lợi nhuận
tên là Internet Archive.
tên là Internet Archive.
01:07
In addition to free books and movies,
19
55030
2645
Bên cạnh sách và phim miễn phí,
01:09
you can access web pages
as far back as 1996.
as far back as 1996.
20
57699
4364
Bạn có thể truy cập trang
web từ năm 1996.
web từ năm 1996.
01:14
Now, this is very tempting,
21
62087
1684
Giờ đây, điều này rất hấp dẫn
01:15
but I decided to go back and look at
the TED website's very humble beginnings.
the TED website's very humble beginnings.
22
63795
5989
nhưng tôi quyết định quay lại và quan sát
sự khởi đầu khiêm tốn của TED.
sự khởi đầu khiêm tốn của TED.
01:21
As you can see, it's changed
quite a bit in the last 30 years.
quite a bit in the last 30 years.
23
69808
3912
Như các bạn thấy, nó thay đổi một chút
trong vòng 30 năm qua.
trong vòng 30 năm qua.
01:26
So this led me to the first-ever TED,
24
74720
2824
Vì vậy, nó khiến tôi tò mò về TED đầu tiên,
01:29
back in 1984,
25
77568
2180
năm 1984,
01:31
and it just so happened
to be a Sony executive
to be a Sony executive
26
79772
2525
và nó chỉ là một hội nghị của Sony
01:34
explaining how a compact disk works.
27
82321
3058
giải thích cơ chế hoạt động của đĩa CD.
01:37
(Laughter)
28
85403
1079
(Cười)
01:38
Now, it's really incredible
to be able to go back in time
to be able to go back in time
29
86506
4264
Giờ đây, quay ngược thời gian và xem lại
khoảnh khắc này
khoảnh khắc này
là một điều đáng kinh ngạc.
01:42
and access this moment.
30
90794
2286
01:45
It's also really fascinating
that after 30 years, after that first TED,
that after 30 years, after that first TED,
31
93548
5363
Một điều đáng kinh ngạc khác nữa là
sau 30 năm kể từ TED đầu tiên,
sau 30 năm kể từ TED đầu tiên,
01:50
we're still talking about digital storage.
32
98935
2779
ta vẫn còn nói về lưu trữ dữ liệu số.
01:54
Now, if we look back another 30 years,
33
102827
2787
Bây giờ, nếu chúng ta nhìn lại 30 năm nữa,
01:57
IBM released the first-ever hard drive
34
105638
3185
IBM ra mắt phần cứng đầu tiên,
02:00
back in 1956.
35
108847
2127
vào năm 1956.
02:02
Here it is being loaded for shipping
in front of a small audience.
in front of a small audience.
36
110998
4197
Nó đang được vận chuyển lên tàu
trước mắt vài người theo dõi.
trước mắt vài người theo dõi.
02:07
It held the equivalent of one MP3 song
37
115569
3110
Dung lượng của nó bằng
với một bài nhạc MP3
với một bài nhạc MP3
02:11
and weighed over one ton.
38
119354
2004
và nặng hơn một tấn.
02:14
At 10,000 dollars a megabyte,
39
122100
2651
Trị giá 10,000 đô la mỗi MB,
02:16
I don't think anyone in this room
would be interested in buying this thing,
would be interested in buying this thing,
40
124775
3587
Tôi không nghĩ bất kì ai ở đây
hứng thú với việc mua nó,
hứng thú với việc mua nó,
Ngoại trừ một vài người sưu tầm
02:20
except maybe as a collector's item.
41
128386
1760
02:22
But it's the best we could do at the time.
42
130817
2988
Nhưng nó là thứ tốt nhất
ta có thể làm tại thời điểm đó.
ta có thể làm tại thời điểm đó.
Chúng ta đã đi một chặng đường dài
trong quá trình lưu trữ dữ liệu số.
trong quá trình lưu trữ dữ liệu số.
02:26
We've come such a long way
in data storage.
in data storage.
43
134832
3116
02:29
Devices have evolved dramatically.
44
137972
2898
Các thiết bị cải tiến
một cách đáng kinh ngạc.
một cách đáng kinh ngạc.
02:32
But all media eventually wear out
or become obsolete.
or become obsolete.
45
140894
4024
Nhưng mọi phương tiện truyền thông
rồi cũng sẽ trở nên lỗi thời.
rồi cũng sẽ trở nên lỗi thời.
02:37
If someone handed you a floppy drive today
to back up your presentation,
to back up your presentation,
46
145401
4417
Nếu ai đó đưa bạn 1 đĩa mềm
để lưu bài thuyết trình của bạn hôm nay,
để lưu bài thuyết trình của bạn hôm nay,
02:41
you'd probably look at them
kind of strange, maybe laugh,
kind of strange, maybe laugh,
47
149842
2940
bạn có lẽ sẽ nhìn họ với ánh mắt kì lạ
và có thể cười,
và có thể cười,
02:44
but you'd have no way
to use the damn thing.
to use the damn thing.
48
152806
2415
bạn không thể sử dụng cái thứ quái quỷ đó.
02:47
These devices can no longer meet
our storage needs,
our storage needs,
49
155854
3141
Những thiết bị đó không thể
đáp ứng nhu cầu lưu trữ của chúng ta,
đáp ứng nhu cầu lưu trữ của chúng ta,
02:51
although some of them can be repurposed.
50
159019
2702
mặc dù một vài trong số đó
có thể tái sử dụng.
có thể tái sử dụng.
02:54
All technology eventually dies or is lost,
51
162682
3109
Mọi công nghệ sẽ hỏng hoặc mất tích,
02:57
along with our data,
52
165815
1851
cùng với dữ liệu của chúng ta,
02:59
all of our memories.
53
167690
1540
và mọi kí ức của chúng ta.
03:02
There's this illusion that
the storage problem has been solved,
the storage problem has been solved,
54
170210
4116
Có người ảo tưởng rằng
vấn đề lưu trữ đã được giải quyết,
vấn đề lưu trữ đã được giải quyết,
03:06
but really, we all just externalize it.
55
174350
2493
nhưng thật ra chúng ta
chỉ ngoại hóa chúng.
chỉ ngoại hóa chúng.
03:08
We don't worry about storing
our emails and our photos.
our emails and our photos.
56
176867
3477
Chúng ta không lo lắng về việc
lưu trữ email và ảnh.
lưu trữ email và ảnh.
03:12
They're just in the cloud.
57
180368
1723
Chúng chỉ ở trên đám mây.
03:15
But behind the scenes,
storage is problematic.
storage is problematic.
58
183231
2937
Nhưng ẩn sau đó,
việc lưu trữ tồn tại nhiều vấn đề
việc lưu trữ tồn tại nhiều vấn đề
03:18
After all, the cloud is just
a lot of hard drives.
a lot of hard drives.
59
186192
3980
Dù sao thì đám mây
cũng chỉ là rất nhiều phần cứng.
cũng chỉ là rất nhiều phần cứng.
03:23
Now, most digital data,
we could argue, is not really critical.
we could argue, is not really critical.
60
191156
4040
Hiện nay, hầu hết dữ liệu số,
không thực sự quan trọng.
không thực sự quan trọng.
03:27
Surely, we could just delete it.
61
195220
2123
Chúng ta chỉ cần xóa nó.
03:29
But how can we really know
what's important today?
what's important today?
62
197957
3535
Nhưng làm sao ta có thể biết
thứ gì là thực sự quan trọng?
thứ gì là thực sự quan trọng?
03:34
We've learned so much about human history
63
202132
2536
Chúng ta đã học nhiều điều
về lịch sử loài người
về lịch sử loài người
03:36
from drawings and writings in caves,
64
204692
2826
từ vẽ và viết lên thành hang động,
03:39
from stone tablets.
65
207542
1614
từ những văn bản viết trên đá.
03:41
We've deciphered languages
from the Rosetta Stone.
from the Rosetta Stone.
66
209180
3397
Chúng ta đã và đang giải mã ngôn ngữ từ
hòn đá Rosetta.
hòn đá Rosetta.
03:45
You know, we'll never really have
the whole story, though.
the whole story, though.
67
213841
3609
Nhưng chúng ta sẽ chả bao giờ biết được
toàn bộ câu chuyện.
toàn bộ câu chuyện.
03:49
Our data is our story,
68
217474
1894
Dữ liệu là câu chuyện của chúng ta,
03:51
even more so today.
69
219392
1735
thậm chí còn hơn nữa.
03:53
We won't have our record
recorded on stone tablets.
recorded on stone tablets.
70
221508
3261
Chúng ta sẽ chẳng bao giờ lưu trữ
văn bản của chúng ta trên đá
văn bản của chúng ta trên đá
03:57
But we don't have to choose
what is important now.
what is important now.
71
225692
2698
Nhưng chúng ta không phải lựa chọn
thứ gì là quan trọng nữa.
thứ gì là quan trọng nữa.
04:00
There's a way to store it all.
72
228847
1893
Có một cách để lưu trữ toàn bộ chúng.
04:03
It turns out that there's
a solution that's been around
a solution that's been around
73
231519
2598
Hóa ra là có một giải pháp ở quanh ta
04:06
for a few billion years,
74
234141
2443
hàng tỉ năm,
04:08
and it's actually in this tube.
75
236608
1840
và nó thật ra ở trong cái ống này.
04:12
DNA is nature's oldest storage device.
76
240044
3722
DNA là công cụ lưu trữ lâu đời nhất
của tự nhiên
của tự nhiên
04:15
After all, it contains
all the information necessary
all the information necessary
77
243790
3371
Nó bao gồm mọi thông tin cần thiết
04:19
to build and maintain a human being.
78
247185
2830
để cấu thành và duy trì loài người.
04:22
But what makes DNA so great?
79
250583
2204
Nhưng điều gì làm DNA tuyệt vời đến vậy?
04:25
Well, let's take our own genome
80
253493
1756
Hãy lấy gen của chúng ta
04:27
as an example.
81
255273
1560
là một ví dụ.
04:28
If we were to print out
all three billion A's, T's, C's and G's
all three billion A's, T's, C's and G's
82
256857
4770
Nếu chúng ra in ra toàn bộ 3 tỉ
A, T, C và G nucleotit
A, T, C và G nucleotit
04:33
on a standard font, standard format,
83
261651
3631
trên một phông tiêu chuẩn,
một định dạng tiêu chuẩn
một định dạng tiêu chuẩn
04:37
and then we were
to stack all of those papers,
to stack all of those papers,
84
265306
2740
và xếp chồng chúng lên nhau,
04:40
it would be about 130 meters high,
85
268070
2660
nó sẽ cao 130 m, khoảng giữa chiều cao
04:42
somewhere between the Statue of Liberty
and the Washington Monument.
and the Washington Monument.
86
270754
3659
của Tượng Nữ thần Tự do
và Đài tưởng niệm Washington,
và Đài tưởng niệm Washington,
04:46
Now, if we converted
all those A's, T's, C's and G's
all those A's, T's, C's and G's
87
274437
2447
Bây giờ, nếu chúng ta chuyển các nucleotit
04:48
to digital data, to zeroes and ones,
88
276898
2556
về dạng dữ liệu số, 0 và 1,
04:51
it would total a few gigs.
89
279478
1769
nó sẽ là một vài gigabyte.
04:53
And that's in each cell of our body.
90
281786
2339
Và đó là trong mỗi tế bào của cơ thể chúng ta.
04:56
We have more than 30 trillion cells.
91
284516
2838
Chúng ta có hơn 30 nghìn tỉ tế bào.
04:59
You get the idea:
92
287757
1500
Bạn hiểu rồi đấy:
05:01
DNA can store a ton of information
in a minuscule space.
in a minuscule space.
93
289281
4675
DNA có thể lưu trữ cả tấn dữ liệu trong
một không gian nhỏ.
một không gian nhỏ.
05:07
DNA is also very durable,
94
295620
1825
DNA cũng rất bền,
05:09
and it doesn't even require
electricity to store it.
electricity to store it.
95
297469
2834
và không cần điện để vận hành.
05:12
We know this because scientists
have recovered DNA from ancient humans
have recovered DNA from ancient humans
96
300327
4276
Chúng ta biết điều này vì các nhà khoa học
đã khôi phục DNA từ người cổ đại
đã khôi phục DNA từ người cổ đại
05:16
that lived hundreds
of thousands of years ago.
of thousands of years ago.
97
304627
2752
từ hàng trăm nghìn năm trước.
05:19
One of those is Ötzi the Iceman.
98
307739
2627
Một trong số đó là
Người băng Ötzi
Người băng Ötzi
05:22
Turns out, he's Austrian.
99
310390
1683
Hóa ra, anh ta là người Áo.
05:24
(Laughter)
100
312097
1600
(Cười)
05:25
He was found high, well-preserved,
101
313721
1630
Anh ta được tìm thấy trên cao,
được bảo quản tốt,
được bảo quản tốt,
05:27
in the mountains
between Italy and Austria,
between Italy and Austria,
102
315375
2814
trên núi giữa Ý và Áo.
05:30
and it turns out that he has living
genetic relatives here in Austria today.
genetic relatives here in Austria today.
103
318213
3984
và hóa ra anh ta có
họ hàng tại Áo hiện nay.
họ hàng tại Áo hiện nay.
05:34
So one of you could be a cousin of Ötzi.
104
322221
2342
Vì vậy một trong số các bạn có thể là
bà con của Ötzi
bà con của Ötzi
05:36
(Laughter)
105
324587
1055
(Cười)
05:38
The point is that we have a better chance
of recovering information
of recovering information
106
326043
3853
Vấn đề ở đây là chúng ta có một cơ hội
tốt hơn để khôi phục thông tin
tốt hơn để khôi phục thông tin
05:41
from an ancient human
107
329920
1225
từ một người cổ đại
05:43
than we do from an old phone.
108
331169
2042
hơn là từ cái điện thoại cũ
của chúng ta.
của chúng ta.
05:45
It's also much less likely
that we'll lose the ability to read DNA
that we'll lose the ability to read DNA
109
333783
4645
Cũng rất hiếm khi chúng ta
mất khả năng đọc DNA
mất khả năng đọc DNA
05:50
than any single man-made device.
110
338452
2434
hơn là bất kì thiết bị nhân tạo nào.
05:53
Every single new storage format
requires a new way to read it.
requires a new way to read it.
111
341567
4112
Mọi định dạng lưu trữ mới cần một
cách mới để đọc nó.
cách mới để đọc nó.
05:57
We'll always be able to read DNA.
112
345703
2133
Chúng ta luôn có thể đọc DNA
05:59
If we can no longer sequence,
we have bigger problems
we have bigger problems
113
347860
3068
Nếu chúng ta không thể,
chúng ta có vấn đề lớn hơn
chúng ta có vấn đề lớn hơn
06:02
than worrying about data storage.
114
350952
2281
việc lưu trữ dữ liệu.
06:05
Storing data on DNA is not new.
115
353725
3071
Lưu trữ dữ liệu trên DNA không hề mới.
06:08
Nature's been doing it
for several billion years.
for several billion years.
116
356820
3099
Tự nhiên đã làm điều đó hàng tỉ năm.
06:11
In fact, every living thing
is a DNA storage device.
is a DNA storage device.
117
359943
3892
Thật ra, mọi thực thể sống
là một thiết bị lưu trữ DNA.
là một thiết bị lưu trữ DNA.
06:16
But how do we store data on DNA?
118
364397
2786
Nhưng làm cách nào để chúng ta
lưu trữ dữ liệu trên DNA?
lưu trữ dữ liệu trên DNA?
06:19
This is Photo 51.
119
367725
1791
Đây là Bức ảnh 51.
06:21
It's the first-ever photo of DNA,
120
369540
2627
Là bức ảnh đầu tiên của DNA,
06:24
taken about 60 years ago.
121
372191
2252
được chụp 60 năm trước.
06:26
This is around the time that
that same hard drive was released by IBM.
that same hard drive was released by IBM.
122
374467
4382
Nó gần với thời điểm phần cứng đầu tiên
được ra mắt bởi IBM.
được ra mắt bởi IBM.
06:31
So really, our understanding of digital
storage and of DNA have coevolved.
storage and of DNA have coevolved.
123
379246
5492
Sự hiểu biết của chúng ta về lưu trữ
và DNA đang tiến hóa cùng nhau.
và DNA đang tiến hóa cùng nhau.
06:37
We first learned to sequence, or read DNA,
124
385600
3316
Chúng ta đầu tiên tìm hiểu trình tự,
hoặc đọc DNA,
hoặc đọc DNA,
06:40
and very soon after, how to write it,
125
388940
2012
và rất nhanh ngay sau đó, học viết nó,
06:42
or synthesize it.
126
390976
1559
hoặc tổng hợp nó.
06:44
This is much like how we learn
a new language.
a new language.
127
392559
3564
Đó rất giống với việc chúng ta
học một ngôn ngữ mới.
học một ngôn ngữ mới.
06:48
And now we have the ability
to read, write and copy DNA.
to read, write and copy DNA.
128
396812
4613
Và giờ đây chúng ta có thể đọc,
viết và sao chép DNA
viết và sao chép DNA
06:53
We do it in the lab all the time.
129
401449
2080
Chúng ta làm điều đó cả ngày trong
phòng thí nghiệm.
phòng thí nghiệm.
06:56
So anything, really anything,
that can be stored as zeroes and ones
that can be stored as zeroes and ones
130
404283
3882
Vậy tất cả mọi thứ mà có thể
lưu trữ dưới dạng 0 và 1
lưu trữ dưới dạng 0 và 1
07:00
can be stored in DNA.
131
408189
1719
có thể lưu trữ trong DNA.
07:02
To store something digitally,
like this photo,
like this photo,
132
410579
3195
Để lưu trữ một thứ gì đó dưới dạng
kĩ thuật số như bức ảnh này,
kĩ thuật số như bức ảnh này,
07:05
we convert it to bits, or binary digits.
133
413798
3306
chúng ta chuyển nó thành bits, hoặc
chữ số nhị phân.
chữ số nhị phân.
07:09
Each pixel in a black-and-white photo
is simply a zero or a one.
is simply a zero or a one.
134
417128
4211
Mỗi pixel trong một ảnh trắng đen
đơn giản chỉ là 0 và 1.
đơn giản chỉ là 0 và 1.
07:13
And we can write DNA much like an inkjet
printer can print letters on a page.
printer can print letters on a page.
135
421849
4824
Và chúng ta có thể viết DNA như cách
một máy in in chữ lên giấy.
một máy in in chữ lên giấy.
07:18
We just have to convert our data,
all of those zeroes and ones,
all of those zeroes and ones,
136
426697
3824
Và chúng ta chỉ cần chuyển đổi dữ liệu,
những thứ bao gồm 0 và 1,
những thứ bao gồm 0 và 1,
07:22
to A's, T's, C's and G's,
137
430545
2138
về dạng A, T, C, và G,
07:24
and then we send this
to a synthesis company.
to a synthesis company.
138
432707
2258
và đưa nó tới một
công ti tổng hợp.
công ti tổng hợp.
07:26
So we write it, we can store it,
139
434989
1947
Vậy chúng ta viết nó,
lưu trữ nó,
lưu trữ nó,
07:28
and when we want to recover our data,
we just sequence it.
we just sequence it.
140
436960
3234
và khi muốn phục hồi,
chúng ta chỉ cần sắp xếp nó.
chúng ta chỉ cần sắp xếp nó.
07:32
Now, the fun part of all of this
is deciding what files to include.
is deciding what files to include.
141
440218
4081
Bây giờ, điều thú vị là
quyết định lưu tệp nào.
quyết định lưu tệp nào.
07:36
We're serious scientists,
so we had to include a manuscript
so we had to include a manuscript
142
444323
3377
Chúng ta là những nhà khoa học,
vì vậy chúng ta sẽ có những bản viết tay
vì vậy chúng ta sẽ có những bản viết tay
07:39
for good posterity.
143
447724
1743
cho hậu thế.
07:41
We also included a $50 Amazon gift card --
144
449491
2833
Chúng ta sẽ lưu trữ
thẻ quà tặng Amazon 50 đô --
thẻ quà tặng Amazon 50 đô --
07:44
don't get too excited, it's already
been spent, someone decoded it --
been spent, someone decoded it --
145
452348
3531
đừng quá hưng phấn, nó đã được dành cho
người mà giải mã được nó --
người mà giải mã được nó --
07:47
as well as an operating system,
146
455903
2210
cũng như là hệ điều hành,
07:50
one of the first movies ever made
147
458137
2371
một trong số những bộ phim đầu tiên
được sản xuất
được sản xuất
07:52
and a Pioneer plaque.
148
460532
1738
và một mảng Pioneer.
07:54
Some of you might have seen this.
149
462294
1669
Một trong số các bạn đã thấy nó trước đây.
07:55
It has a depiction of a typical --
apparently -- male and female,
apparently -- male and female,
150
463987
3456
Nó bao gồm hình ảnh mô tả
một cặp nam nữ phổ thông,
một cặp nam nữ phổ thông,
07:59
and our approximate location
in the Solar System,
in the Solar System,
151
467467
2562
và vị trí của chúng ta trong hệ Mặt Trời,
08:02
in case the Pioneer spacecraft
ever encounters extraterrestrials.
ever encounters extraterrestrials.
152
470053
4002
trong trường hợp tàu Pioneer
bắt gặp người ngoài hành tinh.
bắt gặp người ngoài hành tinh.
08:06
So once we decided what sort of files
we want to encode,
we want to encode,
153
474861
2929
Vậy một khi chúng ta quyết định loại
tài liệu ta muốn mã hóa,
tài liệu ta muốn mã hóa,
08:09
we package up the data,
154
477814
1468
chúng ta đóng gói dữ liệu,
08:11
convert those zeroes and ones
to A's, T's, C's and G's,
to A's, T's, C's and G's,
155
479306
3654
chuyển từ 0 và 1 sang A, T, C và G,
08:14
and then we just send this file off
to a synthesis company.
to a synthesis company.
156
482984
3277
và sau đó chỉ cần gửi tài liệu đến
một công ty tổng hợp.
một công ty tổng hợp.
08:18
And this is what we got back.
157
486285
1770
Và đây là thứ mà ta nhận được.
08:20
Our files were in this tube.
158
488079
1919
Tài liệu của chúng ta
ở trong cái ống này.
ở trong cái ống này.
08:22
All we had to do was sequence it.
159
490022
2098
Mọi thứ ta cần làm là đọc nó.
08:24
This all sounds pretty straightforward,
160
492525
2531
Điều này nghe có vẻ đơn giản,
08:27
but the difference between
a really cool, fun idea
a really cool, fun idea
161
495080
2978
nhưng sự khác biệt
giữa một ý tưởng tuyệt vời
giữa một ý tưởng tuyệt vời
08:30
and something we can actually use
162
498082
2155
và thứ mà chúng ta thực tế
có thể sử dụng
có thể sử dụng
08:32
is overcoming these practical challenges.
163
500261
2496
là vượt qua những thách thức
về mặt thực nghiệm.
về mặt thực nghiệm.
08:35
Now, while DNA is more robust
than any man-made device,
than any man-made device,
164
503453
3972
Bây giờ, khi DNA mạnh mẽ hơn bất kì thiết
bị nhân tạo nào,
bị nhân tạo nào,
08:39
it's not perfect.
165
507449
1285
nó không hoàn hảo.
08:40
It does have some weaknesses.
166
508758
1950
Nó có một vài điểm yếu.
08:43
We recover our message
by sequencing the DNA,
by sequencing the DNA,
167
511364
3431
Chúng ta có thể khôi phục dữ liệu
bằng cách sắp xếp DNA,
bằng cách sắp xếp DNA,
08:46
and every time data is retrieved,
168
514819
2013
và mỗi khi dữ liệu được lấy lại,
08:48
we lose the DNA.
169
516856
1786
chúng ta mất DNA.
08:50
That's just part
of the sequencing process.
of the sequencing process.
170
518666
2414
Đó chỉ là một phần của quá trình sắp xếp.
08:53
We don't want to run out of data,
171
521104
1935
Chúng ta không muốn mất hết
dữ liệu,
dữ liệu,
08:55
but luckily, there's a way to copy the DNA
172
523063
3096
nhưng may thay, có một cách
sao chép DNA
sao chép DNA
08:58
that's even cheaper and easier
than synthesizing it.
than synthesizing it.
173
526183
4585
đó còn rẻ và dễ hơn tổng hợp nó.
09:03
We actually tested a way to make
200 trillion copies of our files,
200 trillion copies of our files,
174
531275
4858
Chúng ta đã thử nghiệm sao chép
tập tin giống loài 200 nghìn tỉ lần,
tập tin giống loài 200 nghìn tỉ lần,
và khôi phục dữ liệu không một sai sót.
09:08
and we recovered
all the data without error.
all the data without error.
175
536157
2732
09:11
So sequencing also introduces
errors into our DNA,
errors into our DNA,
176
539556
3867
Vì vậy sắp xếp có thể gây lỗi ở DNA,
09:15
into the A's, T's, C's and G's.
177
543447
2307
ở A, T, C và G.
09:18
Nature has a way
to deal with this in our cells.
to deal with this in our cells.
178
546135
2978
Tự nhiên có một cách để giải quyết
vấn đề này.
vấn đề này.
09:21
But our data is stored
in synthetic DNA in a tube,
in synthetic DNA in a tube,
179
549137
5890
Nhưng dữ liệu của chúng ta
lưu trữ trong sợi tổng hợp DNA trong ống,
lưu trữ trong sợi tổng hợp DNA trong ống,
09:27
so we had to find our own way
to overcome this problem.
to overcome this problem.
180
555051
3252
vì vậy chúng ta phải tìm cách
giải quyết vấn đề này.
giải quyết vấn đề này.
09:30
We decided to use an algorithm
that was used to stream videos.
that was used to stream videos.
181
558724
4243
Chúng tôi quyết định sử dụng thuật toán
dùng trong phát trực tiếp video.
dùng trong phát trực tiếp video.
09:35
When you're streaming a video,
182
563452
1453
Khi bạn phát một video,
09:36
you're essentially trying to recover
the original video, the original file.
the original video, the original file.
183
564929
4461
bạn đang cố khôi phục
video gốc, tập tin gốc.
video gốc, tập tin gốc.
09:41
When we're trying to recover
our original files,
our original files,
184
569414
2909
Khi chúng ta khôi phục tập tin gốc,
09:44
we're simply sequencing.
185
572347
1848
chúng ta đơn giản là đang sắp xếp.
09:46
But really, both of these processes are
about recovering enough zeroes and ones
about recovering enough zeroes and ones
186
574219
4088
Nhưng thật ra, cả hai quá trình đều là
khôi phục đủ 0 và 1
khôi phục đủ 0 và 1
09:50
to put our data back together.
187
578331
1793
để ghép dữ liệu lại với nhau.
09:52
And so, because of our coding strategy,
188
580711
2041
Và vì thế, nhờ chiến thuật mã hóa,
09:54
we were able to package up all of our data
189
582776
2551
chúng ta có thể ghép lại
toàn bộ dữ liệu
toàn bộ dữ liệu
09:57
in a way that allowed us to make
millions and trillions of copies
millions and trillions of copies
190
585351
3772
theo một cách mà cho phép chúng ta
làm hàng triệu và nghìn tỉ bản sao
làm hàng triệu và nghìn tỉ bản sao
10:01
and still always recover
all of our files back.
all of our files back.
191
589147
2976
và vẫn luôn luôn hồi phục
được toàn bộ tập tin.
được toàn bộ tập tin.
10:04
This is the movie we encoded.
192
592708
1750
Đây là bộ phim chúng ta giải mã.
10:06
It's one of the first movies ever made,
193
594482
2580
Đây là một trong số những bộ phim
đầu tiên được sản xuất,
đầu tiên được sản xuất,
10:09
and now the first to be copied
more than 200 trillion times on DNA.
more than 200 trillion times on DNA.
194
597086
4759
và giờ đây là bộ phim đầu tiên sao chép
hơn 200 nghìn tỉ lần trên DNA.
hơn 200 nghìn tỉ lần trên DNA.
10:14
Soon after our work was published,
195
602377
2130
Ngay sau khi dự án
của chúng tôi công khai,
của chúng tôi công khai,
10:16
we participated in an "Ask Me Anything"
on the website reddit.
on the website reddit.
196
604531
3747
chúng tôi tham gia
"Hỏi tôi bất kì điều gì" trên Reddit
"Hỏi tôi bất kì điều gì" trên Reddit
10:20
If you're a fellow nerd,
you're very familiar with this website.
you're very familiar with this website.
197
608302
3175
Nếu bạn là một mọt sách,
bạn sẽ rất quen thuộc với trang web này.
bạn sẽ rất quen thuộc với trang web này.
10:23
Most questions were thoughtful.
198
611501
1945
Hầu hết câu hỏi đều rất sâu sắc.
10:25
Some were comical.
199
613470
1872
Một số thì lố bịch.
10:27
For example, one user wanted to know
when we would have a literal thumb drive.
when we would have a literal thumb drive.
200
615366
4128
Ví dụ, một người muốn biết khi nào
sẽ có một thiết bị 'ngón tay di động' thực thụ.
sẽ có một thiết bị 'ngón tay di động' thực thụ.
10:32
Now, the thing is,
201
620091
2276
Bây giờ, vấn đề là,
10:34
our DNA already stores everything
needed to make us who we are.
needed to make us who we are.
202
622391
4142
DNA của chúng ta vốn đã lưu trữ mọi
thứ cần thiết để làm nên chúng ta.
thứ cần thiết để làm nên chúng ta.
10:38
It's a lot safer to store data on DNA
203
626557
3818
Lưu trữ dữ liệu trên DNA an toàn hơn
rất nhiều
rất nhiều
10:42
in synthetic DNA in a tube.
204
630399
2821
trong sợi DNA trong 1 cái ống
10:46
Writing and reading data from DNA
is obviously a lot more time-consuming
is obviously a lot more time-consuming
205
634704
5426
Viết và đọc dữ liệu từ DNA rõ ràng
tốn thời gian hơn rất nhiều
tốn thời gian hơn rất nhiều
10:52
than just saving all your files
on a hard drive --
on a hard drive --
206
640154
3095
hơn là chỉ lưu trữ toàn bộ tệp
vào trong ổ cứng --
vào trong ổ cứng --
10:55
for now.
207
643273
1291
hiện nay.
10:57
So initially, we should focus
on long-term storage.
on long-term storage.
208
645159
3781
Vì vậy, ban đầu, chúng ta nên tập trung
lưu trữ thời gian dài.
lưu trữ thời gian dài.
11:02
Most data are ephemeral.
209
650630
2310
Hầu hết các dữ liệu tồn tại
không lâu.
không lâu.
11:04
It's really hard to grasp
what's important today,
what's important today,
210
652964
2588
Rất khó để biết điều gì là
quan trọng
quan trọng
11:07
or what will be important
for future generations.
for future generations.
211
655576
3252
hoặc điều sẽ cần thiết cho thế hệ
tương lai
tương lai
11:10
But the point is,
we don't have to decide today.
we don't have to decide today.
212
658852
2563
Nhưng chúng ta không phải
quyết định điều đó ngay hôm nay.
quyết định điều đó ngay hôm nay.
11:14
There's this great program by UNESCO
called the "Memory of the World" program.
called the "Memory of the World" program.
213
662065
4988
Có một dự án lớn của UNESCO gọi là
"Kí ức của thế giới"
"Kí ức của thế giới"
11:19
It's been created to preserve
historical materials
historical materials
214
667077
3267
Nó đã được tạo ra để bảo tồn
các di sản
các di sản
11:22
that are considered of value
to all of humanity.
to all of humanity.
215
670368
3127
có ý nghĩa với toàn bộ loài người.
11:26
Items are nominated
to be added to the collection,
to be added to the collection,
216
674210
2977
Những thứ mà được đề cử
đưa vào bộ sưu tập,
đưa vào bộ sưu tập,
11:29
including that film that we encoded.
217
677211
2255
bao gồm bộ phim chúng tôi giải mã.
11:32
While a wonderful way
to preserve human heritage,
to preserve human heritage,
218
680188
3582
Một cách tuyệt vời để
bảo tồn di sản loài người,
bảo tồn di sản loài người,
11:35
it doesn't have to be a choice.
219
683794
1912
nó không bắt buộc là một lựa chọn.
11:38
Instead of asking
the current generation -- us --
the current generation -- us --
220
686088
3454
Thay vì hỏi thế hệ hiện tại
-- chúng ta --
-- chúng ta --
11:41
what might be important in the future,
221
689566
2222
điều gì sẽ quan trọng trong tương lai,
11:43
we could store everything in DNA.
222
691812
2334
chúng ta có thể lưu mọi thứ trong DNA.
11:47
Storage is not just about how many bytes
223
695543
2440
Lưu trữ không chỉ là bao nhiêu byte
11:50
but how well we can actually
store the data and recover it.
store the data and recover it.
224
698007
3501
mà là làm cách nào ta có thể
thực sự lưu trữ và phục hồi dữ liệu.
thực sự lưu trữ và phục hồi dữ liệu.
11:53
There's always been this tension
between how much data we can generate
between how much data we can generate
225
701940
3431
Luôn có sự ràng buộc giữa
bao nhiêu dữ liệu ta có thể tạo ra
bao nhiêu dữ liệu ta có thể tạo ra
11:57
and how much we can recover
226
705395
1715
và bao nhiêu ta có thể khôi phục
11:59
and how much we can store.
227
707134
1769
và bao nhiêu ta có thể lưu trữ.
12:01
Every advance in writing data
has required a new way to read it.
has required a new way to read it.
228
709841
4039
Mọi cải tiến trong viết dữ liệu
yêu cầu một cách mới để đọc nó.
yêu cầu một cách mới để đọc nó.
12:05
We can no longer read old media.
229
713904
2343
Chúng ta không còn có thể
đọc phương tiện truyền thông cũ.
đọc phương tiện truyền thông cũ.
12:08
How many of you even have
a disk drive in your laptop,
a disk drive in your laptop,
230
716271
3741
Có bao nhiêu người trong số các bạn
có ổ đĩa trên laptop,
có ổ đĩa trên laptop,
12:12
never mind a floppy drive?
231
720036
1724
không một ổ đĩa mềm?
12:14
This will never be the case with DNA.
232
722151
2552
Nó không bao giờ là vấn đề với DNA.
12:16
As long as we're around, DNA is around,
233
724727
3177
Khi chúng ta còn tồn tại,
DNA còn tồn tại,
DNA còn tồn tại,
12:19
and we'll find a way to sequence it.
234
727928
2180
và chúng ta sẽ có cách xác định
trật tự của nó.
trật tự của nó.
12:23
Archiving the world around us
is part of human nature.
is part of human nature.
235
731214
3459
Lưu trữ thế giới xung quanh là
một bản tính của con người.
một bản tính của con người.
12:27
This is the progress we've made
in digital storage in 60 years,
in digital storage in 60 years,
236
735172
4624
Đây là sự tiến bộ chúng ta đạt được
trong lưu trữ dữ liệu số trong 60 năm,
trong lưu trữ dữ liệu số trong 60 năm,
12:31
at a time when we were only
beginning to understand DNA.
beginning to understand DNA.
237
739820
3376
vào thời điểm chúng ta chỉ vừa
bắt đầu hiểu về DNA.
bắt đầu hiểu về DNA.
12:35
Yet, we've made similar progress
in half that time with DNA sequencers,
in half that time with DNA sequencers,
238
743725
4845
Nhưng, chúng ta đạt được tiến bộ tương tự
với nửa thời gian khi xác định trật tự DNA,
với nửa thời gian khi xác định trật tự DNA,
12:40
and as long as we're around,
DNA will never be obsolete.
DNA will never be obsolete.
239
748594
4943
và khi chúng ta tồn tại,
DNA sẽ không bao giờ lỗi thời.
DNA sẽ không bao giờ lỗi thời.
12:46
Thank you.
240
754107
1181
Cảm ơn các bạn.
12:47
(Applause)
241
755312
4981
(Vỗ tay)
ABOUT THE SPEAKER
Dina Zielinski - Bench scientist, bioinformaticianDina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA.
Why you should listen
Dina Zielinski is a bench scientist and bioinformatician with broad experience in genetics and genomics. Her current projects are in developmental biology and neurology, but she is motivated to keep learning and using her skills to answer scientific questions that challenge our deepest knowledge.
Dina Zielinski | Speaker | TED.com