TEDxVienna
Dina Zielinski: How we can store digital data in DNA
Dina Zielinski: Comment stocker des données numériques dans l'ADN
Filmed:
Readability: 4.4
1,777,866 views
Des disquettes aux clés USB, tous les supports de stockage de données finissent par devenir obsolètes. Et si on pouvait trouver une manière de stocker indéfiniment toutes les données du monde ? Dina Zielinski, bio-informaticienne, révèle la science qui se cache derrière une solution présente depuis quelques milliards d'années : l'ADN.
Dina Zielinski - Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA. Full bio
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA. Full bio
Double-click the English transcript below to play the video.
00:12
I could fit all movies ever made
inside of this tube.
inside of this tube.
0
652
5196
Je pourrais rassembler tous les films
jamais réalisés à l'intérieur de ce tube.
jamais réalisés à l'intérieur de ce tube.
00:17
If you can't see it,
that's kind of the point.
that's kind of the point.
1
5872
2253
Si vous n'arrivez pas à le voir,
c'est le but.
c'est le but.
00:20
(Laughter)
2
8149
1016
(Rires)
00:21
Before we understand how this is possible,
3
9189
3243
Avant de comprendre
comment c'est possible,
comment c'est possible,
00:24
it's important to understand
the value of this feat.
the value of this feat.
4
12456
3746
il est important de comprendre
la valeur de cet exploit.
la valeur de cet exploit.
00:29
All of our thoughts
and actions these days,
and actions these days,
5
17075
2266
Toutes nos pensées et nos actions
de nos jours,
de nos jours,
00:31
through photos and videos --
6
19365
1986
sous la forme de photos et de vidéos --
00:33
even our fitness activities --
7
21375
1879
même nos activités sportives --
00:35
are stored as digital data.
8
23278
2133
sont stockées en tant que
données numériques.
données numériques.
00:38
Aside from running out of space
9
26109
1517
À part le manque de place
00:39
on our phones,
10
27650
1151
dans nos téléphones,
00:40
we rarely think about
our digital footprint.
our digital footprint.
11
28825
2314
on pense rarement à
notre empreinte numérique.
notre empreinte numérique.
00:43
But humanity has collectively
generated more data
generated more data
12
31536
3528
Mais l'Homme a collectivement
créé plus de données
créé plus de données
00:47
in the last few years
13
35088
1873
au cours des dernières années
00:48
than all of preceding human history.
14
36985
2530
que durant le reste de l'histoire
de l'humanité.
de l'humanité.
00:51
Big data has become a big problem.
15
39902
2898
Les gros volumes de données sont devenus
un gros problème.
un gros problème.
00:55
Digital storage is really expensive,
16
43229
2817
Le stockage numérique est très cher,
00:58
and none of these devices that we have
really stand the test of time.
really stand the test of time.
17
46070
3723
et aucun de ces appareils ne résistent
à l'épreuve du temps.
à l'épreuve du temps.
01:03
There's this nonprofit website
called the Internet Archive.
called the Internet Archive.
18
51256
3750
Il y a un site Internet à but non lucratif
appelé Internet Archive.
appelé Internet Archive.
01:07
In addition to free books and movies,
19
55030
2645
En plus de livres et de films gratuits,
01:09
you can access web pages
as far back as 1996.
as far back as 1996.
20
57699
4364
on peut y trouver des pages Internet
remontant à 1996.
remontant à 1996.
01:14
Now, this is very tempting,
21
62087
1684
Ceci est trop excitant,
01:15
but I decided to go back and look at
the TED website's very humble beginnings.
the TED website's very humble beginnings.
22
63795
5989
et je suis allée jeter un coup d'œil
aux débuts modestes du site de TED.
aux débuts modestes du site de TED.
01:21
As you can see, it's changed
quite a bit in the last 30 years.
quite a bit in the last 30 years.
23
69808
3912
On peut voir qu'il a pas mal changé
au cours des 30 dernières années.
au cours des 30 dernières années.
01:26
So this led me to the first-ever TED,
24
74720
2824
Cela m'a donc amenée au tout premier TED
01:29
back in 1984,
25
77568
2180
en 1984,
01:31
and it just so happened
to be a Sony executive
to be a Sony executive
26
79772
2525
et il s'est avéré que
c'était un cadre de Sony
c'était un cadre de Sony
01:34
explaining how a compact disk works.
27
82321
3058
qui expliquait le fonctionnement
d'un disque compact.
d'un disque compact.
01:37
(Laughter)
28
85403
1079
(Rires)
01:38
Now, it's really incredible
to be able to go back in time
to be able to go back in time
29
86506
4264
C'est incroyable de pouvoir remonter
dans le temps
dans le temps
01:42
and access this moment.
30
90794
2286
et d'accéder à ce moment.
01:45
It's also really fascinating
that after 30 years, after that first TED,
that after 30 years, after that first TED,
31
93548
5363
Ce qui est aussi fascinant,
c'est que 30 ans après ce premier TED,
c'est que 30 ans après ce premier TED,
01:50
we're still talking about digital storage.
32
98935
2779
on parle encore de stockage numérique.
01:54
Now, if we look back another 30 years,
33
102827
2787
Et en remontant 30 ans de plus en arrière,
01:57
IBM released the first-ever hard drive
34
105638
3185
IBM lançait le tout premier disque dur
02:00
back in 1956.
35
108847
2127
en 1956.
02:02
Here it is being loaded for shipping
in front of a small audience.
in front of a small audience.
36
110998
4197
On le voit ici être chargé pour livraison
devant un petit public.
devant un petit public.
02:07
It held the equivalent of one MP3 song
37
115569
3110
Il contenait l'équivalent
d'une chanson MP3
d'une chanson MP3
02:11
and weighed over one ton.
38
119354
2004
et pesait plus d'une tonne.
02:14
At 10,000 dollars a megabyte,
39
122100
2651
À presque 9 000 euros le mégaoctet,
02:16
I don't think anyone in this room
would be interested in buying this thing,
would be interested in buying this thing,
40
124775
3587
je pense que personne ici
ne souhaiterait l'acheter,
ne souhaiterait l'acheter,
02:20
except maybe as a collector's item.
41
128386
1760
sauf peut-être un collectionneur.
02:22
But it's the best we could do at the time.
42
130817
2988
Mais c'était le mieux
qu'on pouvait faire à l'époque.
qu'on pouvait faire à l'époque.
02:26
We've come such a long way
in data storage.
in data storage.
43
134832
3116
On a tant accompli en termes
de stockage numérique.
de stockage numérique.
02:29
Devices have evolved dramatically.
44
137972
2898
Les appareils ont énormément évolué.
02:32
But all media eventually wear out
or become obsolete.
or become obsolete.
45
140894
4024
Mais ces supports finissent par s'user
ou deviennent obsolètes.
ou deviennent obsolètes.
02:37
If someone handed you a floppy drive today
to back up your presentation,
to back up your presentation,
46
145401
4417
Si quelqu'un vous donnait une disquette
pour sauvegarder votre exposé aujourd'hui,
pour sauvegarder votre exposé aujourd'hui,
02:41
you'd probably look at them
kind of strange, maybe laugh,
kind of strange, maybe laugh,
47
149842
2940
vous seriez tenté de rire ou
de le regarder d'un drôle d'œil,
de le regarder d'un drôle d'œil,
02:44
but you'd have no way
to use the damn thing.
to use the damn thing.
48
152806
2415
mais vous n'auriez aucun moyen
de l'utiliser.
de l'utiliser.
02:47
These devices can no longer meet
our storage needs,
our storage needs,
49
155854
3141
Ces supports ne répondent plus
à nos besoins de stockage,
à nos besoins de stockage,
02:51
although some of them can be repurposed.
50
159019
2702
bien que certains d'entre eux
peuvent être reconvertis.
peuvent être reconvertis.
02:54
All technology eventually dies or is lost,
51
162682
3109
Toute technologie finit par
s'éteindre ou se perdre,
s'éteindre ou se perdre,
02:57
along with our data,
52
165815
1851
avec nos données,
02:59
all of our memories.
53
167690
1540
tous nos souvenirs.
03:02
There's this illusion that
the storage problem has been solved,
the storage problem has been solved,
54
170210
4116
Il y a cette illusion selon laquelle
le problème de stockage est résolu,
le problème de stockage est résolu,
03:06
but really, we all just externalize it.
55
174350
2493
mais on ne fait que l'externaliser.
03:08
We don't worry about storing
our emails and our photos.
our emails and our photos.
56
176867
3477
On ne se soucie pas du stockage
de nos e-mails et photos.
de nos e-mails et photos.
03:12
They're just in the cloud.
57
180368
1723
Ils se trouvent juste dans le cloud.
03:15
But behind the scenes,
storage is problematic.
storage is problematic.
58
183231
2937
Mais dans les coulisses, le stockage
est un vrai problème.
est un vrai problème.
03:18
After all, the cloud is just
a lot of hard drives.
a lot of hard drives.
59
186192
3980
Après tout, le cloud, ce n'est que
de nombreux disques durs.
de nombreux disques durs.
03:23
Now, most digital data,
we could argue, is not really critical.
we could argue, is not really critical.
60
191156
4040
On peut dire que les données numériques
ne sont pas essentielles pour la plupart.
ne sont pas essentielles pour la plupart.
03:27
Surely, we could just delete it.
61
195220
2123
On pourrait juste les effacer.
03:29
But how can we really know
what's important today?
what's important today?
62
197957
3535
Mais comment savoir
ce qui est important aujourd'hui ?
ce qui est important aujourd'hui ?
03:34
We've learned so much about human history
63
202132
2536
On a tellement appris sur
l'histoire de l'humanité
l'histoire de l'humanité
03:36
from drawings and writings in caves,
64
204692
2826
grâce aux peintures rupestres,
03:39
from stone tablets.
65
207542
1614
ou aux tablettes en pierre.
03:41
We've deciphered languages
from the Rosetta Stone.
from the Rosetta Stone.
66
209180
3397
On a déchiffré des langues avec
la pierre de Rosette.
la pierre de Rosette.
03:45
You know, we'll never really have
the whole story, though.
the whole story, though.
67
213841
3609
On ne connaîtra cependant pas
toute l'histoire.
toute l'histoire.
03:49
Our data is our story,
68
217474
1894
Nos données sont notre histoire,
03:51
even more so today.
69
219392
1735
et encore plus aujourd'hui.
03:53
We won't have our record
recorded on stone tablets.
recorded on stone tablets.
70
221508
3261
Nos données ne seront pas enregistrées
sur des tablettes en pierre.
sur des tablettes en pierre.
03:57
But we don't have to choose
what is important now.
what is important now.
71
225692
2698
Mais on n'a pas à décider
ce qui importe maintenant.
ce qui importe maintenant.
04:00
There's a way to store it all.
72
228847
1893
Il y a un moyen de tout stocker.
04:03
It turns out that there's
a solution that's been around
a solution that's been around
73
231519
2598
Il se trouve que la solution existe
04:06
for a few billion years,
74
234141
2443
depuis quelques milliards d'années,
04:08
and it's actually in this tube.
75
236608
1840
et elle se trouve dans ce tube.
04:12
DNA is nature's oldest storage device.
76
240044
3722
L'ADN est le système
de stockage naturel le plus ancien.
de stockage naturel le plus ancien.
04:15
After all, it contains
all the information necessary
all the information necessary
77
243790
3371
Après tout, il contient
l'information nécessaire
l'information nécessaire
04:19
to build and maintain a human being.
78
247185
2830
pour construire et préserver
un être humain.
un être humain.
04:22
But what makes DNA so great?
79
250583
2204
Qu'est-ce qui rend l'ADN
aussi formidable ?
aussi formidable ?
04:25
Well, let's take our own genome
80
253493
1756
Prenons notre propre génome
04:27
as an example.
81
255273
1560
comme exemple.
04:28
If we were to print out
all three billion A's, T's, C's and G's
all three billion A's, T's, C's and G's
82
256857
4770
Si on devait imprimer les trois milliards
de A, T, C et G
de A, T, C et G
04:33
on a standard font, standard format,
83
261651
3631
dans une police de caractère,
dans un format standard,
dans un format standard,
04:37
and then we were
to stack all of those papers,
to stack all of those papers,
84
265306
2740
et empiler toutes les feuilles de papier,
04:40
it would be about 130 meters high,
85
268070
2660
cette pile mesurerait environ
130 mètres de haut,
130 mètres de haut,
04:42
somewhere between the Statue of Liberty
and the Washington Monument.
and the Washington Monument.
86
270754
3659
entre la Statue de la liberté
et le monument de Washington.
et le monument de Washington.
04:46
Now, if we converted
all those A's, T's, C's and G's
all those A's, T's, C's and G's
87
274437
2447
Maintenant, si on convertissait
ces A, T, C et G
ces A, T, C et G
04:48
to digital data, to zeroes and ones,
88
276898
2556
en données numériques, en zéros et uns,
04:51
it would total a few gigs.
89
279478
1769
on obtiendrait quelques gigaoctets.
04:53
And that's in each cell of our body.
90
281786
2339
Et ce, dans chaque cellule de notre corps.
04:56
We have more than 30 trillion cells.
91
284516
2838
On a plus de 30 000 milliards de cellules.
04:59
You get the idea:
92
287757
1500
Vous avez saisi l'idée :
05:01
DNA can store a ton of information
in a minuscule space.
in a minuscule space.
93
289281
4675
l'ADN peut stocker une tonne d'information
dans un espace minuscule.
dans un espace minuscule.
05:07
DNA is also very durable,
94
295620
1825
L'ADN est aussi très résistant,
05:09
and it doesn't even require
electricity to store it.
electricity to store it.
95
297469
2834
et n'a même pas besoin d'électricité
pour fonctionner.
pour fonctionner.
05:12
We know this because scientists
have recovered DNA from ancient humans
have recovered DNA from ancient humans
96
300327
4276
On le sait parce que des scientifiques
ont retrouvé de l'ADN d'humains
ont retrouvé de l'ADN d'humains
05:16
that lived hundreds
of thousands of years ago.
of thousands of years ago.
97
304627
2752
ayant vécu il y a des centaines
de milliers d'années.
de milliers d'années.
05:19
One of those is Ötzi the Iceman.
98
307739
2627
L'un d'eux étant Ötzi, l'homme des glaces,
05:22
Turns out, he's Austrian.
99
310390
1683
qui s'avère être autrichien.
05:24
(Laughter)
100
312097
1600
(Rires)
05:25
He was found high, well-preserved,
101
313721
1630
On l'a trouvé bien préservé,
05:27
in the mountains
between Italy and Austria,
between Italy and Austria,
102
315375
2814
en haute montagne,
entre l'Italie et l'Autriche,
entre l'Italie et l'Autriche,
05:30
and it turns out that he has living
genetic relatives here in Austria today.
genetic relatives here in Austria today.
103
318213
3984
et il se trouve qu'il a
des parents génétiques en Autriche.
des parents génétiques en Autriche.
05:34
So one of you could be a cousin of Ötzi.
104
322221
2342
L'un d'entre vous pourrait
être un cousin d'Ötzi.
être un cousin d'Ötzi.
05:36
(Laughter)
105
324587
1055
(Rires)
05:38
The point is that we have a better chance
of recovering information
of recovering information
106
326043
3853
Le fait est qu'on a plus de chance
de récupérer de l'information
de récupérer de l'information
05:41
from an ancient human
107
329920
1225
d'un humain ancestral
05:43
than we do from an old phone.
108
331169
2042
que d'un vieux téléphone.
05:45
It's also much less likely
that we'll lose the ability to read DNA
that we'll lose the ability to read DNA
109
333783
4645
Il est moins probable de perdre
la capacité de lire l'ADN
la capacité de lire l'ADN
05:50
than any single man-made device.
110
338452
2434
que celle d'un appareil fait par l'homme.
05:53
Every single new storage format
requires a new way to read it.
requires a new way to read it.
111
341567
4112
Tout nouveau support de stockage
exige un nouveau moyen de le lire.
exige un nouveau moyen de le lire.
05:57
We'll always be able to read DNA.
112
345703
2133
On pourra toujours lire l'ADN.
05:59
If we can no longer sequence,
we have bigger problems
we have bigger problems
113
347860
3068
Si on ne peut plus séquencer l'ADN,
on a des problèmes plus gros
on a des problèmes plus gros
06:02
than worrying about data storage.
114
350952
2281
que de se soucier du stockage numérique.
06:05
Storing data on DNA is not new.
115
353725
3071
Stocker des données dans l'ADN
n'est pas une idée nouvelle.
n'est pas une idée nouvelle.
06:08
Nature's been doing it
for several billion years.
for several billion years.
116
356820
3099
La nature le fait depuis
plusieurs milliards d'années.
plusieurs milliards d'années.
06:11
In fact, every living thing
is a DNA storage device.
is a DNA storage device.
117
359943
3892
En fait, chaque être vivant est
un support de stockage d'ADN.
un support de stockage d'ADN.
06:16
But how do we store data on DNA?
118
364397
2786
Mais comment stocker
des données dans l'ADN ?
des données dans l'ADN ?
06:19
This is Photo 51.
119
367725
1791
Ceci est la photo 51.
06:21
It's the first-ever photo of DNA,
120
369540
2627
C'est la toute première photo d'ADN,
06:24
taken about 60 years ago.
121
372191
2252
prise il y a environ 60 ans.
06:26
This is around the time that
that same hard drive was released by IBM.
that same hard drive was released by IBM.
122
374467
4382
C'est à peu près au même moment
que le disque dur d'IBM.
que le disque dur d'IBM.
06:31
So really, our understanding of digital
storage and of DNA have coevolved.
storage and of DNA have coevolved.
123
379246
5492
La connaissance du stockage numérique et
celle de l'ADN ont évolué en même temps.
celle de l'ADN ont évolué en même temps.
06:37
We first learned to sequence, or read DNA,
124
385600
3316
On a appris à séquencer ou lire l'ADN,
06:40
and very soon after, how to write it,
125
388940
2012
et rapidement après, à l'écrire
06:42
or synthesize it.
126
390976
1559
ou le synthétiser.
06:44
This is much like how we learn
a new language.
a new language.
127
392559
3564
C'est comparable à l'apprentissage
d'une nouvelle langue.
d'une nouvelle langue.
06:48
And now we have the ability
to read, write and copy DNA.
to read, write and copy DNA.
128
396812
4613
Et maintenant, on peut lire,
écrire et copier l'ADN.
écrire et copier l'ADN.
06:53
We do it in the lab all the time.
129
401449
2080
On le fait constamment en laboratoire.
06:56
So anything, really anything,
that can be stored as zeroes and ones
that can be stored as zeroes and ones
130
404283
3882
Donc, tout ce qui peut être stocké
sous la forme de zéros et uns
sous la forme de zéros et uns
07:00
can be stored in DNA.
131
408189
1719
peut être stocké dans l'ADN.
07:02
To store something digitally,
like this photo,
like this photo,
132
410579
3195
Pour stocker quelque chose numériquement,
comme cette photo,
comme cette photo,
07:05
we convert it to bits, or binary digits.
133
413798
3306
on le convertit en bits ou
chiffres binaires.
chiffres binaires.
07:09
Each pixel in a black-and-white photo
is simply a zero or a one.
is simply a zero or a one.
134
417128
4211
Chaque pixel d'une photo en noir et blanc
est simplement un zéro ou un un.
est simplement un zéro ou un un.
07:13
And we can write DNA much like an inkjet
printer can print letters on a page.
printer can print letters on a page.
135
421849
4824
On peut écrire l'ADN comme une imprimante
peut imprimer des lettres sur une page.
peut imprimer des lettres sur une page.
07:18
We just have to convert our data,
all of those zeroes and ones,
all of those zeroes and ones,
136
426697
3824
On doit juste convertir nos données,
tous ces zéros et uns,
tous ces zéros et uns,
07:22
to A's, T's, C's and G's,
137
430545
2138
en A, T, C et G,
07:24
and then we send this
to a synthesis company.
to a synthesis company.
138
432707
2258
et envoyer le tout à
une entreprise de synthèse.
une entreprise de synthèse.
07:26
So we write it, we can store it,
139
434989
1947
Donc on écrit, on sauvegarde,
07:28
and when we want to recover our data,
we just sequence it.
we just sequence it.
140
436960
3234
et pour récupérer nos données,
on séquence.
on séquence.
07:32
Now, the fun part of all of this
is deciding what files to include.
is deciding what files to include.
141
440218
4081
Maintenant, le plus amusant est de
décider quel genre de fichier inclure.
décider quel genre de fichier inclure.
07:36
We're serious scientists,
so we had to include a manuscript
so we had to include a manuscript
142
444323
3377
Nous sommes des chercheurs sérieux ;
on a donc dû intégrer un manuscrit
on a donc dû intégrer un manuscrit
07:39
for good posterity.
143
447724
1743
pour les générations à venir.
07:41
We also included a $50 Amazon gift card --
144
449491
2833
On a aussi inclus une carte-cadeau
Amazon de 45 euros --
Amazon de 45 euros --
07:44
don't get too excited, it's already
been spent, someone decoded it --
been spent, someone decoded it --
145
452348
3531
pas d'affolement, la carte est vide,
quelqu'un l'a décodée --
quelqu'un l'a décodée --
07:47
as well as an operating system,
146
455903
2210
ainsi qu'un système d'exploitation,
07:50
one of the first movies ever made
147
458137
2371
l'un des premiers films jamais créés
07:52
and a Pioneer plaque.
148
460532
1738
et une plaque de Pioneer.
07:54
Some of you might have seen this.
149
462294
1669
Vous l'avez peut-être vue.
07:55
It has a depiction of a typical --
apparently -- male and female,
apparently -- male and female,
150
463987
3456
On y voit la description, apparemment,
typique de l'homme et de la femme,
typique de l'homme et de la femme,
07:59
and our approximate location
in the Solar System,
in the Solar System,
151
467467
2562
et notre position dans le système solaire,
08:02
in case the Pioneer spacecraft
ever encounters extraterrestrials.
ever encounters extraterrestrials.
152
470053
4002
au cas où la sonde Pioneer rencontrerait
des extra-terrestres.
des extra-terrestres.
08:06
So once we decided what sort of files
we want to encode,
we want to encode,
153
474861
2929
Une fois qu'on a décidé quel genre
de fichiers encoder,
de fichiers encoder,
08:09
we package up the data,
154
477814
1468
on a traité les données,
08:11
convert those zeroes and ones
to A's, T's, C's and G's,
to A's, T's, C's and G's,
155
479306
3654
converti les zéros et uns en A, T, C et G,
08:14
and then we just send this file off
to a synthesis company.
to a synthesis company.
156
482984
3277
et on a envoyé le fichier à
une entreprise de synthèse.
une entreprise de synthèse.
08:18
And this is what we got back.
157
486285
1770
Et voici ce qu'on nous a renvoyé.
08:20
Our files were in this tube.
158
488079
1919
Tous nos fichiers sont dans ce tube.
08:22
All we had to do was sequence it.
159
490022
2098
On n'a eu qu'à les séquencer.
08:24
This all sounds pretty straightforward,
160
492525
2531
Ça a l'air assez simple comme ça,
08:27
but the difference between
a really cool, fun idea
a really cool, fun idea
161
495080
2978
mais la différence entre une super idée
08:30
and something we can actually use
162
498082
2155
et une chose qu'on peut vraiment utiliser
08:32
is overcoming these practical challenges.
163
500261
2496
surpasse ces défis pratiques.
08:35
Now, while DNA is more robust
than any man-made device,
than any man-made device,
164
503453
3972
L'ADN est peut-être plus solide que
n'importe quel appareil fait par l'homme,
n'importe quel appareil fait par l'homme,
08:39
it's not perfect.
165
507449
1285
mais il n'est pas parfait.
08:40
It does have some weaknesses.
166
508758
1950
Il a ses faiblesses.
08:43
We recover our message
by sequencing the DNA,
by sequencing the DNA,
167
511364
3431
On récupère le message
en séquençant l'ADN,
en séquençant l'ADN,
08:46
and every time data is retrieved,
168
514819
2013
et une fois les données extraites,
08:48
we lose the DNA.
169
516856
1786
on perd l'ADN.
08:50
That's just part
of the sequencing process.
of the sequencing process.
170
518666
2414
Cela fait partie du processus
de séquençage.
de séquençage.
08:53
We don't want to run out of data,
171
521104
1935
On ne veut pas être à court de données,
08:55
but luckily, there's a way to copy the DNA
172
523063
3096
mais heureusement, l'ADN peut être copié,
08:58
that's even cheaper and easier
than synthesizing it.
than synthesizing it.
173
526183
4585
ce qui est moins cher et plus facile
que de le synthétiser.
que de le synthétiser.
09:03
We actually tested a way to make
200 trillion copies of our files,
200 trillion copies of our files,
174
531275
4858
On a essayé de faire 200 000
milliards de copies de nos fichiers,
milliards de copies de nos fichiers,
09:08
and we recovered
all the data without error.
all the data without error.
175
536157
2732
et on a récupéré
toutes les données sans erreur.
toutes les données sans erreur.
09:11
So sequencing also introduces
errors into our DNA,
errors into our DNA,
176
539556
3867
Le séquençage introduit aussi
des erreurs dans notre ADN,
des erreurs dans notre ADN,
09:15
into the A's, T's, C's and G's.
177
543447
2307
dans les A, T, C et G.
09:18
Nature has a way
to deal with this in our cells.
to deal with this in our cells.
178
546135
2978
La nature a un moyen d'y faire face
dans nos cellules.
dans nos cellules.
09:21
But our data is stored
in synthetic DNA in a tube,
in synthetic DNA in a tube,
179
549137
5890
Mais nos données sont stockées
dans de l'ADN synthétique en tube ;
dans de l'ADN synthétique en tube ;
09:27
so we had to find our own way
to overcome this problem.
to overcome this problem.
180
555051
3252
on a donc dû trouver notre propre solution
pour résoudre ce problème.
pour résoudre ce problème.
09:30
We decided to use an algorithm
that was used to stream videos.
that was used to stream videos.
181
558724
4243
On a donc utilisé un algorithme destiné
à la diffusion de vidéos en continu.
à la diffusion de vidéos en continu.
09:35
When you're streaming a video,
182
563452
1453
Regarder une vidéo en streaming
09:36
you're essentially trying to recover
the original video, the original file.
the original video, the original file.
183
564929
4461
consiste en gros à essayer de récupérer
la vidéo originale, le fichier d'origine.
la vidéo originale, le fichier d'origine.
09:41
When we're trying to recover
our original files,
our original files,
184
569414
2909
Lorsqu'on essaie de récupérer
nos fichiers originaux,
nos fichiers originaux,
09:44
we're simply sequencing.
185
572347
1848
on fait tout simplement du séquençage.
09:46
But really, both of these processes are
about recovering enough zeroes and ones
about recovering enough zeroes and ones
186
574219
4088
En réalité, les deux procédés consistent à
récupérer suffisamment de zéros et uns
récupérer suffisamment de zéros et uns
09:50
to put our data back together.
187
578331
1793
pour rétablir nos données.
09:52
And so, because of our coding strategy,
188
580711
2041
Donc, grâce à notre stratégie de codage,
09:54
we were able to package up all of our data
189
582776
2551
on a pu traiter toutes nos données
09:57
in a way that allowed us to make
millions and trillions of copies
millions and trillions of copies
190
585351
3772
de façon à pouvoir faire
des milliards de copies
des milliards de copies
10:01
and still always recover
all of our files back.
all of our files back.
191
589147
2976
et récupérer à chaque fois
tous nos fichiers.
tous nos fichiers.
10:04
This is the movie we encoded.
192
592708
1750
Voici le film qu'on a encodé.
10:06
It's one of the first movies ever made,
193
594482
2580
C'est l'un des premiers films
jamais réalisés,
jamais réalisés,
10:09
and now the first to be copied
more than 200 trillion times on DNA.
more than 200 trillion times on DNA.
194
597086
4759
et désormais le premier à être copié plus
de 200 000 milliards de fois sur de l'ADN.
de 200 000 milliards de fois sur de l'ADN.
10:14
Soon after our work was published,
195
602377
2130
Peu après la publication de notre travail,
10:16
we participated in an "Ask Me Anything"
on the website reddit.
on the website reddit.
196
604531
3747
on a participé à un débat
« Ask Me Anything » du site Reddit.
« Ask Me Anything » du site Reddit.
10:20
If you're a fellow nerd,
you're very familiar with this website.
you're very familiar with this website.
197
608302
3175
Si vous êtes aussi un fan,
vous connaissez bien ce site Internet.
vous connaissez bien ce site Internet.
10:23
Most questions were thoughtful.
198
611501
1945
La plupart des questions étaient censées.
10:25
Some were comical.
199
613470
1872
D'autres plutôt drôles.
10:27
For example, one user wanted to know
when we would have a literal thumb drive.
when we would have a literal thumb drive.
200
615366
4128
Comme celle de savoir à quand le transfert
littéral de données en main propre.
littéral de données en main propre.
10:32
Now, the thing is,
201
620091
2276
Une chose cependant :
10:34
our DNA already stores everything
needed to make us who we are.
needed to make us who we are.
202
622391
4142
notre ADN comprend déjà tout le nécessaire
pour faire de nous ce que nous sommes.
pour faire de nous ce que nous sommes.
10:38
It's a lot safer to store data on DNA
203
626557
3818
Il est beaucoup plus sûr
de stocker des données
de stocker des données
10:42
in synthetic DNA in a tube.
204
630399
2821
sur de l'ADN synthétique en tube.
10:46
Writing and reading data from DNA
is obviously a lot more time-consuming
is obviously a lot more time-consuming
205
634704
5426
Écrire et lire des données dans l'ADN
demande certes beaucoup plus de temps
demande certes beaucoup plus de temps
10:52
than just saving all your files
on a hard drive --
on a hard drive --
206
640154
3095
que la simple sauvegarde de tous
vos fichiers sur un disque dur --
vos fichiers sur un disque dur --
10:55
for now.
207
643273
1291
pour le moment.
10:57
So initially, we should focus
on long-term storage.
on long-term storage.
208
645159
3781
En premier temps, on devrait donc se
concentrer sur le stockage à long terme.
concentrer sur le stockage à long terme.
11:02
Most data are ephemeral.
209
650630
2310
La plupart des données sont éphémères.
11:04
It's really hard to grasp
what's important today,
what's important today,
210
652964
2588
Il est difficile de décider
ce qui est important,
ce qui est important,
11:07
or what will be important
for future generations.
for future generations.
211
655576
3252
aujourd'hui ou pour
les générations futures.
les générations futures.
11:10
But the point is,
we don't have to decide today.
we don't have to decide today.
212
658852
2563
Mais le fait est qu'on n'a pas
à décider aujourd'hui.
à décider aujourd'hui.
11:14
There's this great program by UNESCO
called the "Memory of the World" program.
called the "Memory of the World" program.
213
662065
4988
L'UNESCO a lancé le formidable programme
intitulé « Mémoire du Monde »
intitulé « Mémoire du Monde »
11:19
It's been created to preserve
historical materials
historical materials
214
667077
3267
qui a été créé pour préserver
des documents historiques
des documents historiques
11:22
that are considered of value
to all of humanity.
to all of humanity.
215
670368
3127
considérés comme précieux
pour l'ensemble de l'humanité.
pour l'ensemble de l'humanité.
11:26
Items are nominated
to be added to the collection,
to be added to the collection,
216
674210
2977
Des éléments sont nominés pour être
ajoutés à cette collection,
ajoutés à cette collection,
11:29
including that film that we encoded.
217
677211
2255
notamment le film qu'on a encodé.
11:32
While a wonderful way
to preserve human heritage,
to preserve human heritage,
218
680188
3582
Même si c'est un formidable moyen
de préserver le patrimoine humain,
de préserver le patrimoine humain,
11:35
it doesn't have to be a choice.
219
683794
1912
on n'est pas obligé de choisir.
11:38
Instead of asking
the current generation -- us --
the current generation -- us --
220
686088
3454
Au lieu de demander
à la génération actuelle -- nous --
à la génération actuelle -- nous --
11:41
what might be important in the future,
221
689566
2222
ce qui peut être important à l'avenir,
11:43
we could store everything in DNA.
222
691812
2334
on peut juste tout stocker dans l'ADN.
11:47
Storage is not just about how many bytes
223
695543
2440
Le stockage, ce n'est pas juste
le nombre d'octets,
le nombre d'octets,
11:50
but how well we can actually
store the data and recover it.
store the data and recover it.
224
698007
3501
mais notre compétence à stocker
les données et à les récupérer.
les données et à les récupérer.
11:53
There's always been this tension
between how much data we can generate
between how much data we can generate
225
701940
3431
Une tension a toujours régné entre
le volume de données qu'on peut créer,
le volume de données qu'on peut créer,
11:57
and how much we can recover
226
705395
1715
le volume qu'on peut récupérer
11:59
and how much we can store.
227
707134
1769
et le volume qu'on peut stocker.
12:01
Every advance in writing data
has required a new way to read it.
has required a new way to read it.
228
709841
4039
Chaque avancée dans l'écriture de données
a exigé un nouveau moyen de lecture.
a exigé un nouveau moyen de lecture.
12:05
We can no longer read old media.
229
713904
2343
On ne peut plus lire les vieux supports.
12:08
How many of you even have
a disk drive in your laptop,
a disk drive in your laptop,
230
716271
3741
Combien d'entre vous ont encore un lecteur
de CD dans votre ordinateur,
de CD dans votre ordinateur,
12:12
never mind a floppy drive?
231
720036
1724
et encore moins, de disquette ?
12:14
This will never be the case with DNA.
232
722151
2552
Ce ne sera jamais le cas avec l'ADN.
12:16
As long as we're around, DNA is around,
233
724727
3177
Tant qu'on sera en vie,
l'ADN sera présent,
l'ADN sera présent,
12:19
and we'll find a way to sequence it.
234
727928
2180
et on trouvera un moyen de le séquencer.
12:23
Archiving the world around us
is part of human nature.
is part of human nature.
235
731214
3459
Archiver le monde autour de nous
fait partie de la nature humaine.
fait partie de la nature humaine.
12:27
This is the progress we've made
in digital storage in 60 years,
in digital storage in 60 years,
236
735172
4624
Voici le progrès accompli en termes
de stockage numérique en 60 ans,
de stockage numérique en 60 ans,
12:31
at a time when we were only
beginning to understand DNA.
beginning to understand DNA.
237
739820
3376
à une époque où l'on commençait tout juste
à comprendre l'ADN.
à comprendre l'ADN.
12:35
Yet, we've made similar progress
in half that time with DNA sequencers,
in half that time with DNA sequencers,
238
743725
4845
Mais on a avancé de la même façon au sujet
du séquençage en moitié moins de temps,
du séquençage en moitié moins de temps,
12:40
and as long as we're around,
DNA will never be obsolete.
DNA will never be obsolete.
239
748594
4943
et tant qu'on sera en vie,
l'ADN ne sera jamais obsolète.
l'ADN ne sera jamais obsolète.
12:46
Thank you.
240
754107
1181
Merci.
12:47
(Applause)
241
755312
4981
(Applaudissements)
ABOUT THE SPEAKER
Dina Zielinski - Bench scientist, bioinformaticianDina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA.
Why you should listen
Dina Zielinski is a bench scientist and bioinformatician with broad experience in genetics and genomics. Her current projects are in developmental biology and neurology, but she is motivated to keep learning and using her skills to answer scientific questions that challenge our deepest knowledge.
Dina Zielinski | Speaker | TED.com