Yaniv Erlich: How we're building the world's largest family tree
Yaniv Erlich: Como estamos construindo a maior árvore genealógica do mundo
Yaniv Erlich is fascinated by the connection between DNA and data. Full bio
Double-click the English transcript below to play the video.
for various reasons.
a internet por várias razões.
popular categories of website
typically consume in private.
acessam reservadamente.
of self-indulgence
the reproductive activities
that is obsessed with genealogy.
uma pessoa obcecada por genealogia.
you want to sit next to
que ninguém quer se sentar ao lado,
with peculiar details
com detalhes específicos
do tio Bernie têm um imenso potencial
for biomedical research.
and his fellow genealogists
a genealogy website called geni.com.
usando um site chamado geni.com.
their trees to the website,
ele verifica os parentes,
and the new tree together.
family trees are created,
grandes árvores genealógicas,
of each genealogist.
de cada genealogista.
with millions of people
com milhões de pessoas,
of a family tree of all humankind.
de uma árvore de toda a humanidade.
125 milhões de pessoas
on the screens over here
a árvore nessas telas,
of 6,000 individuals.
que é apenas uma parte da árvore.
you see the ancestors.
you see the descendants.
generations, approximately.
aproximadamente.
when we increase the number of individuals
aumentamos o número de indivíduos
of all the data that we have.
do total de dados.
the formation of gigantic family trees
de árvores genealógicas gigantescas
of our genealogists,
árduo dos genealogistas,
hundreds of years ago.
vejam aqui Alexander Hamilton,
US Secretary of the Treasury,
secretário do Tesouro dos EUA,
due to a popular Broadway musical.
devido a um musical da Broadway.
connections in the showbiz industry.
profundas na indústria do showbiz.
of a lady from Scotland
que viveu no século 13.
que Alexander Hamilton
de 35 graus com Kevin Bacon.
of stories like that.
de histórias assim.
to validate the quality of our data.
a qualidade dos nossos dados.
the mother-child connections in our data
dos dados das conexões mãe-filho
in the US pre-Second World War.
antes da Segunda Guerra Mundial.
connections in our data are wrong.
nos dados estão erradas.
existem muitos leiteiros por aí.
in patrilineal connections
nas conexões patriarcais
a similar error rate
uma taxa de erro similar
dos nossos dados é boa
a profound, vested interest
têm um profundo interesse
their family history.
a história familiar.
quantitative information about humanity,
quantitativamente sobre a humanidade,
on the map of the world.
perfis no mapa-múndi.
that lived at some point.
que viveu em algum momento.
pode-se ver os contornos de muitos países,
of many countries,
the map that I've showed you
o mapa que acabei de mostrar,
from 1400 to 1900,
das pessoas entre os anos de 1400 a 1900,
to known migration events.
de migração conhecidos.
that the deepest lineages in our data
mais profundas dos dados
onde tinham um registro melhor
the routes of Western colonialism.
do colonialismo ocidental.
na África do Sul]
transportation to Australia starts]
da Grã-Bretanha para a Austrália]
usam a trilha do Oregon]
are giving the context of families,
estão num contexto das famílias,
between the birth locations
entre os locais de nascimento
a pivotal role in demography,
um papel fundamental na demografia,
people migrate to form families
migram para formar famílias
in geographical areas.
pelas áreas geográficas.
era tudo muito fácil.
in the village nearby.
com outras de aldeias próximas.
really complicated our love life.
complicou essa vida amorosa.
and online social media,
e com as mídias sociais,
100 kilometers from their place of birth
de 100 quilômetros de onde nasceram
of migrating from places to places
de um lugar a outro pra formar família?"
fazem esse trabalho difícil
to places to form families.
para formar uma família.
are statistically significant,
estatisticamente significativos
that males are lazy.
que os homens são preguiçosos.
about demography
sobre demografia
account for differences in life span
as diferenças no tempo de vida
of longevity between twins
da longevidade entre gêmeos
variations account for
genéticas respondem
no tempo de vida das pessoas.
in life span between individuals.
due to so many reasons,
por várias razões,
ou por viverem na mesma casa.
to analyze both close relatives,
analisar parentes próximos,
even fourth cousins.
como primos de quarto grau.
modelos consistentes
of genetic variations
das variações genéticas
usando nossos dados,
explain only 15 percent
genéticas explicam apenas 15%
between individuals.
de vida entre indivíduos.
what we thought before to life span.
menos do que pensávamos antes.
our actions can matter more.
são mais importantes.
10 years of our life expectancy --
da nossa expectativa de vida;
mais surpreendentes
document and crowdsource DNA information.
e documentarem informações sobre o DNA.
but Uncle Bernie and his friends
mas o tio Bernie e seus amigos
what the FBI currently has.
on a large family tree,
of distant relatives
that originated the DNA.
à pessoa que originou o DNA.
on a large family tree,
numa grande árvore genealógica,
of an unknown person,
de uma pessoa desconhecida,
uses multiple satellites
o sistema GPS usa vários satélites
of the power of this technique
do Golden State, na Califórnia,
in the history of the US.
da história dos EUA.
for this person for over 40 years.
in any police database.
nos bancos de dados da polícia.
consulted a genetic genealogist,
uma genealogista genética
his DNA to a genealogy service
o DNA dele a um serviço de genealogia,
of the Golden State Killer.
de terceiro grau do assassino.
branches of that tree,
that exactly matched
que correspondesse exatamente
the Golden State Killer.
and found a perfect match
e encontraram uma combinação perfeita
and brought him to justice
depois de todos esses anos.
have started working with
genéticos começaram a trabalhar
in order to capture criminals.
para capturar criminosos.
over 20 cold cases with this technique.
mais de 20 casos arquivados.
Bernie and his fellow genealogists
e seus colegas genealogistas.
with a self-serving hobby.
with a deep passion to tell us who we are.
paixão para investigar quem somos.
can hold a key to the future.
pode ser a chave para o futuro.
ABOUT THE SPEAKER
Yaniv Erlich - Computational geneticistYaniv Erlich is fascinated by the connection between DNA and data.
Why you should listen
As a professor and researcher at Columbia University and as CSO of MyHeritage.com, Yaniv Erlich has performed foundational work in genetic privacy and large-scale studies of crowdsourced genomic data. Dubbed a "genome hacker" by the journal Nature, Erlich and his team discovered a privacy loophole enabling reidentification of allegedly anonymous male research participants using just internet searches and their Y chromosome. Later, he discovered that 60 percent of all US individuals with European descent can be identified by forensic genetics using open genetic genealogy databases, which Science magazine called one of the top 10 breakthroughs of 2018.
Erlich is also responsible for the construction of the world's largest family tree, comprising 13 million people, as well as the development of the website DNA.land, which has compiled the genotypes of more than 150,000 donors. He has also worked to discover the genetic bases for several conditions in Israeli families. His team has demonstrated stable DNA data storage, reaching a density of 215 petabyte per gram of DNA. He's been awarded numerous prizes, has published more than 45 papers and authored seven patents.
Yaniv Erlich | Speaker | TED.com