Yaniv Erlich: How we're building the world's largest family tree
Yaniv Erlich: Como estamos a criar a maior árvore genealógica do mundo
Yaniv Erlich is fascinated by the connection between DNA and data. Full bio
Double-click the English transcript below to play the video.
for various reasons.
por diversas razões.
popular categories of website
mais populares da Internet
typically consume in private.
habitualmente consomem em privado.
of self-indulgence
de autocomplacência
the reproductive activities
as atividades reprodutivas
a história familiar,
that is obsessed with genealogy.
obcecada pela genealogia.
you want to sit next to
que queremos ao nosso lado
with peculiar details
sobre parentes antigos.
for biomedical research.
para a investigação biomédica.
and his fellow genealogists
e os seus camaradas genealogistas
a genealogy website called geni.com.
num "website" chamado geni.com.
as suas árvores neste "website",
their trees to the website,
com outras árvores existentes,
and the new tree together.
às árvores já existentes.
family trees are created,
grandes árvores genealógicas,
of each genealogist.
de cada genealogia.
with millions of people
com milhões de pessoas,
of a family tree of all humankind.
genealógica de toda a humanidade.
on the screens over here
esta árvore num ecrã
of 6,000 individuals.
dum subconjunto de 6000 indivíduos.
representam os casamentos
you see the ancestors.
vemos os antepassados.
you see the descendants.
vemos os descendentes.
generations, approximately.
aproximadamente.
when we increase the number of individuals
quando aumentamos
para 70 000 pessoas,
of all the data that we have.
de todos os dados que temos.
the formation of gigantic family trees
a formação de gigantescas árvores
of our genealogists,
dos nossos genealogistas,
hundreds of years ago.
centenas de anos.
US Secretary of the Treasury,
Secretário do Tesouro dos EUA
due to a popular Broadway musical.
devido a um musical da Broadway.
connections in the showbiz industry.
ligações com a indústria do espetáculo.
of a lady from Scotland
de uma senhora escocesa
que Alexander Hamilton
de Kevin Bacon.
of stories like that.
de histórias destas.
to validate the quality of our data.
para validar a qualidade dos dados.
the mother-child connections in our data
das ligações mãe-filho nos nossos dados
in the US pre-Second World War.
nos EUA, antes da II Guerra Mundial.
connections in our data are wrong.
nos nossos dados que são incorretas.
com um sorriso amarelo.
in patrilineal connections
nas ligações patrilineares
a similar error rate
uma taxa semelhante de erro
dos nossos dados é boa
a profound, vested interest
têm um profundo interesse
their family history.
a sua história de família.
quantitative information about humanity,
informações quantitativas da humanidade,
questões sobre demografia.
on the map of the world.
os nossos perfis no mapa mundo.
that lived at some point.
que viveu em dada altura.
of many countries,
de muitos países,
the map that I've showed you
o mapa que vos mostrei,
from 1400 to 1900,
de pessoas entre 1400 e 1900.
to known migration events.
com movimentos migratórios conhecidos.
that the deepest lineages in our data
mais profundas dos nossos dados
the routes of Western colonialism.
pelas vias do colonialismo ocidental.
em Massachusetts]
instalam-se na África do Sul]
da Grã-Bretanha para a Austrália]
transportation to Australia starts]
usam o Trilho do Oregon]
are giving the context of families,
põem as famílias em contexto,
between the birth locations
entre os locais de nascimento
a pivotal role in demography,
um papel fundamental na demografia
people migrate to form families
as pessoas migram para formar famílias
in geographical areas.
se espalham pelas áreas geográficas.
usando os nossos dados
in the village nearby.
da aldeia vizinha.
really complicated our love life.
complicou a nossa vida amorosa.
and online social media,
e as redes sociais
100 kilometers from their place of birth
de distância do local do nascimento
of migrating from places to places
de migrar de um local para outro
para responder a esta pergunta
que têm o trabalho difícil
to places to form families.
para formar uma família.
are statistically significant,
do ponto de vista estatístico,
that males are lazy.
como facto científico,
about demography
sobre demografia
sobre a saúde humana.
account for differences in life span
genéticas existentes
na longevidade entre indivíduos.
of longevity between twins
a correlação de longevidade entre gémeos
variations account for
contribuem em cerca de um quarto
in life span between individuals.
dos indivíduos.
due to so many reasons,
devido a muitas razões,
to analyze both close relatives,
dão-nos a oportunidade
como os gémeos,
even fourth cousins.
até primos em quarto grau.
modelos robustos
of genetic variations
de variações genéticas
usando os nossos dados
explain only 15 percent
na longevidade entre indivíduos.
between individuals.
what we thought before to life span.
que aquilo que pensávamos,
our actions can matter more.
são mais importantes.
10 years of our life expectancy --
da nossa esperança de vida
pela genética.
mais descobertas surpreendentes
document and crowdsource DNA information.
documentarem informações de ADN.
but Uncle Bernie and his friends
mas o Tio Bernie e os seus amigos
forenses de ADN
what the FBI currently has.
tem atualmente.
on a large family tree,
numa grande árvore genealógica,
of distant relatives
de parentes distantes
that originated the DNA.
que originou esse ADN.
on a large family tree,
numa grande árvore genealógica,
of an unknown person,
duma pessoa desconhecida,
uses multiple satellites
usa múltiplos satélites
of the power of this technique
do poder desta técnica
in the history of the US.
da história dos EUA.
for this person for over 40 years.
desta pessoa há mais de 40 anos.
in any police database.
em nenhuma base de dados da polícia.
consulted a genetic genealogist,
consultou uma genealogista genética
his DNA to a genealogy service
o ADN num serviço de genealogias
of the Golden State Killer.
do Assassino do Golden State.
branches of that tree,
that exactly matched
que correspondia exatamente
the Golden State Killer.
do Assassino do Golden State.
and found a perfect match
e encontraram uma correspondência perfeita
and brought him to justice
have started working with
começaram a trabalhar
in order to capture criminals.
a fim de capturar criminosos.
over 20 cold cases with this technique.
mais de 20 casos arquivados.
Bernie and his fellow genealogists
como o Tio Bernie e os genealogistas.
with a self-serving hobby.
com um passatempo egoísta.
with a deep passion to tell us who we are.
com a profunda paixão
can hold a key to the future.
pode conter a chave do futuro.
ABOUT THE SPEAKER
Yaniv Erlich - Computational geneticistYaniv Erlich is fascinated by the connection between DNA and data.
Why you should listen
As a professor and researcher at Columbia University and as CSO of MyHeritage.com, Yaniv Erlich has performed foundational work in genetic privacy and large-scale studies of crowdsourced genomic data. Dubbed a "genome hacker" by the journal Nature, Erlich and his team discovered a privacy loophole enabling reidentification of allegedly anonymous male research participants using just internet searches and their Y chromosome. Later, he discovered that 60 percent of all US individuals with European descent can be identified by forensic genetics using open genetic genealogy databases, which Science magazine called one of the top 10 breakthroughs of 2018.
Erlich is also responsible for the construction of the world's largest family tree, comprising 13 million people, as well as the development of the website DNA.land, which has compiled the genotypes of more than 150,000 donors. He has also worked to discover the genetic bases for several conditions in Israeli families. His team has demonstrated stable DNA data storage, reaching a density of 215 petabyte per gram of DNA. He's been awarded numerous prizes, has published more than 45 papers and authored seven patents.
Yaniv Erlich | Speaker | TED.com