Yaniv Erlich: How we're building the world's largest family tree
야니브 에를리치(Yaniv Erlich): 세계에서 가장 큰 가계도를 만드는 방법
Yaniv Erlich is fascinated by the connection between DNA and data. Full bio
Double-click the English transcript below to play the video.
for various reasons.
인터넷을 사용합니다.
popular categories of website
웹사이트 중 하나는
typically consume in private.
어떤 것이었습니다.
of self-indulgence
the reproductive activities
기록하는 데 중점을 둡니다.
that is obsessed with genealogy.
족보에 집착하는 사람이 있죠.
you want to sit next to
버니 삼촌 옆에는 앉지 않을 겁니다.
with peculiar details
이상한 정보로
생명 의학 연구에
for biomedical research.
알게 되었습니다.
and his fellow genealogists
a genealogy website called geni.com.
그들의 가계도를 기록하도록 했습니다.
their trees to the website,
웹사이트에 올리면,
and the new tree together.
family trees are created,
개인적인 수준을 넘는
of each genealogist.
with millions of people
of a family tree of all humankind.
크라우드 소싱할 수 있습니다.
연결할 수 있었습니다.
on the screens over here
그릴 순 없습니다.
of 6,000 individuals.
하위 집합의 예가 있습니다.
you see the ancestors.
you see the descendants.
그 자손들을 볼 수 있습니다.
generations, approximately.
when we increase the number of individuals
7만 명까지 늘렸을 때는
of all the data that we have.
여전히 아주 작은 부분집합입니다.
the formation of gigantic family trees
이미 많은 먼 친척들로 구성된
볼 수 있습니다.
of our genealogists,
hundreds of years ago.
돌아갈 수 있습니다.
여기 알렉산더 해밀턴이 있습니다.
US Secretary of the Treasury,
초대 재무 장관이었지만
due to a popular Broadway musical.
브로드웨이 뮤지컬의 인기 덕택이죠.
connections in the showbiz industry.
깊은 연줄이 있다는 걸 알게 됐습니다.
of a lady from Scotland
한 여인의 후손입니다.
친척이라고 할 수 있죠.
of stories like that.
수백만 개의 이야기를 가지고 있습니다.
to validate the quality of our data.
상당한 노력을 기울였습니다.
the mother-child connections in our data
어머니와 아이들의 관계 중 0.3%가
in the US pre-Second World War.
미국의 입양률과 일치할 겁니다.
connections in our data are wrong.
1.9%의 비율로 잘못되었습니다.
웃고 계신 게 보이네요.
in patrilineal connections
1.9% 오차율이
a similar error rate
이전 연구 자료도
a profound, vested interest
가족사를 정확하게 기록하는 데
their family history.
quantitative information about humanity,
인류의 양적 정보를 배울 수 있습니다.
문제 같은 거죠.
on the map of the world.
우리 모두의 프로필이 있습니다.
that lived at some point.
특정 시점에 살았던 사람입니다.
of many countries,
특히 서구 세계의
the map that I've showed you
보여드린 지도를 계층화했습니다.
from 1400 to 1900,
개인의 출생연도를 기준으로요.
to known migration events.
그걸 비교했어요.
that the deepest lineages in our data
거슬러 올라가보면
the routes of Western colonialism.
퍼져나갔습니다.
매사추세츠 상륙]
남아프리카 정착]
transportation to Australia starts]
호주로 유배 시작]
오리건 산길 이용]
are giving the context of families,
가족의 맥락을 말해주고 있기 때문에
between the birth locations
일반적인 거리는 얼마입니까?
a pivotal role in demography,
중요한 역할을 합니다.
people migrate to form families
이주하는 패턴이
in geographical areas.
결정하기 때문이죠.
이 거리를 분석했고
분석하기 쉬웠다는 걸 알게 됐습니다.
in the village nearby.
결혼했습니다.
really complicated our love life.
정말 복잡하게 만들었습니다.
and online social media,
온라인 소셜미디어와 함께
100 kilometers from their place of birth
떨어진 곳으로 이동하죠.
of migrating from places to places
누가 이곳저곳 이동하는
우리 데이터를 사용했죠.
했다는 것을 발견했죠.
to places to form families.
이곳저곳 옮겨가는 일이요.
are statistically significant,
that males are lazy.
과학적 사실로 받아들일 수 있으니까요.
about demography
질문으로부터 벗어나
질문할 수 있습니다.
account for differences in life span
어느 정도까지 설명할 수 있는지
of longevity between twins
쌍둥이의 장수의 상관관계를 분석했습니다.
variations account for
개인 간 수명 차이의
in life span between individuals.
추정했습니다.
due to so many reasons,
상관관계가 있겠죠.
to analyze both close relatives,
분석할 수 있는 기회가 됩니다.
even fourth cousins.
강력한 모델을 구축할 수 있죠.
of genetic variations
유전자 변이의 영향을 구별할 수 있습니다.
이 분석을 수행했고
explain only 15 percent
수명 차이 중 약 15%만을
between individuals.
what we thought before to life span.
우리가 생각했던 것보다 덜 중요합니다.
our actions can matter more.
의미하기 때문이죠.
10 years of our life expectancy --
기대수명의 10년을 결정한다면
두 배나 많습니다.
document and crowdsource DNA information.
크라우드 소싱하게 했을 때
but Uncle Bernie and his friends
버니 삼촌과 그의 친구들은
what the FBI currently has.
on a large family tree,
of distant relatives
표시할 수 있게 되죠.
that originated the DNA.
한 사람과 연결되어 있습니다.
on a large family tree,
여러 개의 비콘을 배치함으로써
of an unknown person,
DNA를 삼각측량할 수 있습니다.
uses multiple satellites
여러 개의 위성을 사용하는 방식과
of the power of this technique
in the history of the US.
가장 악명 높은 범죄자 중 한 명이죠.
for this person for over 40 years.
찾고 있었습니다.
in any police database.
나타나지 않았죠.
consulted a genetic genealogist,
한 유전 계보학자와 상담했고
his DNA to a genealogy service
계보학회에 제출하라고 했습니다.
of the Golden State Killer.
branches of that tree,
훑어봤습니다.
that exactly matched
알고 있는 것과
the Golden State Killer.
프로필을 찾을 때까지요.
and found a perfect match
그들이 가지고 있는 DNA와
and brought him to justice
받게 됐습니다.
have started working with
미국 지방 법 집행기관과
in order to capture criminals.
이 기술을 사용하기 위해서죠.
over 20 cold cases with this technique.
해결할 수 있었습니다.
Bernie and his fellow genealogists
동료 계보학자와 같은 사람들이 있죠.
with a self-serving hobby.
아마추어가 아닙니다.
with a deep passion to tell us who we are.
깊은 열정을 가진 시민과학자이며
can hold a key to the future.
쥐고 있다는 것을 압니다.
ABOUT THE SPEAKER
Yaniv Erlich - Computational geneticistYaniv Erlich is fascinated by the connection between DNA and data.
Why you should listen
As a professor and researcher at Columbia University and as CSO of MyHeritage.com, Yaniv Erlich has performed foundational work in genetic privacy and large-scale studies of crowdsourced genomic data. Dubbed a "genome hacker" by the journal Nature, Erlich and his team discovered a privacy loophole enabling reidentification of allegedly anonymous male research participants using just internet searches and their Y chromosome. Later, he discovered that 60 percent of all US individuals with European descent can be identified by forensic genetics using open genetic genealogy databases, which Science magazine called one of the top 10 breakthroughs of 2018.
Erlich is also responsible for the construction of the world's largest family tree, comprising 13 million people, as well as the development of the website DNA.land, which has compiled the genotypes of more than 150,000 donors. He has also worked to discover the genetic bases for several conditions in Israeli families. His team has demonstrated stable DNA data storage, reaching a density of 215 petabyte per gram of DNA. He's been awarded numerous prizes, has published more than 45 papers and authored seven patents.
Yaniv Erlich | Speaker | TED.com