ABOUT THE SPEAKER
Peter Donnelly - Mathematician; statistician
Peter Donnelly is an expert in probability theory who applies statistical methods to genetic data -- spurring advances in disease treatment and insight on our evolution. He's also an expert on DNA analysis, and an advocate for sensible statistical analysis in the courtroom.

Why you should listen

Peter Donnelly applies statistical methods to real-world problems, ranging from DNA analysis (for criminal trials), to the treatment of genetic disorders. A mathematician who collaborates with biologists, he specializes in applying probability and statistics to the field of genetics, in hopes of shedding light on evolutionary history and the structure of the human genome.

The Australian-born, Oxford-based mathematician is best known for his work in molecular evolution (tracing the roots of human existence to their earliest origins using the mutation rates of mitochondrial DNA). He studies genetic distributions in living populations to trace human evolutionary history -- an approach that informs research in evolutionary biology, as well as medical treatment for genetic disorders. Donnelly is a key player in the International HapMap Project, an ongoing international effort to model human genetic variation and pinpoint the genes responsible for specific aspects of health and disease; its implications for disease prevention and treatment are vast.

He's also a leading expert on DNA analysis and the use of forensic science in criminal trials; he's an outspoken advocate for bringing sensible statistical analysis into the courtroom. Donnelly leads Oxford University's Mathematical Genetics Group, which conducts research in genetic modeling, human evolutionary history, and forensic DNA profiling. He is also serves as Director of the Wellcome Trust Centre for Human Genetics at Oxford University, which explores the genetic relationships to disease and illness. 

More profile about the speaker
Peter Donnelly | Speaker | TED.com
TEDGlobal 2005

Peter Donnelly: How juries are fooled by statistics

Питер Доннелли рассказывает как статистика одурачивает присяжных.

Filmed:
1,279,860 views

Оксфордский математик Питер Доннелли демонстритует распространенные ошибки, которые люди совершают, интерпретируя статистику — и ужасающее влияние эти ошибки могут иметь на результаты уголовных процессов.
- Mathematician; statistician
Peter Donnelly is an expert in probability theory who applies statistical methods to genetic data -- spurring advances in disease treatment and insight on our evolution. He's also an expert on DNA analysis, and an advocate for sensible statistical analysis in the courtroom. Full bio

Double-click the English transcript below to play the video.

00:25
As other speakersдинамики have said, it's a ratherскорее dauntingпугающим experienceопыт --
0
0
2000
Как уже говорили другие докладчики, это довольно трудная задача —
00:27
a particularlyв частности dauntingпугающим experienceопыт -- to be speakingГоворящий in frontфронт of this audienceаудитория.
1
2000
3000
особенно трудная задача — выступать перед этой аудиторией.
00:30
But unlikeВ отличие от the other speakersдинамики, I'm not going to tell you about
2
5000
3000
Но в отличие от других докладчиков, я не собираюсь рассказывать вам
00:33
the mysteriesтайны of the universeвселенная, or the wondersчудеса of evolutionэволюция,
3
8000
2000
о тайнах вселенной, или о чудесах эволюции,
00:35
or the really cleverумная, innovativeинновационный waysпути people are attackingнападающий
4
10000
4000
или о очень изобретательных, новых способах борьбы
00:39
the majorглавный inequalitiesнеравенства in our worldМир.
5
14000
2000
со значительным неравенством в нашем мире.
00:41
Or even the challengesпроблемы of nation-statesнациональные государства in the modernсовременное globalГлобальный economyэкономика.
6
16000
5000
И даже не о трудностях национальных государств в современной глобальной экономике.
00:46
My briefкраткое, as you've just heardуслышанным, is to tell you about statisticsстатистика --
7
21000
4000
Моя задача, как вы только что слышали, рассказать вам о статистике —
00:50
and, to be more preciseточный, to tell you some excitingзахватывающе things about statisticsстатистика.
8
25000
3000
а точнее, рассказать вам что-то захватывающee о статистике.
00:53
And that's --
9
28000
1000
А это
00:54
(LaughterСмех)
10
29000
1000
(Смех)
00:55
-- that's ratherскорее more challengingиспытывающий
11
30000
2000
— а это гораздо более сложная задача
00:57
than all the speakersдинамики before me and all the onesте, comingприход after me.
12
32000
2000
и чем у всех докладчиков до меня, и чем у всех после.
00:59
(LaughterСмех)
13
34000
1000
(Смех)
01:01
One of my seniorстаршая colleaguesколлеги told me, when I was a youngsterюнец in this professionпрофессия,
14
36000
5000
Один из моих старших коллег сказал мне, когда я был еще юнцом в этой профессии,
01:06
ratherскорее proudlyгордо, that statisticiansстатистикам were people who likedпонравилось figuresцифры
15
41000
4000
с долей гордости, что статистики это люди которым нравятся числа,
01:10
but didn't have the personalityличность skillsнавыки to becomeстали accountantsбухгалтеров.
16
45000
3000
но у которых не достаточно общительности, чтобы стать бухгалтерами.
01:13
(LaughterСмех)
17
48000
2000
(Смех)
01:15
And there's anotherдругой in-jokeв шутку amongсреди statisticiansстатистикам, and that's,
18
50000
3000
Еще одна профессиональная шутка среди статистиков:
01:18
"How do you tell the introvertedинтровертированный statisticianстатистик from the extrovertedэкстравертированный statisticianстатистик?"
19
53000
3000
«Как отличить статистика‐интроверта от статистика-экстраверта?»
01:21
To whichкоторый the answerответ is,
20
56000
2000
Ответ:
01:23
"The extrovertedэкстравертированный statistician'sстатистиков the one who looksвыглядит at the other person'sИндивидуальность человека shoesобувь."
21
58000
5000
«Статистик-экстраверт это тот кто смотрит на ботинки собеседника.»
01:28
(LaughterСмех)
22
63000
3000
(Смех)
01:31
But I want to tell you something usefulполезным -- and here it is, so concentrateконцентрат now.
23
66000
5000
Но я хочу рассказать вам кое‐что полезное — и сейчас начну, так что сконцентрируйтесь.
01:36
This eveningвечер, there's a receptionприем in the University'sуниверситета Museumмузей of Naturalнатуральный Historyистория.
24
71000
3000
Сегодня вечером будет прием в Музее естественной истории при университете.
01:39
And it's a wonderfulзамечательно settingустановка, as I hopeнадежда you'llВы будете find,
25
74000
2000
Это замечательное место, я надеюсь вы в этом убедитесь,
01:41
and a great iconзначок to the bestЛучший of the Victorianвикторианский traditionтрадиция.
26
76000
5000
и замечательный символ лучшего в Викторианской традиции.
01:46
It's very unlikelyвряд ли -- in this specialособый settingустановка, and this collectionколлекция of people --
27
81000
5000
Маловероятно — в этих особых обстоятельствах, и в этой группе людей —
01:51
but you mightмог бы just find yourselfсам talkingговорящий to someoneкто то you'dвы бы ratherскорее wishжелание that you weren'tне было.
28
86000
3000
но может оказаться что вы разговариваете с кем‐то, с кем вам бы не хотелось разговаривать.
01:54
So here'sвот what you do.
29
89000
2000
Вот что вам следует сделать.
01:56
When they say to you, "What do you do?" -- you say, "I'm a statisticianстатистик."
30
91000
4000
Когда собеседник спросит вас: «Кто вы по профессии?» — скажите «Я статистик.»
02:00
(LaughterСмех)
31
95000
1000
(Смех)
02:01
Well, exceptКроме they'veони имеют been pre-warnedзаранее предупредил now, and they'llони будут know you're makingизготовление it up.
32
96000
4000
Правда теперь он был предупрежден, так что он будет знать что вы врете.
02:05
And then one of two things will happenслучаться.
33
100000
2000
И тогда произойдет одно из двух.
02:07
They'llОни будут eitherили discoverобнаружить theirих long-lostдавно потерянный cousinдвоюродная сестра in the other cornerугол of the roomкомната
34
102000
2000
Либо он обнаружит давно потерянную двоюродную сестру в углу комнаты
02:09
and runбег over and talk to them.
35
104000
2000
и убежит поговорить с ней.
02:11
Or they'llони будут suddenlyвдруг, внезапно becomeстали parchedпересохший and/or hungryголодный -- and oftenдовольно часто bothи то и другое --
36
106000
3000
Либо он неожиданно почувствует жажду или голод — а часто и то и другое —
02:14
and sprintспринт off for a drinkнапиток and some foodпитание.
37
109000
2000
и помчится за едой и напитками.
02:16
And you'llВы будете be left in peaceмир to talk to the personчеловек you really want to talk to.
38
111000
4000
И оставит вас в покое чтобы вы смогли поговорить с кем хотели.
02:20
It's one of the challengesпроблемы in our professionпрофессия to try and explainобъяснять what we do.
39
115000
3000
Одна из сложностей нашей профессии в том, чтобы объяснить чем мы занимаемся.
02:23
We're not topВверх on people'sнародный listsсписки for dinnerужин partyвечеринка guestsгости and conversationsразговоры and so on.
40
118000
5000
Мы не возглавляем списки приглашаемых на званые обеды, собеседников и так далее.
02:28
And it's something I've never really foundнайденный a good way of doing.
41
123000
2000
Я так и не придумал как это делать.
02:30
But my wifeжена -- who was then my girlfriendПодруга --
42
125000
3000
Но моя жена — тогда она еще была моей девушкой —
02:33
managedудалось it much better than I've ever been ableв состоянии to.
43
128000
3000
преуспела в этом намного лучше чем я когда‐либо мог.
02:36
ManyМногие yearsлет agoтому назад, when we first startedначал going out, she was workingза работой for the BBCBBC in BritainБритания,
44
131000
3000
Много лет назад, когда мы только начали встречаться, она работала на Би‐би‐си в Великобритании,
02:39
and I was, at that stageсцена, workingза работой in AmericaАмерика.
45
134000
2000
я в тот момент работал в Америке.
02:41
I was comingприход back to visitпосещение her.
46
136000
2000
Я собирался навестить ее.
02:43
She told this to one of her colleaguesколлеги, who said, "Well, what does your boyfriendдружок do?"
47
138000
6000
Она рассказала об этом коллеге, и та спросила, «А чем занимается твой парень?»
02:49
SarahСара thought quiteдовольно hardжесткий about the things I'd explainedобъяснил --
48
144000
2000
Сара поразмышляла над тем что я ей объяснял —
02:51
and she concentratedконцентрированный, in those daysдней, on listeningпрослушивание.
49
146000
4000
тогда она в основном слушала.
02:55
(LaughterСмех)
50
150000
2000
(Смех)
02:58
Don't tell her I said that.
51
153000
2000
Не говорите ей что я это сказал.
03:00
And she was thinkingмышление about the work I did developingразвивающийся mathematicalматематическая modelsмодели
52
155000
4000
Она подумала о моих занятиях по разработке математических моделей
03:04
for understandingпонимание evolutionэволюция and modernсовременное geneticsгенетика.
53
159000
3000
для изучения эволюции и современной генетики.
03:07
So when her colleagueколлега said, "What does he do?"
54
162000
3000
И когда ее коллега спросила «Чем он занимается?»
03:10
She pausedприостановлена and said, "He modelsмодели things."
55
165000
4000
она, после паузы, сказала «Он работает с моделями.»
03:14
(LaughterСмех)
56
169000
1000
(Смех)
03:15
Well, her colleagueколлега suddenlyвдруг, внезапно got much more interestedзаинтересованный than I had any right to expectожидать
57
170000
4000
Тогда ее коллега заинтересовалось сильнее чем я мог бы ожидать,
03:19
and wentотправился on and said, "What does he modelмодель?"
58
174000
3000
и спросила, «С какими моделями?»
03:22
Well, SarahСара thought a little bitнемного more about my work and said, "Genesгены."
59
177000
3000
Сара подимала еще немножко о моей работе и сказала, «Генетическими.»
03:25
(LaughterСмех)
60
180000
4000
(Смех)
03:29
"He modelsмодели genesгены."
61
184000
2000
«Он занимается генетическими моделями.»
03:31
That is my first love, and that's what I'll tell you a little bitнемного about.
62
186000
4000
Это моя первая любовь, и я вам немножко об этом расскажу.
03:35
What I want to do more generallyв общем is to get you thinkingмышление about
63
190000
4000
В целом, я хочу заставить вас задуматься
03:39
the placeместо of uncertaintyнеопределенность and randomnessхаотичность and chanceшанс in our worldМир,
64
194000
3000
о месте неопределенности, случайности и шанса в нашем мире,
03:42
and how we reactреагировать to that, and how well we do or don't think about it.
65
197000
5000
как этому относиться, и о том насколько правильно или неправильно мы об этом думаем.
03:47
So you've had a prettyСимпатичная easyлегко time up tillдо now --
66
202000
2000
Так что до сих пор все было довольно просто —
03:49
a fewмало laughsсмеется, and all that kindсвоего рода of thing -- in the talksпереговоры to dateДата.
67
204000
2000
несколько шуток, в таком духе — в предыдущих докладах.
03:51
You've got to think, and I'm going to askпросить you some questionsвопросов.
68
206000
3000
Вам прийдется думать, и я буду задавать вам вопросы.
03:54
So here'sвот the sceneместо действия for the first questionвопрос I'm going to askпросить you.
69
209000
2000
Вот ситуация про которую будет первый вопрос.
03:56
Can you imagineпредставить tossingбросание a coinмонета successivelyпоследовательно?
70
211000
3000
Представьте себе многократное подбрасывание монетки.
03:59
And for some reasonпричина -- whichкоторый shallдолжен remainоставаться ratherскорее vagueрасплывчатый --
71
214000
3000
И по какой‐то причине — которая останется невыясненой —
04:02
we're interestedзаинтересованный in a particularконкретный patternшаблон.
72
217000
2000
нас интересует определенная последовательность.
04:04
Here'sВот one -- a headглава, followedс последующим by a tailхвост, followedс последующим by a tailхвост.
73
219000
3000
Например такая - решка, затем орел, затем снова орел.
04:07
So supposeпредполагать we tossбросать a coinмонета repeatedlyнеоднократно.
74
222000
3000
Итак представьте что мы подбрасываем монетку многократно.
04:10
Then the patternшаблон, head-tail-tailголова-хвост-хвост, that we'veмы в suddenlyвдруг, внезапно becomeстали fixatedфиксироваться with happensпроисходит here.
75
225000
5000
Тогда последовательность решка‐орел‐орел, на которой мы внезапно сконцентрировались, встречается здесь.
04:15
And you can countподсчитывать: one, two, threeтри, four4, five5, sixшесть, sevenсемь, eight8, nine9, 10 --
76
230000
4000
И вы можете посчитать: раз, два, три, четыре, пять, шесть, семь, восемь, девять, десять —
04:19
it happensпроисходит after the 10thго tossбросать.
77
234000
2000
она появляется после десятого броска.
04:21
So you mightмог бы think there are more interestingинтересно things to do, but humorюмор me for the momentмомент.
78
236000
3000
Вам может показаться, что есть занятия и поинтересней, но уважьте меня на время.
04:24
ImagineПредставить this halfполовина of the audienceаудитория eachкаждый get out coinsмонеты, and they tossбросать them
79
239000
4000
Представьте, что эта половина аудитории достала монетки и начала их бросать
04:28
untilдо they first see the patternшаблон head-tail-tailголова-хвост-хвост.
80
243000
3000
до тех пор как они впервые не увидят последовательность решка‐орел‐орел.
04:31
The first time they do it, maybe it happensпроисходит after the 10thго tossбросать, as here.
81
246000
2000
Когда они сделают это в первый раз, может быть это случится после десятого броска, как здесь.
04:33
The secondвторой time, maybe it's after the fourthчетвертый tossбросать.
82
248000
2000
Во второй раз, может быть после четвертого броска.
04:35
The nextследующий time, after the 15thго tossбросать.
83
250000
2000
В следующий раз, после пятнадцатого.
04:37
So you do that lots and lots of timesраз, and you averageв среднем those numbersчисел.
84
252000
3000
Они сделают это много раз, и посчитают среднее этих чисел.
04:40
That's what I want this sideбоковая сторона to think about.
85
255000
3000
Эта половина пусть думает об этом.
04:43
The other halfполовина of the audienceаудитория doesn't like head-tail-tailголова-хвост-хвост --
86
258000
2000
Другой половине аудитории не нравится решка‐орел‐орел —
04:45
they think, for deepглубоко culturalкультурный reasonsпричины, that's boringскучный --
87
260000
3000
они считают, по глубоким культурным причинам, что это скучно —
04:48
and they're much more interestedзаинтересованный in a differentдругой patternшаблон -- head-tail-headголова-хвост-голова.
88
263000
3000
и их гораздо больше интересует другая последовательность — решка‐орел‐решка.
04:51
So, on this sideбоковая сторона, you get out your coinsмонеты, and you tossбросать and tossбросать and tossбросать.
89
266000
3000
Так что, на этой стороне, вы достаете свои монетки, и начинаете подбрасывать.
04:54
And you countподсчитывать the numberномер of timesраз untilдо the patternшаблон head-tail-headголова-хвост-голова appearsпоявляется
90
269000
3000
И считаете количество бросков до появления последовательности решка‐орел‐решка
04:57
and you averageв среднем them. OK?
91
272000
3000
и усредняете. ОК?
05:00
So on this sideбоковая сторона, you've got a numberномер --
92
275000
2000
Итак, эта сторона получила число —
05:02
you've doneсделанный it lots of timesраз, so you get it accuratelyточно --
93
277000
2000
и вы сделали это много раз, так что подсчет довольно точный —
05:04
whichкоторый is the averageв среднем numberномер of tossesподбрасывает untilдо head-tail-tailголова-хвост-хвост.
94
279000
3000
среднее число подбрасываний до решка‐орел‐орел.
05:07
On this sideбоковая сторона, you've got a numberномер -- the averageв среднем numberномер of tossesподбрасывает untilдо head-tail-headголова-хвост-голова.
95
282000
4000
На этой стороне, вы получили число среднее число подбрасываний до решка‐орел‐решка.
05:11
So here'sвот a deepглубоко mathematicalматематическая factфакт --
96
286000
2000
Есть глубокий математический факт —
05:13
if you've got two numbersчисел, one of threeтри things mustдолжен be trueправда.
97
288000
3000
если у вас есть два числа, то верно одно из трех.
05:16
EitherИли they're the sameодна и та же, or this one'sодин это biggerбольше than this one,
98
291000
3000
Либо они одинаковы, либо это больше, чем это,
05:19
or this one'sодин это biggerбольше than that one.
99
294000
1000
либо это больше, чем то.
05:20
So what's going on here?
100
295000
3000
А что получится здесь?
05:23
So you've all got to think about this, and you've all got to voteголос --
101
298000
2000
Подумайте об этом, и проголосуйте —
05:25
and we're not movingперемещение on.
102
300000
1000
мы дальше не пойдем.
05:26
And I don't want to endконец up in the two-minuteдвухминутный silenceтишина
103
301000
2000
Я не хочу получить две минуты молчания
05:28
to give you more time to think about it, untilдо everyone'sвсе это expressedвыраженный a viewПосмотреть. OK.
104
303000
4000
чтобы вы могли подумать об этом, пока каждый не выразил свое мнение. ОК.
05:32
So what you want to do is compareсравнить the averageв среднем numberномер of tossesподбрасывает untilдо we first see
105
307000
4000
Вам нужно сравнить среднее количество бросков до первого появления
05:36
head-tail-headголова-хвост-голова with the averageв среднем numberномер of tossesподбрасывает untilдо we first see head-tail-tailголова-хвост-хвост.
106
311000
4000
решка‐орел‐решка со средним количеством бросков до первого появления решка‐орел‐орел.
05:41
Who thinksдумает that A is trueправда --
107
316000
2000
Кто считает что верен ответ А —
05:43
that, on averageв среднем, it'llэто будет take longerдольше to see head-tail-headголова-хвост-голова than head-tail-tailголова-хвост-хвост?
108
318000
4000
что, в среднем, до решка‐орел‐решка ждать дольше чем до решка‐орел‐орел?
05:47
Who thinksдумает that B is trueправда -- that on averageв среднем, they're the sameодна и та же?
109
322000
3000
Кто считает что правильный ответ B — что, в среднем, они одинаковы?
05:51
Who thinksдумает that C is trueправда -- that, on averageв среднем, it'llэто будет take lessМеньше time
110
326000
2000
Кто считает что ответ C — что, в среднем, меньше ждать
05:53
to see head-tail-headголова-хвост-голова than head-tail-tailголова-хвост-хвост?
111
328000
3000
до решка‐орел‐решка чем до решка‐орел‐орел?
05:57
OK, who hasn'tне имеет votedпроголосовавший yetвсе же? Because that's really naughtyнепослушный -- I said you had to.
112
332000
3000
ОК, кто еще не проголосовал? Какие непослушные — я сказал что все должны.
06:00
(LaughterСмех)
113
335000
1000
(Смех)
06:02
OK. So mostбольшинство people think B is trueправда.
114
337000
3000
ОК. Большинство считает, что верен вариант B.
06:05
And you mightмог бы be relievedоблегчение to know even ratherскорее distinguishedвыдающийся mathematiciansматематики think that.
115
340000
3000
И вас может быть утешит что даже достаточно выдающиеся математики так считают.
06:08
It's not. A is trueправда here.
116
343000
4000
Но это не верно. Правильный ответ A.
06:12
It takes longerдольше, on averageв среднем.
117
347000
2000
Это занимает дольше, в среднем.
06:14
In factфакт, the averageв среднем numberномер of tossesподбрасывает tillдо head-tail-headголова-хвост-голова is 10
118
349000
2000
На самом деле, среднее количество бросков до решка‐орел‐орел 10,
06:16
and the averageв среднем numberномер of tossesподбрасывает untilдо head-tail-tailголова-хвост-хвост is eight8.
119
351000
5000
а среднее количество бросков до решка‐орел‐решка 8.
06:21
How could that be?
120
356000
2000
Как так может быть?
06:24
Anything differentдругой about the two patternsузоры?
121
359000
3000
Есть какая-то разница между двумя последовательностями?
06:30
There is. Head-tail-headГолова-хвост-голова overlapsперекрывается itselfсам.
122
365000
5000
Есть. Решка‐орел‐решка пересекается сама с собой.
06:35
If you wentотправился head-tail-head-tail-headголова-хвост-голова-хвост-голова, you can cunninglyхитро get two occurrencesвхождений
123
370000
4000
Если у вас появится решка‐орел‐решка‐орел‐решка, вы хитрым образом получили два появления
06:39
of the patternшаблон in only five5 tossesподбрасывает.
124
374000
3000
последовательности за пять бросков.
06:42
You can't do that with head-tail-tailголова-хвост-хвост.
125
377000
2000
С решка‐орел‐орел так не сделаешь.
06:44
That turnsвитки out to be importantважный.
126
379000
2000
Оказывается, что это важно.
06:46
There are two waysпути of thinkingмышление about this.
127
381000
2000
Есть два способа это понять.
06:48
I'll give you one of them.
128
383000
2000
Я расскажу вам один из них.
06:50
So imagineпредставить -- let's supposeпредполагать we're doing it.
129
385000
2000
Итак представим что мы занимаемся этим.
06:52
On this sideбоковая сторона -- rememberзапомнить, you're excitedв восторге about head-tail-tailголова-хвост-хвост;
130
387000
2000
На этой стороне — помните, нас интересует решка‐орел‐орел,
06:54
you're excitedв восторге about head-tail-headголова-хвост-голова.
131
389000
2000
вас интересует решка‐орел‐решка.
06:56
We startНачало tossingбросание a coinмонета, and we get a headглава --
132
391000
3000
Мы начинаем бросать монетку, и получаем решку —
06:59
and you startНачало sittingсидящий on the edgeкрай of your seatсиденье
133
394000
1000
и вот вы уже сидите на краю сиденья
07:00
because something great and wonderfulзамечательно, or awesomeздорово, mightмог бы be about to happenслучаться.
134
395000
5000
потому что что-то замечательное и великолепное, потрясающее, может вот-вот случиться.
07:05
The nextследующий tossбросать is a tailхвост -- you get really excitedв восторге.
135
400000
2000
При следующем броске выпадает орел — и вы очень взволнованы.
07:07
The champagne'sШампань on iceлед just nextследующий to you; you've got the glassesочки chilledохлажденный to celebrateпраздновать.
136
402000
4000
Шампанское поставлено на лед, стаканы охлаждены, все готово к празднованию.
07:11
You're waitingожидание with batedзатаив breathдыхание for the finalокончательный tossбросать.
137
406000
2000
Вы затаив дыхание ждете последнего броска .
07:13
And if it comesвыходит down a headглава, that's great.
138
408000
2000
И если выпадет решка, отлично.
07:15
You're doneсделанный, and you celebrateпраздновать.
139
410000
2000
Процесс окончен, пора праздновать.
07:17
If it's a tailхвост -- well, ratherскорее disappointedlyогорченно, you put the glassesочки away
140
412000
2000
Если орел — вы разочаровано убираете бокалы
07:19
and put the champagneшампанское back.
141
414000
2000
и возвращаете на место шампанское.
07:21
And you keep tossingбросание, to wait for the nextследующий headглава, to get excitedв восторге.
142
416000
3000
И продолжаете бросать, ожидая следующей решки чтобы снова обрадоваться.
07:25
On this sideбоковая сторона, there's a differentдругой experienceопыт.
143
420000
2000
У этой стороны дело происходит по-другому.
07:27
It's the sameодна и та же for the first two partsчасти of the sequenceпоследовательность.
144
422000
3000
Все то же самое в первые два подбрасывания.
07:30
You're a little bitнемного excitedв восторге with the first headглава --
145
425000
2000
Вы немножко взволнованы после первой решки —
07:32
you get ratherскорее more excitedв восторге with the nextследующий tailхвост.
146
427000
2000
и значительно более взволнованы после последующего орла.
07:34
Then you tossбросать the coinмонета.
147
429000
2000
Затем вы подбрасываете монетку.
07:36
If it's a tailхвост, you crackтрещина openоткрытый the champagneшампанское.
148
431000
3000
Если орел, вы открываете шампанское.
07:39
If it's a headглава you're disappointedразочарованный,
149
434000
2000
Если решка, вы немного разочарованы,
07:41
but you're still a thirdв третьих of the way to your patternшаблон again.
150
436000
3000
но вас уже опять есть треть вашей последовательности.
07:44
And that's an informalнеофициальный way of presentingпредставление it -- that's why there's a differenceразница.
151
439000
4000
Неформально говоря, именно в этом разница.
07:48
AnotherДругая way of thinkingмышление about it --
152
443000
2000
По-другому об этом можно подумать так —
07:50
if we tossedбросил a coinмонета eight8 millionмиллиона timesраз,
153
445000
2000
если мы подбросим монетку восемь миллионов раз,
07:52
then we'dмы б expectожидать a millionмиллиона head-tail-headsголова-хвост-головка
154
447000
2000
можно ожидать миллион последовательностей решка‐орел‐решка
07:54
and a millionмиллиона head-tail-tailsголова-хвост-хвост -- but the head-tail-headsголова-хвост-головка could occurпроисходить in clumpsсгустки.
155
449000
7000
и миллион последовательностей решка‐орел‐орел — но решка‐орел‐решки могут выпадать кучками.
08:01
So if you want to put a millionмиллиона things down amongstсреди eight8 millionмиллиона positionsпозиции
156
456000
2000
Если вы разбросаете миллион объектов среди восьми миллионов позиций
08:03
and you can have some of them overlappingперекрытие, the clumpsсгустки will be furtherв дальнейшем apartКроме.
157
458000
5000
и некоторые из них могут пересекаться, то кучки будут дальше друг от друга.
08:08
It's anotherдругой way of gettingполучение the intuitionинтуиция.
158
463000
2000
Вот так еще можно интуитивно это представить.
08:10
What's the pointточка I want to make?
159
465000
2000
Что я хочу этим показать?
08:12
It's a very, very simpleпросто exampleпример, an easilyбез труда statedзаявил questionвопрос in probabilityвероятность,
160
467000
4000
Это очень очень простой пример, вопрос по теории вероятностей, который легко сформулировать,
08:16
whichкоторый everyкаждый -- you're in good companyКомпания -- everybodyвсе getsполучает wrongнеправильно.
161
471000
3000
и отвечая на который все — вы в хорошей компании — все ошибаются.
08:19
This is my little diversionотвлечение into my realреальный passionстрасть, whichкоторый is geneticsгенетика.
162
474000
4000
Это мое небольшое отступление в предмет моей страсти, в генетику.
08:23
There's a connectionсоединение betweenмежду head-tail-headsголова-хвост-головка and head-tail-tailsголова-хвост-хвост in geneticsгенетика,
163
478000
3000
Есть связь между решка‐орел‐решка и решка‐орел‐орел и генетикой,
08:26
and it's the followingследующий.
164
481000
3000
и она в следующем.
08:29
When you tossбросать a coinмонета, you get a sequenceпоследовательность of headsруководители and tailsфрак.
165
484000
3000
Когда вы бросаете монетку, вы получаете последовательность орлов и решек.
08:32
When you look at DNAДНК, there's a sequenceпоследовательность of not two things -- headsруководители and tailsфрак --
166
487000
3000
Когда вы смотрите на ДНК, видите последовательности не двух вещей — орлов и решек —
08:35
but four4 lettersбуквы -- As, GsGs, CsCs and TsЦ..
167
490000
3000
а четырех букв — A, G, C и Т.
08:38
And there are little chemicalхимическая scissorsножницы, calledназывается restrictionограничение enzymesферменты
168
493000
3000
И есть такие химические ножницы, они называются эндонуклеазы рестрикции,
08:41
whichкоторый cutпорез DNAДНК wheneverвсякий раз, когда they see particularконкретный patternsузоры.
169
496000
2000
которые разрезают ДНК когда видят определенные последовательности.
08:43
And they're an enormouslyчрезвычайно usefulполезным toolинструмент in modernсовременное molecularмолекулярная biologyбиология.
170
498000
4000
Это невероятно полезный инструмент в современной молекулярной биологии.
08:48
And insteadвместо of askingпросить the questionвопрос, "How long untilдо I see a head-tail-headголова-хвост-голова?" --
171
503000
3000
И вместо того чтобы спросить "Сколько пройдет пока я увижу решка-орел-решка?"
08:51
you can askпросить, "How bigбольшой will the chunksломти be when I use a restrictionограничение enzymeфермент
172
506000
3000
можно спросить "Насколько большие кусочки получатся когда я использую эндонуклеазу рестрикции
08:54
whichкоторый cutsпорезы wheneverвсякий раз, когда it seesвидит G-A-A-GГааг, for exampleпример?
173
509000
4000
которая разрезает когда видит последовательность G-A-A-G, например?
08:58
How long will those chunksломти be?"
174
513000
2000
Какой длинны будут эти кусочки?"
09:00
That's a ratherскорее trivialтривиальный connectionсоединение betweenмежду probabilityвероятность and geneticsгенетика.
175
515000
5000
Это довольно тривиальная связь между теорией вероятности и генетикой.
09:05
There's a much deeperГлубже connectionсоединение, whichкоторый I don't have time to go into
176
520000
3000
Есть более глубокая связь, говорить о которой у меня нет времени,
09:08
and that is that modernсовременное geneticsгенетика is a really excitingзахватывающе areaплощадь of scienceнаука.
177
523000
3000
и которая состоит в том что современная генетика это захватывающая научная область,
09:11
And we'llЧто ж hearзаслушивать some talksпереговоры laterпозже in the conferenceконференция specificallyконкретно about that.
178
526000
4000
и мы услышим несколько докладов как раз об этом позже на этой конференции,
09:15
But it turnsвитки out that unlockingразмыкание the secretsсекреты in the informationИнформация generatedгенерироваться by modernсовременное
179
530000
4000
но оказывается, что чтобы раскрыть секреты информации получаемой современными
09:19
experimentalэкспериментальный technologiesтехнологии, a keyключ partчасть of that has to do with fairlyдовольно sophisticatedутонченный --
180
534000
5000
экспериментальными технологиями, ключевой частью этого процесса являются достаточно сложные —
09:24
you'llВы будете be relievedоблегчение to know that I do something usefulполезным in my day jobработа,
181
539000
3000
будьте покойны, я на работе занимаюсь таки чем-то полезным —
09:27
ratherскорее more sophisticatedутонченный than the head-tail-headголова-хвост-голова storyистория --
182
542000
2000
значительно более сложные чем история про решка-орел-решку —
09:29
but quiteдовольно sophisticatedутонченный computerкомпьютер modelingsmodelings and mathematicalматематическая modelingsmodelings
183
544000
4000
сложные компьютерные модели и математические модели
09:33
and modernсовременное statisticalстатистический techniquesметоды.
184
548000
2000
и современные статистические приемы.
09:35
And I will give you two little snippetsобрывки -- two examplesПримеры --
185
550000
3000
Я расскажу два маленьких отрывка — два примера —
09:38
of projectsпроектов we're involvedучаствует in in my groupгруппа in OxfordОксфорд,
186
553000
3000
проектов в которые вовлечена моя группа в Оксфорде,
09:41
bothи то и другое of whichкоторый I think are ratherскорее excitingзахватывающе.
187
556000
2000
которые оба, по-моему, довольно интересны.
09:43
You know about the HumanЧеловек Genomeгеном Projectпроект.
188
558000
2000
Вы слышали о проекте «Геном человека».
09:45
That was a projectпроект whichкоторый aimedнацеленный to readчитать one copyкопия of the humanчеловек genomeгеном.
189
560000
4000
Это проект целью которого было прочесть одну копию генома человека.
09:51
The naturalнатуральный thing to do after you've doneсделанный that --
190
566000
2000
После того как вы это сделали, естественно перейти к —
09:53
and that's what this projectпроект, the InternationalМеждународный HapMapHapMap Projectпроект,
191
568000
2000
и в этом идея этого проекта, проекта «HapMap»,
09:55
whichкоторый is a collaborationсотрудничество betweenмежду labsлаборатории in five5 or sixшесть differentдругой countriesстраны.
192
570000
5000
совместной работы лабораторий в пяти или шести различных странах.
10:00
Think of the HumanЧеловек Genomeгеном Projectпроект as learningобучение what we'veмы в got in commonобщий,
193
575000
4000
Считайте что суть проекта «Геном человека» узнать, что нас объединяет,
10:04
and the HapMapHapMap Projectпроект is tryingпытаясь to understandПонимаю
194
579000
2000
а проект «HapMap» попытка понять
10:06
where there are differencesразличия betweenмежду differentдругой people.
195
581000
2000
в чем различия между разными людьми.
10:08
Why do we careзабота about that?
196
583000
2000
Почему нас это интересует?
10:10
Well, there are lots of reasonsпричины.
197
585000
2000
Ну, на это много причин.
10:12
The mostбольшинство pressingпрессование one is that we want to understandПонимаю how some differencesразличия
198
587000
4000
Самая насущная из которых в том чтобы понять как некоторые различия
10:16
make some people susceptibleвосприимчивый to one diseaseболезнь -- type-тип-2 diabetesдиабет, for exampleпример --
199
591000
4000
делают одних людей более подверженными одному заболеванию — диабету 2-го типа, например —
10:20
and other differencesразличия make people more susceptibleвосприимчивый to heartсердце diseaseболезнь,
200
595000
5000
а другие различия увеличивают риск сердечных заболеваний,
10:25
or strokeИнсульт, or autismаутизм and so on.
201
600000
2000
или инсульта, или аутизма и так далее.
10:27
That's one bigбольшой projectпроект.
202
602000
2000
Это один большой проект.
10:29
There's a secondвторой bigбольшой projectпроект,
203
604000
2000
Есть еще один большой проект,
10:31
recentlyв последнее время fundedфундированный by the WellcomeWellcome TrustДоверять in this countryстрана,
204
606000
2000
недавно профинансированный в Великобритании трастом Вэлкома,
10:33
involvingс привлечением very largeбольшой studiesисследования --
205
608000
2000
связанный с очень большими исследованиями —
10:35
thousandsтысячи of individualsиндивидуумы, with eachкаждый of eight8 differentдругой diseasesболезни,
206
610000
3000
тысячи человек, с каждым из восьми различных заболеваний,
10:38
commonобщий diseasesболезни like type-тип-1 and type-тип-2 diabetesдиабет, and coronaryкоронарный heartсердце diseaseболезнь,
207
613000
4000
распространенных заболеваний вроде диабета 1-го и 2-го типа, коронарной болезни сердца,
10:42
bipolarбиполярный diseaseболезнь and so on -- to try and understandПонимаю the geneticsгенетика.
208
617000
4000
биполярного расстройства и так далее — чтобы попытаться понять генетику.
10:46
To try and understandПонимаю what it is about geneticгенетический differencesразличия that causesпричины the diseasesболезни.
209
621000
3000
Попытаться понять что в генетических различиях становится причиной этих болезней.
10:49
Why do we want to do that?
210
624000
2000
Почему мы хотим это сделать?
10:51
Because we understandПонимаю very little about mostбольшинство humanчеловек diseasesболезни.
211
626000
3000
Потому что мы очень мало понимаем о большинстве заболеваний человека.
10:54
We don't know what causesпричины them.
212
629000
2000
Мы не знаем их причин.
10:56
And if we can get in at the bottomдно and understandПонимаю the geneticsгенетика,
213
631000
2000
И если мы можем начать с оснований и понять генетику,
10:58
we'llЧто ж have a windowокно on the way the diseaseболезнь worksработает,
214
633000
3000
у нас будет окно в механизм заболевания.
11:01
and a wholeвсе newновый way about thinkingмышление about diseaseболезнь therapiesтерапии
215
636000
2000
И совершенно новый взгляд на лечение,
11:03
and preventativeпревентивный treatmentлечение and so on.
216
638000
3000
превентивные процедуры и тому подобное.
11:06
So that's, as I said, the little diversionотвлечение on my mainглавный love.
217
641000
3000
Это было, как я и говорил, небольшое отступление о моем основном увлечении.
11:09
Back to some of the more mundaneмирской issuesвопросы of thinkingмышление about uncertaintyнеопределенность.
218
644000
5000
Вернемся к более прозаическим вопросам рассуждения о вероятностях.
11:14
Here'sВот anotherдругой quizвикторина for you --
219
649000
2000
Вот вам еще один проверочный вопрос —
11:16
now supposeпредполагать we'veмы в got a testконтрольная работа for a diseaseболезнь
220
651000
2000
допустим у вас есть тест на заболевание,
11:18
whichкоторый isn't infallibleнепогрешимый, but it's prettyСимпатичная good.
221
653000
2000
не идеальный, но довольно неплохой.
11:20
It getsполучает it right 99 percentпроцент of the time.
222
655000
3000
Он дает верный результат в 99и процентах случаев.
11:23
And I take one of you, or I take someoneкто то off the streetулица,
223
658000
3000
И я выбираю одного из вас, или кого-то с улицы,
11:26
and I testконтрольная работа them for the diseaseболезнь in questionвопрос.
224
661000
2000
и тестирую его на это заболевание.
11:28
Let's supposeпредполагать there's a testконтрольная работа for HIVВИЧ -- the virusвирус that causesпричины AIDSСПИД --
225
663000
4000
Допустим есть тест на ВИЧ — вирус вызывающий СПИД —
11:32
and the testконтрольная работа saysговорит the personчеловек has the diseaseболезнь.
226
667000
3000
и этот тест говорит что у этот человек болен.
11:35
What's the chanceшанс that they do?
227
670000
3000
Какова вероятность что он на самом деле болен?
11:38
The testконтрольная работа getsполучает it right 99 percentпроцент of the time.
228
673000
2000
Тест дает верный результат в 99и процентах случаев.
11:40
So a naturalнатуральный answerответ is 99 percentпроцент.
229
675000
4000
Так что естественно ответить 99 процентов.
11:44
Who likesнравится that answerответ?
230
679000
2000
Кому нравится этот ответ?
11:46
Come on -- everyone'sвсе это got to get involvedучаствует.
231
681000
1000
Давайте-давайте — все должны поучаствовать
11:47
Don't think you don't trustдоверять me anymoreбольше не.
232
682000
2000
Не думайте что вы мне больше не доверяете.
11:49
(LaughterСмех)
233
684000
1000
(Смех)
11:50
Well, you're right to be a bitнемного skepticalскептический, because that's not the answerответ.
234
685000
3000
Что ж, вы не зря скептически настроены, этот ответ не верен.
11:53
That's what you mightмог бы think.
235
688000
2000
Так можно подумать.
11:55
It's not the answerответ, and it's not because it's only partчасть of the storyистория.
236
690000
3000
Этот ответ не верен, и не верен он потому что это только часть истории.
11:58
It actuallyна самом деле dependsзависит on how commonобщий or how rareредкий the diseaseболезнь is.
237
693000
3000
На самом деле ответ зависит от отго насколько распространено или редко это заболевание.
12:01
So let me try and illustrateиллюстрировать that.
238
696000
2000
Давйте я попробую это проиллюстрировать.
12:03
Here'sВот a little caricatureкарикатура of a millionмиллиона individualsиндивидуумы.
239
698000
4000
Вот небольшое карикатурное изображение миллиона людей.
12:07
So let's think about a diseaseболезнь that affectsвлияет --
240
702000
3000
Давайте подумаем о заболевании которое затрагивает —
12:10
it's prettyСимпатичная rareредкий, it affectsвлияет one personчеловек in 10,000.
241
705000
2000
довольно редком, оно затрагивает одного человека из 10000.
12:12
AmongstСреди these millionмиллиона individualsиндивидуумы, mostбольшинство of them are healthyздоровый
242
707000
3000
Среди этих миллиона человек, большинство из них здоровы,
12:15
and some of them will have the diseaseболезнь.
243
710000
2000
но некоторые больны.
12:17
And in factфакт, if this is the prevalenceраспространенность of the diseaseболезнь,
244
712000
3000
И, при такой распространенности заболевания,
12:20
about 100 will have the diseaseболезнь and the restотдых won'tне будет.
245
715000
3000
примерно 100 будут больны, а остальные нет.
12:23
So now supposeпредполагать we testконтрольная работа them all.
246
718000
2000
Допустим мы всех их протестировали.
12:25
What happensпроисходит?
247
720000
2000
Что случится?
12:27
Well, amongstсреди the 100 who do have the diseaseболезнь,
248
722000
2000
Среди 100 больных
12:29
the testконтрольная работа will get it right 99 percentпроцент of the time, and 99 will testконтрольная работа positiveположительный.
249
724000
5000
тест даст верный результат в 99и процентах случаев, и 99 получат положительный результат.
12:34
AmongstСреди all these other people who don't have the diseaseболезнь,
250
729000
2000
Среди остальных, тех кто не болен,
12:36
the testконтрольная работа will get it right 99 percentпроцент of the time.
251
731000
3000
тест даст верный результат в 99и процентах случаев.
12:39
It'llЭто будет only get it wrongнеправильно one percentпроцент of the time.
252
734000
2000
Он ошибется только в одном проценте случаев.
12:41
But there are so manyмногие of them that there'llтам будет be an enormousогромный numberномер of falseложный positivesпозитивы.
253
736000
4000
Но их так много, что будет огромное количество ложноположительныx результатов.
12:45
Put that anotherдругой way --
254
740000
2000
Иначе говоря —
12:47
of all of them who testконтрольная работа positiveположительный -- so here they are, the individualsиндивидуумы involvedучаствует --
255
742000
5000
среди всех у тех у кого тест дал положительный результат — вот они, эти люди —
12:52
lessМеньше than one in 100 actuallyна самом деле have the diseaseболезнь.
256
747000
5000
меньше чем один из ста на самом деле болен.
12:57
So even thoughхоть we think the testконтрольная работа is accurateточный, the importantважный partчасть of the storyистория is
257
752000
4000
Так что даже если мы считаем что тест надежен, важность этой истории в том,
13:01
there's anotherдругой bitнемного of informationИнформация we need.
258
756000
3000
что нам нужна дополнительная информация.
13:04
Here'sВот the keyключ intuitionинтуиция.
259
759000
2000
Вот ключевая интуиция.
13:07
What we have to do, onceодин раз we know the testконтрольная работа is positiveположительный,
260
762000
3000
Узнав, что результат теста положительный, мы должны
13:10
is to weighвзвешивать up the plausibilityправдоподобие, or the likelihoodвероятность, of two competingконкурирующий explanationsобъяснения.
261
765000
6000
взвесить правдоподобие, или вероятность, двух соревнующихся объяснений.
13:16
Eachкаждый of those explanationsобъяснения has a likelyвероятно bitнемного and an unlikelyвряд ли bitнемного.
262
771000
3000
В каждом из этих объяснений есть вероятная часть и есть маловероятная часть.
13:19
One explanationобъяснение is that the personчеловек doesn't have the diseaseболезнь --
263
774000
3000
Одно объяснение в том что человек не болен —
13:22
that's overwhelminglyв подавляющем большинстве случаев likelyвероятно, if you pickвыбирать someoneкто то at randomслучайный --
264
777000
3000
это подавляюще вероятно, если выбрать кого-то случайным образом —
13:25
but the testконтрольная работа getsполучает it wrongнеправильно, whichкоторый is unlikelyвряд ли.
265
780000
3000
но тест ошибся, что маловероятно.
13:29
The other explanationобъяснение is that the personчеловек does have the diseaseболезнь -- that's unlikelyвряд ли --
266
784000
3000
Другое объяснение в том что человек болен — это маловероятно —
13:32
but the testконтрольная работа getsполучает it right, whichкоторый is likelyвероятно.
267
787000
3000
и тест прав, что вероятно.
13:35
And the numberномер we endконец up with --
268
790000
2000
И число которое мы получаем —
13:37
that numberномер whichкоторый is a little bitнемного lessМеньше than one in 100 --
269
792000
3000
чуть меньше чем 1 на 100 —
13:40
is to do with how likelyвероятно one of those explanationsобъяснения is relativeотносительный to the other.
270
795000
6000
связано с тем какое из этих объяснений более вероятно по сравнению с другим.
13:46
Eachкаждый of them takenвзятый togetherвместе is unlikelyвряд ли.
271
801000
2000
Они оба маловероятны.
13:49
Here'sВот a more topicalактуальный exampleпример of exactlyв точку the sameодна и та же thing.
272
804000
3000
Вот более животрепещущий пример ровно того же самого.
13:52
Those of you in BritainБритания will know about what's becomeстали ratherскорее a celebratedзнаменитый caseдело
273
807000
4000
Те из вас кто живет в Британии знают о прославившемся деле
13:56
of a womanженщина calledназывается SallyСалли ClarkКларк, who had two babiesдети who diedумер suddenlyвдруг, внезапно.
274
811000
5000
женщины по имени Салли Кларк, у которой было двое детей, которые неожиданно умерли.
14:01
And initiallyпервоначально, it was thought that they diedумер of what's knownизвестен informallyнеформально as "cotдетская кроватка deathсмерть,"
275
816000
4000
И сначала думали что они умерли от того что неформально называется «смерть в колыбели,»
14:05
and more formallyформально as "Suddenвнезапный Infantмладенец DeathСмерть SyndromeСиндром."
276
820000
3000
а более формально Синдром внезапной детской смерти.
14:08
For variousразличный reasonsпричины, she was laterпозже chargedзаряженный with murderубийство.
277
823000
2000
По разным причинам, позже ее обвинили в убийстве.
14:10
And at the trialиспытание, her trialиспытание, a very distinguishedвыдающийся pediatricianпедиатр gaveдал evidenceдоказательства
278
825000
4000
И во время суда, суда над ней, очень выдающийся педиатр свидетельствовал,
14:14
that the chanceшанс of two cotдетская кроватка deathsсмертей, innocentневинный deathsсмертей, in a familyсемья like hersее --
279
829000
5000
что вероятность двух смертей в колыбели, в семье как у нее —
14:19
whichкоторый was professionalпрофессиональный and non-smokingне курить -- was one in 73 millionмиллиона.
280
834000
6000
образованных и некурящих — была один на 73 миллиона.
14:26
To cutпорез a long storyистория shortкороткая, she was convictedосужденный at the time.
281
841000
3000
Короче говоря, в тогда ее признали виновной.
14:29
LaterПозже, and fairlyдовольно recentlyв последнее время, acquittedоправданный on appealобращение -- in factфакт, on the secondвторой appealобращение.
282
844000
5000
Позже, и довольно недавно, освободили после апелляции — после второй апелляции.
14:34
And just to setзадавать it in contextконтекст, you can imagineпредставить how awfulужасный it is for someoneкто то
283
849000
4000
Просто чтобы добавить контекста, представьте себе насколько ужасно
14:38
to have lostпотерял one childребенок, and then two, if they're innocentневинный,
284
853000
3000
потерять ребенка, затем двоих, и, невиновным,
14:41
to be convictedосужденный of murderingсовершение тяжкого убийства them.
285
856000
2000
быть осужденным за их убийство.
14:43
To be put throughчерез the stressстресс of the trialиспытание, convictedосужденный of murderingсовершение тяжкого убийства them --
286
858000
2000
Пройти через стресс суда, быть осужденным за их убийство —
14:45
and to spendпроводить time in a women'sЖенский prisonтюрьма, where all the other prisonersзаключенных
287
860000
3000
и провести время в женской тюрьме, где все остальные заключенные
14:48
think you killedубитый your childrenдети -- is a really awfulужасный thing to happenслучаться to someoneкто то.
288
863000
5000
думают что ты убила своих детей — ужасное злоключение для кого бы то ни было.
14:53
And it happenedполучилось in largeбольшой partчасть here because the expertэксперт got the statisticsстатистика
289
868000
5000
И все это случилось в большой мере потому, что эксперт совершил
14:58
horriblyужасно wrongнеправильно, in two differentдругой waysпути.
290
873000
3000
ужасающие ошибки в статистике, причем двумя способами.
15:01
So where did he get the one in 73 millionмиллиона numberномер?
291
876000
4000
Откуда он взял цифру в 1 на 73 миллиона?
15:05
He lookedсмотрел at some researchисследование, whichкоторый said the chanceшанс of one cotдетская кроватка deathсмерть in a familyсемья
292
880000
3000
Он посмотрел на исследования, которые утверждали что вероятность смерти в колыбели в семье
15:08
like SallyСалли Clark'sКларк is about one in 8,500.
293
883000
5000
как у Салли Кларк равна примерно одному на восемь с половиной тысяч.
15:13
So he said, "I'll assumeпредполагать that if you have one cotдетская кроватка deathсмерть in a familyсемья,
294
888000
4000
И сказал "Я предположу, что если в вашей семье случилась одна смерть в колыбели,
15:17
the chanceшанс of a secondвторой childребенок dyingумирающий from cotдетская кроватка deathсмерть aren'tне changedизменено."
295
892000
4000
это не меняет шансы на то что второй ребенок умрет по той же причине."
15:21
So that's what statisticiansстатистикам would call an assumptionпредположение of independenceнезависимость.
296
896000
3000
Это то, что статистики называют «предположением о независимости».
15:24
It's like sayingпоговорка, "If you tossбросать a coinмонета and get a headглава the first time,
297
899000
2000
Это как утверждение «Если подбросив монетку ты получишь решку,
15:26
that won'tне будет affectаффект the chanceшанс of gettingполучение a headглава the secondвторой time."
298
901000
3000
это не повлияет на вероятность получить решку во второй раз».
15:29
So if you tossбросать a coinмонета twiceдважды, the chanceшанс of gettingполучение a headглава twiceдважды are a halfполовина --
299
904000
5000
Так что подбросив монетку два раза, вероятности получить решку дважды равна половине —
15:34
that's the chanceшанс the first time -- timesраз a halfполовина -- the chanceшанс a secondвторой time.
300
909000
3000
это вероятность в первый раз — помноженной на половину — вероятность во второй раз.
15:37
So he said, "Here,
301
912000
2000
Так что он сказал «Давайте предположим, —
15:39
I'll assumeпредполагать that these eventsМероприятия are independentнезависимый.
302
914000
4000
я предположу, что эти события независимы.
15:43
When you multiplyумножать 8,500 togetherвместе twiceдважды,
303
918000
2000
Если возвести восемь с половиной тысяч в квадрат,
15:45
you get about 73 millionмиллиона."
304
920000
2000
получится примерно 73 миллиона."
15:47
And noneникто of this was statedзаявил to the courtсуд as an assumptionпредположение
305
922000
2000
Все это не было высказано суду как предположение
15:49
or presentedпредставленный to the juryжюри that way.
306
924000
2000
или представлено присяжным в таком виде.
15:52
UnfortunatelyК сожалению here -- and, really, regrettablyприскорбно --
307
927000
3000
К сожалению тут — и вправду, к несчастью—
15:55
first of all, in a situationситуация like this you'dвы бы have to verifyпроверить it empiricallyэмпирически.
308
930000
4000
во-первых, в такой ситуации надо проверять это опытным путем.
15:59
And secondlyво-вторых, it's palpablyощутимо falseложный.
309
934000
2000
А во-вторых, это явно не верно.
16:02
There are lots and lots of things that we don't know about suddenвнезапно infantмладенец deathsсмертей.
310
937000
5000
Мы очень и очень многого не знаем о внезапных детских смертях.
16:07
It mightмог бы well be that there are environmentalэкологическая factorsфакторы that we're not awareзнать of,
311
942000
3000
Вполне может быть что есть внешние факторы, о которых мы не подозреваем,
16:10
and it's prettyСимпатичная likelyвероятно to be the caseдело that there are
312
945000
2000
и скорее всего есть
16:12
geneticгенетический factorsфакторы we're not awareзнать of.
313
947000
2000
генетические факторы о которых мы не подозреваем.
16:14
So if a familyсемья suffersстрадает from one cotдетская кроватка deathсмерть, you'dвы бы put them in a high-riskвысокий риск groupгруппа.
314
949000
3000
Так что если в семье случается такая смерть, их надо отнести к группе повышенного риска.
16:17
They'veУ них есть probablyвероятно got these environmentalэкологическая riskриск factorsфакторы
315
952000
2000
У них наверное есть эти внешние факторы риска
16:19
and/or geneticгенетический riskриск factorsфакторы we don't know about.
316
954000
3000
и/или генетические факторы риска о которых мы ничего не знаем.
16:22
And to argueспорить, then, that the chanceшанс of a secondвторой deathсмерть is as if you didn't know
317
957000
3000
И значит рассудить что вероятность второй смерти такая же как если бы у нас не было
16:25
that informationИнформация is really sillyглупый.
318
960000
3000
этой информации — просто глупость.
16:28
It's worseхуже than sillyглупый -- it's really badПлохо scienceнаука.
319
963000
4000
Это хоже чем глупость — это плохая наука.
16:32
Nonethelessтем не менее, that's how it was presentedпредставленный, and at trialиспытание nobodyникто even arguedутверждал it.
320
967000
5000
Тем не менее, вот так это было представлено, и во время суда никто с этим даже не спорил.
16:37
That's the first problemпроблема.
321
972000
2000
Это первая проблема.
16:39
The secondвторой problemпроблема is, what does the numberномер of one in 73 millionмиллиона mean?
322
974000
4000
Вторая проблема в том, что значит это число — один на 73 миллиона?
16:43
So after SallyСалли ClarkКларк was convictedосужденный --
323
978000
2000
После того как Салли Кларк была осуждена —
16:45
you can imagineпредставить, it madeсделал ratherскорее a splashвсплеск in the pressНажмите --
324
980000
4000
можете себе представить, это вызвало значительный всплеск в печати —
16:49
one of the journalistsжурналисты from one of Britain'sБритании more reputableуважаемый newspapersгазеты wroteписал that
325
984000
7000
журналист одной из более уважаемых Британских газет написал что
16:56
what the expertэксперт had said was,
326
991000
2000
эксперт сказал,
16:58
"The chanceшанс that she was innocentневинный was one in 73 millionмиллиона."
327
993000
5000
«Вероятность того, что она не виновна была один на 73 миллиона.»
17:03
Now, that's a logicalлогический errorошибка.
328
998000
2000
Это ошибка в логике.
17:05
It's exactlyв точку the sameодна и та же logicalлогический errorошибка as the logicalлогический errorошибка of thinkingмышление that
329
1000000
3000
Точно такая же ошибка, как ошибка считать
17:08
after the diseaseболезнь testконтрольная работа, whichкоторый is 99 percentпроцент accurateточный,
330
1003000
2000
после теста на болезнь, верного в 99и процентах случаев,
17:10
the chanceшанс of havingимеющий the diseaseболезнь is 99 percentпроцент.
331
1005000
4000
что вероятность болезни 99 процентов.
17:14
In the diseaseболезнь exampleпример, we had to bearмедведь in mindразум two things,
332
1009000
4000
В примере с болезнью, нам нужно было иметь в виду две вещи,
17:18
one of whichкоторый was the possibilityвозможность that the testконтрольная работа got it right or not.
333
1013000
4000
одной из которых была вероятность того дал ли тест верный результат или нет.
17:22
And the other one was the chanceшанс, a prioriаприори, that the personчеловек had the diseaseболезнь or not.
334
1017000
4000
А другая была вероятность, априори, болен был человек или нет.
17:26
It's exactlyв точку the sameодна и та же in this contextконтекст.
335
1021000
3000
Точно то же самое происходит и здесь.
17:29
There are two things involvedучаствует -- two partsчасти to the explanationобъяснение.
336
1024000
4000
Тут участвуют две вещи — объяснение состоит из двух частей.
17:33
We want to know how likelyвероятно, or relativelyотносительно how likelyвероятно, two differentдругой explanationsобъяснения are.
337
1028000
4000
Мы хотим знать насколько вероятны, или насколько относительно вероятны, два разных объяснения.
17:37
One of them is that SallyСалли ClarkКларк was innocentневинный --
338
1032000
3000
Одно из них в том что Салли была не виновна —
17:40
whichкоторый is, a prioriаприори, overwhelminglyв подавляющем большинстве случаев likelyвероятно --
339
1035000
2000
что, априори, чрезвычайно вероятно —
17:42
mostбольшинство mothersматери don't killубийство theirих childrenдети.
340
1037000
3000
большинство матерей не убивают своих детей.
17:45
And the secondвторой partчасть of the explanationобъяснение
341
1040000
2000
И вторая часть этого объяснения,
17:47
is that she sufferedпострадали an incrediblyневероятно unlikelyвряд ли eventмероприятие.
342
1042000
3000
в том что с ней случилось чрезвычайно редкое происшествие.
17:50
Not as unlikelyвряд ли as one in 73 millionмиллиона, but nonethelessтем не менее ratherскорее unlikelyвряд ли.
343
1045000
4000
Не настолько редкое как 1 на 73 миллиона, но достаточно редкое.
17:54
The other explanationобъяснение is that she was guiltyвиновный.
344
1049000
2000
Другое объяснение в том что она виновна.
17:56
Now, we probablyвероятно think a prioriаприори that's unlikelyвряд ли.
345
1051000
2000
Мы наверняка считаем что это априори маловероятно.
17:58
And we certainlyбезусловно should think in the contextконтекст of a criminalпреступник trialиспытание
346
1053000
3000
И нам конечно должно так считать в контексте уголовного суда,
18:01
that that's unlikelyвряд ли, because of the presumptionпрезумпция of innocenceневинность.
347
1056000
3000
что это маловероятно, в виду презумпции невиновности.
18:04
And then if she were tryingпытаясь to killубийство the childrenдети, she succeededудалось.
348
1059000
4000
А что если она пыталась убить детей, ей это удалось.
18:08
So the chanceшанс that she's innocentневинный isn't one in 73 millionмиллиона.
349
1063000
4000
Так что вероятность того что она не виновна не один на 73 миллиона.
18:12
We don't know what it is.
350
1067000
2000
Мы не знаем чему она равна.
18:14
It has to do with weighingвзвешивание up the strengthпрочность of the other evidenceдоказательства againstпротив her
351
1069000
4000
Она зависит от веса остальных улик против нее по отношению к
18:18
and the statisticalстатистический evidenceдоказательства.
352
1073000
2000
весу статистических рассуждений.
18:20
We know the childrenдети diedумер.
353
1075000
2000
Мы знаем что дети погибли.
18:22
What mattersвопросы is how likelyвероятно or unlikelyвряд ли, relativeотносительный to eachкаждый other,
354
1077000
4000
Важно то, насколько вероятны или маловероятны по отношению друг к другу
18:26
the two explanationsобъяснения are.
355
1081000
2000
эти два объяснения.
18:28
And they're bothи то и другое implausibleнеправдоподобно.
356
1083000
2000
И они оба маловероятны.
18:31
There's a situationситуация where errorsошибки in statisticsстатистика had really profoundглубокий
357
1086000
4000
Это ситуация где ошибки в статистике имели очень глубокие
18:35
and really unfortunateнесчастный consequencesпоследствия.
358
1090000
3000
и очень печальные последствия.
18:38
In factфакт, there are two other womenженщины who were convictedосужденный on the basisоснова of the
359
1093000
2000
Оказалось, что еще двое женщин были осуждены на основе
18:40
evidenceдоказательства of this pediatricianпедиатр, who have subsequentlyвпоследствии been releasedвыпущенный on appealобращение.
360
1095000
4000
показаний этого педиатра, и были позже освобождены по апелляциям.
18:44
ManyМногие casesслучаи were reviewedобзор.
361
1099000
2000
Много дел пришлось пересмотреть.
18:46
And it's particularlyв частности topicalактуальный because he's currentlyВ данный момент facingоблицовочный a disreputeдурная слава chargeзаряд
362
1101000
4000
И это особенно актуально, поскольку он сейчас предстал перед обвинением в недостойном поведении
18:50
at Britain'sБритании GeneralГенеральная Medicalмедицинская Councilсовет.
363
1105000
3000
в Британском Общемедицинском Совете.
18:53
So just to concludeзаключать -- what are the take-homeзабрать домой messagesСообщения from this?
364
1108000
4000
Итак, чтобы подвести итог —в чем урок этого всего?
18:57
Well, we know that randomnessхаотичность and uncertaintyнеопределенность and chanceшанс
365
1112000
4000
Мы знаем что вероятность, и неопределенность, и случайность
19:01
are very much a partчасть of our everydayкаждый день life.
366
1116000
3000
часть нашей повседневной жизни.
19:04
It's alsoтакже trueправда -- and, althoughнесмотря на то что, you, as a collectiveколлектив, are very specialособый in manyмногие waysпути,
367
1119000
5000
И так же верно — и, несмотря на то что вы, как группа, очень особенны по многим параметрам,
19:09
you're completelyполностью typicalтипичный in not gettingполучение the examplesПримеры I gaveдал right.
368
1124000
4000
вы совершенно типичны в том что вы ошиблись в примерах которые я приводил.
19:13
It's very well documentedдокументированный that people get things wrongнеправильно.
369
1128000
3000
Хорошо проверено что люди ошибаются.
19:16
They make errorsошибки of logicлогика in reasoningрассуждения with uncertaintyнеопределенность.
370
1131000
3000
Они совершают логические ошибки рассуждая о вероятностях.
19:20
We can copeсправиться with the subtletiesтонкости of languageязык brilliantlyблестяще --
371
1135000
2000
Мы легко справляемся с нюансами языка —
19:22
and there are interestingинтересно evolutionaryэволюционный questionsвопросов about how we got here.
372
1137000
3000
это интересный вопрос о эволюции, как так получилось.
19:25
We are not good at reasoningрассуждения with uncertaintyнеопределенность.
373
1140000
3000
Но мы плохо умеем рассуждать о вероятностях.
19:28
That's an issueвопрос in our everydayкаждый день livesжизни.
374
1143000
2000
Это проблема в повседневной жизни.
19:30
As you've heardуслышанным from manyмногие of the talksпереговоры, statisticsстатистика underpinsподкрепляет an enormousогромный amountколичество
375
1145000
3000
Как вы слышали из многих докладов, статистика лежит в основе огромного количества
19:33
of researchисследование in scienceнаука -- in socialСоциальное scienceнаука, in medicineлекарственное средство
376
1148000
3000
научных исследований — в естественных науках, медицине
19:36
and indeedв самом деле, quiteдовольно a lot of industryпромышленность.
377
1151000
2000
и многого на производстве.
19:38
All of qualityкачественный controlконтроль, whichкоторый has had a majorглавный impactвлияние on industrialпромышленные processingобработка,
378
1153000
4000
Весь контроль качества, который очень сильно влияет на промышленные процессы,
19:42
is underpinnedподкрепляться by statisticsстатистика.
379
1157000
2000
основан на статистике.
19:44
It's something we're badПлохо at doing.
380
1159000
2000
На том что мы плохо умеем делать.
19:46
At the very leastнаименее, we should recognizeпризнать that, and we tendиметь тенденцию not to.
381
1161000
3000
По крайней мере, нам следует понимать это, а мы обычно не понимаем.
19:49
To go back to the legalправовой contextконтекст, at the SallyСалли ClarkКларк trialиспытание
382
1164000
4000
Возвращаясь к судебному контексту, во время процесса Салли Кларк,
19:53
all of the lawyersадвокаты just acceptedпринято what the expertэксперт said.
383
1168000
4000
все адвокаты просто согласились с тем что сказал эксперт.
19:57
So if a pediatricianпедиатр had come out and said to a juryжюри,
384
1172000
2000
Если бы педиатр сказал присяжным:
19:59
"I know how to buildстроить bridgesмосты. I've builtпостроен one down the roadДорога.
385
1174000
3000
«Я умею строить мосты. Я построил там один, по дороге.
20:02
Please driveводить машину your carавтомобиль home over it,"
386
1177000
2000
Поезжайте домой через него,»
20:04
they would have said, "Well, pediatriciansпедиатры don't know how to buildстроить bridgesмосты.
387
1179000
2000
они бы сказали «Педиатры не умеют строить мосты.
20:06
That's what engineersинженеры do."
388
1181000
2000
Этим занимаются инженеры.»
20:08
On the other handрука, he cameпришел out and effectivelyфактически said, or impliedподразумеваемый,
389
1183000
3000
С другой стороны, он как будто бы сказал, или подразумевал,
20:11
"I know how to reasonпричина with uncertaintyнеопределенность. I know how to do statisticsстатистика."
390
1186000
3000
«Я умею рассуждать о вероятностях. Я умею заниматься статистикой.»
20:14
And everyoneвсе said, "Well, that's fine. He's an expertэксперт."
391
1189000
3000
И все сказали, «Хорошо. Он эксперт.»
20:17
So we need to understandПонимаю where our competenceкомпетентность is and isn't.
392
1192000
3000
Так что стоит понимать в чем мы компетентны а в чем нет.
20:20
ExactlyВ точку the sameодна и та же kindsвиды of issuesвопросы aroseвозникла in the earlyрано daysдней of DNAДНК profilingпрофилирование,
393
1195000
4000
Точно такие же проблемы возникли на заре ДНК-дактилоскопии,
20:24
when scientistsученые, and lawyersадвокаты and in some casesслучаи judgesсудьи,
394
1199000
4000
когда ученые, и адвокаты, и в некоторых случаях судьи,
20:28
routinelyобычно misrepresentedискаженный evidenceдоказательства.
395
1203000
3000
регулярно неправильно интерпретировали улики.
20:32
UsuallyКак правило -- one hopesнадеется -- innocentlyневиновно, but misrepresentedискаженный evidenceдоказательства.
396
1207000
3000
Обычно — хочется надеяться — без злого умысла, но неправильно интерпретировали улики.
20:35
Forensicсудебный scientistsученые said, "The chanceшанс that this guy'sпарень innocentневинный is one in threeтри millionмиллиона."
397
1210000
5000
Судебные эксперты говорили «Вероятность того что этот парень невиновен один на три миллиона.»
20:40
Even if you believe the numberномер, just like the 73 millionмиллиона to one,
398
1215000
2000
Даже если верить этому числу, как и числу в один на 73 миллиона,
20:42
that's not what it meantимел ввиду.
399
1217000
2000
оно обозначает совсем не то.
20:44
And there have been celebratedзнаменитый appealобращение casesслучаи
400
1219000
2000
И были известные случаи апелляций
20:46
in BritainБритания and elsewhereв другом месте because of that.
401
1221000
2000
в Британии и в других странах, по этой причине.
20:48
And just to finishКонец in the contextконтекст of the legalправовой systemсистема.
402
1223000
3000
И чтобы закончить в контексте судебной системы.
20:51
It's all very well to say, "Let's do our bestЛучший to presentнастоящее время the evidenceдоказательства."
403
1226000
4000
Очень просто сказать «Давайте постараемся лучше представлять улики».
20:55
But more and more, in casesслучаи of DNAДНК profilingпрофилирование -- this is anotherдругой one --
404
1230000
3000
Но все чаще и чаще, в случаях ДНК-дактилоскопирования — это еще один —
20:58
we expectожидать juriesприсяжные, who are ordinaryобычный people --
405
1233000
3000
мы ожидаем что присяжные, обычные люди —
21:01
and it's documentedдокументированный they're very badПлохо at this --
406
1236000
2000
и у нас много подтверждений что они плохо это делают —
21:03
we expectожидать juriesприсяжные to be ableв состоянии to copeсправиться with the sortsвиды of reasoningрассуждения that goesидет on.
407
1238000
4000
мы ожидаем что присяжные смогут справится с этими рассуждениями.
21:07
In other spheresсферы of life, if people arguedутверждал -- well, exceptКроме possiblyвозможно for politicsполитика --
408
1242000
5000
Во всех остальных сферах, если бы люди рассуждали — ну, может быть кроме политики.
21:12
but in other spheresсферы of life, if people arguedутверждал illogicallyнелогично,
409
1247000
2000
Но во всех остальных сферах, если бы люди рассуждали нелогично,
21:14
we'dмы б say that's not a good thing.
410
1249000
2000
мы бы считали, что это плохо.
21:16
We sortСортировать of expectожидать it of politiciansполитики and don't hopeнадежда for much more.
411
1251000
4000
От политиков мы как-то уже этого ожидаем и не надеемся на большее.
21:20
In the caseдело of uncertaintyнеопределенность, we get it wrongнеправильно all the time --
412
1255000
3000
В случае неопределенности, мы все время ошибаемся —
21:23
and at the very leastнаименее, we should be awareзнать of that,
413
1258000
2000
и, по крайней мере, нам стоит об этом знать.
21:25
and ideallyИдеально, we mightмог бы try and do something about it.
414
1260000
2000
И, в идеале, мы можем попробовать что-то с этим сделать.
21:27
Thanksблагодаря very much.
415
1262000
1000
Большое спасибо.
Translated by Maksim Maydanskiy
Reviewed by Ilya Sklyar

▲Back to top

ABOUT THE SPEAKER
Peter Donnelly - Mathematician; statistician
Peter Donnelly is an expert in probability theory who applies statistical methods to genetic data -- spurring advances in disease treatment and insight on our evolution. He's also an expert on DNA analysis, and an advocate for sensible statistical analysis in the courtroom.

Why you should listen

Peter Donnelly applies statistical methods to real-world problems, ranging from DNA analysis (for criminal trials), to the treatment of genetic disorders. A mathematician who collaborates with biologists, he specializes in applying probability and statistics to the field of genetics, in hopes of shedding light on evolutionary history and the structure of the human genome.

The Australian-born, Oxford-based mathematician is best known for his work in molecular evolution (tracing the roots of human existence to their earliest origins using the mutation rates of mitochondrial DNA). He studies genetic distributions in living populations to trace human evolutionary history -- an approach that informs research in evolutionary biology, as well as medical treatment for genetic disorders. Donnelly is a key player in the International HapMap Project, an ongoing international effort to model human genetic variation and pinpoint the genes responsible for specific aspects of health and disease; its implications for disease prevention and treatment are vast.

He's also a leading expert on DNA analysis and the use of forensic science in criminal trials; he's an outspoken advocate for bringing sensible statistical analysis into the courtroom. Donnelly leads Oxford University's Mathematical Genetics Group, which conducts research in genetic modeling, human evolutionary history, and forensic DNA profiling. He is also serves as Director of the Wellcome Trust Centre for Human Genetics at Oxford University, which explores the genetic relationships to disease and illness. 

More profile about the speaker
Peter Donnelly | Speaker | TED.com

Data provided by TED.

This site was created in May 2015 and the last update was on January 12, 2020. It will no longer be updated.

We are currently creating a new site called "eng.lish.video" and would be grateful if you could access it.

If you have any questions or suggestions, please feel free to write comments in your language on the contact form.

Privacy Policy

Developer's Blog

Buy Me A Coffee