ABOUT THE SPEAKER
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
TED2012

Jean-Baptiste Michel: The mathematics of history

Jean-Baptiste Michel: Toán học trong lịch sử

Filmed:
1,279,350 views

Toán học có thể nói j về lịch sử? Theo như Teder Jean-Baptise Michel, khá là nhiều. Tù những thay đổi về ngôn ngữ đến thương vong của những cuộc chiên tranh, anh còn trình bày cách số hóa lịch sử là bắt đầu để khám phá những mô hình ẩn sâu bên trong
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio

Double-click the English transcript below to play the video.

00:15
So it turnslượt out that mathematicstoán học is a very powerfulquyền lực languagengôn ngữ.
0
0
3671
Toán học là 1 thứ ngôn ngữ vô cùng mạnh mẽ
00:19
It has generatedtạo ra considerableđáng kể insightcái nhìn sâu sắc in physicsvật lý,
1
3671
2312
Nó đã tạo ra cái nhìn sâu sắc trong vật lý,
00:21
in biologysinh học and economicsKinh tế học,
2
5983
2100
trong sinh học và kinh tế,
00:23
but not that much in the humanitiesnhân văn and in historylịch sử.
3
8083
2817
nhưng không ảnh hưởng nhiều đến nhân văn và lịch sử.
00:26
I think there's a beliefniềm tin that it's just impossibleKhông thể nào,
4
10900
2283
Chúng ta luôn nghĩ rằng sự phối hợp này là không thể được,
00:29
that you cannotkhông thể quantifyđịnh lượng the doingsdoings of mankindnhân loại,
5
13183
2646
vì không ai có thể chuyển dịnh những hành động của loài người thành những con số
00:31
that you cannotkhông thể measuređo historylịch sử.
6
15829
2519
rằng bạn không thể đo đếm được lịch sử.
00:34
But I don't think that's right.
7
18348
1527
Nhưng tôi không đồng ý với ý kiến đó.
00:35
I want to showchỉ you a couplevợ chồng of examplesví dụ why.
8
19875
2042
Tôi sẽ trình bày một vài ví dụ.
00:37
So my collaboratorcộng tác viên ErezErez and I were consideringxem xét the followingtiếp theo factthực tế:
9
21917
2958
Vì vậy tôi và cộng tác viên của tôi -Erez đã xem xét một chứng cứ sau:
00:40
that two kingsvua separatedly thân by centuriesthế kỉ
10
24875
2729
hai vị vua sống cách nhau hàng thế kỉ
00:43
will speaknói a very differentkhác nhau languagengôn ngữ.
11
27604
1767
sẽ nói một ngôn ngữ rất khác nhau.
00:45
That's a powerfulquyền lực historicallịch sử forcelực lượng.
12
29371
2304
Đó là một sức mạnh to lớn của lịch sử
00:47
So the kingnhà vua of EnglandAnh, AlfredAlfred the Great,
13
31675
1773
Vì vậy vua nước Anh, Alfred đại đế
00:49
will use a vocabularytừ vựng and grammarngữ pháp
14
33448
1640
sẽ sử dụng từ vựng và ngữ pháp
00:50
that is quitekhá differentkhác nhau from the kingnhà vua of hiphông hophop, Jay-ZJay-Z.
15
35088
3700
khá khác với vị vua hip hop, Jay-Z.
00:54
(LaughterTiếng cười)
16
38788
1666
(Tiếng cười)
00:56
Now it's just the way it is.
17
40454
2171
Nó là như vậy.
00:58
LanguageNgôn ngữ changesthay đổi over time, and it's a powerfulquyền lực forcelực lượng.
18
42625
2292
Ngôn ngữ thay đổi theo thời gian, và nó là một thứ sức mạnh to lớn
01:00
So ErezErez and I wanted to know more about that.
19
44917
2287
Vì vậy, Erez và tôi muốn biết thêm chi tiết về điều đó.
01:03
So we paidđã thanh toán attentionchú ý to a particularcụ thể grammaticalngữ pháp rulequi định, past-tensethì quá khứ conjugationChia động từ.
20
47204
3657
Vì thế, chúng tôi chú ý đến các quy tắc ngữ pháp cụ thể như chia động từ.
01:06
So you just addthêm vào "edEd" to a verbđộng từ at the endkết thúc to signifybiểu hiện the pastquá khứ.
21
50861
3264
Bạn chỉ cần thêm "ed" [đã] vào một động từ cuối để biểu thị quá khứ.
01:10
"TodayHôm nay I walkđi bộ. YesterdayHôm qua I walkedđi bộ."
22
54125
1927
"Hôm nay tôi đi bộ. Hôm qua tôi đã đi bộ."
01:11
But some verbsđộng từ are irregularkhông thường xuyên.
23
56052
1344
Nhưng một số động từ bất quy tắc
01:13
"YesterdayHôm qua I thought."
24
57396
1396
"Hôm qua tôi đã nghĩ."
01:14
Now what's interestinghấp dẫn about that
25
58792
1666
1 điều thú vị nữa là
01:16
is irregularkhông thường xuyên verbsđộng từ betweengiữa AlfredAlfred and Jay-ZJay-Z have becometrở nên more regularđều đặn.
26
60458
3830
những động từ bất quy tắc giữa Alfred và Jay-Z đã trở nên thường xuyên hơn.
01:20
Like the verbđộng từ "to wedThứ tư" that you see here has becometrở nên regularđều đặn.
27
64288
2735
Giống như động từ "cưới" mà bạn nhìn thấy ở đây đã trở thành thường xuyên.
01:22
So ErezErez and I followedtheo sau the fatesố phận of over 100 irregularkhông thường xuyên verbsđộng từ
28
67023
4022
Vì vậy Erez và tôi sau đó là số phận của hơn 100 động từ bất qui tắc
01:26
throughxuyên qua 12 centuriesthế kỉ of EnglishTiếng Anh languagengôn ngữ,
29
71045
1919
qua 12 thế kỉ của tiếng Anh
01:28
and we saw that there's actuallythực ra a very simpleđơn giản mathematicaltoán học patternmẫu
30
72964
2911
và chúng tôi thấy nó thực sự là một mô hình toán học rất đơn giản
01:31
that captureschụp lại this complexphức tạp historicallịch sử changethay đổi,
31
75875
2542
giải thích cho cách chia những động từ bất qui tắc phức tạp này
01:34
namelycụ thể là, if a verbđộng từ is 100 timeslần more frequentthường xuyên than anotherkhác,
32
78417
3660
cụ thể là, nếu một động từ được sử dụng thường xuyên hơn 100 lần hơn những từ khác
01:37
it regularizesregularizes 10 timeslần slowerchậm.
33
82077
2665
nó được chia theo qui tắc chậm hơn 10 lần
01:40
That's a piececái of historylịch sử, but it comesđến in a mathematicaltoán học wrappingbao bì.
34
84742
3935
Đó là một mảnh ghép của lịch sử, nhưng nó có trong toán học.
01:44
Now in some casescác trường hợp mathmôn Toán can even help explaingiải thích,
35
88677
3654
Trong 1 số trường hợp, toán học có thể giải thích
01:48
or proposecầu hôn explanationsgiải thích for, historicallịch sử forceslực lượng.
36
92331
2879
hoặc đưa ra 1 tiên đề cho sức mạnh của lịch sử
01:51
So here SteveSteve PinkerPinker and I
37
95210
1832
Vì vậy, đây Steve Pinker và tôi
01:52
were consideringxem xét the magnitudeđộ lớn of warschiến tranh duringsuốt trong the last two centuriesthế kỉ.
38
97042
3852
đã xem xét độ lớn của các cuộc chiến tranh trong các thế kỷ hai trước.
01:56
There's actuallythực ra a well-knownnổi tiếng regularityđều đặn to them
39
100894
2495
Chiến tranh thưc sự diễn ra đều đặn
01:59
where the numbercon số of warschiến tranh that are 100 timeslần deadlierdeadlier
40
103389
3422
nơi mà số lượng các cuộc chiến tranh khốc liệt hơn 100 lần
02:02
is 10 timeslần smallernhỏ hơn.
41
106811
1952
thì độ dài sẽ ngắn hơn 10 lần.
02:04
So there are 30 warschiến tranh that are about as deadlychết người as the SixSáu DaysNgày WarChiến tranh,
42
108763
3344
Vì thế, 30 cuộc chiến cũng gây thương vong như cuộc chiến 6 ngày
02:08
but there's only fourbốn warschiến tranh that are 100 timeslần deadlierdeadlier --
43
112107
2820
nhưng chỉ có 4 cuộc chiến tranh khốc liệt hơn 100 lần
02:10
like WorldTrên thế giới WarChiến tranh I.
44
114927
1977
giống như chiến tranh thế giới thứ 1
02:12
So what kindloại of historicallịch sử mechanismcơ chế can producesản xuất that?
45
116904
2923
Vậy cơ chế để tạo ra hiện tượng này là gì?
02:15
What's the origingốc of this?
46
119827
2000
Nguồn gốc của điều này là gì?
02:17
So SteveSteve and I, throughxuyên qua mathematicaltoán học analysisphân tích,
47
121827
2265
Vì vậy, Steve và tôi, qua phương thức phân tích toán học,
02:19
proposecầu hôn that there's actuallythực ra a very simpleđơn giản phenomenonhiện tượng at the rootnguồn gốc of this,
48
124092
4241
nghĩ là thật ra một hiện tượng rất đơn giản là gốc rễ của điều này
02:24
which liesdối trá in our brainsnão.
49
128333
1690
nó nằm trong bộ não của chúng ta.
02:25
This is a very well-knownnổi tiếng featuređặc tính
50
130023
2019
Nó là 1 thứ đặc biệt
02:27
in which we perceivecảm nhận quantitiessố lượng in relativequan hệ wayscách --
51
132042
2975
trong đó chúng ta nhận thức về số lượng theo sự liên hệ -
02:30
quantitiessố lượng like the intensitycường độ of lightánh sáng or the loudnessâm sắc of a soundâm thanh.
52
135017
3716
với số lượng thích cường độ của ánh sáng hay độ ồn của âm thanh.
02:34
For instanceví dụ, committingcam kết 10,000 soldiersbinh lính to the nextkế tiếp battlechiến đấu soundsâm thanh like a lot.
53
138733
5309
Ví dụ, đưa 10.000 binh sĩ ra chiến trường trong trận tiếp theo
02:39
It's relativelytương đối enormousto lớn if you've alreadyđã committedcam kết 1,000 soldiersbinh lính previouslytrước đây.
54
144042
3444
Nó là tương đối lớn nếu bạn đã đã đưa 1.000 binh sĩ ra chiến trường ở trận trước
02:43
But it doesn't soundâm thanh so much,
55
147486
1827
nhưng nó sẽ không phải là nhiều
02:45
it's not relativelytương đối enoughđủ, it won'tsẽ không make a differenceSự khác biệt
56
149313
3020
nếu số lượng không đủ, nó không tạo nên sự khác biệt
02:48
if you've alreadyđã committedcam kết 100,000 soldiersbinh lính previouslytrước đây.
57
152333
2952
nếu bạn đã từng đưat 100.000 lính ra trận trước đó.
02:51
So you see that because of the way we perceivecảm nhận quantitiessố lượng,
58
155285
3613
Vì vậy, bạn thấy rằng vì cách của chúng ta nhận thức số lượng,
02:54
as the warchiến tranh dragskéo on,
59
158898
1767
khi chiến tranh kéo dài ra,
02:56
the numbercon số of soldiersbinh lính committedcam kết to it and the casualtiesthương vong
60
160665
3085
số lượng các binh sĩ ra trận và số thương vong
02:59
will increasetăng not linearlytuyến tính --
61
163750
1683
sẽ tăng không phải theo đường thẳng -
03:01
like 10,000, 11,000, 12,000 --
62
165433
1888
như 10.000, 11.000, 12.000--
03:03
but exponentiallytheo hàm mũ -- 10,000, latermột lát sau 20,000, latermột lát sau 40,000.
63
167321
4275
mà theo cấp số nhân-- 10.000, 20.000 rồi 40.000.
03:07
And so that explainsgiải thích this patternmẫu that we'vechúng tôi đã seenđã xem before.
64
171596
3085
Vì vậy nó giải thích mô hình này mà chúng ta đã thấy ở trước.
03:10
So here mathematicstoán học is ablecó thể to linkliên kết a well-knownnổi tiếng featuređặc tính of the individualcá nhân mindlí trí
65
174681
5498
Toán học có thể liên kết một nét đặc trưng của trí óc cá nhân
03:16
with a long-termdài hạn historicallịch sử patternmẫu
66
180179
2989
với một mô hình lịch sử dài vô tận
03:19
that unfoldsmở ra over centuriesthế kỉ and acrossbăng qua continentslục địa.
67
183168
2857
trải qua nhiều thế kỷ và trên khắp châu lục.
03:21
So these typesloại of examplesví dụ, todayhôm nay there are just a fewvài of them,
68
186025
4017
Những ví dụ hôm nay chỉ là 1 phần nhỏ của lịch sử
03:25
but I think in the nextkế tiếp decadethập kỷ they will becometrở nên commonplacephổ biến.
69
190042
2689
nhưng tôi nghĩ rằng trong thập kỷ tiếp theo nó sẽ trở thành chuyện bình thường.
03:28
The reasonlý do for that is that the historicallịch sử recordghi lại
70
192731
2392
Nguyên nhân là luôn có 1 phần lịch sử
03:31
is becomingtrở thành digitizedsố hóa at a very fastNhanh pacetốc độ.
71
195123
2460
được số hóa với một tốc độ rất nhanh
03:33
So there's about 130 milliontriệu bookssách
72
197583
2610
Đây là khoảng 130 triệu đầu sách
03:36
that have been writtenbằng văn bản sincekể từ the dawnbình minh of time.
73
200193
2311
mà đã được viết từ thời kì bình minh của loài người
03:38
CompaniesCông ty like GoogleGoogle have digitizedsố hóa manynhiều of them --
74
202504
2454
Các công ty như Google đã số hóa rất nhiều sách --
03:40
aboveở trên 20 milliontriệu actuallythực ra.
75
204958
1584
trên 20 triệu thực sự.
03:42
And when the stuffđồ đạc of historylịch sử is availablecó sẵn in digitalkỹ thuật số formhình thức,
76
206542
3578
Và khi các công cụ của lịch sử có sẵn ở dạng kỹ thuật số,
03:46
it makeslàm cho it possiblekhả thi for a mathematicaltoán học analysisphân tích
77
210120
2380
Chúng ta có thể thực hiện các phân tích toán học
03:48
to very quicklyMau and very convenientlytiện lợi
78
212500
2375
rất nhanh chóng và thuận tiện
03:50
reviewôn tập trendsxu hướng in our historylịch sử and our culturenền văn hóa.
79
214875
2725
xem xét các xu hướng trong lịch sử của chúng tôi và văn hóa của chúng tôi.
03:53
So I think in the nextkế tiếp decadethập kỷ,
80
217600
2721
Vì vậy tôi nghĩ rằng trong thập kỷ tiếp theo,
03:56
the scienceskhoa học and the humanitiesnhân văn will come closergần hơn togethercùng với nhau
81
220321
2750
khoa học và con người sẽ đến gần hơn với nhau
03:58
to be ablecó thể to answercâu trả lời deepsâu questionscâu hỏi about mankindnhân loại.
82
223071
3329
để có thể trả lời các câu hỏi sâu sắc về loài người
04:02
And I think that mathematicstoán học will be a very powerfulquyền lực languagengôn ngữ to do that.
83
226400
4121
Và tôi nghĩ rằng toán học sẽ là 1 thứt ngôn ngữ rất mạnh mẽ để làm điều đó.
04:06
It will be ablecó thể to revealtiết lộ newMới trendsxu hướng in our historylịch sử,
84
230521
3146
Nó có thể sẽ tiết lộ xu hướng mới trong lịch sử của chúng ta
04:09
sometimesđôi khi to explaingiải thích them,
85
233667
1750
đôi khi là để giải thích nó
04:11
and maybe even in the futureTương lai to predicttiên đoán what's going to happenxảy ra.
86
235417
3306
và có thể trong tương lai dự đoán những thứ sẽ xảy ra
04:14
Thank you very much.
87
238723
1491
Cảm ơn rất nhiều.
04:16
(ApplauseVỗ tay)
88
240214
3678
(Vỗ tay)
Translated by duc duy
Reviewed by Kim Thanh Nguyen

▲Back to top

ABOUT THE SPEAKER
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com