ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

از 5 میلیون کتاب چه چیزی یادگرفتیم

Filmed:
2,049,453 views

آیا تا حالا با بیننده انگرم گوگل لب کار کردید؟ ابزار شیفته کننده ای است که به شما امکان می دهد کلمات و ایده ها را در بانک اطلاعاتی 5 میلیون کتاب در طول چند صد سال پیش جستجو کنید. ارز لیبرمن آیدن و ژان باپتیست میشل به شما نشان می دهند که کارکرد آن چگونه است و نشان می دهند چه چیزهای جالبی که از 500 میلیارد کلمه می توانیم بیاموزیم.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
Erezاریز Liebermanلیبرمن Aidenایده: Everyoneهر کس knowsمی داند
0
0
2000
اریز لیبرمن آیدن: همه می دانند که
00:17
that a pictureعکس is worthارزش a thousandهزار wordsکلمات.
1
2000
3000
یک تصویر به اندازه هزاران کلمه ارزش دارد.
00:22
But we at Harvardهاروارد
2
7000
2000
اما ما در هاروارد
00:24
were wonderingتعجب کردم if this was really trueدرست است.
3
9000
3000
می خواستیم به درستی آن پی ببریم.
00:27
(Laughterخنده)
4
12000
2000
(خنده حضار)
00:29
So we assembledمونتاژ a teamتیم of expertsکارشناسان,
5
14000
4000
برای همین تیمی از متخصصان تشکیل دادیم،
00:33
spanningپوشیدن Harvardهاروارد, MITMIT,
6
18000
2000
از هاروارد و ام آی تی گرفته
00:35
The Americanآمریکایی Heritageمیراث Dictionaryفرهنگ لغت, The Encyclopediaدایره المعارف Britannicaبریتانیکا
7
20000
3000
تا دیکشنری امریکن هریتیج، دایره المعارف بریتانیکا
00:38
and even our proudمغرور sponsorsحامیان مالی,
8
23000
2000
و حتی حامی مالی عظیممان،
00:40
the Googleگوگل.
9
25000
3000
گوگل.
00:43
And we cogitatedcogitated about this
10
28000
2000
و در حدود 4 سال
00:45
for about fourچهار yearsسالها.
11
30000
2000
در مورد آن فکر کردیم.
00:47
And we cameآمد to a startlingهیجان انگیز conclusionنتیجه.
12
32000
5000
و به نتیجه تکان دهنده ایی رسیدیم.
00:52
Ladiesخانم ها and gentlemenآقایان, a pictureعکس is not worthارزش a thousandهزار wordsکلمات.
13
37000
3000
خانمها و آقایان تصویر به اندازه هزاران کلمه ارزش ندارد.
00:55
In factواقعیت, we foundپیدا شد some picturesتصاویر
14
40000
2000
در حقیقت تصاویری پیدا کردیم که
00:57
that are worthارزش 500 billionبیلیون wordsکلمات.
15
42000
5000
500 میلیون کلمه ارزش داشتند.
01:02
Jean-Baptisteژان باپتیست Michelمیشل: So how did we get to this conclusionنتیجه?
16
47000
2000
ژان باپتیست میشل: چگونه به این نتیجه رسیدیم؟
01:04
So Erezاریز and I were thinkingفكر كردن about waysراه ها
17
49000
2000
من و اروز به روشهایی فکر می کردیم تا
01:06
to get a bigبزرگ pictureعکس of humanانسان cultureفرهنگ
18
51000
2000
به تصویر بزرگی از فرهنگ و تاریخ انسان
01:08
and humanانسان historyتاریخ: changeتغییر دادن over time.
19
53000
3000
دست یابیم: تغییر در طول زمان.
01:11
So manyبسیاری booksکتاب ها actuallyدر واقع have been writtenنوشته شده است over the yearsسالها.
20
56000
2000
کتابهایی زیادی در طول تاریخ نوشته شده است.
01:13
So we were thinkingفكر كردن, well the bestبهترین way to learnیاد گرفتن from them
21
58000
2000
فکر کردیم بهترین راه آموختن از آنها
01:15
is to readخواندن all of these millionsمیلیون ها نفر of booksکتاب ها.
22
60000
2000
خواندن تمام این چند میلیون کتاب است.
01:17
Now of courseدوره, if there's a scaleمقیاس for how awesomeعالی that is,
23
62000
3000
البته اگه مقیاسی باشد که بتوان بزرگی آنرا اندازه گرفت،
01:20
that has to rankرتبه بندی extremelyفوق العاده, extremelyفوق العاده highبالا.
24
65000
3000
بی نهایت، بی نهایت زیاد است.
01:23
Now the problemمسئله is there's an X-axisمحور X for that,
25
68000
2000
مشکل این بود که یک محور ایکس وجود دارد،
01:25
whichکه is the practicalکاربردی axisمحور.
26
70000
2000
و آن محور کاربردی است.
01:27
This is very, very lowکم.
27
72000
2000
که بسیار، بسیار پایین است.
01:29
(Applauseتشویق و تمجید)
28
74000
3000
(تشویق)
01:32
Now people tendگرایش داشتن to use an alternativeجایگزین approachرویکرد,
29
77000
3000
امروزه مردم از یک روش جایگزین استفاده میکنند،
01:35
whichکه is to take a fewتعداد کمی sourcesمنابع and readخواندن them very carefullyبا دقت.
30
80000
2000
چند منبع تهیه می کنند وآنرا با دقت می خوانند.
01:37
This is extremelyفوق العاده practicalکاربردی, but not so awesomeعالی.
31
82000
2000
کاملا عملی است اما چندان عالی نیست.
01:39
What you really want to do
32
84000
3000
کاری که می خواهید کنید این است که
01:42
is to get to the awesomeعالی yetهنوز practicalکاربردی partبخشی of this spaceفضا.
33
87000
3000
بهترین و در عین حال عملی ترین نتیجه را از این فضا بدست بیاورید.
01:45
So it turnsچرخش out there was a companyشرکت acrossدر سراسر the riverرودخانه calledبه نام Googleگوگل
34
90000
3000
معلوم شد شرکتی آنطرف رودخانه وجود دارد بنام گوگل
01:48
who had startedآغاز شده a digitizationدیجیتال سازی projectپروژه a fewتعداد کمی yearsسالها back
35
93000
2000
که از سالها پیش یک پروژه دیجیتالی کردن را شروع کرده
01:50
that mightممکن just enableفعال کردن this approachرویکرد.
36
95000
2000
که ممکن است این رویکرد را ممکن سازد.
01:52
They have digitizedدیجیتال شده millionsمیلیون ها نفر of booksکتاب ها.
37
97000
2000
میلیونها کتاب را دیجیتالی کرده اند.
01:54
So what that meansبه معنای is, one could use computationalمحاسباتی methodsمواد و روش ها
38
99000
3000
یعنی اینکه یکنفر می تواند با روشهای محاسباتی
01:57
to readخواندن all of the booksکتاب ها in a clickکلیک of a buttonدکمه.
39
102000
2000
همه کتابها را به یک کلیک بخواند.
01:59
That's very practicalکاربردی and extremelyفوق العاده awesomeعالی.
40
104000
3000
بسیار عملی و عالی است.
02:03
ELAELA: Let me tell you a little bitبیت about where booksکتاب ها come from.
41
108000
2000
الا: اجازه دهید توضیح دهم این کتابها از کجا می آیند.
02:05
Sinceاز آنجا که time immemorialقدیم, there have been authorsنویسندگان.
42
110000
3000
از زمانهای قدیم کسانی بودن که نویسنده بودند.
02:08
These authorsنویسندگان have been strivingتلاش to writeنوشتن booksکتاب ها.
43
113000
3000
این نویسندگان شیفته نوشتن کتاب بودند.
02:11
And this becameتبدیل شد considerablyبطور قابل توجهی easierآسان تر
44
116000
2000
و این کار با توسعه فرایند چاپ
02:13
with the developmentتوسعه of the printingچاپ pressمطبوعات some centuriesقرن ها agoپیش.
45
118000
2000
از قرنها پیش آسانتر شد.
02:15
Sinceاز آنجا که then, the authorsنویسندگان have wonبرنده شد
46
120000
3000
از آن به بعد نویسندگان
02:18
on 129 millionمیلیون distinctمتمایز occasionsموارد,
47
123000
2000
129 میلیون کتاب در موضوعات مختلف را
02:20
publishingانتشارات booksکتاب ها.
48
125000
2000
منتشر کردند.
02:22
Now if those booksکتاب ها are not lostکم شده to historyتاریخ,
49
127000
2000
اگر این کتابها در تاریخ گم نمی شدند،
02:24
then they are somewhereجایی in a libraryکتابخانه,
50
129000
2000
جایی در کتابخانه بودند،
02:26
and manyبسیاری of those booksکتاب ها have been gettingگرفتن retrievedبازیابی from the librariesکتابخانه ها
51
131000
3000
و بسیاری از این کتابها از کتابخانه ها جمع آوری شدند
02:29
and digitizedدیجیتال شده by Googleگوگل,
52
134000
2000
و توسط گوگل دیجیتالی شدند،
02:31
whichکه has scannedاسکن شده 15 millionمیلیون booksکتاب ها to dateتاریخ.
53
136000
2000
که تا کنون 15 میلیون کتاب را اسکن کرده است.
02:33
Now when Googleگوگل digitizesدیجیتالی کردن a bookکتاب, they put it into a really niceخوب formatفرمت.
54
138000
3000
وقتی گوگل کتاب را اسکن می کند آنرا به فرمت جالبی در می آورد.
02:36
Now we'veما هستیم got the dataداده ها, plusبه علاوه we have metadataابرداده.
55
141000
2000
علاوه بر اطلاعات اصلی، اطلاعات جنبی را هم داریم.
02:38
We have informationاطلاعات about things like where was it publishedمنتشر شده,
56
143000
3000
ما اطلاعاتی راجع به اینکه مثلا کجا این کتاب منتشر شده است،
02:41
who was the authorنویسنده, when was it publishedمنتشر شده.
57
146000
2000
نویسنده کتاب کی بوده و چه وقت نوشته شده داریم.
02:43
And what we do is go throughاز طریق all of those recordsسوابق
58
148000
3000
و کاری که ما باید بکنیم این است که همه این رکوردها را مرور کنیم
02:46
and excludeمحروم کردن everything that's not the highestبالاترین qualityکیفیت dataداده ها.
59
151000
4000
و هر چیزی که ارزش مناسب اطلاعاتی ندارد نادیده بگیریم.
02:50
What we're left with
60
155000
2000
چیزی که برای ما باقی ماند
02:52
is a collectionمجموعه of fiveپنج millionمیلیون booksکتاب ها,
61
157000
3000
مجموعه ای از پنج میلیون کتاب است،
02:55
500 billionبیلیون wordsکلمات,
62
160000
3000
500 میلیارد کلمه،
02:58
a stringرشته of charactersشخصیت ها a thousandهزار timesبار longerطولانی تر
63
163000
2000
رشته کاراکترهایی هزاران برابر بزرگتر از
03:00
than the humanانسان genomeژنوم --
64
165000
3000
ژنوم انسان--
03:03
a textمتن whichکه, when writtenنوشته شده است out,
65
168000
2000
متنی که اگر نوشته بشود،
03:05
would stretchکش آمدن from here to the Moonماه and back
66
170000
2000
10 برابر فاصله رفت و برگشت از اینجا تا ماه کشیده خواهد شد.
03:07
10 timesبار over --
67
172000
2000
10 برابر فاصله رفت و برگشت از اینجا تا ماه کشیده خواهد شد.
03:09
a veritableواقعی shardشاد of our culturalفرهنگی genomeژنوم.
68
174000
4000
پاره حقیقتی از ژنوم فرهنگی ما.
03:13
Of courseدوره what we did
69
178000
2000
البته ما وقتی با چنین
03:15
when facedدر مواجهه with suchچنین outrageousظالمانه hyperboleهیپربول ...
70
180000
3000
حجم بی نهایت بزرگی مواجه شدیم...
03:18
(Laughterخنده)
71
183000
2000
(خنده حضار)
03:20
was what any self-respectingاحترام به خود researchersمحققان
72
185000
3000
کاری کردیم که هر محقق قابل احترامی
03:23
would have doneانجام شده.
73
188000
3000
انجام می داد.
03:26
We tookگرفت a pageصفحه out of XKCDXKCD,
74
191000
2000
صفحه ای از XKCD خارج کردیم و
03:28
and we said, "Standایستادن back.
75
193000
2000
گفتیم، "کنار باستید. ما روش میخواهیم روش علمی رو امتحان کنیم."
03:30
We're going to try scienceعلوم پایه."
76
195000
2000
گفتیم، "کنار باستید. ما روش میخواهیم روش علمی رو امتحان کنیم."
03:32
(Laughterخنده)
77
197000
2000
(خنده حضار)
03:34
JMJM: Now of courseدوره, we were thinkingفكر كردن,
78
199000
2000
جی ام: در آن زمان فکر می کردیم،
03:36
well let's just first put the dataداده ها out there
79
201000
2000
بسیار خوب، بیایید اطلاعات را در دسترس افرادی قرار دهیم
03:38
for people to do scienceعلوم پایه to it.
80
203000
2000
که با آن کار علمی می کنند.
03:40
Now we're thinkingفكر كردن, what dataداده ها can we releaseرهایی?
81
205000
2000
و فکر کردیم چه نوع اطلاعاتی میتوانیم ارائه کنیم؟
03:42
Well of courseدوره, you want to take the booksکتاب ها
82
207000
2000
البته می خواهید که
03:44
and releaseرهایی the fullپر شده textمتن of these fiveپنج millionمیلیون booksکتاب ها.
83
209000
2000
تمام متن این پنج میلیون کتاب را استخراج کنید.
03:46
Now Googleگوگل, and Jonجون OrwantOrwant in particularخاص,
84
211000
2000
اکنون گوگل و به ویژه اورانت،
03:48
told us a little equationمعادله that we should learnیاد گرفتن.
85
213000
2000
به ما معادله کوچکی گفتند که باید یاد بگیریم.
03:50
So you have fiveپنج millionمیلیون, that is, fiveپنج millionمیلیون authorsنویسندگان
86
215000
3000
ازآنجایی که 5 میلیون کتاب داریم پس 5 میلیون نویسنده داریم
03:53
and fiveپنج millionمیلیون plaintiffsشاکیان is a massiveعظیم lawsuitطرح دعوی در دادگاه.
87
218000
3000
و 5 میلیون شاکی که دعوای دادگاهی عظیمی است.
03:56
So, althoughبا اينكه that would be really, really awesomeعالی,
88
221000
2000
اگرچه بسیار بسیار عجیب است،
03:58
again, that's extremelyفوق العاده, extremelyفوق العاده impracticalغیر عملی است.
89
223000
3000
خیلی خیلی غیرممکن است.
04:01
(Laughterخنده)
90
226000
2000
(خنده حضار)
04:03
Now again, we kindنوع of cavedحفره in,
91
228000
2000
ما کاوش کردیم،
04:05
and we did the very practicalکاربردی approachرویکرد, whichکه was a bitبیت lessکمتر awesomeعالی.
92
230000
3000
و ما روش خیلی کاربردی ای را انجام دادیم، که کمتر جالب بود.
04:08
We said, well insteadبجای of releasingآزادی the fullپر شده textمتن,
93
233000
2000
گفتیم بجای انتشار متن کلی کتاب،
04:10
we're going to releaseرهایی statisticsآمار about the booksکتاب ها.
94
235000
2000
ما میخواهیم اطلاعات آماری راجع به کتابها منتشر کنیم.
04:12
So take for instanceنمونه "A gleamسوسو زدن of happinessشادی."
95
237000
2000
مثلا کتاب "بارقه ای از امید" را برای مثال در نظر بگیرید
04:14
It's fourچهار wordsکلمات; we call that a four-gramچهار گرم.
96
239000
2000
که چهار کلمه است، آنرا 4 تایی نامیدیم.
04:16
We're going to tell you how manyبسیاری timesبار a particularخاص four-gramچهار گرم
97
241000
2000
به شما خواهیم گفت چندبار یک چهارتایی خاص
04:18
appearedظاهر شد in booksکتاب ها in 1801, 1802, 1803,
98
243000
2000
در سالهای1801، 1802، 1803
04:20
all the way up to 2008.
99
245000
2000
تا 2008 در کتابها بکار رفته.
04:22
That givesمی دهد us a time seriesسلسله
100
247000
2000
این روش به ما یک سری زمانی
04:24
of how frequentlyمکررا this particularخاص sentenceجمله was used over time.
101
249000
2000
از اینکه این جمله در طول زمان چقدر تکرار شده به ما می دهد.
04:26
We do that for all the wordsکلمات and phrasesعبارات that appearبه نظر می رسد in those booksکتاب ها,
102
251000
3000
این کار را برای تمام کلمات و عباراتی که در کتابها بکار رفته بود انجام دادیم،
04:29
and that givesمی دهد us a bigبزرگ tableجدول of two billionبیلیون linesخطوط
103
254000
3000
و جدولی به بزرگی 2 میلیارد خط داد
04:32
that tell us about the way cultureفرهنگ has been changingتغییر دادن.
104
257000
2000
که به ما نحوه تغییر فرهنگ را می گوید.
04:34
ELAELA: So those two billionبیلیون linesخطوط,
105
259000
2000
الا: از اینرو آن دو میلیارد خط،
04:36
we call them two billionبیلیون n-gramsn گرم.
106
261000
2000
را دومیلیارد ان-گرم می نامیم.
04:38
What do they tell us?
107
263000
2000
به ما چه می گویند؟
04:40
Well the individualفردی n-gramsn گرم measureاندازه گرفتن culturalفرهنگی trendsروند.
108
265000
2000
هر کدام از این ان-گرمها روند فرهنگی ما را می سنجند.
04:42
Let me give you an exampleمثال.
109
267000
2000
اجازه دهید مثالی بزنم.
04:44
Let's supposeفرض کنید that I am thrivingپر رونق,
110
269000
2000
فرض کنید من در حال پیشرفت هستم،
04:46
then tomorrowفردا I want to tell you about how well I did.
111
271000
2000
و فردا به شما خواهم گفت چقدر خوب کار کردم.
04:48
And so I mightممکن say, "Yesterdayدیروز, I throveسرگردان."
112
273000
3000
و ممکن است بگویم "دیروز من پیشرفتم"
04:51
Alternativelyمتناوبا، از سوی دیگر, I could say, "Yesterdayدیروز, I thrivedپر رونق گرفت."
113
276000
3000
همچنین، می توانیم بگویم، دیروز پیشرفت کردم"
04:54
Well whichکه one should I use?
114
279000
3000
کدام را باید بکار ببرم؟
04:57
How to know?
115
282000
2000
چطوری بفهمم؟
04:59
As of about sixشش monthsماه ها agoپیش,
116
284000
2000
حدود شش ماه پیش،
05:01
the stateحالت of the artهنر in this fieldرشته
117
286000
2000
بهترین کار در این زمینه
05:03
is that you would, for instanceنمونه,
118
288000
2000
اینطور بود که مثلا با موهای عجیب
05:05
go up to the followingذیل psychologistروانشناس with fabulousشگفت آور hairمو,
119
290000
2000
پیش روانشناس بروید
05:07
and you'dمی خواهی say,
120
292000
2000
و بگویید،
05:09
"Steveاستیو, you're an expertکارشناس on the irregularبی رویه verbsفعل ها.
121
294000
3000
استیو، تو متخصص افعال بی قاعده ایی.
05:12
What should I do?"
122
297000
2000
چکار کنم؟
05:14
And he'dاو می خواهد tell you, "Well mostاکثر people say thrivedپر رونق گرفت,
123
299000
2000
و او به شما می گفت، خوب اغلب مردم می گویند پیشرفت کردم،
05:16
but some people say throveسرگردان."
124
301000
3000
اما بعضی ها می گویند پیشرفتم.
05:19
And you alsoهمچنین knewمی دانست, more or lessکمتر,
125
304000
2000
و کم و بیش می دانید،
05:21
that if you were to go back in time 200 yearsسالها
126
306000
3000
که اگر به 200 سال پیش برگردید
05:24
and askپرسیدن the followingذیل statesmanدولتمرد with equallyبه همان اندازه fabulousشگفت آور hairمو,
127
309000
3000
و این جمله را با موهای عجیب بپرسید،
05:27
(Laughterخنده)
128
312000
3000
(خنده حضار)
05:30
"Tomتام, what should I say?"
129
315000
2000
"تام، چی باید بگم؟"
05:32
He'dاو می خواهد say, "Well, in my day, mostاکثر people throveسرگردان,
130
317000
2000
می گفت ، "خوب در روزگار من مردم پیش میرفتند،
05:34
but some thrivedپر رونق گرفت."
131
319000
3000
اما بعضی ها پیشرفت میکردند"
05:37
So now what I'm just going to showنشان بده you is rawخام dataداده ها.
132
322000
2000
چیزی که به شما نشان خواهم داد اطلاعات خام هستند.
05:39
Two rowsردیف from this tableجدول of two billionبیلیون entriesورودی های.
133
324000
4000
دو ردیف از این جدول دومیلیارد ردیفی.
05:43
What you're seeingدیدن is yearسال by yearسال frequencyفرکانس
134
328000
2000
چیزی که می بینید تکرار سال به سال
05:45
of "thrivedپر رونق گرفت" and "throveسرگردان" over time.
135
330000
3000
"پیشرفت کردن" و "پیشرفتن" در طول زمان است.
05:49
Now this is just two
136
334000
2000
و این تاره دو ردیف
05:51
out of two billionبیلیون rowsردیف.
137
336000
3000
از دو میلیارد ردیف است.
05:54
So the entireکل dataداده ها setتنظیم
138
339000
2000
بنابراین مجموعه کل اطلاعات
05:56
is a billionبیلیون timesبار more awesomeعالی than this slideاسلاید.
139
341000
3000
یک میلیارد بار شگفت انگیز تر از این اسلاید است.
05:59
(Laughterخنده)
140
344000
2000
(خنده حضار)
06:01
(Applauseتشویق و تمجید)
141
346000
4000
(تشویق)
06:05
JMJM: Now there are manyبسیاری other picturesتصاویر that are worthارزش 500 billionبیلیون wordsکلمات.
142
350000
2000
جی ام: تصاویر دیگری هم وجود دارد که 500 میلیارد کلمه می ارزند.
06:07
For instanceنمونه, this one.
143
352000
2000
برای نمونه، این یکی.
06:09
If you just take influenzaآنفلوآنزا,
144
354000
2000
اگر آنفولانزا را در نظر بگیرید،
06:11
you will see peaksقله ها at the time where you knewمی دانست
145
356000
2000
شما میتوانید در زمان هایی که میدانید آنفولانزا
06:13
bigبزرگ fluآنفلوآنزا epidemicsاپیدمی were killingکشتن people around the globeجهان.
146
358000
3000
جان مردم زیادی را در سراسر جهان گرفته، اوج هایی مشاهده کنید.
06:16
ELAELA: If you were not yetهنوز convincedمتقاعد,
147
361000
3000
الا: اگر هنور متقاعد نشدید،
06:19
seaدریا levelsسطوح are risingرو به افزایش,
148
364000
2000
سطح دریاها در حال افزایش هستند،
06:21
so is atmosphericاتمسفر COCO2 and globalجهانی است temperatureدرجه حرارت.
149
366000
3000
همینطور دی اسید کربن و گرمای زمین.
06:24
JMJM: You mightممکن alsoهمچنین want to have a look at this particularخاص n-gramn-gram,
150
369000
3000
جی ام: شاید بخواهید به این ان-گرم خاص نگاهی بیاندازید،
06:27
and that's to tell Nietzscheنیچه that God is not deadمرده,
151
372000
3000
که به نیچه می گوید خدا نمرده،
06:30
althoughبا اينكه you mightممکن agreeموافق that he mightممکن need a better publicistخبرنگار.
152
375000
3000
اگرچه شاید موافق باشید که به تبلیغ کننده بهتری نیاز دارد.
06:33
(Laughterخنده)
153
378000
2000
(خنده حضار)
06:35
ELAELA: You can get at some prettyبسیار abstractچکیده conceptsمفاهیم with this sortمرتب سازی of thing.
154
380000
3000
الا: می توانید مفاهیم انتزاعی زیبایی با اینگونه چیزها بدست آورید.
06:38
For instanceنمونه, let me tell you the historyتاریخ
155
383000
2000
برای نمونه بذارید براتون تاریخ
06:40
of the yearسال 1950.
156
385000
2000
سال 1950 را بگم.
06:42
Prettyبسیار much for the vastعظیم majorityاکثریت of historyتاریخ,
157
387000
2000
اکثر عمده تاریخ،
06:44
no one gaveداد a damnلعنت about 1950.
158
389000
2000
کسی به 1950 توجهی نمی کند.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
در سال 1700، در 1800 در 1900،
06:48
no one caredمراقب باشید.
160
393000
3000
هیچکس اهمیت نداد.
06:52
Throughاز طریق the 30s and 40s,
161
397000
2000
از دهه 30 و 40،
06:54
no one caredمراقب باشید.
162
399000
2000
هیچکس اهمیت نداد.
06:56
Suddenlyناگهان, in the mid-اواسط40s,
163
401000
2000
ناگهان در اواسط دهه 40،
06:58
there startedآغاز شده to be a buzzوزوز.
164
403000
2000
یه صدایی شروع شد.
07:00
People realizedمتوجه شدم that 1950 was going to happenبه وقوع پیوستن,
165
405000
2000
مردم متوجه شدند که سال 1950 داره میرسه،
07:02
and it could be bigبزرگ.
166
407000
2000
و این می تونه اتفاق خیلی بزرگی باشه.
07:04
(Laughterخنده)
167
409000
3000
(خنده حضار)
07:07
But nothing got people interestedعلاقه مند in 1950
168
412000
3000
اما هیچی چیز 1950 برای مردم جذاب نبود
07:10
like the yearسال 1950.
169
415000
3000
همانند سال 1950.
07:13
(Laughterخنده)
170
418000
3000
(خنده حضار)
07:16
People were walkingپیاده روی around obsessedغرق.
171
421000
2000
مردم با وسواس به این طرف و آنطرف می رفتند.
07:18
They couldn'tنمی توانستم stop talkingصحبت کردن
172
423000
2000
نمی تونستند جلوی صحبت کردنشان را بگیرند
07:20
about all the things they did in 1950,
173
425000
3000
درباره کارهایی که در سال 1950 انجام داده بودند،
07:23
all the things they were planningبرنامه ریزی to do in 1950,
174
428000
3000
و چیزهایی که قصد داشتند در سال 1950 انجام دهند،
07:26
all the dreamsرویاها of what they wanted to accomplishانجام دادن in 1950.
175
431000
5000
تمام ارزوهایی که می خواستند در سال 1950 برآورده کنند.
07:31
In factواقعیت, 1950 was so fascinatingشگفت انگیز
176
436000
2000
در حقیقت، سال 1950 چنان جذاب بود
07:33
that for yearsسالها thereafterبعد از آن,
177
438000
2000
که سالها بعد از آن،
07:35
people just keptنگه داشته شد talkingصحبت کردن about all the amazingحیرت آور things that happenedاتفاق افتاد,
178
440000
3000
مردم فقط به صحبت در مورد تمام اتفاقاتی که افتاده بود صحبت کردند،
07:38
in '51, '52, '53.
179
443000
2000
در 51، 52، 53.
07:40
Finallyسرانجام in 1954,
180
445000
2000
و در سرانجام در 1954،
07:42
someoneکسی wokeبیدار شدم up and realizedمتوجه شدم
181
447000
2000
یکی فهمید که
07:44
that 1950 had gottenدریافت کردم somewhatتاحدی passعبورé.
182
449000
4000
سال 1950 تمام شده.
07:48
(Laughterخنده)
183
453000
2000
(خنده حضار)
07:50
And just like that, the bubbleحباب burstپشت سر هم.
184
455000
2000
و اینگونه، حباب ترکید.
07:52
(Laughterخنده)
185
457000
2000
(خنده حضار)
07:54
And the storyداستان of 1950
186
459000
2000
و داستان 1950
07:56
is the storyداستان of everyهرکدام yearسال that we have on recordرکورد,
187
461000
2000
داستان هرسالی است که ثبت می کنیم،
07:58
with a little twistپیچ, because now we'veما هستیم got these niceخوب chartsنمودار.
188
463000
3000
با کمی تغییر چون ما این جدول های زیبا را داریم.
08:01
And because we have these niceخوب chartsنمودار, we can measureاندازه گرفتن things.
189
466000
3000
و چون این جدولهای زیبا را داریم، می توانیم اتفاقات را اندازه گیری کنیم.
08:04
We can say, "Well how fastسریع does the bubbleحباب burstپشت سر هم?"
190
469000
2000
می توانم بگویم، "با چه سرعتی حباب ترکید؟"
08:06
And it turnsچرخش out that we can measureاندازه گرفتن that very preciselyدقیقا.
191
471000
3000
و مشخص شد که می توانیم آنرا با دقت اندازه گیری کنیم.
08:09
Equationsمعادلات were derivedنشات گرفته, graphsنمودارها were producedتولید شده,
192
474000
3000
معادلات بدست آمد و گراف ها رسم شد،
08:12
and the netخالص resultنتيجه
193
477000
2000
و نتیجه نهایی
08:14
is that we find that the bubbleحباب burstsانفجار fasterسریعتر and fasterسریعتر
194
479000
3000
چیزی شد که فهمیدیم حباب سریعتر و سریعتر می ترکد
08:17
with eachهر یک passingگذراندن yearسال.
195
482000
2000
هر سالی که می گذرد.
08:19
We are losingاز دست دادن interestعلاقه in the pastگذشته more rapidlyبه سرعت در حال.
196
484000
5000
علاقه خود را به گذشته با سرعت بیشتری از دست می دهیم.
08:24
JMJM: Now a little pieceقطعه of careerحرفه adviceمشاوره.
197
489000
2000
جی ام: اکنون کمی نصیحت شغلی.
08:26
So for those of you who seekبه دنبال to be famousمشهور,
198
491000
2000
آنهایی که به دنبال شهرت هستند،
08:28
we can learnیاد گرفتن from the 25 mostاکثر famousمشهور politicalسیاسی figuresارقام,
199
493000
2000
می توانیم از 25 شخصیت مشهور سیاسی یادبگیریم،
08:30
authorsنویسندگان, actorsبازیگران and so on.
200
495000
2000
نویسندگان، هنرپیشه ها و غیره.
08:32
So if you want to becomeتبدیل شدن به famousمشهور earlyزود on, you should be an actorبازیگر,
201
497000
3000
اگر می خواهید خیلی زود مشهور بشید باید هنرپیشه شوید،
08:35
because then fameشهرت startsشروع می شود risingرو به افزایش by the endپایان of your 20s --
202
500000
2000
چون شهرت از پایان دهه 20 شما شروع می شود--
08:37
you're still youngجوان, it's really great.
203
502000
2000
هنوز جوان هستید و این خیلی عالیه.
08:39
Now if you can wait a little bitبیت, you should be an authorنویسنده,
204
504000
2000
اگر کمی صبر داشته باشید باید نویسنده شوید،
08:41
because then you riseبالا آمدن to very great heightsارتفاعات,
205
506000
2000
چون به جاهای بالایی خواهید رسید،
08:43
like Markعلامت Twainتواین, for instanceنمونه: extremelyفوق العاده famousمشهور.
206
508000
2000
مانند مارک تواین بسیار مشهور.
08:45
But if you want to reachنائل شدن the very topبالا,
207
510000
2000
اما اگر می خواهید به جای بالا برسید،
08:47
you should delayتاخیر انداختن gratificationلذت بردن
208
512000
2000
باید لذت را به تاخیر بیاندازید
08:49
and, of courseدوره, becomeتبدیل شدن به a politicianسیاستمدار.
209
514000
2000
و البته سیاستمدار شوید.
08:51
So here you will becomeتبدیل شدن به famousمشهور by the endپایان of your 50s,
210
516000
2000
و اینجاست که تا پایان دهه 50 زندگی خود مشهور می شوید،
08:53
and becomeتبدیل شدن به very, very famousمشهور afterwardپس از آن.
211
518000
2000
و بعد از آن بسیار بسیار مشهور خواهید شد.
08:55
So scientistsدانشمندان alsoهمچنین tendگرایش داشتن to get famousمشهور when they're much olderمسن تر.
212
520000
3000
دانشمندان هم وقتی مسن تر شدن مشهور می شوند.
08:58
Like for instanceنمونه, biologistsزیست شناسان and physicsفیزیک
213
523000
2000
مانند بیولوژیست ها و فیزیکدانها
09:00
tendگرایش داشتن to be almostتقریبا as famousمشهور as actorsبازیگران.
214
525000
2000
تقریبا به اندازه هنرپیشه ها مشهورند.
09:02
One mistakeاشتباه you should not do is becomeتبدیل شدن به a mathematicianریاضیدان.
215
527000
3000
نباید اشتباه کنید و ریاضی دان شوید.
09:05
(Laughterخنده)
216
530000
2000
(خنده حضار)
09:07
If you do that,
217
532000
2000
اگر اینکار را کنید،
09:09
you mightممکن think, "Oh great. I'm going to do my bestبهترین work when I'm in my 20s."
218
534000
3000
ممکن است فکر کنید "عالیه، من وقتی 20 سالم شد بهترین کارم را ارائه می کنم"
09:12
But guessحدس بزن what, nobodyهيچ كس will really careاهميت دادن.
219
537000
2000
اما می توانید حدس بزنید، هیچکسی توجهی نخواهد کرد.
09:14
(Laughterخنده)
220
539000
3000
(خده حضار)
09:17
ELAELA: There are more soberingخفیف notesیادداشت
221
542000
2000
بیشتر نوشته های
09:19
amongدر میان the n-gramsn گرم.
222
544000
2000
ان-گرم جدی هستند.
09:21
For instanceنمونه, here'sاینجاست the trajectoryمسیر of Marcمارک Chagallچگال,
223
546000
2000
مثلا این خط سیر مارک شاگال است،
09:23
an artistهنرمند bornبدنیا آمدن in 1887.
224
548000
2000
هنرمندی که در سال 1887 بدنیا آمد.
09:25
And this looksبه نظر می رسد like the normalطبیعی trajectoryمسیر of a famousمشهور personفرد.
225
550000
3000
همانند مسیر رایج یک شخص مشهور به نظر می رسد.
09:28
He getsمی شود more and more and more famousمشهور,
226
553000
4000
او مشهورتر، مشهورتر و مشهورتر می شود،
09:32
exceptبجز if you look in Germanآلمانی.
227
557000
2000
بجز وقتی به آلمان نگاه کنید.
09:34
If you look in Germanآلمانی, you see something completelyبه صورت کامل bizarreعجیب و غریب,
228
559000
2000
اگر به آلمان نگاه کنید چیز کاملا عجیبی می بینید،
09:36
something you prettyبسیار much never see,
229
561000
2000
چیزی که تا حالا هرگز ندیدید،
09:38
whichکه is he becomesتبدیل می شود extremelyفوق العاده famousمشهور
230
563000
2000
اینکه بسیار مشهور می شود
09:40
and then all of a suddenناگهانی plummetsپرتقال,
231
565000
2000
و ناگهان سقوط می کند،
09:42
going throughاز طریق a nadirنادیر betweenبین 1933 and 1945,
232
567000
3000
و بین سالهای 1933 و 1945 می بینیم که در پایین ترین سطح قرار دارد،
09:45
before reboundingبازخوانی afterwardپس از آن.
233
570000
3000
قبل از اینکه دوباره شروع به بدست آوردن محبوبیت کند.
09:48
And of courseدوره, what we're seeingدیدن
234
573000
2000
البته چیزی که می بینیم
09:50
is the factواقعیت Marcمارک Chagallچگال was a Jewishیهودی artistهنرمند
235
575000
3000
این است که مارک شاگال یک هنرمند یهودی بود
09:53
in Naziنازی ها Germanyآلمان.
236
578000
2000
در آلمان نازی.
09:55
Now these signalsسیگنال ها
237
580000
2000
اکنون این علائم
09:57
are actuallyدر واقع so strongقوی
238
582000
2000
چنان قوی هستند که
09:59
that we don't need to know that someoneکسی was censoredسانسور شده.
239
584000
3000
که لازم نیست بدانیم کسی سانسور شده است.
10:02
We can actuallyدر واقع figureشکل it out
240
587000
2000
می توانیم به آن پی ببریم
10:04
usingاستفاده كردن really basicپایه ای signalسیگنال processingدر حال پردازش.
241
589000
2000
معمولا با استفاده از فرآیند سیگنال ساده.
10:06
Here'sاینجاست a simpleساده way to do it.
242
591000
2000
یک راه ساده آن اینجاست.
10:08
Well, a reasonableمعقول expectationانتظار
243
593000
2000
خوب، یک انتظار معقول
10:10
is that somebody'sکسی هست fameشهرت in a givenداده شده periodدوره زمانی of time
244
595000
2000
اینکه شهرت فردی در یک دوره زمانی
10:12
should be roughlyتقریبا the averageمیانگین of theirخودشان fameشهرت before
245
597000
2000
باید تقریبا به اندازه میانگین شهرتش در گذشته
10:14
and theirخودشان fameشهرت after.
246
599000
2000
و بعد از آن مدت باشد.
10:16
So that's sortمرتب سازی of what we expectانتظار.
247
601000
2000
و این چیزی است که انتظار داریم.
10:18
And we compareمقايسه كردن that to the fameشهرت that we observeمشاهده کنید.
248
603000
3000
و آنرا با شهرتی که می بینیم مقایسه می کنیم.
10:21
And we just divideتقسیم کنید one by the other
249
606000
2000
و فقط یکی را بر دیگری تقسیم می کنیم
10:23
to produceتولید کردن something we call a suppressionسرکوب indexشاخص.
250
608000
2000
تا چیزی ایجاد کنیم که آنرا شاخص سرکوب می نامیم.
10:25
If the suppressionسرکوب indexشاخص is very, very, very smallکوچک,
251
610000
3000
اگر شاخص سرکوب خیلی، خیلی، خیلی کوچک باشد،
10:28
then you very well mightممکن be beingبودن suppressedسرکوب.
252
613000
2000
ممکن است به راحتی سرکوب شده باشید.
10:30
If it's very largeبزرگ, maybe you're benefitingبهره مند شدن from propagandaتبلیغاتی.
253
615000
3000
اگر بزرگ باشد، شاید از پروپاگاندا ذی نفع هستید.
10:34
JMJM: Now you can actuallyدر واقع look at
254
619000
2000
جی ام: اکنون می توانید شاخص های
10:36
the distributionتوزیع of suppressionسرکوب indexesشاخص ها over wholeکل populationsجمعیت ها.
255
621000
3000
توزیع سرکوب در کل جمعیت را ببینید.
10:39
So for instanceنمونه, here --
256
624000
2000
برای نمونه، اینجا --
10:41
this suppressionسرکوب indexشاخص is for 5,000 people
257
626000
2000
این شاخص سرکوب برای 5000 نفر است
10:43
pickedبرداشت in Englishانگلیسی booksکتاب ها where there's no knownشناخته شده suppressionسرکوب --
258
628000
2000
از کتابهای انگلیسی انتخاب شده اند جایی که سرکوب مشهودی وجود ندارد--
10:45
it would be like this, basicallyاساسا tightlyمحکم centeredمرکزی on one.
259
630000
2000
شبیه این خواهد بود، اساسا محکم روی کسی متمرکز است.
10:47
What you expectانتظار is basicallyاساسا what you observeمشاهده کنید.
260
632000
2000
چیزی که انتظار دارید چیزی است که می بینید.
10:49
This is distributionتوزیع as seenمشاهده گردید in Germanyآلمان --
261
634000
2000
این توزیعی است که در آلمان دیده می شود--
10:51
very differentناهمسان, it's shiftedتغییر یافته است to the left.
262
636000
2000
خیلی متفاوت، به سمت چپ متمایل است.
10:53
People talkedصحبت کرد about it twiceدو برابر lessکمتر as it should have been.
263
638000
3000
مردم دوبرابر از آنچه که باید کمتر صحبت می کنند.
10:56
But much more importantlyمهم است, the distributionتوزیع is much widerگسترده تر.
264
641000
2000
اما چیزی که مهمتر است، توزیع وسیع تر است.
10:58
There are manyبسیاری people who endپایان up on the farدور left on this distributionتوزیع
265
643000
3000
مردم بسیاری هستند که در انتهای سمت چپ این توزیع هستند
11:01
who are talkedصحبت کرد about 10 timesبار fewerکمتر than they should have been.
266
646000
3000
مردمی که 10 بار کمتر از آنچه باید باشد کمتر صحبت می کنند.
11:04
But then alsoهمچنین manyبسیاری people on the farدور right
267
649000
2000
اما از طرف دیگر مردمی هستند
11:06
who seemبه نظر می رسد to benefitسود from propagandaتبلیغاتی.
268
651000
2000
از این پروپاگاندا ذی نفع هستند.
11:08
This pictureعکس is the hallmarkانگ of censorshipسانسور in the bookکتاب recordرکورد.
269
653000
3000
این تصویر نمایانگر سانسور در کتاب است.
11:11
ELAELA: So culturomicsفرهنگ
270
656000
2000
الا: کالترومیکس
11:13
is what we call this methodروش.
271
658000
2000
اسمی است که ما روی این متد گذاشته ایم.
11:15
It's kindنوع of like genomicsژنومیک.
272
660000
2000
نوعی ژن شناسی است.
11:17
Exceptبجز genomicsژنومیک is a lensلنز on biologyزیست شناسی
273
662000
2000
فرقشان این است که لنز ژنومیکس روی بیولوژی است
11:19
throughاز طریق the windowپنجره of the sequenceتوالی of basesپایگاه ها in the humanانسان genomeژنوم.
274
664000
3000
از پنجره ترتیب ژنوم انسانی.
11:22
Culturomicsکالترومیکس is similarمشابه.
275
667000
2000
کالترومیکس شبیه آن است.
11:24
It's the applicationکاربرد of massive-scaleمقیاس گسترده dataداده ها collectionمجموعه analysisتحلیل و بررسی
276
669000
3000
برنامه تحلیل اطلاعات در مقیاس عظیم است
11:27
to the studyمطالعه of humanانسان cultureفرهنگ.
277
672000
2000
برای مطالعه فرهنگ انسان.
11:29
Here, insteadبجای of throughاز طریق the lensلنز of a genomeژنوم,
278
674000
2000
اینجا، بجای نگاه از عدسی ژنوم،
11:31
throughاز طریق the lensلنز of digitizedدیجیتال شده piecesقطعات of the historicalتاریخی recordرکورد.
279
676000
3000
از لنزهای قطعات دیجیتالی شده ثبت تاریخی دیده می شود.
11:34
The great thing about culturomicsفرهنگ
280
679000
2000
نکته بزرگ در مورد کالترومیکس
11:36
is that everyoneهر کس can do it.
281
681000
2000
این است که هر کسی می تواند آنرا انجام دهد.
11:38
Why can everyoneهر کس do it?
282
683000
2000
چرا هر کسی می تواند انجام دهد؟
11:40
Everyoneهر کس can do it because threeسه guys,
283
685000
2000
هر کسی می تواند انجام دهد چون سه نفر
11:42
Jonجون OrwantOrwant, Mattمات Grayخاکستری and Will Brockmanبرکمن over at Googleگوگل,
284
687000
3000
جان اوروانت، مت گری و بیل بروکمن در گوگل،
11:45
saw the prototypeنمونه اولیه of the NgramNgram Viewerنمایشگر,
285
690000
2000
نمونه ای از بیینده انگرم را دیدند،
11:47
and they said, "This is so funسرگرم کننده.
286
692000
2000
و گفتند، " بسیار جالب است.
11:49
We have to make this availableدر دسترس است for people."
287
694000
3000
باید این را در دسترس مردم قرار دهیم."
11:52
So in two weeksهفته ها flatتخت -- the two weeksهفته ها before our paperکاغذ cameآمد out --
288
697000
2000
در عرض دو هفته - دو هفته قبل از اینکه مقاله ما منتشر شود --
11:54
they codedکدگذاری شده up a versionنسخه of the NgramNgram Viewerنمایشگر for the generalعمومی publicعمومی.
289
699000
3000
نسخه ای از بیننده انگرم را برای استفاده عمومی کدگذاری کردند.
11:57
And so you too can typeتایپ کنید in any wordکلمه or phraseعبارت that you're interestedعلاقه مند in
290
702000
3000
و شما می توانید هر کلمه یا عبارتی که دوست دارید را تایپ کنید
12:00
and see its n-gramn-gram immediatelyبلافاصله --
291
705000
2000
و ان-گرم آن را سریع پیدا کنید--
12:02
alsoهمچنین browseمرور کردن examplesمثال ها of all the variousمختلف booksکتاب ها
292
707000
2000
همچنین نمونه هایی از کتاب های مختلف را مرور کنید
12:04
in whichکه your n-gramn-gram appearsظاهر می شود.
293
709000
2000
در ان-گرم شما که ظاهر می شود.
12:06
JMJM: Now this was used over a millionمیلیون timesبار on the first day,
294
711000
2000
جی ام: در روز اول میلیون ها بار استفاده شد،
12:08
and this is really the bestبهترین of all the queriesنمایش ها.
295
713000
2000
و واقعا بهترین تمام جستجوهاست.
12:10
So people want to be theirخودشان bestبهترین, put theirخودشان bestبهترین footپا forwardرو به جلو.
296
715000
3000
مردم می خواهند بهترین باشند، با بهترین قدم شروع کنند.
12:13
But it turnsچرخش out in the 18thth centuryقرن, people didn't really careاهميت دادن about that at all.
297
718000
3000
اما در قرن 18 معلوم شد، مردم اصلا به آن توجهی نمی کردند.
12:16
They didn't want to be theirخودشان bestبهترین, they wanted to be theirخودشان beftسرقت.
298
721000
3000
نمی خواستند بهترین باشند، می خواستند به نفعشان باشد.
12:19
So what happenedاتفاق افتاد is, of courseدوره, this is just a mistakeاشتباه.
299
724000
3000
چه اتفاقی افتاد، البته، این کاملا اشتباه است.
12:22
It's not that stroveتلاش کرد for mediocrityمیانجیگری,
300
727000
2000
تلاش برای حد متوسط هم نبود،
12:24
it's just that the S used to be writtenنوشته شده است differentlyمتفاوت است, kindنوع of like an F.
301
729000
3000
فقط مانند متفاوت نوشتن S بود، یا چیزی شبیه F.
12:27
Now of courseدوره, Googleگوگل didn't pickانتخاب کنید this up at the time,
302
732000
3000
حالا البته که گوگل آنرا در آن زمان انتخاب نکرد،
12:30
so we reportedگزارش داد this in the scienceعلوم پایه articleمقاله that we wroteنوشت.
303
735000
3000
برای همین در مقاله علمی که نوشتیم آنرا گزارش کردیم.
12:33
But it turnsچرخش out this is just a reminderیادآور
304
738000
2000
معلوم شد فقط یادآوری است
12:35
that, althoughبا اينكه this is a lot of funسرگرم کننده,
305
740000
2000
اگرچه بسیار جالب است،
12:37
when you interpretتفسیر these graphsنمودارها, you have to be very carefulمراقب باشید,
306
742000
2000
وقتی این گرافها را تفسیر می کنید باید بسیار دقت کنید،
12:39
and you have to adoptاتخاذ کردن the baseپایه standardsاستانداردها in the sciencesعلوم.
307
744000
3000
و باید استانداردهای پایه را در علوم رعایت کنید.
12:42
ELAELA: People have been usingاستفاده كردن this for all kindsانواع of funسرگرم کننده purposesاهداف.
308
747000
3000
الا: مردم از این برای انواع مقاصد تفریحی استفاده کردند.
12:45
(Laughterخنده)
309
750000
7000
(خنده حضار)
12:52
Actuallyدر واقع, we're not going to have to talk,
310
757000
2000
در واقع، دیگر صحبت نخواهیم کرد،
12:54
we're just going to showنشان بده you all the slidesاسلایدها and remainماندن silentبی صدا.
311
759000
3000
به شما اسلایدها را نشان می دهیم و ساکت خواهیم ماند.
12:57
This personفرد was interestedعلاقه مند in the historyتاریخ of frustrationنا امیدی.
312
762000
3000
این شخص یه تاریخ افسردگی علاقمند است.
13:00
There's variousمختلف typesانواع of frustrationنا امیدی.
313
765000
3000
انواع نا امیدی وجود دارد.
13:03
If you stubخرد your toeپا, that's a one A "arghآره."
314
768000
3000
اگر انگشت شصت تون به جایی بخوره ، یک آ "آخ" است.
13:06
If the planetسیاره Earthزمین is annihilatedنابود شد by the VogonsVogons
315
771000
2000
اگر سیاره زمین توسط وگونها نابود بشه
13:08
to make roomاتاق for an interstellarدر میان ستارگان bypassمیان بر,
316
773000
2000
تا جایی برای عبور از ستاره ها باز بشه،
13:10
that's an eightهشت A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
8 تا آ"آآآآآآآآخ" است.
13:12
This personفرد studiesمطالعات all the "arghsاحمق,"
318
777000
2000
این شخص همه"آخ ها" را مطالعه کرده است.
13:14
from one throughاز طریق eightهشت A'sمانند.
319
779000
2000
از یک تا هشت آ.
13:16
And it turnsچرخش out
320
781000
2000
و متوجه شد
13:18
that the less-frequentکمتر مکرر "arghsاحمق"
321
783000
2000
"آخ" های کمتر رایجتر
13:20
are, of courseدوره, the onesآنهایی که that correspondمطابقت to things that are more frustratingخسته کننده، اذیت کننده --
322
785000
3000
آنهایی هستند که مربوط به چیزهای افسرده کننده است--
13:23
exceptبجز, oddlyعجیب و غریب, in the earlyزود 80s.
323
788000
3000
بجز، بطور عجیبی، در اوائل قرن 80.
13:26
We think that mightممکن have something to do with Reaganریگان.
324
791000
2000
ما فکر کردیم احتمال داره که این ربطی به ریگان داشته باشه.
13:28
(Laughterخنده)
325
793000
2000
(خنده حضار)
13:30
JMJM: There are manyبسیاری usagesکاربردهای of this dataداده ها,
326
795000
3000
جی ام: کاربردهای متعددی برای این اطلاعات وجود دارد،
13:33
but the bottomپایین lineخط is that the historicalتاریخی recordرکورد is beingبودن digitizedدیجیتال شده.
327
798000
3000
اما دلیل اصلی دیجیتالی کردن برای ثبت تاریخی است.
13:36
Googleگوگل has startedآغاز شده to digitizeدیجیتالی کردن 15 millionمیلیون booksکتاب ها.
328
801000
2000
گوگل دیجیتالی کردن 15 میلیون کتاب را شروع کرده است.
13:38
That's 12 percentدرصد of all the booksکتاب ها that have ever been publishedمنتشر شده.
329
803000
2000
12 درصد کتابهایی که منتشر شده است.
13:40
It's a sizableقابل توجه chunkتکه of humanانسان cultureفرهنگ.
330
805000
3000
بخش عظیمی از فرهنگ بشری است.
13:43
There's much more in cultureفرهنگ: there's manuscriptsنسخه های خطی, there newspapersروزنامه ها,
331
808000
3000
چیزهای فرهنگی بیشتری وجود دارد: دست نوشته ها، روزنامه ها،
13:46
there's things that are not textمتن, like artهنر and paintingsنقاشی.
332
811000
2000
چیزهایی که نوشتنی نیستند، مانند هنر و نقاشی.
13:48
These all happenبه وقوع پیوستن to be on our computersکامپیوترها,
333
813000
2000
همه اینها در کامپیوتر ما قرار دارند،
13:50
on computersکامپیوترها acrossدر سراسر the worldجهان.
334
815000
2000
در تمام کامپیوترهای سراسر دنیا.
13:52
And when that happensاتفاق می افتد, that will transformتبدیل the way we have
335
817000
3000
و وقتی اتفاق بیافتد، مسیری که داریم را تغییر خواهد داد
13:55
to understandفهمیدن our pastگذشته, our presentحاضر and humanانسان cultureفرهنگ.
336
820000
2000
تا گذشته و حال و فرهنگ بشری را بفهمیم.
13:57
Thank you very much.
337
822000
2000
بسیار سپاسگذارم.
13:59
(Applauseتشویق و تمجید)
338
824000
3000
(تشویق)
Translated by Mahdi Yaghoubi
Reviewed by Bidel Akbari

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com