ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

جين بابتيست ميكل + إيريز ليبرمان أيدن: ما تعلمناه من 5 ملايين كتاب

Filmed:
2,049,453 views

هل سبق لكم أن تسليتم بمشروع عارض ن-غرام في مختبرات غوغل؟ إنه أداة مسببة للإدمان تسمح لك بالبحث في الكلمات والأفكار في قاعدة بيانات 5 ملايين كتاب على مر القرون. يعرض إيريز ليبرمان إيدن وجان باتيست ميشال كيفية اشتغالها، وبعضا من الأمور المفاجئة التي يمكننا تعلمها من 500 مليار كلمة.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
Erezإيريز Liebermanليبرمان Aidenايدن: Everyoneكل واحد knowsيعرف
0
0
2000
إيريز ليبرمان ايدن: الجميع يعرف
00:17
that a pictureصورة is worthيستحق a thousandألف wordsكلمات.
1
2000
3000
أن الصورة تعادل الف كلمة.
00:22
But we at Harvardجامعة هارفارد
2
7000
2000
لكننا في هارفارد
00:24
were wonderingيتساءل if this was really trueصحيح.
3
9000
3000
تساءلنا ما إذا كان ذلك بالفعل صحيحا.
00:27
(Laughterضحك)
4
12000
2000
(ضحك)
00:29
So we assembledتجميعها a teamالفريق of expertsخبراء,
5
14000
4000
وبالتالي جمعنا فريقا من الخبراء،
00:33
spanningتمتد Harvardجامعة هارفارد, MITMIT,
6
18000
2000
يمتدون في هارفارد وMIT
00:35
The Americanأمريكي Heritageتراث Dictionaryقاموس, The Encyclopediaموسوعة Britannicaبريتانيكا
7
20000
3000
قاموس التراث الأمريكي، موسوعة بريتانيكا
00:38
and even our proudفخور sponsorsالرعاة,
8
23000
2000
وحتى رعاتنا الذين نفتخر بهم،
00:40
the Googleجوجل.
9
25000
3000
غوغل.
00:43
And we cogitatedcogitated about this
10
28000
2000
ودبرنا هذا
00:45
for about fourأربعة yearsسنوات.
11
30000
2000
لحوالي أربع سنوات.
00:47
And we cameأتى to a startlingمذهل conclusionاستنتاج.
12
32000
5000
ووصلنا إلى استنتاج مبدئي،
00:52
Ladiesسيدات and gentlemenالسادة الأفاضل, a pictureصورة is not worthيستحق a thousandألف wordsكلمات.
13
37000
3000
سيداتي سادتي، الصورة لا تعادل الف كلمة.
00:55
In factحقيقة, we foundوجدت some picturesالصور
14
40000
2000
في الحقيقة، وجدنا بعض الصور
00:57
that are worthيستحق 500 billionمليار wordsكلمات.
15
42000
5000
التي تقدر بأكثر من 500 مليار كلمة.
01:02
Jean-Baptisteجان باتيست Michelميشيل: So how did we get to this conclusionاستنتاج?
16
47000
2000
جان باتيست ميشال: إذن كيف وصلنا إلى هذا الاستنتاج؟
01:04
So Erezإيريز and I were thinkingتفكير about waysطرق
17
49000
2000
إذن أنا وإريز كنا نفكر في طرق
01:06
to get a bigكبير pictureصورة of humanبشري cultureحضاره
18
51000
2000
للحصول على صورة كبيرة للثقافة الإنسانية
01:08
and humanبشري historyالتاريخ: changeيتغيرون over time.
19
53000
3000
والتاريخ البشري: تغيرها عبر الزمن.
01:11
So manyكثير booksالكتب actuallyفعلا have been writtenمكتوب over the yearsسنوات.
20
56000
2000
وهكذا الكثير من الكتب تم تأليفها على مدى السنوات.
01:13
So we were thinkingتفكير, well the bestالأفضل way to learnتعلم from them
21
58000
2000
وبالتالي كنا نفكر، حسنا أفضل طريقة للاستفادة منها
01:15
is to readاقرأ all of these millionsملايين of booksالكتب.
22
60000
2000
هو قراءة كل هذه الملايين من الكتب.
01:17
Now of courseدورة, if there's a scaleمقياس for how awesomeرائع that is,
23
62000
3000
الآن بالطبع، إن كان هناك مقياس لمدى روعة ذلك،
01:20
that has to rankمرتبة extremelyجدا, extremelyجدا highمتوسط.
24
65000
3000
كان هذا ليصنف عاليا وعاليا للغاية.
01:23
Now the problemمشكلة is there's an X-axisX-محور for that,
25
68000
2000
الآن المشكل هو أن هناك محور أفاصيل لذلك،
01:25
whichالتي is the practicalعملي axisمحور.
26
70000
2000
والذي هو محور العملية.
01:27
This is very, very lowمنخفض.
27
72000
2000
هذا متدن متدن للغاية.
01:29
(Applauseتصفيق)
28
74000
3000
(تصفيق)
01:32
Now people tendتميل to use an alternativeلبديل approachمقاربة,
29
77000
3000
الآن الناس يميلون إلى استخدام مقاربة بديلة،
01:35
whichالتي is to take a fewقليل sourcesمصادر and readاقرأ them very carefullyبحرص.
30
80000
2000
والتي هي أخذ بضعة مصادر وقرائتها بعناية.
01:37
This is extremelyجدا practicalعملي, but not so awesomeرائع.
31
82000
2000
هذا عملي للغاية، لكن ليس بتلك الروعة.
01:39
What you really want to do
32
84000
3000
ما تريد فعله حقا
01:42
is to get to the awesomeرائع yetبعد practicalعملي partجزء of this spaceالفراغ.
33
87000
3000
هو أخذ الجزء الرائع والعملي كذلك من هذا الفضاء.
01:45
So it turnsيتحول out there was a companyشركة acrossعبر the riverنهر calledمسمي Googleجوجل
34
90000
3000
وقد اتضح أن هناك شركة على الجانب الآخر من النهر تدعى غوغل
01:48
who had startedبدأت a digitizationرقمنة projectمشروع a fewقليل yearsسنوات back
35
93000
2000
والتي بدأت مشروع رقمنة قبل بضع سنوات
01:50
that mightربما just enableمكن this approachمقاربة.
36
95000
2000
من شأنه أن يسمح بهذه المقاربة.
01:52
They have digitizedرقمية millionsملايين of booksالكتب.
37
97000
2000
قاموا برقمنة ملايين الكتب.
01:54
So what that meansيعني is, one could use computationalالحسابية methodsأساليب
38
99000
3000
وبالتالي ما يعنيه ذلك هو، قد يستخدم المرء طرقا حوسبية
01:57
to readاقرأ all of the booksالكتب in a clickانقر of a buttonزر.
39
102000
2000
لقراءة كل الكتب بضغطة زر.
01:59
That's very practicalعملي and extremelyجدا awesomeرائع.
40
104000
3000
هذا في غاية العملية والروعة.
02:03
ELAELA: Let me tell you a little bitقليلا about where booksالكتب come from.
41
108000
2000
إ. ل. أ: دعوني أخبركم قليلا من أين تأتي الكتب.
02:05
Sinceمنذ time immemorialسحيق, there have been authorsالمؤلفون.
42
110000
3000
منذ قديم الزمن، تواجد كتّاب.
02:08
These authorsالمؤلفون have been strivingسعي to writeاكتب booksالكتب.
43
113000
3000
هؤلاء الكتّاب كانوا يسعون لتأليف كتب.
02:11
And this becameأصبح considerablyكثيرا easierأسهل
44
116000
2000
وقد صار ذلك سهلا جدا
02:13
with the developmentتطوير of the printingطبع pressصحافة some centuriesقرون agoمنذ.
45
118000
2000
مع تطور الصحافة المطبوعة قبل بضعة قرون.
02:15
Sinceمنذ then, the authorsالمؤلفون have wonوون
46
120000
3000
منذ ذلك الوقت، استطاع الكتاب
02:18
on 129 millionمليون distinctخامد occasionsمناسبات,
47
123000
2000
على مدى 129 مليون مناسبة متميزة،
02:20
publishingنشر booksالكتب.
48
125000
2000
من نشر الكتب.
02:22
Now if those booksالكتب are not lostضائع to historyالتاريخ,
49
127000
2000
الآن إن لم تكن تلك الكتب مفقودة في التاريخ،
02:24
then they are somewhereمكان ما in a libraryمكتبة,
50
129000
2000
فإنها في مكان ما في مكتبة،
02:26
and manyكثير of those booksالكتب have been gettingالحصول على retrievedاسترجاع from the librariesالمكتبات
51
131000
3000
والكثير من تلك الكتب يتم استرجاعها من المكتبات
02:29
and digitizedرقمية by Googleجوجل,
52
134000
2000
ورقمنتها من قبل غوغل،
02:31
whichالتي has scannedالممسوحة ضوئيا 15 millionمليون booksالكتب to dateتاريخ.
53
136000
2000
والذين قاموا بمسح 15 مليون كتاب لحد الساعة.
02:33
Now when Googleجوجل digitizesالتحويل الرقمي a bookكتاب, they put it into a really niceلطيف formatشكل.
54
138000
3000
الآن حين يقوم غوغل برقمنة كتاب، يضعونه في شكل أنيق للغاية.
02:36
Now we'veقمنا got the dataالبيانات, plusزائد we have metadataالبيانات الوصفية.
55
141000
2000
الآن لدينا البيانات بالإضافة إلى البيانات الوصفية.
02:38
We have informationمعلومات about things like where was it publishedنشرت,
56
143000
3000
لدينا معلومات حول أمور مثل أين تم نشره،
02:41
who was the authorمؤلف, when was it publishedنشرت.
57
146000
2000
من كان المؤلف، متى تم نشره.
02:43
And what we do is go throughعبر all of those recordsتسجيل
58
148000
3000
وما نقوم به هو القراء من خلال كل هذه السجلات
02:46
and excludeاستبعد everything that's not the highestأعلى qualityجودة dataالبيانات.
59
151000
4000
وإلغاء كل البيانات التي ليست ذات جودة عالية.
02:50
What we're left with
60
155000
2000
ما يتبقى لنا
02:52
is a collectionمجموعة of fiveخمسة millionمليون booksالكتب,
61
157000
3000
هو مجموعة من خمسة ملايين كتاب،
02:55
500 billionمليار wordsكلمات,
62
160000
3000
500 مليار كلمة،
02:58
a stringخيط of charactersالشخصيات a thousandألف timesمرات longerطويل
63
163000
2000
سلسلة من الأحرف أطول بألف مرة
03:00
than the humanبشري genomeالجينوم --
64
165000
3000
من الجينوم البشري --
03:03
a textنص whichالتي, when writtenمكتوب out,
65
168000
2000
نص إن تمت كتابته،
03:05
would stretchتمتد from here to the Moonالقمر and back
66
170000
2000
سيمتد من هنا إلى القمر وعودة
03:07
10 timesمرات over --
67
172000
2000
10 مرات متوالية --
03:09
a veritableحقيقي shardقشرة of our culturalثقافي genomeالجينوم.
68
174000
4000
قشرة حقيقية لجينومنا الثقافي.
03:13
Of courseدورة what we did
69
178000
2000
ما قمنا به بالطبع
03:15
when facedواجه with suchهذه outrageousشائن hyperboleمقارنة مبالغ فيها ...
70
180000
3000
حين واجهنا تلك المبالغة الفظيعة ..
03:18
(Laughterضحك)
71
183000
2000
(ضحك)
03:20
was what any self-respectingيحترم نفسه researchersالباحثين
72
185000
3000
هو ماكان أي باحث يحترم نفسه
03:23
would have doneفعله.
73
188000
3000
ليقوم به.
03:26
We tookأخذ a pageصفحة out of XKCDXKCD,
74
191000
2000
أخذنا صفحة من إكس كي سي دي،
03:28
and we said, "Standيفهم back.
75
193000
2000
وقلنا، "ارجع للوراء.
03:30
We're going to try scienceعلم."
76
195000
2000
سنجرب العلم."
03:32
(Laughterضحك)
77
197000
2000
(ضحك)
03:34
JMJM: Now of courseدورة, we were thinkingتفكير,
78
199000
2000
ج. م: الآن بالطبع، كنا نفكر،
03:36
well let's just first put the dataالبيانات out there
79
201000
2000
حسنا، دعونا أولا نضع البيانات فقط هناك
03:38
for people to do scienceعلم to it.
80
203000
2000
حتى يمارس عليها الناس العلم.
03:40
Now we're thinkingتفكير, what dataالبيانات can we releaseإطلاق سراح?
81
205000
2000
الآن كنا نفكر، ما نوع البيانات التي قد نصدرها؟
03:42
Well of courseدورة, you want to take the booksالكتب
82
207000
2000
حسنا بالطبع، تريد أخذ كل الكتب
03:44
and releaseإطلاق سراح the fullممتلئ textنص of these fiveخمسة millionمليون booksالكتب.
83
209000
2000
ونشر النص الكامل لتلك الخمس ملايين كتاب.
03:46
Now Googleجوجل, and Jonجون OrwantOrwant in particularبصفة خاصة,
84
211000
2000
الآن غوغل، وجون أوروانت تحديدا،
03:48
told us a little equationمعادلة that we should learnتعلم.
85
213000
2000
أخبرونا عن معادلة صغيرة علينا تعلمها.
03:50
So you have fiveخمسة millionمليون, that is, fiveخمسة millionمليون authorsالمؤلفون
86
215000
3000
حسنا لديكم خمس ملايين، هذا يعني، خمس ملايين كاتب
03:53
and fiveخمسة millionمليون plaintiffsالمدعون is a massiveكبير lawsuitدعوى قضائية.
87
218000
3000
وخمس ملايين مدعي هي دعوى قضائية هائلة.
03:56
So, althoughبرغم من that would be really, really awesomeرائع,
88
221000
2000
إذن، على الرغم من أن هذا كان ليكون رائعا للغاية،
03:58
again, that's extremelyجدا, extremelyجدا impracticalغير عملي.
89
223000
3000
مجددا، إنه غير عملي للغاية.
04:01
(Laughterضحك)
90
226000
2000
(ضحك)
04:03
Now again, we kindطيب القلب of cavedانهار in,
91
228000
2000
الآن مجددا، أذعنا نوعا ما،
04:05
and we did the very practicalعملي approachمقاربة, whichالتي was a bitقليلا lessأقل awesomeرائع.
92
230000
3000
وأنجزنا المقاربة العملية جدا، والتي لم تكن بتلك الروعة.
04:08
We said, well insteadفي حين أن of releasingإطلاق the fullممتلئ textنص,
93
233000
2000
قلنا، حسنا بدل نشر النصوص الكاملة،
04:10
we're going to releaseإطلاق سراح statisticsالإحصاء about the booksالكتب.
94
235000
2000
سنقوم بنشر إحصائيات حول الكتب.
04:12
So take for instanceحتة "A gleamومضة of happinessسعادة."
95
237000
2000
إذن على سبيل المثال "بصيص من السعادة."
04:14
It's fourأربعة wordsكلمات; we call that a four-gramأربعة غرام.
96
239000
2000
إنها أربع كلمات؛ نسمي ذلك أربعة-غرام
04:16
We're going to tell you how manyكثير timesمرات a particularبصفة خاصة four-gramأربعة غرام
97
241000
2000
سنقوم باخباركم بعدد المرات التي ظهرت فيها أربعة-غرام معينة
04:18
appearedظهر in booksالكتب in 1801, 1802, 1803,
98
243000
2000
في الكتب في 1801، 1802، 1803،
04:20
all the way up to 2008.
99
245000
2000
على طول الطريق إلى 2008.
04:22
That givesيعطي us a time seriesسلسلة
100
247000
2000
ذلك يعطينا تسلسلا زمنيا
04:24
of how frequentlyفي كثير من الأحيان this particularبصفة خاصة sentenceجملة او حكم على was used over time.
101
249000
2000
حول مدى تردد استخدام هذه الجملة المعينة مع مرور الزمن.
04:26
We do that for all the wordsكلمات and phrasesالعبارات that appearبدا in those booksالكتب,
102
251000
3000
نقوم بذلك لكل الكلمات والجمل التي تظهر في تلك الكتب،
04:29
and that givesيعطي us a bigكبير tableالطاولة of two billionمليار linesخطوط
103
254000
3000
وذلك يعطينا جدولا ضخما من ملياري سطر
04:32
that tell us about the way cultureحضاره has been changingمتغير.
104
257000
2000
يخبرنا حول الطريقة التي تتغير بها الثقافة.
04:34
ELAELA: So those two billionمليار linesخطوط,
105
259000
2000
إ. ل. أ: وبالتالي هذان الملياران،
04:36
we call them two billionمليار n-gramsن-غرام.
106
261000
2000
نسميهما ملياري ن-غرام.
04:38
What do they tell us?
107
263000
2000
ما الذي تخبرنا؟
04:40
Well the individualفرد n-gramsن-غرام measureقياس culturalثقافي trendsاتجاهات.
108
265000
2000
حسنا ال: ن-غرام المفردة تقيس الاتجاهات الثقافية.
04:42
Let me give you an exampleمثال.
109
267000
2000
دعوني أعطيكم مثالا.
04:44
Let's supposeافترض that I am thrivingمزدهر,
110
269000
2000
دعونا نفترض أنني في ازدهار،
04:46
then tomorrowغدا I want to tell you about how well I did.
111
271000
2000
ثم أردت إخباركم في الغد كيف أبليت حسنا.
04:48
And so I mightربما say, "Yesterdayفي الامس, I throvethrove."
112
273000
3000
وبالتالي قد أقول، "البارحة قد نجحت."
04:51
Alternativelyبدلا من ذلك, I could say, "Yesterdayفي الامس, I thrivedازدهرت."
113
276000
3000
كبديل، يمكنني القول، "البارحة، ازدهرت."
04:54
Well whichالتي one should I use?
114
279000
3000
حسنا أي واحدة يمكنني استخدامها؟
04:57
How to know?
115
282000
2000
كيف أعرف؟
04:59
As of about sixستة monthsالشهور agoمنذ,
116
284000
2000
قبل ستة أشهر من الآن،
05:01
the stateحالة of the artفن in this fieldحقل
117
286000
2000
أعلى تقدم تقني في المجال
05:03
is that you would, for instanceحتة,
118
288000
2000
كان أن تقوم، على سبيل المثال،
05:05
go up to the followingالتالية psychologistالطبيب النفسي with fabulousرائع hairشعر,
119
290000
2000
بالذهاب إلى عالم نفساني بشعر رائع،
05:07
and you'dكنت say,
120
292000
2000
وتقول،
05:09
"Steveستيف, you're an expertخبير on the irregularغير منتظم verbsأفعال.
121
294000
3000
"ستيف، أنت خبير في الأفعال غير النظامية.
05:12
What should I do?"
122
297000
2000
ما الذي يجدر بي فعله؟"
05:14
And he'dعنيدا tell you, "Well mostعظم people say thrivedازدهرت,
123
299000
2000
وسيقول لك، "حسنا معظم الناس يقولون نجحت،
05:16
but some people say throvethrove."
124
301000
3000
لكن بعضهم يقول ازدهرت."
05:19
And you alsoأيضا knewعرف, more or lessأقل,
125
304000
2000
وتعلم كذلك، أكثر أو أقل،
05:21
that if you were to go back in time 200 yearsسنوات
126
306000
3000
أنه إن عدت 200 سنة إلى الوراء
05:24
and askيطلب the followingالتالية statesmanرجل دولة with equallyبالتساوي fabulousرائع hairشعر,
127
309000
3000
وسألت رجل دولة بنفس الشعر الرائع،
05:27
(Laughterضحك)
128
312000
3000
(ضحك)
05:30
"Tomتوم, what should I say?"
129
315000
2000
"توم، ما الذي يجدر بي قوله؟"
05:32
He'dعنيدا say, "Well, in my day, mostعظم people throvethrove,
130
317000
2000
سيقول، "حسنا، في وقتنا، معظم الناس يزدهرون،
05:34
but some thrivedازدهرت."
131
319000
3000
لكن بعضعهم ينجحون."
05:37
So now what I'm just going to showتبين you is rawالخام dataالبيانات.
132
322000
2000
وبالتالي الآن ما سأعرضهم عليهم هو بينات خام.
05:39
Two rowsالصفوف from this tableالطاولة of two billionمليار entriesإدخالات.
133
324000
4000
صفان من هذا جدول ملياري مدخلة.
05:43
What you're seeingرؤية is yearعام by yearعام frequencyتكرر
134
328000
2000
ما ترونه هو تردد سنة بسنة
05:45
of "thrivedازدهرت" and "throvethrove" over time.
135
330000
3000
لـ "نجح" و"ازدهر" على مرور الزمن.
05:49
Now this is just two
136
334000
2000
الآن هذه فقط اثنتان
05:51
out of two billionمليار rowsالصفوف.
137
336000
3000
من ملياري صف.
05:54
So the entireكامل dataالبيانات setجلس
138
339000
2000
وبالتالي مجموع البيانات الكلية
05:56
is a billionمليار timesمرات more awesomeرائع than this slideالانزلاق.
139
341000
3000
هي مليار مرة أكثر روعة من هذه الشريحة.
05:59
(Laughterضحك)
140
344000
2000
(ضحك)
06:01
(Applauseتصفيق)
141
346000
4000
(تصفيق)
06:05
JMJM: Now there are manyكثير other picturesالصور that are worthيستحق 500 billionمليار wordsكلمات.
142
350000
2000
ج. م: الآن هناك الكثير من الصور الأخرى التي تعادل 500 مليار كلمة.
06:07
For instanceحتة, this one.
143
352000
2000
على سبيل المثال، هذه.
06:09
If you just take influenzaإنفلونزا,
144
354000
2000
إن أخذتم الإنفلونزا
06:11
you will see peaksقمم at the time where you knewعرف
145
356000
2000
سترون ذرى في الأوقات التي تعرفون
06:13
bigكبير fluأنفلونزا epidemicsالأوبئة were killingقتل people around the globeكره ارضيه.
146
358000
3000
كانت تقتل فيه أوبئة الأنفلونزا الكبرى الناس في جميع أنحاء العالم.
06:16
ELAELA: If you were not yetبعد convincedمقتنع,
147
361000
3000
إ. ل. أ: إن لم تكونوا بعد مقتنعين،
06:19
seaبحر levelsمستويات are risingارتفاع,
148
364000
2000
مستويات البحر ترتفع،
06:21
so is atmosphericجوي COCO2 and globalعالمي temperatureدرجة الحرارة.
149
366000
3000
وكذلك ثنائي أكسيد الكربون في الجو والحرارة العالمية.
06:24
JMJM: You mightربما alsoأيضا want to have a look at this particularبصفة خاصة n-gramن-غرام,
150
369000
3000
ج. م: سترغبون كذلك في إلقاء نظرة على هذا الـ ن-غرام بذاته،
06:27
and that's to tell Nietzscheنيتشه that God is not deadميت,
151
372000
3000
وذلك لإخبار نيتشه أن الإله ليس ميتا،
06:30
althoughبرغم من you mightربما agreeيوافق على that he mightربما need a better publicistالخبير في القانون الدولي.
152
375000
3000
على الرغم من أنه قد يحتاج وكيلا إعلاميا أفضل.
06:33
(Laughterضحك)
153
378000
2000
(ضحك)
06:35
ELAELA: You can get at some prettyجميلة abstractنبذة مختصرة conceptsالمفاهيم with this sortفرز of thing.
154
380000
3000
إ. ل. أ: يمكنكم الحصول على بعض المفاهيم المجردة بهذا الشيء.
06:38
For instanceحتة, let me tell you the historyالتاريخ
155
383000
2000
على سبيل المثال، دعوني أخبركم عن تاريخ
06:40
of the yearعام 1950.
156
385000
2000
السنة 1950.
06:42
Prettyجميلة much for the vastشاسع majorityأغلبية of historyالتاريخ,
157
387000
2000
للغالبية العظمى من التاريخ،
06:44
no one gaveأعطى a damnاللعنة about 1950.
158
389000
2000
لم يهتم أحد في حدود 1950.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
في 1700 في 1800 في 1900،
06:48
no one caredالرعاية.
160
393000
3000
لم يهتم أحد.
06:52
Throughعبر the 30s and 40s,
161
397000
2000
خلال الثلاثينيات والأربعينيات،
06:54
no one caredالرعاية.
162
399000
2000
لم يهتم أحد.
06:56
Suddenlyفجأة, in the mid-منتصف40s,
163
401000
2000
وفجأة، في منتصف الأربعينيات،
06:58
there startedبدأت to be a buzzشرب حتى الثمالة.
164
403000
2000
بدأت تحدث ضجة.
07:00
People realizedأدرك that 1950 was going to happenيحدث,
165
405000
2000
بدأ الناس يدركون أن 1950 قادمة،
07:02
and it could be bigكبير.
166
407000
2000
وقد تكون عظيمة.
07:04
(Laughterضحك)
167
409000
3000
(ضحك)
07:07
But nothing got people interestedيستفد in 1950
168
412000
3000
لكن لا شيء جعل الناس أكثر اهتماما بـ 1950
07:10
like the yearعام 1950.
169
415000
3000
مثل السنة 1950.
07:13
(Laughterضحك)
170
418000
3000
(ضحك)
07:16
People were walkingالمشي around obsessedمهووس.
171
421000
2000
كان الناس يمشون مهووسين.
07:18
They couldn'tلم أستطع stop talkingالحديث
172
423000
2000
لم يستطيعوا التوقف عن الكلام
07:20
about all the things they did in 1950,
173
425000
3000
حول ما قاموا به في 1950،
07:23
all the things they were planningتخطيط to do in 1950,
174
428000
3000
كل ما كانوا يخططون له في 1950،
07:26
all the dreamsأحلام of what they wanted to accomplishإنجاز in 1950.
175
431000
5000
كل الأحلام حول ما أرادوا إنجازه في 1950.
07:31
In factحقيقة, 1950 was so fascinatingساحر
176
436000
2000
في الواقع، 1950 كان آسرا لدرجة
07:33
that for yearsسنوات thereafterبعد ذلك,
177
438000
2000
أنه في السنوات اللاحقة،
07:35
people just keptأبقى talkingالحديث about all the amazingرائعة حقا things that happenedحدث,
178
440000
3000
بقي الناس يتحدثون حول كل الأمور الرائعة التي حدثت،
07:38
in '51, '52, '53.
179
443000
2000
في 51 و 52 و53.
07:40
Finallyأخيرا in 1954,
180
445000
2000
وأخير في 1954،
07:42
someoneشخصا ما wokeاستيقظ up and realizedأدرك
181
447000
2000
أحدهم استيقظ وأدرك
07:44
that 1950 had gottenحصلت somewhatقليلا passالبشريé.
182
449000
4000
أن 1950 قد انقضت.
07:48
(Laughterضحك)
183
453000
2000
(ضحك)
07:50
And just like that, the bubbleفقاعة burstانفجار.
184
455000
2000
وبكل بساطة، انفجرت الفقاعة.
07:52
(Laughterضحك)
185
457000
2000
(ضحك)
07:54
And the storyقصة of 1950
186
459000
2000
وقصة 1950
07:56
is the storyقصة of everyكل yearعام that we have on recordسجل,
187
461000
2000
هي قصة كل سنة لدينا في السجلات،
07:58
with a little twistإلتواء, because now we'veقمنا got these niceلطيف chartsالرسوم البيانية.
188
463000
3000
بالتفاف بسيط، لأنه لدينا الآن هذه المبيانات الجميلة.
08:01
And because we have these niceلطيف chartsالرسوم البيانية, we can measureقياس things.
189
466000
3000
ولأنه لدينا مبيانات جميلة، يمكننا قياس الأشياء.
08:04
We can say, "Well how fastبسرعة does the bubbleفقاعة burstانفجار?"
190
469000
2000
يمكننا القول، "حسنا ما مدى سرعة انفجار الفقاعة؟"
08:06
And it turnsيتحول out that we can measureقياس that very preciselyعلى وجه التحديد.
191
471000
3000
وقد اتضح أنه يمكننا قياس ذلك بدقة بالغة.
08:09
Equationsمعادلات were derivedمستمد, graphsالرسوم البيانية were producedأنتجت,
192
474000
3000
تم اشتقاق معادلات، وإنتاج رسوم بيانية،
08:12
and the netشبكة resultنتيجة
193
477000
2000
والنتيجة الخام
08:14
is that we find that the bubbleفقاعة burstsرشقات نارية fasterبسرعة and fasterبسرعة
194
479000
3000
هي أنه وجدنا أن الفقاعة تنفجر بسرعة أكثر فأكثر
08:17
with eachكل passingعابر yearعام.
195
482000
2000
مع مرور كل سنة.
08:19
We are losingفقدان interestفائدة in the pastالماضي more rapidlyبسرعة.
196
484000
5000
نحن نفقد اهتمامنا بالماضي بشكل أكثر سرعة.
08:24
JMJM: Now a little pieceقطعة of careerمهنة adviceالنصيحة.
197
489000
2000
ج. م: الآن نصيحة مهنية بسيطة.
08:26
So for those of you who seekطلب to be famousمشهور,
198
491000
2000
وبالتالي لمن يريد منكم أن يشتهر،
08:28
we can learnتعلم from the 25 mostعظم famousمشهور politicalسياسي figuresالأرقام,
199
493000
2000
يمكننا الاستفادة من الشخصيات السياسية الـ 25 الأكثر شهرة،
08:30
authorsالمؤلفون, actorsممثلين and so on.
200
495000
2000
والكتاب والممثلين وما إلى ذلك.
08:32
So if you want to becomeيصبح famousمشهور earlyمبكرا on, you should be an actorالممثل,
201
497000
3000
وبالتالي إذا ما أردت أن تصبح مشهورا لاحقا، يجدر بك أن تصير ممثلا،
08:35
because then fameشهرة startsيبدأ risingارتفاع by the endالنهاية of your 20s --
202
500000
2000
لأن الشهرة تبدأ بالزيادة في نهاية العشرينيات --
08:37
you're still youngشاب, it's really great.
203
502000
2000
لا تزال يافعا، ذلك عظيم للغاية.
08:39
Now if you can wait a little bitقليلا, you should be an authorمؤلف,
204
504000
2000
الآن إن أمكنك الانتظار قليلا، يجدر بك أن تصير كاتبا،
08:41
because then you riseترتفع to very great heightsالمرتفعات,
205
506000
2000
لأنه آنذاك ترتفع إلى مستويات عظيمة،
08:43
like Markعلامة Twainزوجان, for instanceحتة: extremelyجدا famousمشهور.
206
508000
2000
مثل مارك توين، على سبيل المثال: في غاية الشهرة.
08:45
But if you want to reachتصل the very topأعلى,
207
510000
2000
لكن إن أردت أن تصل إلى أعلى القمة،
08:47
you should delayتأخير gratificationالإشباع
208
512000
2000
يجدر بك أن تؤجل المتعة،
08:49
and, of courseدورة, becomeيصبح a politicianسياسي.
209
514000
2000
وتصير سياسيا بالطبع.
08:51
So here you will becomeيصبح famousمشهور by the endالنهاية of your 50s,
210
516000
2000
وبالتالي هنا ستصير مشهورا في نهاية خمسينياتك،
08:53
and becomeيصبح very, very famousمشهور afterwardبعد ذلك.
211
518000
2000
وستصير مشهورا للغاية بعد ذلك.
08:55
So scientistsالعلماء alsoأيضا tendتميل to get famousمشهور when they're much olderاكبر سنا.
212
520000
3000
والعلماء كذلك يميلون إلى أن يصيروا مشهورين حين يكونون أكبر بكثير.
08:58
Like for instanceحتة, biologistsعلماء الأحياء and physicsعلوم فيزيائية
213
523000
2000
على سبيل المثال، الأحيائيون والفيزيائيون
09:00
tendتميل to be almostتقريبيا as famousمشهور as actorsممثلين.
214
525000
2000
يصيرون بقدر شهرة الممثلين.
09:02
One mistakeخطأ you should not do is becomeيصبح a mathematicianرياضياتي.
215
527000
3000
خطأ واحد لا يجدر بكم الوقوع فيه هو أن تصيروا رياضياتيين.
09:05
(Laughterضحك)
216
530000
2000
(ضحك)
09:07
If you do that,
217
532000
2000
إن قمتم بذلك،
09:09
you mightربما think, "Oh great. I'm going to do my bestالأفضل work when I'm in my 20s."
218
534000
3000
قد تعتقدون، "أوه عظيم. سأقوم بأعظم أعمالي في العشرينيات من عمري"
09:12
But guessخمن what, nobodyلا أحد will really careرعاية.
219
537000
2000
لكن خمنوا ماذا، لا أحد في الواقع يهتم.
09:14
(Laughterضحك)
220
539000
3000
(ضحك)
09:17
ELAELA: There are more soberingحكمة notesملاحظات
221
542000
2000
إ. ل. أ: هناك ملاحظات حكيمة أخرى
09:19
amongمن بين the n-gramsن-غرام.
222
544000
2000
فيما بين الـ ن-غرام.
09:21
For instanceحتة, here'sمن هنا the trajectoryمسار of Marcمارك Chagallشاغال,
223
546000
2000
على سبيل المثال، هنا تجدون مسار مارك شاغال،
09:23
an artistفنان bornمولود in 1887.
224
548000
2000
فنان ولد سنة 1887.
09:25
And this looksتبدو like the normalعادي trajectoryمسار of a famousمشهور personشخص.
225
550000
3000
ويبدو هذا مثل مسار شخص مشهور عادي.
09:28
He getsيحصل على more and more and more famousمشهور,
226
553000
4000
يصير أكثر وأكثر شهرة،
09:32
exceptإلا if you look in Germanألمانية.
227
557000
2000
باستثناء إن بحثتم بالألمانية.
09:34
If you look in Germanألمانية, you see something completelyتماما bizarreغريب,
228
559000
2000
إن بحثتم بالألمانية، ترون شيئا غريبا للغاية،
09:36
something you prettyجميلة much never see,
229
561000
2000
شيئا لا ترونه أبدا،
09:38
whichالتي is he becomesيصبح extremelyجدا famousمشهور
230
563000
2000
وهو أن تصير مشهورا للغاية
09:40
and then all of a suddenمفاجئ plummetsينهار,
231
565000
2000
ثم وفجأة،
09:42
going throughعبر a nadirالحضيض betweenما بين 1933 and 1945,
232
567000
3000
يصل الحضيض ما بين 1933 و1945،
09:45
before reboundingانتعاش afterwardبعد ذلك.
233
570000
3000
قبل أن يرتد مجددا لاحقا.
09:48
And of courseدورة, what we're seeingرؤية
234
573000
2000
وبالطبع، ما ترونه
09:50
is the factحقيقة Marcمارك Chagallشاغال was a Jewishيهودي artistفنان
235
575000
3000
هو حقيقة كون مارك شاغال فنانا يهوديا
09:53
in Naziالنازي Germanyألمانيا.
236
578000
2000
في ألمانيا النازية.
09:55
Now these signalsإشارات
237
580000
2000
الآن هذه الإشارات
09:57
are actuallyفعلا so strongقوي
238
582000
2000
هي في الواقع قوية للغاية
09:59
that we don't need to know that someoneشخصا ما was censoredرقابة.
239
584000
3000
لدرجة أنه لا تحتاج إلى معرفة أن أحدهم كان تحت الرقابة.
10:02
We can actuallyفعلا figureالشكل it out
240
587000
2000
يمكننا في الواقع إستنتاج ذلك
10:04
usingاستخدام really basicالأساسية signalإشارة processingمعالجة.
241
589000
2000
باستخدام معالجة إشارات أساسية.
10:06
Here'sمن هنا a simpleبسيط way to do it.
242
591000
2000
هنا طريقة بسيطة للقيام بذلك.
10:08
Well, a reasonableمعقول expectationتوقع
243
593000
2000
حسنا، توقع منطقي
10:10
is that somebody'sشخص ما fameشهرة in a givenمعطى periodفترة of time
244
595000
2000
هو أن شهرة أحدهم في فترة زمنية معينة
10:12
should be roughlyبقسوة the averageمعدل of theirهم fameشهرة before
245
597000
2000
يجب أن تكون تقريبا معدل شهرتهم قبل
10:14
and theirهم fameشهرة after.
246
599000
2000
وبعد الاشتهار.
10:16
So that's sortفرز of what we expectتوقع.
247
601000
2000
وبالتالي ذلك نوع مما نتوقعه.
10:18
And we compareقارن that to the fameشهرة that we observeرصد.
248
603000
3000
ونقارن ذلك بالشهرة التي نلاحظها.
10:21
And we just divideيقسم one by the other
249
606000
2000
ونقسم واحدا بالآخر
10:23
to produceإنتاج something we call a suppressionإخماد indexفهرس.
250
608000
2000
لإنتاج شيء نسميه مؤشر القمع.
10:25
If the suppressionإخماد indexفهرس is very, very, very smallصغير,
251
610000
3000
إن كان مؤشر القمع صغيرا جدا للغاية،
10:28
then you very well mightربما be beingيجرى suppressedقمع.
252
613000
2000
بعد ذلك قد تكون أنت ذاتك تحت القمع.
10:30
If it's very largeكبير, maybe you're benefitingالاستفادة from propagandaدعاية.
253
615000
3000
إن كان كبيرا للغاية، ربما تكون مستفيدا من بروباغاندا.
10:34
JMJM: Now you can actuallyفعلا look at
254
619000
2000
ج. م: الآن يمكنكم فعلا أن تنظروا
10:36
the distributionتوزيع of suppressionإخماد indexesالفهارس over wholeكامل populationsالسكان.
255
621000
3000
توزيع مؤشرات القمع على لمجموع السكان.
10:39
So for instanceحتة, here --
256
624000
2000
لذا على سبيل المثال، هنا --
10:41
this suppressionإخماد indexفهرس is for 5,000 people
257
626000
2000
مؤشر القمع هذا هو لـ 5000 شخص
10:43
pickedالتقطت in Englishالإنجليزية booksالكتب where there's no knownمعروف suppressionإخماد --
258
628000
2000
تم اختيارهم من كتب إنجليزية حيث لا يوجد هناك قمع --
10:45
it would be like this, basicallyفي الأساس tightlyبإحكام centeredمركز on one.
259
630000
2000
سيكون شيئا مثل هذا، سيكون أساسا متركزا بإحكام.
10:47
What you expectتوقع is basicallyفي الأساس what you observeرصد.
260
632000
2000
ما تتوقعونه هو ما يمكنكم ملاحظته أساسا.
10:49
This is distributionتوزيع as seenرأيت in Germanyألمانيا --
261
634000
2000
هذا التوزيع كما يرى في ألمانيا --
10:51
very differentمختلف, it's shiftedتحول to the left.
262
636000
2000
مختلف كثيرا، إنه محول قليلا لليسار.
10:53
People talkedتحدث about it twiceمرتين lessأقل as it should have been.
263
638000
3000
تحدث عنه الناس مرتين أقل مما يجب أن يكون.
10:56
But much more importantlyالأهم, the distributionتوزيع is much widerعلى نطاق أوسع.
264
641000
2000
لكن المهم جدا، التوزيع أقل وسعا.
10:58
There are manyكثير people who endالنهاية up on the farبعيدا left on this distributionتوزيع
265
643000
3000
هناك الكثير من الناس ينتهون في أقصى يسار التوزيع
11:01
who are talkedتحدث about 10 timesمرات fewerأقل than they should have been.
266
646000
3000
تم الحديث عنهم حوالي 10 مرات أقل مما يجب أن يكون.
11:04
But then alsoأيضا manyكثير people on the farبعيدا right
267
649000
2000
لكن كذلك الكثير من الناس على أقصى اليسار
11:06
who seemبدا to benefitفائدة from propagandaدعاية.
268
651000
2000
يبدو أنهم استفادوا من البروباغندا.
11:08
This pictureصورة is the hallmarkسمة مميزة of censorshipرقابة in the bookكتاب recordسجل.
269
653000
3000
هذه الصورة هي السمة المميزة للرقابة في سجل الكتب.
11:11
ELAELA: So culturomicsculturomics
270
656000
2000
إ. ل. أ: الكلتروميكس
11:13
is what we call this methodطريقة.
271
658000
2000
هي ما نسمي هذه الطريقة.
11:15
It's kindطيب القلب of like genomicsعلم الجينوم.
272
660000
2000
إنها نوع ما مثل الجينوميات.
11:17
Exceptإلا genomicsعلم الجينوم is a lensعدسة on biologyمادة الاحياء
273
662000
2000
باستثناء أن الجينوما هي عدسات على البيولوجيا
11:19
throughعبر the windowنافذة او شباك of the sequenceتسلسل of basesقواعد in the humanبشري genomeالجينوم.
274
664000
3000
من خلال نافذة تسلسل القواعد في الجينوم البشري.
11:22
CulturomicsCulturomics is similarمماثل.
275
667000
2000
الكلتروميكس أمر مشابه.
11:24
It's the applicationالوضعية of massive-scaleنطاق واسع dataالبيانات collectionمجموعة analysisتحليل
276
669000
3000
إنه تطبيق تحليل لمجموعة البيانات الهائلة الحجم
11:27
to the studyدراسة of humanبشري cultureحضاره.
277
672000
2000
لدراسة الثقافة البشرية.
11:29
Here, insteadفي حين أن of throughعبر the lensعدسة of a genomeالجينوم,
278
674000
2000
هنا، على سبيل المثال من خلال عدسات الجينوم،
11:31
throughعبر the lensعدسة of digitizedرقمية piecesقطع of the historicalتاريخي recordسجل.
279
676000
3000
من خلال عدسات السجل التاريخي المرقمن.
11:34
The great thing about culturomicsculturomics
280
679000
2000
الأمر العظيم بخصوص الكلتروميكس
11:36
is that everyoneكل واحد can do it.
281
681000
2000
هو أن الجميع يمكنه القيام بذلك.
11:38
Why can everyoneكل واحد do it?
282
683000
2000
لماذا يمكن للجميع القيام بذلك؟
11:40
Everyoneكل واحد can do it because threeثلاثة guys,
283
685000
2000
الجميع يمكنه القيام بذلك لأن ثلاثة أشخاص،
11:42
Jonجون OrwantOrwant, Mattمات Grayاللون الرمادي and Will Brockmanبروكمان over at Googleجوجل,
284
687000
3000
جون أوروانت ومات غراي وويل بروكمان في غوغل،
11:45
saw the prototypeالنموذج المبدئي of the NgramNgram Viewerمشاهد,
285
690000
2000
رأوا النموذج الأولي لعارض ن-غرام،
11:47
and they said, "This is so funمرح.
286
692000
2000
فقالوا، "هذا في غاية المتعة.
11:49
We have to make this availableمتاح for people."
287
694000
3000
علينا جعل هذا متوفرا للناس."
11:52
So in two weeksأسابيع flatمسطحة -- the two weeksأسابيع before our paperورقة cameأتى out --
288
697000
2000
وبالتالي في أسبوعين بالتمام -- الأسبوعان قبل صدور ورقتنا البحثية --
11:54
they codedمشفرة up a versionالإصدار of the NgramNgram Viewerمشاهد for the generalجنرال لواء publicعامة.
289
699000
3000
قاموا ببرمجة نسخة من عارض ن-غرام من أجل الاستخدام العام.
11:57
And so you too can typeاكتب in any wordكلمة or phraseالعبارة that you're interestedيستفد in
290
702000
3000
وبالتالي يمكنكم كذلك أن تكتبوا أي كلمة أو جملة تهتمون بها
12:00
and see its n-gramن-غرام immediatelyفورا --
291
705000
2000
ورؤية الـ ن-غرام مباشرة --
12:02
alsoأيضا browseتصفح examplesأمثلة of all the variousمختلف booksالكتب
292
707000
2000
كذلك تصفح أمثلة من مختلف الكتب
12:04
in whichالتي your n-gramن-غرام appearsيبدو.
293
709000
2000
حيث تظهر ن-غرام.
12:06
JMJM: Now this was used over a millionمليون timesمرات on the first day,
294
711000
2000
ج. م: الآن تم استخدام هذا أكثر من مليون مرة في اليوم الأول،
12:08
and this is really the bestالأفضل of all the queriesالاستفسارات.
295
713000
2000
وهذه بالفعل أفضل كل تلك الاستعلامات.
12:10
So people want to be theirهم bestالأفضل, put theirهم bestالأفضل footقدم forwardإلى الأمام.
296
715000
3000
وبالتالي أراد الناس وضع قدمهم الأفضل إلى الأمام.
12:13
But it turnsيتحول out in the 18thعشر centuryمئة عام, people didn't really careرعاية about that at all.
297
718000
3000
لكن اتضح أنه في القرن الـ 18، لم يهتم الناس بذلك على الإطلاق.
12:16
They didn't want to be theirهم bestالأفضل, they wanted to be theirهم beftbeft.
298
721000
3000
لم يريدوا أن يكونوا الأفضل، أرادوا أن يكونوا الأفدل.
12:19
So what happenedحدث is, of courseدورة, this is just a mistakeخطأ.
299
724000
3000
وبالتالي ما حصل هو، بالطبع، هذا كان مجرد خطأ.
12:22
It's not that stroveجاهد for mediocrityتوسط,
300
727000
2000
ليس ذلك السعي نحو التوسط،
12:24
it's just that the S used to be writtenمكتوب differentlyبشكل مختلف, kindطيب القلب of like an F.
301
729000
3000
إنه فقط حقيقة كون الحرف ض كان يكتب بشكل مختلف، نوعا ما مثل د.
12:27
Now of courseدورة, Googleجوجل didn't pickقطف او يقطف this up at the time,
302
732000
3000
الآن بالطبع، غوغل لم يلاحظ ذلك آنذاك،
12:30
so we reportedذكرت this in the scienceعلم articleمقالة - سلعة that we wroteكتب.
303
735000
3000
وبالتالي أبلغنا عن ذلك في المقال العلمي الذي كتبناه.
12:33
But it turnsيتحول out this is just a reminderتذكير
304
738000
2000
لكن اتضح أن ذلك هو فقط تذكير
12:35
that, althoughبرغم من this is a lot of funمرح,
305
740000
2000
أنه، على الرغم من أنه ممتع جدا،
12:37
when you interpretتفسر these graphsالرسوم البيانية, you have to be very carefulحذر,
306
742000
2000
حين تفسر تلك الرسوم البيانية، عليك أن تكون حذرا للغاية،
12:39
and you have to adoptتبنى the baseقاعدة standardsالمعايير in the sciencesعلوم.
307
744000
3000
وعليك أن تعتمد المعايير الأساسية للعلوم.
12:42
ELAELA: People have been usingاستخدام this for all kindsأنواع of funمرح purposesالمقاصد.
308
747000
3000
إ. ل. أ: الناس كانوا يستخدمون جميع أنواع أغراض المتعة.
12:45
(Laughterضحك)
309
750000
7000
(ضحك)
12:52
Actuallyفعلا, we're not going to have to talk,
310
757000
2000
في الواقع، ليس علينا الكلام،
12:54
we're just going to showتبين you all the slidesالشرائح and remainيبقى silentصامت.
311
759000
3000
سنقوم فقط بعرض بقية الشرائح والبقاء صامتين.
12:57
This personشخص was interestedيستفد in the historyالتاريخ of frustrationإحباط.
312
762000
3000
هذا الشخص كان مهتما بتاريخ الإحباط.
13:00
There's variousمختلف typesأنواع of frustrationإحباط.
313
765000
3000
هنا هذه الأنواع المختلفة من الإحباط.
13:03
If you stubرطم your toeإصبع قدم, that's a one A "arghأرغ."
314
768000
3000
إن صدمت اصبع قدمك، تلك آ "أرغ."
13:06
If the planetكوكب Earthأرض is annihilatedيباد by the VogonsVogons
315
771000
2000
إن كان كوكب الأرض أبيد من طرف الفوغونات
13:08
to make roomمجال for an interstellarواقع بين النجوم bypassالالتفافية,
316
773000
2000
لإفساح المكان لممر بين-نجمي،
13:10
that's an eightثمانية A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
تلك 8 آهات "آآآآآآآآرغ."
13:12
This personشخص studiesدراسات all the "arghsarghs,"
318
777000
2000
هذا الشخص درس كل هذه ال"آرغ".
13:14
from one throughعبر eightثمانية A'sمثل.
319
779000
2000
من واحد إلى ثمانية آهات.
13:16
And it turnsيتحول out
320
781000
2000
وقد اتضح
13:18
that the less-frequentاقل تكرارا "arghsarghs"
321
783000
2000
أن أقل الآهات استخداما
13:20
are, of courseدورة, the onesمنها that correspondتطابق to things that are more frustratingمحبط --
322
785000
3000
هي بالطبع تلك التي ترتبط بالأشياء الأكثر احباطا
13:23
exceptإلا, oddlyبشكل غريب, in the earlyمبكرا 80s.
323
788000
3000
باستثناء، وبشكل غريب، في بداية الثمانينيات.
13:26
We think that mightربما have something to do with Reaganريغان.
324
791000
2000
نعتقد أن لذلك علاقة بريغان.
13:28
(Laughterضحك)
325
793000
2000
(ضحك)
13:30
JMJM: There are manyكثير usagesالأعراف of this dataالبيانات,
326
795000
3000
ج. م: هناك الكثير من الاستخدامات لهذه البيانات،
13:33
but the bottomالأسفل lineخط is that the historicalتاريخي recordسجل is beingيجرى digitizedرقمية.
327
798000
3000
لكن الخلاصة أن السجلات التاريخية تتم رقمنتها.
13:36
Googleجوجل has startedبدأت to digitizeرقمنة 15 millionمليون booksالكتب.
328
801000
2000
غوغل قد بدأ يرقمن 15 مليون كتاب.
13:38
That's 12 percentنسبه مئويه of all the booksالكتب that have ever been publishedنشرت.
329
803000
2000
ذلك 12 في المئة من كل الكتب التي نشرت من قبل.
13:40
It's a sizableكبير الحجم chunkقطعة of humanبشري cultureحضاره.
330
805000
3000
إنه قسم لا بأس به من الثقافة البشرية.
13:43
There's much more in cultureحضاره: there's manuscriptsالمخطوطات, there newspapersالصحف,
331
808000
3000
هناك ما هو أكثر بكثير في الثقافة: هناك المخطوطات، الجرائد،
13:46
there's things that are not textنص, like artفن and paintingsلوحات.
332
811000
2000
هناك الأشياء التي ليست كتابة، مثل الفن والرسومات.
13:48
These all happenيحدث to be on our computersأجهزة الكمبيوتر,
333
813000
2000
كل هذا يصادف تواجده في حواسيبنا،
13:50
on computersأجهزة الكمبيوتر acrossعبر the worldالعالمية.
334
815000
2000
في حواسيب في جميع أنحاء العالم.
13:52
And when that happensيحدث, that will transformتحول the way we have
335
817000
3000
وحين يحدث ذلك، سيغير ذلك الطريقة التي
13:55
to understandتفهم our pastالماضي, our presentحاضر and humanبشري cultureحضاره.
336
820000
2000
نفهم بها ماضينا، وحاضرنا والثقافة البشرية.
13:57
Thank you very much.
337
822000
2000
شكرا جزيلا لكم.
13:59
(Applauseتصفيق)
338
824000
3000
(تصفيق)
Translated by Khalid Marbou
Reviewed by Faisal Jeber

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com