ABOUT THE SPEAKER
Rajesh Rao - Computational neuroscientist
Rajesh Rao seeks to understand the human brain through computational modeling, on two fronts: developing computer models of our minds, and using tech to decipher the 4,000-year-old lost script of the Indus Valley civilization.

Why you should listen

Rajesh Rao is looking for the computational principles underlying the brain's remarkable ability to learn, process and store information --  hoping to apply this knowledge to the task of building adaptive robotic systems and artificially intelligent agents.

Some of the questions that motivate his research include: How does the brain learn efficient representations of novel objects and events occurring in the natural environment? What are the algorithms that allow useful sensorimotor routines and behaviors to be learned? What computational mechanisms allow the brain to adapt to changing circumstances and remain fault-tolerant and robust?

By investigating these questions within a computational and probabilistic framework, it is often possible to derive algorithms that not only provide functional interpretations of neurobiological properties but also suggest solutions to difficult problems in computer vision, speech, robotics and artificial intelligence.

More profile about the speaker
Rajesh Rao | Speaker | TED.com
TED2011

Rajesh Rao: A Rosetta Stone for a lost language

羅傑許: 古印度河文字符號的羅賽塔石碑

Filmed:
2,103,451 views

羅傑許樂談『填字文字遊戲之始』,呈現解讀4000年前的印度抽象符號之道。他解釋如何藉由現代電腦科技幫助解讀古印度河文字,解開印度古文明之謎。
- Computational neuroscientist
Rajesh Rao seeks to understand the human brain through computational modeling, on two fronts: developing computer models of our minds, and using tech to decipher the 4,000-year-old lost script of the Indus Valley civilization. Full bio

Double-click the English transcript below to play the video.

00:15
I'd like to begin開始 with a thought experiment實驗.
0
0
3000
首先,我們先做個實驗
00:19
Imagine想像 that it's 4,000 years年份 into the future未來.
1
4000
3000
想像距今4000年後
00:22
Civilization文明 as we know it
2
7000
2000
我們所瞭解的文明
00:24
has ceased停止 to exist存在 --
3
9000
2000
已不存在
00:26
no books圖書,
4
11000
2000
沒有書
00:28
no electronic電子 devices設備,
5
13000
3000
沒有電子產品
00:31
no FacebookFacebook的 or Twitter推特.
6
16000
3000
沒有臉書或推特
00:34
All knowledge知識 of the English英語 language語言 and the English英語 alphabet字母
7
19000
3000
所有以英文寫成的知識甚至是英文符號
00:37
has been lost丟失.
8
22000
2000
都已經消失
00:39
Now imagine想像 archeologists考古學家
9
24000
2000
現在,再來想想考古學家們
00:41
digging挖掘 through通過 the rubble瓦礫 of one of our cities城市.
10
26000
2000
在某個城市的殘磚瓦片中挖掘
00:43
What might威力 they find?
11
28000
2000
他們會發現什麼呢?
00:45
Well perhaps也許 some rectangular長方形 pieces of plastic塑料
12
30000
3000
可能會發現長形的塑膠碎片
00:48
with strange奇怪 symbols符號 on them.
13
33000
3000
上面印怪異的符號
00:51
Perhaps也許 some circular pieces of metal金屬.
14
36000
3000
又或者發現一些圓形的金屬碎片
00:54
Maybe some cylindrical圓柱形 containers集裝箱
15
39000
2000
也可能是些圓柱型的容器
00:56
with some symbols符號 on them.
16
41000
2000
上頭有些符號
00:58
And perhaps也許 one archeologist考古學家 becomes an instant瞬間 celebrity名人
17
43000
3000
還可能有某個考古學家一夕成名
01:01
when she discovers發現的 --
18
46000
2000
是因為她發現了
01:03
buried隱藏 in the hills丘陵 somewhere某處 in North America美國 --
19
48000
2000
埋沒在北美的某個山上的
01:05
massive大規模的 versions版本 of these same相同 symbols符號.
20
50000
3000
一堆大量相同符號的圖片
01:10
Now let's ask ourselves我們自己,
21
55000
2000
現在讓我們捫心自問
01:12
what could such這樣 artifacts文物 say about us
22
57000
3000
對4000年後欲瞭解我們現在生活的人們
01:15
to people 4,000 years年份 into the future未來?
23
60000
3000
這些物品有什麼意義?
01:18
This is no hypothetical假想 question.
24
63000
2000
這不是假設
01:20
In fact事實, this is exactly究竟 the kind of question we're faced面對 with
25
65000
3000
事實上,這正是當我們去瞭解
01:23
when we try to understand理解 the Indus梧桐 Valley civilization文明,
26
68000
3000
4000年前印度河文明
01:26
which哪一個 existed存在 4,000 years年份 ago.
27
71000
2000
所必須面對的問題
01:28
The Indus梧桐 civilization文明 was roughly大致 contemporaneous同期
28
73000
3000
古印度河文明和較為人所熟知的
01:31
with the much better known已知 Egyptian埃及人 and the Mesopotamian美索不達米亞 civilizations文明,
29
76000
3000
埃及以及美所不達米亞文化同時期
01:34
but it was actually其實 much larger than either of these two civilizations文明.
30
79000
3000
但實際上印度河文明的範圍比這兩者還要大
01:37
It occupied佔據 the area
31
82000
2000
它所佔的範圍
01:39
of approximately one million百萬 square廣場 kilometers公里,
32
84000
2000
近乎100萬平方公里
01:41
covering覆蓋 what is now Pakistan巴基斯坦,
33
86000
2000
涵蓋了今天的巴基斯坦
01:43
Northwestern西北方 India印度
34
88000
2000
東北印度
01:45
and parts部分 of Afghanistan阿富汗 and Iran伊朗.
35
90000
2000
和部份的阿富汗及伊朗
01:47
Given特定 that it was such這樣 a vast廣大 civilization文明,
36
92000
2000
如此廣大的文明
01:49
you might威力 expect期望 to find really powerful強大 rulers統治者, kings國王,
37
94000
4000
你可能會期待尋找到主權者,國王
01:53
and huge巨大 monuments紀念碑 glorifying榮耀 these powerful強大 kings國王.
38
98000
3000
以及用來紀念王者的巨大紀念碑
01:56
In fact事實,
39
101000
2000
事實上
01:58
what archeologists考古學家 have found發現 is none沒有 of that.
40
103000
2000
考古學者沒有發現那些
02:00
They've他們已經 found發現 small objects對象 such這樣 as these.
41
105000
3000
他們發現了像這些的小東西
02:03
Here's這裡的 an example of one of these objects對象.
42
108000
3000
這裡有其中的一樣物品
02:06
Well obviously明顯 this is a replica複製品.
43
111000
2000
很明顯地這只是個複製品
02:08
But who is this person?
44
113000
3000
但這是誰呢?
02:11
A king國王? A god?
45
116000
2000
是某個國王?是某個神?
02:13
A priest牧師?
46
118000
2000
是某個祭司?
02:15
Or perhaps也許 an ordinary普通 person
47
120000
2000
又或者只是一個普通人
02:17
like you or me?
48
122000
2000
就像你我一樣?
02:19
We don't know.
49
124000
2000
我們不知道
02:21
But the Indus梧桐 people also left behind背後 artifacts文物 with writing寫作 on them.
50
126000
3000
但是古印度河的人們也在他們的人造品後面留了支字片語
02:24
Well no, not pieces of plastic塑料,
51
129000
2000
不,不是塑膠片
02:26
but stone seals密封件, copper tablets平板電腦,
52
131000
3000
是 石頭章,銅牌
02:29
pottery陶器 and, surprisingly出奇,
53
134000
2000
陶器還有一個令人驚訝的
02:31
one large sign標誌 board,
54
136000
2000
大的符號版
02:33
which哪一個 was found發現 buried隱藏 near the gate of a city.
55
138000
2000
這被掩埋在城門附近
02:35
Now we don't know if it says Hollywood好萊塢,
56
140000
2000
我們不知道在好萊塢
02:37
or even Bollywood寶萊塢 for that matter.
57
142000
2000
還是寶萊塢這些物品能有什麼功用
02:39
In fact事實, we don't even know
58
144000
2000
事實上,我們甚至不知道
02:41
what any of these objects對象 say,
59
146000
2000
這些物件有什麼意義
02:43
and that's because the Indus梧桐 script腳本 is undeciphered破譯.
60
148000
3000
因為這些印度河文字是解不開的謎
02:46
We don't know what any of these symbols符號 mean.
61
151000
2000
我們不知道這些符號的意思
02:48
The symbols符號 are most commonly常用 found發現 on seals密封件.
62
153000
3000
這些符號常出現在印章上
02:51
So you see up there one such這樣 object目的.
63
156000
2000
你們可以看到這裡有個類似的物品
02:53
It's the square廣場 object目的 with the unicorn-like麒麟狀 animal動物 on it.
64
158000
3000
這個方形的物品上有個像是獨角獸的動物
02:56
Now that's a magnificent華麗的 piece of art藝術.
65
161000
2000
這是一件很壯觀的藝術品
02:58
So how big do you think that is?
66
163000
2000
你覺得這塊有多大呢?
03:00
Perhaps也許 that big?
67
165000
2000
這麼大?
03:02
Or maybe that big?
68
167000
2000
還是這麼大?
03:04
Well let me show顯示 you.
69
169000
2000
讓我告訴你吧!
03:07
Here's這裡的 a replica複製品 of one such這樣 seal密封.
70
172000
3000
這裡有個印章的複製品
03:10
It's only about one inch英寸 by one inch英寸 in size尺寸 --
71
175000
2000
只有一英吋平方大
03:12
pretty漂亮 tiny.
72
177000
2000
非常小
03:14
So what were these used for?
73
179000
2000
那這些東西用來作什麼呢?
03:16
We know that these were used for stamping沖壓 clay粘土 tags標籤
74
181000
3000
這些用來蓋在黏土標簽上
03:19
that were attached to bundles捆綁 of goods產品 that were sent發送 from one place地點 to the other.
75
184000
3000
然後貼在一堆貨品,以利於從此地運送到其他地方
03:22
So you know those packing填料 slips卡瓦 you get on your FedEx聯邦快遞 boxes盒子?
76
187000
3000
所以你知道會從FedEx箱子上拿到這些送貨單了嗎?
03:25
These were used to make those kinds of packing填料 slips卡瓦.
77
190000
3000
這些泥版就是用來作為包裹送貨單
03:28
You might威力 wonder奇蹟 what these objects對象 contain包含
78
193000
3000
你可能想用上面的文字來猜測
03:31
in terms條款 of their text文本.
79
196000
2000
這些東西的內容
03:33
Perhaps也許 they're the name名稱 of the sender寄件人
80
198000
2000
可能是寄送者的名字
03:35
or some information信息 about the goods產品
81
200000
2000
或是關於產品
03:37
that are being存在 sent發送 from one place地點 to the other -- we don't know.
82
202000
3000
從某地送到其他地方的資訊--我們不知道
03:40
We need to decipher解碼 the script腳本 to answer回答 that question.
83
205000
2000
我們需要解開這段文字才能知道回答這問題
03:42
Deciphering解讀 the script腳本
84
207000
2000
解謎這些文字符號
03:44
is not just an intellectual知識分子 puzzle難題;
85
209000
2000
不單只是一個得動腦思考的謎題
03:46
it's actually其實 become成為 a question
86
211000
2000
事實上還牽涉到
03:48
that's become成為 deeply intertwined交織
87
213000
2000
與南亞的政治與文化歷史
03:50
with the politics政治 and the cultural文化 history歷史 of South Asia亞洲.
88
215000
3000
極為相關的問題
03:53
In fact事實, the script腳本 has become成為 a battleground戰場 of sorts排序
89
218000
3000
實際上,對這些文字符號
03:56
between之間 three different不同 groups of people.
90
221000
2000
有三種不同的解讀意見
03:58
First, there's a group of people
91
223000
2000
第一,有一群人
04:00
who are very passionate多情 in their belief信仰
92
225000
2000
他們堅決相信
04:02
that the Indus梧桐 script腳本
93
227000
2000
認為古印度河文字
04:04
does not represent代表 a language語言 at all.
94
229000
2000
根本不是種語言
04:06
These people believe that the symbols符號
95
231000
2000
這些人認為這些符號就像是
04:08
are very similar類似 to the kind of symbols符號 you find on traffic交通 signs跡象
96
233000
3000
交通號誌
04:11
or the emblems徽記 you find on shields盾牌.
97
236000
3000
或者是盾上面的一些象徵符號
04:14
There's a second第二 group of people
98
239000
2000
還有第二群人
04:16
who believe that the Indus梧桐 script腳本 represents代表 an Indo-European印歐 language語言.
99
241000
3000
認為印度河文字代表著某個印歐語言
04:19
If you look at a map地圖 of India印度 today今天,
100
244000
2000
如果來看今天的印度地圖
04:21
you'll你會 see that most of the languages語言 spoken in North India印度
101
246000
3000
你會看到北印度大部份使用的語言
04:24
belong屬於 to the Indo-European印歐 language語言 family家庭.
102
249000
3000
都來自於印歐語系
04:27
So some people believe that the Indus梧桐 script腳本
103
252000
2000
所以一些人相信古印度河文字
04:29
represents代表 an ancient Indo-European印歐 language語言 such這樣 as Sanskrit梵文.
104
254000
3000
是某種古老的印歐語,就像梵語一樣
04:32
There's a last group of people
105
257000
2000
最後一群人
04:34
who believe that the Indus梧桐 people
106
259000
3000
相信古印度人
04:37
were the ancestors祖先 of people living活的 in South India印度 today今天.
107
262000
3000
是現在住在南印度人的祖先
04:40
These people believe that the Indus梧桐 script腳本
108
265000
2000
這些人覺得古印度文字
04:42
represents代表 an ancient form形成
109
267000
2000
是德拉威語系下的
04:44
of the Dravidian德拉威 language語言 family家庭,
110
269000
2000
的某個語系
04:46
which哪一個 is the language語言 family家庭 spoken in much of South India印度 today今天.
111
271000
3000
現今南印度多數人皆使用德拉威語系
04:49
And the proponents支持者 of this theory理論
112
274000
2000
支持這理論者
04:51
point to that small pocket口袋 of Dravidian-speaking德拉威語 people in the North,
113
276000
3000
指出一小部份使用德拉威語的北印度人
04:54
actually其實 near Afghanistan阿富汗,
114
279000
2000
確實鄰近阿富汗
04:56
and they say that perhaps也許, sometime某時 in the past過去,
115
281000
3000
他們認為或許在過去的某個時期
04:59
Dravidian德拉威 languages語言 were spoken all over India印度
116
284000
3000
全印度皆使用德拉威語
05:02
and that this suggests提示
117
287000
2000
這也意味著
05:04
that the Indus梧桐 civilization文明 is perhaps也許 also Dravidian德拉威.
118
289000
3000
印度河文明或許就是德拉威文明
05:07
Which哪一個 of these hypotheses假設 can be true真正?
119
292000
3000
這些假設哪個是真的呢?
05:10
We don't know, but perhaps也許 if you deciphered破譯 the script腳本,
120
295000
2000
我們不知道,但若能解開這些文字符號
05:12
you would be able能夠 to answer回答 this question.
121
297000
2000
就可以找到答案
05:14
But deciphering破譯 the script腳本 is a very challenging具有挑戰性的 task任務.
122
299000
2000
但解開這些文字內容不容易
05:16
First, there's no Rosetta羅塞塔 Stone.
123
301000
2000
第一,我們沒有羅薩塔石
05:18
I don't mean the software軟件;
124
303000
2000
我不是指語言學習軟體
05:20
I mean an ancient artifact神器
125
305000
2000
我是說一件古物
05:22
that contains包含 in the same相同 text文本
126
307000
2000
分別以我們知道與不知道的文字
05:24
both a known已知 text文本 and an unknown未知 text文本.
127
309000
3000
書寫著同樣文字內容
05:27
We don't have such這樣 an artifact神器 for the Indus梧桐 script腳本.
128
312000
3000
印度河文化中並沒有像那樣的古物
05:30
And furthermore此外, we don't even know what language語言 they spoke.
129
315000
3000
說得更明白一點,我們不知道他們使用哪種語言
05:33
And to make matters事項 even worse更差,
130
318000
2000
而且更糟的是
05:35
most of the text文本 that we have are extremely非常 short.
131
320000
2000
大部份的文字都相當短
05:37
So as I showed顯示 you, they're usually平時 found發現 on these seals密封件
132
322000
2000
就像我給大家看的,最常發現的是這些印章類的東西
05:39
that are very, very tiny.
133
324000
2000
他們都非常非常地小
05:41
And so given特定 these formidable強大 obstacles障礙,
134
326000
2000
這讓我們更難解讀
05:43
one might威力 wonder奇蹟 and worry擔心
135
328000
2000
有些人或許會擔心
05:45
whether是否 one will ever be able能夠 to decipher解碼 the Indus梧桐 script腳本.
136
330000
3000
是否真的有誰可以解開古印度河文字呢?
05:48
In the rest休息 of my talk,
137
333000
2000
在我接下來的演講中
05:50
I'd like to tell you about how I learned學到了 to stop worrying令人擔憂
138
335000
2000
我要來告訴各位我怎麼克服這些解讀障礙
05:52
and love the challenge挑戰 posed構成 by the Indus梧桐 script腳本.
139
337000
2000
並喜歡上解讀古印度河文字所帶來的挑戰
05:54
I've always been fascinated入迷 by the Indus梧桐 script腳本
140
339000
3000
我熱衷於古印度河文字
05:57
ever since以來 I read about it in a middle中間 school學校 textbook教科書.
141
342000
2000
大概始自於在中學課本
05:59
And why was I fascinated入迷?
142
344000
2000
為什麼我如此著迷?
06:01
Well it's the last major重大的 undeciphered破譯 script腳本 in the ancient world世界.
143
346000
4000
因為這是目前唯一未被解開的重要古文字符號
06:05
My career事業 path路徑 led me to become成為 a computational計算 neuroscientist神經學家,
144
350000
3000
我的職業是計算神經科學
06:08
so in my day job工作,
145
353000
2000
所以我每天的工作
06:10
I create創建 computer電腦 models楷模 of the brain
146
355000
2000
就是製造出大腦的電腦模型
06:12
to try to understand理解 how the brain makes品牌 predictions預測,
147
357000
3000
來試圖瞭解大腦如何預知事物
06:15
how the brain makes品牌 decisions決定,
148
360000
2000
如何下判斷
06:17
how the brain learns獲悉 and so on.
149
362000
2000
如何學習等
06:19
But in 2007, my path路徑 crossed越過 again with the Indus梧桐 script腳本.
150
364000
3000
但在2007年,我與古印度河文字重逢
06:22
That's when I was in India印度,
151
367000
2000
我當時人在印度
06:24
and I had the wonderful精彩 opportunity機會
152
369000
2000
有著很好的機會
06:26
to meet遇到 with some Indian印度人 scientists科學家們
153
371000
2000
與印度科學家見面
06:28
who were using運用 computer電腦 models楷模 to try to analyze分析 the script腳本.
154
373000
3000
他們使用電腦模型去分析那些文字符號
06:31
And so it was then that I realized實現
155
376000
2000
我想到
06:33
there was an opportunity機會 for me to collaborate合作 with these scientists科學家們,
156
378000
3000
可以藉由這次機會與這些科學家合作
06:36
and so I jumped跳下 at that opportunity機會.
157
381000
2000
所以我抓住了這次機會
06:38
And I'd like to describe描述 some of the results結果 that we have found發現.
158
383000
2000
我想說明我們所發現的一些成果
06:40
Or better yet然而, let's all collectively decipher解碼.
159
385000
3000
甚至,讓我們一起來解讀這些文字符號
06:43
Are you ready準備?
160
388000
2000
準備好了嗎?
06:45
The first thing that you need to do when you have an undeciphered破譯 script腳本
161
390000
3000
當你有段未解的文字符號時,你必須先
06:48
is try to figure數字 out the direction方向 of writing寫作.
162
393000
2000
去分辨書寫的方向
06:50
Here are two texts文本 that contain包含 some symbols符號 on them.
163
395000
3000
這裡有兩段相同符號的文字
06:53
Can you tell me
164
398000
2000
你能告訴我
06:55
if the direction方向 of writing寫作 is right to left or left to right?
165
400000
3000
書寫的方向是由右到左還是左到右呢?
06:58
I'll give you a couple一對 of seconds.
166
403000
3000
我給大家幾分鐘的時間
07:01
Okay. Right to left, how many許多? Okay.
167
406000
3000
好!右到左。有多少?好
07:04
Okay. Left to right?
168
409000
2000
左到右呢?
07:06
Oh, it's almost幾乎 50/50. Okay.
169
411000
2000
喔,大概一半一半。好
07:08
The answer回答 is:
170
413000
2000
答案是:
07:10
if you look at the left-hand左手 side of the two texts文本,
171
415000
2000
如果你看這兩段文字的左側
07:12
you'll你會 notice注意 that there's a cramping抽筋 of signs跡象,
172
417000
3000
你會注意到左邊的符號有點擁擠
07:15
and it seems似乎 like 4,000 years年份 ago,
173
420000
2000
似乎是4000年前
07:17
when the scribe was writing寫作 from right to left,
174
422000
2000
當書寫者從右寫到左時
07:19
they ran out of space空間.
175
424000
2000
因空間不夠
07:21
And so they had to cram填滿 the sign標誌.
176
426000
2000
只得縮小間距
07:23
One of the signs跡象 is also below下面 the text文本 on the top最佳.
177
428000
2000
其中有一個符號也出現在下面的文字符號中
07:25
This suggests提示 the direction方向 of writing寫作
178
430000
2000
意味著書寫的方向
07:27
was probably大概 from right to left,
179
432000
2000
應該是從右到左
07:29
and so that's one of the first things we know,
180
434000
2000
所以我們知道的第一件事是
07:31
that directionality方向性 is a very key aspect方面 of linguistic語言 scripts腳本.
181
436000
3000
書寫方向是語言符號中的關鍵項目
07:34
And the Indus梧桐 script腳本 now has
182
439000
2000
古印度河文字有個
07:36
this particular特定 property屬性.
183
441000
2000
特別的特徵
07:38
What other properties性能 of language語言 does the script腳本 show顯示?
184
443000
2000
這文字符號中還有什麼其他語言特徵?
07:40
Languages語言 contain包含 patterns模式.
185
445000
2000
語言會有一定模式
07:42
If I give you the letter Q
186
447000
2000
如果我給你一個字母Q
07:44
and ask you to predict預測 the next下一個 letter, what do you think that would be?
187
449000
3000
然後請你猜下一個字母,你們覺得會是什麼呢?
07:47
Most of you said U, which哪一個 is right.
188
452000
2000
大部份人都會說U,答對了
07:49
Now if I asked you to predict預測 one more letter,
189
454000
2000
現在我請你們再猜下個字母
07:51
what do you think that would be?
190
456000
2000
你們覺得會是什麼呢?
07:53
Now there's several一些 thoughts思念. There's E. It could be I. It could be A,
191
458000
3000
現在這邊有很多種答案,有人說E,有人說I,也可能是A
07:56
but certainly當然 not B, C or D, right?
192
461000
3000
但絕對不是B,C,D,對吧?
07:59
The Indus梧桐 script腳本 also exhibits展品 similar類似 kinds of patterns模式.
193
464000
3000
印度河文字也有類似的模式
08:02
There's a lot of text文本 that start開始 with this diamond-shaped菱形 symbol符號.
194
467000
3000
有很多段文字的開頭都有菱形符號
08:05
And this in turn tends趨向 to be followed其次
195
470000
2000
接著下個字
08:07
by this quotation行情 marks-like商標類 symbol符號.
196
472000
2000
會有類似引號的符號
08:09
And this is very similar類似 to a Q and U example.
197
474000
2000
這非常的類似Q跟U的例子
08:11
This symbol符號 can in turn be followed其次
198
476000
2000
這符號之後
08:13
by these fish-like魚肉狀 symbols符號 and some other signs跡象,
199
478000
3000
會有著類似魚等其他的符號
08:16
but never by these other signs跡象 at the bottom底部.
200
481000
2000
但不會是最底下出現的這些符號
08:18
And furthermore此外, there's some signs跡象
201
483000
2000
更詳細來說,有些符號
08:20
that really prefer比較喜歡 the end結束 of texts文本,
202
485000
2000
比較常出現在文章結尾
08:22
such這樣 as this jar-shaped罐子形 sign標誌,
203
487000
2000
像是這壺型的記號
08:24
and this sign標誌, in fact事實, happens發生 to be
204
489000
2000
事實上,這記號剛好是
08:26
the most frequently經常 occurring發生 sign標誌 in the script腳本.
205
491000
2000
在這些文句中最常出現的記號
08:28
Given特定 such這樣 patterns模式, here was our idea理念.
206
493000
3000
看出這些慣用模式後,我們有個想法
08:31
The idea理念 was to use a computer電腦
207
496000
2000
就是用電腦
08:33
to learn學習 these patterns模式,
208
498000
2000
去瞭解這些圖案
08:35
and so we gave the computer電腦 the existing現有 texts文本.
209
500000
3000
我們將這些文字符號輸入電腦
08:38
And the computer電腦 learned學到了 a statistical統計 model模型
210
503000
2000
然後電腦以某種統計模型
08:40
of which哪一個 symbols符號 tend趨向 to occur發生 together一起
211
505000
2000
算出哪些符號會一起出現
08:42
and which哪一個 symbols符號 tend趨向 to follow跟隨 each other.
212
507000
2000
而哪些符號常以先後順序出現
08:44
Given特定 the computer電腦 model模型,
213
509000
2000
使用此電腦模式
08:46
we can test測試 the model模型 by essentially實質上 quizzingquizzing it.
214
511000
3000
我們可以以測驗的方式測試此模式
08:49
So we could deliberately故意 erase抹去 some symbols符號,
215
514000
2000
如此我們可以知道某些符號可以被省去
08:51
and we can ask it to predict預測 the missing失踪 symbols符號.
216
516000
3000
甚至可以重建不完整的文字符號
08:54
Here are some examples例子.
217
519000
3000
這裡有些例子
09:00
You may可能 regard看待 this
218
525000
2000
大家可以參考一下
09:02
as perhaps也許 the most ancient game遊戲
219
527000
2000
比如說像是命運轉輪
09:04
of Wheel of Fortune幸運.
220
529000
3000
這種古老的遊戲
09:08
What we found發現
221
533000
2000
我們發現
09:10
was that the computer電腦 was successful成功 in 75 percent百分 of the cases
222
535000
2000
電腦預測符號的成功率
09:12
in predicting預測 the correct正確 symbol符號.
223
537000
2000
達75%
09:14
In the rest休息 of the cases,
224
539000
2000
而剩下的25%
09:16
typically一般 the second第二 best最好 guess猜測 or third第三 best最好 guess猜測 was the right answer回答.
225
541000
3000
理論上來說,電腦提供的第二或第三選項也會是正確答案
09:19
There's also practical實際的 use
226
544000
2000
這種預測途徑
09:21
for this particular特定 procedure程序.
227
546000
2000
很實用
09:23
There's a lot of these texts文本 that are damaged破損.
228
548000
2000
很多文字符號都已經損毀
09:25
Here's這裡的 an example of one such這樣 text文本.
229
550000
2000
這裡有個例子
09:27
And we can use the computer電腦 model模型 now to try to complete完成 this text文本
230
552000
3000
我們可以使用電腦模式來修復這段文字內容
09:30
and make a best最好 guess猜測 prediction預測.
231
555000
2000
且做出最佳的猜測
09:32
Here's這裡的 an example of a symbol符號 that was predicted預料到的.
232
557000
3000
這邊有一成功預測的例子
09:35
And this could be really useful有用 as we try to decipher解碼 the script腳本
233
560000
2000
它真的非常有用,在解開文字的過程中
09:37
by generating發電 more data數據 that we can analyze分析.
234
562000
3000
讓我們得到了更多可供分析的數據
09:40
Now here's這裡的 one other thing you can do with the computer電腦 model模型.
235
565000
3000
現在多了一件藉由電腦模式解決的例子
09:43
So imagine想像 a monkey
236
568000
2000
請想像有隻猴子
09:45
sitting坐在 at a keyboard鍵盤.
237
570000
2000
坐在鍵盤上
09:47
I think you might威力 get a random隨機 jumble混亂 of letters that looks容貌 like this.
238
572000
3000
我猜會得到ㄧ堆像這樣隨機跑出的字母
09:50
Such這樣 a random隨機 jumble混亂 of letters
239
575000
2000
這些隨機混亂的字母
09:52
is said to have a very high entropy.
240
577000
2000
說明了很高的熵
09:54
This is a physics物理 and information信息 theory理論 term術語.
241
579000
2000
這是物理跟資訊理論說法
09:56
But just imagine想像 it's a really random隨機 jumble混亂 of letters.
242
581000
3000
但想像這是相當隨機混亂的字母排列
09:59
How many許多 of you have ever spilled coffee咖啡 on a keyboard鍵盤?
243
584000
4000
你們有誰曾經將咖啡濺在鍵盤上?
10:03
You might威力 have encountered遇到 the stuck-key卡鍵 problem問題 --
244
588000
2000
可能會有鍵盤卡住的問題
10:05
so basically基本上 the same相同 symbol符號 being存在 repeated重複 over and over again.
245
590000
3000
所以基本上有些同樣的符號會一再的重複
10:08
This kind of a sequence序列 is said to have a very low entropy
246
593000
3000
這類的數列可以說有著非常低的熵
10:11
because there's no variation變異 at all.
247
596000
2000
因為它們一點都沒變化
10:13
Language語言, on the other hand, has an intermediate中間 level水平 of entropy;
248
598000
3000
語言,從別個角度說,有著中間程度的熵
10:16
it's neither也不 too rigid死板,
249
601000
2000
他的排列不會太單調
10:18
nor也不 is it too random隨機.
250
603000
2000
也不會過於隨機
10:20
What about the Indus梧桐 script腳本?
251
605000
2000
而古印度河文字呢?
10:22
Here's這裡的 a graph圖形 that plots地塊 the entropies of a whole整個 bunch of sequences序列.
252
607000
4000
我們看到以上所有例子的數值
10:26
At the very top最佳 you find the uniformly均勻 random隨機 sequence序列,
253
611000
2000
最上面是排序最為隨機的序列
10:28
which哪一個 is a random隨機 jumble混亂 of letters --
254
613000
2000
是一連串隨機的字母
10:30
and interestingly有趣, we also find
255
615000
2000
有趣的是,我們還發現
10:32
the DNA脫氧核糖核酸 sequence序列 from the human人的 genome基因組 and instrumental儀器的 music音樂.
256
617000
3000
人類DNA的排序以及旋律優美的音樂
10:35
And both of these are very, very flexible靈活,
257
620000
2000
兩者排序都很有彈性
10:37
which哪一個 is why you find them in the very high range範圍.
258
622000
2000
這是兩者數值較高
10:39
At the lower降低 end結束 of the scale規模,
259
624000
2000
在圖表較下方的地方
10:41
you find a rigid死板 sequence序列, a sequence序列 of all A's,
260
626000
2000
你可以看到最單調的排序是一串字母A
10:43
and you also find a computer電腦 program程序,
261
628000
2000
你也會發現一種電腦程式
10:45
in this case案件 in the language語言 FortranFortran語言,
262
630000
2000
一種電腦翻譯語言Fortran
10:47
which哪一個 obeys服從 really strict嚴格 rules規則.
263
632000
2000
即是照著這種嚴謹的規則
10:49
Linguistic語言 scripts腳本
264
634000
2000
語言文字符號
10:51
occupy佔據 the middle中間 range範圍.
265
636000
2000
正落於這些中間值
10:53
Now what about the Indus梧桐 script腳本?
266
638000
2000
古印度河文字呢?
10:55
We found發現 that the Indus梧桐 script腳本
267
640000
2000
我們發現它落於
10:57
actually其實 falls下降 within the range範圍 of the linguistic語言 scripts腳本.
268
642000
2000
語言文字範圍值中
10:59
When this result結果 was first published發表,
269
644000
2000
這結果首次被公開
11:01
it was highly高度 controversial爭論的.
270
646000
3000
即引起高度爭議
11:04
There were people who raised上調 a hue色調 and cry,
271
649000
3000
有人提出強烈批評
11:07
and these people were the ones那些 who believed相信
272
652000
2000
這些批評的人相信
11:09
that the Indus梧桐 script腳本 does not represent代表 language語言.
273
654000
3000
古印度河文字根本不是文字
11:12
I even started開始 to get some hate討厭 mail郵件.
274
657000
2000
我甚至收到一些惡意信函
11:14
My students學生們 said
275
659000
2000
我的學生說
11:16
that I should really seriously認真地 consider考慮 getting得到 some protection保護.
276
661000
3000
我應該要好好保護自身安危
11:19
Who'd誰願意 have thought
277
664000
2000
誰能料到
11:21
that deciphering破譯 could be a dangerous危險 profession職業?
278
666000
2000
解讀古文字會變成一種危險職業
11:23
What does this result結果 really show顯示?
279
668000
2000
這結果說明了什麼?
11:25
It shows節目 that the Indus梧桐 script腳本
280
670000
2000
他說明了古印度河文字
11:27
shares分享 an important重要 property屬性 of language語言.
281
672000
2000
有著重要的語言特徵
11:29
So, as the old saying goes,
282
674000
2000
所以,就像古老的諺語說得
11:31
if it looks容貌 like a linguistic語言 script腳本
283
676000
2000
如果這看起來像是語言性文字
11:33
and it acts行為 like a linguistic語言 script腳本,
284
678000
2000
且它也有語言性文字的功用
11:35
then perhaps也許 we may可能 have a linguistic語言 script腳本 on our hands.
285
680000
3000
那麼我們所擁有的就是語言性文字
11:38
What other evidence證據 is there
286
683000
2000
有什麼其他證據顯示
11:40
that the script腳本 could actually其實 encode編碼 language語言?
287
685000
2000
這類文字能對解譯語言呢?
11:42
Well linguistic語言 scripts腳本 can actually其實 encode編碼 multiple languages語言.
288
687000
3000
語言性文字的確能解譯多種語言
11:45
So for example, here's這裡的 the same相同 sentence句子 written書面 in English英語
289
690000
3000
例如,一句英文
11:48
and the same相同 sentence句子 written書面 in Dutch荷蘭人
290
693000
2000
還有一句相同的荷蘭文
11:50
using運用 the same相同 letters of the alphabet字母.
291
695000
2000
都用同樣的字母
11:52
If you don't know Dutch荷蘭人 and you only know English英語
292
697000
3000
如果你不懂荷蘭文,只懂英文
11:55
and I give you some words in Dutch荷蘭人,
293
700000
2000
你看一些荷蘭文
11:57
you'll你會 tell me that these words contain包含
294
702000
2000
你會告訴我裡面有些字
11:59
some very unusual異常 patterns模式.
295
704000
2000
的排序很奇怪
12:01
Some things are not right,
296
706000
2000
有點不對勁
12:03
and you'll你會 say these words are probably大概 not English英語 words.
297
708000
3000
你會說這些字不是英文
12:06
The same相同 thing happens發生 in the case案件 of the Indus梧桐 script腳本.
298
711000
2000
在古印度河文字中,也是同樣的道理
12:08
The computer電腦 found發現 several一些 texts文本 --
299
713000
2000
電腦發現了一些文字
12:10
two of them are shown顯示 here --
300
715000
2000
這裡有兩段
12:12
that have very unusual異常 patterns模式.
301
717000
2000
他們都有著非常少見的符號
12:14
So for example the first text文本:
302
719000
2000
以第一個例子來說
12:16
there's a doubling加倍 of this jar-shaped罐子形 sign標誌.
303
721000
3000
可以看到兩個壺形記號出現
12:19
This sign標誌 is the most frequently-occurring多發病 sign標誌
304
724000
2000
這種記號是最常在古印度河文字中
12:21
in the Indus梧桐 script腳本,
305
726000
2000
發現的符號
12:23
and it's only in this text文本
306
728000
2000
但只有在這
12:25
that it occurs發生 as a doubling加倍 pair.
307
730000
2000
以一對的方式出現
12:27
Why is that the case案件?
308
732000
2000
為什麼在這裡是是這樣呢?
12:29
We went back and looked看著 at where these particular特定 texts文本 were found發現,
309
734000
3000
我們回頭看這些文字符號的出處
12:32
and it turns out that they were found發現
310
737000
2000
發現他們來自
12:34
very, very far away from the Indus梧桐 Valley.
311
739000
2000
離古印度河文明非常非常遠的地方
12:36
They were found發現 in present當下 day Iraq伊拉克 and Iran伊朗.
312
741000
3000
他們來自現今的伊拉克以及伊朗
12:39
And why were they found發現 there?
313
744000
2000
為何出處會在那裡?
12:41
What I haven't沒有 told you is that
314
746000
2000
我還沒跟你說的是
12:43
the Indus梧桐 people were very, very enterprising進取.
315
748000
2000
古印度人很會做生意
12:45
They used to trade貿易 with people pretty漂亮 far away from where they lived生活,
316
750000
3000
他們常和遠地區的人們做生意
12:48
and so in this case案件, they were traveling旅行 by sea
317
753000
3000
也因此,他們會越洋交易
12:51
all the way to Mesopotamia美索不達米亞, present-day今天 Iraq伊拉克.
318
756000
3000
交易地區遍及美索不達米亞,亦即現今的伊拉克
12:54
And what seems似乎 to have happened發生 here
319
759000
2000
我們所看到的
12:56
is that the Indus梧桐 traders貿易商, the merchants商家,
320
761000
3000
是印度商人
12:59
were using運用 this script腳本 to write a foreign國外 language語言.
321
764000
3000
用他們的文字符號寫下外來語
13:02
It's just like our English英語 and Dutch荷蘭人 example.
322
767000
2000
就像我們這邊所舉的英文以及荷蘭語意思相同
13:04
And that would explain說明 why we have these strange奇怪 patterns模式
323
769000
2000
這也是我們看到這些異常排序的原因
13:06
that are very different不同 from the kinds of patterns模式 you see in the text文本
324
771000
3000
它們和你看到古印度河文字符號
13:09
that are found發現 within the Indus梧桐 Valley.
325
774000
3000
大相徑庭
13:12
This suggests提示 that the same相同 script腳本, the Indus梧桐 script腳本,
326
777000
2000
這也意謂著,同樣的古印度文字符號
13:14
could be used to write different不同 languages語言.
327
779000
3000
可能被用在不同的語言上
13:17
The results結果 we have so far seem似乎 to point to the conclusion結論
328
782000
3000
我們從此可論斷
13:20
that the Indus梧桐 script腳本 probably大概 does represent代表 language語言.
329
785000
3000
古印度河的文字符號,的確是語言
13:23
If it does represent代表 language語言,
330
788000
2000
它的確代表一種語言
13:25
then how do we read the symbols符號?
331
790000
2000
我們如何解讀這些符號呢?
13:27
That's our next下一個 big challenge挑戰.
332
792000
2000
這是我們接下來的難題
13:29
So you'll你會 notice注意 that many許多 of the symbols符號
333
794000
2000
所以你會注意到這些符號
13:31
look like pictures圖片 of humans人類, of insects昆蟲,
334
796000
2000
看起來像是人,像是昆蟲
13:33
of fishes魚類, of birds鳥類.
335
798000
3000
像魚,像鳥
13:36
Most ancient scripts腳本
336
801000
2000
大部份的古代文字符號
13:38
use the rebus畫謎 principle原理,
337
803000
2000
都是象形字
13:40
which哪一個 is, using運用 pictures圖片 to represent代表 words.
338
805000
3000
以圖像代表文字
13:43
So as an example, here's這裡的 a word.
339
808000
3000
像之前的例子,這裡有個字
13:46
Can you write it using運用 pictures圖片?
340
811000
2000
你可以用圖畫來寫它嗎?
13:48
I'll give you a couple一對 seconds.
341
813000
2000
我給你幾分鐘時間
13:50
Got it?
342
815000
2000
好了嗎?
13:52
Okay. Great.
343
817000
2000
很好!
13:54
Here's這裡的 my solution.
344
819000
2000
這是我的解決方法
13:56
You could use the picture圖片 of a bee蜜蜂 followed其次 by a picture圖片 of a leaf --
345
821000
2000
你可以先畫一隻蜜蜂,接著畫一片樹葉
13:58
and that's "belief信仰," right.
346
823000
2000
這就代表 “相信”,對吧
14:00
There could be other solutions解決方案.
347
825000
2000
還有其他畫法
14:02
In the case案件 of the Indus梧桐 script腳本,
348
827000
2000
在古印度河文字裡
14:04
the problem問題 is the reverse相反.
349
829000
2000
問題剛好相反
14:06
You have to figure數字 out the sounds聲音 of each of these pictures圖片
350
831000
3000
你必須先瞭解每個圖像的聲音
14:09
such這樣 that the entire整個 sequence序列 makes品牌 sense.
351
834000
2000
才能瞭解整個排序的意思
14:11
So this is just like a crossword填字遊戲 puzzle難題,
352
836000
3000
就像是字謎遊戲
14:14
except that this is the mother母親 of all crossword填字遊戲 puzzles謎題
353
839000
3000
只不過這是所有字謎遊戲之始
14:17
because the stakes賭注 are so high if you solve解決 it.
354
842000
4000
因為代價實在太高了
14:21
My colleagues同事, IravathamIravatham Mahadevan馬哈德 and Asko阿斯科 ParpolaParpola,
355
846000
3000
我的同事,曼哈達凡以及巴布達
14:24
have been making製造 some headway前進 on this particular特定 problem問題.
356
849000
2000
對這問題都頗有心得
14:26
And I'd like to give you a quick example of Parpola'sParpola的 work.
357
851000
2000
我可以讓你看一下巴布達的成果
14:28
Here's這裡的 a really short text文本.
358
853000
2000
這是很短的文字符號
14:30
It contains包含 seven vertical垂直 strokes followed其次 by this fish-like魚肉狀 sign標誌.
359
855000
3000
有七條直線後面有一條魚的圖象
14:33
And I want to mention提到 that these seals密封件 were used
360
858000
2000
我想要說明這些印章是被用來
14:35
for stamping沖壓 clay粘土 tags標籤
361
860000
2000
蓋在黏土標簽
14:37
that were attached to bundles捆綁 of goods產品,
362
862000
2000
然後被貼在貨物上
14:39
so it's quite相當 likely容易 that these tags標籤, at least最小 some of them,
363
864000
3000
所以它會很像這些標簽,至少其中的某些
14:42
contain包含 names of merchants商家.
364
867000
2000
有著商號的名字
14:44
And it turns out that in India印度
365
869000
2000
在印度
14:46
there's a long tradition傳統
366
871000
2000
長久以來即習慣
14:48
of names being存在 based基於 on horoscopes八字
367
873000
2000
以星座來命名
14:50
and star constellations星座 present當下 at the time of birth分娩.
368
875000
3000
以星群象徵出生時間
14:53
In Dravidian德拉威 languages語言,
369
878000
2000
在德拉威語系裡
14:55
the word for fish is "meenmeen"
370
880000
2000
魚的發音是 “meen"
14:57
which哪一個 happens發生 to sound聲音 just like the word for star.
371
882000
3000
而這個字的發音跟星星剛好相同
15:00
And so seven stars明星
372
885000
2000
所以七顆星星
15:02
would stand for "elu埃盧 meenmeen,"
373
887000
2000
代表 "elu meen"
15:04
which哪一個 is the Dravidian德拉威 word
374
889000
2000
就是德拉威語的
15:06
for the Big Dipper star constellation星座.
375
891000
2000
北斗七星
15:08
Similarly同樣, there's another另一個 sequence序列 of six stars明星,
376
893000
3000
同樣地,這裡有六顆星
15:11
and that translates轉換 to "aru阿魯 meenmeen,"
377
896000
2000
可以翻成 ”aru meen"
15:13
which哪一個 is the old Dravidian德拉威 name名稱
378
898000
2000
在德拉威語
15:15
for the star constellation星座 Pleiades.
379
900000
2000
代表昴宿星團
15:17
And finally最後, there's other combinations組合,
380
902000
3000
事實上,還有其他的組合
15:20
such這樣 as this fish sign標誌 with something that looks容貌 like a roof屋頂 on top最佳 of it.
381
905000
3000
像是,魚的圖象上有個蓋子
15:23
And that could be translated翻譯 into "meyMEY meenmeen,"
382
908000
3000
可以翻成 "mey meen"
15:26
which哪一個 is the old Dravidian德拉威 name名稱 for the planet行星 Saturn土星.
383
911000
3000
在德拉威語意思是土星
15:29
So that was pretty漂亮 exciting扣人心弦.
384
914000
2000
讓人感到振奮的是
15:31
It looks容貌 like we're getting得到 somewhere某處.
385
916000
2000
我們似乎有所進展
15:33
But does this prove證明
386
918000
2000
這證明
15:35
that these seals密封件 contain包含 Dravidian德拉威 names
387
920000
2000
這些印章有著以行星
15:37
based基於 on planets行星 and star constellations星座?
388
922000
2000
以及星群來命名的德威語
15:39
Well not yet然而.
389
924000
2000
但不是這樣就結束了
15:41
So we have no way of validating證實
390
926000
2000
我們仍無法證實
15:43
these particular特定 readings讀數,
391
928000
2000
這樣的解讀方式無誤
15:45
but if more and more of these readings讀數 start開始 making製造 sense,
392
930000
3000
但如果越來越多的解讀都有道理
15:48
and if longer and longer sequences序列
393
933000
2000
越來越長的排序解讀
15:50
appear出現 to be correct正確,
394
935000
2000
都是正確的
15:52
then we know that we are on the right track跟踪.
395
937000
2000
我們就能知道這樣的方法是對的
15:54
Today今天,
396
939000
2000
今天
15:56
we can write a word such這樣 as TEDTED
397
941000
3000
我們可以用埃及象形文字以及楔形文字
15:59
in Egyptian埃及人 hieroglyphics象形文字 and in cuneiform楔形的 script腳本,
398
944000
3000
寫下TED這樣的名字
16:02
because both of these were deciphered破譯
399
947000
2000
因為人們在十九世紀
16:04
in the 19th century世紀.
400
949000
2000
早已解開兩者的文字符號內容
16:06
The decipherment解密 of these two scripts腳本
401
951000
2000
對於兩種文字的解讀
16:08
enabled啟用 these civilizations文明 to speak說話 to us again directly.
402
953000
3000
使得我們現在能瞭解過去的文明
16:11
The Mayans瑪雅人
403
956000
2000
二十世紀
16:13
started開始 speaking請講 to us in the 20th century世紀,
404
958000
2000
我們也開始瞭解馬亞文明
16:15
but the Indus梧桐 civilization文明 remains遺跡 silent無聲.
405
960000
3000
但我們至今仍無法瞭解古印度河文明
16:18
Why should we care關心?
406
963000
2000
為什麼我們需要這麼在乎
16:20
The Indus梧桐 civilization文明 does not belong屬於
407
965000
2000
印度河文明不僅屬於
16:22
to just the South Indians印度人 or the North Indians印度人
408
967000
2000
南印度或是北印度人
16:24
or the Pakistanis巴基斯坦人;
409
969000
2000
或是巴基斯坦人
16:26
it belongs屬於 to all of us.
410
971000
2000
這屬於我們所有人
16:28
These are our ancestors祖先 --
411
973000
2000
這些是我們的祖先
16:30
yours你的 and mine.
412
975000
2000
你我共同的祖先
16:32
They were silenced沉默
413
977000
2000
他們因為遭遇了
16:34
by an unfortunate不幸的 accident事故 of history歷史.
414
979000
2000
某個不幸的歷史意外而不為人知
16:36
If we decipher解碼 the script腳本,
415
981000
2000
如果我們解開了這些文字符號
16:38
we would enable啟用 them to speak說話 to us again.
416
983000
2000
就能再次瞭解這些符號的意義
16:40
What would they tell us?
417
985000
3000
他們會傳達什麼呢?
16:43
What would we find out about them? About us?
418
988000
3000
我們又會發現什麼呢?是關於我們的事情嗎?
16:46
I can't wait to find out.
419
991000
3000
我等不及發現
16:49
Thank you.
420
994000
2000
謝謝大家
16:51
(Applause掌聲)
421
996000
4000
(鼓掌)
Translated by Ivy Chinying Tsai
Reviewed by Shiau Han Li

▲Back to top

ABOUT THE SPEAKER
Rajesh Rao - Computational neuroscientist
Rajesh Rao seeks to understand the human brain through computational modeling, on two fronts: developing computer models of our minds, and using tech to decipher the 4,000-year-old lost script of the Indus Valley civilization.

Why you should listen

Rajesh Rao is looking for the computational principles underlying the brain's remarkable ability to learn, process and store information --  hoping to apply this knowledge to the task of building adaptive robotic systems and artificially intelligent agents.

Some of the questions that motivate his research include: How does the brain learn efficient representations of novel objects and events occurring in the natural environment? What are the algorithms that allow useful sensorimotor routines and behaviors to be learned? What computational mechanisms allow the brain to adapt to changing circumstances and remain fault-tolerant and robust?

By investigating these questions within a computational and probabilistic framework, it is often possible to derive algorithms that not only provide functional interpretations of neurobiological properties but also suggest solutions to difficult problems in computer vision, speech, robotics and artificial intelligence.

More profile about the speaker
Rajesh Rao | Speaker | TED.com