sponsored links
TEDxCaFoscariU

Frederic Kaplan: How to build an information time machine

フレデリック・カプラン: 情報の世界をめぐる、タイムマシンの制作

June 19, 2013

中世のFacebookを見れたら、どうでしょう? これは、それほど突飛な話でもありません。楽しく興味深いトークで、研究者・エンジニアのフレデリック・カプランが堂々発表するのは「ヴェネツィア・タイムマシン」というプロジェクトです。全長80キロにも及ぶ保管庫にある書籍をデジタル化し、1000年にもわたるヴェネツィアの歴史や地理を再現します。(TEDxCaFoscariUで撮影)

Frederic Kaplan - Digital humanities researcher
Frederic Kaplan seeks to digitize vast archives of historical information to make maps that move -- through time. Full bio

sponsored links
Double-click the English subtitles below to play the video.
This is an image of the planet Earth.
これは 地球の画像です
00:12
It looks very much like the Apollo pictures
アポロ17号から撮影された
あの有名な写真に
00:14
that are very well known.
よく似ていますよね
00:18
There is something different;
でも ちょっと違います
00:19
you can click on it,
この画像はクリックでき
00:21
and if you click on it,
クリックすることで
00:23
you can zoom in on almost any place on the Earth.
地球上の ほぼ全ての地点に
ズームインできます
00:24
For instance, this is a bird's-eye view
例えば これは
空から見た―
00:27
of the EPFL campus.
ローザンヌ工科大学(EPFL)の
キャンパスです
00:29
In many cases, you can also see
多くの場合
00:32
how a building looks from a nearby street.
近くの通りから見た
建物の様子も見ることができます
00:34
This is pretty amazing.
本当に素晴らしいことです
00:38
But there's something missing in this wonderful tour:
でも この素敵なツアーには
あることが欠けています
00:39
It's time.
「時間」です
00:42
i'm not really sure when this picture was taken.
この写真がいつ撮影されたのか
分からないばかりか
00:45
I'm not even sure it was taken
空撮写真と
同じ時期に
00:48
at the same moment as the bird's-eye view.
撮られたのかさえ
分かりません
00:49
In my lab, we develop tools
私の研究室で
開発しているツールは
00:55
to travel not only in space
空間だけでなく
00:57
but also through time.
時間を超えて
旅ができるようにします
00:59
The kind of question we're asking is
私たちが投げかけている
問いはこうです
01:02
Is it possible to build something
過去のGoogleマップのようなものを
作れないか?
01:04
like Google Maps of the past?
過去のGoogleマップのようなものを
作れないか?
01:05
Can I add a slider on top of Google Maps
つまり Googleマップの上部に
スクロールバーを付けて
01:07
and just change the year,
それで年を遡れるように
できないか?
01:10
seeing how it was 100 years before,
百年前や
01:12
1,000 years before?
千年前の様子を
01:14
Is that possible?
見られるようにできないか?
01:16
Can I reconstruct social networks of the past?
過去のソーシャル・ネットワークを
再現できないか?
01:18
Can I make a Facebook of the Middle Ages?
中世のFacebookを作れないか?
01:20
So, can I build time machines?
タイムマシンを作れないか?
01:23
Maybe we can just say, "No, it's not possible."
単に「不可能だ」と言うことも
できるでしょう
01:27
Or, maybe, we can think of it from an information point of view.
しかし 情報という観点から
考えたらどうでしょう
01:29
This is what I call the information mushroom.
これは 「キノコ型情報」と
呼んでいるもので
01:33
Vertically, you have the time.
縦軸に 時間
01:36
and horizontally, the amount of digital information available.
横軸に デジタル情報蓄積量を
示したグラフです
01:38
Obviously, in the last 10 years, we have much information.
過去10年 たくさんの情報があることは
一目瞭然ですね
01:41
And obviously the more we go in the past, the less information we have.
そして 時間を遡るにつれ
情報は減っていきます
01:44
If we want to build something like Google Maps of the past,
過去のGoogleマップや
01:48
or Facebook of the past,
Facebookを作るためには
01:50
we need to enlarge this space,
この部分を広げて
ちょうど
01:52
we need to make that like a rectangle.
長方形にする必要があります
01:53
How do we do that?
どうすればいいでしょうか?
01:55
One way is digitization.
1つは デジタル化です
01:57
There's a lot of material available --
資料は
たくさんあります
01:59
newspaper, printed books, thousands of printed books.
新聞や書籍―
それも何千という書籍です
02:01
I can digitize all these.
これらを全て
デジタル化して
02:07
I can extract information from these.
そこから情報を
抽出できます
02:09
Of course, the more you go in the past,
the less information you will have.
もちろん 昔に行くにつれ
情報は少なくなるので
02:11
So, it might not be enough.
十分では
ないかもしれません
02:15
So, I can do what historians do.
ですから
歴史学者のように
02:17
I can extrapolate.
「推定」を行うのです
02:20
This is what we call, in computer science, simulation.
コンピュータ科学の世界で言う
シミュレーションです
02:21
If I take a log book,
ここに 航海日誌が
あるとしましょう
02:26
I can consider, it's not just a log book
それを ただの日誌で
バチカンの船長が
02:28
of a Venetian captain going to a particular journey.
ある航海をつづるもの
と捉えるのではなく
02:30
I can consider it is actually a log book
その日誌に
書かれているのは
02:33
which is representative of
many journeys of that period.
当時 数多くされた航海の
代表例だと捉えるのです
02:35
I'm extrapolating.
こうして推定を
するわけです
02:37
If I have a painting of a facade,
建物の外観を
描いた絵があれば
02:39
I can consider it's not just that particular building,
それを単に 特定の建物を
描いたものとするのではなく
02:42
but probably it also shares the same grammar
おそらく同じ構造は
情報が残っていない―
02:44
of buildings where we lost any information.
ほかの建物にも
採用されていたと考えるのです
02:48
So if we want to construct a time machine,
ですから
タイムマシンを作るのに
02:52
we need two things.
必要なものは2つです
02:55
We need very large archives,
大量の保存記録と
02:56
and we need excellent specialists.
優秀な専門家です
02:59
The Venice Time Machine,
ヴェネツィア・タイムマシンという
03:01
the project I'm going to talk to you about,
プロジェクトについて
お話しします
03:03
is a joint project between the EPFL
これは ローザンヌ工科大学と
03:05
and the University of Venice Ca'Foscari.
ヴェネツィア・カ・フォスカリ大学との
共同プロジェクトです
03:08
There's something very peculiar about Venice,
ヴェネツィアに
特有なのは
03:11
that its administration has been
政府がずっと
03:13
very, very bureaucratic.
非常に官僚的であることです
03:16
They've been keeping track of everything,
あらゆることを
記録してきています
03:18
almost like Google today.
今日のGoogleのようなものです
03:20
At the Archivio di Stato,
ヴェネツィアの古文書館には
03:23
you have 80 kilometers of archives
全長80キロにわたる
保管庫があり
03:25
documenting every aspect
ヴェネツィア生活の
全てが
03:27
of the life of Venice over
more than 1,000 years.
千年以上にわたり
記録されてきています
03:29
You have every boat that goes out,
出航・到着した船も
03:31
every boat that comes in.
全て分かります
03:33
You have every change that was made in the city.
市内の あらゆる変化が
記録されています
03:34
This is all there.
これらの情報は
全て そこにあるのです
03:37
We are setting up a 10-year digitization program
今 デジタル化の
10年計画を立てており
03:40
which has the objective of transforming
この膨大な資料を
03:44
this immense archive
巨大な情報システムに
03:45
into a giant information system.
変えようとしています
03:47
The type of objective we want to reach
目標として
掲げているのは
03:49
is 450 books a day that can be digitized.
一日 450冊の本を
デジタル化することです
03:51
Of course, when you digitize, that's not enough,
当然 デジタル化したところで
十分ではありません
03:56
because these documents,
というのも
これらの文書が
03:58
most of them are in Latin, in Tuscan,
書かれているのは
たいてい ラテン語やトスカナ語
03:59
in Venetian dialect,
ヴェネツィアの方言なので
04:02
so you need to transcribe them,
文字に起こして
04:04
to translate them in some cases,
場合により 翻訳もして
04:05
to index them,
索引を付ける必要があり
04:07
and this is obviously not easy.
どう見ても
簡単なことではないのです
04:08
In particular, traditional optical
character recognition method
特に これまでの
光学式文字認識(OCR)方法は
04:10
that can be used for printed manuscripts,
印刷原稿には
使えますが
04:14
they do not work well on the handwritten document.
手書きの文書となると
うまく行きません
04:15
So the solution is actually to take inspiration
これを解決するため
参考にしたのは
04:19
from another domain: speech recognition.
音声認識の
分野です
04:22
This is a domain of something
that seems impossible,
音声認識は
不可能と思われたことですが
04:24
which can actually be done,
ただ条件を
加えるだけで
04:27
simply by putting additional constraints.
実現することが
できます
04:29
If you have a very good model
必要なのは
使われている言語の―
04:31
of a language which is used,
良いモデルです
04:33
if you have a very good model of a document,
つまり
構成が整った文書の―
04:34
how well they are structured.
良いモデルがあれば
よいのです
04:36
And these are administrative documents.
これらは
行政文書ですから
04:38
They are well structured in many cases.
多くは
構成が整っています
04:39
If you divide this huge archive into smaller subsets
膨大な保存記録を
細かく分類し
04:41
where a smaller subset
actually shares similar features,
同じような特徴ごとに
分類ができれば
04:45
then there's a chance of success.
うまくいく可能性が
あります
04:48
If we reach that stage, then there's something else:
その段階まで行けば
他のこともできます
04:54
we can extract from this document events.
この文書から
出来事を抽出できるのです
04:57
Actually probably 10 billion events
実際 おそらく
この保存記録から
05:00
can be extracted from this archive.
100万件の出来事が
抽出できます
05:02
And this giant information system
さらに この巨大な
情報システムは
05:04
can be searched in many ways.
さまざまな方法で
検索できます
05:06
You can ask questions like,
こんな質問も
できます
05:08
"Who lived in this palazzo in 1323?"
「1323年に この宮殿に
住んでいたのは誰?」
05:09
"How much cost a sea bream at the Realto market
「1434年に
レアルト市場で
05:12
in 1434?"
鯛はいくらで
売られていた?」
05:14
"What was the salary
「ムラノのガラス職人の
05:16
of a glass maker in Murano
給料はいくらだった?
05:17
maybe over a decade?"
例えば この10年で」
05:19
You can ask even bigger questions
もっと大きな質問もできます
05:21
because it will be semantically coded.
意味に応じて
コード化されているからです
05:22
And then what you can do is put that in space,
それを場所と
結びつけることもできます
05:25
because much of this information is spatial.
多くの情報は
場所と関係しているからです
05:27
And from that, you can do things like
そこから
この都市の
05:29
reconstructing this extraordinary journey
素晴らしい歴史を
たどることができます
05:31
of that city that managed to
have a sustainable development
この都市が
千年以上もの時を超えて
05:33
over a thousand years,
常に環境との
均衡を保ちながら
05:37
managing to have all the time
持続的な発展を
とげてきた―
05:39
a form of equilibrium with its environment.
その軌跡を
たどるのです
05:40
You can reconstruct that journey,
都市の歴史を
再構築して
05:43
visualize it in many different ways.
さまざまな形で
ビジュアル化できます
05:45
But of course, you cannot understand
Venice if you just look at the city.
当然 ヴェネツィアを理解するには
その都市だけではなく
05:47
You have to put it in a larger European context.
広くヨーロッパという
文脈で見る必要があります
05:50
So the idea is also to document all the things
ですから
ヨーロッパで起こった―
05:53
that worked at the European level.
全ての事柄を
記録するのです
05:55
We can reconstruct also the journey
海洋帝国時代の
ヴェネツィアの動きを
05:58
of the Venetian maritime empire,
再現することも
できます
06:00
how it progressively controlled the Adriatic Sea,
どのようにアドリア海の
支配を強めていき
06:02
how it became the most powerful medieval empire
どのように 当時
06:05
of its time,
中世で最強の帝国になり
06:09
controlling most of the sea routes
東から南にわたる
06:10
from the east to the south.
ほとんどの海上航路を押さえたかです
06:12
But you can even do other things,
他のこともできます
06:17
because in these maritime routes,
こうした海上航路には
06:19
there are regular patterns.
決まったパターンがあるからです
06:21
You can go one step beyond
さらに一歩進めて
06:23
and actually create a simulation system,
シミュレーション・システムを作り
06:26
create a Mediterranean simulator
地中海のシミュレーターを作れば
06:28
which is capable actually of reconstructing
欠けている情報でさえ
06:31
even the information we are missing,
再構築をすることができ
06:33
which would enable us to have
questions you could ask
こんな質問も
受けられるようになります
06:35
like if you were using a route planner.
まるで旅行代理店に
相談する感じで
06:38
"If I am in Corfu in June 1323
「1323年6月に
コルフ島から
06:41
and want to go to Constantinople,
コンスタンチノープルに行くには
06:44
where can I take a boat?"
どこで船に乗ればよいですか?」と
06:47
Probably we can answer this question
おそらく
この質問へは
06:49
with one or two or three days' precision.
1日、2日、あるいは3日の
誤差で答えられます
06:51
"How much will it cost?"
「いくらかかりますか?」
06:55
"What are the chance of encountering pirates?"
「海賊に遭遇する可能性は?」
という質問もです
06:57
Of course, you understand,
もちろん ご承知の通り
07:00
the central scientific challenge
of a project like this one
このようなプロジェクトで
核となる科学的課題は
07:02
is qualifying, quantifying and representing
このプロセスの各段階において
不確実性や矛盾を
07:05
uncertainty and inconsistency
at each step of this process.
制限・数量化し
説明をすることです
07:08
There are errors everywhere,
誤りは どこにでもあります
07:12
errors in the document, it's
the wrong name of the captain,
文書にもです
船長は違う名前で
07:14
some of the boats never actually took to sea.
船は実は出航しなかったかも
しれません
07:17
There are errors in translation, interpretative biases,
翻訳や解釈上の誤りも
あるでしょう
07:20
and on top of that, if you add algorithmic processes,
さらに アルゴリズム的処理を
加えれば
07:25
you're going to have errors in recognition,
認識や抽出においても
07:28
errors in extraction,
誤りが出てくるでしょう
07:31
so you have very, very uncertain data.
ですから ここにあるのは
非常に不確実なデータなのです
07:33
So how can we detect and
correct these inconsistencies?
では どうすれば
こうした矛盾を見つけ修正できるでしょう?
07:38
How can we represent that form of uncertainty?
不確実性の形式を
どう説明できるでしょう?
07:42
It's difficult. One thing you can do
難しいことですが
できることとしたら
07:45
is document each step of the process,
プロセスの各段階を
記録して
07:47
not only coding the historical information
歴史的情報だけでなく
07:50
but what we call the meta-historical information,
いわゆる「メタヒストリー情報」も
コード化するのです
07:52
how is historical knowledge constructed,
歴史的知識が
どう形成されたか
07:55
documenting each step.
各段階で
記録するのです
07:57
That will not guarantee that we actually converge
これによって
ヴェネツィアの
07:59
toward a single story of Venice,
歴史を一つに
収斂させられるとは限りません
08:01
but probably we can actually reconstruct
でも おそらく
完全に記録をもとにした―
08:03
a fully documented potential story of Venice.
ヴェネツィアの歴史を
再構築できます
08:06
Maybe there's not a single map.
もしかしたら
地図は一つでなく
08:09
Maybe there are several maps.
複数あるかも
しれません
08:10
The system should allow for that,
システムは
それを許容すべきなのです
08:12
because we have to deal with
a new form of uncertainty,
不確実性の新たな形式を
扱わないといけないからです
08:14
which is really new for this type of giant databases.
その形式は この種の巨大データベースには
新しいものなのですから
08:17
And how should we communicate
では この新しい研究成果を
08:22
this new research to a large audience?
どうすれば 多くの人に
伝えられるでしょう?
08:24
Again, Venice is extraordinary for that.
あらためて申し上げると
ヴェネツィアはそれに最適です
08:28
With the millions of visitors that come every year,
毎年 何百万もの
人々が訪れており
08:31
it's actually one of the best places
未来の博物館を
つくるには
08:33
to try to invent the museum of the future.
最もふさわしい場所なのです
08:35
Imagine, horizontally you see the reconstructed map
想像してみてください
下に ある年の
08:38
of a given year,
再現地図を置き
08:41
and vertically, you see the document
壁には
その再現に使用された―
08:42
that served the reconstruction,
例えば 絵画などの
08:45
paintings, for instance.
資料が見られるのです
08:47
Imagine an immersive system that permits
この没入型システムによって
08:50
to go and dive and reconstruct
the Venice of a given year,
その年のヴェネツィアに
入り込んで再構築し
08:53
some experience you could share within a group.
まわりの人と
その体験を共有できるのです
08:56
On the contrary, imagine actually that you start
一方で
ヴェネツィアの原稿などの
08:59
from a document, a Venetian manuscript,
文書から始めて
09:01
and you show, actually, what
you can construct out of it,
それから何が言えるか
見せることができます
09:03
how it is decoded,
どのように解読がされ
09:06
how the context of that document can be recreated.
どのような文脈で
文書が再生されたかなどです
09:08
This is an image from an exhibit
こちらの画像は
09:11
which is currently conducted in Geneva
ジュネーブで
現在行われている展示で
09:13
with that type of system.
同様なシステムを使って
出したイメージです
09:15
So to conclude, we can say that
結論として言えるのは
09:17
research in the humanities is about to undergo
人文科学の研究は 今
09:19
an evolution which is maybe similar
進化を遂げようとしています
09:22
to what happened to life sciences 30 years ago.
ちょうど 30年前に
生物科学に起こったような進化です
09:24
It's really a question of scale.
まさに規模の問題なのです
09:29
We see projects which are
こうしたプロジェクトは
09:33
much beyond any single research team can do,
1つの研究チームで
できる範囲を大きく超えるもので
09:37
and this is really new for the humanities,
人文科学にとっては
今までなかったことなのです
09:41
which very often take the habit of working
私たちは しばしば
小さなグループや
09:43
in small groups or only with a couple of researchers.
数名の研究者だけで
研究する傾向にありますが
09:47
When you visit the Archivio di Stato,
あの古文書館を訪れてみれば
09:51
you feel this is beyond what any single team can do,
1つの研究チームで
できることを超えていて
09:53
and that should be a joint and common effort.
共同で行うべきものというのが
わかるでしょう
09:56
So what we must do for this paradigm shift
こうしたパラダイム・シフトに向けて
私たちは
09:59
is actually foster a new generation
「デジタル古典研究者」という
新たな世代を育む必要があるのです
10:03
of "digital humanists"
「デジタル古典研究者」という
新たな世代を育む必要があるのです
10:04
that are going to be ready for this shift.
彼らこそ このシフトに
ふさわしいのです
10:06
I thank you very much.
ありがとうございました
10:08
(Applause)
(拍手)
10:10
Translator:Yuko Yoshida
Reviewer:ASAKO SHIMAOKA

sponsored links

Frederic Kaplan - Digital humanities researcher
Frederic Kaplan seeks to digitize vast archives of historical information to make maps that move -- through time.

Why you should listen

Frederic Kaplan is the Digital Humanities Chair at Ecole Polytechnique Federale de Lausanne (EPFL) and the EPFL's Digital Humanities Lab Director. Kaplan leads the lab in applying computation to humanities research. His latest project is the Venice Time Machine, a collaborative work archiving 80 kilometers of books from throughout 1000 years of Venetician history. The goal of the time machine is to create an information system which can be searched and mapped. Think of it as a Google Maps for time.

Kaplan holds a PhD in artificial intelligence from the University Paris VI. He lives in Switzerland.

sponsored links

If you need translations, you can install "Google Translate" extension into your Chrome Browser.
Furthermore, you can change playback rate by installing "Video Speed Controller" extension.

Data provided by TED.

This website is owned and operated by Tokyo English Network.
The developer's blog is here.