12:28
TED@IBM

Susan Etlinger: What do we do with all this big data?

スーザン・エトリンガー: ビッグデータにどう向き合うべきか?

Filmed:

あるデータのおかげで、心地よい気持ちになれますか?より成功していると感じることができますか?だとしたら、あなたのそのデータの解釈は間違っている可能性が高いでしょう。この驚くほど心を揺さぶられるトークで、スーザン・エトリンガーは、より多くのデータを手にすればするほどに私たちの批判的に考える能力もまた深められなければならない理由を説明してくれます。なぜなら、単に物を数えるところを超えて、それらを本当に理解するところまで到達するのは、とても難しいのです。

- Data analyst
Susan Etlinger promotes the smart, well-considered and ethical use of data. Full bio

Technology has brought us so much:
科学技術は多くをもたらしてくれました
00:13
the moon landing, the Internet,
月面着陸 インターネット
00:16
the ability to sequence the human genome.
ヒトゲノム配列の解析などです
00:18
But it also taps into a lot of our deepest fears,
ですが 私たちの奥深くにある
恐怖の多くにも それは入り込んでいます
00:21
and about 30 years ago,
およそ30年ほど前
00:24
the culture critic Neil Postman wrote a book
文化批評家のニール・ポストマンは
00:26
called "Amusing Ourselves to Death,"
"Amusing Ourselves to Death"
という著作で
00:29
which lays this out really brilliantly.
このことを的確に述べました
00:31
And here's what he said,
彼はこの著作において
00:34
comparing the dystopian visions
ジョージ・オーウェルとオルダス・ハクスリーの
00:35
of George Orwell and Aldous Huxley.
ディストピア (反ユートピア) 思想を比べて
こう書きました
00:38
He said, Orwell feared we would become
「オーウェルは私たちが
00:41
a captive culture.
囚われの身になる文化を恐れた
00:44
Huxley feared we would become a trivial culture.
ハクスリーは私たちが
取るに足らないことに耽溺する文化を恐れた
00:47
Orwell feared the truth would be
オーウェルは真実が
00:50
concealed from us,
私たちから隠蔽されることを恐れ
00:52
and Huxley feared we would be drowned
ハクスリーは私たちが無関心の海で
00:54
in a sea of irrelevance.
溺れ死ぬことを恐れた」
00:57
In a nutshell, it's a choice between
要するに
00:59
Big Brother watching you
「ビッグ・ブラザー」 に監視されるか
01:01
and you watching Big Brother.
「ビッグ・ブラザー」を監視するかの
どちらかということです
01:04
(Laughter)
(笑)
01:06
But it doesn't have to be this way.
でも そうでなくともよいのです
01:08
We are not passive consumers
of data and technology.
私たちはデータや技術を
受け身で消費するだけではありません
01:10
We shape the role it plays in our lives
生活において
データや技術が果たす役割や
01:13
and the way we make meaning from it,
その意味を見出す方法を
私たちが形作るのです
01:16
but to do that,
しかし そのためには
01:18
we have to pay as much attention to how we think
コード化の方法と同じくらいに
01:20
as how we code.
考え方にも注意を向けねばなりません
01:23
We have to ask questions, and hard questions,
物を数えるだけでなく
さらにそれを理解するために
01:25
to move past counting things
難解な問いを
01:28
to understanding them.
投げかけねばなりません
01:30
We're constantly bombarded with stories
私たちは世界に
どれ位のデータがあるか
01:33
about how much data there is in the world,
常に聞かされていますが
01:35
but when it comes to big data
ビッグデータや
01:38
and the challenges of interpreting it,
それを読み解く難解さとなると
01:39
size isn't everything.
量だけがすべてではありません
01:42
There's also the speed at which it moves,
データが動く速さも問題になりますし
01:44
and the many varieties of data types,
データには様々な種類があります
01:47
and here are just a few examples:
ごくわずかな例を挙げると
01:49
images,
画像
01:51
text,
文章
01:53
video,
映像
01:57
audio.
音声などです
01:59
And what unites this disparate types of data
これら別々の種類のデータに
共通しているのは
02:01
is that they're created by people
これらは人の手で作られ
02:04
and they require context.
文脈を必要としているということです
02:06
Now, there's a group of data scientists
さて イリノイ大学シカゴ校出身の
02:09
out of the University of Illinois-Chicago,
データ科学者のグループがあります
02:12
and they're called the Health Media Collaboratory,
このグループは
ヘルス・メディア・コラボラトリーと呼ばれ
02:14
and they've been working with
the Centers for Disease Control
米国疾病管理センターと一緒に仕事をし
02:16
to better understand
人々が
02:19
how people talk about quitting smoking,
禁煙についての言い表し方や
02:21
how they talk about electronic cigarettes,
電子タバコについての言い表し方
02:23
and what they can do collectively
禁煙を促すために協力しあえることを
02:26
to help them quit.
より良く理解するよう努めました
02:28
The interesting thing is, if you want to understand
興味深いことに 人がどのように
02:30
how people talk about smoking,
喫煙について話しているかを
理解するにはまず
02:32
first you have to understand
「smoking (吸う)」という語で
02:34
what they mean when they say "smoking."
どんな意味が表されているかを
理解せねばなりません
02:36
And on Twitter, there are four main categories:
ツイッター上には
4つの主なカテゴリーがあります
02:39
number one, smoking cigarettes;
1つ目 タバコを「吸う」
02:43
number two, smoking marijuana;
2つ目 マリファナを「吸入する」
02:46
number three, smoking ribs;
3つ目 リブ肉を「いぶす」
02:48
and number four, smoking hot women.
4つ目 「煙が出るほどホットな」イケてる女
02:51
(Laughter)
(笑)
02:55
So then you have to think about, well,
電子タバコについて
どのように話されているかは
02:58
how do people talk about electronic cigarettes?
その上で考えてみなければなりません
03:00
And there are so many different ways
これには 非常に様々な例が見られます
03:02
that people do this, and you can see from the slide
スライドからもおわかりのように
03:04
it's a complex kind of a query.
これは複雑な問いなのです
03:07
And what it reminds us is that
このことで思い出すのは
03:09
language is created by people,
言語は人々によって作られたものであり
03:13
and people are messy and we're complex
人間は厄介かつ複雑なもので
03:15
and we use metaphors and slang and jargon
比喩やスラングや隠語を
使うものだということ
03:17
and we do this 24/7 in many, many languages,
そしてそれを人間は毎日24時間
多くの言語で行い続けており
03:20
and then as soon as we figure it out, we change it up.
理解するやいなや
その言葉自体を変えてしまうことです
03:23
So did these ads that the CDC put on,
では 米国疾病管理センターが出した
03:27
these television ads that featured a woman
喉に穴が開いた女性を
映し出すこのテレビ広告は
03:32
with a hole in her throat and that were very graphic
非常に描写が露骨で
03:34
and very disturbing,
気持ちの良いものではありませんが
03:36
did they actually have an impact
この広告は実際に禁煙するように
03:38
on whether people quit?
人々を促したのでしょうか?
03:40
And the Health Media Collaboratory
respected the limits of their data,
ヘルス・メディア・コラボラトリーは
データの限界を認めてはいますが
03:43
but they were able to conclude
その結論によると
03:46
that those advertisements —
and you may have seen them —
あなた方も見たことがあるかもしれない
これらの広告によって
03:48
that they had the effect of jolting people
将来の行動が
03:51
into a thought process
影響されるかもしれないような
03:54
that may have an impact on future behavior.
思考プロセスに
人々を導いたのだそうです
03:56
And what I admire and
appreciate about this project,
私がこのプロジェクトについて
感心し 評価するのは
03:59
aside from the fact, including the fact
人間の現実的な必要性に
基づいている などの事実面はさておき
04:03
that it's based on real human need,
人間の現実的な必要性に
基づいている などの事実面はさておき
04:05
is that it's a fantastic example of courage
これが無関心の海に真っ向から
立ち向かう勇気を示す
04:09
in the face of a sea of irrelevance.
素晴らしい例であるということです
04:12
And so it's not just big data that causes
一方 理解が難しいのは
ビッグデータだけではないのです
04:16
challenges of interpretation, because let's face it,
なぜなら 考えてもみてください
04:19
we human beings have a very rich history
私たち人間は データの大小にかかわらず
04:22
of taking any amount of data, no matter how small,
それを台無しにしてしまった
豊かな歴史を
04:25
and screwing it up.
有しているではありませんか
04:27
So many years ago, you may remember
何年も前に
ロナルド・レーガン元大統領が
04:29
that former President Ronald Reagan
このように述べて厳しく批判されたことを
04:33
was very criticized for making a statement
皆さんも覚えているかもしれません
04:35
that facts are stupid things.
「事実とは馬鹿げたものである」と
04:37
And it was a slip of the tongue, let's be fair.
これは言い間違いでした
公平を期すなら ですが
04:40
He actually meant to quote John Adams' defense
彼はジョン・アダムズが
04:43
of British soldiers in the Boston Massacre trials
ボストン虐殺事件裁判において
イギリス人兵士の弁護で述べた
04:45
that facts are stubborn things.
「事実とは確固たるものである」を
引用したつもりだったのです
04:48
But I actually think there's
しかし このレーガンの言い間違いは
04:51
a bit of accidental wisdom in what he said,
偶然ながらも 一理あると私は思います
04:54
because facts are stubborn things,
なぜなら 事実は確固たるものですが
04:57
but sometimes they're stupid, too.
時に 馬鹿げてもいるからです
05:00
I want to tell you a personal story
これが 私にとってなぜ重要なのか
05:03
about why this matters a lot to me.
個人的なお話をしたいと思います
05:05
I need to take a breath.
ひと息つかせてください
05:08
My son Isaac, when he was two,
息子のアイザックは 2歳の時に
05:11
was diagnosed with autism,
自閉症の診断を受けました
05:13
and he was this happy, hilarious,
彼はにこにこして 愉快で
05:16
loving, affectionate little guy,
愛情深く 優しい男の子でしたが
05:18
but the metrics on his developmental evaluations,
彼の発育評価についての測定基準が
05:20
which looked at things like
the number of words —
着目したのは 話せる言葉の数や―
05:23
at that point, none —
これは当時 ゼロでした―
05:25
communicative gestures and minimal eye contact,
意思疎通を図る身振り
アイコンタクトなどであったため
05:29
put his developmental level
彼の発育レベルは
05:33
at that of a nine-month-old baby.
9か月の赤ちゃん程度でした
05:35
And the diagnosis was factually correct,
この診断は事実からすれば
正しいものでしたが
05:39
but it didn't tell the whole story.
全体像を語ってはいませんでした
05:42
And about a year and a half later,
およそ1年半後
05:45
when he was almost four,
アイザックがもうすぐ4歳になる頃
05:46
I found him in front of the computer one day
私は ある日
彼がコンピュータの前で
05:48
running a Google image search on women,
グーグル画像検索で
女性を検索しているのを見つけました
05:51
spelled "w-i-m-e-n."
「w-i-m-e-n」というつづりで です
05:56
And I did what any obsessed parent would do,
過干渉な親がそうするように 私も
06:00
which is immediately started
hitting the "back" button
「前のページに戻る」ボタンをクリックし
06:02
to see what else he'd been searching for.
他に何を検索していたのか知ろうとしました
06:04
And they were, in order: men,
他の検索は 順番に「男性」
06:08
school, bus and computer.
「学校」 「バス」 そして「コンピュータ」でした
06:10
And I was stunned,
私は呆気にとられました
06:17
because we didn't know that he could spell,
アイザックがスペルを知っているとも
06:19
much less read, and so I asked him,
ましてや読めるとも知らなかったのです
06:21
"Isaac, how did you do this?"
そこで息子に訊きました
「どうやったの?」
06:23
And he looked at me very seriously and said,
アイザックは私を真剣に見て 言いました
06:25
"Typed in the box."
「ボックスに文字をタイプしたんだ」
06:28
He was teaching himself to communicate,
彼は自分で意思疎通の仕方を
学んでいたのに
06:31
but we were looking in the wrong place,
私たちは誤った部分に
目を向けていたのです
06:35
and this is what happens when assessments
そして こういったことが起こるのは
06:38
and analytics overvalue one metric —
査定や分析が ある測定基準―
06:40
in this case, verbal communication —
ここでは 言語による意思疎通―
を過大評価して
06:43
and undervalue others, such
as creative problem-solving.
創造的問題解決能力のような
他の基準を過小評価する場合です
06:45
Communication was hard for Isaac,
アイザックにとって
他者との意思疎通は難しいので
06:51
and so he found a workaround
彼は自分に必要なことを知るための
06:53
to find out what he needed to know.
別の方法を見つけたのです
06:55
And when you think about it, it makes a lot of sense,
考えてみれば 合点がいきますね
06:58
because forming a question
質問文を構成するのは
07:00
is a really complex process,
実に複雑なプロセスですが
07:02
but he could get himself a lot of the way there
アイザックは検索ボックスに
単語を入れるだけで
07:05
by putting a word in a search box.
自力で答えにたどり着けるのです
07:07
And so this little moment
この些細な瞬間が
07:11
had a really profound impact on me
私と家族に
07:14
and our family
大きな影響を与えました
07:17
because it helped us change our frame of reference
なぜなら これが
アイザックに何が起こっているのかを
07:18
for what was going on with him,
把握する方法を変えてくれたからです
07:21
and worry a little bit less and appreciate
心配もほんの少し和らぎ
07:24
his resourcefulness more.
彼の能力を
より理解できるようになりました
07:27
Facts are stupid things.
事実とは馬鹿げたものなのです
07:29
And they're vulnerable to misuse,
また事実は意図的 あるいは無意図的に
07:32
willful or otherwise.
誤用されやすいものです
07:34
I have a friend, Emily Willingham, who's a scientist,
私には エミリー・ウィリンガムという
科学者の友人がいますが
07:36
and she wrote a piece for Forbes not long ago
彼女は最近フォーブス誌に
07:39
entitled "The 10 Weirdest Things
「自閉症と関連付けられてきた
10のおかしな事」
07:42
Ever Linked to Autism."
という記事を書きました
07:44
It's quite a list.
これは 結構なリストです
07:45
The Internet, blamed for everything, right?
何でもインターネットのせいにされます ねえ?
07:48
And of course mothers, because.
もちろん 母親も入っています
07:52
And actually, wait, there's more,
実は もっとあります
07:56
there's a whole bunch in
the "mother" category here.
この「母親」のカテゴリーの中に
色々とあるのです
07:57
And you can see it's a pretty
rich and interesting list.
色々な要素の入った
興味深いリストでしょう?
08:01
I'm a big fan of
私が好きなのは
08:05
being pregnant near freeways, personally.
「妊娠中 高速道路のそばで
暮らしていた」ですね
08:08
The final one is interesting,
最後のも興味深いです
08:11
because the term "refrigerator mother"
「冷蔵庫のような母親」という言葉は
08:13
was actually the original hypothesis
自閉症の原因に関する
08:16
for the cause of autism,
元々の仮説からきており
08:19
and that meant somebody
who was cold and unloving.
冷徹で愛情が薄い人という意味でした
08:20
And at this point, you might be thinking,
ここで こう考えるかもしれませんね
08:23
"Okay, Susan, we get it,
「わかった データを測定してしまえば
08:24
you can take data, you can
make it mean anything."
どんな意味づけも可能と言うんだろう」
08:26
And this is true, it's absolutely true,
確かに 全くその通りですが
08:28
but the challenge is that
難しいのは
08:32
we have this opportunity
私たちは その意味を作り出す機会を
08:38
to try to make meaning out of it ourselves,
自らに与えられていることです
08:40
because frankly, data doesn't
create meaning. We do.
データ自身ではなく
私たちが意味を作るのです
08:43
So as businesspeople, as consumers,
ビジネスパーソンとして
消費者として
08:48
as patients, as citizens,
患者として 市民として
08:51
we have a responsibility, I think,
私たちには より多くの時間を使って
08:54
to spend more time
批判的に考える能力を
08:56
focusing on our critical thinking skills.
鍛える責任があります
08:58
Why?
なぜかって?
09:01
Because at this point in our history, as we've heard
なぜなら 何度も耳にしてきたように
09:02
many times over,
有史以来 今やものすごい速さで
09:06
we can process exabytes of data
何エクサバイトものデータを
09:07
at lightning speed,
私たちは処理することができるからです
09:09
and we have the potential to make bad decisions
そして 間違った判断を
09:11
far more quickly, efficiently,
より速く 効率的に下し
09:15
and with far greater impact than we did in the past.
これまでにないほどの影響を及ぼす
可能性があるからです
09:17
Great, right?
すごいと思いませんか?
09:22
And so what we need to do instead
ですから 私たちがすべきなのは
09:23
is spend a little bit more time
時間をもう少し
09:26
on things like the humanities
人文学や
09:29
and sociology, and the social sciences,
社会学 社会科学―
09:31
rhetoric, philosophy, ethics,
修辞学や哲学 倫理学などに費やすことです
09:35
because they give us context that is so important
これらがビッグデータに
重要な文脈を与えてくれ
09:37
for big data, and because
より批判的な考え方が
09:40
they help us become better critical thinkers.
できるようにしてくれるからです
09:42
Because after all, if I can spot
結局のところ
特定の議論の中に存在する問題を
09:45
a problem in an argument, it doesn't much matter
見つけることができれば
09:49
whether it's expressed in words or in numbers.
それが言葉で表されようと
数字で表されようと関係ないのですから
09:52
And this means
つまり
09:54
teaching ourselves to find
those confirmation biases
確証バイアスや誤った相関関係を
09:57
and false correlations
自ら見つけ出し
10:02
and being able to spot a naked emotional appeal
感情に露骨に訴えるようなやり方を
10:03
from 30 yards,
30m手前で見抜けるようにするのです
10:05
because something that happens after something
なぜなら 何かがある出来事の後に
起こったからといって
10:07
doesn't mean it happened
because of it, necessarily,
必ずしも関連があるとは限らないからです
10:10
and if you'll let me geek out on you for a second,
ちょっと 小難しいことを言えば
10:13
the Romans called this
"post hoc ergo propter hoc,"
ローマ人はこう言い表しました
「post hoc ergo propter hoc」
10:15
after which therefore because of which.
「後に起きた ゆえにそれが原因なり」
という前後即因果の誤謬です
10:19
And it means questioning
disciplines like demographics.
つまり 人口統計学のような
学問を疑問に付すことになります
10:22
Why? Because they're based on assumptions
なぜかって?
なぜなら 人口統計学は
10:26
about who we all are based on our gender
私たちの実際の考えや行動ではなく
10:29
and our age and where we live
性別や年齢
10:31
as opposed to data on what
we actually think and do.
住む場所による推定に基づいているからです
10:32
And since we have this data,
それから データを取得した以上は
10:36
we need to treat it with appropriate privacy controls
適切な個人情報保護や
10:38
and consumer opt-in,
消費者の意思を汲んで
これを扱わねばなりません
10:41
and beyond that, we need to be clear
さらには 私たちは
10:44
about our hypotheses,
自身の仮説や用いる方法論
10:47
the methodologies that we use,
そして結果の確実性について
10:49
and our confidence in the result.
明確でなければなりません
10:52
As my high school algebra teacher used to say,
私の高校の代数の先生は
よくこう言っていました
10:55
show your math,
「計算過程を明らかにしなさい
10:57
because if I don't know what steps you took,
君が踏んだ過程がわからなければ
10:59
I don't know what steps you didn't take,
どの手順を
踏まなかったのかわからないし
11:02
and if I don't know what questions you asked,
君がどんな問いを立てたのかが
わからなければ
11:04
I don't know what questions you didn't ask.
どんな問いを
立てなかったかがわからないからね」
11:07
And it means asking ourselves, really,
それは最も難しい問いを
11:10
the hardest question of all:
自らに投げかけることなのです
11:11
Did the data really show us this,
このデータは本当に
このことを示しているのか?
11:13
or does the result make us feel
それともこの結果が 私たちをもっと
11:16
more successful and more comfortable?
成功しているとか 心地よく
感じさせてくれるだけなのか? と
11:19
So the Health Media Collaboratory,
ヘルス・メディア・コラボラトリーは
11:23
at the end of their project, they were able
プロジェクトの終わりに
11:25
to find that 87 percent of tweets
あの非常に露骨で不快な
禁煙推奨広告に関する
11:27
about those very graphic and disturbing
ツイートの87パーセントが
11:30
anti-smoking ads expressed fear,
恐れを表していたことが
わかったといいます
11:32
but did they conclude
しかし 彼らは
11:36
that they actually made people stop smoking?
「広告が実際に人々を禁煙に導いた」
と結論付けていましたか?
11:38
No. It's science, not magic.
答えはノーです
これは科学であり 魔法ではないのです
11:41
So if we are to unlock
ですから データの力を
11:44
the power of data,
解き放つのであれば
11:47
we don't have to go blindly into
私たちは必ずしも
オーウェルの思い描いたような
11:50
Orwell's vision of a totalitarian future,
全体主義的な未来や
11:54
or Huxley's vision of a trivial one,
ハクスリーの描いたような
些末な事柄に溺れる未来 あるいは
11:57
or some horrible cocktail of both.
両者を折衷したおぞましい未来に
盲目的に突き進まずに済むのです
12:00
What we have to do
私たちがすべきなのは
12:03
is treat critical thinking with respect
批判的な思考に敬意を払い
12:05
and be inspired by examples
ヘルス・メディア・コラボラトリーのような
前例からインスピレーションを得ることです
12:08
like the Health Media Collaboratory,
ヘルス・メディア・コラボラトリーのような
前例からインスピレーションを得ることです
12:10
and as they say in the superhero movies,
そして ヒーローものの映画に
よくあるように
12:13
let's use our powers for good.
私たちの力を善きものに使いましょう
12:15
Thank you.
ありがとうございました
12:17
(Applause)
(拍手)
12:19
Translated by Moe Shoji
Reviewed by Naoko Fujii

▲Back to top

About the Speaker:

Susan Etlinger - Data analyst
Susan Etlinger promotes the smart, well-considered and ethical use of data.

Why you should listen

Susan Etlinger is an industry analyst with Altimeter Group, where she focuses on data and analytics. She conducts independent research and has authored two intriguing reports: “The Social Media ROI Cookbook” and “A Framework for Social Analytics.” She also advises global clients on how to work measurement into their organizational structure and how to extract insights from the social web which can lead to tangible actions. In addition, she works with technology innovators to help them refine their roadmaps and strategies. 

Etlinger is on the board of The Big Boulder Initiative, an industry organization dedicated to promoting the successful and ethical use of social data. She is regularly interviewed and asked to speak on data strategy and best practices, and has been quoted in media outlets like The Wall Street Journal, The New York Times, and the BBC.

More profile about the speaker
Susan Etlinger | Speaker | TED.com