ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com
TEDxNewYork

Ben Wellington: How we found the worst place to park in New York City -- using big data

ベン・ウェリントン: ビックデータを使ったNYCでの最悪な駐車場の見つけ方

Filmed:
1,055,247 views

市の各課は都市生活を反映している多くのデータや統計にアクセスしています。しかし、データ分析者のベン・ウェリントンはこの面白いトークの中で、時としてそのデータを使ってやるべきことが分かっていないと示唆しています。ウェリントンは予期せぬ質問とスマート・データ・クランチングを組み合わせると、不思議と役立つ洞察力が生じることを示し、大量のデータを公表することで誰でも使えるようになる秘訣を共有しています。
- Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data. Full bio

Double-click the English transcript below to play the video.

00:12
Six6人 thousand milesマイル of road道路,
0
711
2820
道路なら6千マイル
00:15
600 milesマイル of subway地下鉄 trackトラック,
1
3531
2203
地下鉄なら600マイル
00:17
400 milesマイル of bike自転車 lanesレーン
2
5734
1644
自転車専用道路なら400マイル
00:19
and a halfハーフ a mileマイル of tramトラム trackトラック,
3
7378
1821
トラムウェイなら0.5マイル
00:21
if you've ever been to Rooseveltルーズベルト Island.
4
9199
1953
ルーズベルト島に行ったらわかりますね
00:23
These are the numbers数字 that make up
the infrastructureインフラ of New新しい Yorkヨーク Cityシティ.
5
11152
3334
これはニューヨーク市(NYC)のインフラを表す数字です
00:26
These are the statistics統計
of our infrastructureインフラ.
6
14486
2619
インフラを統計的にまとめ
00:29
They're the kind種類 of numbers数字 you can find
released解放された in reportsレポート by cityシティ agencies代理店.
7
17105
3706
市の各部局が公表した報告書の数字です
00:32
For example, the Department部門
of Transportation交通 will probably多分 tell you
8
20811
3199
例えば交通課では
保守管理した道路の距離を
00:36
how manyたくさんの milesマイル of road道路 they maintain維持する.
9
24010
1781
報告するかもしれませんし
00:37
The MTAMTA will boast自慢 how manyたくさんの milesマイル
of subway地下鉄 trackトラック there are.
10
25791
2821
都市交通局は誇らしげに地下鉄の路線の距離を
示すでしょう
00:40
Most最も cityシティ agencies代理店 give us statistics統計.
11
28612
1807
市の部局の大半が統計を使います
00:42
This is from a report報告する this year
12
30419
1483
今年の報告書や
00:43
from the Taxiタクシー and Limousineリムジン Commission手数料,
13
31902
1892
タクシー・リムジン委員会(TLC)によると
00:45
where we learn学ぶ that there's about
13,500 taxisタクシー here in New新しい Yorkヨーク Cityシティ.
14
33794
3276
ここNYCには約13,500台のタクシーがいます
00:49
Prettyかなり interesting面白い, right?
15
37070
1290
とても面白いでしょう?
00:50
But did you ever think about
where these numbers数字 came来た from?
16
38360
2784
でも これらの数字はどこから来たのでしょうか?
00:53
Because for these numbers数字 to exist存在する,
someone誰か at the cityシティ agency代理店
17
41144
2903
こういう数字が存在するためには
市の職員の誰かがふと
00:56
had to stop and say, hmmうーん, here'sここにいる a number
that somebody誰か mightかもしれない want want to know.
18
44047
3880
「これは誰かが知りたがっている数字だ」と
気づかなければなりません
00:59
Here'sここにいる a number
that our citizens市民 want to know.
19
47927
2250
これが市民が知りたがっている数字なのです
01:02
So they go back to their彼らの raw dataデータ,
20
50177
1830
そのため 加工していないデータを
01:04
they countカウント, they add追加する, they calculate計算する,
21
52007
1797
数えたり 足したり 計算して
01:05
and then they put out reportsレポート,
22
53804
1467
報告書を発行するので
01:07
and those reportsレポート
will have numbers数字 like this.
23
55271
2177
報告書には このような数字があるのです
01:09
The problem問題 is, how do they know
all of our questions質問?
24
57448
2540
問題は 私たちが聞きたい質問をどのように知るのか?
01:11
We have lots of questions質問.
25
59988
1243
様々な質問があるのです
01:13
In fact事実, in some ways方法 there's literally文字通り
an infinite無限 number of questions質問
26
61231
3340
実際ある意味では 市民には文字通り
01:16
that we can ask尋ねる about our cityシティ.
27
64571
1649
市に関する質問が無数にあり
01:18
The agencies代理店 can never keep up.
28
66220
1475
各部局は対応しきれません
01:19
So the paradigmパラダイム isn't exactly正確に workingワーキング,
and I think our policymakers政策立案者 realize実現する that,
29
67695
4056
パラダイムは上手く機能しておらず
政治家もそれに気付いていると思います
01:23
because in 2012, Mayor市長 Bloombergブルームバーグ
signed署名された into law法律 what he calledと呼ばれる
30
71751
3959
2012年ブルームバーグ市長は
アメリカで最も熱望され
01:27
the most最も ambitious意欲的な and comprehensive包括的な
open開いた dataデータ legislation立法 in the country.
31
75710
3837
包括的なオープンデータ法案を
成立させたからです
01:31
In a lot of ways方法, he's right.
32
79547
1573
多くの意味で市長は正しいのです
01:33
In the last two years,
the cityシティ has released解放された 1,000 datasetsデータセット
33
81120
2861
過去2年間NYCは
オープンデータポータルのデータセットを
01:35
on our open開いた dataデータ portalポータル,
34
83981
1610
1,000件公表しました
01:37
and it's prettyかなり awesome驚くばかり.
35
85591
1764
物凄いことですよね
01:39
So you go and look at dataデータ like this,
36
87355
1968
だから タクシーの数を数えなくても
01:41
and instead代わりに of just counting数える
the number of cabsキャブ,
37
89323
2289
このようにデータを見られるので
01:43
we can start開始 to ask尋ねる different異なる questions質問.
38
91612
1943
違う質問もできるのです
01:45
So I had a question質問.
39
93555
1200
そこで 私は質問しました
01:46
When'sいつ rushラッシュ hour時間 in New新しい Yorkヨーク Cityシティ?
40
94755
1701
NYCのラッシュアワーはいつ?
01:48
It can be prettyかなり bothersome気になる.
When is rushラッシュ hour時間 exactly正確に?
41
96456
2581
厄介ですよね
正確なラッシュアワーの時間帯は?
01:51
And I thought to myself私自身,
these cabsキャブ aren'tない just numbers数字,
42
99037
2625
私はタクシーがただの数字
ではないと考えたのです
01:53
these are GPSGPS recordersレコーダー
driving運転 around in our cityシティ streets通り
43
101662
2711
市内の路上を走り回る
GPSレコーダーであり
01:56
recording録音 each and everyすべて rideライド they take.
44
104373
1913
乗客を乗せる度に記録しています
01:58
There's dataデータ there,
and I looked見た at that dataデータ,
45
106286
2322
そこにデータがあるのです
私はそのデータを調べて
02:00
and I made a plotプロット of the average平均 speed速度 of
taxisタクシー in New新しい Yorkヨーク Cityシティ throughout全体を通して the day.
46
108608
3961
1日のNYCのタクシーの
平均スピードを策定しました
02:04
You can see that from about midnight真夜中
to around 5:18 in the morning,
47
112569
3412
ご覧のとおり 真夜中から朝の5時18分まで
02:07
speed速度 increases増加する, and at that pointポイント,
things turn順番 around,
48
115981
3563
スピードは速くなり
そこからスピードが落ちていきます
02:11
and they get slowerもっとゆっくり and slowerもっとゆっくり and slowerもっとゆっくり
until〜まで about 8:35 in the morning,
49
119544
3962
だんだん遅くなり 朝の8時35分には
02:15
when they end終わり up at around
11 and a halfハーフ milesマイル per〜ごと hour時間.
50
123506
2693
時速11.5マイルになります
02:18
The average平均 taxiタクシー is going 11 and a halfハーフ
milesマイル per〜ごと hour時間 on our cityシティ streets通り,
51
126199
3562
路上を走る平均的なタクシーのスピードは
時速11.5マイルです
02:21
and it turnsターン out it stays滞在する that way
52
129761
1987
日中の時速は変わらないのです
02:23
for the entire全体 day.
53
131748
3368
日中の時速は変わらないのです
02:27
(Laughter笑い)
54
135116
1373
(笑)
02:28
So I said to myself私自身, I guess推測
there's no rushラッシュ hour時間 in New新しい Yorkヨーク Cityシティ.
55
136489
3180
私はNYCにラッシュアワーが
ないのだと思いました
02:31
There's just a rushラッシュ day.
56
139669
1537
ただラッシュデイがあるのです
02:33
Makes作る senseセンス. And this is important重要
for a coupleカップル of reasons理由.
57
141206
2850
なるほど
これは2つの理由で重要です
02:36
If you're a transportation交通 plannerプランナー,
this mightかもしれない be prettyかなり interesting面白い to know.
58
144056
3637
あなたが交通プランナーなら
とても知りたいかもしれませんよね
02:39
But if you want to get somewhereどこかで quickly早く,
59
147693
1975
どこかに早く着きたければ
02:41
you now know to setセット your alarm警報 for
4:45 in the morning and you're all setセット.
60
149668
3468
目覚まし時計を
朝の4時45分にセットすればいいのです
02:45
New新しい Yorkヨーク, right?
61
153136
1044
NYのことですよ
02:46
But there's a storyストーリー behind後ろに this dataデータ.
62
154180
1762
でも このデータには裏話があります
02:47
This dataデータ wasn'tなかった
just available利用可能な, it turnsターン out.
63
155942
2185
こんなデータは
入手できなかったのです
02:50
It actually実際に came来た from something calledと呼ばれる
a Freedom自由 of Information情報 Law法律 Request要求,
64
158127
3619
実際 出所は情報公開法による請求でした
02:53
or a FOILホイル Request要求.
65
161746
1076
実際 出所は情報公開法による請求でした
02:54
This is a form you can find on the
Taxiタクシー and Limousineリムジン Commission手数料 websiteウェブサイト.
66
162822
3466
これはTLCのホームページにあるフォームです
02:58
In order注文 to accessアクセス this dataデータ,
you need to go get this form,
67
166288
2826
データにアクセスするため
このフォームをダウンロードして
03:01
fill埋める it out, and they will notify通知する you,
68
169114
1846
記入すると 情報が得られます
03:02
and a guy named名前 Chrisクリス Whongファン
did exactly正確に that.
69
170960
2130
クリス・ウォンという男性が
それをしました
03:05
Chrisクリス went行った down, and they told him,
70
173090
1890
クリスが行くと
新品のハードディスクを
03:06
"Just bring持参する a brandブランド new新しい hardハード driveドライブ
down to our office事務所,
71
174980
2827
事務所に持って来るよう
職員から言われました
03:09
leave離れる it here for five hours時間,
we'll私たちは copyコピー the dataデータ and you take it back."
72
177807
3424
「5時間後にデータをコピーしてお返しします」
03:13
And that's where this dataデータ came来た from.
73
181231
2032
そうやってこのデータを取得したのです
03:15
Now, Chrisクリス is the kind種類 of guy
who wants to make the dataデータ publicパブリック,
74
183263
3005
さて クリスはデータを公表するタイプなので
03:18
and so it ended終了しました up onlineオンライン for all to use,
and that's where this graphグラフ came来た from.
75
186268
3784
ネット上で誰でも利用できるようにしました
そうやってこのグラフが作られました
03:22
And the fact事実 that it exists存在する is amazing素晴らしい.
These GPSGPS recordersレコーダー -- really coolクール.
76
190052
3518
存在自体が驚きですね
GPSレコーダーの記録 すごいです
03:25
But the fact事実 that we have citizens市民
walking歩く around with hardハード drivesドライブ
77
193570
3118
ではデータを公表するために
役所にハードディスクを持って行き
03:28
pickingピッキング up dataデータ from cityシティ agencies代理店
to make it publicパブリック --
78
196688
2582
データを受取る市民がいるという事実はどうでしょう
03:31
it was already既に kind種類 of publicパブリック,
you could get to it,
79
199270
2390
もともと公的データで
得られてしかるべきものでした
03:33
but it was "publicパブリック," it wasn'tなかった publicパブリック.
80
201660
1812
「公」のデータでしたが
非公開でした
03:35
And we can do better than that as a cityシティ.
81
203472
1962
市として もっと上手いやり方があります
03:37
We don't need our citizens市民
walking歩く around with hardハード drivesドライブ.
82
205434
2756
市民がハードディスクを
持って歩かなくてもいいのです
03:40
Now, not everyすべて datasetデータセット
is behind後ろに a FOILホイル Request要求.
83
208190
2337
情報公開で得られないデータセットもあります
03:42
Here is a map地図 I made with the most最も
dangerous危険な intersections交差点 in New新しい Yorkヨーク Cityシティ
84
210527
3802
これは自転車事故に基づいて作成した
03:46
basedベース on cyclistサイクリスト accidents事故.
85
214329
1878
NYCで最も危険な交差点の地図です
03:48
So the red areasエリア are more dangerous危険な.
86
216207
1939
赤のエリアはより危険です
03:50
And what it showsショー is first
the East side of Manhattanマンハッタン,
87
218146
2553
地図によると まずマンハッタンの東側
03:52
especially特に in the lower低い areaエリア of Manhattanマンハッタン,
has more cyclistサイクリスト accidents事故.
88
220699
3611
特にロワー・マンハッタン地域で
自転車事故が多発しています
03:56
That mightかもしれない make senseセンス
89
224310
1019
多くのサイクリストが
03:57
because there are more cyclistsサイクリスト
coming到来 off the bridges there.
90
225329
2896
そこで橋を渡ってくるので
納得できますよね
04:00
But there's other hotspotsホットスポット worth価値 studying勉強する.
91
228225
2014
しかし他の危険地域も調査の価値ありです
04:02
There's Williamsburgウィリアムズバーグ.
There's Rooseveltルーズベルト Avenueアベニュー in Queensクイーンズ.
92
230239
2669
ウィリアムズバーグと
クイーンズ州ルーズベルト・アベニューです
04:04
And this is exactly正確に the kind種類 of dataデータ
we need for Visionビジョン Zeroゼロ.
93
232908
2852
これこそが ビジョン・ゼロに求めるデータで
04:07
This is exactly正確に what we're looking for.
94
235760
1990
まさに 私たちが探し求めているものです
04:09
But there's a storyストーリー
behind後ろに this dataデータ as well.
95
237750
2135
しかし このデータを入手するにも
04:11
This dataデータ didn't just appear現れる.
96
239885
2067
工夫が必要だったのです
04:13
How manyたくさんの of you guys know this logoロゴ?
97
241952
2391
このロゴを知っている人は?
04:16
Yeah, I see some shakes振る.
98
244343
1352
何人か手を上げていますね
04:17
Have you ever tried試した to copyコピー
and pasteペースト dataデータ out of a PDFPDF
99
245695
2655
PDFをコピー・ペーストして
文書を作成しようと
04:20
and make senseセンス of it?
100
248350
1357
したことがありますか?
04:21
I see more shakes振る.
101
249707
1060
更に手が上がりました
04:22
More of you tried試した copyingコピー and pastingペースト
than knew知っていた the logoロゴ. I like that.
102
250767
3345
ロゴを知らなくてもコピー・ペーストしてみる
いいですね
04:26
So what happened起こった is, the dataデータ
that you just saw was actually実際に on a PDFPDF.
103
254112
3510
つまり お見せしたのは PDFだったのです
04:29
In fact事実, hundreds数百 and hundreds数百
and hundreds数百 of pagesページ of PDFPDF
104
257622
3105
実際 物凄い数のPDFを
ニューヨーク市警は公開しました
実際 物凄い数のPDFを
ニューヨーク市警は公開しました
04:32
put out by our very own自分の NYPDNYPD,
105
260727
2159
04:34
and in order注文 to accessアクセス it,
you would eitherどちらか have to copyコピー and pasteペースト
106
262886
3152
それにアクセスする方法は
物凄い時間をかけて
04:38
for hundreds数百 and hundreds数百 of hours時間,
107
266038
1726
コピー・ペーストするか
04:39
or you could be Johnジョン Kraussクラウス.
108
267764
1344
ジョン・クラウスのようにするかです
04:41
Johnジョン Kraussクラウス was like,
109
269108
1043
ジョン・クラウスは
04:42
I'm not going to copyコピー and pasteペースト this dataデータ.
I'm going to write書きます a programプログラム.
110
270151
3413
ニューヨーク市警クラッシュデータ・バンドエイド
というプログラムを書き
04:45
It's calledと呼ばれる the NYPDNYPD Crashクラッシュ Dataデータ Band-Aidバンドエイド,
111
273564
2288
コピー・ペーストを不要にしました
04:47
and it goes行く to the NYPD'sNYPDの websiteウェブサイト
and it would downloadダウンロード PDFsPDF.
112
275852
3032
ニューヨーク市警のホームページから
PDFをダウンロードします
04:50
Everyすべて day it would searchサーチ;
if it found見つけた a PDFPDF, it would downloadダウンロード it
113
278884
3126
データを収集するプログラムを実行し
04:54
and then it would run走る
some PDF-scrapingPDFのスクレイピング programプログラム,
114
282010
2250
PDFの保護を解除するプログラムを実行し
04:56
and out would come the textテキスト,
115
284260
1336
編集できるテキストに戻し
04:57
and it would go on the Internetインターネット,
and then people could make maps地図 like that.
116
285596
3565
ネット上に上げるのです
だから誰でも地図も作れるのです
05:01
And the fact事実 that the data'sデータ here,
the fact事実 that we have accessアクセス to it --
117
289161
3429
ここにデータがあり
それにアクセスできるのです
05:04
Everyすべて accident事故, by the way,
is a row in this table.
118
292590
2450
ところで この表では
事故毎に一列になっています
05:07
You can imagine想像する how manyたくさんの PDFsPDF that is.
119
295040
1836
PDFの量はどのくらいだと思いますか
05:08
The fact事実 that we
have accessアクセス to that is great,
120
296876
2207
アクセスできることは素晴らしいのですが
05:11
but let's not release解放 it in PDFPDF form,
121
299083
2110
PDF以外にして欲しいものです
05:13
because then we're having持つ our citizens市民
write書きます PDFPDF scrapersスクレーパー.
122
301193
2739
市民がデータ読み取りプログラムを
書くはめになるからです
05:15
It's not the bestベスト use
of our citizens'市民は、 time,
123
303932
2076
市民は時間の有効利用できませんし
05:18
and we as a cityシティ can do better than that.
124
306008
2004
市として もっと良くやれるのです
05:20
Now, the good newsニュース is that
the de Blasioブラシオ administration投与
125
308012
2736
さて 良いニュースは
デブラシオの行政が数か月前に
05:22
actually実際に recently最近 released解放された this dataデータ
a few少数 months数ヶ月 ago,
126
310748
2532
このデータを公表したことで
05:25
and so now we can
actually実際に have accessアクセス to it,
127
313280
2158
私たちはアクセスできるようになりました
05:27
but there's a lot of dataデータ
still entombed埋葬された in PDFPDF.
128
315438
2536
しかしまだ 多くのデータがPDFのままです
05:29
For example, our crime犯罪 dataデータ
is still only available利用可能な in PDFPDF.
129
317974
3197
例えば 犯罪データはPDFしかありません
05:33
And not just our crime犯罪 dataデータ,
our own自分の cityシティ budget予算.
130
321171
3755
また犯罪データだけでなく
市の予算もです
05:36
Our cityシティ budget予算 is only readable読める
right now in PDFPDF form.
131
324926
3729
市の予算はPDFでしか読めません
05:40
And it's not just us
that can't analyze分析する it --
132
328655
2141
私たちがデータ分析を出来ないだけでなく
05:42
our own自分の legislators立法者
who vote投票 for the budget予算
133
330796
2955
予算に賛成票を投じる議員も
05:45
alsoまた、 only get it in PDFPDF.
134
333751
1943
PDFしか使えません
05:47
So our legislators立法者 cannotできない analyze分析する
the budget予算 that they are voting投票 for.
135
335694
3844
そのため 議員は賛成する
予算の分析できないのです
05:51
And I think as a cityシティ we can do
a little better than that as well.
136
339538
3608
市の行政として
私たちはそれよりも少しましだと思うのです
05:55
Now, there's a lot of dataデータ
that's not hidden隠された in PDFsPDF.
137
343146
2488
さて PDFではないデータもたくさんあります
05:57
This is an example of a map地図 I made,
138
345634
1700
私の作った地図を例にとると
05:59
and this is the dirtiest汚れた waterways水路
in New新しい Yorkヨーク Cityシティ.
139
347334
2926
これはNYCで一番汚い河川です
06:02
Now, how do I measure測定 dirty汚れた?
140
350260
1509
どうやって汚さを測るのか?
06:03
Well, it's kind種類 of a little weird奇妙な,
141
351769
1857
ちょっと変なんですけど
06:05
but I looked見た at the levelレベル
of fecal糞便 coliform大腸菌,
142
353626
2113
糞便性大腸菌のレベルを
06:07
whichどの is a measurement測定 of fecal糞便 matter問題
in each of our waterways水路.
143
355739
3506
つまり 河川ごとの糞便物質の指標を調べました
06:11
The larger大きい the circleサークル,
the dirtierより汚れた the water,
144
359245
3274
円が大きいほど
水が汚れているのです
06:14
so the large circles are dirty汚れた water,
the small小さい circles are cleanerクリーナー.
145
362519
3357
大きな円が汚水で
小さな円がきれいな水です
06:17
What you see is inland内陸 waterways水路.
146
365876
1644
ご覧のものは 陸地の河川です
06:19
This is all dataデータ that was sampledサンプリングされた
by the cityシティ over the last five years.
147
367520
3404
これは過去5年間に
市が採取した全データなのです
06:22
And inland内陸 waterways水路 are,
in general一般, dirtierより汚れた.
148
370924
2694
陸地の河川は一般的により汚いのです
06:25
That makes作る senseセンス, right?
149
373618
1218
納得ですか?
06:26
And the biggerより大きい circles are dirty汚れた.
And I learned学んだ a few少数 things from this.
150
374836
3374
より大きな円は汚いのです
こんなことがわかります
06:30
Number one: Never swim泳ぐ in anything
that ends終わり in "creekクリーク" or "canal運河."
151
378210
3164
その1: 河口で泳がないこと
06:33
But number two: I alsoまた、 found見つけた
the dirtiest汚れた waterway水路 in New新しい Yorkヨーク Cityシティ,
152
381374
4318
その2: NYCに一番汚い河川があること
06:37
by this measure測定, one measure測定.
153
385692
1834
が測定から判明しました
06:39
In Coneyコニー Island Creekクリーク, whichどの is not
the Coneyコニー Island you swim泳ぐ in, luckily幸運にも.
154
387526
3648
コニー・アイランド・クリークです
コニーアイランドの海水浴場ではなく
06:43
It's on the other side.
155
391174
1158
対岸です
06:44
But Coneyコニー Island Creekクリーク, 94 percentパーセント
of samplesサンプル taken撮影 over the last five years
156
392332
3878
しかし 5年間に渡り
コニー・アイランド・クリークで採取した試料の94%では
06:48
have had fecal糞便 levelsレベル so high高い
157
396210
2157
糞便性大腸菌のレベルがとても高く
06:50
that it would be againstに対して state状態 law法律
to swim泳ぐ in the water.
158
398367
3093
河川で泳ぐことは州法に触れます
06:53
And this is not the kind種類 of fact事実
that you're going to see
159
401460
2729
市の報告書で強調されるような
06:56
boasted自慢 in a cityシティ report報告する, right?
160
404189
1537
成果とは言えませんね
06:57
It's not going to be
the frontフロント pageページ on nycニューヨーク.gov政府.
161
405726
2250
nyc.govのトップ・ページに載ったりもしません
06:59
You're not going to see it there,
162
407976
1580
そうやって見せようとしていなくても
07:01
but the fact事実 that we can get
to that dataデータ is awesome驚くばかり.
163
409556
2518
そういうデータに到達したことが凄いのです
07:04
But once一度 again, it wasn'tなかった superスーパー easy簡単,
164
412074
1773
でも データがオープン・データ・ポータルに
07:05
because this dataデータ was not
on the open開いた dataデータ portalポータル.
165
413847
2358
掲載されていなかったので
超簡単とは言えませんでした
07:08
If you were to go to the open開いた dataデータ portalポータル,
166
416205
2013
オープン・データ・ポータルで探しても
07:10
you'dあなたは see just a snippetスニペット of it,
a year or a few少数 months数ヶ月.
167
418218
2613
部分的な数か月か1年分しか見つかりません
07:12
It was actually実際に on the Department部門
of Environmental環境 Protection's保護の websiteウェブサイト.
168
420831
3390
実際 環境保護課のホームページにありました
07:16
And each one of these linksリンク is an ExcelExcel
sheetシート, and each ExcelExcel sheetシート is different異なる.
169
424221
3878
リンクは全てエクセルで
全て違う形式でした
07:20
Everyすべて heading見出し is different異なる:
you copyコピー, pasteペースト, reorganize再編成する.
170
428099
2630
見出しも全て違うので
コピー・ペーストして 編集します
07:22
When you do you can make maps地図
and that's great, but once一度 again,
171
430729
2952
それでようやく 地図が作れます
素晴らしいことですが ここでもまた
07:25
we can do better than that
as a cityシティ, we can normalizeノーマライズ things.
172
433681
2969
市としてはもっと上手なやり方があり
標準化できるのです
07:28
And we're getting取得 there, because
there's this websiteウェブサイト that Socrataソクラタ makes作る
173
436650
3384
Socrata のオープンデータポータルNYC
というホームページで
07:32
calledと呼ばれる the Open開いた Dataデータ Portalポータル NYCNYC.
174
440034
1541
目的を果たせそうです
07:33
This is where 1,100 dataデータ setsセット
that don't suffer苦しむ
175
441575
2257
ここにある1100個のデータセットは
今話したような問題がなく
07:35
from the things I just told you liveライブ,
176
443832
1781
ここにある1100個のデータセットは
今話したような問題がなく
07:37
and that number is growing成長する,
and that's great.
177
445613
2148
その数が増えていくのは
素晴らしいことです
07:39
You can downloadダウンロード dataデータ in any formatフォーマット,
be it CSVCSV or PDFPDF or ExcelExcel document資料.
178
447761
3412
CSV、PDF、エクセルなどに
データをダウンロードできるのです
07:43
Whateverなんでも you want,
you can downloadダウンロード the dataデータ that way.
179
451173
2547
どんなデータであれ
ダウンロードできるのです
07:45
The problem問題 is, once一度 you do,
180
453720
1352
問題は ダウンロードする時
07:47
you will find that each agency代理店
codesコード their彼らの addressesアドレス differently異なって.
181
455072
3686
部署ごとに住所の切れ目がバラバラなことです
07:50
So one is street通り name,
intersection交差点 street通り,
182
458758
2141
街路名、交差点の通り、通り、区
07:52
street通り, boroughボロー, address住所, building建物,
building建物 address住所.
183
460899
2491
住所、建物、建物の住所などです
07:55
So once一度 again, you're spending支出 time,
even when we have this portalポータル,
184
463390
3180
だから このポータルを使ってもまだ
時間がかかるのです
07:58
you're spending支出 time
normalizing正規化する our address住所 fieldsフィールド.
185
466570
2606
住所のフィールドを標準化するのに
時間をかけるので
08:01
And that's not the bestベスト use
of our citizens'市民は、 time.
186
469176
2423
市民の時間の
有効活用になりません
08:03
We can do better than that as a cityシティ.
187
471599
1796
私たちは市として上手にできるのです
08:05
We can standardize標準化する our addressesアドレス,
188
473395
1645
私たちは住所を標準化できます
08:07
and if we do,
we can get more maps地図 like this.
189
475040
2185
そうすれば
こんな地図がもっと増えます
08:09
This is a map地図 of fire火災 hydrants消火器
in New新しい Yorkヨーク Cityシティ,
190
477225
2285
これはNYCの消火栓の地図ですが
08:11
but not just any fire火災 hydrants消火器.
191
479510
1531
ただの消火栓ではないのです
08:13
These are the top 250 grossing総収入 fire火災
hydrants消火器 in terms条項 of parkingパーキング tickets切符売場.
192
481041
4726
駐車違反切符に関して
トップ250の消火栓なのです
08:17
(Laughter笑い)
193
485767
1986
(笑)
08:19
So I learned学んだ a few少数 things from this map地図,
and I really like this map地図.
194
487753
3358
この地図には学べることがあったので
私のお気に入りです
08:23
Number one, just don't parkパーク
on the Upperアッパー East Side.
195
491111
2402
その1
アッパー・イースト・サイドに駐車しないこと
08:25
Just don't. It doesn't matter問題 where
you parkパーク, you will get a hydrant消火器 ticketチケット.
196
493513
3587
だめですよ どこに駐車しても
消火栓の違反切符をもらいますよ
08:29
Number two, I found見つけた the two highest最高
grossing総収入 hydrants消火器 in all of New新しい Yorkヨーク Cityシティ,
197
497100
4153
その2
NYCの中で上位2位の消火栓を特定しました
08:33
and they're on the Lower下げる East Side,
198
501253
1886
ロワー・イースト・サイドにあり
08:35
and they were bringing持参 in over
55,000 dollarsドル a year in parkingパーキング tickets切符売場.
199
503139
5098
駐車違反切符で年間55,000ドルを超える
収益を上げていました
08:40
And that seemed見えた a little strange奇妙な
to me when I noticed気づいた it,
200
508237
2738
そのことに気付いた時
私はちょっと変な感じがしました
08:42
so I did a little digging掘削 and it turnsターン out
what you had is a hydrant消火器
201
510975
3269
ちょっと調べて分かったのですが
消火栓があって
08:46
and then something calledと呼ばれる
a curb縁石 extension拡張,
202
514244
1996
脇に縁石に囲まれた路側帯があります
08:48
whichどの is like a seven-foot7フィート
spaceスペース to walk歩く on,
203
516240
2059
幅7フィートで歩ける場所です
08:50
and then a parkingパーキング spotスポット.
204
518299
1156
駐車する場所はその隣です
08:51
And so these cars came来た along一緒に,
and the hydrant消火器 --
205
519455
2254
だから 駐車する車が現れても
消火栓がずっと
向こうにあるので 大丈夫と思うのです
08:53
"It's all the way over there, I'm fine,"
206
521709
1911
08:55
and there was actually実際に a parkingパーキング spotスポット
painted描きました there beautifully美しく for them.
207
523620
3474
実際 駐車スペースはきれいに塗ってあります
08:59
They would parkパーク there, and the NYPDNYPD
disagreed不一致 with this designation指定
208
527094
3155
そこに駐車すると
ニューヨーク市警はこれは困ると
09:02
and would ticketチケット them.
209
530249
1058
違反切符を貼るのです
09:03
And it wasn'tなかった just me
who found見つけた a parkingパーキング ticketチケット.
210
531307
2344
駐車違反切符を見つけたのは
私だけではありません
09:05
This is the GoogleGoogle
Street通り Viewビュー car driving運転 by
211
533651
2146
Googleストリート・ビューカーも
09:07
finding所見 the same同じ parkingパーキング ticketチケット.
212
535797
1617
駐車違反切符を撮影していたのです
09:09
So I wrote書きました about this on my blogブログ,
on I Quant数量 NYNY, and the DOTドット responded応答した,
213
537414
4504
私が I Quant NYというブログに
このことを書くと 交通課が
09:13
and they said,
214
541918
1020
回答を寄せました
09:14
"While the DOTドット has not received受け取った
any complaints苦情 about this locationロケーション,
215
542938
3410
「この場所について 交通課は
苦情を言われたことはありませんが
09:18
we will reviewレビュー the roadway道路 markingsマーキング
and make any appropriate適切な alterations変更."
216
546348
4542
道路標示を検討し
適切なものに変更します」
09:22
And I thought to myself私自身,
typical典型的な government政府 response応答,
217
550890
2959
定型的な行政の反応だと
私は内心思いました
09:25
all right, moved移動した on with my life.
218
553849
1881
半ば諦めてもいたのです
09:27
But then, a few少数 weeks later後で,
something incredible信じられない happened起こった.
219
555730
3970
数週間後 信じられないようなことが
起こりました
09:31
They repainted再塗りつぶされた the spotスポット,
220
559700
2520
交通課はその場所を塗り直しました
09:34
and for a second二番 I thought I saw
the future未来 of open開いた dataデータ,
221
562220
2690
一瞬 私はオープンデータの
未来を見たと思いました
09:36
because think about what happened起こった here.
222
564910
2000
ここで起きたことを考えてみてください
09:38
For five years, this spotスポット was beingであること
ticketedチケットを発券した, and it was confusing混乱する,
223
566910
5100
5年間 この場所は
駐車違反切符でだらけでした
09:44
and then a citizen市民 found見つけた something,
they told the cityシティ, and within以内 a few少数 weeks
224
572010
4306
市民が何かを見つけ 市に話すと
数週間以内に
09:48
the problem問題 was fixed一定.
225
576316
1294
問題が解決したのです
09:49
It's amazing素晴らしい. And a lot of people
see open開いた dataデータ as beingであること a watchdogウォッチドッグ.
226
577610
3200
素晴らしい
多くの人がオープンデータが番犬になると考えますが
09:52
It's not, it's about beingであること a partnerパートナー.
227
580810
1772
むしろパートナーと見るべきなのです
09:54
We can empower力を与える our citizens市民
to be better partnersパートナー for government政府,
228
582582
3138
市民に行政のより良いパートナーになる
力を与えます
09:57
and it's not that hardハード.
229
585720
1881
そんなに難しいことではありません
09:59
All we need are a few少数 changes変更.
230
587601
1459
必要なのは 少しの変化です
10:01
If you're FOILingFOILing dataデータ,
231
589060
1107
公開要請のデータがあり
10:02
if you're seeing見る your dataデータ
beingであること FOILedFOILされた over and over again,
232
590167
2867
何度となく公開を求められるなら
10:05
let's release解放 it to the publicパブリック, that's
a sign符号 that it should be made publicパブリック.
233
593034
3574
データを公開しましょう
それは公開すべきという合図なのです
10:08
And if you're a government政府 agency代理店
releasing解放する a PDFPDF,
234
596608
2482
そして PDFを公開する部局のみなさん
10:11
let's passパス legislation立法 that requires要求する you
to post役職 it with the underlying根底にある dataデータ,
235
599090
3649
基礎資料をデータと一緒に掲載する
規則にしてください
10:14
because that dataデータ
is coming到来 from somewhereどこかで.
236
602739
2028
そのデータは どこかから来ているからです
10:16
I don't know where, but it's
coming到来 from somewhereどこかで,
237
604767
2482
どこかは分かりませんが
どこかから来ているのです
10:19
and you can release解放 it with the PDFPDF.
238
607249
1725
それをPDFと共に公開できるのです
10:20
And let's adopt採用 and shareシェア
some open開いた dataデータ standards基準.
239
608974
2411
そしてオープンデータの基準を
採用し共有しましょう
10:23
Let's start開始 with our addressesアドレス
here in New新しい Yorkヨーク Cityシティ.
240
611385
2481
ここNYCの住所から始めましょう
10:25
Let's just start開始
normalizing正規化する our addressesアドレス.
241
613866
2074
まず住所を標準化することから
始めるのです
10:27
Because New新しい Yorkヨーク is a leaderリーダー in open開いた dataデータ.
242
615940
2062
NYはオープンデータのリーダーだからです
10:30
Despiteにもかかわらず all this, we are absolutely絶対に
a leaderリーダー in open開いた dataデータ,
243
618002
2789
問題があっても オープンデータの
絶対的なリーダーです
10:32
and if we start開始 normalizing正規化する things,
and setセット an open開いた dataデータ standard標準,
244
620791
3121
標準化に着手し
オープンデータの基準を作るなら
10:35
othersその他 will followフォローする. The state状態 will followフォローする,
and maybe the federal連邦 government政府,
245
623912
3634
自治体も州も おそらく連邦政府も倣うでしょう
10:39
Other countries could followフォローする,
246
627546
1445
他国も倣うかもしれません
10:40
and we're not that far遠い off from a time
where you could write書きます one programプログラム
247
628991
3411
プログラムや100か国の地図情報を
書いた時から
10:44
and map地図 information情報 from 100 countries.
248
632402
1890
そんなに時間が経っていないのです
10:46
It's not science科学 fictionフィクション.
We're actually実際に quiteかなり close閉じる.
249
634292
2487
SFではありません
実際つい最近のことです
10:48
And by the way, who are we
empowering力を与える with this?
250
636779
2240
ところで これにより得するのは誰でしょう?
10:51
Because it's not just Johnジョン Kraussクラウス
and it's not just Chrisクリス Whongファン.
251
639019
3005
ジョン・クラウスや
クリス・ウォンだけではありません
10:54
There are hundreds数百 of meetupsミートアップ
going on in New新しい Yorkヨーク Cityシティ right now,
252
642024
3095
NYCでは現在 何百もの
10:57
activeアクティブ meetupsミートアップ.
253
645119
1025
活発な会合があります
10:58
There are thousands of people
attending出席する these meetupsミートアップ.
254
646144
2572
それらの会合に何千人が出席します
11:00
These people are going after work
and on weekends週末,
255
648716
2368
彼らは仕事の後や週末に集まります
11:03
and they're attending出席する these meetupsミートアップ
to look at open開いた dataデータ
256
651084
2636
オープンデータを調べ
都市をより住みやすくするために
11:05
and make our cityシティ a better place場所.
257
653720
1640
会合に参加するのです
11:07
Groupsグループ like BetaNYCBetaNYC, who just last week週間
released解放された something calledと呼ばれる citygram都市図.nycニューヨーク
258
655360
4073
BetaNYCのような団体は先週
citygram.nycを公表し
11:11
that allows許す you to subscribe申し込む
to 311 complaints苦情
259
659433
2147
自宅や職場に関する311への苦情の
11:13
around your own自分の home,
or around your office事務所.
260
661580
2068
定期購読を可能にしました
11:15
You put in your address住所,
you get local地元 complaints苦情.
261
663648
2427
住所を入力し
地元の苦情を検索します
11:18
And it's not just the techハイテク communityコミュニティ
that are after these things.
262
666075
3374
これらの情報を求めているのは
技術者コミュニティーだけではありません
11:21
It's urban都市 plannersプランナー like
the students学生の I teach教える at Prattプラット.
263
669449
2622
私がプラットで教えている学生の
都市プランナーも
11:24
It's policyポリシー advocates支持者, it's everyoneみんな,
264
672071
1919
政策支持者も 皆もです
11:25
it's citizens市民 from a diverse多様
setセット of backgrounds背景.
265
673990
2563
様々な背景の市民もです
11:28
And with some small小さい, incremental増分 changes変更,
266
676553
2786
小さな変化の積み重ねで
11:31
we can unlockロック解除する the passion情熱
and the ability能力 of our citizens市民
267
679339
3225
オープンデータを利用し
より良い都市を作るため
11:34
to harnessハーネス open開いた dataデータ
and make our cityシティ even better,
268
682564
3156
市民の情熱や能力を解き放つのです
11:37
whetherかどうか it's one datasetデータセット,
or one parkingパーキング spotスポット at a time.
269
685720
3626
変化は1つのデータセットや1か所の駐車場からです
11:41
Thank you.
270
689346
2322
ありがとう
11:43
(Applause拍手)
271
691668
3305
(拍手)
Translated by Masako Kigami
Reviewed by Claire Ghyselen

▲Back to top

ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com