ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com
TEDxNewYork

Ben Wellington: How we found the worst place to park in New York City -- using big data

벤 웰링턴(Ben Wellington): 뉴욕시에서 가장 최악의 주차공간을 알아낸 방법 ㅡ 빅데이터를 이용해서

Filmed:
1,055,247 views

시 공무원들은 도시 삶의 모든 방면의 축적된 데이터와 통계값에 대한 접근권한을 가지고 있습니다. 하지만 데이터 분석가인 벤 웰링턴은 이 흥미로운 이야기를 통해서 그들이 그 데이터로 무엇을 할지를 모르는 것 같다고 말합니다. 그는 기발한 물음과 데이터 가공 스킬을 통해서 놀라운 결과를 만드는 방법과 많은 데이터를 모두가 공유하는 좋은 팁을 이야기 합니다.
- Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data. Full bio

Double-click the English transcript below to play the video.

00:12
Six thousand miles마일 of road도로,
0
711
2820
6,000 마일의 도로와
00:15
600 miles마일 of subway지하철 track선로,
1
3531
2203
600 마일의 지하철 노선,
00:17
400 miles마일 of bike자전거 lanes차선
2
5734
1644
400 마일의 자전거 도로,
00:19
and a half절반 a mile마일 of tram시가 전차 track선로,
3
7378
1821
그리고 0.5마일의 트램노선.
00:21
if you've ever been to Roosevelt루스벨트 Island.
4
9199
1953
루즈벨트 아일랜드에 가보셨는지요.
00:23
These are the numbers번호 that make up
the infrastructure하부 구조 of New새로운 York요크 City시티.
5
11152
3334
저 숫자는 뉴욕시의 기간시설을
구성하는 숫자들입니다.
우리 사회기반시설의 통계치인 것이죠.
00:26
These are the statistics통계
of our infrastructure하부 구조.
6
14486
2619
시당국이 발간하는 보고서에서
찾아볼 수 있는 숫자들입니다.
00:29
They're the kind종류 of numbers번호 you can find
released석방 된 in reports보고 by city시티 agencies에이전시.
7
17105
3706
예를 들어, 교통국에서는
그들이 얼마나 긴 길이의 도로를
00:32
For example, the Department학과
of Transportation교통 will probably아마 tell you
8
20811
3199
유지 관리하는지를 발표하죠.
MTA는 지하철 노선이
얼마나 긴지를 과시합니다.
00:36
how many많은 miles마일 of road도로 they maintain유지하다.
9
24010
1781
00:37
The MTAMTA will boast자랑 how many많은 miles마일
of subway지하철 track선로 there are.
10
25791
2821
대부분의 시정 기관들은
여러 통계자료를 제공하죠.
00:40
Most가장 city시티 agencies에이전시 give us statistics통계.
11
28612
1807
이건 택시 리무진 위원회가
00:42
This is from a report보고서 this year
12
30419
1483
올해 발표한 보고서의 자료입니다.
00:43
from the Taxi택시 and Limousine리무진 Commission위원회,
13
31902
1892
이곳 뉴욕시에는 약 13,500대의
택시가 있다는군요.
00:45
where we learn배우다 that there's about
13,500 taxis택시 here in New새로운 York요크 City시티.
14
33794
3276
꽤 흥미롭죠?
00:49
Pretty예쁜 interesting재미있는, right?
15
37070
1290
그런데 이 숫자들이 어떻게
나왔는지 생각해 보셨나요?
00:50
But did you ever think about
where these numbers번호 came왔다 from?
16
38360
2784
이런 숫자들을 만들면서,
어떤 공무원이
00:53
Because for these numbers번호 to exist있다,
someone어떤 사람 at the city시티 agency대리점
17
41144
2903
'흠. 이 수치를 궁금해 하겠군'
이렇게 말했겠죠.
00:56
had to stop and say, hmm, here's여기에 a number번호
that somebody어떤 사람 might want want to know.
18
44047
3880
시민들이 알고 싶어하는
어떤 수치가 있다 치죠.
00:59
Here's여기에 a number번호
that our citizens시민 want to know.
19
47927
2250
그러면 공무원들은
기초 자료를 찾아서
01:02
So they go back to their그들의 raw노골적인 data데이터,
20
50177
1830
숫자를 세고, 더하고, 계산을 하죠.
01:04
they count카운트, they add더하다, they calculate계산하다,
21
52007
1797
그리곤 보고서를 내놓습니다.
01:05
and then they put out reports보고,
22
53804
1467
그 보고서에 이런 숫자들이 있겠죠.
01:07
and those reports보고
will have numbers번호 like this.
23
55271
2177
문제는, 우리의 질문을
어떻게 다 아냐는 거죠.
01:09
The problem문제 is, how do they know
all of our questions질문들?
24
57448
2540
우린 궁금한 게 많습니다.
01:11
We have lots of questions질문들.
25
59988
1243
01:13
In fact, in some ways there's literally말 그대로
an infinite무한의 number번호 of questions질문들
26
61231
3340
사실, 우리 도시에 관한 질문들이
말 그대로 무궁무진 할겁니다.
01:16
that we can ask청하다 about our city시티.
27
64571
1649
기관들이 감당하지 못할 정도로요.
01:18
The agencies에이전시 can never keep up.
28
66220
1475
기본 개념이 잘못 되었다는 걸
정책가들도 알고 있을 겁니다.
01:19
So the paradigm어형 변화표 isn't exactly정확하게 working,
and I think our policymakers정책 입안자 realize깨닫다 that,
29
67695
4056
01:23
because in 2012, Mayor시장 Bloomberg블룸버그
signed서명 한 into law what he called전화 한
30
71751
3959
왜냐하면 2012년 블룸버그 시장은
미국에서 가장 야심차고 광범위한
01:27
the most가장 ambitious거창한 and comprehensive포괄적 인
open열다 data데이터 legislation법률 제정 in the country국가.
31
75710
3837
개방형 데이터 법률안에
서명을 하였습니다.
01:31
In a lot of ways, he's right.
32
79547
1573
여러 측면에서, 옳은 결정을 했죠.
01:33
In the last two years연령,
the city시티 has released석방 된 1,000 datasets데이터 세트
33
81120
2861
지난 2년 동안, 뉴욕시는
1000개의 정보 자료를
01:35
on our open열다 data데이터 portal,
34
83981
1610
개방형 자료 포털사이트에 공개했습니다.
01:37
and it's pretty예쁜 awesome대단한.
35
85591
1764
꽤 잘한 일이죠.
01:39
So you go and look at data데이터 like this,
36
87355
1968
이런 데이터를 찾아 보다 보면
01:41
and instead대신에 of just counting세는
the number번호 of cabs택시,
37
89323
2289
단순히 택시 숫자만 세어 보는 대신에
01:43
we can start스타트 to ask청하다 different다른 questions질문들.
38
91612
1943
다른 질문들을 하기 시작할 겁니다.
저도 묻고 싶은 게 있어요.
01:45
So I had a question문제.
39
93555
1200
01:46
When's언제 rush돌진 hour시간 in New새로운 York요크 City시티?
40
94755
1701
뉴욕에서 가장 붐비는 시간대는 언제죠?
01:48
It can be pretty예쁜 bothersome귀찮은.
When is rush돌진 hour시간 exactly정확하게?
41
96456
2581
좀 귀찮은 질문일 수 있겠지만,
정확히 언제입니까?
01:51
And I thought to myself자기,
these cabs택시 aren't있지 않다. just numbers번호,
42
99037
2625
생각해 봤는데, 이 택시들은
단순한 숫자가 아니에요.
뉴욕시 도로를 다니는
차들의 GPS 기록들입니다.
01:53
these are GPSGPS recorders레코더
driving운전 around in our city시티 streets시가
43
101662
2711
택시를 타고 내리는
모든 이력이 기록되죠.
01:56
recording녹음 each마다 and every...마다 ride타기 they take.
44
104373
1913
01:58
There's data데이터 there,
and I looked보았다 at that data데이터,
45
106286
2322
그런 데이터가 있었습니다.
제가 찾아 봤어요.
02:00
and I made만든 a plot음모 of the average평균 speed속도 of
taxis택시 in New새로운 York요크 City시티 throughout전역 the day.
46
108608
3961
그래서 제가 뉴욕시 택시들의
일일 평균속도를 그려 봤습니다.
자정에서 아침 5:18까지는
속도가 증가하는 게 보이시죠.
02:04
You can see that from about midnight한밤중
to around 5:18 in the morning아침,
47
112569
3412
속도가 증가하다가,
그 시점부터는 양상이 바뀝니다.
02:07
speed속도 increases증가, and at that point포인트,
things turn회전 around,
48
115981
3563
02:11
and they get slower느린 and slower느린 and slower느린
until...까지 about 8:35 in the morning아침,
49
119544
3962
아침 8시 35분까지는
계속 점점 느려지다가
02:15
when they end종료 up at around
11 and a half절반 miles마일 per hour시간.
50
123506
2693
시속 11.5 마일까지 내려갑니다.
02:18
The average평균 taxi택시 is going 11 and a half절반
miles마일 per hour시간 on our city시티 streets시가,
51
126199
3562
평균적으로 택시들이 시내에서
시속 11.5마일로 다니고,
02:21
and it turns회전 out it stays체재하다 that way
52
129761
1987
하루 종일 그 정도로
02:23
for the entire완전한 day.
53
131748
3368
다닌다는 걸 알았죠.
02:27
(Laughter웃음)
54
135116
1373
(웃음)
02:28
So I said to myself자기, I guess추측
there's no rush돌진 hour시간 in New새로운 York요크 City시티.
55
136489
3180
제 생각에, 뉴욕에는
러시 아워는 없는 거 같아요.
그냥 러시 데이인거죠.
02:31
There's just a rush돌진 day.
56
139669
1537
02:33
Makes~한다. sense감각. And this is important중대한
for a couple of reasons원인.
57
141206
2850
맞는 말이죠. 이게 중요한
몇가지 이유가 있습니다.
02:36
If you're a transportation교통 planner입안자,
this might be pretty예쁜 interesting재미있는 to know.
58
144056
3637
여러분이 교통 계획자라면
꽤 흥미를 가졌을 거에요.
02:39
But if you want to get somewhere어딘가에 quickly빨리,
59
147693
1975
어떤 장소에
빨리 도착하고 싶다면,
새벽 4시 45분에 알람을
맞춰 놓기만 하면 됩니다.
02:41
you now know to set세트 your alarm경보 for
4:45 in the morning아침 and you're all set세트.
60
149668
3468
뉴욕에서는요. 그렇죠?
02:45
New새로운 York요크, right?
61
153136
1044
이 데이터에는 다른
이야기가 숨어 있습니다.
02:46
But there's a story이야기 behind뒤에 this data데이터.
62
154180
1762
알고 보면, 이 데이터는
그냥 얻을 수 없어요.
02:47
This data데이터 wasn't아니었다.
just available유효한, it turns회전 out.
63
155942
2185
사실 이 자료는 정보공개 요청을
통해서 얻었습니다.
02:50
It actually사실은 came왔다 from something called전화 한
a Freedom자유 of Information정보 Law Request의뢰,
64
158127
3619
FOIL 요청서라고도 하는데요.
02:53
or a FOIL Request의뢰.
65
161746
1076
이것은 택시리무진 위원회 웹사이트에
있는 신청서 양식입니다.
02:54
This is a form형태 you can find on the
Taxi택시 and Limousine리무진 Commission위원회 website웹 사이트.
66
162822
3466
이 자료를 얻으려면
이런 신청서를 받아서
02:58
In order주문 to access접속하다 this data데이터,
you need to go get this form형태,
67
166288
2826
작성을 하면 알려줄 겁니다.
03:01
fill가득 따르다 it out, and they will notify통보하다 you,
68
169114
1846
크리스 왕이라는 사람이
실제로 그렇게 했죠.
03:02
and a guy named명명 된 Chris크리스 Whong
did exactly정확하게 that.
69
170960
2130
크리스가 갔을 때, 거기서 말하길
03:05
Chris크리스 went갔다 down, and they told him,
70
173090
1890
03:06
"Just bring가져오다 a brand상표 new새로운 hard단단한 drive드라이브
down to our office사무실,
71
174980
2827
"새 하드 디스크를 가지고
사무실로 오세요"
03:09
leave휴가 it here for five다섯 hours시간,
we'll copy the data데이터 and you take it back."
72
177807
3424
"5시간 동안 맡겨 두시면
데이터를 복사해 둘테니, 찾아가세요"
03:13
And that's where this data데이터 came왔다 from.
73
181231
2032
그렇게 해서 이 데이터가 나온 겁니다.
03:15
Now, Chris크리스 is the kind종류 of guy
who wants to make the data데이터 public공공의,
74
183263
3005
크리스는 데이터를 공개하고 싶었습니다.
그래서 모두가 사용할 수 있게 인터넷에
올렸고, 결국 이 그래프가 만들어졌죠.
03:18
and so it ended끝난 up online온라인 for all to use,
and that's where this graph그래프 came왔다 from.
75
186268
3784
이런 게 존재한다는 사실이 놀랍습니다.
이런 GPS기록이요. 정말 대단하죠.
03:22
And the fact that it exists존재하다 is amazing놀랄 만한.
These GPSGPS recorders레코더 -- really cool시원한.
76
190052
3518
하지만 실상은, 시민들이
하드디스크를 들고 다니며
03:25
But the fact that we have citizens시민
walking보행 around with hard단단한 drives드라이브
77
193570
3118
시 당국에서 데이터를 얻어 와야만
대중에 공개된다는 거죠.
03:28
picking선발 up data데이터 from city시티 agencies에이전시
to make it public공공의 --
78
196688
2582
데이터는 이미 공공재입니다.
여러분도 얻을 수 있어요.
03:31
it was already이미 kind종류 of public공공의,
you could get to it,
79
199270
2390
하지만 공개되지 않은
"공공재"였던 거죠.
03:33
but it was "public공공의," it wasn't아니었다. public공공의.
80
201660
1812
더 잘할 수 있습니다.
03:35
And we can do better than that as a city시티.
81
203472
1962
시민들이 하드 드라이브를
들고 다닐 필요가 없죠.
03:37
We don't need our citizens시민
walking보행 around with hard단단한 drives드라이브.
82
205434
2756
정보공개 요청으로 모든
데이터를 얻을 수는 없습니다.
03:40
Now, not every...마다 dataset데이터 세트
is behind뒤에 a FOIL Request의뢰.
83
208190
2337
03:42
Here is a map지도 I made만든 with the most가장
dangerous위험한 intersections교차로 in New새로운 York요크 City시티
84
210527
3802
이건 제가 만든 뉴욕시에서
가장 위험한 교차로 지도입니다.
03:46
based기반 on cyclist자전거 타는 사람 accidents사고.
85
214329
1878
자전거 사고를 기초로 만든거죠.
03:48
So the red빨간 areas지역 are more dangerous위험한.
86
216207
1939
붉은 지역이 더 위험한 곳입니다.
03:50
And what it shows is first
the East동쪽 side측면 of Manhattan맨해튼,
87
218146
2553
맨하탄 동쪽이 먼저 눈에 띄는데요.
03:52
especially특히 in the lower보다 낮은 area지역 of Manhattan맨해튼,
has more cyclist자전거 타는 사람 accidents사고.
88
220699
3611
특히 맨하탄 하부 지역에서
자전거 사고가 더 많이 일어나죠.
03:56
That might make sense감각
89
224310
1019
이해가 되는 것이
03:57
because there are more cyclists자전거 타는 사람
coming오는 off the bridges다리 there.
90
225329
2896
저 다리 쪽에서 오는 자전거들이
더 많기 때문이죠.
04:00
But there's other hotspots핫스팟 worth가치 studying공부하는.
91
228225
2014
다른 장소도 연구해 볼 만합니다.
윌리엄스버그 거리와
퀸즈에 루즈벨트 거리입니다.
04:02
There's WilliamsburgWilliamsburg.
There's Roosevelt루스벨트 Avenue수단 in Queens퀸즈.
92
230239
2669
이것이 "무사고 정책"을 위해
필요한 데이터들입니다.
04:04
And this is exactly정확하게 the kind종류 of data데이터
we need for Vision시력 Zero제로.
93
232908
2852
바로 우리가 찾던 것이죠.
04:07
This is exactly정확하게 what we're looking for.
94
235760
1990
04:09
But there's a story이야기
behind뒤에 this data데이터 as well.
95
237750
2135
하지만 이 데이터도 뒷이야기가 있어요.
04:11
This data데이터 didn't just appear나타나다.
96
239885
2067
이 데이터가 그냥 생긴 게 아닙니다.
04:13
How many많은 of you guys know this logo심벌 마크?
97
241952
2391
이 로고를 아시나요?
04:16
Yeah, I see some shakes흔들다.
98
244343
1352
몇 분이 고개를 끄덕이시네요.
04:17
Have you ever tried시도한 to copy
and paste data데이터 out of a PDFPDF
99
245695
2655
PDF 데이터를 복사해서
붙여넣기 해본 적이 있나요?
04:20
and make sense감각 of it?
100
248350
1357
이해가 되십니까?
04:21
I see more shakes흔들다.
101
249707
1060
더 많은 분이 고개를 끄덕거리는군요.
붙여넣기를 해보신 분이 더 많으시군요.
04:22
More of you tried시도한 copying사자 and pasting붙여 넣기
than knew알고 있었다 the logo심벌 마크. I like that.
102
250767
3345
지금 막 보신 저 데이터는
사실 PDF 형태입니다.
04:26
So what happened일어난 is, the data데이터
that you just saw was actually사실은 on a PDFPDF.
103
254112
3510
사실, 수백, 수백, 수백 쪽의
PDF 형태의 보고서를
04:29
In fact, hundreds수백 and hundreds수백
and hundreds수백 of pages페이지들 of PDFPDF
104
257622
3105
04:32
put out by our very own개인적인 NYPDNYPD,
105
260727
2159
우리 뉴욕시 경찰청이 발간하고 있습니다.
04:34
and in order주문 to access접속하다 it,
you would either어느 한 쪽 have to copy and paste
106
262886
3152
그 자료를 다루려면
엄청난 시간들을 들여서
복사해서 붙이기를 해야 하죠.
04:38
for hundreds수백 and hundreds수백 of hours시간,
107
266038
1726
아니면 존 크로스처럼 하면 됩니다.
04:39
or you could be John남자 Krauss크라우스.
108
267764
1344
04:41
John남자 Krauss크라우스 was like,
109
269108
1043
존 크로스는
04:42
I'm not going to copy and paste this data데이터.
I'm going to write쓰다 a program프로그램.
110
270151
3413
데이터를 복사해서 붙이지 않고
프로그램을 만들었습니다.
'NYPD 사고 데이터 반창고'라는
이름을 붙였습니다.
04:45
It's called전화 한 the NYPDNYPD Crash추락 Data데이터 Band-Aid반창고,
111
273564
2288
04:47
and it goes간다 to the NYPD'sNYPD website웹 사이트
and it would download다운로드 PDFsPDF.
112
275852
3032
이 프로그램이 뉴욕경찰청 홈페이지에
접속해서 PDF를 내려받습니다.
04:50
Every마다 day it would search수색;
if it found녹이다 a PDFPDF, it would download다운로드 it
113
278884
3126
매일 검색하고 있다가,
PDF를 찾으면 다운로드하죠.
04:54
and then it would run운영
some PDF-scrapingPDF 스크래핑 program프로그램,
114
282010
2250
그리고는 스크랩 프로그램을 실행합니다.
04:56
and out would come the text본문,
115
284260
1336
그러면 텍스트를 뽑아 내고,
04:57
and it would go on the Internet인터넷,
and then people could make maps지도들 like that.
116
285596
3565
인터넷에 업로드하면,
누구나 저런 지도를 만들 수 있죠.
05:01
And the fact that the data's데이터 here,
the fact that we have access접속하다 to it --
117
289161
3429
데이터가 여기 존재하고,
우리는 그 데이터를 찾아내고,
05:04
Every마다 accident사고, by the way,
is a row in this table.
118
292590
2450
이런 식으로 모든 사고자료가
표 안의 행에 표시됩니다.
05:07
You can imagine상상하다 how many많은 PDFsPDF that is.
119
295040
1836
PDF가 얼마나 많은지 상상이 되나요?
05:08
The fact that we
have access접속하다 to that is great,
120
296876
2207
그것에 접근할 수 있다는
사실이야말로 대단한거죠.
05:11
but let's not release해제 it in PDFPDF form형태,
121
299083
2110
하지만 그걸 PDF로 공개하지는
않았으면 합니다.
05:13
because then we're having our citizens시민
write쓰다 PDFPDF scrapers긁는 도구.
122
301193
2739
시민들이 PDF를 스크랩해야 하잖아요.
우리 시민들의 시간을 낭비하는 겁니다.
05:15
It's not the best베스트 use
of our citizens'시민 ' time,
123
303932
2076
더 잘할 수 있는 방법이 있는데도 말이죠.
05:18
and we as a city시티 can do better than that.
124
306008
2004
05:20
Now, the good news뉴스 is that
the de Blasio블라시오 administration관리
125
308012
2736
희소식은 디 블라지오 행정부가
05:22
actually사실은 recently요새 released석방 된 this data데이터
a few조금 months개월 ago...전에,
126
310748
2532
사실 몇 달 전에
데이터들을 공개했습니다.
05:25
and so now we can
actually사실은 have access접속하다 to it,
127
313280
2158
이제 그 자료에 접근할 수 있죠.
05:27
but there's a lot of data데이터
still entombed안치 된 in PDFPDF.
128
315438
2536
하지만 아직도 많은 데이터들이
PDF로 만들어집니다.
05:29
For example, our crime범죄 data데이터
is still only available유효한 in PDFPDF.
129
317974
3197
예를 들어, 범죄 데이터는
여전히 PDF로만 공개됩니다.
05:33
And not just our crime범죄 data데이터,
our own개인적인 city시티 budget예산.
130
321171
3755
범죄 데이터뿐 아니라
시예산 자료도 마찬가지죠.
05:36
Our city시티 budget예산 is only readable읽을 수있는
right now in PDFPDF form형태.
131
324926
3729
시예산 자료는 지금 현재로서는
PDF로만 볼 수 있습니다.
05:40
And it's not just us
that can't analyze분석하다 it --
132
328655
2141
우리만 그걸 분석할 수 없는 게 아니라
05:42
our own개인적인 legislators입법자
who vote투표 for the budget예산
133
330796
2955
시예산을 승인한 시의원들도 역시
05:45
also또한 only get it in PDFPDF.
134
333751
1943
PDF로만 자료를 받고 있죠.
05:47
So our legislators입법자 cannot~ 할 수 없다. analyze분석하다
the budget예산 that they are voting투표 for.
135
335694
3844
그래서 시의원들도 자신들이 의결한
시예산을 살펴 보지 못합니다.
05:51
And I think as a city시티 we can do
a little better than that as well.
136
339538
3608
그 보다 더 나은 방법을 생각했어요.
PDF 속에는 많은
자료들이 드러나 있습니다.
05:55
Now, there's a lot of data데이터
that's not hidden숨겨진 in PDFsPDF.
137
343146
2488
05:57
This is an example of a map지도 I made만든,
138
345634
1700
그 예로 이 지도를 만들었습니다.
05:59
and this is the dirtiest더러운 waterways수로
in New새로운 York요크 City시티.
139
347334
2926
이건 뉴욕시 수로의
오염도를 나타낸 것입니다.
06:02
Now, how do I measure법안 dirty더러운?
140
350260
1509
어떻게 측정했냐구요?
06:03
Well, it's kind종류 of a little weird기묘한,
141
351769
1857
좀 특이하지만,
06:05
but I looked보았다 at the level수평
of fecal배설물 coliform대장균,
142
353626
2113
분변계 대장균 수치를 알아봤어요.
06:07
which어느 is a measurement측정 of fecal배설물 matter문제
in each마다 of our waterways수로.
143
355739
3506
각 수로에서 측정된 분변을 의미하죠.
06:11
The larger더 큰 the circle,
the dirtier더러운 the water,
144
359245
3274
원이 클수록 물이 더 더럽습니다.
06:14
so the large circles동그라미 are dirty더러운 water,
the small작은 circles동그라미 are cleaner청소기.
145
362519
3357
큰 원일수록 더러운 물이고
작은 원일수록 깨끗합니다.
06:17
What you see is inland내륙 waterways수로.
146
365876
1644
이것은 내륙 수로입니다.
06:19
This is all data데이터 that was sampled샘플링 된
by the city시티 over the last five다섯 years연령.
147
367520
3404
이것은 뉴욕시가 지난 5년간
측정한 모든 데이터들입니다.
06:22
And inland내륙 waterways수로 are,
in general일반, dirtier더러운.
148
370924
2694
내륙 수로들은 보통 더 더럽죠.
06:25
That makes~을 만든다 sense감각, right?
149
373618
1218
이해가 되시죠?
06:26
And the bigger더 큰 circles동그라미 are dirty더러운.
And I learned배운 a few조금 things from this.
150
374836
3374
원이 크면 더러운거죠.
이걸로 알게 된 것이 있어요.
하나. 개천이나 운하가 끝나는
곳에서는 절대 수영을 하지 마세요.
06:30
Number번호 one: Never swim수영 in anything
that ends끝이다 in "creek작은 만" or "canal운하."
151
378210
3164
06:33
But number번호 two: I also또한 found녹이다
the dirtiest더러운 waterway수로 in New새로운 York요크 City시티,
152
381374
4318
둘. 뉴욕시에서 가장 더러운 수로가
어딘 지를 제가 알아냈습니다.
06:37
by this measure법안, one measure법안.
153
385692
1834
이 측정값으로 말이죠, 이것만 가지고요.
06:39
In Coney토끼 Island Creek작은 만, which어느 is not
the Coney토끼 Island you swim수영 in, luckily운 좋게.
154
387526
3648
코니 아일랜드는 다행히도
사람들이 수영하는 곳은 아니에요.
그 반대 쪽이죠.
06:43
It's on the other side측면.
155
391174
1158
06:44
But Coney토끼 Island Creek작은 만, 94 percent퍼센트
of samples견본 taken취한 over the last five다섯 years연령
156
392332
3878
하지만 지난 5년 동안 거기에서
얻은 94%의 견본들에서
06:48
have had fecal배설물 levels수준 so high높은
157
396210
2157
분변 수치가 매우 높았습니다.
06:50
that it would be against반대 state상태 law
to swim수영 in the water.
158
398367
3093
그런 물에서 수영을 하는 건
법에 어긋날 겁니다.
06:53
And this is not the kind종류 of fact
that you're going to see
159
401460
2729
이런 사실을 시정 보고서에
자랑으로 내세우진 않겠죠?
06:56
boasted자랑하는 in a city시티 report보고서, right?
160
404189
1537
06:57
It's not going to be
the front page페이지 on nyc뉴욕.gov정부.
161
405726
2250
홈페이지에 이런 걸
올리지는 않을 겁니다.
거기에는 없어요.
06:59
You're not going to see it there,
162
407976
1580
하지만, 자료를 얻을 수
있다는 건 대단합니다.
07:01
but the fact that we can get
to that data데이터 is awesome대단한.
163
409556
2518
완전히 쉽지는 않아요.
07:04
But once일단 again, it wasn't아니었다. super감독자 easy쉬운,
164
412074
1773
07:05
because this data데이터 was not
on the open열다 data데이터 portal.
165
413847
2358
이런 건 데이터 포털에는 없어요.
공개 데이터 포털에 들어가 보면
07:08
If you were to go to the open열다 data데이터 portal,
166
416205
2013
아마 1년 전이나 몇 달 전에 나온
단편적 자료는 보실 수 있을겁니다.
07:10
you'd당신은 see just a snippet단편 of it,
a year or a few조금 months개월.
167
418218
2613
실제로 환경보호국
웹사이트에는 나와 있어요.
07:12
It was actually사실은 on the Department학과
of Environmental환경 Protection's보호 website웹 사이트.
168
420831
3390
이 각각의 링크가 엑셀로 연결되고,
각 엑셀시트 내용도 다릅니다.
07:16
And each마다 one of these links모래밭 is an Excel뛰어나다
sheet시트, and each마다 Excel뛰어나다 sheet시트 is different다른.
169
424221
3878
각 머릿글도 달라요.
복사하고 붙이고 재정리해서
07:20
Every마다 heading표제 is different다른:
you copy, paste, reorganize재구성하다.
170
428099
2630
이런 훌륭한 지도를 만들 수 있습니다.
다시 말씀드리지만,
07:22
When you do you can make maps지도들
and that's great, but once일단 again,
171
430729
2952
뉴욕시보다 더 잘 할 수 있고,
표준화할 수 있어요.
07:25
we can do better than that
as a city시티, we can normalize정상화하다 things.
172
433681
2969
소크라타가 만든 웹사이트를 보면
그걸 잘 이해할 수 있어요.
07:28
And we're getting점점 there, because
there's this website웹 사이트 that Socrata소크라타 makes~을 만든다
173
436650
3384
'공개 자료 포털 뉴욕시'라는
웹사이트인데요.
이곳의 1,100개의 자료는
귀찮지 않아요
07:32
called전화 한 the Open열다 Data데이터 Portal NYC뉴욕.
174
440034
1541
07:33
This is where 1,100 data데이터 sets세트
that don't suffer참다
175
441575
2257
방금 설명한 방법으로 만들었죠.
자료수는 계속 늘어나고 있어요.
07:35
from the things I just told you live살고 있다,
176
443832
1781
07:37
and that number번호 is growing성장하는,
and that's great.
177
445613
2148
어떤 형식으로든 받을 수 있습니다.
CSV, PDF, 엑셀로도요.
07:39
You can download다운로드 data데이터 in any format체재,
be it CSVCSV or PDFPDF or Excel뛰어나다 document문서.
178
447761
3412
여러분이 원하는 자료를
받아볼 수 있습니다.
07:43
Whatever도대체 무엇이 you want,
you can download다운로드 the data데이터 that way.
179
451173
2547
문제는, 자료를 보다보면
07:45
The problem문제 is, once일단 you do,
180
453720
1352
07:47
you will find that each마다 agency대리점
codes코드들 their그들의 addresses구애 differently다르게.
181
455072
3686
각 기관들이 주소를 다르게
규정하는 걸 알게될 겁니다.
07:50
So one is street거리 name이름,
intersection교차로 street거리,
182
458758
2141
어떤 건 도로명이고, 교차로,
07:52
street거리, borough자치구, address주소, building건물,
building건물 address주소.
183
460899
2491
거리, 군, 주소, 건물,
건물 주소를 쓰고 있죠.
07:55
So once일단 again, you're spending지출 time,
even when we have this portal,
184
463390
3180
역시나, 이 포탈이 있어도
시간을 들여야 할 겁니다.
07:58
you're spending지출 time
normalizing정규화 our address주소 fields전지.
185
466570
2606
시간을 들여서 주소를 정리해야 하죠.
08:01
And that's not the best베스트 use
of our citizens'시민 ' time.
186
469176
2423
이건 시민들의 시간을 낭비하는 거에요.
우리는 더 잘 할 수 있습니다.
08:03
We can do better than that as a city시티.
187
471599
1796
08:05
We can standardize표준화하다 our addresses구애,
188
473395
1645
주소 체계를 표준화하면
08:07
and if we do,
we can get more maps지도들 like this.
189
475040
2185
이런 지도를 쉽게 만들 수 있습니다.
08:09
This is a map지도 of fire hydrants소화전
in New새로운 York요크 City시티,
190
477225
2285
이것은 뉴욕의 소화전 지도입니다.
08:11
but not just any fire hydrants소화전.
191
479510
1531
일반적인 소화전이 아니고
08:13
These are the top상단 250 grossing총 수익 fire
hydrants소화전 in terms자귀 of parking주차 tickets티켓.
192
481041
4726
주차위반 딱지로 흥행을 거둔
상위 250개의 소화전 입니다.
08:17
(Laughter웃음)
193
485767
1986
(웃음)
08:19
So I learned배운 a few조금 things from this map지도,
and I really like this map지도.
194
487753
3358
이 지도에서도 몇가지를 배웠고
전 정말 이 지도를 좋아해요.
08:23
Number번호 one, just don't park공원
on the Upper높은 East동쪽 Side측면.
195
491111
2402
첫째, 맨하탄 북동쪽에는
절대로 주차하지 마세요.
08:25
Just don't. It doesn't matter문제 where
you park공원, you will get a hydrant소화전 ticket티켓.
196
493513
3587
어디에 주차를 하든
주차 딱지를 떼일거니까요.
08:29
Number번호 two, I found녹이다 the two highest제일 높은
grossing총 수익 hydrants소화전 in all of New새로운 York요크 City시티,
197
497100
4153
둘째, 뉴욕시에서 두번째로
소화전이 많은 곳을 찾았는데요.
08:33
and they're on the Lower보다 낮은 East동쪽 Side측면,
198
501253
1886
맨하탄 하부 동쪽입니다.
08:35
and they were bringing데려 오는 in over
55,000 dollars불화 a year in parking주차 tickets티켓.
199
503139
5098
주차딱지로 1년에 5만 5천달러가
넘는 세금을 벌어들입니다.
08:40
And that seemed~ 같았다 a little strange이상한
to me when I noticed알아 차 렸던 it,
200
508237
2738
그걸 알아냈을 때 뭔가 이상했어요.
08:42
so I did a little digging파기 and it turns회전 out
what you had is a hydrant소화전
201
510975
3269
좀 더 알아내서 나온 게 소화전이었고
경계석 확장 영역이
있다는 것을 알았습니다.
08:46
and then something called전화 한
a curb연석 extension신장,
202
514244
1996
보행자를 위한 2m 정도의 공간이죠.
08:48
which어느 is like a seven-foot7 피트
space공간 to walk산책 on,
203
516240
2059
그리고 주차 공간도 있어요.
08:50
and then a parking주차 spot자리.
204
518299
1156
08:51
And so these cars자동차 came왔다 along...을 따라서,
and the hydrant소화전 --
205
519455
2254
이 차들이 늘어서 있고
소화전도 있어요.
"소화전은 저기 있으니까,
주차해도 괜찮을거야."
08:53
"It's all the way over there, I'm fine,"
206
521709
1911
사실 저기에 예쁘게 표시된
주차공간이 있어요.
08:55
and there was actually사실은 a parking주차 spot자리
painted그린 there beautifully아름답게 for them.
207
523620
3474
거기에 주차를 하면, 뉴욕경찰은
이 곳은 지정된 공간이 아니라고 하면서
08:59
They would park공원 there, and the NYPDNYPD
disagreed의견이 맞지 않는 with this designation지정
208
527094
3155
주차위반 딱지를 끊겠죠.
09:02
and would ticket티켓 them.
209
530249
1058
저만 주차위반 딱지를 본 게 아니구요.
09:03
And it wasn't아니었다. just me
who found녹이다 a parking주차 ticket티켓.
210
531307
2344
이건 구글 스트릿뷰에
찍힌 자동차 모습인데
09:05
This is the GoogleGoogle
Street거리 View전망 car driving운전 by
211
533651
2146
역시 주차위반 딱지를 받았습니다.
09:07
finding발견 the same같은 parking주차 ticket티켓.
212
535797
1617
09:09
So I wrote about this on my blog블로그,
on I Quant퀀트 NY뉴욕, and the DOT responded대답했다,
213
537414
4504
이걸 제 블로그에 올렸더니
아이콴트 뉴욕과 교통부에서 답을 했죠.
09:13
and they said,
214
541918
1020
그들이 말하기를,
09:14
"While the DOT has not received받은
any complaints불만 사항 about this location위치,
215
542938
3410
"교통부는 이 지역에 관한
어떤 항의도 받지 않았지만,
09:18
we will review리뷰 the roadway도로 markings표식
and make any appropriate적당한 alterations변경."
216
546348
4542
길 표지를 다시 확인하고
적당한 교체를 할 것입니다. "
09:22
And I thought to myself자기,
typical전형적인 government정부 response응답,
217
550890
2959
전 속으로 저건 틀에 박힌
대답이라고 생각했어요.
09:25
all right, moved움직이는 on with my life.
218
553849
1881
그래요, 무시하기로 했어요.
09:27
But then, a few조금 weeks later후에,
something incredible놀랄 만한 happened일어난.
219
555730
3970
하지만, 몇주일 후,
정말 놀라운 일이 일어났습니다.
09:31
They repainted다시 그려진 the spot자리,
220
559700
2520
그 공간에 다시 페인트칠을 한겁니다.
09:34
and for a second둘째 I thought I saw
the future미래 of open열다 data데이터,
221
562220
2690
잠깐이지만 오픈 데이터의
미래를 봤다는 생각을 했어요.
09:36
because think about what happened일어난 here.
222
564910
2000
여기에서 일어난 일을 생각해보세요.
09:38
For five다섯 years연령, this spot자리 was being존재
ticketed발권 된, and it was confusing혼란스러운,
223
566910
5100
5년 동안 그 곳은 유명한
단속장소였는데,
09:44
and then a citizen시민 found녹이다 something,
they told the city시티, and within이내에 a few조금 weeks
224
572010
4306
시민 한명이 무언가를 찾았고,
시 당국에 알리고, 몇 주 후에
09:48
the problem문제 was fixed결정된.
225
576316
1294
문제가 해결된 거에요.
09:49
It's amazing놀랄 만한. And a lot of people
see open열다 data데이터 as being존재 a watchdog지키는 개.
226
577610
3200
그리고 다들 오픈 데이터를
감시견으로 생각하는데
09:52
It's not, it's about being존재 a partner파트너.
227
580810
1772
이건 파트너에 가깝습니다.
09:54
We can empower능력을 키우다 our citizens시민
to be better partners파트너 for government정부,
228
582582
3138
우리 시민은 정부의 훌륭한
파트너가 될 수 있어요.
09:57
and it's not that hard단단한.
229
585720
1881
어려운 일이 아닙니다.
필요한 건 작은 변화입니다.
09:59
All we need are a few조금 changes변화들.
230
587601
1459
10:01
If you're FOILingFOILing data데이터,
231
589060
1107
자료 공개를 요청하고,
10:02
if you're seeing your data데이터
being존재 FOILedFOILed over and over again,
232
590167
2867
구한 자료를 계속 살펴 보고,
대중에게 알리는 겁니다.
공개하라는 신호를 보내는거죠.
10:05
let's release해제 it to the public공공의, that's
a sign기호 that it should be made만든 public공공의.
233
593034
3574
정부기관의 PDF 발행을
담당하는 분이 계시다면
10:08
And if you're a government정부 agency대리점
releasing풀어주는 a PDFPDF,
234
596608
2482
10:11
let's pass패스 legislation법률 제정 that requires요구하다 you
to post게시하다 it with the underlying밑에 있는 data데이터,
235
599090
3649
기초 데이터 배포에 필요한
법안을 통과시켜 주세요.
10:14
because that data데이터
is coming오는 from somewhere어딘가에.
236
602739
2028
왜냐하면 그런 데이터가
어디선가 나오잖아요.
저는 모르지만,
어디선가 나오니까
10:16
I don't know where, but it's
coming오는 from somewhere어딘가에,
237
604767
2482
PDF로 배포하는 거겠죠.
10:19
and you can release해제 it with the PDFPDF.
238
607249
1725
그리고 이 데이터의 표준을
만들고 공유해 주세요.
10:20
And let's adopt채택하다 and share
some open열다 data데이터 standards표준.
239
608974
2411
이곳 뉴욕시에서 우리의
주소체계를 시작해 주세요.
10:23
Let's start스타트 with our addresses구애
here in New새로운 York요크 City시티.
240
611385
2481
우리의 주소체계를 표준화해 주세요.
10:25
Let's just start스타트
normalizing정규화 our addresses구애.
241
613866
2074
뉴욕시는 오픈 데이터의 선두주자니까요.
10:27
Because New새로운 York요크 is a leader리더 in open열다 data데이터.
242
615940
2062
이 모든 것에도 불구하고, 우리는
오픈 데이터 영역의 선구자입니다.
10:30
Despite무례 all this, we are absolutely전혀
a leader리더 in open열다 data데이터,
243
618002
2789
그리고 만약 우리가
표준화 작업을 시작하면,
10:32
and if we start스타트 normalizing정규화 things,
and set세트 an open열다 data데이터 standard표준,
244
620791
3121
다른 지역, 다른 주,
연방정부도 따라 할 겁니다.
10:35
others다른 사람 will follow따르다. The state상태 will follow따르다,
and maybe the federal연방의 government정부,
245
623912
3634
다른 나라들도 따라 하겠죠.
프로그램 하나로 100개 국가의
정보를 지도로 만들 날이
10:39
Other countries국가 could follow따르다,
246
627546
1445
10:40
and we're not that far멀리 off from a time
where you could write쓰다 one program프로그램
247
628991
3411
그리 머지 않았습니다.
10:44
and map지도 information정보 from 100 countries국가.
248
632402
1890
이건 공상과학 소설이 아니며
실제로 가능합니다.
10:46
It's not science과학 fiction소설.
We're actually사실은 quite아주 close닫기.
249
634292
2487
그런데, 그럴 자격은 누구에게 있죠?
10:48
And by the way, who are we
empowering권한을 부여하는 with this?
250
636779
2240
존 크로스도 아니고
크리스 왕도 아닙니다.
10:51
Because it's not just John남자 Krauss크라우스
and it's not just Chris크리스 Whong.
251
639019
3005
뉴욕시에만도 수 백개의
소모임이 있습니다.
10:54
There are hundreds수백 of meetups만남
going on in New새로운 York요크 City시티 right now,
252
642024
3095
왕성하게 활동중이죠.
10:57
active유효한 meetups만남.
253
645119
1025
수 천 명의 사람들이
이 모임에 참여합니다.
10:58
There are thousands수천 of people
attending참석하는 these meetups만남.
254
646144
2572
퇴근 후나 주말이 되면
11:00
These people are going after work
and on weekends주말,
255
648716
2368
모임에 참여해서
공개된 자료를 분석합니다.
11:03
and they're attending참석하는 these meetups만남
to look at open열다 data데이터
256
651084
2636
더 나은 도시를 만들자는 생각으로요.
11:05
and make our city시티 a better place장소.
257
653720
1640
베타NYC 단체는 지난 주에
citygram.nyc 라는 사이트를 열었습니다.
11:07
Groups여러 떼 like BetaNYCBetaNYC, who just last week
released석방 된 something called전화 한 citygram시청.nyc뉴욕
258
655360
4073
11:11
that allows허락하다 you to subscribe구독하다
to 311 complaints불만 사항
259
659433
2147
여러분 집이나 사무실 주변의
11:13
around your own개인적인 home,
or around your office사무실.
260
661580
2068
311 불편신고 내용을 구독할 수 있죠.
11:15
You put in your address주소,
you get local노동 조합 지부 complaints불만 사항.
261
663648
2427
집주소를 입력하면,
지역 민원 내용을 알려줍니다.
11:18
And it's not just the tech기술 community커뮤니티
that are after these things.
262
666075
3374
이건 기술 동호회만의 몫이 아닙니다.
제가 가르치는 학생들같은 도시계획가.
11:21
It's urban도시의 planners기획자 like
the students재학생 I teach가르치다 at Pratt프랫.
263
669449
2622
11:24
It's policy정책 advocates옹호자, it's everyone각자 모두,
264
672071
1919
정책입안자, 그리고 우리 모두.
11:25
it's citizens시민 from a diverse다양한
set세트 of backgrounds배경.
265
673990
2563
다양한 배경을 가진 시민들의 몫입니다.
11:28
And with some small작은, incremental증분 changes변화들,
266
676553
2786
이런 작고, 점진적인 변화를 통해서
11:31
we can unlock터놓다 the passion열정
and the ability능력 of our citizens시민
267
679339
3225
시민으로서의 열정과 능력을 드러내고
11:34
to harness마구 open열다 data데이터
and make our city시티 even better,
268
682564
3156
오픈 데이터를 이용해
더 나은 도시를 만들 수 있습니다.
11:37
whether인지 어떤지 it's one dataset데이터 세트,
or one parking주차 spot자리 at a time.
269
685720
3626
하나의 데이터든, 작은
주차공간이든, 뭐든지 말이죠.
11:41
Thank you.
270
689346
2322
감사합니다.
11:43
(Applause박수 갈채)
271
691668
3305
(박수)
Translated by Jihyeon J. Kim
Reviewed by JY Kang

▲Back to top

ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com