ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com
TEDxNewYork

Ben Wellington: How we found the worst place to park in New York City -- using big data

Ben Wellington: Jak znaleźliśmy najgorsze miejsce do parkowania w Nowym Jorku za pomocą danych statystycznych

Filmed:
1,055,247 views

Miejskie agencje mają dostęp do wielu danych i statystyk obejmujących każdą część życia miasta. Ben Wellington, badacz danych pokazuje w tej prelekcji, że czasem po prostu nie wiedzą, co z nimi zrobić. Wellington demonstruje, jak połączenie niespodziewanych pytań i dobrze zorganizowanych danych może stworzyć bardzo użyteczne informacje oraz podpowiada, w jaki sposób udostępniać duże zbiory danych, aby każdy mógł ich użyć.
- Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data. Full bio

Double-click the English transcript below to play the video.

00:12
SixSześć thousandtysiąc milesmile of roadDroga,
0
711
2820
Dziesięć tysięcy kilometrów dróg,
00:15
600 milesmile of subwaymetro tracktor,
1
3531
2203
1000 kilometrów torów metra,
00:17
400 milesmile of bikerower lanesścieżki
2
5734
1644
650 kilometrów ścieżek rowerowych
00:19
and a halfpół a mileMila of tramtramwaj tracktor,
3
7378
1821
oraz kilometr toru tramwajowego,
00:21
if you've ever been to RooseveltRoosevelt IslandWyspa.
4
9199
1953
jeśli ktoś był na Roosevelt Island.
00:23
These are the numbersliczby that make up
the infrastructureinfrastruktura of NewNowy YorkYork CityMiasto.
5
11152
3334
Te liczby składają się
na infrastrukturę Nowego Jorku.
00:26
These are the statisticsStatystyka
of our infrastructureinfrastruktura.
6
14486
2619
Oto statystyki naszej infrastruktury.
00:29
They're the kinduprzejmy of numbersliczby you can find
releasedwydany in reportsraporty by cityMiasto agenciesagencje.
7
17105
3706
Można je znaleźć w raportach
agencji miejskich.
Na przykład Departament Transportu
prawdopodobnie poinformuje,
00:32
For exampleprzykład, the DepartmentDział
of TransportationTransportu will probablyprawdopodobnie tell you
8
20811
3199
00:36
how manywiele milesmile of roadDroga they maintainutrzymać.
9
24010
1781
iloma kilometrami dróg zarządza.
00:37
The MTAMTA will boastpochwalić się how manywiele milesmile
of subwaymetro tracktor there are.
10
25791
2821
MTA będzie się przechwalać
długością torów metra.
00:40
MostWiększość cityMiasto agenciesagencje give us statisticsStatystyka.
11
28612
1807
Miejskie agencje publikują statystyki.
00:42
This is from a reportraport this yearrok
12
30419
1483
Te są z tegorocznego raportu
00:43
from the TaxiTaksówką and LimousineLimuzyna CommissionKomisja,
13
31902
1892
Komisji Taksówek i Limuzyn.
00:45
where we learnuczyć się that there's about
13,500 taxistaksówki here in NewNowy YorkYork CityMiasto.
14
33794
3276
Można się z nich dowiedzieć,
że po mieście jeździ 13 500 taksówek.
00:49
PrettyŁadny interestingciekawy, right?
15
37070
1290
Całkiem ciekawe, prawda?
00:50
But did you ever think about
where these numbersliczby cameoprawa ołowiana witrażu from?
16
38360
2784
Ale czy zastanawialiście się,
skąd pochodzą te liczby?
00:53
Because for these numbersliczby to exististnieć,
someonektoś at the cityMiasto agencyagencja
17
41144
2903
Żeby powstały, ktoś w agencji
00:56
had to stop and say, hmmhmm, here'soto jest a numbernumer
that somebodyktoś mightmoc want want to know.
18
44047
3880
musiał uznać: "Oto liczba,
którą ktoś chciałby poznać.
00:59
Here'sTutaj jest a numbernumer
that our citizensobywatele want to know.
19
47927
2250
Oto liczba, którą obywatele chcą znać".
01:02
So they go back to theirich rawsurowy datadane,
20
50177
1830
Wracają więc do surowych danych,
01:04
they countliczyć, they addDodaj, they calculateobliczać,
21
52007
1797
liczą, dodają, obliczają
01:05
and then they put out reportsraporty,
22
53804
1467
i wydają raporty
01:07
and those reportsraporty
will have numbersliczby like this.
23
55271
2177
zawierające liczby takie, jak ta.
01:09
The problemproblem is, how do they know
all of our questionspytania?
24
57448
2540
Skąd jednak znają wszystkie nasze pytania?
01:11
We have lots of questionspytania.
25
59988
1243
Mamy ich mnóstwo.
01:13
In factfakt, in some wayssposoby there's literallydosłownie
an infinitenieskończony numbernumer of questionspytania
26
61231
3340
O naszym mieście można zadać
nieskończenie wiele pytań.
01:16
that we can askzapytać about our cityMiasto.
27
64571
1649
01:18
The agenciesagencje can never keep up.
28
66220
1475
Agencje nigdy by nie nadążyły.
01:19
So the paradigmparadygmat isn't exactlydokładnie workingpracujący,
and I think our policymakersPolitycy realizerealizować that,
29
67695
4056
To nie za bardzo działa
i urzędnicy chyba o tym wiedzą.
01:23
because in 2012, MayorBurmistrz BloombergBloomberg
signedpodpisany into lawprawo what he callednazywa
30
71751
3959
W 2012 roku burmistrz Bloomberg
podpisał ustawę, którą nazwał
01:27
the mostwiększość ambitiousambitny and comprehensivewszechstronny
openotwarty datadane legislationustawodawstwo in the countrykraj.
31
75710
3837
"najbardziej ambitnym i kompleksowym
prawodawstwem otwartych danych w kraju".
01:31
In a lot of wayssposoby, he's right.
32
79547
1573
Pod wieloma względami ma rację.
01:33
In the last two yearslat,
the cityMiasto has releasedwydany 1,000 datasetszestawów danych
33
81120
2861
Przez dwa lata nasze miasto
umieściło 1000 zbiorów danych
01:35
on our openotwarty datadane portalPortal,
34
83981
1610
na portalu otwartych danych.
01:37
and it's prettyładny awesomeniesamowite.
35
85591
1764
To jest naprawdę niesamowite.
01:39
So you go and look at datadane like this,
36
87355
1968
Kiedy je ściągasz i analizujesz
01:41
and insteadzamiast of just countingrachunkowość
the numbernumer of cabskabiny,
37
89323
2289
zamiast liczyć taksówki,
01:43
we can startpoczątek to askzapytać differentróżne questionspytania.
38
91612
1943
można zadawać inne pytania.
01:45
So I had a questionpytanie.
39
93555
1200
Zadałem pytanie.
01:46
When'sKiedy w rushpośpiech hourgodzina in NewNowy YorkYork CityMiasto?
40
94755
1701
Kiedy w NY są godziny szczytu?
01:48
It can be prettyładny bothersomeuciążliwe.
When is rushpośpiech hourgodzina exactlydokładnie?
41
96456
2581
Są trochę uciążliwe, ale kiedy dokładnie?
01:51
And I thought to myselfsiebie,
these cabskabiny aren'tnie są just numbersliczby,
42
99037
2625
Pomyślałem, że taksówki
nie są jedynie numerami,
01:53
these are GPSGPS recordersrejestratory
drivingnapędowy around in our cityMiasto streetsulice
43
101662
2711
są rejestratorami GPS
jeżdżącymi po ulicach miasta,
01:56
recordingnagranie eachkażdy and everykażdy ridejazda they take.
44
104373
1913
nagrywającymi każdy przebyty kurs.
01:58
There's datadane there,
and I lookedspojrzał at that datadane,
45
106286
2322
Przyjrzałem się tym danym
02:00
and I madezrobiony a plotwątek of the averageśredni speedprędkość of
taxistaksówki in NewNowy YorkYork CityMiasto throughoutpoprzez the day.
46
108608
3961
i stworzyłem dzienny wykres
średniej prędkości nowojorskich taksówek.
02:04
You can see that from about midnightpółnocy
to around 5:18 in the morningranek,
47
112569
3412
Można zaobserwować,
że od północy do 5:18 rano
02:07
speedprędkość increaseswzrasta, and at that pointpunkt,
things turnskręcać around,
48
115981
3563
prędkość rośnie,
a następnie zaczyna spadać.
02:11
and they get slowerwolniej and slowerwolniej and slowerwolniej
untilaż do about 8:35 in the morningranek,
49
119544
3962
Maleje i maleje i maleje aż do około 8:35,
02:15
when they endkoniec up at around
11 and a halfpół milesmile perza hourgodzina.
50
123506
2693
kiedy to wynosi około 18,5 km/h.
02:18
The averageśredni taxiTaxi is going 11 and a halfpół
milesmile perza hourgodzina on our cityMiasto streetsulice,
51
126199
3562
Przeciętna taksówka przemierza miasto
z prędkością 18,5 km/h.
02:21
and it turnsskręca out it staysgorset that way
52
129761
1987
Okazuje się, że ta prędkość
02:23
for the entireCały day.
53
131748
3368
utrzymuje się już do końca dnia.
02:27
(LaughterŚmiech)
54
135116
1373
(Śmiech)
02:28
So I said to myselfsiebie, I guessodgadnąć
there's no rushpośpiech hourgodzina in NewNowy YorkYork CityMiasto.
55
136489
3180
Stwierdziłem, że w Nowym Jorku
nie ma godzin szczytu.
02:31
There's just a rushpośpiech day.
56
139669
1537
Jest natomiast dzień szczytu.
02:33
MakesSprawia, że sensesens. And this is importantważny
for a couplepara of reasonspowody.
57
141206
2850
To ma sens. I jest ważne z paru powodów.
02:36
If you're a transportationtransport plannerPlanner,
this mightmoc be prettyładny interestingciekawy to know.
58
144056
3637
To interesujące dla planisty transportu.
02:39
But if you want to get somewheregdzieś quicklyszybko,
59
147693
1975
Jeśli chcesz dokądś sprawnie dojechać,
02:41
you now know to setzestaw your alarmalarm for
4:45 in the morningranek and you're all setzestaw.
60
149668
3468
wystarczy ustawić budzik
na 4:45 rano i gotowe.
02:45
NewNowy YorkYork, right?
61
153136
1044
W końcu to Nowy Jork.
02:46
But there's a storyfabuła behindza this datadane.
62
154180
1762
Z tymi danymi wiąże się opowieść.
02:47
This datadane wasn'tnie było
just availabledostępny, it turnsskręca out.
63
155942
2185
Nie były one dostępne wprost.
02:50
It actuallytak właściwie cameoprawa ołowiana witrażu from something callednazywa
a FreedomWolność of InformationInformacje LawPrawa RequestWniosek,
64
158127
3619
Pochodzą z "Zapytania na podstawie
Ustawy o Wolności Informacji"
02:53
or a FOILFOLII RequestWniosek.
65
161746
1076
lub Zapytania FOIL.
02:54
This is a formformularz you can find on the
TaxiTaksówką and LimousineLimuzyna CommissionKomisja websitestronie internetowej.
66
162822
3466
Ten formularz jest na stronie
Komisji ds. Taksówek i Limuzyn.
Żeby uzyskać dostęp do tych danych,
należało go pobrać i wypełnić,
02:58
In orderzamówienie to accessdostęp this datadane,
you need to go get this formformularz,
67
166288
2826
a potem cię zawiadomią.
03:01
fillwypełniać it out, and they will notifypowiadomić you,
68
169114
1846
Zrobił to facet o nazwisku Chris Whong.
03:02
and a guy namedo imieniu ChrisChris WhongWhong
did exactlydokładnie that.
69
170960
2130
03:05
ChrisChris wentposzedł down, and they told him,
70
173090
1890
Chris usłyszał:
03:06
"Just bringprzynieść a brandMarka newNowy hardciężko drivenapęd
down to our officegabinet,
71
174980
2827
"Przynieś nam fabrycznie nowy dysk twardy
i zostaw go na pięć godzin.
03:09
leavepozostawiać it here for fivepięć hoursgodziny,
we'lldobrze copyKopiuj the datadane and you take it back."
72
177807
3424
Dostaniesz skopiowane dane".
03:13
And that's where this datadane cameoprawa ołowiana witrażu from.
73
181231
2032
Tak powstały te dane.
03:15
Now, ChrisChris is the kinduprzejmy of guy
who wants to make the datadane publicpubliczny,
74
183263
3005
Chris chciał upubliczniać dane.
03:18
and so it endedzakończyło się up onlineonline for all to use,
and that's where this graphwykres cameoprawa ołowiana witrażu from.
75
186268
3784
Udostępnił je w internecie,
dzięki czemu powstały te wykresy.
03:22
And the factfakt that it existsistnieje is amazingniesamowity.
These GPSGPS recordersrejestratory -- really coolchłodny.
76
190052
3518
Fajnie, że istnieją takie dane.
Rejestratory GPS - fajna rzecz.
Ale żeby to obywatele mieli
spacerować z twardymi dyskami
03:25
But the factfakt that we have citizensobywatele
walkingpieszy around with hardciężko drivesdyski
77
193570
3118
kopiować dane w celu upublicznienia,
03:28
pickingowocobranie up datadane from cityMiasto agenciesagencje
to make it publicpubliczny --
78
196688
2582
dane niby już "publiczne",
bo dało się je zdobyć,
03:31
it was alreadyjuż kinduprzejmy of publicpubliczny,
you could get to it,
79
199270
2390
ale nie naprawdę publiczne.
03:33
but it was "publicpubliczny," it wasn'tnie było publicpubliczny.
80
201660
1812
03:35
And we can do better than that as a cityMiasto.
81
203472
1962
Miasto może zrobić to lepiej.
Nie potrzeba obywateli
krążących z dyskami twardymi.
03:37
We don't need our citizensobywatele
walkingpieszy around with hardciężko drivesdyski.
82
205434
2756
03:40
Now, not everykażdy datasetzestawu danych
is behindza a FOILFOLII RequestWniosek.
83
208190
2337
Nie każdy pakiet danych
jest związany z FOIL.
03:42
Here is a mapmapa I madezrobiony with the mostwiększość
dangerousniebezpieczny intersectionsskrzyżowania in NewNowy YorkYork CityMiasto
84
210527
3802
Stworzyłem mapę najniebezpieczniejszych
skrzyżowań w Nowym Yorku
03:46
basedna podstawie on cyclistrowerzysta accidentsWypadki.
85
214329
1878
w oparciu o wypadki rowerzystów.
03:48
So the redczerwony areasobszary are more dangerousniebezpieczny.
86
216207
1939
Czerwone obszary są niebezpieczniejsze.
03:50
And what it showsprzedstawia is first
the EastWschód sidebok of ManhattanManhattan,
87
218146
2553
Od razu widać,
że we wschodniej części Manhattanu,
03:52
especiallyszczególnie in the lowerniższy areapowierzchnia of ManhattanManhattan,
has more cyclistrowerzysta accidentsWypadki.
88
220699
3611
jest więcej wypadków rowerowych.
03:56
That mightmoc make sensesens
89
224310
1019
03:57
because there are more cyclistsrowerzystów
comingprzyjście off the bridgesmosty there.
90
225329
2896
To ma sens.
W tym miejscu rowerzyści
zjeżdżają z mostów.
04:00
But there's other hotspotshotspoty worthwartość studyingstudiować.
91
228225
2014
Są też inne punkty zapalne.
To Williamsburg
i aleja Roosvelta w Queens.
04:02
There's WilliamsburgWilliamsburg.
There's RooseveltRoosevelt AvenueAvenue in QueensQueens.
92
230239
2669
Takich danych potrzeba do Vision Zero.
04:04
And this is exactlydokładnie the kinduprzejmy of datadane
we need for VisionWizja ZeroZero.
93
232908
2852
04:07
This is exactlydokładnie what we're looking for.
94
235760
1990
Tego właśnie szukamy.
04:09
But there's a storyfabuła
behindza this datadane as well.
95
237750
2135
Za tymi danymi też kryje się historia.
04:11
This datadane didn't just appearzjawić się.
96
239885
2067
Te dane nie wzięły się z powietrza.
04:13
How manywiele of you guys know this logologo?
97
241952
2391
Ile z was zna to logo?
04:16
Yeah, I see some shakestrzęsie.
98
244343
1352
Kilka osób potakuje.
04:17
Have you ever triedwypróbowany to copyKopiuj
and pastepasta datadane out of a PDFPDF
99
245695
2655
Próbowaliście kiedyś
skopiować i wkleić dane z PDFa,
04:20
and make sensesens of it?
100
248350
1357
żeby miały jakiś sens?
04:21
I see more shakestrzęsie.
101
249707
1060
Więcej próbowało funkcji kopiuj-wklej,
04:22
More of you triedwypróbowany copyingbiurowy and pastingwklejanie
than knewwiedziałem the logologo. I like that.
102
250767
3345
niż zna to logo. Nieźle.
04:26
So what happenedstało się is, the datadane
that you just saw was actuallytak właściwie on a PDFPDF.
103
254112
3510
Dane, które właśnie widzieliśmy,
były w właśnie w pliku PDF,
04:29
In factfakt, hundredssetki and hundredssetki
and hundredssetki of pagesstrony of PDFPDF
104
257622
3105
na setkach stron dokumentów,
04:32
put out by our very ownwłasny NYPDNYPD,
105
260727
2159
tworzone przez naszą własną policję.
04:34
and in orderzamówienie to accessdostęp it,
you would eitherzarówno have to copyKopiuj and pastepasta
106
262886
3152
Aby je wykorzystać,
trzeba by robić kopuj-wklej
04:38
for hundredssetki and hundredssetki of hoursgodziny,
107
266038
1726
przez setki godzin
albo być Janem Kraussem.
04:39
or you could be JohnJohn KraussKrauss.
108
267764
1344
04:41
JohnJohn KraussKrauss was like,
109
269108
1043
Jan Krauss uznał:
04:42
I'm not going to copyKopiuj and pastepasta this datadane.
I'm going to writepisać a programprogram.
110
270151
3413
"Nie zamierzam kopiować tych danych.
Stworzę program".
Nazywa się "Wsparcie Bazy
Danych o Wypadkach".
04:45
It's callednazywa the NYPDNYPD CrashAwaria DataDanych Band-AidPlaster,
111
273564
2288
04:47
and it goesidzie to the NYPD'sNYPD's websitestronie internetowej
and it would downloadpobieranie PDFsPliki PDF.
112
275852
3032
Wchodzi na stronę policji i ściąga PDFy.
04:50
EveryKażdy day it would searchszukanie;
if it founduznany a PDFPDF, it would downloadpobieranie it
113
278884
3126
Szuka ich codziennie.
Ściąga znaleziony PDF
i wyodrębnia informacje,
04:54
and then it would runbiegać
some PDF-scrapingSkrobanie PDF programprogram,
114
282010
2250
04:56
and out would come the texttekst,
115
284260
1336
tworząc tekst,
04:57
and it would go on the InternetInternet,
and then people could make mapsmapy like that.
116
285596
3565
za pomocą którego można
tworzyć mapy, jak ta.
05:01
And the factfakt that the data'sdane firmy here,
the factfakt that we have accessdostęp to it --
117
289161
3429
To, że dane są tutaj
i że mamy do nich dostęp...
05:04
EveryKażdy accidentwypadek, by the way,
is a rowrząd in this tablestół.
118
292590
2450
Każdy wypadek to wiersz tabeli.
05:07
You can imaginewyobrażać sobie how manywiele PDFsPliki PDF that is.
119
295040
1836
Wyobraźcie sobie, ile to PDF-ów.
05:08
The factfakt that we
have accessdostęp to that is great,
120
296876
2207
To, że mamy do nich dostęp, jest super,
05:11
but let's not releasewydanie it in PDFPDF formformularz,
121
299083
2110
ale nie publikujmy ich w formacie PDF,
05:13
because then we're havingmający our citizensobywatele
writepisać PDFPDF scrapersSkrobaki.
122
301193
2739
zmuszając ludzi do pisania
programów dekodujących PDF-y.
05:15
It's not the bestNajlepiej use
of our citizens'obywatele time,
123
303932
2076
To marnowanie czasu mieszkańców.
Jako miasto możemy zrobić to lepiej.
05:18
and we as a cityMiasto can do better than that.
124
306008
2004
05:20
Now, the good newsAktualności is that
the dede BlasioBlasio administrationadministracja
125
308012
2736
Dobrze, że administracja de Blasio
05:22
actuallytak właściwie recentlyostatnio releasedwydany this datadane
a fewkilka monthsmiesiące agotemu,
126
310748
2532
udostępniła te dane kilka miesięcy temu,
05:25
and so now we can
actuallytak właściwie have accessdostęp to it,
127
313280
2158
i teraz rzeczywiście jest do nich dostęp,
05:27
but there's a lot of datadane
still entombedEntombed in PDFPDF.
128
315438
2536
ale wiele danych wciąż
jest zagrzebanych w PDF-ach.
05:29
For exampleprzykład, our crimeprzestępstwo datadane
is still only availabledostępny in PDFPDF.
129
317974
3197
Dane kryminalne są dostępne tylko w PDF.
05:33
And not just our crimeprzestępstwo datadane,
our ownwłasny cityMiasto budgetbudżet.
130
321171
3755
Również budżet miasta.
05:36
Our cityMiasto budgetbudżet is only readableczytelne
right now in PDFPDF formformularz.
131
324926
3729
Budżet miasta dostępny jest
tylko w formacie PDF.
05:40
And it's not just us
that can't analyzeanalizować it --
132
328655
2141
Nie tylko nam trudno go przeanalizować.
05:42
our ownwłasny legislatorsustawodawcy
who votegłosować for the budgetbudżet
133
330796
2955
Ustawodawcy, którzy głosują nad budżetem,
05:45
alsorównież only get it in PDFPDF.
134
333751
1943
też dostają ten PDF.
05:47
So our legislatorsustawodawcy cannotnie może analyzeanalizować
the budgetbudżet that they are votinggłosowanie for.
135
335694
3844
Prawodawcy nie mogą
przeanalizować budżetu, za którym głosują.
05:51
And I think as a cityMiasto we can do
a little better than that as well.
136
339538
3608
Jako miasto stać nas na więcej.
05:55
Now, there's a lot of datadane
that's not hiddenukryty in PDFsPliki PDF.
137
343146
2488
Jest wiele danych,
które nie są ukryte w plikach PDF.
05:57
This is an exampleprzykład of a mapmapa I madezrobiony,
138
345634
1700
To przykład stworzonej przeze mnie
05:59
and this is the dirtiestnajbrudniejsze waterwaysdrogi wodne
in NewNowy YorkYork CityMiasto.
139
347334
2926
mapy najbrudniejszych
cieków wodnych w Nowym Jorku.
06:02
Now, how do I measurezmierzyć dirtybrudny?
140
350260
1509
Jak mierzę poziom brudu?
06:03
Well, it's kinduprzejmy of a little weirddziwne,
141
351769
1857
To trochę dziwaczne.
06:05
but I lookedspojrzał at the levelpoziom
of fecalkał coliformbakterie coli,
142
353626
2113
Zmierzyłem poziom pałeczek z grupy coli,
06:07
whichktóry is a measurementPomiar of fecalkał mattermateria
in eachkażdy of our waterwaysdrogi wodne.
143
355739
3506
który jest miarą masy kałowej w wodzie.
06:11
The largerwiększy the circleokrąg,
the dirtierbrudniejsze the waterwoda,
144
359245
3274
Im większe kółko, tym brudniejsza woda,
06:14
so the largeduży circleskółka are dirtybrudny waterwoda,
the smallmały circleskółka are cleanerodkurzacz.
145
362519
3357
duże kółka - brudniejsza,
małe - czystsza.
06:17
What you see is inlandśródlądowy waterwaysdrogi wodne.
146
365876
1644
Na mapie widać cieki powierzchniowe.
06:19
This is all datadane that was sampledpróbą
by the cityMiasto over the last fivepięć yearslat.
147
367520
3404
To dane miejskie za ostatnie pięć lat.
06:22
And inlandśródlądowy waterwaysdrogi wodne are,
in generalgenerał, dirtierbrudniejsze.
148
370924
2694
Cieki powierzchniowe są brudniejsze.
06:25
That makesczyni sensesens, right?
149
373618
1218
To ma sens, prawda?
06:26
And the biggerwiększy circleskółka are dirtybrudny.
And I learnednauczyli a fewkilka things from this.
150
374836
3374
Dowiedziałem się dzięki temu paru rzeczy.
Po pierwsze: nie pływaj w niczym,
co ma w nazwie "potok" lub "kanał".
06:30
NumberNumer one: Never swimpływać in anything
that endskończy się in "creekCreek" or "canalkanał."
151
378210
3164
06:33
But numbernumer two: I alsorównież founduznany
the dirtiestnajbrudniejsze waterwaydroga wodna in NewNowy YorkYork CityMiasto,
152
381374
4318
Po drugie: znalazłem najbrudniejsze
cieki w Nowym Jorku
06:37
by this measurezmierzyć, one measurezmierzyć.
153
385692
1834
dzięki jednemu pomiarowi.
06:39
In ConeyConey IslandWyspa CreekCreek, whichktóry is not
the ConeyConey IslandWyspa you swimpływać in, luckilyna szczęście.
154
387526
3648
Potok Coney Island,
nie kąpielisko Coney Island.
06:43
It's on the other sidebok.
155
391174
1158
To po drugiej stronie.
06:44
But ConeyConey IslandWyspa CreekCreek, 94 percentprocent
of samplespróbki takenwzięty over the last fivepięć yearslat
156
392332
3878
W potoku Coney Island 94% próbek
pobranych przez ostatnie 5 lat
06:48
have had fecalkał levelspoziomy so highwysoki
157
396210
2157
miała tak wysoki poziom kału,
06:50
that it would be againstprzeciwko statestan lawprawo
to swimpływać in the waterwoda.
158
398367
3093
że pływanie tam byłoby
niezgodne z prawem stanowym.
06:53
And this is not the kinduprzejmy of factfakt
that you're going to see
159
401460
2729
Nie ma się czym chwalić
06:56
boastedchwalił się in a cityMiasto reportraport, right?
160
404189
1537
w miejskim raporcie.
06:57
It's not going to be
the frontz przodu pagestrona on nycNYC.govgov.
161
405726
2250
Nie znajdziecie tego
na głównej stronie nyc.gov.
06:59
You're not going to see it there,
162
407976
1580
ale mimo to fajnie,
07:01
but the factfakt that we can get
to that datadane is awesomeniesamowite.
163
409556
2518
że dotarliśmy do tych danych.
07:04
But oncepewnego razu again, it wasn'tnie było superWspaniały easyłatwo,
164
412074
1773
Ale znowu, nie było to łatwe,
07:05
because this datadane was not
on the openotwarty datadane portalPortal.
165
413847
2358
bo dane nie były na otwartym portalu.
07:08
If you were to go to the openotwarty datadane portalPortal,
166
416205
2013
Na otwartym portalu można zobaczyć
07:10
you'dty byś see just a snippetfragment kodu of it,
a yearrok or a fewkilka monthsmiesiące.
167
418218
2613
tylko fragment, rok lub parę miesięcy.
Znajdowały się na stronie
Departamentu Ochrony Środowiska.
07:12
It was actuallytak właściwie on the DepartmentDział
of EnvironmentalOchrony środowiska Protection'sProtection websitestronie internetowej.
168
420831
3390
Każdy z tych linków to arkusz Excel
i każdy jest inaczej zbudowany.
07:16
And eachkażdy one of these linksspinki do mankietów is an ExcelProgramu Excel
sheetarkusz, and eachkażdy ExcelProgramu Excel sheetarkusz is differentróżne.
169
424221
3878
Każdy jest inny:
trzeba je kopiować, organizować.
07:20
EveryKażdy headingnagłówek is differentróżne:
you copyKopiuj, pastepasta, reorganizeReorganizacja.
170
428099
2630
07:22
When you do you can make mapsmapy
and that's great, but oncepewnego razu again,
171
430729
2952
Potem można stworzyć mapy.
Miasto powinno to standaryzować.
07:25
we can do better than that
as a cityMiasto, we can normalizenormalizacji things.
172
433681
2969
Do tego celu zbliża się Socrata ze stroną
07:28
And we're gettinguzyskiwanie there, because
there's this websitestronie internetowej that SocrataUsługi Socrata makesczyni
173
436650
3384
Otwarty Portal Danych NYC.
07:32
callednazywa the OpenOtwarte DataDanych PortalPortal NYCNYC.
174
440034
1541
Znajduje się tam 1100 zestawów danych,
07:33
This is where 1,100 datadane setszestawy
that don't sufferponieść
175
441575
2257
bez wad, o których mówiłem.
07:35
from the things I just told you liverelacja na żywo,
176
443832
1781
Ich liczba rośnie.
07:37
and that numbernumer is growingrozwój,
and that's great.
177
445613
2148
Można ściągnąć dane
w dowolnym formacie, CSV, PDF lub Excel.
07:39
You can downloadpobieranie datadane in any formatformat,
be it CSVCSV or PDFPDF or ExcelProgramu Excel documentdokument.
178
447761
3412
07:43
WhateverCokolwiek you want,
you can downloadpobieranie the datadane that way.
179
451173
2547
Można je ściągnąć w dowolnej chwili,
ale problem w tym,
07:45
The problemproblem is, oncepewnego razu you do,
180
453720
1352
że każda agencja inaczej koduje adresy.
07:47
you will find that eachkażdy agencyagencja
codesKody theirich addressesadresy differentlyróżnie.
181
455072
3686
07:50
So one is streetulica nameNazwa,
intersectionskrzyżowanie streetulica,
182
458758
2141
Tu mamy nazwę ulicy, skrzyżowania,,
07:52
streetulica, boroughBorough, addressadres, buildingbudynek,
buildingbudynek addressadres.
183
460899
2491
ulicę, dzielnicę, adres,
budynek, adres budynku.
07:55
So oncepewnego razu again, you're spendingwydatki time,
even when we have this portalPortal,
184
463390
3180
Nawet mając ten portal,
07:58
you're spendingwydatki time
normalizingnormalizowanie our addressadres fieldspola.
185
466570
2606
znów tracisz czas,
ujednolicając pola adresowe.
08:01
And that's not the bestNajlepiej use
of our citizens'obywatele time.
186
469176
2423
To nie najlepsze wykorzystanie
czasu obywateli.
08:03
We can do better than that as a cityMiasto.
187
471599
1796
Możemy zrobić to lepiej.
08:05
We can standardizestandaryzacja our addressesadresy,
188
473395
1645
Możemy standaryzować adresy,
08:07
and if we do,
we can get more mapsmapy like this.
189
475040
2185
stworzyć więcej map takich, jak ta.
08:09
This is a mapmapa of fireogień hydrantshydranty pożarowe
in NewNowy YorkYork CityMiasto,
190
477225
2285
To jest mapa hydrantów w Nowym Jorku,
08:11
but not just any fireogień hydrantshydranty pożarowe.
191
479510
1531
ale nie byle jakich hydrantów.
08:13
These are the topTop 250 grossingIG fireogień
hydrantshydranty pożarowe in termswarunki of parkingparking ticketsbilety.
192
481041
4726
250 hydrantów o największych przychodach
z mandatów za złe parkowanie.
08:17
(LaughterŚmiech)
193
485767
1986
(Śmiech)
08:19
So I learnednauczyli a fewkilka things from this mapmapa,
and I really like this mapmapa.
194
487753
3358
Sporo mnie ta mapa nauczyła.
Naprawdę ją lubię.
08:23
NumberNumer one, just don't parkpark
on the UpperGórnej EastWschód SidePo stronie.
195
491111
2402
Pierwsze - nie parkuj na Upper East Side.
08:25
Just don't. It doesn't mattermateria where
you parkpark, you will get a hydrantHydrant ticketbilet.
196
493513
3587
Po prostu nie. Wszędzie dostaniesz mandat.
08:29
NumberNumer two, I founduznany the two highestnajwyższy
grossingIG hydrantshydranty pożarowe in all of NewNowy YorkYork CityMiasto,
197
497100
4153
Znalazłem też dwa najbardziej dochodowe
hydranty w całym Nowym Yorku,
08:33
and they're on the LowerNiższe EastWschód SidePo stronie,
198
501253
1886
oba na Lower East Side,
08:35
and they were bringingprzynoszący in over
55,000 dollarsdolarów a yearrok in parkingparking ticketsbilety.
199
503139
5098
przynoszące ponad 55 000 dolarów rocznie
z mandatów za parkowanie.
08:40
And that seemedwydawało się a little strangedziwne
to me when I noticedzauważyłem it,
200
508237
2738
Trochę mnie to zdziwiło,
więc trochę poszperałem.
08:42
so I did a little diggingkopanie and it turnsskręca out
what you had is a hydrantHydrant
201
510975
3269
Okazuje się, że stoi hydrant,
następnie "przedłużenie krawężnika",
08:46
and then something callednazywa
a curbKrawężnik extensionrozbudowa,
202
514244
1996
08:48
whichktóry is like a seven-footsiedem stóp
spaceprzestrzeń to walkspacerować on,
203
516240
2059
2 metry chodnika
i dopiero miejsce parkingowe.
08:50
and then a parkingparking spotmiejsce.
204
518299
1156
08:51
And so these carssamochody cameoprawa ołowiana witrażu alongwzdłuż,
and the hydrantHydrant --
205
519455
2254
Kierowcy sądzili, że hydrant jest daleko,
08:53
"It's all the way over there, I'm fine,"
206
521709
1911
więc wszystko jest w porządku,
08:55
and there was actuallytak właściwie a parkingparking spotmiejsce
paintednamalowany there beautifullyestetycznie for them.
207
523620
3474
było specjalnie namalowane
miejsce parkingowe.
08:59
They would parkpark there, and the NYPDNYPD
disagreednie zgodził się with this designationoznaczenie
208
527094
3155
Tylko że policja nie zgadzała się
z wyborem miejsca
i dawała mandaty.
09:02
and would ticketbilet them.
209
530249
1058
Nie tylko ja je znalazłem.
09:03
And it wasn'tnie było just me
who founduznany a parkingparking ticketbilet.
210
531307
2344
Przejeżdżający samochód Google Street View
09:05
This is the GoogleGoogle
StreetUlica ViewWidok carsamochód drivingnapędowy by
211
533651
2146
odnalazł te same mandaty.
09:07
findingodkrycie the samepodobnie parkingparking ticketbilet.
212
535797
1617
09:09
So I wrotenapisał about this on my blogblog,
on I QuantQuant NYNY, and the DOTKROPKA respondedodpowiedział,
213
537414
4504
Napisałem o tym na moim blogu, I Quant NY,
i DOT odpowiedział mi tak:
09:13
and they said,
214
541918
1020
"Chociaż DOT nie otrzymał żadnych skarg
w odniesieniu do tego miejsca,
09:14
"While the DOTKROPKA has not receivedOdebrane
any complaintsReklamacje about this locationLokalizacja,
215
542938
3410
09:18
we will reviewrecenzja the roadwayjezdni markingsoznaczenia
and make any appropriatewłaściwy alterationszmiany."
216
546348
4542
sprawdzimy znaki drogowe
i dokonamy odpowiednich poprawek ".
09:22
And I thought to myselfsiebie,
typicaltypowy governmentrząd responseodpowiedź,
217
550890
2959
Pomyślałem - typowa urzędnicza odpowiedź.
09:25
all right, movedprzeniósł on with my life.
218
553849
1881
Zapomniałem o sprawie.
09:27
But then, a fewkilka weekstygodnie laterpóźniej,
something incredibleniesamowite happenedstało się.
219
555730
3970
Kilka tygodni później,
stało się coś niesamowitego.
09:31
They repaintedodmalowane the spotmiejsce,
220
559700
2520
Przemalowali to miejsce.
09:34
and for a seconddruga I thought I saw
the futureprzyszłość of openotwarty datadane,
221
562220
2690
Pomyślałem,
że to przyszłość otwartych danych.
09:36
because think about what happenedstało się here.
222
564910
2000
Pomyślcie, co tu zaszło.
09:38
For fivepięć yearslat, this spotmiejsce was beingistota
ticketedbiletowe, and it was confusingmylące,
223
566910
5100
Przez pięć lat w tym mylącym miejscu
wystawiano mandaty,
09:44
and then a citizenobywatel founduznany something,
they told the cityMiasto, and withinw ciągu a fewkilka weekstygodnie
224
572010
4306
obywatel to zauważył,
powiedział o tym miastu
i w parę tygodni
problem został rozwiązany.
09:48
the problemproblem was fixednaprawiony.
225
576316
1294
09:49
It's amazingniesamowity. And a lot of people
see openotwarty datadane as beingistota a watchdogWatchdog.
226
577610
3200
Wiele osób uważa dostęp
do danych to nadzór.
09:52
It's not, it's about beingistota a partnerpartner.
227
580810
1772
ale tu chodzi o partnerstwo.
09:54
We can empowerumożliwiać our citizensobywatele
to be better partnerswzmacniacz for governmentrząd,
228
582582
3138
Obywatele mogą być
lepszymi partnerami dla władz
09:57
and it's not that hardciężko.
229
585720
1881
i nie jest to takie trudne.
09:59
All we need are a fewkilka changeszmiany.
230
587601
1459
Potrzeba tylko paru zmian.
10:01
If you're FOILingFoliowanie datadane,
231
589060
1107
Jeżeli udostępniasz dane dla FOIL,
10:02
if you're seeingwidzenie your datadane
beingistota FOILedFoliowane over and over again,
232
590167
2867
widzisz, że ktoś wciąż o nie prosi,
10:05
let's releasewydanie it to the publicpubliczny, that's
a signznak that it should be madezrobiony publicpubliczny.
233
593034
3574
to jest znak, że trzeba je upublicznić.
Jeżeli jako agent rządowy
wypuszczasz dane w formacie PDF,
10:08
And if you're a governmentrząd agencyagencja
releasingzwolnienie a PDFPDF,
234
596608
2482
10:11
let's passprzechodzić legislationustawodawstwo that requireswymaga you
to poststanowisko it with the underlyingpoważniejszych datadane,
235
599090
3649
niech prawo wymaga, żeby publikować je
wraz z danymi źródłowymi,
10:14
because that datadane
is comingprzyjście from somewheregdzieś.
236
602739
2028
bo te dane skądś się wzięły,
10:16
I don't know where, but it's
comingprzyjście from somewheregdzieś,
237
604767
2482
choć nie wiem skąd,
więc można je publikować wraz z PDF-em.
10:19
and you can releasewydanie it with the PDFPDF.
238
607249
1725
10:20
And let's adoptprzyjąć and sharedzielić
some openotwarty datadane standardsstandardy.
239
608974
2411
Przyjmijmy standard otwartych danych.
10:23
Let's startpoczątek with our addressesadresy
here in NewNowy YorkYork CityMiasto.
240
611385
2481
Zacznijmy od ujednolicenia adresów,
10:25
Let's just startpoczątek
normalizingnormalizowanie our addressesadresy.
241
613866
2074
Nowy Jork jest liderem w otwartych danych.
10:27
Because NewNowy YorkYork is a leaderlider in openotwarty datadane.
242
615940
2062
10:30
DespitePomimo all this, we are absolutelyabsolutnie
a leaderlider in openotwarty datadane,
243
618002
2789
Mimo problemów
jesteśmy absolutnym liderem.
Jeżeli ustalimy standard
dla otwartych danych,
10:32
and if we startpoczątek normalizingnormalizowanie things,
and setzestaw an openotwarty datadane standardstandard,
244
620791
3121
10:35
othersinni will followśledzić. The statestan will followśledzić,
and maybe the federalfederalny governmentrząd,
245
623912
3634
inni za nami podążą.
Władze stanowe, rząd, inne kraje.
10:39
Other countrieskraje could followśledzić,
246
627546
1445
10:40
and we're not that fardaleko off from a time
where you could writepisać one programprogram
247
628991
3411
Niewiele brakuje,
żeby za pomocą jednego programu
10:44
and mapmapa informationInformacja from 100 countrieskraje.
248
632402
1890
tworzyć mapy informacji ze 100 krajów.
10:46
It's not sciencenauka fictionfikcja.
We're actuallytak właściwie quitecałkiem closeblisko.
249
634292
2487
To nie science fiction.
Jesteśmy naprawdę blisko.
10:48
And by the way, who are we
empoweringwzmacnianie with this?
250
636779
2240
Kto na tym skorzysta?
10:51
Because it's not just JohnJohn KraussKrauss
and it's not just ChrisChris WhongWhong.
251
639019
3005
Nie tylko John Krauss czy Chris Whong,
10:54
There are hundredssetki of meetupsspotkaniach Wikipedystów
going on in NewNowy YorkYork CityMiasto right now,
252
642024
3095
lecz setki nowojorskich organizacji,
aktywnych grup.
10:57
activeaktywny meetupsspotkaniach Wikipedystów.
253
645119
1025
10:58
There are thousandstysiące of people
attendinguczestniczyć these meetupsspotkaniach Wikipedystów.
254
646144
2572
Tysiące ludzi uczestniczy w spotkaniach,
11:00
These people are going after work
and on weekendsweekendy,
255
648716
2368
w weekendy, po pracy
przyglądają się danym
11:03
and they're attendinguczestniczyć these meetupsspotkaniach Wikipedystów
to look at openotwarty datadane
256
651084
2636
żeby ulepszyć nasze miasto.
11:05
and make our cityMiasto a better placemiejsce.
257
653720
1640
Na przykład grupa BetaNYC
założyła citygram.nyc,
11:07
GroupsGrupy like BetaNYCBetaNYC, who just last weektydzień
releasedwydany something callednazywa citygramcitygram.nycNYC
258
655360
4073
11:11
that allowspozwala you to subscribeZapisz się
to 311 complaintsReklamacje
259
659433
2147
gdzie można zasubskrybować
skargi komunalne
11:13
around your ownwłasny home,
or around your officegabinet.
260
661580
2068
w okolicach domu lub biura.
11:15
You put in your addressadres,
you get locallokalny complaintsReklamacje.
261
663648
2427
Wpisujesz adres
i dostajesz listę lokalnych zażaleń.
11:18
And it's not just the techtech communityspołeczność
that are after these things.
262
666075
3374
Dąży do tego nie tylko
techniczna społeczność,
ale też planiści miejscy,
jak studenci, których uczę w Pratt,
11:21
It's urbanmiejski plannersplaniści like
the studentsstudenci I teachnauczać at PrattPratt.
263
669449
2622
11:24
It's policypolityka advocatesopowiada się za, it's everyonekażdy,
264
672071
1919
aktywiści polityczni, każdy,
11:25
it's citizensobywatele from a diverseróżnorodny
setzestaw of backgroundstła.
265
673990
2563
obywatele z różnych środowisk.
11:28
And with some smallmały, incrementalprzyrostowe changeszmiany,
266
676553
2786
Małymi, stopniowymi zmianami
11:31
we can unlockodblokować the passionpasja
and the abilityzdolność of our citizensobywatele
267
679339
3225
możemy uwolnić pasję
i zdolności naszych obywateli,
11:34
to harnessuprząż openotwarty datadane
and make our cityMiasto even better,
268
682564
3156
żeby wykorzystać otwarte dane
i usprawniać nasze miasto,
11:37
whetherczy it's one datasetzestawu danych,
or one parkingparking spotmiejsce at a time.
269
685720
3626
czy to jednym zestawem danych,
czy jednym miejscem parkingowym.
11:41
Thank you.
270
689346
2322
Dziękuję.
11:43
(ApplauseAplauz)
271
691668
3305
(Brawa)
Translated by Kacper Borowiecki
Reviewed by Rysia Wand

▲Back to top

ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com

Data provided by TED.

This site was created in May 2015 and the last update was on January 12, 2020. It will no longer be updated.

We are currently creating a new site called "eng.lish.video" and would be grateful if you could access it.

If you have any questions or suggestions, please feel free to write comments in your language on the contact form.

Privacy Policy

Developer's Blog

Buy Me A Coffee