ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com
TEDxNewYork

Ben Wellington: How we found the worst place to park in New York City -- using big data

Ben Wellington: Come abbiamo trovato il peggior posto per parcheggiare a New York -- con i big data

Filmed:
1,055,247 views

Gli uffici delle città hanno accesso ad enormi quantità di dati e statistiche che riflettono ogni aspetto della vita urbana. Ma, come suggerisce l'analista Ben Wellington in questo intervento, a volte non sanno proprio che farne. Wellington dimostra come la combinazione di domande inaspettate e di una consultazione intelligente dei dati possa generare prospettive d'osservazione insolite e utili, e condivide alcuni consigli su come rilasciare grandi quantità di dati in modo da renderli fruibili per tutti.
- Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data. Full bio

Double-click the English transcript below to play the video.

00:12
SixSei thousandmille milesmiglia of roadstrada,
0
711
2820
10.000 km di strade,
00:15
600 milesmiglia of subwaymetropolitana tracktraccia,
1
3531
2203
1.000 km di tratte metropolitane,
00:17
400 milesmiglia of bikebicicletta lanescorsie
2
5734
1644
650 km di piste ciclabili
00:19
and a halfmetà a milemiglio of tramtram tracktraccia,
3
7378
1821
e poco meno di 1 km di tramvia,
00:21
if you've ever been to RooseveltRoosevelt IslandIsola.
4
9199
1953
se siete mai stati a Roosevelt Island.
00:23
These are the numbersnumeri that make up
the infrastructureinfrastruttura of NewNuovo YorkYork CityCittà.
5
11152
3334
Questi sono i numeri delle infrastrutture
di New York City,
le statistiche
delle nostre infrastrutture.
00:26
These are the statisticsstatistica
of our infrastructureinfrastruttura.
6
14486
2619
Sono numeri che si trovano
nei report degli uffici comunali.
00:29
They're the kindgenere of numbersnumeri you can find
releasedrilasciato in reportsrapporti by citycittà agenciesagenzie.
7
17105
3706
Il Dipartimento dei Trasporti
sarà orgoglioso nel dire
00:32
For exampleesempio, the DepartmentDipartimento
of TransportationTrasporto will probablyprobabilmente tell you
8
20811
3199
di quanti km di strade si occupa.
L'MTA si sarà vantata dei km
di tratta metropolitana.
00:36
how manymolti milesmiglia of roadstrada they maintainmantenere.
9
24010
1781
00:37
The MTAMTA will boastvantare how manymolti milesmiglia
of subwaymetropolitana tracktraccia there are.
10
25791
2821
La maggior parte degli uffici
ci dà delle statistiche.
00:40
MostMaggior parte citycittà agenciesagenzie give us statisticsstatistica.
11
28612
1807
Da un resoconto di quest'anno
00:42
This is from a reportrapporto this yearanno
12
30419
1483
della Commissione Taxi e Limousine
00:43
from the TaxiTaxi and LimousineLimousine CommissionCommissione,
13
31902
1892
apprendiamo che ci sono circa
13.500 taxi qui a New York City.
00:45
where we learnimparare that there's about
13,500 taxisTaxi here in NewNuovo YorkYork CityCittà.
14
33794
3276
Interessante, no?
00:49
PrettyPiuttosto interestinginteressante, right?
15
37070
1290
Ma avete mai pensato
"Da dove vengono questi numeri"?
00:50
But did you ever think about
where these numbersnumeri cameè venuto from?
16
38360
2784
Perché se questi numeri esistono,
qualcuno lì in ufficio
00:53
Because for these numbersnumeri to existesistere,
someonequalcuno at the citycittà agencyagenzia
17
41144
2903
si è fermato e ha detto: "Ok, questo
è un numero che qualcuno vorrebbe sapere".
00:56
had to stop and say, hmmHmm, here'secco a numbernumero
that somebodyqualcuno mightpotrebbe want want to know.
18
44047
3880
Un numero che i cittadini
vorrebbero conoscere.
00:59
Here'sQui è a numbernumero
that our citizenscittadini want to know.
19
47927
2250
Sono tornati ai loro dati grezzi,
01:02
So they go back to theirloro rawcrudo datadati,
20
50177
1830
hanno contato, aggiunto, calcolato,
01:04
they countcontare, they addInserisci, they calculatecalcolare,
21
52007
1797
e poi hanno emesso dei rapporti
01:05
and then they put out reportsrapporti,
22
53804
1467
e quei rapporti hanno numeri come questi.
01:07
and those reportsrapporti
will have numbersnumeri like this.
23
55271
2177
01:09
The problemproblema is, how do they know
all of our questionsle domande?
24
57448
2540
Il punto è: come conoscono
le nostre domande?
Abbiamo un sacco di domande.
01:11
We have lots of questionsle domande.
25
59988
1243
01:13
In factfatto, in some waysmodi there's literallyletteralmente
an infiniteinfinito numbernumero of questionsle domande
26
61231
3340
In qualche modo esiste un numero
infinito di domande
da porci sulla nostra città.
01:16
that we can askChiedere about our citycittà.
27
64571
1649
Gli uffici non potranno
mai stare al passo.
01:18
The agenciesagenzie can never keep up.
28
66220
1475
Quindi il paradigma non sta funzionando
01:19
So the paradigmparadigma isn't exactlydi preciso workinglavoro,
and I think our policymakersresponsabili politici realizerendersi conto that,
29
67695
4056
e credo che i nostri legislatori
se ne siano accorti,
01:23
because in 2012, MayorSindaco BloombergBloomberg
signedfirmato into lawlegge what he calledchiamato
30
71751
3959
perché nel 2012 il sindaco Bloomberg
ha firmato una legge che ha definito
01:27
the mostmaggior parte ambitiousambizioso and comprehensiveglobale
openAperto datadati legislationlegislazione in the countrynazione.
31
75710
3837
"La legge più ambiziosa e globale
di tutto il Paese sui dati aperti".
01:31
In a lot of waysmodi, he's right.
32
79547
1573
Sotto molti aspetti ha ragione.
01:33
In the last two yearsanni,
the citycittà has releasedrilasciato 1,000 datasetsset di dati
33
81120
2861
Negli ultimi 2 anni
la città ha rilasciato 1.000 dataset
01:35
on our openAperto datadati portalPortal,
34
83981
1610
sul portale degli open data.
01:37
and it's prettybella awesomeeccezionale.
35
85591
1764
È fantastico,
01:39
So you go and look at datadati like this,
36
87355
1968
perché guardiamo questi dati
01:41
and insteadanziché of just countingconteggio
the numbernumero of cabscabine,
37
89323
2289
e invece di contare
solo il numero dei taxi
possiamo iniziare a farci
domande diverse.
01:43
we can startinizio to askChiedere differentdiverso questionsle domande.
38
91612
1943
01:45
So I had a questiondomanda.
39
93555
1200
Ho una domanda.
01:46
When'sQuando di rushcorsa hourora in NewNuovo YorkYork CityCittà?
40
94755
1701
Qual è l'ora di punta a New York?
01:48
It can be prettybella bothersomefastidiosi.
When is rushcorsa hourora exactlydi preciso?
41
96456
2581
Può essere seccante,
qual è esattamente l'ora di punta?
01:51
And I thought to myselfme stessa,
these cabscabine aren'tnon sono just numbersnumeri,
42
99037
2625
E ho pensato che questi taxi
non sono solo numeri:
sono dei GPS che girano
per le strade della nostra città,
01:53
these are GPSGPS recordersregistratori
drivingguida around in our citycittà streetsstrade
43
101662
2711
registrando ogni singola corsa.
01:56
recordingregistrazione eachogni and everyogni ridecavalcata they take.
44
104373
1913
01:58
There's datadati there,
and I lookedguardato at that datadati,
45
106286
2322
Ho guardato questi dati
02:00
and I madefatto a plottracciare of the averagemedia speedvelocità of
taxisTaxi in NewNuovo YorkYork CityCittà throughoutper tutto the day.
46
108608
3961
e ho fatto uno schema della velocità media
dei taxi a New York durante il giorno.
02:04
You can see that from about midnightmezzanotte
to around 5:18 in the morningmattina,
47
112569
3412
Potete vedere come,
da mezzanotte alle 5.18 circa,
02:07
speedvelocità increasesaumenta, and at that pointpunto,
things turnturno around,
48
115981
3563
la velocità aumenti e da quel punto
le cose cambiano.
02:11
and they get slowerPiù lentamente and slowerPiù lentamente and slowerPiù lentamente
untilfino a about 8:35 in the morningmattina,
49
119544
3962
I taxi vanno sempre più lenti
fino a circa le 8.35,
02:15
when they endfine up at around
11 and a halfmetà milesmiglia perper hourora.
50
123506
2693
quando arrivano a circa 18 km/h.
02:18
The averagemedia taxiTaxi is going 11 and a halfmetà
milesmiglia perper hourora on our citycittà streetsstrade,
51
126199
3562
In media i taxi procedono a 18 km/h
sulle nostre strade.
02:21
and it turnsgiri out it stayssoggiorni that way
52
129761
1987
E così sarà per il resto della giornata.
(Risate)
02:23
for the entireintero day.
53
131748
3368
02:27
(LaughterRisate)
54
135116
1373
Quindi mi sono detto che non c'è
nessuna ora di punta a New York.
02:28
So I said to myselfme stessa, I guessindovina
there's no rushcorsa hourora in NewNuovo YorkYork CityCittà.
55
136489
3180
È tutto un "giorno di punta".
02:31
There's just a rushcorsa day.
56
139669
1537
02:33
MakesRende sensesenso. And this is importantimportante
for a couplecoppia of reasonsmotivi.
57
141206
2850
Ha senso, ed è importante
per un paio di motivi.
02:36
If you're a transportationmezzi di trasporto plannerPianificatore,
this mightpotrebbe be prettybella interestinginteressante to know.
58
144056
3637
Se sei un pianificatore di itinerari
ti interessa molto saperlo.
Se vuoi andare velocemente
da qualche parte
02:39
But if you want to get somewhereda qualche parte quicklyvelocemente,
59
147693
1975
sai che devi mettere la sveglia
alle 4.45 e sei a posto.
02:41
you now know to setimpostato your alarmallarme for
4:45 in the morningmattina and you're all setimpostato.
60
149668
3468
New York, no?
02:45
NewNuovo YorkYork, right?
61
153136
1044
Ma c'è una storia dietro.
02:46
But there's a storystoria behinddietro a this datadati.
62
154180
1762
Questo dato non era accessibile,
02:47
This datadati wasn'tnon era
just availablea disposizione, it turnsgiri out.
63
155942
2185
si è ottenuto con una richiesta
02:50
It actuallyin realtà cameè venuto from something calledchiamato
a FreedomLibertà of InformationInformazioni LawLegge RequestRichiesta,
64
158127
3619
in seguito alla legge per la libertà
di informazione, o FOIL.
02:53
or a FOILLAMINA RequestRichiesta.
65
161746
1076
È un modulo che si trova sul sito
della Commissione Taxi e Limousine.
02:54
This is a formmodulo you can find on the
TaxiTaxi and LimousineLimousine CommissionCommissione websiteSito web.
66
162822
3466
Per accedere a questi dati
devi prendere questo modulo,
02:58
In orderordine to accessaccesso this datadati,
you need to go get this formmodulo,
67
166288
2826
compilarlo e poi riceverai una notifica.
03:01
fillriempire it out, and they will notifynotificare you,
68
169114
1846
Un ragazzo, Chris Whong, ha fatto così.
03:02
and a guy nameddi nome ChrisChris WhongWhong
did exactlydi preciso that.
69
170960
2130
03:05
ChrisChris wentandato down, and they told him,
70
173090
1890
Chris è andato e gli hanno detto:
03:06
"Just bringportare a brandmarca newnuovo harddifficile driveguidare
down to our officeufficio,
71
174980
2827
"Portaci un hard disk vergine,
lasciacelo per cinque ore,
copieremo i dati e te lo riprenderai".
03:09
leavepartire it here for fivecinque hoursore,
we'llbene copycopia the datadati and you take it back."
72
177807
3424
Ed ecco da dove vengono questi dati.
03:13
And that's where this datadati cameè venuto from.
73
181231
2032
03:15
Now, ChrisChris is the kindgenere of guy
who wants to make the datadati publicpubblico,
74
183263
3005
Chris è il tipo
che vuole rendere pubblici i dati,
così li mise online per tutti
ed ecco da dove viene questo grafico.
03:18
and so it endedconclusa up onlinein linea for all to use,
and that's where this graphgrafico cameè venuto from.
75
186268
3784
E il fatto che esista è fantastico.
Questi GPS -- bellissimo.
03:22
And the factfatto that it existsesiste is amazingStupefacente.
These GPSGPS recordersregistratori -- really coolfreddo.
76
190052
3518
Ma il fatto che dei cittadini
gìrino con degli hard disk,
03:25
But the factfatto that we have citizenscittadini
walkinga passeggio around with harddifficile drivesunità
77
193570
3118
prendendo dati dai comuni
per renderli pubblici
03:28
pickingscelta up datadati from citycittà agenciesagenzie
to make it publicpubblico --
78
196688
2582
-- erano già pubblici più o meno.
Potevi accedervi,
03:31
it was alreadygià kindgenere of publicpubblico,
you could get to it,
79
199270
2390
ma erano "disponibili",
non pubblici.
03:33
but it was "publicpubblico," it wasn'tnon era publicpubblico.
80
201660
1812
Possiamo fare di meglio.
03:35
And we can do better than that as a citycittà.
81
203472
1962
Non serve che i nostri cittadini
vadano in giro con degli hard disk.
03:37
We don't need our citizenscittadini
walkinga passeggio around with harddifficile drivesunità.
82
205434
2756
Non tutti i dataset sono vincolati
da una richiesta per visionarli.
03:40
Now, not everyogni datasetDataSet
is behinddietro a a FOILLAMINA RequestRichiesta.
83
208190
2337
03:42
Here is a mapcarta geografica I madefatto with the mostmaggior parte
dangerouspericoloso intersectionsintersezioni in NewNuovo YorkYork CityCittà
84
210527
3802
Questa è una mappa che ho fatto
degli incroci più pericolosi di New York,
03:46
basedbasato on cyclistciclista accidentsincidenti.
85
214329
1878
basata sugli incidenti dei ciclisti.
03:48
So the redrosso areasle zone are more dangerouspericoloso.
86
216207
1939
Le aree in rosso sono più pericolose.
03:50
And what it showsSpettacoli is first
the EastEast sidelato of ManhattanManhattan,
87
218146
2553
Mostra come l'East side di Manhattan,
03:52
especiallyparticolarmente in the lowerinferiore areala zona of ManhattanManhattan,
has more cyclistciclista accidentsincidenti.
88
220699
3611
specialmente nell'area a sud,
è quella in cui ci sono più incidenti.
03:56
That mightpotrebbe make sensesenso
89
224310
1019
E questo ha senso, perché lì ci sono
più ciclisti che scendono dai ponti.
03:57
because there are more cyclistsciclisti
comingvenuta off the bridgesponti there.
90
225329
2896
Ma ci sono anche altre
zone interessanti.
04:00
But there's other hotspotshotspot worthdi valore studyingstudiando.
91
228225
2014
Williamsburg,
Roosevelt Avenue nel Queens.
04:02
There's WilliamsburgWilliamsburg.
There's RooseveltRoosevelt AvenueAvenue in QueensQueens.
92
230239
2669
Questi sono esattamente i dati
che ci servono per Vision Zero.
04:04
And this is exactlydi preciso the kindgenere of datadati
we need for VisionVisione ZeroZero.
93
232908
2852
È quello che stavamo cercando.
04:07
This is exactlydi preciso what we're looking for.
94
235760
1990
04:09
But there's a storystoria
behinddietro a this datadati as well.
95
237750
2135
Ma anche dietro questi dati
c'è una storia.
04:11
This datadati didn't just appearapparire.
96
239885
2067
Questi dati non sono
semplicemente apparsi.
04:13
How manymolti of you guys know this logologo?
97
241952
2391
Quanti di voi conoscono questo logo?
04:16
Yeah, I see some shakesFrullati.
98
244343
1352
Bene, vedo che annuite.
04:17
Have you ever triedprovato to copycopia
and pasteincolla datadati out of a PDFPDF
99
245695
2655
Avete mai provato
a fare copia-incolla da un PDF
e dargli un senso?
04:20
and make sensesenso of it?
100
248350
1357
Vedo che annuite di più.
04:21
I see more shakesFrullati.
101
249707
1060
04:22
More of you triedprovato copyingcopiatura and pastingincollando
than knewconosceva the logologo. I like that.
102
250767
3345
Fate copia-incolla più di quanto
conosciate il logo. Mi piace.
Dunque, i dati che avete appena visto
si trovavano su un PDF.
04:26
So what happenedè accaduto is, the datadati
that you just saw was actuallyin realtà on a PDFPDF.
103
254112
3510
Ci sono centinaia e centinaia
di pagine in PDF
04:29
In factfatto, hundredscentinaia and hundredscentinaia
and hundredscentinaia of pagespagine of PDFPDF
104
257622
3105
emesse dal nostro NYPD.
04:32
put out by our very ownproprio NYPDPOLIZIA DI NEW YORK,
105
260727
2159
04:34
and in orderordine to accessaccesso it,
you would eithero have to copycopia and pasteincolla
106
262886
3152
Per accedervi dovreste fare
copia-incolla
per centinaia e centinaia di ore.
04:38
for hundredscentinaia and hundredscentinaia of hoursore,
107
266038
1726
Oppure potreste essere John Krauss.
04:39
or you could be JohnJohn KraussKrauss.
108
267764
1344
04:41
JohnJohn KraussKrauss was like,
109
269108
1043
Lui pensò:
"Non farò copia-incolla,
scriverò un programma".
04:42
I'm not going to copycopia and pasteincolla this datadati.
I'm going to writeScrivi a programprogramma.
110
270151
3413
Si chiama NYPD Crash Data Band-Aid
04:45
It's calledchiamato the NYPDPOLIZIA DI NEW YORK CrashArresto anomalo del sistema DataDati Band-AidBand-Aid,
111
273564
2288
04:47
and it goesva to the NYPD'sDi NYPD websiteSito web
and it would downloadScaricare PDFsFile PDF.
112
275852
3032
Va sul sito del NYPD,
e scarica i PDF.
04:50
EveryOgni day it would searchricerca;
if it foundtrovato a PDFPDF, it would downloadScaricare it
113
278884
3126
Cerca ogni giorno,
e se trova un PDF lo scarica.
Poi, con qualche programma
che raschia via il PDF,
04:54
and then it would runcorrere
some PDF-scrapingPDF-scraping programprogramma,
114
282010
2250
04:56
and out would come the texttesto,
115
284260
1336
viene fuori il testo,
04:57
and it would go on the InternetInternet,
and then people could make mapsmappe like that.
116
285596
3565
che poi finisce su internet così che
la gente possa fare mappe come questa.
05:01
And the factfatto that the data'sdi dati here,
the factfatto that we have accessaccesso to it --
117
289161
3429
E il fatto che questi dati,
il fatto che abbiamo l'accesso...
-- A proposito, ogni incidente
è una stringa su questa tabella:
05:04
EveryOgni accidentincidente, by the way,
is a rowriga in this tabletavolo.
118
292590
2450
05:07
You can imagineimmaginare how manymolti PDFsFile PDF that is.
119
295040
1836
immaginate quanti PDF sono --
05:08
The factfatto that we
have accessaccesso to that is great,
120
296876
2207
È fantastico poter
accedere a questi dati,
05:11
but let's not releaseliberare it in PDFPDF formmodulo,
121
299083
2110
ma non rilasciateli in formato PDF,
05:13
because then we're havingavendo our citizenscittadini
writeScrivi PDFPDF scrapersraschietti.
122
301193
2739
perché poi i nostri cittadini
dovranno decriptarli.
05:15
It's not the bestmigliore use
of our citizens'cittadini time,
123
303932
2076
Non è l'uso migliore
del tempo dei cittadini,
05:18
and we as a citycittà can do better than that.
124
306008
2004
e come città possiamo fare di meglio.
05:20
Now, the good newsnotizia is that
the dede BlasioBlasio administrationamministrazione
125
308012
2736
La buona notizia è che
l'amministrazione De Blasio
05:22
actuallyin realtà recentlyrecentemente releasedrilasciato this datadati
a fewpochi monthsmesi agofa,
126
310748
2532
ha pubblicato questi dati
qualche mese fa
05:25
and so now we can
actuallyin realtà have accessaccesso to it,
127
313280
2158
e quindi possiamo accedervi,
ma ci sono ancora
tanti dati sepolti in PDF.
05:27
but there's a lot of datadati
still entombedEntombed in PDFPDF.
128
315438
2536
05:29
For exampleesempio, our crimecrimine datadati
is still only availablea disposizione in PDFPDF.
129
317974
3197
Ad esempio i dati sul crimine
sono disponibili solo in PDF.
05:33
And not just our crimecrimine datadati,
our ownproprio citycittà budgetbilancio.
130
321171
3755
E non solo quelli,
anche quelli sul bilancio.
05:36
Our citycittà budgetbilancio is only readableleggibili
right now in PDFPDF formmodulo.
131
324926
3729
Il bilancio della nostra città
al momento è leggibile solo in PDF.
05:40
And it's not just us
that can't analyzeanalizzare it --
132
328655
2141
E non solo noi
non possiamo analizzarlo,
ma anche i legislatori
che approvano il bilancio
05:42
our ownproprio legislatorslegislatori
who votevotazione for the budgetbilancio
133
330796
2955
lo ricevono in PDF.
05:45
alsoanche only get it in PDFPDF.
134
333751
1943
05:47
So our legislatorslegislatori cannotnon può analyzeanalizzare
the budgetbilancio that they are votingvoto for.
135
335694
3844
Quindi i nostri legislatori non possono
analizzare il bilancio che stanno votando.
05:51
And I think as a citycittà we can do
a little better than that as well.
136
339538
3608
E credo, anche qui, che come città
potremmo fare un po' meglio.
05:55
Now, there's a lot of datadati
that's not hiddennascosto in PDFsFile PDF.
137
343146
2488
Ci sono molti dati non nascosti in PDF.
05:57
This is an exampleesempio of a mapcarta geografica I madefatto,
138
345634
1700
Questa è una mappa che ho fatto
05:59
and this is the dirtiestpiù sporca waterwayscorsi d'acqua
in NewNuovo YorkYork CityCittà.
139
347334
2926
sui corsi d'acqua
più sporchi di New York.
06:02
Now, how do I measuremisurare dirtysporco?
140
350260
1509
Come misuro lo sporco?
06:03
Well, it's kindgenere of a little weirdstrano,
141
351769
1857
È un po' strano,
ma ho guardato il livello
dei coliformi fecali,
06:05
but I lookedguardato at the levellivello
of fecalfecale coliformbacillo coliforme,
142
353626
2113
06:07
whichquale is a measurementmisura of fecalfecale matterimporta
in eachogni of our waterwayscorsi d'acqua.
143
355739
3506
una misurazione delle sostanze fecali
in ognuno dei nostri corsi d'acqua.
06:11
The largerpiù grandi the circlecerchio,
the dirtierpiù sporca the wateracqua,
144
359245
3274
Più grande è il cerchio,
più sporca è l'acqua.
Quindi nei cerchi ampi acqua sporca,
in quelli piccoli quella più pulita.
06:14
so the largegrande circlescerchi are dirtysporco wateracqua,
the smallpiccolo circlescerchi are cleaneraddetto alle pulizie.
145
362519
3357
06:17
What you see is inlandnell'entroterra waterwayscorsi d'acqua.
146
365876
1644
Sono corsi d'acqua interni.
06:19
This is all datadati that was sampledCampionati
by the citycittà over the last fivecinque yearsanni.
147
367520
3404
Sono i dati che sono stati raccolti
in città negli ultimi 5 anni.
06:22
And inlandnell'entroterra waterwayscorsi d'acqua are,
in generalgenerale, dirtierpiù sporca.
148
370924
2694
E i corsi interni
di solito sono più sporchi.
Ha senso, no?
06:25
That makesfa sensesenso, right?
149
373618
1218
I cerchi grandi sono sporchi.
Ho imparato un po' di cose.
06:26
And the biggerpiù grande circlescerchi are dirtysporco.
And I learnedimparato a fewpochi things from this.
150
374836
3374
Numero uno: mai nuotare in niente
che inizi con "torrente" o "canale".
06:30
NumberNumero one: Never swimnuotare in anything
that endsestremità in "creekCreek" or "canalcanale."
151
378210
3164
06:33
But numbernumero two: I alsoanche foundtrovato
the dirtiestpiù sporca waterwayvia navigabile in NewNuovo YorkYork CityCittà,
152
381374
4318
Numero due: ho trovato i corsi d'acqua
più sporchi di New York,
06:37
by this measuremisurare, one measuremisurare.
153
385692
1834
con questa unica misurazione.
06:39
In ConeyConey IslandIsola CreekCreek, whichquale is not
the ConeyConey IslandIsola you swimnuotare in, luckilyfortunatamente.
154
387526
3648
A Coney Island,
non la Coney Island in cui nuotate,
dall'altra parte,
06:43
It's on the other sidelato.
155
391174
1158
nel torrente di Coney Island il 94%
dei campioni degli ultimi cinque anni
06:44
But ConeyConey IslandIsola CreekCreek, 94 percentper cento
of samplescampioni takenprese over the last fivecinque yearsanni
156
392332
3878
06:48
have had fecalfecale levelslivelli so highalto
157
396210
2157
il livello di sostanze fecali
era così alto
06:50
that it would be againstcontro statestato lawlegge
to swimnuotare in the wateracqua.
158
398367
3093
che avrebbe dovuto essere
illegale nuotarci.
06:53
And this is not the kindgenere of factfatto
that you're going to see
159
401460
2729
E questo non è il genere di cose
che trovate nei resoconti ufficiali, no?
06:56
boastedsi vantava in a citycittà reportrapporto, right?
160
404189
1537
06:57
It's not going to be
the frontdavanti pagepagina on nycNYC.govgov.
161
405726
2250
Non finirà sulla homepage di nyc.gov .
Non lo troverete lì,
06:59
You're not going to see it there,
162
407976
1580
ma il fatto che possiamo arrivare
a questo dato è fantastico.
07:01
but the factfatto that we can get
to that datadati is awesomeeccezionale.
163
409556
2518
07:04
But onceuna volta again, it wasn'tnon era supersuper easyfacile,
164
412074
1773
Ma di nuovo, non è stato facilissimo:
07:05
because this datadati was not
on the openAperto datadati portalPortal.
165
413847
2358
i dati non erano sul portale open data.
Se ci andate,
07:08
If you were to go to the openAperto datadati portalPortal,
166
416205
2013
troverete solo un frammento
di un anno o pochi mesi.
07:10
you'dfaresti see just a snippetframmento of it,
a yearanno or a fewpochi monthsmesi.
167
418218
2613
Stava sul sito del Dipartimento
per la Protezione Ambientale.
07:12
It was actuallyin realtà on the DepartmentDipartimento
of EnvironmentalAmbientale Protection'sDi protezione websiteSito web.
168
420831
3390
Ognuno di questi link è un foglio Excel
e ogni foglio Excel è diverso.
07:16
And eachogni one of these linkslink is an ExcelExcel
sheetfoglio, and eachogni ExcelExcel sheetfoglio is differentdiverso.
169
424221
3878
Ogni intestazione è diversa:
copi, incolli, riorganizzi.
07:20
EveryOgni headingintestazione is differentdiverso:
you copycopia, pasteincolla, reorganizeriorganizzare.
170
428099
2630
Puoi creare delle mappe
ed è fantastico, ma
07:22
When you do you can make mapsmappe
and that's great, but onceuna volta again,
171
430729
2952
possiamo fare di meglio,
possiamo normalizzare le cose.
07:25
we can do better than that
as a citycittà, we can normalizenormalizzare things.
172
433681
2969
E ci stiamo arrivando.
Questo è il sito di Socrata,
07:28
And we're gettingottenere there, because
there's this websiteSito web that SocrataDurante makesfa
173
436650
3384
l' Open Data Portal NYC.
Qui ci sono 1.100 dataset
che non hanno
07:32
calledchiamato the OpenAperto DataDati PortalPortal NYCNYC.
174
440034
1541
07:33
This is where 1,100 datadati setsimposta
that don't suffersoffrire
175
441575
2257
i difetti di cui vi parlavo,
stanno aumentando
ed è fantastico.
07:35
from the things I just told you livevivere,
176
443832
1781
07:37
and that numbernumero is growingin crescita,
and that's great.
177
445613
2148
Potete scaricare i dati in ogni formato,
CSV, PDF o documento Excel.
07:39
You can downloadScaricare datadati in any formatformato,
be it CSVCSV or PDFPDF or ExcelExcel documentdocumento.
178
447761
3412
Potete scaricare i dati
in qualunque modo vogliate.
07:43
WhateverVabbè you want,
you can downloadScaricare the datadati that way.
179
451173
2547
Il problema è che una volta fatto
07:45
The problemproblema is, onceuna volta you do,
180
453720
1352
07:47
you will find that eachogni agencyagenzia
codescodici theirloro addressesindirizzi differentlydiversamente.
181
455072
3686
scoprirete che ogni ufficio codifica
gli indirizzi diversamente.
07:50
So one is streetstrada namenome,
intersectionintersezione streetstrada,
182
458758
2141
Uno è il nome della strada,
l'incrocio,
07:52
streetstrada, boroughBorough, addressindirizzo, buildingcostruzione,
buildingcostruzione addressindirizzo.
183
460899
2491
via, distretto, indirizzo,
edificio, ecc.
07:55
So onceuna volta again, you're spendingla spesa time,
even when we have this portalPortal,
184
463390
3180
Quindi si spreca ancora del tempo
nonostante il portale.
Si spreca tempo normalizzando
i campi per gli indirizzi.
07:58
you're spendingla spesa time
normalizingnormalizzante our addressindirizzo fieldsi campi.
185
466570
2606
08:01
And that's not the bestmigliore use
of our citizens'cittadini time.
186
469176
2423
E non è l'uso migliore
del tempo di noi cittadini.
08:03
We can do better than that as a citycittà.
187
471599
1796
Possiamo fare di meglio come città.
08:05
We can standardizestandardizzare our addressesindirizzi,
188
473395
1645
Possiamo standardizzare gli indirizzi
08:07
and if we do,
we can get more mapsmappe like this.
189
475040
2185
e, se lo facciamo,
avremo più mappe del genere.
08:09
This is a mapcarta geografica of firefuoco hydrantsidranti
in NewNuovo YorkYork CityCittà,
190
477225
2285
Questa è una mappa
degli idranti a New York.
08:11
but not just any firefuoco hydrantsidranti.
191
479510
1531
Ma non idranti qualsiasi.
08:13
These are the topsuperiore 250 grossingcoefficiente di espansione firefuoco
hydrantsidranti in termscondizioni of parkingparcheggio ticketsBiglietti.
192
481041
4726
Sono i 250 idranti più redditizi
in termini di multe per divieto di sosta.
08:17
(LaughterRisate)
193
485767
1986
(Risate)
08:19
So I learnedimparato a fewpochi things from this mapcarta geografica,
and I really like this mapcarta geografica.
194
487753
3358
Ho imparato un po' di cose da questa mappa
e mi piace molto.
08:23
NumberNumero one, just don't parkparco
on the UpperSuperiore EastEast SideLato.
195
491111
2402
Numero uno: non parcheggiare
nell'Upper East Side.
08:25
Just don't. It doesn't matterimporta where
you parkparco, you will get a hydrantidrante ticketbiglietto.
196
493513
3587
Non farlo: non importa dove parcheggi,
ti beccherai comunque una multa.
08:29
NumberNumero two, I foundtrovato the two highestmassimo
grossingcoefficiente di espansione hydrantsidranti in all of NewNuovo YorkYork CityCittà,
197
497100
4153
Numero due: ho trovato i due
idranti più redditizi di tutta New York,
08:33
and they're on the LowerInferiore EastEast SideLato,
198
501253
1886
che si trovano nel Lower East Side.
08:35
and they were bringingportando in over
55,000 dollarsdollari a yearanno in parkingparcheggio ticketsBiglietti.
199
503139
5098
Hanno fruttato più di 55.000 dollari
l'anno in multe.
08:40
And that seemedsembrava a little strangestrano
to me when I noticedsi accorse it,
200
508237
2738
Mi è sembrato un po' strano
quando l'ho visto,
quindi ho indagato un po'
e ho scoperto che attorno a un idrante
08:42
so I did a little diggingscavando and it turnsgiri out
what you had is a hydrantidrante
201
510975
3269
c'è una cosa chiamata
estensione del marciapiede,
08:46
and then something calledchiamato
a curbmarciapiede extensionestensione,
202
514244
1996
che è tipo uno spazio
calpestabile di 2 metri
08:48
whichquale is like a seven-footsette piedi
spacespazio to walkcamminare on,
203
516240
2059
08:50
and then a parkingparcheggio spotindividuare.
204
518299
1156
e poi c'è il posto auto.
08:51
And so these carsautomobili cameè venuto alonglungo,
and the hydrantidrante --
205
519455
2254
Quindi le macchine arrivano...
"C'è spazio, sono a posto"
08:53
"It's all the way over there, I'm fine,"
206
521709
1911
C'è un posto auto
disegnato per loro.
08:55
and there was actuallyin realtà a parkingparcheggio spotindividuare
painteddipinto there beautifullymagnificamente for them.
207
523620
3474
Parcheggiano lì,
la polizia non è d'accordo
08:59
They would parkparco there, and the NYPDPOLIZIA DI NEW YORK
disagreedin disaccordo with this designationdesignazione
208
527094
3155
e li multa.
E non sono l'unico
che ha trovato la multa.
09:02
and would ticketbiglietto them.
209
530249
1058
09:03
And it wasn'tnon era just me
who foundtrovato a parkingparcheggio ticketbiglietto.
210
531307
2344
L'ha vista anche la Google Street View car
mentre passava da lì.
09:05
This is the GoogleGoogle
StreetVia ViewVista carauto drivingguida by
211
533651
2146
09:07
findingscoperta the samestesso parkingparcheggio ticketbiglietto.
212
535797
1617
Quindi ho scritto sul mio blog,
su I Quant NY
09:09
So I wroteha scritto about this on my blogblog,
on I QuantQuant NYNY, and the DOTDOT respondedrisposto,
213
537414
4504
e il Dipartimento dei Trasporti rispose.
09:13
and they said,
214
541918
1020
Mi hanno detto:
09:14
"While the DOTDOT has not receivedricevuto
any complaintsreclami about this locationPosizione,
215
542938
3410
"Sebbene il DOT non abbia ricevuto
lamentele su questa posizione,
rivedremo la segnaletica
e apporteremo le modifiche opportune".
09:18
we will reviewrevisione the roadwaycarreggiata markingsmarcature
and make any appropriateadeguata alterationsalterazioni."
216
546348
4542
Pensai che fosse
la classica risposta del Governo,
09:22
And I thought to myselfme stessa,
typicaltipico governmentgoverno responserisposta,
217
550890
2959
09:25
all right, movedmosso on with my life.
218
553849
1881
e andai avanti con la mia vita.
09:27
But then, a fewpochi weekssettimane laterdopo,
something incredibleincredibile happenedè accaduto.
219
555730
3970
Ma qualche settimana dopo
accadde qualcosa di incredibile.
09:31
They repaintedriverniciato the spotindividuare,
220
559700
2520
Avevano ridipinto il parcheggio,
09:34
and for a secondsecondo I thought I saw
the futurefuturo of openAperto datadati,
221
562220
2690
e per un secondo ho visto
il futuro degli open data.
09:36
because think about what happenedè accaduto here.
222
564910
2000
Pensate a cosa è successo.
Per cinque anni chi parcheggiava lì
veniva multato, c'era confusione,
09:38
For fivecinque yearsanni, this spotindividuare was beingessere
ticketedpossesso del biglietto, and it was confusingconfusione,
223
566910
5100
09:44
and then a citizencittadino foundtrovato something,
they told the citycittà, and withinentro a fewpochi weekssettimane
224
572010
4306
e poi un cittadino
lo dice all'amministrazione
e nel giro di poche settimane
il problema è risolto.
09:48
the problemproblema was fixedfisso.
225
576316
1294
09:49
It's amazingStupefacente. And a lot of people
see openAperto datadati as beingessere a watchdogcane da guardia.
226
577610
3200
Bene! Molti vedono gli open data
come un cane da guardia.
09:52
It's not, it's about beingessere a partnercompagno.
227
580810
1772
No, può anche essere un compagno.
09:54
We can empowerautorizzare our citizenscittadini
to be better partnerspartner for governmentgoverno,
228
582582
3138
Possiamo rendere i cittadini
dei collaboratori migliori per il governo.
09:57
and it's not that harddifficile.
229
585720
1881
Non è difficile,
occorrono solo piccoli cambiamenti.
09:59
All we need are a fewpochi changesi cambiamenti.
230
587601
1459
Se ricevi richieste per dei dati,
10:01
If you're FOILingSventare datadati,
231
589060
1107
10:02
if you're seeingvedendo your datadati
beingessere FOILedSventato over and over again,
232
590167
2867
se i tuoi dati sono richiesti
sempre più spesso,
allora rendili pubblici, perché
è un segnale che dovrebbero esserlo.
10:05
let's releaseliberare it to the publicpubblico, that's
a signsegno that it should be madefatto publicpubblico.
233
593034
3574
Se sei un ufficio governativo
che rilascia file in PDF,
10:08
And if you're a governmentgoverno agencyagenzia
releasingrilasciando a PDFPDF,
234
596608
2482
attieniti alla legge che ti impone
di allegare anche i dati relativi,
10:11
let's passpassaggio legislationlegislazione that requiresrichiede you
to postinviare it with the underlyingsottostanti datadati,
235
599090
3649
perché quei dati vengono
da qualche parte.
10:14
because that datadati
is comingvenuta from somewhereda qualche parte.
236
602739
2028
Non so da dove,
ma da qualche parte arrivano,
10:16
I don't know where, but it's
comingvenuta from somewhereda qualche parte,
237
604767
2482
e puoi allegarli al PDF.
10:19
and you can releaseliberare it with the PDFPDF.
238
607249
1725
Adottiamo e condividiamo
degli standard sui dati aperti.
10:20
And let's adoptadottare and shareCondividere
some openAperto datadati standardsnorme.
239
608974
2411
Iniziamo con gli indirizzi di New York.
10:23
Let's startinizio with our addressesindirizzi
here in NewNuovo YorkYork CityCittà.
240
611385
2481
Iniziamo a normalizzare gli indirizzi.
10:25
Let's just startinizio
normalizingnormalizzante our addressesindirizzi.
241
613866
2074
Perché New York è leader
negli open data.
10:27
Because NewNuovo YorkYork is a leadercapo in openAperto datadati.
242
615940
2062
Nonostante tutto,
siamo assolutamente dei leader,
10:30
DespiteNonostante all this, we are absolutelyassolutamente
a leadercapo in openAperto datadati,
243
618002
2789
e se iniziamo a normalizzarci
fissiando standard per gli open data,
10:32
and if we startinizio normalizingnormalizzante things,
and setimpostato an openAperto datadati standardstandard,
244
620791
3121
il resto verrà, lo stato e forse
il governo ci seguiranno.
10:35
othersaltri will followSeguire. The statestato will followSeguire,
and maybe the federalfederale governmentgoverno,
245
623912
3634
E anche altri paesi ci seguiranno,
e non saremo lontani dal momento
in cui potremo scrivere un programma
10:39
Other countriespaesi could followSeguire,
246
627546
1445
10:40
and we're not that farlontano off from a time
where you could writeScrivi one programprogramma
247
628991
3411
e una mappa unica
per più di 100 paesi.
10:44
and mapcarta geografica informationinformazione from 100 countriespaesi.
248
632402
1890
Non è fantascienza, ci siamo vicini.
10:46
It's not sciencescienza fictionfinzione.
We're actuallyin realtà quiteabbastanza closevicino.
249
634292
2487
E a proposito,
a chi daremmo più forza così?
10:48
And by the way, who are we
empoweringche abilita with this?
250
636779
2240
Perché non sarebbe solo
John Krauss o Chris Whong.
10:51
Because it's not just JohnJohn KraussKrauss
and it's not just ChrisChris WhongWhong.
251
639019
3005
Ci sono centinaia di incontri in corso
a New York in questo momento.
10:54
There are hundredscentinaia of meetupsMeetups
going on in NewNuovo YorkYork CityCittà right now,
252
642024
3095
Incontri attivi.
10:57
activeattivo meetupsMeetups.
253
645119
1025
Ci sono migliaia di persone
a questi incontri.
10:58
There are thousandsmigliaia of people
attendingfrequentando these meetupsMeetups.
254
646144
2572
Persone che vanno
dopo il lavoro, o nel weekend,
11:00
These people are going after work
and on weekendsweek-end,
255
648716
2368
e partecipano per osservare gli open data
11:03
and they're attendingfrequentando these meetupsMeetups
to look at openAperto datadati
256
651084
2636
e rendere la nostra città
un posto migliore.
11:05
and make our citycittà a better placeposto.
257
653720
1640
Gruppi come BetaNYC,
che proprio la scorsa settimana
11:07
GroupsGruppi like BetaNYCBetaNYC, who just last weeksettimana
releasedrilasciato something calledchiamato citygramcitygram.nycNYC
258
655360
4073
ha rilasciato citygram.nyc
11:11
that allowsconsente you to subscribeabbonarsi
to 311 complaintsreclami
259
659433
2147
che permette di sottoscrivere
le lamentele al 311
11:13
around your ownproprio home,
or around your officeufficio.
260
661580
2068
su casa vostra, o sull'ufficio.
11:15
You put in your addressindirizzo,
you get localLocale complaintsreclami.
261
663648
2427
Inserisci l'indirizzo e trovi
le lamentele locali.
11:18
And it's not just the techTech communitycomunità
that are after these things.
262
666075
3374
E non sono solo gli esperti di tecnologia
a fare queste cose.
Sono gli urban planner come
i miei studenti del Pratt.
11:21
It's urbanurbano plannerspianificatori like
the studentsstudenti I teachinsegnare at PrattPratt.
263
669449
2622
Sostenitori politici... chiunque.
11:24
It's policypolitica advocatessostenitori, it's everyonetutti,
264
672071
1919
11:25
it's citizenscittadini from a diversediverso
setimpostato of backgroundssfondi.
265
673990
2563
Sono cittadini coi più diversi background.
Con piccoli cambiamenti incrementali,
11:28
And with some smallpiccolo, incrementalincrementale changesi cambiamenti,
266
676553
2786
possiamo sbloccare la passione
e la capacità dei nostri cittadini
11:31
we can unlocksbloccare the passionpassione
and the abilitycapacità of our citizenscittadini
267
679339
3225
di elaborare gli open data
e rendere migliori le nostre città,
11:34
to harnessimbracatura openAperto datadati
and make our citycittà even better,
268
682564
3156
un dataset - o un posto auto - per volta.
11:37
whetherse it's one datasetDataSet,
or one parkingparcheggio spotindividuare at a time.
269
685720
3626
11:41
Thank you.
270
689346
2322
Grazie.
(Applausi)
11:43
(ApplauseApplausi)
271
691668
3305
Translated by Valentina Buda
Reviewed by Chiara Vallasciani

▲Back to top

ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com

Data provided by TED.

This site was created in May 2015 and the last update was on January 12, 2020. It will no longer be updated.

We are currently creating a new site called "eng.lish.video" and would be grateful if you could access it.

If you have any questions or suggestions, please feel free to write comments in your language on the contact form.

Privacy Policy

Developer's Blog

Buy Me A Coffee