ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com
TEDxNewYork

Ben Wellington: How we found the worst place to park in New York City -- using big data

Ben Wellington: Cómo se encontró el peor lugar para estacionar en Nueva York con datos masivos

Filmed:
1,055,247 views

Las agencias estatales tienen acceso a abundante información y estadísticas que reflejan todos los aspectos de la vida urbana. Pero el analista de datos Ben Wellington sugiere en esta entretenida charla, que algunas veces no sabemos qué hacer con ellos. Él presenta cómo combinar preguntas inesperadas y agrupar información inteligente puede producir extrañas respuestas útiles, comparte consejos de cómo liberar grandes grupos de información y cómo cualquier persona puede utilizarlos.
- Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data. Full bio

Double-click the English transcript below to play the video.

00:12
SixSeis thousandmil milesmillas of roadla carretera,
0
711
2820
Unos 10 000 km de calles,
00:15
600 milesmillas of subwaysubterraneo trackpista,
1
3531
2203
cerca de 1000 km de metro
00:17
400 milesmillas of bikebicicleta lanescarriles
2
5734
1644
650 km de ciclovías
00:19
and a halfmitad a milemilla of tramtranvía trackpista,
3
7378
1821
y 800 m de tranvía
00:21
if you've ever been to RooseveltRoosevelt IslandIsla.
4
9199
1953
si han estado en Roosevelth Island.
00:23
These are the numbersnúmeros that make up
the infrastructureinfraestructura of NewNuevo YorkYork CityCiudad.
5
11152
3334
Son los números que forman la
infraestructura de New York.
Son estadísticas
de nuestra infraestructura.
00:26
These are the statisticsestadística
of our infrastructureinfraestructura.
6
14486
2619
Son la clase de números de los informes
de las agencias estatales
00:29
They're the kindtipo of numbersnúmeros you can find
releasedliberado in reportsinformes by cityciudad agenciesagencias.
7
17105
3706
Por ejemplo, el departamento de
transporte informará de
00:32
For exampleejemplo, the DepartmentDepartamento
of TransportationTransporte will probablyprobablemente tell you
8
20811
3199
cuántos km hay de carretera.
00:36
how manymuchos milesmillas of roadla carretera they maintainmantener.
9
24010
1781
El MTA cuántos km de metro.
00:37
The MTAMTA will boastalarde how manymuchos milesmillas
of subwaysubterraneo trackpista there are.
10
25791
2821
La mayoría de agencias
estatales nos dan estadísticas.
00:40
MostMás cityciudad agenciesagencias give us statisticsestadística.
11
28612
1807
Este es un reporte de este año
00:42
This is from a reportinforme this yearaño
12
30419
1483
de la comisión de taxis y limusinas
00:43
from the TaxiTaxi and LimousineLimusina CommissionComisión,
13
31902
1892
donde vemos que hay
uno 13 500 taxis aquí en Nueva York.
00:45
where we learnaprender that there's about
13,500 taxisTaxis here in NewNuevo YorkYork CityCiudad.
14
33794
3276
Interesante, ¿cierto?
00:49
PrettyBonita interestinginteresante, right?
15
37070
1290
¿Se han puesto a pensar
de dónde vienen estos números?
00:50
But did you ever think about
where these numbersnúmeros camevino from?
16
38360
2784
00:53
Because for these numbersnúmeros to existexiste,
someonealguien at the cityciudad agencyagencia
17
41144
2903
Para que estos números existan,
alguien en la agencia municipal
00:56
had to stop and say, hmmhmm, here'saquí está a numbernúmero
that somebodyalguien mightpodría want want to know.
18
44047
3880
tuvo que pensar: "Estas cifras
pueden interesarle a alguien.
Nuestros ciudadanos
quieren conocer estas cifras".
00:59
Here'sAquí está a numbernúmero
that our citizenslos ciudadanos want to know.
19
47927
2250
Ellos van a la información original,
01:02
So they go back to theirsu rawcrudo datadatos,
20
50177
1830
cuentan, agregan, calculan
01:04
they countcontar, they addañadir, they calculatecalcular,
21
52007
1797
y lo ponen en informes,
01:05
and then they put out reportsinformes,
22
53804
1467
01:07
and those reportsinformes
will have numbersnúmeros like this.
23
55271
2177
y los informes tienen números como estos.
01:09
The problemproblema is, how do they know
all of our questionspreguntas?
24
57448
2540
El problema es, ¿cómo saben
nuestras preguntas?
Tenemos muchas...
01:11
We have lots of questionspreguntas.
25
59988
1243
01:13
In facthecho, in some waysformas there's literallyliteralmente
an infiniteinfinito numbernúmero of questionspreguntas
26
61231
3340
De hecho, hay literalmente
un número infinito de preguntas
que podemos hacer
sobre nuestra ciudad.
01:16
that we can askpedir about our cityciudad.
27
64571
1649
Las agencias no pueden seguir el paso.
01:18
The agenciesagencias can never keep up.
28
66220
1475
01:19
So the paradigmparadigma isn't exactlyexactamente workingtrabajando,
and I think our policymakersResponsables políticos realizedarse cuenta de that,
29
67695
4056
El paradigma no está trabajando
correctamente y creo que ellos lo saben
01:23
because in 2012, MayorAlcalde BloombergBloomberg
signedfirmado into lawley what he calledllamado
30
71751
3959
porque en 2012 el alcalde Bloomberg
firmó una ley a la que llamó
01:27
the mostmás ambitiousambicioso and comprehensiveexhaustivo
openabierto datadatos legislationlegislación in the countrypaís.
31
75710
3837
"La más ambiciosa legislación
de datos abiertos en el país".
01:31
In a lot of waysformas, he's right.
32
79547
1573
En muchos sentidos,
estaba en lo correcto.
01:33
In the last two yearsaños,
the cityciudad has releasedliberado 1,000 datasetsconjuntos de datos
33
81120
2861
En los últimos dos años, la ciudad
publicó mil bases de datos
01:35
on our openabierto datadatos portalportal,
34
83981
1610
en nuestro portal,
01:37
and it's prettybonita awesomeincreíble.
35
85591
1764
y es muy impresionante.
01:39
So you go and look at datadatos like this,
36
87355
1968
Verán información como ésta,
01:41
and insteaden lugar of just countingcontando
the numbernúmero of cabstaxis,
37
89323
2289
y en lugar de solo contar
los datos de los taxis,
01:43
we can startcomienzo to askpedir differentdiferente questionspreguntas.
38
91612
1943
podemos hacer diferentes preguntas.
01:45
So I had a questionpregunta.
39
93555
1200
Yo tenía una pregunta.
01:46
When'sCuando es rushprisa hourhora in NewNuevo YorkYork CityCiudad?
40
94755
1701
¿Cuándo es la hora punta en Nueva York?
01:48
It can be prettybonita bothersomemolesto.
When is rushprisa hourhora exactlyexactamente?
41
96456
2581
Es algo muy molesto.
¿Cuándo es exactamente?
01:51
And I thought to myselfmí mismo,
these cabstaxis aren'tno son just numbersnúmeros,
42
99037
2625
Y pensé, estos taxis no son solo números,
son grabadores de GPS cuando
transitan por las calles
01:53
these are GPSGPS recordersgrabadoras
drivingconducción around in our cityciudad streetscalles
43
101662
2711
en cada uno de los viajes que hacen.
Hay información ahí.
01:56
recordinggrabación eachcada and everycada ridepaseo they take.
44
104373
1913
01:58
There's datadatos there,
and I lookedmirado at that datadatos,
45
106286
2322
Y busqué esa información,
hice un estimado del promedio
02:00
and I madehecho a plottrama of the averagepromedio speedvelocidad of
taxisTaxis in NewNuevo YorkYork CityCiudad throughouten todo the day.
46
108608
3961
de la velocidad de los taxis
durante todo el día.
Pueden verlo desde la media noche
hasta las 5:18 de la mañana,
02:04
You can see that from about midnightmedianoche
to around 5:18 in the morningMañana,
47
112569
3412
02:07
speedvelocidad increasesaumenta, and at that pointpunto,
things turngiro around,
48
115981
3563
la velocidad aumenta,
y en ese punto, las cosas cambian,
02:11
and they get slowermás lento and slowermás lento and slowermás lento
untilhasta about 8:35 in the morningMañana,
49
119544
3962
y bajan la velocidad más
y más hasta las 8:35 am.
cuando terminan a 18 km hora,
el taxi promedio va a 18 km hora
02:15
when they endfin up at around
11 and a halfmitad milesmillas perpor hourhora.
50
123506
2693
02:18
The averagepromedio taxitaxi is going 11 and a halfmitad
milesmillas perpor hourhora on our cityciudad streetscalles,
51
126199
3562
y se mantiene así
02:21
and it turnsvueltas out it stayscorsé that way
52
129761
1987
el día completo.
02:23
for the entiretodo day.
53
131748
3368
(Risas)
02:27
(LaughterRisa)
54
135116
1373
02:28
So I said to myselfmí mismo, I guessadivinar
there's no rushprisa hourhora in NewNuevo YorkYork CityCiudad.
55
136489
3180
Entonces, me dije,
creo que no hay hora punta de tráfico,
hay día punta.
02:31
There's just a rushprisa day.
56
139669
1537
02:33
MakesHace sensesentido. And this is importantimportante
for a couplePareja of reasonsrazones.
57
141206
2850
Tiene sentido. Y esto es importante
por un par de razones.
02:36
If you're a transportationtransporte plannerplanificador,
this mightpodría be prettybonita interestinginteresante to know.
58
144056
3637
Si son planificadores de transporte,
esto podría ser interesante.
02:39
But if you want to get somewherealgun lado quicklycon rapidez,
59
147693
1975
Pero si quieren algo rápido,
02:41
you now know to setconjunto your alarmalarma for
4:45 in the morningMañana and you're all setconjunto.
60
149668
3468
ahora saben programar la alarma
a las 4:45 am.
Nueva York, ¿correcto?
02:45
NewNuevo YorkYork, right?
61
153136
1044
Pero hay una historia detrás de esto
02:46
But there's a storyhistoria behinddetrás this datadatos.
62
154180
1762
02:47
This datadatos wasn'tno fue
just availabledisponible, it turnsvueltas out.
63
155942
2185
Esta información no estaba
allí disponible, se creó.
02:50
It actuallyactualmente camevino from something calledllamado
a FreedomLibertad of InformationInformación LawLey RequestSolicitud,
64
158127
3619
Vino de algo llamado “Solicitud
legal de libertad de información“,
o una “Solicitud FOIL“.
02:53
or a FOILFRUSTRAR RequestSolicitud.
65
161746
1076
Este formulario lo encuentran
02:54
This is a formformar you can find on the
TaxiTaxi and LimousineLimusina CommissionComisión websitesitio web.
66
162822
3466
la Comisión de taxis y limusinas.
Para acceder a la información,
deben pedir este formulario,
02:58
In orderorden to accessacceso this datadatos,
you need to go get this formformar,
67
166288
2826
hay que llenarlo, ellos les notificarán.
Chris Whong hizo esto
03:01
fillllenar it out, and they will notifynotificar you,
68
169114
1846
03:02
and a guy namedllamado ChrisChris WhongWhong
did exactlyexactamente that.
69
170960
2130
Chris fue allí y le dijeron,
03:05
ChrisChris wentfuimos down, and they told him,
70
173090
1890
“Traiga un disco externo
nuevo a nuestra oficina,
03:06
"Just bringtraer a brandmarca newnuevo harddifícil drivemanejar
down to our officeoficina,
71
174980
2827
déjelo y en 5 horas le copiamos la
información y se lo devolvemos",
03:09
leavesalir it here for fivecinco hourshoras,
we'llbien copydupdo the datadatos and you take it back."
72
177807
3424
y de ahí vino esta información.
03:13
And that's where this datadatos camevino from.
73
181231
2032
03:15
Now, ChrisChris is the kindtipo of guy
who wants to make the datadatos publicpúblico,
74
183263
3005
Ahora Chris quiere que
la información sea pública,
y así terminó en línea
para que todos la usen.
03:18
and so it endedterminado up onlineen línea for all to use,
and that's where this graphgrafico camevino from.
75
186268
3784
Y el hecho de que exista es maravilloso.
Estos grabadores de GPS son geniales.
03:22
And the facthecho that it existsexiste is amazingasombroso.
These GPSGPS recordersgrabadoras -- really coolguay.
76
190052
3518
Pero el hecho de que tengamos
ciudadanos
03:25
But the facthecho that we have citizenslos ciudadanos
walkingpara caminar around with harddifícil drivesunidades
77
193570
3118
recogiendo información de las
agencias estatales y haciéndola pública...
03:28
pickingcosecha up datadatos from cityciudad agenciesagencias
to make it publicpúblico --
78
196688
2582
era algo más o menos público,
se podía conseguir,
03:31
it was alreadyya kindtipo of publicpúblico,
you could get to it,
79
199270
2390
pero siendo “público“ no era pública.
03:33
but it was "publicpúblico," it wasn'tno fue publicpúblico.
80
201660
1812
Y podemos hacerlo mejor
que solo como ciudad.
03:35
And we can do better than that as a cityciudad.
81
203472
1962
No necesitamos que nuestros ciudadanos
vayan por ahí con discos duros.
03:37
We don't need our citizenslos ciudadanos
walkingpara caminar around with harddifícil drivesunidades.
82
205434
2756
03:40
Now, not everycada datasetconjunto de datos
is behinddetrás a FOILFRUSTRAR RequestSolicitud.
83
208190
2337
No todos los datos
tienen una solicitud FOIL.
03:42
Here is a mapmapa I madehecho with the mostmás
dangerouspeligroso intersectionsintersecciones in NewNuevo YorkYork CityCiudad
84
210527
3802
Este mapa que hice muestra los
cruces más peligrosos de Nueva York
03:46
basedbasado on cyclistciclista accidentsaccidentes.
85
214329
1878
basado en los accidentes de ciclistas.
03:48
So the redrojo areasáreas are more dangerouspeligroso.
86
216207
1939
Las áreas rojas son más peligrosas.
03:50
And what it showsmuestra is first
the EastEste sidelado of ManhattanManhattan,
87
218146
2553
Lo primero que muestra
es que en el Este de Manhattan,
03:52
especiallyespecialmente in the lowerinferior areazona of ManhattanManhattan,
has more cyclistciclista accidentsaccidentes.
88
220699
3611
especialmente al sur,
hay más accidentes de ciclistas.
03:56
That mightpodría make sensesentido
89
224310
1019
Esto tendría sentido
03:57
because there are more cyclistsciclistas
comingviniendo off the bridgespuentes there.
90
225329
2896
porque hay más ciclistas
que vienen por los puentes.
04:00
But there's other hotspotsPuntos calientes worthvalor studyingestudiando.
91
228225
2014
Pero hay otros puntos.
Está Williambsburg
04:02
There's WilliamsburgWilliamsburg.
There's RooseveltRoosevelt AvenueAvenida in QueensQueens.
92
230239
2669
La Avenida Roosevelth y Queens.
Esta es la clase de información
que necesitamos para Visión Cero.
04:04
And this is exactlyexactamente the kindtipo of datadatos
we need for VisionVisión ZeroCero.
93
232908
2852
04:07
This is exactlyexactamente what we're looking for.
94
235760
1990
Esto es exactamente
lo que estamos buscando.
04:09
But there's a storyhistoria
behinddetrás this datadatos as well.
95
237750
2135
Pero también hay una historia
detrás de esta información.
04:11
This datadatos didn't just appearAparecer.
96
239885
2067
No apareció de repente
04:13
How manymuchos of you guys know this logologo?
97
241952
2391
¿Cuántos de Uds. conocen este logo?
Veo algunas manos levantadas
04:16
Yeah, I see some shakesbatidos.
98
244343
1352
04:17
Have you ever triedintentó to copydupdo
and pastepegar datadatos out of a PDFPDF
99
245695
2655
¿Han probado copiar y pegar
información de un PDF y darle sentido?
04:20
and make sensesentido of it?
100
248350
1357
Veo más manos levantadas.
04:21
I see more shakesbatidos.
101
249707
1060
Más han tratado de copiar y pegar que las
que reconocen el logo. Me gusta eso.
04:22
More of you triedintentó copyingproceso de copiar and pastingpaliza
than knewsabía the logologo. I like that.
102
250767
3345
04:26
So what happenedsucedió is, the datadatos
that you just saw was actuallyactualmente on a PDFPDF.
103
254112
3510
En este caso la información
estaba realmente en un PDF.
De hecho, en cientos y cientos
y cientos de páginas de PDF
04:29
In facthecho, hundredscientos and hundredscientos
and hundredscientos of pagespáginas of PDFPDF
104
257622
3105
publicadas por el NYPD,
04:32
put out by our very ownpropio NYPDNYPD,
105
260727
2159
y para acceder a ella,
tenías que copiar y pegar
04:34
and in orderorden to accessacceso it,
you would eitherya sea have to copydupdo and pastepegar
106
262886
3152
por cientos y cientos de horas
04:38
for hundredscientos and hundredscientos of hourshoras,
107
266038
1726
04:39
or you could be JohnJohn KraussKrauss.
108
267764
1344
o podrías ser John Krauss.
04:41
JohnJohn KraussKrauss was like,
109
269108
1043
Johk Krauss decía
"No voy a copiar y pegar
esta información. Escribiré un programa".
04:42
I'm not going to copydupdo and pastepegar this datadatos.
I'm going to writeescribir a programprograma.
110
270151
3413
Se llama Información de
primeros auxilios NYPD,
04:45
It's calledllamado the NYPDNYPD CrashChoque DataDatos Band-AidTirita,
111
273564
2288
04:47
and it goesva to the NYPD'sNYPD websitesitio web
and it would downloaddescargar PDFsArchivos PDF.
112
275852
3032
y va a la website de NPYD
para descargar PDFs.
04:50
EveryCada day it would searchbuscar;
if it foundencontró a PDFPDF, it would downloaddescargar it
113
278884
3126
Todo los días busca,
y si encuentra un PDF, lo descarga
04:54
and then it would runcorrer
some PDF-scrapingPDF-raspado programprograma,
114
282010
2250
y entonces activa un programa
04:56
and out would come the texttexto,
115
284260
1336
para extraer el texto del PDF,
y hacer mapas en internet como este.
04:57
and it would go on the InternetInternet,
and then people could make mapsmapas like that.
116
285596
3565
05:01
And the facthecho that the data'sdatos here,
the facthecho that we have accessacceso to it --
117
289161
3429
El hecho de que la información
esté ahí, que podamos tener acceso...
05:04
EveryCada accidentaccidente, by the way,
is a rowfila in this tablemesa.
118
292590
2450
Todo accidente,
es una fila en esta tabla,
05:07
You can imagineimagina how manymuchos PDFsArchivos PDF that is.
119
295040
1836
pueden imaginar
cuántos PDFs son todo esto.
05:08
The facthecho that we
have accessacceso to that is great,
120
296876
2207
Que podamos tener acceso
a eso es genial,
05:11
but let's not releaselanzamiento it in PDFPDF formformar,
121
299083
2110
pero no publiquemos
en formato PDF,
05:13
because then we're havingteniendo our citizenslos ciudadanos
writeescribir PDFPDF scrapersraspadores.
122
301193
2739
porque obligamos a los ciudadanos,
a extraer el texto de PDFs.
05:15
It's not the bestmejor use
of our citizens'los ciudadanos' time,
123
303932
2076
Este no es el mejor uso del
tiempo de nuestros ciudadanos,
05:18
and we as a cityciudad can do better than that.
124
306008
2004
como ciudad podemos
hacerlo mejor.
05:20
Now, the good newsNoticias is that
the deDelaware BlasioBlasio administrationadministración
125
308012
2736
La buena noticia es que
en la administración de Blasio
05:22
actuallyactualmente recentlyrecientemente releasedliberado this datadatos
a fewpocos monthsmeses agohace,
126
310748
2532
liberó la información
hace unos meses,
05:25
and so now we can
actuallyactualmente have accessacceso to it,
127
313280
2158
y ahora podemos tener
acceso a esto,
05:27
but there's a lot of datadatos
still entombedenterrado in PDFPDF.
128
315438
2536
pero hay demasiada información
que sigue en PDF.
05:29
For exampleejemplo, our crimecrimen datadatos
is still only availabledisponible in PDFPDF.
129
317974
3197
Por ejemplo la información de
delitos está solo en PDF.
05:33
And not just our crimecrimen datadatos,
our ownpropio cityciudad budgetpresupuesto.
130
321171
3755
Y no solo esta información,
sino también la del presupuesto
05:36
Our cityciudad budgetpresupuesto is only readablelegible
right now in PDFPDF formformar.
131
324926
3729
de nuestra ciudad está
solo en formato PDF.
05:40
And it's not just us
that can't analyzeanalizar it --
132
328655
2141
Y no solo nosotros
no podemos analizarla,
05:42
our ownpropio legislatorslegisladores
who votevotar for the budgetpresupuesto
133
330796
2955
nuestros propios legisladores
que votaron por el presupuesto
05:45
alsoademás only get it in PDFPDF.
134
333751
1943
también lo obtienen en PDF.
05:47
So our legislatorslegisladores cannotno poder analyzeanalizar
the budgetpresupuesto that they are votingvotación for.
135
335694
3844
Nuestros legisladores
no pueden analizar
el presupuesto que votaron.
05:51
And I think as a cityciudad we can do
a little better than that as well.
136
339538
3608
Y creo que como ciudad,
podemos hacer algo mejor.
Hay mucha información
que no está escondida en PDF.
05:55
Now, there's a lot of datadatos
that's not hiddenoculto in PDFsArchivos PDF.
137
343146
2488
05:57
This is an exampleejemplo of a mapmapa I madehecho,
138
345634
1700
Este es un ejemplo
de un mapa que hice,
05:59
and this is the dirtiestmás sucio waterwayscanales
in NewNuevo YorkYork CityCiudad.
139
347334
2926
estos son los canales más sucios
en la ciudad de New York.
06:02
Now, how do I measuremedida dirtysucio?
140
350260
1509
¿Cómo mido el nivel de contaminación?
06:03
Well, it's kindtipo of a little weirdextraño,
141
351769
1857
Bueno, es un poco raro,
06:05
but I lookedmirado at the levelnivel
of fecalfecal coliformcoliforme,
142
353626
2113
pero busqué niveles
de coliformes fecales
06:07
whichcual is a measurementmedición of fecalfecal matterimportar
in eachcada of our waterwayscanales.
143
355739
3506
que es la medida de materia fecal
en cada uno de nuestros canales
Cuanto mayor sea el círculo
más sucia el agua;
06:11
The largermás grande the circlecirculo,
the dirtiermás sucio the wateragua,
144
359245
3274
los círculos grandes son agua sucia,
los pequeños, más limpia.
06:14
so the largegrande circlescírculos are dirtysucio wateragua,
the smallpequeña circlescírculos are cleanerlimpiador.
145
362519
3357
06:17
What you see is inlandinterior waterwayscanales.
146
365876
1644
Lo que se ve son canales subterráneos.
06:19
This is all datadatos that was sampledmuestreado
by the cityciudad over the last fivecinco yearsaños.
147
367520
3404
Esta es toda la información de muestras
de la ciudad de los últimos 5 años
06:22
And inlandinterior waterwayscanales are,
in generalgeneral, dirtiermás sucio.
148
370924
2694
Los canales subterráneos son,
en general, más sucios
06:25
That makeshace sensesentido, right?
149
373618
1218
06:26
And the biggermás grande circlescírculos are dirtysucio.
And I learnedaprendido a fewpocos things from this.
150
374836
3374
Algunas enseñanzas de esto.
Número uno: nunca nades en nada
que termine en "arroyo" o "canal".
06:30
NumberNúmero one: Never swimnadar in anything
that endstermina in "creekArroyo" or "canalcanal."
151
378210
3164
06:33
But numbernúmero two: I alsoademás foundencontró
the dirtiestmás sucio waterwaycamino acuático in NewNuevo YorkYork CityCiudad,
152
381374
4318
Pero número dos:
también encontré el canal
más sucio de la ciudad
para esta medida, una medida
06:37
by this measuremedida, one measuremedida.
153
385692
1834
06:39
In ConeyConejo IslandIsla CreekArroyo, whichcual is not
the ConeyConejo IslandIsla you swimnadar in, luckilypor suerte.
154
387526
3648
En el arroyo Coney Island
que no es Coney Island
donde nadas, por suerte.
06:43
It's on the other sidelado.
155
391174
1158
Está en el otro lado
06:44
But ConeyConejo IslandIsla CreekArroyo, 94 percentpor ciento
of samplesmuestras takentomado over the last fivecinco yearsaños
156
392332
3878
pero allí el 94 % de las muestras que
se tomaron los últimos 5 años,
06:48
have had fecalfecal levelsniveles so highalto
157
396210
2157
tenían niveles fecales muy altos
06:50
that it would be againsten contra stateestado lawley
to swimnadar in the wateragua.
158
398367
3093
que sobrepasaban lo permitido por
la ley estatal para nadar.
06:53
And this is not the kindtipo of facthecho
that you're going to see
159
401460
2729
Y no es el tipo de dato que se ve
06:56
boastedjactó in a cityciudad reportinforme, right?
160
404189
1537
publicado en un informe
de la ciudad, ¿verdad?
06:57
It's not going to be
the frontfrente pagepágina on nycNueva York.govgov.
161
405726
2250
No aparecerá en la página
principal de nyc.gov.
06:59
You're not going to see it there,
162
407976
1580
El hecho de que podamos acceder
a esa información, es asombroso
07:01
but the facthecho that we can get
to that datadatos is awesomeincreíble.
163
409556
2518
Pero una vez más,
no resultó muy fácil,
07:04
But onceuna vez again, it wasn'tno fue supersúper easyfácil,
164
412074
1773
07:05
because this datadatos was not
on the openabierto datadatos portalportal.
165
413847
2358
porque esta información no estaba
en el portal de información abierta.
07:08
If you were to go to the openabierto datadatos portalportal,
166
416205
2013
Uds. podrían ver solo
parte de eso,
07:10
you'dtu hubieras see just a snippetretazo of it,
a yearaño or a fewpocos monthsmeses.
167
418218
2613
un año o unos meses.
Estaba en el sitio web del
departamento de protección ambiental
07:12
It was actuallyactualmente on the DepartmentDepartamento
of EnvironmentalAmbiental Protection'sProtección websitesitio web.
168
420831
3390
Cada uno de esos enlaces es
una hoja de Excel diferente.
07:16
And eachcada one of these linkscampo de golf is an ExcelSobresalir
sheethoja, and eachcada ExcelSobresalir sheethoja is differentdiferente.
169
424221
3878
Cada título es diferente:
uno copia, pega, reorganiza.
07:20
EveryCada headingtítulo is differentdiferente:
you copydupdo, pastepegar, reorganizereorganizar.
170
428099
2630
y pueden hacer mapas
y es genial, pero de nuevo,
07:22
When you do you can make mapsmapas
and that's great, but onceuna vez again,
171
430729
2952
podemos hacerlo mejor;
podemos normalizar las cosas.
07:25
we can do better than that
as a cityciudad, we can normalizenormalizar things.
172
433681
2969
Estamos cerca, porque está
este sitio web de Socrata
07:28
And we're gettingconsiguiendo there, because
there's this websitesitio web that SocrataSocrata makeshace
173
436650
3384
llamado Portal de Información
abierta de Nueva York.
07:32
calledllamado the OpenAbierto DataDatos PortalPortal NYCNueva York.
174
440034
1541
Hay 1100 archivos
de información que no sufre
07:33
This is where 1,100 datadatos setsconjuntos
that don't suffersufrir
175
441575
2257
de lo que les he contado
y el número sigue creciendo, es genial.
07:35
from the things I just told you livevivir,
176
443832
1781
07:37
and that numbernúmero is growingcreciente,
and that's great.
177
445613
2148
Pueden descargar
información en cualquier formato,
07:39
You can downloaddescargar datadatos in any formatformato,
be it CSVCSV or PDFPDF or ExcelSobresalir documentdocumento.
178
447761
3412
en CSV o PDF o Excel.
Pueden bajarla en cualquier formato
07:43
WhateverLo que sea you want,
you can downloaddescargar the datadatos that way.
179
451173
2547
El problema es,
que una vez que lo hacen
07:45
The problemproblema is, onceuna vez you do,
180
453720
1352
07:47
you will find that eachcada agencyagencia
codescódigos theirsu addressesdirecciones differentlydiferentemente.
181
455072
3686
verán que cada agencia estatal
codifica las direcciones diferente.
07:50
So one is streetcalle namenombre,
intersectionintersección streetcalle,
182
458758
2141
Como un nombre
de una calle, un cruce,
07:52
streetcalle, boroughciudad, addressdirección, buildingedificio,
buildingedificio addressdirección.
183
460899
2491
calle, barrio, dirección, edificio,
dirección de edificio.
07:55
So onceuna vez again, you're spendinggasto time,
even when we have this portalportal,
184
463390
3180
Aún teniendo este portal,
uno pierde tiempo
normalizando los campos.
07:58
you're spendinggasto time
normalizingnormalizando our addressdirección fieldscampos.
185
466570
2606
Y ese no es el mejor uso
del tiempo de los ciudadanos.
08:01
And that's not the bestmejor use
of our citizens'los ciudadanos' time.
186
469176
2423
08:03
We can do better than that as a cityciudad.
187
471599
1796
Podemos hacerlo mejor como ciudad.
08:05
We can standardizeestandarizar our addressesdirecciones,
188
473395
1645
Podemos estandarizar
nuestras direcciones,
08:07
and if we do,
we can get more mapsmapas like this.
189
475040
2185
y así hacer más mapas como este.
08:09
This is a mapmapa of firefuego hydrantshidrantes
in NewNuevo YorkYork CityCiudad,
190
477225
2285
Este es un mapa de
los hidrantes de Nueva York
08:11
but not just any firefuego hydrantshidrantes.
191
479510
1531
pero solo de cada hidrante.
08:13
These are the topparte superior 250 grossingrecaudando firefuego
hydrantshidrantes in termscondiciones of parkingestacionamiento ticketsEntradas.
192
481041
4726
Estos son los 250 más multados por
mal estacionamiento cerca de hidrante
(Risas)
08:17
(LaughterRisa)
193
485767
1986
08:19
So I learnedaprendido a fewpocos things from this mapmapa,
and I really like this mapmapa.
194
487753
3358
Aprendí algunas cosas de este mapa
y me gusta este mapa.
Número uno: no estacionen
en Upper East Side.
08:23
NumberNúmero one, just don't parkparque
on the UpperSuperior EastEste SideLado.
195
491111
2402
08:25
Just don't. It doesn't matterimportar where
you parkparque, you will get a hydrantboca de aguas ticketboleto.
196
493513
3587
No importa dónde estacionen,
los multarán por estacionar
ante un hidrante.
08:29
NumberNúmero two, I foundencontró the two highestmás alto
grossingrecaudando hydrantshidrantes in all of NewNuevo YorkYork CityCiudad,
197
497100
4153
Número dos: Los dos hidrantes
más populares en todo Nueva York
08:33
and they're on the LowerInferior EastEste SideLado,
198
501253
1886
están en Lower East Side
08:35
and they were bringingtrayendo in over
55,000 dollarsdólares a yearaño in parkingestacionamiento ticketsEntradas.
199
503139
5098
y producen USD 55 000 anuales
en multas de estacionamiento.
Y como me pareció algo extraño
08:40
And that seemedparecía a little strangeextraño
to me when I noticednotado it,
200
508237
2738
fui a investigar
y resultó que hay un hidrante
08:42
so I did a little diggingexcavación and it turnsvueltas out
what you had is a hydrantboca de aguas
201
510975
3269
y una extensión de acera,
08:46
and then something calledllamado
a curbbordillo extensionextensión,
202
514244
1996
de unos dos metros de espacio
para caminar
08:48
whichcual is like a seven-footsiete pies
spaceespacio to walkcaminar on,
203
516240
2059
08:50
and then a parkingestacionamiento spotlugar.
204
518299
1156
y un espacio para estacionar.
08:51
And so these carscarros camevino alonga lo largo,
and the hydrantboca de aguas --
205
519455
2254
Los autos vienen y el hidrante
--"Hay espacio no hay problema"--
08:53
"It's all the way over there, I'm fine,"
206
521709
1911
en realidad el espacio está marcado
para estacionar muy bonito.
08:55
and there was actuallyactualmente a parkingestacionamiento spotlugar
paintedpintado there beautifullyhermosamente for them.
207
523620
3474
Estacionan, pero la Policía no está
de acuerdo con esta designación
08:59
They would parkparque there, and the NYPDNYPD
disagreeden desacuerdo with this designationdesignacion
208
527094
3155
y los multa.
09:02
and would ticketboleto them.
209
530249
1058
Y no solo a mí me multaron.
09:03
And it wasn'tno fue just me
who foundencontró a parkingestacionamiento ticketboleto.
210
531307
2344
Este es el auto de
Google Street view
09:05
This is the GoogleGoogle
StreetCalle ViewVer carcoche drivingconducción by
211
533651
2146
con la misma multa
por mal estacionamiento.
09:07
findinghallazgo the samemismo parkingestacionamiento ticketboleto.
212
535797
1617
09:09
So I wroteescribió about this on my blogBlog,
on I QuantQuant NYNueva York, and the DOTPUNTO respondedrespondido,
213
537414
4504
Entonces escribí de esto en mi blog:
I Quant NY, y el DOT respondió,
09:13
and they said,
214
541918
1020
"No habíamos recibido
ninguna queja sobre esta punto,
09:14
"While the DOTPUNTO has not receivedrecibido
any complaintsquejas about this locationubicación,
215
542938
3410
09:18
we will reviewrevisión the roadwaycalzada markingsmarcas
and make any appropriateapropiado alterationsalteraciones."
216
546348
4542
revisaremos las marcas de la calle
y haremos los cambios apropiados".
09:22
And I thought to myselfmí mismo,
typicaltípico governmentgobierno responserespuesta,
217
550890
2959
Y pensé para mí mismo,
típica respuesta del gobierno,
09:25
all right, movedmovido on with my life.
218
553849
1881
muy bien, de regreso a mi vida normal.
09:27
But then, a fewpocos weekssemanas laterluego,
something incredibleincreíble happenedsucedió.
219
555730
3970
Pero unas pocas semanas
después, algo increíble pasó.
Repintaron ese punto,
09:31
They repaintedrepintado the spotlugar,
220
559700
2520
y por un segundo pensé que había visto
el futuro de la información abierta.
09:34
and for a secondsegundo I thought I saw
the futurefuturo of openabierto datadatos,
221
562220
2690
09:36
because think about what happenedsucedió here.
222
564910
2000
Porque piensen en lo que pasó aquí.
09:38
For fivecinco yearsaños, this spotlugar was beingsiendo
ticketedmultado, and it was confusingconfuso,
223
566910
5100
Por 5 años, este punto
había sido multado y era confuso
Y entonces un ciudadano encontró algo,
lo comunicó a la cuidad y en semanas
09:44
and then a citizenciudadano foundencontró something,
they told the cityciudad, and withindentro a fewpocos weekssemanas
224
572010
4306
09:48
the problemproblema was fixedfijo.
225
576316
1294
el problema estaba resuelto.
09:49
It's amazingasombroso. And a lot of people
see openabierto datadatos as beingsiendo a watchdogperro guardián.
226
577610
3200
Asombroso.
Se ve la información abierta
como ser un perro guardián.
09:52
It's not, it's about beingsiendo a partnercompañero.
227
580810
1772
No es eso, sino de ser socios.
09:54
We can empowerautorizar our citizenslos ciudadanos
to be better partnersfogonadura for governmentgobierno,
228
582582
3138
Podemos empoderar a nuestros ciudadanos
para ser mejores socios del gobierno
09:57
and it's not that harddifícil.
229
585720
1881
No es difícil.
Solo necesitamos pocos cambios.
09:59
All we need are a fewpocos changescambios.
230
587601
1459
10:01
If you're FOILingFOILing datadatos,
231
589060
1107
Si ven que su información
10:02
if you're seeingviendo your datadatos
beingsiendo FOILedFOILed over and over again,
232
590167
2867
está siendo requerida legalmente
una y otra vez
10:05
let's releaselanzamiento it to the publicpúblico, that's
a signfirmar that it should be madehecho publicpúblico.
233
593034
3574
libérenla al público,
esa es una señal
de que debería hacerse pública.
10:08
And if you're a governmentgobierno agencyagencia
releasingliberando a PDFPDF,
234
596608
2482
Si son de un estamento
gubernamental que publica PDFs,
10:11
let's passpasar legislationlegislación that requiresrequiere you
to postenviar it with the underlyingsubyacente datadatos,
235
599090
3649
aprueben una legislación que haga
que se publiquen los datos básicos
10:14
because that datadatos
is comingviniendo from somewherealgun lado.
236
602739
2028
ya que la información
proviene de algún lugar.
10:16
I don't know where, but it's
comingviniendo from somewherealgun lado,
237
604767
2482
y puede hacerse pública en PDFs.
10:19
and you can releaselanzamiento it with the PDFPDF.
238
607249
1725
Adoptemos y compartamos unos
estándares de información abierta
10:20
And let's adoptadoptar and sharecompartir
some openabierto datadatos standardsestándares.
239
608974
2411
Empecemos con nuestras
direcciones de Nueva York,
10:23
Let's startcomienzo with our addressesdirecciones
here in NewNuevo YorkYork CityCiudad.
240
611385
2481
normalizando
nuestras direcciones.
10:25
Let's just startcomienzo
normalizingnormalizando our addressesdirecciones.
241
613866
2074
Porque Nueva York es un líder
en información abierta, aún así
10:27
Because NewNuevo YorkYork is a leaderlíder in openabierto datadatos.
242
615940
2062
10:30
DespiteA pesar de all this, we are absolutelyabsolutamente
a leaderlíder in openabierto datadatos,
243
618002
2789
Y si normalizamos las cosas,
y establecemos
un estándar para información abierta,
10:32
and if we startcomienzo normalizingnormalizando things,
and setconjunto an openabierto datadatos standardestándar,
244
620791
3121
otros seguirán. El estado
y tal vez el gobierno federal,
10:35
othersotros will followseguir. The stateestado will followseguir,
and maybe the federalfederal governmentgobierno,
245
623912
3634
Es loco, pero otros países
podrían seguir el ejemplo,
10:39
Other countriespaíses could followseguir,
246
627546
1445
y no está muy lejano el día en que
se escribirá un programa
10:40
and we're not that farlejos off from a time
where you could writeescribir one programprograma
247
628991
3411
para mapear la información
de 100 países.
10:44
and mapmapa informationinformación from 100 countriespaíses.
248
632402
1890
No es ciencia ficción.
De hecho estamos cerca.
10:46
It's not scienceciencia fictionficción.
We're actuallyactualmente quitebastante closecerca.
249
634292
2487
Y por cierto, ¿a quién
empoderamos con esto?
10:48
And by the way, who are we
empoweringempoderamiento with this?
250
636779
2240
Porque no es solo John Krauss
o Chris Whong.
10:51
Because it's not just JohnJohn KraussKrauss
and it's not just ChrisChris WhongWhong.
251
639019
3005
Hay cientos de reuniones en Nueva York
actualmente, reuniones activas
10:54
There are hundredscientos of meetupsencuentros
going on in NewNuevo YorkYork CityCiudad right now,
252
642024
3095
10:57
activeactivo meetupsencuentros.
253
645119
1025
Hay miles de personas
que asisten a estas reuniones.
10:58
There are thousandsmiles of people
attendingasistiendo these meetupsencuentros.
254
646144
2572
11:00
These people are going after work
and on weekendsfines de semana,
255
648716
2368
Van después del trabajo
o los fines de semana,
11:03
and they're attendingasistiendo these meetupsencuentros
to look at openabierto datadatos
256
651084
2636
y participan en estas reuniones
para buscar información abierta
11:05
and make our cityciudad a better placelugar.
257
653720
1640
y hacer de nuestra ciudad un mejor lugar.
11:07
GroupsGrupos like BetaNYCBetaNYC, who just last weeksemana
releasedliberado something calledllamado citygramcitygram.nycNueva York
258
655360
4073
Grupos como BETANYC, que la semana
pasada liberó algo llamado citygram.nyc
11:11
that allowspermite you to subscribesuscribir
to 311 complaintsquejas
259
659433
2147
que nos permite adherirnos a 311 quejas
11:13
around your ownpropio home,
or around your officeoficina.
260
661580
2068
cerca de sus casas u oficinas.
11:15
You put in your addressdirección,
you get locallocal complaintsquejas.
261
663648
2427
Pones tu dirección y aparecen
las quejas del sector
11:18
And it's not just the techtecnología communitycomunidad
that are after these things.
262
666075
3374
Y no solo está la comunidad
tecnológica tras estas cosas.
Son planeadores urbanos
como mis estudiantes en Pratt.
11:21
It's urbanurbano plannersplanificadores like
the studentsestudiantes I teachenseñar at PrattPratt.
263
669449
2622
11:24
It's policypolítica advocatesdefensores, it's everyonetodo el mundo,
264
672071
1919
Son defensores de políticas,
son todos,
11:25
it's citizenslos ciudadanos from a diversediverso
setconjunto of backgroundsantecedentes.
265
673990
2563
son ciudadanos con
diferentes antecedentes.
11:28
And with some smallpequeña, incrementalincremental changescambios,
266
676553
2786
Y con algunos pequeños
cambios incrementales,
podemos liberar la pasión y
las capacidades de nuestros ciudadanos
11:31
we can unlockdesbloquear the passionpasión
and the abilitycapacidad of our citizenslos ciudadanos
267
679339
3225
11:34
to harnessaprovechar openabierto datadatos
and make our cityciudad even better,
268
682564
3156
para apoyar la información abierta
y hacer nuestra ciudad aún mejor
11:37
whethersi it's one datasetconjunto de datos,
or one parkingestacionamiento spotlugar at a time.
269
685720
3626
ya bien mediante una información
o mediante un lugar para estacionar.
11:41
Thank you.
270
689346
2322
Gracias.
11:43
(ApplauseAplausos)
271
691668
3305
(Aplausos)
Translated by Rebeca Zuniga
Reviewed by Lidia Cámara de la Fuente

▲Back to top

ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com

Data provided by TED.

This site was created in May 2015 and the last update was on January 12, 2020. It will no longer be updated.

We are currently creating a new site called "eng.lish.video" and would be grateful if you could access it.

If you have any questions or suggestions, please feel free to write comments in your language on the contact form.

Privacy Policy

Developer's Blog

Buy Me A Coffee