ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com
TEDxNewYork

Ben Wellington: How we found the worst place to park in New York City -- using big data

Ben Wellington: Comment l'analyse de données générales m'a permis de trouver les pires endroits où se garer à New York

Filmed:
1,055,247 views

Les organismes municipaux ont accès à de nombreuses données et statistiques sur tous les aspects de la vie urbaine. Mais comme le suggère l'analyste de données Ben Wellington dans sa conférence, ces organismes ne savent pas toujours quoi faire avec leurs données. Il fait la preuve qu'il est possible de répondre à des questions incongrues grâce à des mesures de traitement de données, et ainsi d'obtenir des renseignements étrangement utiles, et il partage avec nous ses conseils afin que les grands ensembles de données rendus publics puissent être utilisés par tous.
- Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data. Full bio

Double-click the English transcript below to play the video.

00:12
SixSix thousandmille milesmiles of roadroute,
0
711
2820
10 000 km de routes,
00:15
600 milesmiles of subwaymétro trackPiste,
1
3531
2203
1000 km de rails de métro,
00:17
400 milesmiles of bikebicyclette lanesvoies
2
5734
1644
640 km d'aménagements cyclables
00:19
and a halfmoitié a milemile of tramtram trackPiste,
3
7378
1821
et un tramway aérien de 945 m reliant
00:21
if you've ever been to RooseveltRoosevelt IslandÎle.
4
9199
1953
Manhattan à Roosevelt Island.
00:23
These are the numbersNombres that make up
the infrastructureInfrastructure of NewNouveau YorkYork CityVille.
5
11152
3334
Ces quelques nombres décrivent
l'infrastructure routière
00:26
These are the statisticsstatistiques
of our infrastructureInfrastructure.
6
14486
2619
de la ville de New York.
00:29
They're the kindgentil of numbersNombres you can find
releasedlibéré in reportsrapports by cityville agenciesagences.
7
17105
3706
Les rapports des organismes
municipaux contiennent ces données.
Le département des transports, vous dira
00:32
For exampleExemple, the DepartmentDépartement
of TransportationTransport will probablyProbablement tell you
8
20811
3199
le nombre de km de routes entretenus
00:36
how manybeaucoup milesmiles of roadroute they maintainmaintenir.
9
24010
1781
Le MTA se vantera du nombre de km
de voies de métro.
00:37
The MTAMTA will boastse vanter how manybeaucoup milesmiles
of subwaymétro trackPiste there are.
10
25791
2821
La plupart des organismes établissent
des statistiques.
00:40
MostPlupart cityville agenciesagences give us statisticsstatistiques.
11
28612
1807
Voici des données
d'un rapport de cette année
00:42
This is from a reportrapport this yearan
12
30419
1483
de la commission des taxis,
00:43
from the TaxiTaxi and LimousineLimousine CommissionCommission,
13
31902
1892
qui nous apprennent qu'il y a environ
13 500 taxis ici à New York.
00:45
where we learnapprendre that there's about
13,500 taxisTaxis here in NewNouveau YorkYork CityVille.
14
33794
3276
Intéressant, n'est-ce pas?
00:49
PrettyAssez interestingintéressant, right?
15
37070
1290
Mais vous êtes-vous déjà demandé
d'où viennent ces nombres?
00:50
But did you ever think about
where these numbersNombres camevenu from?
16
38360
2784
Pour qu'ils existent,
des fonctionnaires ont dû
00:53
Because for these numbersNombres to existexister,
someoneQuelqu'un at the cityville agencyagence
17
41144
2903
00:56
had to stop and say, hmmHmm, here'svoici a numbernombre
that somebodyquelqu'un mightpourrait want want to know.
18
44047
3880
s'arrêter et se dire, hum, voici une
donnée qui intéresse peut-être quelqu'un.
Voilà un nombre dont
nos citoyens ont besoin.
00:59
Here'sVoici a numbernombre
that our citizenscitoyens want to know.
19
47927
2250
Ils sortent alors leurs
données brutes,
01:02
So they go back to theirleur rawbrut dataLes données,
20
50177
1830
comptent, ajoutent, calculent,
01:04
they countcompter, they addajouter, they calculatecalculer,
21
52007
1797
et rédigent des rapports
01:05
and then they put out reportsrapports,
22
53804
1467
contenant de nouveaux chiffres.
01:07
and those reportsrapports
will have numbersNombres like this.
23
55271
2177
Mais le problème : comment
devinent-ils nos questions?
01:09
The problemproblème is, how do they know
all of our questionsdes questions?
24
57448
2540
Nous en avons beaucoup.
01:11
We have lots of questionsdes questions.
25
59988
1243
01:13
In factfait, in some waysfaçons there's literallyLittéralement
an infiniteinfini numbernombre of questionsdes questions
26
61231
3340
En fait, le nombre de questions
que nous nous posons sur notre ville
01:16
that we can askdemander about our cityville.
27
64571
1649
est infini et les organismes
01:18
The agenciesagences can never keep up.
28
66220
1475
peinent à nous suivre.
01:19
So the paradigmparadigme isn't exactlyexactement workingtravail,
and I think our policymakersdécideurs realizeprendre conscience de that,
29
67695
4056
Cette façon de faire n'est pas au point et
je crois que nos décideurs le réalisent,
01:23
because in 2012, MayorMaire BloombergBloomberg
signedsigné into lawloi what he calledappelé
30
71751
3959
car en 2012, le maire Bloomberg
a signé ce qu'il a appelé la mesure
01:27
the mostles plus ambitiousambitieux and comprehensivecomplet
openouvrir dataLes données legislationlégislation in the countryPays.
31
75710
3837
législative sur les données ouvertes
la plus ambitieuse et exhaustive au pays.
01:31
In a lot of waysfaçons, he's right.
32
79547
1573
Il a raison à bien des égards.
01:33
In the last two yearsannées,
the cityville has releasedlibéré 1,000 datasetsensembles de données
33
81120
2861
En deux ans, la ville a publié
1000 jeux de données sur notre
01:35
on our openouvrir dataLes données portalportail,
34
83981
1610
portail des données ouvertes,
01:37
and it's prettyjoli awesomeimpressionnant.
35
85591
1764
ce qui n'est pas mal.
01:39
So you go and look at dataLes données like this,
36
87355
1968
Vous regardez des données comme celles-là
01:41
and insteadau lieu of just countingcompte
the numbernombre of cabscabines,
37
89323
2289
et vous commencez à vous
poser des questions qui
01:43
we can startdébut to askdemander differentdifférent questionsdes questions.
38
91612
1943
vont au-delà du simple
nombre de taxis.
01:45
So I had a questionquestion.
39
93555
1200
Moi, je me suis demandé,
01:46
When'sQuand de rushse ruer hourheure in NewNouveau YorkYork CityVille?
40
94755
1701
quelle est l'heure de pointe à NY?
01:48
It can be prettyjoli bothersomegênants.
When is rushse ruer hourheure exactlyexactement?
41
96456
2581
La réponse ne nous vient
pas naturellement.
01:51
And I thought to myselfmoi même,
these cabscabines aren'tne sont pas just numbersNombres,
42
99037
2625
Et je me suis dit, ces taxis sont
plus que des nombres,
01:53
these are GPSGPS recordersenregistreurs
drivingau volant around in our cityville streetsdes rues
43
101662
2711
ils transportent des GPS qui enregistrent
01:56
recordingenregistrement eachchaque and everychaque ridebalade they take.
44
104373
1913
chaque course qu'ils font.
01:58
There's dataLes données there,
and I lookedregardé at that dataLes données,
45
106286
2322
J'ai donc jeté un œil à ces données,
02:00
and I madefabriqué a plotterrain of the averagemoyenne speedla vitesse of
taxisTaxis in NewNouveau YorkYork CityVille throughouttout au long de the day.
46
108608
3961
et j'ai tracé une courbe de la vitesse
moyenne des taxis durant la journée.
02:04
You can see that from about midnightminuit
to around 5:18 in the morningMatin,
47
112569
3412
Vous pouvez voir qu'à partir de minuit
jusqu'à environ 5 h 18,
02:07
speedla vitesse increasesaugmente, and at that pointpoint,
things turntour around,
48
115981
3563
la vitesse augmente,
puis les choses se gâtent et
02:11
and they get slowerRalentissez and slowerRalentissez and slowerRalentissez
untiljusqu'à about 8:35 in the morningMatin,
49
119544
3962
la vitesse décroît et décroît
et décroît jusqu'à 8 h 35,
02:15
when they endfin up at around
11 and a halfmoitié milesmiles perpar hourheure.
50
123506
2693
où elle se stabilise à environ
18,5 km par heure.
02:18
The averagemoyenne taxiTaxi is going 11 and a halfmoitié
milesmiles perpar hourheure on our cityville streetsdes rues,
51
126199
3562
Les taxis roulent en moyenne à 18,5 km/h
dans les rues de notre ville,
02:21
and it turnsse tourne out it staysreste that way
52
129761
1987
et leur vitesse demeure telle quelle
02:23
for the entiretout day.
53
131748
3368
toute la journée.
02:27
(LaughterRires)
54
135116
1373
(Rires)
02:28
So I said to myselfmoi même, I guessdeviner
there's no rushse ruer hourheure in NewNouveau YorkYork CityVille.
55
136489
3180
J'en conclus donc qu'il n'y a pas
d'heure de pointe à New York,
02:31
There's just a rushse ruer day.
56
139669
1537
mais des journées de pointe.
02:33
MakesFait sensesens. And this is importantimportant
for a couplecouple of reasonsles raisons.
57
141206
2850
Logique. Et c'est important
pour diverses raisons.
02:36
If you're a transportationtransport plannerPlanificateur de,
this mightpourrait be prettyjoli interestingintéressant to know.
58
144056
3637
Si vous travaillez dans le domaine du
transport, c'est intéressant pour vous.
02:39
But if you want to get somewherequelque part quicklyrapidement,
59
147693
1975
Et si vous êtes quelqu'un de pressé,
vous savez maintenant que vous
devez vous réveiller à 4 h 45.
02:41
you now know to setensemble your alarmalarme for
4:45 in the morningMatin and you're all setensemble.
60
149668
3468
New York, non?
02:45
NewNouveau YorkYork, right?
61
153136
1044
Mais ces données
ont elles aussi une
02:46
But there's a storyrécit behindderrière this dataLes données.
62
154180
1762
histoire : elles n'étaient
publiées nulle part
02:47
This dataLes données wasn'tn'était pas
just availabledisponible, it turnsse tourne out.
63
155942
2185
et ont été obtenues par suite d'une
demande faite en vertu
02:50
It actuallyréellement camevenu from something calledappelé
a FreedomLiberté of InformationInformations LawDroit RequestDemande,
64
158127
3619
de la loi del’accès à l’information.
02:53
or a FOILFLEURET RequestDemande.
65
161746
1076
Le formulaire pour faire une telle
demande est sur le site de la TLC.
02:54
This is a formforme you can find on the
TaxiTaxi and LimousineLimousine CommissionCommission websitesite Internet.
66
162822
3466
Pour obtenir les données, vous
devez le remplir, l'envoyer, puis
02:58
In ordercommande to accessaccès this dataLes données,
you need to go get this formforme,
67
166288
2826
attendre qu'on communique avec nous.
03:01
fillremplir it out, and they will notifynotifier you,
68
169114
1846
C'est ce qu'a fait Chris Whong.
03:02
and a guy namednommé ChrisChris WhongWhong
did exactlyexactement that.
69
170960
2130
Voici ce que le TLC lui a demandé :
03:05
ChrisChris wentest allé down, and they told him,
70
173090
1890
03:06
"Just bringapporter a brandmarque newNouveau harddifficile driveconduire
down to our officeBureau,
71
174980
2827
« Apportez-nous un disque
dur neuf. Nous y copierons
03:09
leavelaisser it here for fivecinq hoursheures,
we'llbien copycopie the dataLes données and you take it back."
72
177807
3424
les données et vous pourrez venir le
chercher cinq heures plus tard. »
03:13
And that's where this dataLes données camevenu from.
73
181231
2032
Voilà d'où les données proviennent.
03:15
Now, ChrisChris is the kindgentil of guy
who wants to make the dataLes données publicpublic,
74
183263
3005
Chris est de ceux qui veulent
que de telles données soient
03:18
and so it endedterminé up onlineen ligne for all to use,
and that's where this graphgraphique camevenu from.
75
186268
3784
publiques, et il les a mis en ligne,
ce qui m'a permis de faire la carte.
03:22
And the factfait that it existsexiste is amazingincroyable.
These GPSGPS recordersenregistreurs -- really coolcool.
76
190052
3518
Le fait que ces enregistrements GPS
existent -- vraiment cool.
03:25
But the factfait that we have citizenscitoyens
walkingen marchant around with harddifficile drivesdisques
77
193570
3118
Mais le fait que des citoyens
se promènent avec des disques durs
03:28
pickingcueillette up dataLes données from cityville agenciesagences
to make it publicpublic --
78
196688
2582
pour aller chercher des données,
03:31
it was alreadydéjà kindgentil of publicpublic,
you could get to it,
79
199270
2390
qui en soi sont « publiques », mais
03:33
but it was "publicpublic," it wasn'tn'était pas publicpublic.
80
201660
1812
qui ne sont pas rendues publiques,
03:35
And we can do better than that as a cityville.
81
203472
1962
nous pouvons faire mieux comme ville.
03:37
We don't need our citizenscitoyens
walkingen marchant around with harddifficile drivesdisques.
82
205434
2756
Nul besoin que nos citoyens
trimbalent des disques durs.
03:40
Now, not everychaque datasetDataSet
is behindderrière a FOILFLEURET RequestDemande.
83
208190
2337
Mais certaines données
sont déjà à disposition.
03:42
Here is a mapcarte I madefabriqué with the mostles plus
dangerousdangereux intersectionsintersections in NewNouveau YorkYork CityVille
84
210527
3802
Voici une carte que j'ai créée des
intersections de NY enregistrant le plus
03:46
basedbasé on cyclistcycliste accidentsles accidents.
85
214329
1878
d'accidents impliquant des cyclistes.
Les zones rouges sont
les plus dangereuses.
03:48
So the redrouge areaszones are more dangerousdangereux.
86
216207
1939
03:50
And what it showsmontre is first
the EastEast sidecôté of ManhattanManhattan,
87
218146
2553
Ce que l'on observe, c'est
que la portion est de l'île,
03:52
especiallynotamment in the lowerinférieur arearégion of ManhattanManhattan,
has more cyclistcycliste accidentsles accidents.
88
220699
3611
particulièrement dans le sud de la
ville, enregistre le plus d'accidents.
03:56
That mightpourrait make sensesens
89
224310
1019
Ce n'est pas illogique,
03:57
because there are more cyclistscyclistes
comingvenir off the bridgesdes ponts there.
90
225329
2896
car beaucoup de cyclistes
sortent du pont à cet endroit.
04:00
But there's other hotspotspoints chauds worthvaut studyingen train d'étudier.
91
228225
2014
Mais d'autres zones,
comme Williamsburg,
04:02
There's WilliamsburgWilliamsburg.
There's RooseveltRoosevelt AvenueAvenue in QueensQueens.
92
230239
2669
Roosevelt Avenue dans Queens,
méritent notre attention.
04:04
And this is exactlyexactement the kindgentil of dataLes données
we need for VisionVision ZeroZéro.
93
232908
2852
C'est le genre de données
dont Vision Zero a besoin.
C'est ce qui fait notre bonheur.
04:07
This is exactlyexactement what we're looking for.
94
235760
1990
04:09
But there's a storyrécit
behindderrière this dataLes données as well.
95
237750
2135
Mais encore une fois,
il y a une histoire
04:11
This dataLes données didn't just appearapparaître.
96
239885
2067
à raconter au sujet de ces données.
04:13
How manybeaucoup of you guys know this logologo?
97
241952
2391
Combien d'entre vous connaissent ce logo?
Je vois des hochements de tête.
04:16
Yeah, I see some shakessecoue.
98
244343
1352
04:17
Have you ever trieda essayé to copycopie
and pastecoller dataLes données out of a PDFPDF
99
245695
2655
Avez-vous déjà copié et
collé des données d'un PDF,
04:20
and make sensesens of it?
100
248350
1357
puis essayé d'y voir clair?
04:21
I see more shakessecoue.
101
249707
1060
Vous l'êtes apparemment.
04:22
More of you trieda essayé copyingcopier and pasting-coller
than knewa connu the logologo. I like that.
102
250767
3345
Plus à avoir fait du copier-coller
qu'à reconnaître le logo. Intéressant.
04:26
So what happenedarrivé is, the dataLes données
that you just saw was actuallyréellement on a PDFPDF.
103
254112
3510
Les données que vous avez vues
se trouvaient à l'origine dans un PDF.
En fait, dans un PDF de
plusieurs centaines de pages
04:29
In factfait, hundredsdes centaines and hundredsdes centaines
and hundredsdes centaines of pagespages of PDFPDF
104
257622
3105
04:32
put out by our very ownposséder NYPDNYPD,
105
260727
2159
créé par notre service de police,
04:34
and in ordercommande to accessaccès it,
you would eithernon plus have to copycopie and pastecoller
106
262886
3152
et pour pouvoir les utiliser, vous
deviez faire du copier-coller,
04:38
for hundredsdes centaines and hundredsdes centaines of hoursheures,
107
266038
1726
pendant des heures,
04:39
or you could be JohnJohn KraussKrauss.
108
267764
1344
ou vous appelez John Krauss.
04:41
JohnJohn KraussKrauss was like,
109
269108
1043
John Krauss s'est dit,
04:42
I'm not going to copycopie and pastecoller this dataLes données.
I'm going to writeécrire a programprogramme.
110
270151
3413
je ne vais pas copier ces données,
mais plutôt créer un programme,
04:45
It's calledappelé the NYPDNYPD CrashCrash DataDonnées Band-AidBand-Aid,
111
273564
2288
le NYPD Crash Data Band-Aid,
04:47
and it goesva to the NYPD'sDu NYPD websitesite Internet
and it would downloadTélécharger PDFsFichier PDF.
112
275852
3032
qui se promène sur le site Web du NYPD
pour y dénicher des PDF.
04:50
EveryChaque day it would searchchercher;
if it founda trouvé a PDFPDF, it would downloadTélécharger it
113
278884
3126
Chaque jour, il cherche,
trouve et télécharge des PDF,
04:54
and then it would runcourir
some PDF-scrapingPDF-grattage programprogramme,
114
282010
2250
puis en extrait le contenu qu'il
04:56
and out would come the texttexte,
115
284260
1336
transforme en texte et
04:57
and it would go on the InternetInternet,
and then people could make mapscartes like that.
116
285596
3565
qu'il publie sur le Web, pour que
l'on puisse faire des cartes.
05:01
And the factfait that the data'sde données here,
the factfait that we have accessaccès to it --
117
289161
3429
Et le fait que nous ayons ces données --
en passant, chaque ligne
du tableau est un accident.
05:04
EveryChaque accidentaccident, by the way,
is a rowrangée in this tabletable.
118
292590
2450
05:07
You can imagineimaginer how manybeaucoup PDFsFichier PDF that is.
119
295040
1836
Vous pouvez imaginer le nombre de PDF.
05:08
The factfait that we
have accessaccès to that is great,
120
296876
2207
Le fait que nous y ayons
accès est formidable,
05:11
but let's not releaseLibération it in PDFPDF formforme,
121
299083
2110
mais ne les publions pas dans des PDF,
05:13
because then we're havingayant our citizenscitoyens
writeécrire PDFPDF scrapersgrattoirs.
122
301193
2739
car nos citoyens chercheront
le moyen de les en extraire.
05:15
It's not the bestmeilleur use
of our citizens'citoyens' time,
123
303932
2076
Nos citoyens n'ont pas de temps à perdre,
05:18
and we as a cityville can do better than that.
124
306008
2004
et comme ville nous pouvons offrir mieux.
05:20
Now, the good newsnouvelles is that
the dede BlasioBlasio administrationadministration
125
308012
2736
La bonne nouvelle, c'est
que l'administration Blasio
05:22
actuallyréellement recentlyrécemment releasedlibéré this dataLes données
a fewpeu monthsmois agodepuis,
126
310748
2532
a publié ces données il y a quelques mois,
05:25
and so now we can
actuallyréellement have accessaccès to it,
127
313280
2158
Mais beaucoup de données restent enfermées
05:27
but there's a lot of dataLes données
still entombedEntombed in PDFPDF.
128
315438
2536
dans des PDF, ce qui est notamment le cas
05:29
For exampleExemple, our crimela criminalité dataLes données
is still only availabledisponible in PDFPDF.
129
317974
3197
des données sur les crimes.
05:33
And not just our crimela criminalité dataLes données,
our ownposséder cityville budgetbudget.
130
321171
3755
Tout comme du budget
de notre propre ville.
05:36
Our cityville budgetbudget is only readablelisible par
right now in PDFPDF formforme.
131
324926
3729
Le budget de NY n'est actuellement
disponible qu'en format PDF.
05:40
And it's not just us
that can't analyzeanalyser it --
132
328655
2141
Nous ne sommes pas les
seuls que cela embête.
05:42
our ownposséder legislatorsles législateurs
who votevote for the budgetbudget
133
330796
2955
Nos propres législateurs, ceux
qui votent le budget,
05:45
alsoaussi only get it in PDFPDF.
134
333751
1943
le reçoivent en PDF.
05:47
So our legislatorsles législateurs cannotne peux pas analyzeanalyser
the budgetbudget that they are votingvote for.
135
335694
3844
Nos législateurs ne peuvent pas
analyser le budget qu'ils votent.
05:51
And I think as a cityville we can do
a little better than that as well.
136
339538
3608
Et je crois que comme ville nous
pouvons faire un peu mieux que cela.
05:55
Now, there's a lot of dataLes données
that's not hiddencaché in PDFsFichier PDF.
137
343146
2488
Toutes les données ne sont
pas cachées dans des PDF.
05:57
This is an exampleExemple of a mapcarte I madefabriqué,
138
345634
1700
Voici une carte que j'ai faite
05:59
and this is the dirtiestplus sale waterwayscours d’eau
in NewNouveau YorkYork CityVille.
139
347334
2926
des voies de navigation
les plus sales de New York.
06:02
Now, how do I measuremesure dirtysale?
140
350260
1509
Que veux-je dire par sale?
06:03
Well, it's kindgentil of a little weirdbizarre,
141
351769
1857
C'est quelque peu étrange,
06:05
but I lookedregardé at the levelniveau
of fecalfécale coliformcoliformes,
142
353626
2113
mais j'ai pris le nombre
de coliformes fécaux,
06:07
whichlequel is a measurementmesure of fecalfécale mattermatière
in eachchaque of our waterwayscours d’eau.
143
355739
3506
soit la quantité de matière fécale,
dans chacune de nos voies d'eau.
06:11
The largerplus grand the circlecercle,
the dirtierplus sale the watereau,
144
359245
3274
Plus le cercle est grand,
plus l'eau est sale,
06:14
so the largegrand circlescercles are dirtysale watereau,
the smallpetit circlescercles are cleanernettoyeur.
145
362519
3357
et vice versa.
Ce que vous voyez ce sont
06:17
What you see is inlandintérieur waterwayscours d’eau.
146
365876
1644
les voies navigables intérieures.
06:19
This is all dataLes données that was sampledéchantillonnés
by the cityville over the last fivecinq yearsannées.
147
367520
3404
Il s'agit de données que la ville
recueille depuis cinq ans.
06:22
And inlandintérieur waterwayscours d’eau are,
in generalgénéral, dirtierplus sale.
148
370924
2694
Les voies intérieures sont
généralement plus sales,
06:25
That makesfait du sensesens, right?
149
373618
1218
C'est assez évident, non?
06:26
And the biggerplus gros circlescercles are dirtysale.
And I learnedappris a fewpeu things from this.
150
374836
3374
Voici ce que j'ai découvert
grâce à cette carte.
06:30
NumberNombre one: Never swimnager in anything
that endsprend fin in "creekruisseau" or "canalcanal."
151
378210
3164
Premièrement, il ne faut jamais nager
dans un « creek » ou un « canal ».
06:33
But numbernombre two: I alsoaussi founda trouvé
the dirtiestplus sale waterwayvoie navigable in NewNouveau YorkYork CityVille,
152
381374
4318
Deuxièmement, la voie la plus sale
de New York est Coney Island Creek,
06:37
by this measuremesure, one measuremesure.
153
385692
1834
d'après cette mesure.
06:39
In ConeyConey IslandÎle CreekCreek, whichlequel is not
the ConeyConey IslandÎle you swimnager in, luckilyHeureusement.
154
387526
3648
Ce n'est heureusement pas le Coney
Island où vous vous baignez.
06:43
It's on the other sidecôté.
155
391174
1158
C'est de l'autre côté.
06:44
But ConeyConey IslandÎle CreekCreek, 94 percentpour cent
of sampleséchantillons takenpris over the last fivecinq yearsannées
156
392332
3878
Mais à Coney Island Creek, 94 % des
échantillons prélevés depuis cinq ans
06:48
have had fecalfécale levelsles niveaux so highhaute
157
396210
2157
contenaient tellement de coliformes fécaux
06:50
that it would be againstcontre stateEtat lawloi
to swimnager in the watereau.
158
398367
3093
que les lois de l'État le rendent
impropre à la baignade.
06:53
And this is not the kindgentil of factfait
that you're going to see
159
401460
2729
Et ce n'est pas le genre
de faits que les rapports
06:56
boastedse vantait in a cityville reportrapport, right?
160
404189
1537
de la ville contiennent ou qui
06:57
It's not going to be
the frontde face pagepage on nycNYC.govgov.
161
405726
2250
figure sur la page d'accueil
du nyc.gov, non?
06:59
You're not going to see it there,
162
407976
1580
Vous ne les y verrez pas, mais
07:01
but the factfait that we can get
to that dataLes données is awesomeimpressionnant.
163
409556
2518
le fait qu'on puisse trouver
ces données est génial.
07:04
But onceune fois que again, it wasn'tn'était pas supersuper easyfacile,
164
412074
1773
Ici encore, ce ne fut pas facile, car
07:05
because this dataLes données was not
on the openouvrir dataLes données portalportail.
165
413847
2358
elles ne figuraient pas
dans le portail des
07:08
If you were to go to the openouvrir dataLes données portalportail,
166
416205
2013
données ouvertes, où vous trouverez
07:10
you'dtu aurais see just a snippetextrait of it,
a yearan or a fewpeu monthsmois.
167
418218
2613
seulement des chiffres pour
un an ou quelques mois.
07:12
It was actuallyréellement on the DepartmentDépartement
of EnvironmentalEnvironnement Protection'sDe protection websitesite Internet.
168
420831
3390
Elles étaient plutôt sur le site
du DEP de la ville de NY.
07:16
And eachchaque one of these linksdes liens is an ExcelExcel
sheetdrap, and eachchaque ExcelExcel sheetdrap is differentdifférent.
169
424221
3878
Chacun de ces liens ouvre un tableur Excel
différent, avec des titres différents.
07:20
EveryChaque headingtitre is differentdifférent:
you copycopie, pastecoller, reorganizeréorganiser les.
170
428099
2630
Vous copiez, collez, réorganisez le tout,
puis faites des cartes et
c'est bien, mais encore une fois,
07:22
When you do you can make mapscartes
and that's great, but onceune fois que again,
171
430729
2952
nous pouvons faire mieux comme
ville et établir des normes.
07:25
we can do better than that
as a cityville, we can normalizenormaliser things.
172
433681
2969
Et nous y arrivons par des sites
Web comme celui de Socrata
07:28
And we're gettingobtenir there, because
there's this websitesite Internet that SocrataSocrata makesfait du
173
436650
3384
appelé l'Open Data Portal NYC,
où 1100 jeux de données,
qui ne souffrent pas
07:32
calledappelé the OpenOuvert DataDonnées PortalPortail NYCNYC.
174
440034
1541
07:33
This is where 1,100 dataLes données setsensembles
that don't suffersouffrir
175
441575
2257
des maux que j'ai décrits se trouvent,
07:35
from the things I just told you livevivre,
176
443832
1781
et leur nombre ne
cesse de croître.
07:37
and that numbernombre is growingcroissance,
and that's great.
177
445613
2148
Vous pouvez y télécharger les données
que vous voulez dans une foule
07:39
You can downloadTélécharger dataLes données in any formatformat,
be it CSVCSV or PDFPDF or ExcelExcel documentdocument.
178
447761
3412
de formats : CSV,
PDF, XLS ou autres.
07:43
WhateverQuelle que soit you want,
you can downloadTélécharger the dataLes données that way.
179
451173
2547
07:45
The problemproblème is, onceune fois que you do,
180
453720
1352
Vous découvrirez alors que
07:47
you will find that eachchaque agencyagence
codescodes theirleur addressesadresses differentlydifféremment.
181
455072
3686
le format des adresses n'est pas
le même d'un organisme à l'autre.
07:50
So one is streetrue nameprénom,
intersectionintersection streetrue,
182
458758
2141
L'un classe ses données par rue ou par
07:52
streetrue, boroughDistrict londonien, addressadresse, buildingbâtiment,
buildingbâtiment addressadresse.
183
460899
2491
intersection, l'autre par quartier
ou adresse postale.
07:55
So onceune fois que again, you're spendingdépenses time,
even when we have this portalportail,
184
463390
3180
Même avec ce portail, vous perdez
du temps, car vous devez
07:58
you're spendingdépenses time
normalizingnormalisant our addressadresse fieldsdes champs.
185
466570
2606
uniformiser les champs des adresses.
08:01
And that's not the bestmeilleur use
of our citizens'citoyens' time.
186
469176
2423
Et nos citoyens ont d'autres
chats à fouetter.
Nous pouvons faire mieux comme ville.
08:03
We can do better than that as a cityville.
187
471599
1796
Nous pourrions normaliser nos adresses,
08:05
We can standardizenormaliser les our addressesadresses,
188
473395
1645
08:07
and if we do,
we can get more mapscartes like this.
189
475040
2185
ce qui nous aiderait
à créer plus de cartes.
08:09
This is a mapcarte of fireFeu hydrantsbouches d’incendie
in NewNouveau YorkYork CityVille,
190
477225
2285
En voici une des
bornes d'incendie de NY,
08:11
but not just any fireFeu hydrantsbouches d’incendie.
191
479510
1531
mais pas de n'importe quelle borne.
08:13
These are the topHaut 250 grossingextrapolation fireFeu
hydrantsbouches d’incendie in termstermes of parkingparking ticketsdes billets.
192
481041
4726
Il s'agit des 250 bornes ayant remis le
plus grand nombre de contraventions.
08:17
(LaughterRires)
193
485767
1986
(Rires)
08:19
So I learnedappris a fewpeu things from this mapcarte,
and I really like this mapcarte.
194
487753
3358
J'ai fait des découvertes
grâce à cette carte.
08:23
NumberNombre one, just don't parkparc
on the UpperPartie supérieure EastEast SideCôté.
195
491111
2402
Primo, ne vous garez
pas dans l'Upper East Side.
08:25
Just don't. It doesn't mattermatière where
you parkparc, you will get a hydrantbouche d’incendie ticketbillet.
196
493513
3587
Peu importe où vous vous
garerez, vous aurez un ticket.
08:29
NumberNombre two, I founda trouvé the two highestle plus élevé
grossingextrapolation hydrantsbouches d’incendie in all of NewNouveau YorkYork CityVille,
197
497100
4153
J'ai également trouvé les deux
bornes les plus lucratives pour la ville,
08:33
and they're on the LowerPlus bas EastEast SideCôté,
198
501253
1886
deux bornes dans le Lower East Side,
08:35
and they were bringingapportant in over
55,000 dollarsdollars a yearan in parkingparking ticketsdes billets.
199
503139
5098
qui rapportent plus de 55 000 $
par année en contraventions.
08:40
And that seemedsemblait a little strangeétrange
to me when I noticedremarqué it,
200
508237
2738
Cela m'a surpris.
08:42
so I did a little diggingcreusement and it turnsse tourne out
what you had is a hydrantbouche d’incendie
201
510975
3269
J'ai donc fait des recherches
et j'ai découvert
08:46
and then something calledappelé
a curbtrottoir extensionextension,
202
514244
1996
qu'une avancée de trottoir de sept pieds
08:48
whichlequel is like a seven-footsept pieds
spaceespace to walkmarche on,
203
516240
2059
sépare la place de parking
08:50
and then a parkingparking spotplace.
204
518299
1156
de la borne d'incendie.
08:51
And so these carsdes voitures camevenu alongle long de,
and the hydrantbouche d’incendie --
205
519455
2254
Un conducteur arrive et se dit :
08:53
"It's all the way over there, I'm fine,"
206
521709
1911
« La borne est là-bas, je suis ok. »
08:55
and there was actuallyréellement a parkingparking spotplace
paintedpeint there beautifullymagnifiquement for them.
207
523620
3474
Il regarde les lignes de parking
dessinées au sol et se gare.
08:59
They would parkparc there, and the NYPDNYPD
disagreeden désaccord with this designationdésignation
208
527094
3155
Les policiers, qui ne voient pas
les choses du même œil, lui
09:02
and would ticketbillet them.
209
530249
1058
collent une amende.
09:03
And it wasn'tn'était pas just me
who founda trouvé a parkingparking ticketbillet.
210
531307
2344
Je ne suis pas le seul
à avoir remarqué cela.
09:05
This is the GoogleGoogle
StreetRue ViewVue carvoiture drivingau volant by
211
533651
2146
La voiture de Google qui passait par là
09:07
findingdécouverte the sameMême parkingparking ticketbillet.
212
535797
1617
a photographié la scène.
09:09
So I wrotea écrit about this on my blogBlog,
on I QuantQuant NYNY, and the DOTDOT respondeda répondu,
213
537414
4504
J'en ai parlé dans mon blogue I Quant NY,
à la suite de quoi le DOT m'a répondu,
09:13
and they said,
214
541918
1020
et a déclaré :
09:14
"While the DOTDOT has not receivedreçu
any complaintsplaintes about this locationemplacement,
215
542938
3410
« Bien que le DOT n'ait reçu
aucune plainte au sujet de
09:18
we will reviewla revue the roadwaychaussée markingsmarquages
and make any appropriateapproprié alterationsaltérations."
216
546348
4542
cet emplacement, nous allons
revoir le marquage au sol. »
09:22
And I thought to myselfmoi même,
typicaltypique governmentgouvernement responseréponse,
217
550890
2959
Je me suis dit, voilà une
réponse typique,
09:25
all right, moveddéplacé on with my life.
218
553849
1881
merci, passons à autre chose.
09:27
But then, a fewpeu weekssemaines laterplus tard,
something incredibleincroyable happenedarrivé.
219
555730
3970
Mais, quelques semaines plus tard, une
chose extraordinaire s'est produite.
09:31
They repaintedrepeinte the spotplace,
220
559700
2520
Ils ont refait les lignes, et pendant
09:34
and for a secondseconde I thought I saw
the futureavenir of openouvrir dataLes données,
221
562220
2690
une seconde, j'ai vu l'avenir
de l'ouverture des données,
09:36
because think about what happenedarrivé here.
222
564910
2000
car pensez à ce qui est arrivé ici.
09:38
For fivecinq yearsannées, this spotplace was beingétant
ticketedont acheté un billet, and it was confusingdéroutant,
223
566910
5100
Durant cinq ans, ceux qui se garaient-là
recevaient un ticket sans comprendre,
09:44
and then a citizencitoyen founda trouvé something,
they told the cityville, and withindans a fewpeu weekssemaines
224
572010
4306
puis un citoyen a fait une observation,
en a fait part à la ville et en quelques
09:48
the problemproblème was fixedfixé.
225
576316
1294
semaines tout était réglé.
09:49
It's amazingincroyable. And a lot of people
see openouvrir dataLes données as beingétant a watchdogchien de garde.
226
577610
3200
C'est formidable. Plusieurs personnes
voient là un rôle de cerbère.
09:52
It's not, it's about beingétant a partnerpartenaire.
227
580810
1772
Les données sont plutôt un outil,
09:54
We can empowerhabiliter our citizenscitoyens
to be better partnersles partenaires for governmentgouvernement,
228
582582
3138
qui nous permettent d'être de vrais
partenaires du gouvernement,
09:57
and it's not that harddifficile.
229
585720
1881
et ce n'est pas si complexe.
09:59
All we need are a fewpeu changeschangements.
230
587601
1459
Peu de changements sont requis.
10:01
If you're FOILingFOILing dataLes données,
231
589060
1107
Si vous vous faites
10:02
if you're seeingvoyant your dataLes données
beingétant FOILedDéjoué over and over again,
232
590167
2867
régulièrement demander vos données,
10:05
let's releaseLibération it to the publicpublic, that's
a signsigne that it should be madefabriqué publicpublic.
233
593034
3574
rendez-les publiques, c'est un signe
qu'elles devraient l'être.
10:08
And if you're a governmentgouvernement agencyagence
releasingrelâchant a PDFPDF,
234
596608
2482
Votons aussi une loi qui
oblige les organismes
10:11
let's passpasser legislationlégislation that requiresa besoin you
to postposter it with the underlyingsous-jacent dataLes données,
235
599090
3649
gouvernementaux qui mettent en
ligne des PDF à joindre à ceux-ci
10:14
because that dataLes données
is comingvenir from somewherequelque part.
236
602739
2028
les données brutes, car
celles-ci proviennent
10:16
I don't know where, but it's
comingvenir from somewherequelque part,
237
604767
2482
nécessairement de quelque part,
10:19
and you can releaseLibération it with the PDFPDF.
238
607249
1725
et devraient être accessibles.
10:20
And let's adoptadopter and sharepartager
some openouvrir dataLes données standardsnormes.
239
608974
2411
Fixons des normes
sur les données ouvertes
10:23
Let's startdébut with our addressesadresses
here in NewNouveau YorkYork CityVille.
240
611385
2481
et uniformisons le format
10:25
Let's just startdébut
normalizingnormalisant our addressesadresses.
241
613866
2074
des adresses de New York.
10:27
Because NewNouveau YorkYork is a leaderchef in openouvrir dataLes données.
242
615940
2062
Malgré tout ce que j'ai dit, NY reste un
10:30
DespiteMalgré all this, we are absolutelyabsolument
a leaderchef in openouvrir dataLes données,
243
618002
2789
leader dans le domaine
des données ouvertes
10:32
and if we startdébut normalizingnormalisant things,
and setensemble an openouvrir dataLes données standardla norme,
244
620791
3121
et si nous choisissons d'établir
des normes en la matière
10:35
othersautres will followsuivre. The stateEtat will followsuivre,
and maybe the federalfédéral governmentgouvernement,
245
623912
3634
d'autres feront de même. L'État,
le gouvernement fédéral, voire d'autres
10:39
Other countriesdes pays could followsuivre,
246
627546
1445
pays pourraient nous suivre.
Nous approchons d'une ère où nous
aurons un programme qui pourra
10:40
and we're not that farloin off from a time
where you could writeécrire one programprogramme
247
628991
3411
créeons des cartes avec les
données de 100 pays.
10:44
and mapcarte informationinformation from 100 countriesdes pays.
248
632402
1890
Ce n'est pas de la science fiction,
nous y sommes presque.
10:46
It's not sciencescience fictionfiction.
We're actuallyréellement quiteassez closeFermer.
249
634292
2487
10:48
And by the way, who are we
empoweringautonomiser with this?
250
636779
2240
Mais au fait, à qui donnons-nous
le pouvoir?
10:51
Because it's not just JohnJohn KraussKrauss
and it's not just ChrisChris WhongWhong.
251
639019
3005
Car il ne s'agit pas seulement de
John Krauss et de Chris Whong,
10:54
There are hundredsdes centaines of meetupsmeetups
going on in NewNouveau YorkYork CityVille right now,
252
642024
3095
Il y a actuellement des
centaines de Meetup actifs
10:57
activeactif meetupsmeetups.
253
645119
1025
à New York.
Ils sont des milliers
à participer à ces réunions.
10:58
There are thousandsmilliers of people
attendingassister these meetupsmeetups.
254
646144
2572
Ils y assistent après le
travail et les weekends,
11:00
These people are going after work
and on weekendsfins de semaine,
255
648716
2368
pour passer en revue des
données et améliorer la
11:03
and they're attendingassister these meetupsmeetups
to look at openouvrir dataLes données
256
651084
2636
qualité de vie dans notre ville.
11:05
and make our cityville a better placeendroit.
257
653720
1640
Des groupes comme BetaNYC, qui la
semaine dernière a lancé citygram.nyc,
11:07
GroupsGroupes like BetaNYCBetaNYC, who just last weekla semaine
releasedlibéré something calledappelé citygramcitygram.nycNYC
258
655360
4073
11:11
that allowspermet you to subscribes’abonner
to 311 complaintsplaintes
259
659433
2147
où vous pouvez vous
abonner à un bulletin des
11:13
around your ownposséder home,
or around your officeBureau.
260
661580
2068
plaintes que la ville
reçoit au 311 dans un
11:15
You put in your addressadresse,
you get locallocal complaintsplaintes.
261
663648
2427
rayon autour de chez vous
ou de votre travail.
11:18
And it's not just the techtechnologie communitycommunauté
that are after these things.
262
666075
3374
Et ce n'est pas que la communauté
techno que cela intéresse.
11:21
It's urbanUrbain plannersplanificateurs like
the studentsélèves I teachapprendre at PrattPratt.
263
669449
2622
Les urbanistes, mes
étudiants, les défenseurs
11:24
It's policypolitique advocatesdéfenseurs, it's everyonetoutes les personnes,
264
672071
1919
du domaine public, des citoyens
11:25
it's citizenscitoyens from a diversediverse
setensemble of backgroundsarrière-plans.
265
673990
2563
de tous les milieux.
Tout le monde s'y intéresse.
11:28
And with some smallpetit, incrementalincrémentale changeschangements,
266
676553
2786
Et tous ces petits changements progressifs
11:31
we can unlockdéverrouiller the passionla passion
and the abilitycapacité of our citizenscitoyens
267
679339
3225
attisent la passion de nos
citoyens et leur permettent
11:34
to harnessharnais openouvrir dataLes données
and make our cityville even better,
268
682564
3156
d'utiliser des données pour
améliorer notre ville,
11:37
whetherqu'il s'agisse it's one datasetDataSet,
or one parkingparking spotplace at a time.
269
685720
3626
que ce soit une donnée ou
une place de stationnement à la fois.
11:41
Thank you.
270
689346
2322
Merci.
11:43
(ApplauseApplaudissements)
271
691668
3305
(Applaudissements)
Translated by Jean-Pierre Bourgault
Reviewed by Vincent Lecoanet

▲Back to top

ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com

Data provided by TED.

This site was created in May 2015 and the last update was on January 12, 2020. It will no longer be updated.

We are currently creating a new site called "eng.lish.video" and would be grateful if you could access it.

If you have any questions or suggestions, please feel free to write comments in your language on the contact form.

Privacy Policy

Developer's Blog

Buy Me A Coffee