Ben Wellington: How we found the worst place to park in New York City -- using big data
Ben Wellington: Comment l'analyse de données générales m'a permis de trouver les pires endroits où se garer à New York
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data. Full bio
Double-click the English transcript below to play the video.
the infrastructure of New York City.
l'infrastructure routière
of our infrastructure.
released in reports by city agencies.
municipaux contiennent ces données.
of Transportation will probably tell you
de voies de métro.
of subway track there are.
des statistiques.
d'un rapport de cette année
13 500 taxis ici à New York.
13,500 taxis here in New York City.
d'où viennent ces nombres?
where these numbers came from?
des fonctionnaires ont dû
someone at the city agency
that somebody might want want to know.
donnée qui intéresse peut-être quelqu'un.
nos citoyens ont besoin.
that our citizens want to know.
données brutes,
will have numbers like this.
devinent-ils nos questions?
all of our questions?
an infinite number of questions
que nous nous posons sur notre ville
and I think our policymakers realize that,
je crois que nos décideurs le réalisent,
signed into law what he called
a signé ce qu'il a appelé la mesure
open data legislation in the country.
la plus ambitieuse et exhaustive au pays.
the city has released 1,000 datasets
1000 jeux de données sur notre
the number of cabs,
poser des questions qui
nombre de taxis.
When is rush hour exactly?
pas naturellement.
these cabs aren't just numbers,
plus que des nombres,
driving around in our city streets
and I looked at that data,
taxis in New York City throughout the day.
moyenne des taxis durant la journée.
to around 5:18 in the morning,
jusqu'à environ 5 h 18,
things turn around,
puis les choses se gâtent et
until about 8:35 in the morning,
et décroît jusqu'à 8 h 35,
11 and a half miles per hour.
18,5 km par heure.
miles per hour on our city streets,
dans les rues de notre ville,
there's no rush hour in New York City.
d'heure de pointe à New York,
for a couple of reasons.
pour diverses raisons.
this might be pretty interesting to know.
transport, c'est intéressant pour vous.
devez vous réveiller à 4 h 45.
4:45 in the morning and you're all set.
ont elles aussi une
publiées nulle part
just available, it turns out.
demande faite en vertu
a Freedom of Information Law Request,
demande est sur le site de la TLC.
Taxi and Limousine Commission website.
devez le remplir, l'envoyer, puis
you need to go get this form,
did exactly that.
down to our office,
dur neuf. Nous y copierons
we'll copy the data and you take it back."
chercher cinq heures plus tard. »
who wants to make the data public,
que de telles données soient
and that's where this graph came from.
ce qui m'a permis de faire la carte.
These GPS recorders -- really cool.
existent -- vraiment cool.
walking around with hard drives
se promènent avec des disques durs
to make it public --
you could get to it,
walking around with hard drives.
trimbalent des disques durs.
is behind a FOIL Request.
sont déjà à disposition.
dangerous intersections in New York City
intersections de NY enregistrant le plus
les plus dangereuses.
the East side of Manhattan,
que la portion est de l'île,
has more cyclist accidents.
ville, enregistre le plus d'accidents.
coming off the bridges there.
sortent du pont à cet endroit.
comme Williamsburg,
There's Roosevelt Avenue in Queens.
méritent notre attention.
we need for Vision Zero.
dont Vision Zero a besoin.
behind this data as well.
il y a une histoire
and paste data out of a PDF
collé des données d'un PDF,
than knew the logo. I like that.
qu'à reconnaître le logo. Intéressant.
that you just saw was actually on a PDF.
se trouvaient à l'origine dans un PDF.
plusieurs centaines de pages
and hundreds of pages of PDF
you would either have to copy and paste
deviez faire du copier-coller,
I'm going to write a program.
mais plutôt créer un programme,
and it would download PDFs.
pour y dénicher des PDF.
if it found a PDF, it would download it
trouve et télécharge des PDF,
some PDF-scraping program,
and then people could make maps like that.
l'on puisse faire des cartes.
the fact that we have access to it --
du tableau est un accident.
is a row in this table.
have access to that is great,
accès est formidable,
write PDF scrapers.
le moyen de les en extraire.
of our citizens' time,
the de Blasio administration
que l'administration Blasio
a few months ago,
actually have access to it,
still entombed in PDF.
is still only available in PDF.
our own city budget.
de notre propre ville.
right now in PDF form.
disponible qu'en format PDF.
that can't analyze it --
seuls que cela embête.
who vote for the budget
qui votent le budget,
the budget that they are voting for.
analyser le budget qu'ils votent.
a little better than that as well.
pouvons faire un peu mieux que cela.
that's not hidden in PDFs.
pas cachées dans des PDF.
in New York City.
les plus sales de New York.
of fecal coliform,
de coliformes fécaux,
in each of our waterways.
dans chacune de nos voies d'eau.
the dirtier the water,
plus l'eau est sale,
the small circles are cleaner.
Ce que vous voyez ce sont
by the city over the last five years.
recueille depuis cinq ans.
in general, dirtier.
généralement plus sales,
And I learned a few things from this.
grâce à cette carte.
that ends in "creek" or "canal."
dans un « creek » ou un « canal ».
the dirtiest waterway in New York City,
de New York est Coney Island Creek,
the Coney Island you swim in, luckily.
Island où vous vous baignez.
of samples taken over the last five years
échantillons prélevés depuis cinq ans
to swim in the water.
impropre à la baignade.
that you're going to see
de faits que les rapports
the front page on nyc.gov.
du nyc.gov, non?
to that data is awesome.
ces données est génial.
on the open data portal.
dans le portail des
a year or a few months.
un an ou quelques mois.
of Environmental Protection's website.
du DEP de la ville de NY.
sheet, and each Excel sheet is different.
différent, avec des titres différents.
you copy, paste, reorganize.
c'est bien, mais encore une fois,
and that's great, but once again,
ville et établir des normes.
as a city, we can normalize things.
Web comme celui de Socrata
there's this website that Socrata makes
qui ne souffrent pas
that don't suffer
cesse de croître.
and that's great.
que vous voulez dans une foule
be it CSV or PDF or Excel document.
PDF, XLS ou autres.
you can download the data that way.
codes their addresses differently.
le même d'un organisme à l'autre.
intersection street,
building address.
ou adresse postale.
even when we have this portal,
du temps, car vous devez
normalizing our address fields.
of our citizens' time.
chats à fouetter.
we can get more maps like this.
à créer plus de cartes.
in New York City,
bornes d'incendie de NY,
hydrants in terms of parking tickets.
plus grand nombre de contraventions.
and I really like this map.
grâce à cette carte.
on the Upper East Side.
pas dans l'Upper East Side.
you park, you will get a hydrant ticket.
garerez, vous aurez un ticket.
grossing hydrants in all of New York City,
bornes les plus lucratives pour la ville,
55,000 dollars a year in parking tickets.
par année en contraventions.
to me when I noticed it,
what you had is a hydrant
et j'ai découvert
a curb extension,
space to walk on,
and the hydrant --
painted there beautifully for them.
dessinées au sol et se gare.
disagreed with this designation
les choses du même œil, lui
who found a parking ticket.
à avoir remarqué cela.
Street View car driving by
on I Quant NY, and the DOT responded,
à la suite de quoi le DOT m'a répondu,
any complaints about this location,
aucune plainte au sujet de
and make any appropriate alterations."
revoir le marquage au sol. »
typical government response,
réponse typique,
something incredible happened.
chose extraordinaire s'est produite.
the future of open data,
de l'ouverture des données,
ticketed, and it was confusing,
recevaient un ticket sans comprendre,
they told the city, and within a few weeks
en a fait part à la ville et en quelques
see open data as being a watchdog.
voient là un rôle de cerbère.
to be better partners for government,
partenaires du gouvernement,
being FOILed over and over again,
a sign that it should be made public.
qu'elles devraient l'être.
releasing a PDF,
oblige les organismes
to post it with the underlying data,
ligne des PDF à joindre à ceux-ci
is coming from somewhere.
celles-ci proviennent
coming from somewhere,
some open data standards.
sur les données ouvertes
here in New York City.
normalizing our addresses.
a leader in open data,
des données ouvertes
and set an open data standard,
des normes en la matière
and maybe the federal government,
le gouvernement fédéral, voire d'autres
aurons un programme qui pourra
where you could write one program
données de 100 pays.
nous y sommes presque.
We're actually quite close.
empowering with this?
le pouvoir?
and it's not just Chris Whong.
John Krauss et de Chris Whong,
going on in New York City right now,
centaines de Meetup actifs
à participer à ces réunions.
attending these meetups.
travail et les weekends,
and on weekends,
données et améliorer la
to look at open data
semaine dernière a lancé citygram.nyc,
released something called citygram.nyc
to 311 complaints
abonner à un bulletin des
or around your office.
reçoit au 311 dans un
you get local complaints.
ou de votre travail.
that are after these things.
techno que cela intéresse.
the students I teach at Pratt.
étudiants, les défenseurs
set of backgrounds.
Tout le monde s'y intéresse.
and the ability of our citizens
citoyens et leur permettent
and make our city even better,
améliorer notre ville,
or one parking spot at a time.
une place de stationnement à la fois.
ABOUT THE SPEAKER
Ben Wellington - Data scientistBen Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.
Why you should listen
Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)
Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.
Ben Wellington | Speaker | TED.com