Ben Wellington: How we found the worst place to park in New York City -- using big data
Ben Wellington: Como conseguimos encontrar o pior lugar para estacionar em Nova York usando uma enorme base de dados
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data. Full bio
Double-click the English transcript below to play the video.
the infrastructure of New York City.
à infraestrutura de Nova York.
of our infrastructure.
de órgãos municipais,
released in reports by city agencies.
que orgulhosamente informa
of Transportation will probably tell you
das linhas do metrô.
of subway track there are.
fornece estatísticas.
de 13.500 táxis aqui em Nova York.
13,500 taxis here in New York City.
de onde esses números vêm?
where these numbers came from?
existirem, alguém na prefeitura
someone at the city agency
que alguém pode querer saber.
that somebody might want want to know.
querem saber.
that our citizens want to know.
will have numbers like this.
conhecem todas nossas dúvidas?
all of our questions?
um número infinito de perguntas
an infinite number of questions
and I think our policymakers realize that,
que nossos urbanistas percebem isso,
signed into law what he called
sancionou uma lei que chamou
open data legislation in the country.
legislação de dados abertos do país.
mil arquivos de dados nesse portal,
the city has released 1,000 datasets
the number of cabs,
When is rush hour exactly?
Qual é o horário de pico?
these cabs aren't just numbers,
esses táxis não são só números,
rodando por nossas ruas,
driving around in our city streets
and I looked at that data,
dos táxis em Nova York durante o dia.
taxis in New York City throughout the day.
até cerca das 5h18 da manhã,
to around 5:18 in the morning,
things turn around,
as coisas se invertem,
until about 8:35 in the morning,
até cerca das 8h35 da manhã,
11 and a half miles per hour.
em torno dos 17 km/h.
miles per hour on our city streets,
nas ruas da cidade,
existe horário de pico em Nova York,
there's no rush hour in New York City.
for a couple of reasons.
por diversas razões.
this might be pretty interesting to know.
deve ser bem interessante saber isso.
a um lugar rápido,
para 4h45 da manhã, e pronto.
4:45 in the morning and you're all set.
disponíveis dessa forma.
just available, it turns out.
legislação sobre liberdade de informação,
a Freedom of Information Law Request,
da Comissão de Táxis e Limusines.
Taxi and Limousine Commission website.
pegar este formulário,
you need to go get this form,
fez exatamente isso.
did exactly that.
down to our office,
ao nosso escritório,
we'll copy the data and you take it back."
os dados e você busca-o de volta".
tornar públicos esses dados,
who wants to make the data public,
e esse gráfico veio daí.
and that's where this graph came from.
Esses registros de GP: muito legais.
These GPS recorders -- really cool.
andar por aí com HDs,
walking around with hard drives
para torná-los públicos,
to make it public --
que públicos, acessíveis,
you could get to it,
andando por aí com HDs.
walking around with hard drives.
de uma solicitação de informação.
is behind a FOIL Request.
dangerous intersections in New York City
mais perigosos de Nova York,
the East side of Manhattan,
é o East Side de Manhattan,
has more cyclist accidents.
com maior número de acidentes.
mais ciclistas vindo das pontes.
coming off the bridges there.
e a Avenida Roosevelt, no Queens.
There's Roosevelt Avenue in Queens.
que precisamos para o "Vision Zero".
we need for Vision Zero.
behind this data as well.
and paste data out of a PDF
dados de um arquivo PDF
than knew the logo. I like that.
do que conhecem a logomarca. Gostei!
that you just saw was actually on a PDF.
de ver estavam em PDF.
de páginas em PDF
and hundreds of pages of PDF
you would either have to copy and paste
I'm going to write a program.
Vou escrever um programa."
and it would download PDFs.
if it found a PDF, it would download it
se encontrar um PDF, ele baixa,
some PDF-scraping program,
os dados do PDF,
and then people could make maps like that.
as pessoas possam fazer mapas assim.
the fact that we have access to it --
o fato de termos acesso a eles...
is a row in this table.
tabela é um acidente.
have access to that is great,
write PDF scrapers.
ter de extrair dados do PDF.
do tempo dos cidadãos,
of our citizens' time,
the de Blasio administration
é que a administração Blasio
a few months ago,
actually have access to it,
still entombed in PDF.
de dados escondidos em PDF.
is still only available in PDF.
estão disponíveis apenas em PDF.
our own city budget.
o próprio orçamento do município.
right now in PDF form.
apenas no formato PDF.
a não conseguir analisá-los.
that can't analyze it --
who vote for the budget
que votam o orçamento,
the budget that they are voting for.
analisar o orçamento que estão votando.
a little better than that as well.
um pouco melhor que isso.
that's not hidden in PDFs.
não escondidos em PDFs.
com as hidrovias mais sujas de Nova York.
in New York City.
of fecal coliform,
in each of our waterways.
em cada uma das nossas hidrovias.
the dirtier the water,
the small circles are cleaner.
e os menores, mais limpa.
by the city over the last five years.
pela prefeitura nos últimos cinco anos.
in general, dirtier.
em geral, mais sujas.
And I learned a few things from this.
E concluí algumas coisas daí.
que termine com "creek" ou "canal".
that ends in "creek" or "canal."
the dirtiest waterway in New York City,
mais suja de Nova York
the Coney Island you swim in, luckily.
felizmente, é do outro lado,
of samples taken over the last five years
tinham níveis fecais tão altos
to swim in the water.
nadar naquela água.
that you're going to see
divulgado num relatório municipal, né?
the front page on nyc.gov.
página do nyc.gov.
acessar esses dados é incrível.
to that data is awesome.
on the open data portal.
um ano ou poucos meses.
a year or a few months.
da Secretaria do Meio Ambiente.
of Environmental Protection's website.
Excel, e cada planilha é diferente.
sheet, and each Excel sheet is different.
você copia, cola, reorganiza.
you copy, paste, reorganize.
and that's great, but once again,
padronizando os dados.
as a city, we can normalize things.
há este site feito pela Socrata,
there's this website that Socrata makes
sem esses problemas que mencionei,
that don't suffer
o que é ótimo.
and that's great.
formato, CSV, PDF ou Excel.
be it CSV or PDF or Excel document.
do jeito que for melhor.
you can download the data that way.
codes their addresses differently.
os endereços de forma diferente.
intersection street,
nome da rua, cruzamento,
building address.
endereço do prédio.
even when we have this portal,
mesmo tendo o portal,
normalizing our address fields.
nossos campos de endereço.
de usarmos nosso tempo.
of our citizens' time.
nossos endereços
we can get more maps like this.
in New York City,
hydrants in terms of parking tickets.
campeões de multas de trânsito.
and I really like this map.
com este mapa, e realmente gosto dele.
on the Upper East Side.
no Upper East Side.
you park, you will get a hydrant ticket.
parar, vai levar uma multa de hidrante.
grossing hydrants in all of New York City,
campeões de multa em Nova York.
55,000 dollars a year in parking tickets.
em multas de estacionamento proibido.
to me when I noticed it,
e acontece que há um hidrante
what you had is a hydrant
a curb extension,
e depois um lugar para estacionar.
space to walk on,
and the hydrant --
"A vaga vai até lá, estou bem",
lá demarcada bonitinha.
painted there beautifully for them.
discorda dessa marcação e multa.
disagreed with this designation
who found a parking ticket.
ali com a mesma multa de trânsito.
Street View car driving by
on I Quant NY, and the DOT responded,
"I Quant NY", e o "DOT" respondeu:
qualquer reclamação sobre esse lugar,
any complaints about this location,
and make any appropriate alterations."
e fazer as alterações necessárias."
typical government response,
resposta típica do governo,
something incredible happened.
algo incrível aconteceu.
the future of open data,
o futuro dos dados abertos,
ticketed, and it was confusing,
levamos multas, e era confuso,
they told the city, and within a few weeks
avisou à prefeitura e, em poucas semanas,
see open data as being a watchdog.
Não é, tem a ver com parceria.
to be better partners for government,
melhores parceiros do governo.
só precisamos de algumas mudanças.
tiverem de requisitá-los todas as vezes,
being FOILed over and over again,
preciso torná-los públicos.
a sign that it should be made public.
liberando um PDF,
releasing a PDF,
to post it with the underlying data,
publicar isso com os dados originais,
não sei de onde,
is coming from somewhere.
coming from somewhere,
publicá-los em PDF.
padrões de dados abertos.
some open data standards.
endereços aqui em Nova York.
here in New York City.
pois somos referência nos dados abertos.
normalizing our addresses.
somos líderes absolutos nisso.
a leader in open data,
para os dados, outros vão nos seguir.
and set an open data standard,
o governo federal.
and maybe the federal government,
mas outros países poderiam seguir,
de escrever um programa
where you could write one program
Estamos bem perto disso, na verdade.
We're actually quite close.
empoderando com isso?
empowering with this?
and it's not just Chris Whong.
em Nova York agora mesmo.
going on in New York City right now,
de pessoas participando
attending these meetups.
analisando dados abertos,
and on weekends,
to look at open data
passada lançou o citygram.nyc,
released something called citygram.nyc
to 311 complaints
no site da prefeitura, por região.
or around your office.
you get local complaints.
e acessar as reclamações.
that are after these things.
que está atrás dessas coisas.
the students I teach at Pratt.
como meus alunos em Pratt,
cidadãos de diversos segmentos.
set of backgrounds.
pequenas, graduais,
and the ability of our citizens
e a habilidade de nossos cidadãos
and make our city even better,
e tornar nossa cidade ainda melhor,
or one parking spot at a time.
ou com um lugar para estacionar.
ABOUT THE SPEAKER
Ben Wellington - Data scientistBen Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.
Why you should listen
Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)
Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.
Ben Wellington | Speaker | TED.com