Ben Wellington: How we found the worst place to park in New York City -- using big data
Бен Веллингтон: Как найти худшее место для парковки в Нью-Йорке, оперируя данными
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data. Full bio
Double-click the English transcript below to play the video.
the infrastructure of New York City.
инфраструктура Нью-Йорка.
of our infrastructure.
нашей инфраструктуры.
released in reports by city agencies.
увидеть в отчётах городских служб.
of Transportation will probably tell you
транспорта вам наверняка скажут,
они обслуживают.
of subway track there are.
километров подземки в городе.
13,500 taxis here in New York City.
около 13 500 такси.
where these numbers came from?
откуда берутся эти цифры?
someone at the city agency
кто-то должен был подумать:
that somebody might want want to know.
кому-то интересно.
that our citizens want to know.
понадобиться горожанам».
will have numbers like this.
с подобной статистикой.
all of our questions?
откуда им знать все наши вопросы?
an infinite number of questions
бесконечное количество вопросов,
and I think our policymakers realize that,
должностные лица это понимают,
signed into law what he called
утвердил закон, который он назвал
open data legislation in the country.
законопроектом об открытых данных в стране.
the city has released 1,000 datasets
1 000 массивов данных
the number of cabs,
When is rush hour exactly?
Так когда наступает час пик?
these cabs aren't just numbers,
это не просто циферки,
driving around in our city streets
которые разъежают по улицам города
and I looked at that data,
я их проанализировал
taxis in New York City throughout the day.
такси в Нью-Йорке в течение дня.
to around 5:18 in the morning,
с полуночи до 5:18 утра
things turn around,
until about 8:35 in the morning,
вплоть до 8:35 утра,
11 and a half miles per hour.
miles per hour on our city streets,
со скоростью 18,5 км/ч,
there's no rush hour in New York City.
«Кажется, в Нью-Йорке нет часа пик.
for a couple of reasons.
this might be pretty interesting to know.
движения, это должно быть вам интересно.
куда-то добраться,
4:45 in the morning and you're all set.
just available, it turns out.
в рамках Закона о свободе информации,
a Freedom of Information Law Request,
Комиссии по такси и лимузинам.
Taxi and Limousine Commission website.
вам надо получить этот бланк,
you need to go get this form,
всё это сделал.
did exactly that.
down to our office,
туда все данные и отдаём диск вам».
we'll copy the data and you take it back."
who wants to make the data public,
информацию публичной,
and that's where this graph came from.
в Интернете, и появился этот график.
These GPS recorders -- really cool.
Эти GPS-устройства — классная вещь.
walking around with hard drives
ходить с жёсткими дисками
to make it public --
чтобы опубликовать их —
you could get to it,
их же можно получить,
walking around with hard drives.
с жёсткими дисками.
is behind a FOIL Request.
dangerous intersections in New York City
перекрёстков в Нью-Йорке
the East side of Manhattan,
has more cyclist accidents.
множество ДТП с велосипедистами.
coming off the bridges there.
спускаются с мостов.
There's Roosevelt Avenue in Queens.
we need for Vision Zero.
в рамках программы Vision Zero.
behind this data as well.
and paste data out of a PDF
скопировать данные из PDF так,
из PDF, но не узнают логотип.
than knew the logo. I like that.
только что видели, были в формате PDF.
that you just saw was actually on a PDF.
and hundreds of pages of PDF
полиции Нью-Йорка,
you would either have to copy and paste
вам нужно или копировать их вручную
I'm going to write a program.
Лучше я напишу программу».
и скачивала PDF-файлы.
and it would download PDFs.
if it found a PDF, it would download it
и, если находила, скачивала их,
some PDF-scraping program,
and then people could make maps like that.
люди могли делать подобные карты.
the fact that we have access to it --
что мы можем работать с ними...
is a row in this table.
строка в этой таблице.
have access to that is great,
это отлично,
write PDF scrapers.
программы разбора PDF-файлов.
of our citizens' time,
задействовать горожан,
можем улучшить ситуацию.
the de Blasio administration
администрация де Блазио
несколько месяцев назад,
a few months ago,
actually have access to it,
нормальный доступ к ним,
still entombed in PDF.
сокрыто в PDF-файлах.
is still only available in PDF.
доступны только в формате PDF.
our own city budget.
right now in PDF form.
только в формате PDF.
проанализировать его,
that can't analyze it --
who vote for the budget
которые голосуют за бюджет,
the budget that they are voting for.
бюджет, за который голосуют.
a little better than that as well.
организовать всё гораздо лучше.
that's not hidden in PDFs.
не похороненных в PDF-файлах.
in New York City.
of fecal coliform,
фекальных бактерий,
in each of our waterways.
количество экскрементов в воде.
the dirtier the water,
the small circles are cleaner.
маленькие — вода почище.
by the city over the last five years.
последних пяти лет —
in general, dirtier.
And I learned a few things from this.
Из этой карты я сделал несколько выводов.
что называется «сток» или «канал».
that ends in "creek" or "canal."
the dirtiest waterway in New York City,
водосток в Нью-Йорке.
the Coney Island you swim in, luckily.
Кони-Айленд, где вы купаетесь, к счастью.
of samples taken over the last five years
в 94% образцов, взятых за пять лет,
уровень экскрементов,
to swim in the water.
that you're going to see
the front page on nyc.gov.
странице nyc.gov.
эти данные,— это очень круто.
to that data is awesome.
на портале открытых данных.
on the open data portal.
на портал открытых данных,
a year or a few months.
за год или за пару месяцев.
of Environmental Protection's website.
Департамента охраны окружающей среды.
sheet, and each Excel sheet is different.
все эти листы Excel — разные.
копировать, всё переделывать.
you copy, paste, reorganize.
and that's great, but once again,
такие карты, и это хорошо,
as a city, we can normalize things.
стандартизировать форму.
there's this website that Socrata makes
есть один сайт от Socrata,
that don't suffer
без тех недостатков,
and that's great.
и это прекрасно.
be it CSV or PDF or Excel document.
будь то CSV, PDF или Excel.
в удобном формате.
you can download the data that way.
codes their addresses differently.
кодирует адреса.
intersection street,
пересекающихся улиц,
building address.
номер дома, адрес дома.
даже используя этот портал,
even when we have this portal,
normalizing our address fields.
данные в адресных полях.
of our citizens' time.
использовать время горожан.
we can get more maps like this.
больше таких карт.
in New York City,
hydrants in terms of parking tickets.
за счёт штрафов за неправильную парковку.
and I really like this map.
мне она очень нравится.
on the Upper East Side.
you park, you will get a hydrant ticket.
вы заплатите за парковку у гидранта.
grossing hydrants in all of New York City,
гидранта во всем Нью-Йорке,
55,000 dollars a year in parking tickets.
в год в виде штрафов за парковку.
to me when I noticed it,
what you had is a hydrant
гидрант на краю тротуара,
a curb extension,
space to walk on,
and the hydrant --
painted there beautifully for them.
обозначающая парковочное место.
disagreed with this designation
Нью-Йорка не соглашалась с этой разметкой
who found a parking ticket.
эти штрафы за парковку.
Street View car driving by
View проезжает там
on I Quant NY, and the DOT responded,
и мне ответили из Департамента транспорта,
any complaints about this location,
жалоб по поводу этого места,
and make any appropriate alterations."
и внесём необходимые изменения».
typical government response,
«Типичная государственная отписка».
something incredible happened.
случилось кое-что невообразимое.
the future of open data,
эпоху открытых данных.
ticketed, and it was confusing,
штрафы, разметка была неоднозначной,
they told the city, and within a few weeks
городу, и в течение нескольких недель
see open data as being a watchdog.
данные как на механизм контроля.
to be better partners for government,
работать рука об руку с государством,
being FOILed over and over again,
что их запрашивают постоянно,
a sign that it should be made public.
вы ведь видите, что они востребованы.
releasing a PDF,
которое публикует PDF-файлы,
to post it with the underlying data,
данные, лежащие в основе PDF-файлов,
is coming from somewhere.
coming from somewhere,
но где-то вы их берёте, а значит,
some open data standards.
стандарты открытых данных.
here in New York City.
normalizing our addresses.
открытых данных.
a leader in open data,
в области открытых данных,
стандартизацией открытых данных,
and set an open data standard,
and maybe the federal government,
и, может быть, федеральное правительство.
where you could write one program
сможет написать программу,
We're actually quite close.
Мы довольно-таки близко.
empowering with this?
and it's not just Chris Whong.
going on in New York City right now,
attending these meetups.
на выходных,
and on weekends,
на открытые данные
to look at open data
недавно создала сайт www.citygram.nyc,
released something called citygram.nyc
to 311 complaints
на жалобы в службу «3-1-1»
or around your office.
you get local complaints.
жалобы в окрестностях.
that are after these things.
которых я учу в Институте Пратта.
the students I teach at Pratt.
set of backgrounds.
постепенных изменений
and the ability of our citizens
и дать горожанам возможность
and make our city even better,
и улучшать наш город,
or one parking spot at a time.
или об одном парковочном месте.
ABOUT THE SPEAKER
Ben Wellington - Data scientistBen Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.
Why you should listen
Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)
Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.
Ben Wellington | Speaker | TED.com