Ben Wellington: How we found the worst place to park in New York City -- using big data
بين ويلينقتون: كيف اكتشفنا أسوء موقف سيارات في مدينة نيويورك باستخدام البيانات مفتوحة المصدر.
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data. Full bio
Double-click the English transcript below to play the video.
the infrastructure of New York City.
البنية التحتية لمدينة نيويورك
of our infrastructure.
released in reports by city agencies.
في التقارير الحكومية.
of Transportation will probably tell you
of subway track there are.
13,500 taxis here in New York City.
هنا في نيويورك
where these numbers came from?
عن مصدر هذه الأرقام؟
someone at the city agency
لشخص ما في مكتب المدينة
that somebody might want want to know.
قد يرغب البعض بمعرفته.
that our citizens want to know.
will have numbers like this.
all of our questions?
an infinite number of questions
عدد لا نهائي من الأسئلة
and I think our policymakers realize that,
واعتقد أن صانعي القرار يعلمون ذلك،
signed into law what he called
بلومبيرج قانونا ما سماه
open data legislation in the country.
الأكثر طموحا وشمولا في البلد.
the city has released 1,000 datasets
1000 مجموعة بيانات
the number of cabs,
When is rush hour exactly?
متى ساعة الذروة بالضبط؟
these cabs aren't just numbers,
هذه ليست مجرد أرقام
driving around in our city streets
تسير في شوارع مدينتا
and I looked at that data,
و قد نظرت الى تلك البيانات،
taxis in New York City throughout the day.
سيارة الاجرة في مدينة نيويورك طوال اليوم.
to around 5:18 in the morning,
من منتصف الليل الى 5:18 صباحا،
things turn around,
وعند هذه النقطة، تنعكس القراءة
until about 8:35 in the morning,
11 and a half miles per hour.
miles per hour on our city streets,
هو 11.5 ميل في الساعة،
there's no rush hour in New York City.
ساعة ذروة في نيويورك.
for a couple of reasons.
this might be pretty interesting to know.
سيبدو ذلك مهماً لمعرفته.
4:45 in the morning and you're all set.
الساعة 4:45 صباحاً لتكون مستعداً.
just available, it turns out.
a Freedom of Information Law Request,
قانون طلب تحرير المعلومات،
Taxi and Limousine Commission website.
على موقع لجنة سيارات الأجرة والليموزين.
you need to go get this form,
يجب عليك ملء هذا النموذج،
did exactly that.
قام تماماً بذلك.
down to our office,
صلبا جديدا إلى مكتبنا
we'll copy the data and you take it back."
سنقوم بنسخ البيانات و من ثم نعيده لك".
who wants to make the data public,
إتاحة هذه البيانات للعامة.
and that's where this graph came from.
ومنها تم رسم هذا المخطط..
These GPS recorders -- really cool.
مسجلات المواقع الملاحية هذه رائعة حقا.
walking around with hard drives
يتجولون حاملين أقراص صلبه،
to make it public --
من وكالات المدينة بغرض نشرها للعامة،
you could get to it,
يمكنك الوصول إليها،
walking around with hard drives.
يتجولون حاملين أقراص صلبة.
is behind a FOIL Request.
من خلال نموذج الطلب FOIL.
dangerous intersections in New York City
أكثر التقاطعات خطورة في نيويورك
the East side of Manhattan,
الجانب الشرقي من مدينة "مانهاتن"
has more cyclist accidents.
يحوي الجزء الأكبر من حوادث الدراجات.
coming off the bridges there.
There's Roosevelt Avenue in Queens.
we need for Vision Zero.
behind this data as well.
and paste data out of a PDF
than knew the logo. I like that.
أكثر من معرفة الشعار. أحب ذلك.
that you just saw was actually on a PDF.
كانت في الأساس بصيغة بي دي إف.
and hundreds of pages of PDF
من صفحات البي دي إف
you would either have to copy and paste
I'm going to write a program.
ولكن سأقوم بانشاء تطبيق.
بيانات شرطة نيويورك.
الإلكتروني، ويقوم بتحميل ملفات بي دي إف.
and it would download PDFs.
if it found a PDF, it would download it
بي دي إف يقوم البرنامج بتحميله.
some PDF-scraping program,
and then people could make maps like that.
حينها نستطيع عمل خرائط كهذه.
the fact that we have access to it --
is a row in this table.
have access to that is great,
الوصول لهذه البيانات لهو شيء عظيم،
write PDF scrapers.
برمجيات لهذه الملفات.
of our citizens' time,
the de Blasio administration
a few months ago,
actually have access to it,
still entombed in PDF.
مدفونة في ملف بي دي إف.
is still only available in PDF.
ما زال متوفرا فقط بصيغة بي دي إف.
our own city budget.
بل ميزانية المدينة أيضاً.
right now in PDF form.
فقط بصيغة بي دي إف.
that can't analyze it --
who vote for the budget
الذين صوتوا على هذه الميزانية
the budget that they are voting for.
فهم الميزانية التي يصوتون عليها.
a little better than that as well.
يمكننا تحسين ذلك قليلاً بالطبع.
that's not hidden in PDFs.
الغير محصورة بملفات بي دي إف.
in New York City.
الممرات المائية الأقذر في نيويورك.
of fecal coliform,
in each of our waterways.
في كل من هذه الممرات.
the dirtier the water,
the small circles are cleaner.
والأصغر هي أقل تلوثاً.
by the city over the last five years.
قامت بها المدينة خلال 5 سنوات.
in general, dirtier.
And I learned a few things from this.
و قد تعلمت عدة أمور من هذه البيانات.
that ends in "creek" or "canal."
ينتهي بقناة أو جدول مائي.
the dirtiest waterway in New York City,
وجدت أن أقذر ممر مائي في نيوروك،
the Coney Island you swim in, luckily.
وهو ليس الذي تسبحون فيه، لحسن الحظ.
of samples taken over the last five years
هذا الجدول خلال السنوات الخمس الماضية
to swim in the water.
من حيث المستويات المسموح السباحة فيها.
that you're going to see
the front page on nyc.gov.
to that data is awesome.
on the open data portal.
ليست ضمن مصدر بيانات مفتوح.
a year or a few months.
of Environmental Protection's website.
كانت في موقع إدارة حماية البيئة.
sheet, and each Excel sheet is different.
جداول حسابية وكل ملف مختلف.
you copy, paste, reorganize.
تقوم بنسخ ولسق وترتيب البيانات.
and that's great, but once again,
ولكن أيضاً،
as a city, we can normalize things.
يمكننا تعميم الأشياء.
there's this website that Socrata makes
بسبب الموقع الذي أسسه ساكروتا
العامة لمدينة نيويورك.
that don't suffer
and that's great.
be it CSV or PDF or Excel document.
سي إس في أو بي دي إف أو جداول.
you can download the data that way.
البيانات بتلك الطريقة.
codes their addresses differently.
ترميز مختلف لعناوينها.
intersection street,
building address.
والمبنى وعنوان المبنى.
even when we have this portal,
ستقضي الوقت رغم توفر هذه البوابة
normalizing our address fields.
of our citizens' time.
we can get more maps like this.
in New York City,
hydrants in terms of parking tickets.
من حيث مخالفات مواقف السيارات.
and I really like this map.
on the Upper East Side.
الجزء الشمالي الشرقي.
you park, you will get a hydrant ticket.
تحصل على مخالفة متعلقه بحنفيات الحريق.
grossing hydrants in all of New York City,
الإطلاق في نيويورك
55,000 dollars a year in parking tickets.
دولار سنوياً كمخالفات.
to me when I noticed it,
بعض الشيء حيث لاحظت ذلك.
what you had is a hydrant
وأتضح أنه ما يبدو أنه طفاية حريق
a curb extension,
space to walk on,
and the hydrant --
و الحنفية
painted there beautifully for them.
طلاؤه بشكل جميل لذلك.
فتخالفهم الرأي بمسمى هذه الموقف،
disagreed with this designation
who found a parking ticket.
Street View car driving by
on I Quant NY, and the DOT responded,
الخاصة فقامت إدارة المواصلات بالرد،
any complaints about this location,
أي شكاوى عن هذا الموقع،
and make any appropriate alterations."
و إجراء أي تعديلات بديلة."
typical government response,
something incredible happened.
the future of open data,
ticketed, and it was confusing,
وكانت ذلك محيراً،
they told the city, and within a few weeks
وأخبر المدينة، وخلال أسابيع قليلة
see open data as being a watchdog.
يرون أن البيانات العامة هي الحارس.
to be better partners for government,
ليكونوا شركاء أفضل للحكومة،
being FOILed over and over again,
تم نشرها للعامة،
a sign that it should be made public.
releasing a PDF,
تنشر بياناتك بصيغه بي دي إف،
to post it with the underlying data,
نشرها بالبيانات الدقيقة،
is coming from somewhere.
coming from somewhere,
some open data standards.
البيانات المفتوحة للعامة.
here in New York City.
normalizing our addresses.
في نشر البيانات المفتوحة.
a leader in open data,
في البيانات المفتوحة
and set an open data standard,
وضع معايير للبيانات المفتوحة،
and maybe the federal government,
أو ربما الحكومة الفيدرالية.
where you could write one program
حيث تستطيع كتابة برنامج مشترك
We're actually quite close.
نحن قريبون من ذلك حقاً.
empowering with this?
and it's not just Chris Whong.
جوهن كراوس او كريس وونج فقط
going on in New York City right now,
تجري في نيويورك حاليا،
attending these meetups.
and on weekends,
بعد العمل وفي عطلة الأسبوع،
to look at open data
released something called citygram.nyc
أطلقت الأسبوع الماضي موقع شكاوى نيويورك.
to 311 complaints
or around your office.
you get local complaints.
that are after these things.
خلف هذا المشروع،
the students I teach at Pratt.
set of backgrounds.
من مختلف الأعراق.
and the ability of our citizens
and make our city even better,
لجعل مدينتا أفضل،
or one parking spot at a time.
أو موقف سيارات وحيد.
ABOUT THE SPEAKER
Ben Wellington - Data scientistBen Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.
Why you should listen
Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)
Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.
Ben Wellington | Speaker | TED.com