Ben Wellington: How we found the worst place to park in New York City -- using big data
Ben Wellington: Cách chúng ta tìm thấy nơi tệ nhất để đỗ xe trong thành phố New York - dùng dữ liệu lớn
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data. Full bio
Double-click the English transcript below to play the video.
the infrastructure of New York City.
cơ sở hạ tầng của New York.
of our infrastructure.
báo cáo của cơ quan thành phố.
released in reports by city agencies.
of Transportation will probably tell you
về số dặm đường ngầm.
of subway track there are.
cho ta thống kê.
taxi ở thành phố New York.
13,500 taxis here in New York City.
những con số này đến từ đâu?
where these numbers came from?
ai đó ở cơ quan thành phố
someone at the city agency
that somebody might want want to know.
con số mà ai đó rất muốn biết.
that our citizens want to know.
sẽ chứa những con số thế này.
will have numbers like this.
để họ biết tất cả các câu hỏi?
all of our questions?
chúng ta có vô số câu hỏi
an infinite number of questions
có thể theo kịp.
tôi nghĩ những nhà chính sách nhận ra,
and I think our policymakers realize that,
signed into law what he called
đã thông qua điều luật mà ông ấy gọi là
open data legislation in the country.
tham vọng và toàn diện nhất cả nước.
ông đã đúng.
the city has released 1,000 datasets
đưa ra 1,000 tập dữ liệu
the number of cabs,
nhiều thứ khác nhau.
When is rush hour exactly?
Khi nào mới đúng là giờ cao điểm?
these cabs aren't just numbers,
không chỉ là con số,
di chuyển trong thành phố
driving around in our city streets
and I looked at that data,
nhìn vào dữ liệu đó,
những chiếc taxi ở New York trong ngày.
taxis in New York City throughout the day.
đến khoảng 5:18 sáng,
to around 5:18 in the morning,
mọi thứ quay ngược lại,
things turn around,
until about 8:35 in the morning,
đến khoảng 8:35 sáng,
11 and a half miles per hour.
ở khoảng 11,5 dặm mỗi giờ.
miles per hour on our city streets,
11,5 dặm mỗi giờ trên phố
there's no rush hour in New York City.
giờ cao điểm ở New York.
for a couple of reasons.
Và điều này quan trọng vì một số lý do.
this might be pretty interesting to know.
điều này có thể rất thú vị.
một nơi thật nhanh,
lúc 4:45 sáng và sẵn sàng.
4:45 in the morning and you're all set.
những dữ liệu này.
just available, it turns out.
yêu cầu quyền tự do thông tin pháp luật,
a Freedom of Information Law Request,
web của Uỷ ban taxi và xe Limousine.
Taxi and Limousine Commission website.
bạn cần lấy được tờ đơn này,
you need to go get this form,
đã làm chính xác như thế.
did exactly that.
đến văn phòng của chúng tôi,
down to our office,
we'll copy the data and you take it back."
sẽ chép dữ liệu và bạn đến lấy về."
who wants to make the data public,
muốn công khai mọi dữ liệu,
sử dụng nó và đấy là lý do có biểu đồ này.
and that's where this graph came from.
Những người ghi GPS - vô cùng tuyệt.
These GPS recorders -- really cool.
mang theo những ổ cứng
walking around with hard drives
để công khai chúng -
to make it public --
bạn có thể tiếp cận chúng,
you could get to it,
đi khắp nơi với những chiếc ổ cứng
walking around with hard drives.
phù hợp yêu cầu FOIL.
is behind a FOIL Request.
dangerous intersections in New York City
nhất ở thành phố New York mà tôi đã làm.
the East side of Manhattan,
has more cyclist accidents.
số tai nạn xe đạp xảy ra cao hơn.
coming off the bridges there.
phóng xuống cầu ở đây.
rất đáng nghiên cứu.
Roosevelt Avenue ở Queens.
There's Roosevelt Avenue in Queens.
cho Vision Zero.
we need for Vision Zero.
thứ chúng ta đang tìm kiếm.
behind this data as well.
biết đến logo này ạ?
and paste data out of a PDF
dữ liệu từ một bản PDF
than knew the logo. I like that.
là biết về cái logo này. Tôi thích.
thực ra là từ một file PDF.
that you just saw was actually on a PDF.
and hundreds of pages of PDF
you would either have to copy and paste
bạn sẽ phải chép hoặc dán
Tôi sẽ viết một chương trình.
I'm going to write a program.
của Cục cảnh sát Hoa Kỳ
and it would download PDFs.
và tải về các tệp PDF.
if it found a PDF, it would download it
và tải về bất cứ tệp PDF nào xuất hiện
chương trình xuất thông tin
some PDF-scraping program,
and then people could make maps like that.
và ta có thể vẽ bản đồ bằng cách này.
mà chúng ta tiếp cận -
the fact that we have access to it --
là một hàng trong bảng này.
is a row in this table.
số lượng tệp PDF nhiều thế nào.
have access to that is great,
nguồn dữ liệu đó là một điều tuyệt vời,
dưới định dạng PDF,
write PDF scrapers.
chương trình xuất file PDF.
of our citizens' time,
có thể làm tốt hơn thế.
thị trưởng thành phố, ông Blasio
the de Blasio administration
khoảng vài tháng trước,
a few months ago,
actually have access to it,
mới có thể tham khảo nó,
bị chôn vùi dưới dạng PDF
still entombed in PDF.
is still only available in PDF.
chỉ có dưới dạng PDF.
our own city budget.
còn có ngân sách thành phố chúng ta.
right now in PDF form.
chỉ đọc được ở dạng PDF.
that can't analyze it --
không thể phân tích được -
who vote for the budget
người mà ủng hộ cho bản ngân sách
the budget that they are voting for.
phân tích bản ngân sách mà họ bầu cử.
a little better than that as well.
cũng chỉ làm tốt hơn một chút thôi.
that's not hidden in PDFs.
không còn ở dạng PDF.
mà tôi đã vẽ,
tại thành phố New York.
in New York City.
mức độ nhiễm trực khuẩn ruột,
of fecal coliform,
in each of our waterways.
có trong mỗi đường thuỷ này
the dirtier the water,
mức độ bẩn càng cao,
the small circles are cleaner.
vòng tròn bé là vùng nước sạch hơn.
đường thuỷ nội địa
by the city over the last five years.
của thành phố trong vòng 5 năm tới.
sẽ bẩn hơn.
in general, dirtier.
And I learned a few things from this.
Tôi cũng học được vài điều.
nào có chữ "lạch" hay "kênh".
that ends in "creek" or "canal."
the dirtiest waterway in New York City,
đường thuỷ bẩn nhất thành phố New York,
bằng cách này.
the Coney Island you swim in, luckily.
không phải Coney Island các bạn hay bơi.
được lấy trong vòng 5 năm nay
of samples taken over the last five years
to swim in the water.
theo điều luật của bang.
that you're going to see
trang nhất của nyc.gov.
the front page on nyc.gov.
là điều vô cùng tuyệt diệu.
to that data is awesome.
chuyện đó không dễ chút nào,
on the open data portal.
trong cổng thông tin.
trong vòng một năm hay vài tháng.
a year or a few months.
web của Cục bảo vệ Môi trường.
of Environmental Protection's website.
mỗi trang excel cũng khác nhau.
sheet, and each Excel sheet is different.
bạn sao, chép, sắp xếp lại.
you copy, paste, reorganize.
và điều này thật tuyệt, nhưng lần nữa,
and that's great, but once again,
ta có thể chuẩn hoá mọi thứ.
as a city, we can normalize things.
bởi đã có một trang do Socrata tạo
there's this website that Socrata makes
tôi đã đề cập,
that don't suffer
định dạng nào, CSV hay PDF hay Excel.
and that's great.
be it CSV or PDF or Excel document.
bạn muốn theo cách đó.
you can download the data that way.
những địa chỉ khác nhau.
codes their addresses differently.
intersection street,
building address.
toà nhà, địa chỉ toà nhà.
kể cả khi đã có cổng thông tin này,
even when we have this portal,
normalizing our address fields.
of our citizens' time.
we can get more maps like this.
nhiều bản đồ hơn nữa.
ở thành phố New York.
in New York City,
vòi chữa cháy thôi đâu.
hydrants in terms of parking tickets.
liên quan đến vé phạt đỗ xe.
and I really like this map.
bản đồ này, tôi thực sự rất thích.
on the Upper East Side.
you park, you will get a hydrant ticket.
thì cũng bị nhận vé phạt thôi.
grossing hydrants in all of New York City,
vòi nước máy lớn nhất New York,
55,000 đô la mỗi năm từ những vé đỗ xe.
55,000 dollars a year in parking tickets.
to me when I noticed it,
hoá ra vấn đề ở vòi nước máy
what you had is a hydrant
vỉa hè,
a curb extension,
space to walk on,
and the hydrant --
đỗ ở đây là ổn",
khéo léo để đỗ xe.
painted there beautifully for them.
và NYPD không đồng ý với lựa chọn này
disagreed with this designation
thẻ phạt này đâu.
who found a parking ticket.
Street View car driving by
I Quant NY, và Sở Giao Thông đã hồi âm,
on I Quant NY, and the DOT responded,
bất cứ phàn nàn nào về địa điểm này,
any complaints about this location,
and make any appropriate alterations."
cũng như tiến hành những thay đổi hợp lí."
typical government response,
điển hình của chính phủ,
vẫn tiếp diễn.
đã xảy ra.
something incredible happened.
thấy được tương lai của thông tin mở,
the future of open data,
điều đã xảy ra ở đây.
và chuyện cũng rối thêm,
ticketed, and it was confusing,
they told the city, and within a few weeks
họ báo lại với thành phố, chỉ trong vài tuần
see open data as being a watchdog.
chừng như khuyển canh nhà vậy.
việc trở thành một cộng sự.
to be better partners for government,
những cộng sự có ích cho chính phủ.
là một vài thay đổi.
being FOILed over and over again,
được yêu cầu nhiều lần,
dữ liệu cần được công khai.
a sign that it should be made public.
định công khai một bản PDF,
releasing a PDF,
người đăng phải ghi rõ dữ liệu gốc,
to post it with the underlying data,
is coming from somewhere.
dẫn nguồn từ đâu đó.
chắc sẽ có nguồn gốc,
coming from somewhere,
dưới dạng PDF.
tiêu chuẩn cho dữ liệu mở.
some open data standards.
tại thành phố New York.
here in New York City.
normalizing our addresses.
trong dữ liệu mở.
với thông tin mở,
a leader in open data,
và đặt tiêu chuẩn dữ liệu mở,
and set an open data standard,
Bang và thậm chí chính phủ sẽ tán đồng.
and maybe the federal government,
bạn có thể viết một chương trình
where you could write one program
Chúng ta thực sự tiến gần hơn.
We're actually quite close.
trao quyền cho ai?
empowering with this?
John Krauss hay Chris Whong.
and it's not just Chris Whong.
đang diễn ra ở thành phố New York,
going on in New York City right now,
attending these meetups.
hay vào các ngày cuối tuần,
and on weekends,
những thông tin mở
to look at open data
trở nên tốt đẹp hơn.
công khai một thứ gọi là citygram.nyc
released something called citygram.nyc
to 311 complaints
or around your office.
you get local complaints.
lời phàn nàn từ địa phương.
công nghệ mới dùng cách này.
that are after these things.
học sinh tôi từng dạy ở Pratt cũng dùng.
the students I teach at Pratt.
dành cho mọi người,
hoàn cảnh khác nhau.
set of backgrounds.
and the ability of our citizens
và năng lực của người dân
làm thành phố tươi đẹp hơn,
and make our city even better,
hay là một điểm đỗ xe đi chăng nữa.
or one parking spot at a time.
ABOUT THE SPEAKER
Ben Wellington - Data scientistBen Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.
Why you should listen
Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)
Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.
Ben Wellington | Speaker | TED.com