Vitaly Vlasov

Vitaly VlasovOpen Data Hackathon 6-7 октября

image 6 по 7 октября пройдет Open Data Hackathon. Мы соберемся в уютном офисе 2Nova Interactive в «Ткачах», чтобы в течении 24 часов разрабатывать прототипы сервисов на основе открытых гос. данных и Semantic Web. Для этого мы пригласили экспертов в этой области: Питера Мику (Yahoo), Серна Ауэра (Лейпцигскмй Университет), директора представительства W3C в России, Владимира Горового (Яндекс.Услуги) и других.

Это будет отличный способ пообщаться с иностранными коллегами-программистами, узнать о новых технологиях и опробовать их на практике. Все разработанные прототипы вы сможете продемонстрировать на демофесте, на который приглашены также инвесторы и представители комитетов Администрации СПб. Также будут призы от организаторов, пицца, чай, кофе, игры и отличная рабочая атмосфера! Подробнее о мероприятии можно прочитать тут, и зарегистрироваться. Ниже написано почему стоит посетить это мероприятие и какие сервисы можно сделать, откуда можно брать данные и предложены идеи проектов.

От хакатона до миллиона

image

Сегодня во всем мире сотни программистов разрабатывают собственные общественно-значимые приложения и городские сервисы на основе открытых государственных данных. В течении 3 лет в «Большом Яблоке» (Нью Йорк) проходит BigApps 3.0 - конкурс приложений на основе открытых городских данных, направленных на улучшение жизни в городе. Чем Санкт-Петербург хуже? Ничем, говорим мы и наши разработчики не хуже. Правда данных у нас выложено разве что поменьше.

Создатели сервисов могли использовать нью-йоркский портал открытых данных. Огромное количество данных, собранных в одном месте: от данных расписания движения городского транспорта, результаты инспекций ресторанов, городские развлекательные мероприятия, информация по выборам, карта потребления электроэнергии по районам и многое другое!

Зачем разработчики участвуют в этом конкурсе? Конечно призовой фонд, размером в $50 000 – весомая причина. Однако наиболее ценным является опыт, продвижение своего проекта и возможность продемонстрировать себя инвесторам. Одной из таких историй успеха стало приложение MyCityWay, который вначале получил $5000 в качестве приза, потом $300 000 венчурного финансирования, а потом — пятимиллионный контракт с BMW. А всего уже выложено около 100 приложений.

Другой известный пример «городского» сервиса SeeClcikFix, который позволяет отмечать городские проблемы на карте. Этот сервис уже привлек $ 1,5 млн. инвестиций.

Мы убеждены, что нет смысла разработчикам создавать клоны сервисов коллективных покупок или каких-то иных, имеющих сотни аналогов по всему миру – надо создавать что-то новое и востребованное. И выбранная тема Хакатона на наш взгляд является таковой. Отличным примером является новосибирский «городской» проект карты ДТП, который получил премию 7500 евро и занял 1 место на конкурсе Data Journalism Awards-2012 в Париже. Это отличный повод заявить о себе и привлечь инвестиции!

Завизуализируй!

Сегодня очень популярны инфографики, да и вообще разные виды визуализаций. Вот еще один пример приложения на основе открытых данных, красивейшее приложение, разработанное в Google, которое визуализирует данные по продаже оружия в мире. image

Для таких задач используются данные из сторонних открытых источников. Мы к примеру нашли такие данные, а соединив их с возможностями Google Chrome – получаем очень эффектный мэшап! Об этом приложении также есть небольшая статья на Хабре. Большая коллекция фреймворков и решений для мэшапов собрана на этом сайте.

Что же можно сделать на Хакатоне?

Для российских разработчиков, пока еще не искушенных в этой сфере, пожалуй это главный вопрос! Ниже перечислены идеи для проектов, а также известные источники данных. В комментариях напишите свои идеи. Если вы хотите принять участие, но у вас возникают сложности с поиском источников данных – также напишите в комментариях, мы поможем.

Геосервисы и использование карт

Используйте карты OpenStreetMap, Google или Яндекс, чтобы наложить на них данные. Что это могут быть за данные и откуда их брать? Например, данные о ДТП, данные о расходах и доходах регионов, чиновников (по регионам, городам), данные о движении транспорта. Список основных источников подобных данных можно найти в конце статьи. Примеры существующих сервисов:

Использование API открытых сервисов, веб-сервисов WSDL, REST и прочее.

Использование структурированных данных

Таких как XML, CSV. Это значительно облегчает получение данных, но не так удобно как при наличии API.

  • Большое количество данных выложено на сайте проекта Ивана Бегтина http://opengovdata.ru.
  • На сайте «Декларатор» можно найти данные по доходам чиновников http://declarator.org,
  • сведения обо всех существующих/не существующих адресах в Российской Федерации http://fias.nalog.ru/Public/NewsPage.aspx.
  • Единая межведомственная информационно-статистическая система http://www.fedstat.ru/indicators/start.do

Данные в формате Semantic Web

OWL, RDF, SPARQL и другие технологии. Это наиболее продвинутый способ публикации данных, имеющий большие возможности, в том числе делать SQL-запросы к массивам данных и применение онтологий.

Извлечение данных. Data mining. Неструктурированные данные.

Даже если данные не выложены в структурированном виде (XML, Semantic Web), можно получать их используя стандартные методы извлечения данных из документов, опубликованных в сети. К счастью таких данных огромное количество. К примеру, с сайта Центризбиркома или иных гос. учреждений, порталов статистики. Например, можно проанализировать итоги выборов, используя в том числе оппозиционные сайты, которые изобилуют данными о нарушениях. Используя данные ЦИКа был создан такой мэшап по результатам выборов в Думу в 2011 году.

Социальные мэшапы

Можно использовать социальные сервисы, такие как Facebook, Twitter, например для анализа того, что пишут наши чиновники, и другой информации. Пример приложения «О чем говорят конгрессмены в Твиттере» я уже приводил выше. Есть и более глобальные проекты, например OpenCongress. Но это явно не для 24 часов работы! Для поиска подходящих технологий для мэшапов можно использовать ресурс Programmable Web.

Создание полезных инструментов для разработчиков

Например, парсеров данных. Известно, что у нас опубликовано большое количество данных, однако большинство из них не структурировано, что усложняет работу с ними. На портале OpenGovData команда энтузиастов создали подобные парсеры – вы можете помочь проекту. Большая работа была проделана разработчиками Артемием Трегубенко, Александром Мальцевым, Виктором Миреевым, Иваном Бегтиным, Алексеем Капрановым и другими. Вы можете стать следующим! Посмотрите какие общественно-значимые сервисы в России уже созданы на сайте Gov2People. Итак, если у вас есть идеи проектов, или желание поработать в команде, или вы хорошо разбираетесь в данных/хотите разобраться – приглашаем на сайт http://hackgovernment.ru. Там же можно найти контакты организаторов.

Регистрация на мероприятие.

Комментарии