Как правительство готовит почву для украинских bigdata-стартапов
21 октября Кабмин планирует рассмотреть проект доработанного постановления о правилах публикации открытых государственных данных. Если Кабмин утвердит постановление, то в ближайшее время в Украине заработает единый портал (data.gov.ua), на котором ведомства будут обязаны публиковать данные из своих реестров, а позже и нецифровые документы. Обязательное условие публикации - все массивы данных должны быть машиночитаемыми. Только тогда предприниматели смогут использовать их в интернет-приложениях, работающих по технологии Bigdata (программная обработка больших массивов данных).
Согласно прогнозам исследовательской компании Bigopendata.eu, к 2020 году использование открытых данных принесет компаниям Европы и сэкономит государствам 206 млрд евро. Руководитель общественной организации SocialBoost, советник премьер-министра по вопросам открытых данных Денис Гурский рассказал в блицинтервью для ЛІГА.net, какие документы окажутся на новом украинском портале, сколько этот проект стоит государству и как повлияет эта реформа на экономику нашей страны.
- Когда будет подписано постановление Кабмина, которое обяжет все министерства публиковать информацию на едином портале открытых данных data.gov.ua, а также на своих сайтах в машиночитаемом виде?
- Поскольку оно уже завизировано большинством министерств, думаю, что по нему вопросов возникать не должно. Тем более это же премьерская инициатива. Решение появится очень скоро.
- Как финансируется проект?
- Пока что он финансируется так же, как и большинство наших государственных IT-проектов: за счет грантовых денег. А на следующий бюджетный год, наверно, будут уже предусмотрены какие-то финансы. Пока бюджет еще формируется, и даже проекта я никакого не видел. Госагентство по электронному управлению уже подало свои предложения, сколько им денег нужно на поддержку сайта единого портала открытых данных, на новых людей в министерствах, которые будут ответственны за публикацию открытых данных. Этому агентству мы передали data.gov.ua в управление.
- Какие сейчас гранты привлечены в проект?
- Из того, что я знаю, государство само на себя ничего не получало. Наша общественная организация SocialBoost год назад получила гранты от фонда "Видродження" и программы развития ООН. За эти деньги при поддержке Microsoft мы разработали портал открытых данных и провели кампанию по поддержке Закона "Об открытых данных".
- Сколько в общем было средств?
- Примерно $100 000.
- Как будет дальше развивать портал открытых данных Госагентство по вопросам электронного управления?
- Они поставили его себе на баланс. У них, я так понимаю, еще есть бюджетные средства на его доработку. Поэтому будут еще его допиливать. Сам портал уже функционирует. Как только будет принято постановление Кабмина, каждое министерство получит на портале свои аккаунты и будет выкладывать обязательные к публикации данные, а также то, что еще считает нужным. Мое ощущение, что необходимо разбить проект на несколько этапов. Во время первого нужно публиковать те данные, которые собираются и хранятся в структурированном цифровом формате (базы данных, например). Они уже упорядочены в министерствах. Следующая волна - это документы, которые собираются и хранятся в цифровом виде, но не упорядочены и пока не машиночитаемы. Это, условно говоря, PDF-файлы, Word-файлы. И третья, самая дорогостоящая и сложная волна - это перевод в цифру всего того, что собирается госорганами в бумажном виде.
- Сколько нужно людей в каждом министерстве, чтобы такие проекты вести?
- По опыту пяти месяцев, в каждом из них должен быть один сильный координатор. Он должен разбираться и в бюрократии, и в работе с данными, и в статистике, и в ИТ, и в антикоррупции. Тот, кто мог бы здраво мыслить и в общем оценивать необходимость открытия тех или иных массивов данных. На сегодня в трех первых министерствах - в Министерстве инфраструктуры, Минэкономразвития и Минфине - уже проводится аудит, для того чтобы ответить на вопрос, какие вообще данные собираются и хранятся, потому что сами министерства зачастую не имеют целостной картины. Плюс ко всему, у самих министерств данных часто меньше, чем у госпредприятий, которые под ними находятся. А те вообще не особо счастливы, когда им говорят открывать какие-то данные и делиться ими.
- Но постановление Кабмина обяжет их это делать?
- Министерства внутри себя инициируют внутренние распоряжения о том, какие данные и какие госпредприятия должны открывать. А наш аудит позволит получить консолидированные списки, в которых можно будет просто поставить галочки напротив тех наборов данных, которые интересны общественности и бизнесу. На этой неделе был тренинг для предприятий Мининфраструктуры. Их около 60, включая и Укрзализныцю, и Укрпошту. И я был удивлен, что они поняли, в чем смысл нового закона. На открытых данных можно разрабатывать новые приложения и сервисы. И они собираются выходить с какими-то идеями. Получается, что госпредприятия уже смотрят на прикладную часть вопроса, и это хорошо. По крайней мере, мы нашли мотиватор для того, чтобы госпредприятия начали открывать больше данных.
- Есть ли какие-то оценки, во сколько обойдется поддержка проекта по открытым данным в следующем году?
- Поскольку мы говорим о работе с базами данных, то на них идет серьезная нагрузка и с серверами будет очень сложно. Если купить сразу много серверов, то они часто будут простаивать. На данный момент портал развернут в бесплатном облаке Microsoft. Я очень надеюсь, что в скором времени закон об облачных технологиях будет принят, и государство сможет официально их использовать для работы со своей информацией. Мы просчитывали необходимые затраты на поддержку портала в облаке - это около одного миллиона гривен в год. И плюс затраты людей, которые в министерствах систему будут поддерживать.
- Какие данные будут обязаны публиковать министерства?
- В постановлении прописано 320 наборов данных, некоторые их них являются целыми реестрами. Оно формировалось из того, что можно легко открыть.
- Какие интересные данные будут обнародованы и доступны для программной обработки? Можете несколько примеров привести?
- Реестр юрлиц и ФЛП, реестр административно-территориального устройства, реестр патентов Украины, реестр медицинских препаратов, реестр отпускно-оптовых цен на медицинские препараты, информация о концентрации ДТП на дорогах, финансовые планы госпредприятий Мининфраструктуры, реестр детсадов, единый реестр спортивных сооружений, кадастр месторождений полезных ископаемых Украины.
- Какая польза экономике в целом от открытия данных?
- Весь процесс в Украине начал двигаться в прошлом году, когда по заказу Microsoft в Варшаве экономический институт провел исследование на тему экономического эффекта от этого процесса. Они вывели средние показатели по ЕС. В итоге получилось, что экономика ЕС получит два процента дополнительно к ВВП через 5 лет из-за открытия данных. Во-первых, за счет экономии средств и принятия аргументированных решений на основе данных в государстве. Во-вторых, появится большое количество приложений. Это стартапы, работающие на базе открытых данных и генерирующие новые налоговые поступления. Наибольшими бенефициарами в этом процессе являются те отрасли, которые на сегодняшний день наименее цифровизированы, но при этом обладают наибольшим количеством данных. Это агросектор, энергетика и управление инфраструктурой.
- Какие вы можете назвать сервисы, которые появятся после открытия данных?
- Геймификация энергопотребления. Это система поощрения предприятий за энергоэффективность: они в игровой форме собирают баллы и получают вознаграждения. Или, например, прогнозные сервисы для фермеров, которые позволяют правильно спланировать посевные площади и культуры, основываясь на предыдущих данных и климатических прогнозах, а также на прогнозах госзакупок по разным культурам. Мы выяснили, что большинство украинских фермеров, у которых площадь угодий больше 5 000 га, пользуются планшетами, но пока только с одной-единственной целью: посмотреть по GPS месторасположение тракторов и комбайнов. Они не пользуются специальными приложениями, которые автоматизируют их бизнес. А теперь такой шанс появится. На основе данных Минагрополитики такие сервисы будут возникать.
В сфере инфраструктуры появятся приложения по оптимизации транспортных маршрутов. Неожиданная вещь: оказалось, у Укрзализныци в распоряжении есть набор данных, который почему-то закрыт, хотя и не секретный. Это GPS-координаты и часы работы всех станций, а также их пассажиропоток, плановые техработы. Мне кажется, если какой-то предприниматель занимается розничной торговлей на вокзалах, то это просто золотой набор данных. Он позволит правильно масштабировать бизнес. Я уверен, украинские предприниматели быстро разберутся, что к чему. И самое важное - не уедут после этого в Кремниевую долину, а создадут добавленную стоимость, которая останется здесь.
- Если заработает портал и все органы будут публиковать свои данные, то что в таком случае делать Госстату?
- Вся статистика должна быть приведена в машиночитаемый вид. В том числе и Госстата. Иначе с ней нет смысла работать. Я не думаю, что его функции другие министерства будут дублировать. В ближайшее время станет понятно стратегически, как к Госстату подойти.