Главная » Новости » Как правительство открывает данные: второй месяц исполнения постановления

Как правительство открывает данные: второй месяц исполнения постановления

9165

First Truth&Transparency Committee продолжает отслеживать, как органы власти и госпредприятия открывают новые наборы данных. На этот раз речь пойдет об итогах второго месяца внедрения обновленной версии Постановления КМУ №835. А также проанализируем наиболее распространенные ошибки распорядителей при обнародованы открытых данных.

Уже прошло более двух месяцев после того, как в Украине начало действовать новое законодательство об открытых данных. Согласно постановлению КМУ № 1100 от 20.12.2017, перечень наборов расширился, а распорядители получили четкие инструкции по их публикации. По состоянию на 9 апреля центральные органы исполнительной власти и госпредприятия обнародовали менее половины предусмотренных наборов данных. Еще меньше датасета можно считать пригодными для практического использования. Теперь распорядители имеют лишь месяц для того, чтобы наверстать упущенное и исправить допущенные ошибки.

Итоги второго месяца

С 9 марта по 9-е апреля центральные органы исполнительной власти обнародовали 30 новых наборов данных. Таким образом, их общее количество выросло до 251 (45% от предусмотренного перечня). Среди 56 распорядителей, охваченных мониторингом, 12 обнародовали все наборы, 23 — не менее 1, а 21 распорядитель не обнародовало ни одного. Визуализация ниже показывает, сколько наборов данных необходимо обнародовать центральным органам исполнительной власти и госпредприятиям.

На ней мы показали тех распорядителей, которые должны обнародовать еще не менее 5 наборов данных. С полным перечнем можно ознакомиться в первичных данных мониторинга.

Наибольший рывок в публикации открытых данных сделала Государственная служба статистики. Ведомство обнародовало 17 классификаторов в машиночитаемом формате. Эти наборы могут выполнять функцию справочников для других наборов данных, которые используют, например, классификацию организационно-правовых форм или административно-территориальных единиц. Государственная фискальная служба и Государственное агентство рыбного хозяйства обнародовали по 4 набора данных. Это позволило им полностью выполнить нормы законодательства.

В общем, за март Единый государственный портал открытых данных пополнился информацией о зарегистрированных уголовных правонарушениях (Генеральная прокуратура Украины), налоговые проверки (Государственная фискальная служба Украины), запасы и использование рыбных ресурсов (Государственное агентство рыбного хозяйства Украины), тарифы (Национальная комиссия, осуществляющая государственное регулирование в сферах энергетики и коммунальных услуг).
4 типичные ошибки распорядителей на data.gov.ua

Сам факт публикации на портале открытых данных не делает автоматически данные открытыми. Они должны отвечать ряду качественных критериев, что позволит их анализ или использования е-сервисами. К сожалению, подавляющее большинство распорядителей допускают ошибки при обнародованы наборов. Рассмотрим самые распространенные из них.

Непонимание принципов открытых данных

Распространенными примерами непонимание принципов открытых данных является обнародование агрегированных (сводных) показателей, форм отчетности и веб-сервисов. Информация в таком формате может показаться распорядителям удобной, логичной и такой, что легко воспринимается. Веб-сервисы позволяют искать и визуализировать данные.

Однако, ценность открытых данных заключается в их первичной и детализированной форме. Именно поэтому, распорядители должны обнародовать первичные данные и экспортировать их из собственных информационных систем. Рассмотрим несколько примеров.

Генеральная прокуратура Украины обнародует информацию о зарегистрированных уголовные правонарушения и результаты их досудебного расследования. В наборе приведены общие показатели преступности по Украине, сгруппированные по месяцам. С такими данными невозможно ничего сделать, и нужны дополнительные запросы в ГПУ, чтобы понять, как толковать эти данные. Лучше подавать информацию о каждом зарегистрировано правонарушения отдельной записью в таблице.

Некоторые распорядители опубликовали ссылки на собственные веб-сервисы вместо наборов данных: Единый электронный реестр спортивных сооружений Министерства молодежи и спорта Украины, База данных специальных разрешений на пользование недрами от Государственной службы геологии и недр Украины, данные государственного мониторинга поверхностных вод от Государственного агентства водных ресурсов . В этих и других случаях необходимо перенести данные информационных систем, на основе которых построены сервисы, data.gov.ua, или предоставить пользователям доступ через API (прикладной программный интерфейс).

Некорректные форматы сохранения файлов

Прежде чем загрузить набор на data.gov.ua, необходимо определить тип данных и сохранить файл в корректном формате. Данные могут быть текстовыми, структурированными, графическими, геопространственными или иметь другие типы. В пункте 9 постановления КМУ №835 определены форматы для каждого из них.

Однако, как показывает практика, распорядители иногда допускают ошибки при определении типа данных и сохранении файлов. 35 из 251 (14%) обнародованных наборов данных на data.gov.ua имеют форматы, которые не соответствуют типу.

Преимущественно это структурированные данные, сохраненные в текстовых форматах, например, Реестр договоров о сотрудничестве территориальных общин в формате DOCX, или Лицензионный реестр субъектов туроператорской деятельности в формате PDF. Наибольшее количество таких наборов имеют Министерство экономического развития и торговли Украины — 6, Министерство социальной политики Украины — 4, Государственная служба специальной связи и защиты информации Украины — 4.

Другая проблема заключается в том, что в машиночитаемых форматах сохраняются неструктурированные данные. Некоторые распорядители просто выкладывают документы в том же виде, в котором готовят в рамках своей работы. Такую ошибку сделать в Реестре спортивных рекордов из признанных в Украине видов спорта, Информации о количестве проведенных плановых / внеплановых проверок и их результаты.

Документы Microsoft Excel содержат «шапку», поля для подписи и объединены клетки. Их нужно удалить перед тем, как превращать файл в CSV. В первой строке документа нужно оставить названия переменных, а во всех последующих — их значения. Только после этого файл можно сохранять.

Много путаницы возникает с кодировкой файлов.

Для публикации открытых данных нужно использовать кодировку UTF-8. Однако, распорядители часто сохраняют файлы с другим кодированием (обычно Cyrillic 1251). На иллюстрации ниже вы можете увидеть, как выглядит неправильно и правильно сохранены файлы.

Неустроенность наборов и ресурсов

Достаточно часто распорядители недооценивают важность выбора названия набора данных. По итогам мониторинга, названия 119 из 251 (47%) наборов данных, опубликованных на data.gov.ua, полностью или частично не совпадают с названиями из Перечня, определенного в постановлении КМУ №835. Такая практика затрудняет поиск для активистов и делает ненадежным применения автоматизированного сбора информации с сайта. Распорядителям желательно называть наборы в соответствии с перечнем, утвержденным Постановлением КМУ №835, или действовать в соответствии со стандартами.

Другая распространенная практика — обнародовать каждый новый файл отдельным набором данных. Например, Центральная избирательная комиссия обнародует каждый нормативно-правовой акт, как отдельный набор данных. На странице ведомства на data.gov.ua уже накоплено более 450 наборов и ресурсов.

Найти нужную информацию при таких обстоятельствах крайне сложно. Аналогичная ситуация и у Министерства инфраструктуры Украины (390 наборов данных и ресурсов), Государственного агентства рыбного хозяйства Украины (221), Государственной казначейской службы Украины (214), Государственной службы статистики Украины (134) и ряда других распорядителей. Для того, чтобы решить проблему, необходимо группировать подобные ресурсы в наборы данных, четко регламентировать процедуры обнародования и разъяснять их распорядителям.

Некорректное оформление ключевых слов

Лишь 78 из 251 (31%) наборов данных, опубликованных на data.gov.ua, имеют корректно сформулированы ключевые слова. Визуализация ниже демонстрирует самые распространенные ошибки.

Как видим, распорядители чаще всего переносят названия наборов данных в ключевых слов. Для того, чтобы правильно оформить ключевые слова, необходимо разделить название набора данных на слова и словосочетания, и выбрать из них наиболее сущностные.

Наибольшее количество наборов данных с ошибками в ключевых словах имеют Министерство инфраструктуры Украины — 22 Государственная фискальная служба Украины — 14 Государственная служба интеллектуальной собственности Украины — 12 и Государственная служба статистики Украины — 12 наборов данных.
выводы

В распорядителей открытых данных остается один месяц для того, чтобы выполнить нормы законодательства и обнародовать остальные наборов. Очень важно при этом уделять одинаковое внимание как количества, так и качества наборов. А для этого нужно четко осознавать основные принципы открытых данных и опираться на стандарты их обнародования.

Оставить комментарий

Ваш email нигде не будет показанОбязательные для заполнения поля помечены *

*