ОЦЕНКИ ДОСТОВЕРНОСТИ, ПОЛНОТЫ И ТОЧНОСТИ ДАННЫХ

ОЦЕНКИ ДОСТОВЕРНОСТИ, ПОЛНОТЫ И ТОЧНОСТИ ДАННЫХ

В рамках реализации приоритетной программы «Реформа контрольной и надзорной деятельности» (далее — приоритетная программа) необходимо сформировать новые улучшенные способы получения информации о целевых группах населения и предпринимателях, объектах контроля и состоянии подконтрольной среды, а именно обеспечить качество собираемых данных.

Целями формирования новых подходов являются получение достоверных и точных данных для их дальнейшего использования в контрольно-надзорной деятельности, создание возможности по их передаче между контрольно-надзорными ведомствами, что потребует унификации подходов к обеспечению их качества.

Задачи методических рекомендаций оценки достоверности, полноты и точности данных, используемых при расчете показателей результативности и эффективности контрольно-надзорной деятельности (далее — методические рекомендации) заключаются в выявлении основных пробелов в разрабатываемой ведомственной статистике, существующих в системах сбора и обработки данных.

В настоящих методических рекомендациях приведены следующие основные понятия, характеризующие качество собираемых данных.

Достоверность — сбор данных из первоисточника информации или их получение от органов власти, осуществляющих сбор данных непосредственно от первоисточника информации или организаций, для обеспечения достоверности осуществляющих введение реестров с необходимыми данными, при наличии стандартов сбора данных и их агрегирование, а также незаинтересованность источника информации в ее содержании. Существует подтверждение, что данные не были изменены при выполнении какой-либо операции над ними, будь то передача, хранение или публикация.

Точность — осуществление контроля качества сбора и формирования данных, а также приведение перечней допущений по использованию собираемых данных. В описании данных должны быть указаны их основные характеристики: охват, период сбора, периодичность обновления.

Полнота — при сборе данных охвачены все контрагенты, информация от которых должна быть получена, или в соответствующей методике указаны исключения из собираемой информации.

Дополнительные термины, используемые в настоящих методических рекомендациях:

административные данные — используемая при формировании официальной статистической информации документированная информация, получаемая федеральными органами государственной власти, иными федеральными государственными органами, органами государственной власти субъектов Российской Федерации, иными государственными органами субъектов Российской Федерации, органами местного самоуправления, государственными организациями в связи с осуществлением ими разрешительных, регистрационных, контрольно-надзорных и других административных функций, а также иными организациями, на которые осуществление указанных функций возложено законодательством Российской Федерации;

качество данных — характеристика данных, при которой они соответствуют установленным понятиям точности, достоверности и полноты и могут быть использованы для целей, в рамках которых они формировались;

агрегированные данные — данные, полученные путем присоединения различных данных в общую совокупность на основании установленных принципов ее формирования;

форма сбора информации — форма, утвержденная нормативным актом, содержащая основные поля для сбора информации и их описание;

(общий, собираемый, итоговый) файл данных — совокупность агрегированных данных по всем источникам по определенному принципу;

независимые источники данных — источники данных, не заинтересованные в результатах использования данных или у которых отсутствует «конфликт интересов» по собираемым данным;

деперсонализация данных — регламентированный процесс обезличивания персональных данных, необходимый для возможности их дальнейшего использования в статистических целях без ограничений, накладываемых на персональные данные;

территориальные параметры сбора данных — определенные на этапе сбора данных критерии отнесения информации по географическим границам или иным видам географического или административного деления в целях возможности дальнейшего сопоставления полученных данных;

период сбора — указывает период времени (год, полугодие, месяц и т.д.), необходимый для сбора данных, корректно отражающий процесс, информацию или сферу, характеристики которой будут рассматриваться при анализе данных.

Наличие, качество и иные характеристики используемых данных зависят в том числе от нескольких факторов, наиболее важными из которых являются:

1) законодательные и нормативно-правовые ограничения;

2) имеющиеся технические, коммуникационные и информационные ресурсы, в том числе базы данных;

3) используемые стандарты и методологические подходы к разработке ведомственной отчетности.

Существуют и другие факторы, которые могут негативно повлиять на сбор данных:

— компетентность персонала;

— конфликты интересов (те, кто собирает данные, также «оцениваются» на основе данных);

— институциональные стимулы (если достижение определенных уровней данных показателей влияет на бюджет или оценку эффективности агентства);

— технические трудности в надежном обнаружении измерения.

При анализе качества данных необходимо изучить каждый элемент данных, который планируется использовать в рамках управления контрольно-надзорной деятельностью.

Кроме того, необходимо внедрить непрерывную или периодическую оценку качества входящих данных. Эта оценка заключается в применении дополнительных гарантий и контроля при получении данных, сравнении с другими источниками или выборочных последующих исследованиях.