Качество официальной статистической информации - Медицинская статистика - Каталог статей - Управление здравоохранением
Главная » Статьи » Медицинская статистика

Качество официальной статистической информации

Источник: журнал «Медицинская статистика и оргметодработа в учреждениях здравоохранения».

Критерии оценки качества статистической информации могут быть выражены в терминах целостности, востребованности, точности и достоверности, своевременности, доступности, интерпретируемости и сопоставимости. Эти элементы качества должны учитываться и быть сбалансированными при планировании любых статистических исследований.

 

В современных условиях значение качества представления пользователям информации возросло значительно. Это обусловливается, во-первых, усложнением социально-экономических явлений и процессов, в которых «цена» ошибки при принятии управленческих решений или при сборе необходимых для их обоснования данных становится все выше.

Во-вторых, широкое применение экономико-математических методов и электронно-вычислительной техники, развитие интегрированных систем обработки данных, повышение комплексности их использования для решения различных задач предъявляют более высокие требования к качеству информации. Ошибка в исходных данных накапливается в последующих многократных вычислениях и может обесценить результаты сложных дорогостоящих расчетов.

В-третьих, проблемы качества данных заслуживают внимания потому, что проверка достоверности с ростом объемов обрабатываемых данных становится все более трудоемкой.

Одной из главных задач для эффективного управления в социально-экономической сфере является достижение приемлемого уровня качества представляемой пользователям статистической информации, что достигается путем регламентации основных понятий и требований, предъявляемых к качеству данных в системе государственной статистики.

В мировой статистической практике нет общепринятого определения качества данных как результата статистической деятельности. Тем не менее, в настоящее время установилось и превалирует понятие качества, основанное на оценке степени нужности статистических данных пользователям. Двумя другими компонентами современного понятия качества являются корректность применяемой статистической методологии (в том числе соответствие принятым международным стандартам и ее соблюдение органами статистики в процессе сбора, обработки, анализа и публикации данных.

Соответствующие аспекты качества могут быть выражены в терминах целостности, востребованности, точности и достоверности, своевременности, доступности, интерпретируемости и сопоставимости. Эти элементы качества должны учитываться и быть сбалансированными при планировании статистических программ.

ЦЕЛОСТНОСТЬ заключается в том, что статистическая деятельность должна основываться на научно обоснованной методологии и неукоснительном соблюдении утвержденных методик проведения обследований при сборе, обработке и распространении статистических данных. Этот термин охватывает институциональные основы, устанавливающие принцип объективности статистической деятельности и этические нормы, призванные гарантировать профессионализм при осуществлении планирования и проведении наблюдений, в том числе прозрачность используемой методологической базы.

Методологическая база статистической деятельности должна быть гармонизирована с принятыми международными стандартами и принципами ее использования в статистической практике.

ВОСТРЕБОВАННОСТЬ статистических данных представляет собой качественную оценку степени их нужности пользователям, т.е. насколько данные служат целям, ради которых были произведены, и доведены ли они до пользователя. Востребованность характеризует корректность поставленных цели и задач статистического исследования, их соответствия нормативно-правовой базе. При планировании статистической деятельности с учетом удовлетворения запросов пользователей необходимо учитывать стоимость и затраты времени на формирование данных, соответствующих ожиданиям пользователей.

ДОСТОВЕРНОСТЬ – это степень адекватности результатов статистических наблюдений (отклонение оценок параметров используемых статистических моделей от их истинных значений), характеризующих социально-экономические и демократические явления. В практических терминах не существует единой и полной меры достоверности результатов статистических наблюдений, поэтому используются несколько форм ее выражения.

Исходя из практической потребности, достоверность обычно измеряется или описывается в терминах ошибок (потенциальных величин ошибок), вводимых через индивидуальные главные источники погрешности расчетов, такие как неполнота охвата реальной генеральной совокупности, ошибки, связанные с выборкой, случаями неответов респондентов, умышленным искажением представляемой информации, а также статистической обработкой данных.

ТОЧНОСТЬ оценки статистического показателя характеризует случайную ошибку выборки и показывает величину отклонения рассчитываемого значения от ее усредненной величины по всем возможным выборкам.

Степень точности оценки обычно характеризуется ее дисперсией, стандартной ошибкой, коэффициентом вариации (относительной стандартной ошибкой) и доверительным интервалом. Точность какой-либо оценки, полученной по выборке, зависит от двух факторов: от способа, которым оценка вычисляется по данным выборки, и от способа формирования самой выборки.

СВОЕВРЕМЕННОСТЬ представления данных отражает приемлемую для пользователей продолжительность периода времени, проходящего от описываемого события до момента публикации соответствующих данных. Своевременность характеризуется предельно допустимым интервалом времени, на протяжении которого статистическая информация остается актуальной и востребованной пользователями.

ДОСТУПНОСТЬ отражает состояние готовности данных к официальному распространению (публикации), учитывая приемлемость формы (носителя), в которой данные становятся доступными пользователям, степень подготовленности соответствующих метаданных (информации о данных), а также информированность пользователей о возможности и средствах получения интересующих их данных. Одним из аспектов этой характеристики является возможность получения пользователями данных значительного объема.

ИНТЕРПРЕТИРУЕМОСТЬ статистических данных отражает возможность соотнесения пользователем статистических данных с объективной реальностью социально-экономической ситуации, а также простота их подготовки к анализу, в том числе автоматизированному. Строгость используемых в публикациях статистических терминов, включая определения признаков, показателей и границ исследуемых совокупностей в значительной мере определяют степень интерпретируемости.

СОГЛАСОВАННОСТЬ означает степень полноты данных и логической взаимосвязи между результатами статистического наблюдения и данными других наблюдений, либо показателями, полученными на их основе расчетным путем. Согласованные данные непротиворечивы в хронологической последовательности, сопоставимы и дополняют друг друга в сопряженных наблюдениях, относящихся к одному и тому же периоду времени. При этом необходимо учитывать, что используемые целевые совокупности могут отличаться в разных наблюдениях.

Достижение необходимого уровня качества результатов статистической деятельности требует от организаторов наблюдений тщательного планирования и осуществления непрерывного контроля за ходом их проведения.

Процесс проведения статистического наблюдения состоит из ряда последовательных этапов, данные которых обрабатываются раздельно. Перед организатором наблюдения стоит задача гарантировать качество результатов на каждой стадии.

Вместе с тем, каждый этап наблюдения необходимо рассматривать как часть единого процесса формирования сводных итогов.

При организации наблюдения необходимо учитывать потенциальные источники возникновения ошибок.

В планировании наблюдения принимают участие предметные специалисты, являющиеся методологами соответствующей отрасли статистики, а также специалисты в областях: организации статистического наблюдения, информационных технологий и публикации результатов.

Для достижения высокой эффективности использования ресурсного обеспечения от организатора требуется понимание значимости влияния каждого этапа процесса сбора и обработки данных на качество конечных результатов.

При организации наблюдения необходимо иметь достаточно полные сведения об основных источниках ошибок, их влиянии на уровень общей погрешности, о путях эффективного использования. Наличие таких сведений позволяет оценить альтернативные возможности распределения ресурсного обеспечения по этапам его наблюдения. Указанный подход особенно эффективен при проведении периодических наблюдений и приводит к последовательному повышению качества результатов на данном этапе.

При определении цели и задач наблюдения организаторы, как правило, исходят из максимального удовлетворения установленных потребностей пользователей в статистической информации, соответствующей нормативно-правовому обеспечению проведения статистических наблюдений, а также соблюдению конфиденциальности пообъектных данных.

Установление потребностей пользователей позволяет планировать наблюдение таким образом, чтобы публикуемые данные были представлены в понятной и удобной для использования форме.

Обязательным требованием качества публикуемых данных является сопровождение итогов наблюдения соответствующей метаинформацией, то есть материалами по методике проведения расчета показателей наблюдения, включая необходимую информацию в части статистических классификаций и охвата объекта наблюдения.

 

Качество программы и формуляра статистического наблюдения

Использование гармонизированных систем показателей и классификаций – одно из основных требований для обеспечения сопоставимости статистических данных, результатов наблюдений. Поэтому данные, предоставляемые пользователям, приведены в строгое соответствие с используемым Госкомстатом России Каталогом статистических показателей.

Обязательным требованием для органов статистики является обеспечение однозначного понимания респондентами вопросов формуляров проводимых статистических наблюдений. Для этого стандартные классификации и определения показателей должны быть доступны пользователям в печатном и электронном виде, в том числе в сети Интернет (www.gks.ru).

В процессе проектирования и использования статистических формуляров в Госкомстате России, как правило, выполняются три основных требования:

1. Создание логически ясного бланка наблюдения, в котором используются лаконичные и легко воспринимаемые респондентами вопросы и пояснения.

2. Оценивание качества разработанного бланка (ясность вопросов) до проведения наблюдения по результатам пилотных апробаций, включая анализ его эффективности в смысле корректности ответов респондентов и процента заполняемости основных вопросов бланка, а также наличия у респондентов необходимых первичных данных.

3. Осуществление «обратной связи» по результатам проведения наблюдения, т.е. внесение необходимых изменений для повышения качества бланка в случае его использования в последующих наблюдениях.

По данным пилотной апробации статистического формуляра многих обследований проводится анализ качества его заполнения. При этом по каждому вопросу определяются такие характеристики, как доля бланков: с ошибками заполнения и измерения, с пропусками, а также признанных корректно заполненными.

 

Качество данных статистических регистров

Для практической организации наблюдений органы государственной статистики создают и поддерживают в актуальном состоянии систему регистров – перечней единиц наблюдения, отвечающих реальным генеральным совокупностям, с ограниченным набором признаков идентификации, классификации и основных статистических характеристик. Одним из ключевых факторов для формирования статистической информации высокого качества является организация эффективного контроля за полнотой охвата исследуемых совокупностей, для чего проводится управление и обслуживание регистров.

Списочные статистические основы для отраслевых и межотраслевых наблюдений предприятий формируются на базе Генеральной совокупности объектов статистического наблюдения и создаваемых на ее основе отраслевых субрегистров. Качество данных регистра определяется полнотой охвата генеральной совокупности и актуальностью имеющихся данных, включая их достоверность. При использовании данных регистров (и других статистических и административных баз данных) учитывается и контролируется фактор запаздывания поступления в них информации и степень влияния этого фактора на сводные итоги проводимых наблюдений.

Генеральная совокупность объектов статистического наблюдения формируется и фиксируется по состоянию на 1 января текущего года. Поэтому, чем продолжительнее период времени, прошедший с момента ее формирования до организации конкретного наблюдения, тем меньше актуальность данных создаваемой основы.

 

Выборка

Качество итогов выборочного статистического наблюдения характеризуется достоверностью рассчитанных по выборке оценок показателей.

Результаты выборочного наблюдения практически всегда несколько отличаются от истинных, неизвестных на момент проведения наблюдения, значений показателей изучаемой генеральной совокупности. Эти отклонения – ошибки выборки, могут быть систематическими или случайными.

Систематические ошибки выборки имеют место в тех случаях, когда нарушен принцип случайности отбора и в выборку попали единицы, обладающие нехарактерными свойствами для всех единиц генеральной совокупности. Случайные ошибки обусловлены тем обстоятельством, что даже при тщательном планировании выборка не может в точности воспроизвести структуру генеральной совокупности. Поэтому случайные ошибки «присущи» несплошному наблюдению и вполне допустимы, если они малы и могут быть оценены статистически.

Для измерения полной ошибки выборки используется средний квадрат ошибки оценки показателя (СКО), который измеряет ошибку оценки показателя относительно истинного значения параметра совокупности.

СКО является критерием достоверности оценки, который характеризует величину отклонения рассчитываемого значения показателя от его истинного значения. Если смещение отсутствует или достаточно мало, то средний квадрат ошибки практически равен дисперсии оценки показателя, которая является характеристикой точности выборочного наблюдения.

В практической статистической деятельности любая выборочная оценка имеет смещение. Это связано с неполным охватом исследуемой генеральной совокупности, недостаточной актуальностью данных в основе выборки, факторами неполучения ответов от респондентов, намеренного искажения представляемой информации, обработкой данных и т.д.

Смещение, не связанное с вероятностным аспектом выборки, не может быть оценено, исходя только из выборочных данных. Поэтому для контроля его уровня необходимо привлекать из административных и других источников дополнительную информацию о происходящих процессах в генеральной совокупности, либо требуется организация специальных наблюдений, например, двухфазовых выборок с различными источниками первичных данных.

Обязательной для расчета и практически значимой характеристикой точности распространенных результатов выборочного наблюдения является доверительный интервал оценки показателя при выбранном уровне доверительной вероятности.

Под доверительным интервалом понимается интервал, внутри которого с соответствующей (выбранной) доверительной вероятностью находится истинное значение оцениваемого показателя. Обычно в социально-экономических исследованиях используется уровень доверия, равный 0,95. Это означает, что в 95 случаях из ста истинное значение оцениваемого по выборке показателя действительно находится внутри рассчитанного доверительного интервала.

 

Контроль процесса сбора первичных данных

Основной задачей при сборе первичных данных является обеспечение в кратчайшие сроки достаточно высоких уровней собираемости и заполнения статистических формуляров. Для решения поставленной задачи процесс сбора первичных данных и дополняющих его действий максимально ориентируется на характерные особенности совокупности респондентов и их потреб­ности.

В некоторых обследованиях проводится разъяснительная работа в средствах массовой информации о цели и задачах наблюдения (например, последняя перепись населения России), а также в ряде случаев считается целесообразным стимулировать респондентов отвечать на запросы органов статистики путем доведения до них результатов проведенного наблюдения.

Контроль процесса сбора данных осуществляется путем проведения мониторинга для отслеживания доли полученных ответов от респондентов. Мониторинг способствует эффективному использованию ресурсного обеспечения на стадиях сбора и обработки данных.

При его проведении, помимо текущих ответов респондентов, поступивших на данный момент, по имеющимся данным автоматически пересчитываются основные показатели наблюдения в целях определения наступления факта стабилизации – несущественного изменения значений показателей с поступлением новых отчетов.

Также рассчитывается характеристика процентного соотношения текущих (зависящих от уровня сбора) значений показателей с итоговыми их величинами за предшествующий период наблюдения. Полученные показатели текущего уровня собираемости первичных данных должны использоваться при определении приоритетных групп респондентов для проведения дальнейших мероприятий по сбору информации.

 

Автоматическое редактирование первичных данных

Редактирование – это процесс обнаружения и исправления ошибок в первичных данных наблюдения. Под ошибкой понимается отличие между измеренным значением и соответствующим истинным значением данных. Истинное значение определяется как величина, которая могла бы быть получена от респондента, если бы применялась идеальная (более дорогостоящая) процедура измерения в процессе сбора данных.

Общая стратегия заключается в развитии единой автоматизированной системы редактирования собираемых данных при проведении сопряженных наблюдений в каждой области статистической деятельности. Целями разработки таких систем являются:

• гарантия эффективного распределения ресурсов на редактирование данных для каждого проводимого наблюдения;

• ориентированность на применение универсальных программно-технологических средств;

• использование отлаженных на практике («лучших» в данной области статистики) алгоритмов автоматического редактирования;

• сохранение на относительно низком уровне затрат на обучение персонала, привлекаемого к данной работе;

• снижение числа повторных обращений к респондентам.

По используемым методам редактирование может быть классифицировано на два типа. Статистическое редактирование связано с идентификацией значений данных, которые возможно, с той или иной долей вероятности, ошибочны. С этим типом редактирования связан широкий класс стохастических методов замещения ошибочных значений и заполнения пропусков в данных.

Второй тип – логический и арифметический контроли данных, при котором значения признаков и показателей должны отвечать определенным заранее правилам (соотношениям). Поэтому редактирование в этом случае представляет собой процесс проверки (контроля) соответствия данных указанным выше правилам. Значения данных, которые не проходят логический или арифметический контроль, являются ошибочными и должны быть исправлены. Коррекция обычно основана на применении детерминированных методов, то есть с помощью расчетных формул, аргументами в которых выступают признанные верными значения признаков и показателей этой же единицы текущего периода наблюдения или любого предшествующего, либо данные других наблюдений или административных источников.

При проведении наблюдений целесообразно выполнение целевого редактирования, направленного на исправление ошибок, наиболее влияющих на сводные итоги. Ограниченное ресурсное обеспечение в этом случае направляется в ту область, где можно получить наибольший эффект. Такое редактирование обеспечивает своевременность представления итогов, сокращает стоимость и затраты времени занятого персонала на обработку первичных данных.

Для сплошных наблюдений (переписей) предприятий требование эффективности использования ресурсного обеспечения состоит в том, чтобы оно в первую очередь направлялось на исправление данных крупных, более сложных по своей структуре предприятий, поскольку вклад в значения показателей более мелких единиц (предприятий) менее значим. При редактировании и заполнении пропусков данных выборочных наблюдений учитываются выборочные веса единиц, присвоенные им на стадии планирования выборки.

В каждом конкретном случае оценивается экономический эффект от применения редактирования пообъектных данных. И только с учетом этого принимается решение о целесообразности затрат, в том числе времени, на проведение процедур редактирования. Кроме того, при принятии решения существенным критерием является достигаемое снижение нагрузки на респондентов по повторным к ним обращениям с целью уточнения представленных сомнительных сведений.

Для обследований с большим числом разрезов разработки и, соответственно, со значительным количеством выходных таблиц из их общего числа, как правило, выбираются и контролируются на непротиворечивость только ключевые (по возможности с различными видами взаимосвязей показателей). Графическое представление данных на стадии редактирования помогает идентифицировать нетипичные и экстремальные значения показателей.

При редактировании обеспечивается непротиворечивость первичных данных наблюдения во временном разрезе. В случае, когда результаты наблюдения должны быть согласованными с итогами других наблюдений, этап редактирования должен обеспечивать сопоставимость данных этих наблюдений на микроуровне.

Обязательным к выполнению требованием при использовании процедур редактирования является накопление информации о внесенных, с целью исправлений, изменениях в пообъектные данные для обеспечения в случае необходимости возможности возврата к исходным данным.

 

Идентификация и статистическая обработка данных нетипичных единиц наблюдения

Нетипичными называются единицы наблюдения проводимого обследования, которые обладают значениями некоторого признака (показателя), существенно отличными от остальных уровней статистического ряда распределения этого признака (показателя).

Нетипичные значения в файле данных наблюдения могут быть объективно таковыми, т.е. достоверными; либо быть ошибочными вследствие различных причин. Поэтому идентификация нетипичных единиц и проверка достоверности соответствующих значений признаков является обязательным этапом обработки первичных данных наблю­дения.

Для определения нетипичных значений преимущественно используются порядковые статистики ряда распределения (квартили, децили и квантили более высоких порядков), на основе значений которых рассчитывается интервал типичных значений. Нетипичными считаются все значения признака (показателя), находящиеся вне границ интервала, принятого в качестве типичного. Границы интервала типичных значений рассчитываются, например, как медиана плюс-минус значение межквартильных рангов, умноженные на экспертно определяемый коэффициент.

При проведении выборочных наблюдений взвешенные (умноженные на выборочные веса) значения признаков нетипичных единиц искажают оценки показателей, так как их вклад в распространенные на генеральную совокупность данные неоправданно завышен. Поэтому эти единицы не могут «представлять» в выборке своими первичными данными другие, не включенные в выборку.

В связи с этим при распространении выборочных данных на разрезы разработки в этом случае корректируются веса нетипичных единиц, либо экспертно их уменьшают (вплоть до значения, равного единице), либо помещают все нетипичные единицы в специальный слой (наблюдаемый на сплошной основе) с соответствующим изменением (перевзвешиванием) плана выборки типичных единиц.

Оба из указанных подходов приводят к снижению уровня стандартной ошибки оценок показателей, т.е. к повышению точности результатов наблюдения.

 

Публикация результатов статистических наблюдений

Качество статистической публикации определяется информативностью, ясностью и наглядностью ее материала. Необходимым требованием к составу публикуемого материала является наличие сведений о цели, предмете и объекте статистического исследования, ходе проведения наблюдения, методах сбора и обработки данных, а также характеристик точности представляемых результатов в случае проведения выборочного обследования.

В настоящее время основной формой представления государственными органами статистики официальной статистической информации всем пользователям являются печатные публикации, подготавливаемые в виде сборников, бюллетеней и срочных информационных сообщений, содержащих статистические таблицы и графики. Кроме того, для распространения статистической информации используются электронные носители (дискеты и компакт-диски) и передача информации зарегистрированным пользо­вателям по линиям связи средствами электронной почты. Практически все официальные статистические публикации размеща­ются на сайте Госкомстата России в сети Интернет (www.gks.ru). При этом часть информации является общедоступной, а доступ к наиболее подробным сведениям предоставляется зарегистриро­ванным пользователям.

 

Литература:

1. Организация государственной статистики в Российской Федерации / Госкомстат России. – М., 2004. – 429 с.

 

Источник: журнал «Медицинская статистика и оргметодработа в учреждениях здравоохранения» 2012/07

Другие статьи по теме
Категория: Медицинская статистика | Добавил: zdrav1 (26.08.2017)
Просмотров: 3479 | Теги: Медицинская статистика
Всего комментариев: 0
Яндекс.Метрика