Статистические методы анализа медико-демографических показателей (часть 1) - Медицинская статистика - Каталог статей

Главная » Статьи » Медицинская статистика

Статистические методы анализа медико-демографических показателей (часть 1)

Медико-демографическая ситуация в нашей стране является объектом самого пристального внимания в виду возрастающей депопуляции. Уменьшение численности населения и трудовых ресурсов, высокие показатели смертности, низкая рождаемость, постарение нации вызывают самые мрачные прогнозы в отношении стратегического развития страны. Известна высокая информативная значимость медико-демографических показателей в отношении влияния факторов среды обитания различной природы – физических, химических, биологических и социально-экономических. Ввиду вышеизложенного анализ медико-демографической ситуации имеет первостепенное значение в рамках социально-гигиенического мониторинга[1].
Многими научными исследованиями показана основная роль социально-экономических факторов среды обитания в ухудшении медико-демографической ситуации в стране, чем и объясняется введение в Федеральный информационный фонд данных социально-гигиенического мониторинга (ФИФ СГМ)[2] раздела "Сведения о социально-экономическом состоянии территории".
На данном этапе развития социально-гигиенического мониторинга задачей первостепенной важности является анализ накопленных информационных массивов и получение результата многолетней деятельности по организации системы социально-гигиенического мониторинга и сбору данных в виде регионально-ориентированных профилактических программ. Несмотря на разработанные методические подходы к анализу медико-демографической ситуации, для практики социально-гигиенического мониторинга он все еще представляет определенные трудности ввиду отсутствия подготовленных статистиков-аналитиков и специально разработанных технологий.
Задачами статистического анализа медико-демографических показателей территорий являются:
1) определение основных пространственных и временных закономерностей изменения медико-демографических показателей;
2) определение территорий риска по медико-демографической ситуации в общей совокупности территорий;
3) оценка качества статистики по медико-демографическим показателям;
4) выявление причин (условий) формирования той или иной медико-демографической ситуации в регионе (районе), ведущих социально-экономических факторов, способствующих ухудшению медико-демографической ситуации;
5) определение основных направлений регионально-ориентированных профилактических программ.

Сбор данных и формирование базы данных

Сбор данных является одним из основных разделов деятельности специалистов исходя из задач социально-гигиенического мониторинга. Сбор данных должен осуществляться параллельно с формированием базы данных.
База данных – упорядоченный массив чисел, электронная таблица вида m × n, где m – число строк и n – число столбцов. База данных играет решающую роль в анализе и его результатах, отражает план и потенциал работы. От качества базы данных зависят точность результатов и достоверность выводов, полученных в результате ее статистической обработки.
Строки базы данных – это, как правило, наименования единиц совокупности, включенных в анализ (фамилии участников групп, номера животных, административные территории и др.). На языке статистики единицы совокупности называются случаями. Чем больше случаев, тем больше численность выборки, что имеет решающее значение для статистической значимости результатов[3]. Так, результаты корреляционного анализа на выборке численностью менее 10 весьма сомнительны.
Столбцы – это те характеристики совокупности, которые решено изучить (заболеваемость, смертность, численность и плотность населения, удельный вес жителей села, характеристики загрязнения и проч.; для выборки, состоящей из людей, – это пол, возраст и т.п.). На языке статистики характеристики совокупности называются переменные[4].
База данных предназначена для накопления, структурирования, обработки с помощью компьютера и хранения информации. С использованием базы данных проводится анализ, оценка и прогноз ситуации на основе определения причинно-следственных связей между состоянием здоровья населения и воздействием факторов среды обитания с последующей разработкой мер профилактики.

Пошаговая инструкция по формированию базы данных
ШАГ N 1. Сформировать макет базы данных с названиями строк и столбцов. Первичная база данных должна включать всю совокупность регионов или муниципальных образований, выделяемых Федеральной службой статистики (названия строк), и весь перечень медико-демографических и социально-экономических показателей, определенных приказом Роспотребнадзора от 30.12.2005 N 810 "О Перечне показателей и данных для формирования Федерального информационного фонда социально-гигиенического мониторинга".
ШАГ N 2. Сформировать перечень полных и кратких названий мониторируемых показателей (столбцов базы данных). Краткие названия необходимы для обозначения показателей в электронных таблицах, где объем названия ограничен по техническим причинам (табл. 1).

Таблица 1

ФРАГМЕНТ ПЕРЕЧНЯ НАИМЕНОВАНИЙ БАЗЫ МЕДИКО-ДЕМОГРАФИЧЕСКИХ ДАННЫХ

N	Наименование показателя
N	Полное	Краткое
1	Общий коэффициент рождаемости, среднее хронологическое значение за 2016 г., на 1000 человек населения	Рождаемость, 2016
2	Общий коэффициент смертности, среднее хронологическое значение за 2016 г., на 1000 человек населения	Смертность, 2016
3	Коэффициент младенческой смертности (число детей, умерших в возрасте до 1 года), среднее хронологическое значение за 2016 г., на 1000 родившихся живыми	Младенческая смертность, 2016

ШАГ N 3. Сформировать базу данных в формате Microsoft Excel вручную либо вставляя табличные данные из Microsoft Word или других программ.
ШАГ N 4. Следует избегать пробелов базы данных. В некоторых случаях пустые клетки могут быть заполнены путем введения средних величин по совокупности, за период, либо за два соседних периода.
ШАГ N 5. Проверить правильность формирования базы данных методом графического анализа[5]. Следует построить точечную диаграмму, используя функции Мастер диаграмм Microsoft Excel – Точечная. В случае получения сильно отличающихся от основного массива данных следует проверить эти данные в источнике исходной информации.
ШАГ N 6. Сформировать ту же базу данных в формате пакета прикладных программ Statistica[6], используя опцию Открытие. В окне Тип файлов выбрать Все, найти и открыть нужный файл Microsoft Excel – Импортировать выбранный лист в электронную таблицу. Выбрать нужный лист, отжать флажки Получить имена случаев и Получить имена переменных. Нажать ОК.
ШАГ N 7. В базе данных формата Statistica ввести полные наименования показателей в окне Переменные, которое должно быть получено двойным щелчком на названии столбца (кратком наименовании).
ШАГ N 8. Организовать хранение исходной базы в неизменном виде, все виды анализа проводить в копиях базы данных.
ШАГ N 9. Руководителям отделов социально-гигиенического мониторинга вести личный контроль за ведением и хранением баз данных.

Описательная статистика

Описательная статистика – комплекс базовых приемов анализа данных вариационного ряда, дающий наиболее общее представление о распределении той или иной характеристики в изучаемой совокупности.
Этапы анализа распределения:
1) расчет параметров описательной статистики (распределения);
2) графический анализ графика распределения (гистограммы) с визуальной оценкой смещения центра распределения ряда;
3) расчет критериев нормальности распределения.
Параметры описательной статистики (распределения): среднее арифметическое, ошибка среднего, медиана (срединное значение вариационного ряда), мода (наиболее частое значение ряда), стандартное отклонение (мера вариабельности данных в ряду), минимум (минимальное значение в ряду), максимум (максимальное значение в ряду), счет (количество членов ряда).
Гистограмма – столбиковая диаграмма, позволяющая судить о том, сколько элементов совокупности попало в тот или иной диапазон значений.
Асимметрия – смещение центра, вершины гистограммы в горизонтальном отношении (вправо – влево), эксцесс – в вертикальном (вверх – вниз) относительно колоколообразной формы нормального распределения.
Критерии нормальности – критерии, позволяющие оценить характер распределения, значимость его отклонения от нормального: хи-квадрат, критерий Колмогорова-Смирнова, W критерий Шапиро-Уилка. Значение p < 0,05 критерия указывает на значимое отклонение распределения от нормального и предпочтение непараметрических методов статистического анализа (хи-квадрат, ранговую корреляцию и др.).
Описательная статистика позволяет получить первое общее представление, например, о том или ином медико-демографическом показателе на изучаемой территории. Числовые и визуальные результаты описательной статистики позволяют также решить вопрос выбора параметрических или непараметрических методов дальнейшего анализа данных. Описательная статистика обладает самостоятельным значением и обязательна для применения в медико-демографических и социально-экономических исследованиях.

Пошаговая инструкция
Пример. Требуется изучить рождаемость среди населения в муниципальных образованиях Региона за 2018 г.
ШАГ N 1. В файле Microsoft Excel сформировать вариационный ряд: в столбце А – названия районов Региона, в столбце Б – значения рождаемости в этих районах, на 100 тыс.
ШАГ N 2. Рассчитать на основе этого ряда числовые параметры описательной статистики, применив соответствующие статистические функции: среднее арифметическое (СРЗНАЧ), значения медианы (МЕДИАНА), мода (МОДА), стандартное отклонение (СТАНДОТКЛОН), минимального и максимального значений ряда (МИН, МАХ), размера совокупности (СЧЕТ). Например, рассчитать медиану следует путем введения в окно формул со значком f на панели инструментов формулы =МЕДИАНА(B2:B30).
ШАГ N 3. В случае необходимости анализа нескольких медико-демографических характеристик расчеты следует проводить в ППП Statistica. Там же следует построить гистограмму и рассчитать критерии нормальности всех медико-демографических характеристик путем применения опции Основные статистики – Описательная статистика – Расширенный анализ – Нормальность – Гистограмма.
ШАГ N 4. Проанализировать результаты.
ЗАКЛЮЧЕНИЕ ПО ПРИМЕРУ. В Регионе в 2018 г. рождалось в среднем 12 детей на 100 тыс. населения (точнее 11,7). Показатели рождаемости в 29 районах региона колебались от 9,1 (минимум) до 14,8 (максимум). Стандартное отклонение составило 1,27, ошибка средней – 0,24. Значение медианы практически совпало с таковым среднего значения (соответственно 11,6 и 11,7), что указывает на нормальный характер распределения показателей рождаемости в изучаемой совокупности районов Региона. Нормальный характер распределения подтверждается также с помощью критерия Шапиро-Уилка: уровень значимости p > 0,05. Судя по гистограмме, наиболее часто показатели рождаемости в Регионе регистрировались в диапазоне от 11 до 12: такие цифры отмечены в девяти районах области. В диапазон от 10 до 11 вошли значения восьми районов. В семи районах значения рождаемости от 12 до 13 детей на 100 тыс., в трех – от 13 до 14, и по одному – в диапазонах от 9 до 10 и от 14 до 15. То есть выше среднего значения в 11 районах области (7 + 3 + 1), ниже среднего – в девяти (8 + 1). Таким образом, показатели рождаемости в Регионе имеют нормальное распределение, что позволяет их обрабатывать в дальнейшем с помощью параметрических методов.

Примечания.
Существуют определенные правила ввода формул в Microsoft Excel: все формулы в Microsoft Excel начинаются со знака "="; не следует допускать лишних пробелов, знаков препинания; нельзя путать знаки препинания, например запятую и точку с запятой; названия функций писать по-русски, а диапазоны обозначать английскими буквами (диапазоны лучше выделять мышкой).
Следует всегда проверять формулы, поставив курсор сразу после формулы в окне со значком fx на панели инструментов. При этом формула в окне должна быть неизменна, ссылка должна занимать нужный диапазон, а меняться должно только значение конкретного элемента совокупности. Обращать также внимание на диапазон, сравнивая выделение соответствующих элементов разными цветами в формуле и на листе. Неопытному пользователю следует посоветовать пользоваться услугами Функция в меню Вставка и изучать детальнейшую Справку Microsoft Excel.

Сравнение данных: методы сравнения групп

Методы сравнения групп являются классическими и наиболее распространенными методами сравнения данных. Группами в случае мониторинга медико-демографических показателей будут совокупности районов двух регионов, разных территорий региона, объединенных по какому-либо признаку и т.д.
Существует довольно много методов сравнения групп. Все они основаны на применении т.н. нулевой гипотезы (о том, что различия между группами не значимы, не существенны) и определении ее справедливости. Если вероятность получить наблюдаемые или более сильные различия в повторных выборках мала (максимально приемлемая вероятность ее отвергнуть – уровень значимости p = 0,05), то нулевая гипотеза отвергается, то есть различия между группами значимы.
Один из основных методов оценки различий между группами – дисперсионный анализ, основанный на сравнении разброса выборочных средних в группах с разбросом значений внутри группы с помощью дисперсии и расчета критерия F. Разновидностью дисперсионного анализа в случае сравнения двух групп является t-критерий, который также имеет варианты – сравнение независимых групп (например, в случае сравнения рождаемости в совокупностях районов двух регионов) и сравнение зависимых групп (например, в случае сравнения рождаемости в районах области в 2000 г. и в 2016 г.).
Непараметрическими аналогами дисперсионного анализа и t-критерия являются в случае сравнения двух независимых групп критерий Манна-Уитни, нескольких независимых групп – критерий Крускала-Уоллиса, двух зависимых групп – критерий Уилкоксона.
Расчет этих критериев следует проводить на базе Statistica с применением опций Основные статистики (t-критерий), ANOVA (дисперсионный анализ) и Непараметрические методы (критерии Манна-Уитни, Крускала-Уоллиса, Уилкоксона). Все опции предполагают также графический анализ данных.
Сравнение данных с указанием значимости различий – основа статистического анализа данных. Только таким образом можно оценивать, насколько случайны различия между группами, следует ли принимать во внимание различия, являются ли они следствием влияния каких-то важных факторов.

Пошаговая инструкция.
ПРИМЕР 1. Требуется сравнить показатели заболеваемости детей в возрасте 0 – 14 лет и заболеваемости подростков в возрасте 15 – 17 лет в районах Региона в 2018 г.
ШАГ N 1. В файле Statistica сформировать базу данных вида m × n, где m – перечень районов Региона, а n – переменные Заболеваемость детей и Заболеваемость подростков.
ШАГ N 2. Провести оценку распределения по алгоритму, приведенному в предыдущем разделе. Убедиться, что обе переменные распределены нормально.
ШАГ N 3. Провести расчеты t-критерия, применив опции Статистика – Основные статистики – t-тест для зависимых выборок. В результате будет получена таблица с итогами расчетов (табл. 2).

Таблица 2

РЕЗУЛЬТАТЫ РАСЧЕТА t-КРИТЕРИЯ В ФОРМАТЕ STATISTICA

ПРИ СРАВНЕНИИ ЗАБОЛЕВАЕМОСТИ ДЕТЕЙ И ПОДРОСТКОВ В РЕГИОНЕ

	Среднее значение	Стандартное отклонение	t	p
Заболеваемость детей	106861,2	25709,42
Заболеваемость подростков	83580,9	26572,76	6,85	0,000

ШАГ N 4. Проанализировать результаты.
ЗАКЛЮЧЕНИЕ ПО ПРИМЕРУ. В 2018 г. заболеваемость детей в возрасте 0 – 14 лет существенно превысила уровень заболеваемости подростков в возрасте 15 – 17 лет (соответственно 106861,2 ± 25709,42 и 83580,9 ± 26572,76 на 100 тыс. населения соответствующего возраста, t = 6,85, p = 0,000...) (табл. 2).
ПРИМЕР 2. Требуется сравнить показатели рождаемости среди населения в 2018 г. в районах Региона, отнесенных к четырем природно-климатическим зонам – северной, северной лесостепи, южной лесостепи, степной.
ШАГ N 1. В файле Statistica сформировать базу данных вида m × n, где m – перечень районов Региона, а n – две переменные: Географ и Рождаемость. Обратить внимание на группирующую переменную Географ. Она имеет ключевое значение для анализа, так как таким образом автор дает понять программе Statistica, на какие же группы разделена совокупность. В данном случае совокупность разделена на четыре группы – зоны Региона согласно делению, принятому официально: 1 – северная зона, 2 – северная лесостепь, 3 – южная лесостепь, 4 – степная.
ШАГ N 2. Провести расчеты критерия Краскела-Уоллиса, применив опцию Статистика – Непараметрические методы – Независимые выборки. Выбрать переменные в окне Переменные: как группирующую – переменную Географ, как зависимую – переменную Рождаемость. В результате будет получена таблица с итогами расчетов: H(3, N = 32) = 8,8707, p = 0,031.
ШАГ N 3. Для визуализации результатов применить опцию Объемно-точечная диаграмма.
ШАГ N 4. Проанализировать результаты.
ЗАКЛЮЧЕНИЕ ПО ПРИМЕРУ. В 2018 г. рождаемость среди населения южной половины области существенно превысила таковую на севере Региона (H = 8,87, p = 0,031). Максимальные средние уровни отмечены в районах южной лесостепи, минимальные – в северной лесостепи. Наименьшая вариабельность данных отмечена в степной зоне, зоне северной лесостепи, максимальная – в южной лесостепи и северной зоне.

Сравнение данных: картографический анализ

Картографический анализ данных является разновидностью географических методов исследования, которые применяют для количественной и качественной характеристик объектов внешней среды на территории больших регионов. Картографический анализ данных на современном уровне позволяют провести геоинформационные системы.
Современные геоинформационные системы предлагают ряд других способов – совокупность может быть разделена на квартили (4 равных интервала), квинтили (5 равных интервалов), по методу персентилей[7] (вводятся другие значения Р), по сигмальному методу (использовать в случае нормального распределения данных) и вручную, когда для обозначения границ интервалов имеется возможность вводить любые цифры. В случае отсутствия соответствующих функций в геоинформационной системе значения границ интервалов рассчитать для каждого класса болезней и ввести вручную.
Картографический анализ данных позволяет визуально получить представление о распространении того или иного явления на территории, выделить территории риска. В ряде случаев в результате картографического анализа данных возможна формулировка гипотез о факторах, способствующих формированию изучаемого явления.

Пошаговая инструкция
Пример. Требуется провести картографический анализ инвалидности детей в регионах России с выделением медико-географических закономерностей ее формирования и территорий риска по той или иной нозологической форме.
ШАГ N 1. Сформировать базу данных вида m × n, где m – перечень регионов страны, а n – инвалидность детей вследствие разных болезней (17 классов болезней).
ШАГ N 2. Для всех классов болезней по методу персентилей рассчитать границы четырех интервалов (квартилей), на которые будет разделена совокупность регионов в процессе построения карт: интервал низких значений – Р0 – Р25, значений ниже средних – Р25 – Р50, значений выше средних – Р50 – Р75, высокие значения – Р75 – Р100 (разделение по квартилям).
ШАГ N 3. Проанализировать полученные карты.
ЗАКЛЮЧЕНИЕ ПО ПРИМЕРУ. Судя по приведенным картам, в России существуют определенные географические различия инвалидизации детей. Так, Сибирь и Дальний Восток следует считать территорий риска инвалидизации детей вследствие инфекционных и паразитарных заболеваний (чаще всего это туберкулез), так как большинство регионов этих федеральных округов вошли в верхний и третий квартили ряда (выше среднего по России). Другими центрами этой патологии в России следует считать некоторые регионы Приволжского, Южного федеральных округов, севера европейской части России. Европейскую часть России следует признать территорией риска инвалидизации детей вследствие болезней эндокринной системы, расстройств питания и нарушений обмена веществ: подавляющее большинство европейских регионов составили верхний и третий квартили ряда. Визуально четко прослеживается уменьшение показателей с запада на восток страны.

Примечания.
В случае нормального распределения данных вариационного ряда границы интервалов для картографирования следует рассчитывать по методу сигмальных отклонений (табл. 3). Не следует увеличивать количество интервалов, особенно в случае небольшого числа субтерриторий, так как визуальный анализ затрудняется.

Таблица 3

РАСЧЕТ ГРАНИЦ ИНТЕРВАЛОВ СТАТИСТИЧЕСКОЙ НОРМЫ
ПО МЕТОДУ СИГМАЛЬНЫХ ОТКЛОНЕНИЙ (дельта)

N интервала	Границы интервала	Название интервала
1	Менее (М – 2 дельта)	Очень низкие значения
2	-1 дельта – 2 дельта	Низкие значения
3	М ± 1 дельта	Средние значения
4	+1 дельта + 2 дельта	Высокие значения
5	Более (М + 2 дельта)	Очень высокие значения

Сравнение данных: структурный профиль

Структурный профиль – это визуальное представление числовых выражений частей многокомпонентного явления на столбиковой диаграмме с нанесением интервалов статистической нормы. Способ основан на определении границ статистической нормы методом персентилей для каждого класса болезни: Р25 – Р75. Суть анализа в том, чтобы можно было определить, попадает ли тот или иной регион в интервал статистической нормы. Если регион попадает в интервал "выше нормы" (> Р75), то этот показатель является болезнью (группой) риска для данной территории и в первую очередь нуждается в изучении и коррекции.
Анализ структурных профилей необходим для получения наглядного представления об особенностях конкретного показателя на территории в сравнении с генеральными показателями, о разбросе, вариабельности данных по каждой нозологической форме на генеральной территории, о нозологических особенностях конкретного признака среды или здоровья на данной территории по сравнению с аналогичными данными всей совокупности. Дает возможность выделить патологию риска (группу риска, фактор риска) для конкретной территории, с последующими целенаправленными действиями по ее изучению и профилактике.

Пошаговая инструкция
Пример. Требуется провести анализ профессиональной заболеваемости в совокупности регионов России за период 2007 – 2015 гг. с определением вариабельности показателей и оценкой положения конкретного Региона. В анализ включены сведения по профессиональной заболеваемости во всех регионах страны за 2007 – 2015 гг. (всего 9 показателей по 89 регионам). Анализ следует проводить в Microsoft Excel.
ШАГ N 1. В файле Microsoft Excel в интервале A1-I89 сформировать базу данных вида m × n, где m – перечень регионов (89), а n – период (годы) наблюдений с 2007 по 2015 гг.
ШАГ N 2. С помощью функции ПЕРСЕНТИЛЬ рассчитать персентили 25, 75 и 50 (Р25, Р75, Р50) для каждого года наблюдений.
ШАГ N 3. Рассчитать стандартизованные в персентилях Интервал нормы выше среднего и Интервал нормы ниже среднего для каждого периода наблюдений по формулам, соответственно:
=Р75-Р50.
=Р50-Р25.
ШАГ N 4. Провести стандартизацию всех значений базы данных как отношение данных в каждом из регионов за конкретный год к соответствующей медиане, выраженное в процентах по формуле:
=данные каждого региона/Р50*100.[8]
ШАГ N 5. Рассчитать стандартизованные относительно медианы значения верхней и нижней границы нормы, медианы, Интервала выше среднего и Интервала ниже среднего как отношение ранее полученных данных (шаги 2 и 3) к соответствующей медиане, выраженное в процентах. Стандартизованные значения медианы всего периода должны составить 100%.
ШАГ N 6. Используя функции Мастера диаграмм на диапазоне полученных значений медианы, выраженной как 100%, построить точечный график .
ШАГ N 7. Щелкнув правой кнопкой на одной из точек графика, выбрать опцию Формат рядов данных, выбрать окно "Y-погрешности", из предлагаемых Величин погрешности выбрать Пользовательскую. Поставив курсор в ее верхнее окно, внести в него диапазон нормализованных значений Интервала нормы выше среднего и в нижнее окно – Интервал нормы ниже среднего. В результате на графике будет получен российский межрегиональный профиль профессиональной заболеваемости.
ШАГ N 8. Выделив диаграмму и расширив ее ссылку на вставленную строку с показателями конкретного Региона, получить график профессиональной заболеваемости в Регионе относительно межрегионального профиля за изучаемый период.
ШАГ N 9. Проанализировать с указанием: 1) разброса (вариабельности) показателей на конкретной территории по сравнению со среднероссийскими данными; 2) определением "попадания" Региона в интервал статистической нормы по каждому из признаков; 3) выявлением "проблемных мест" для Региона – показателей, превышающих верхнюю границу статистической нормы для российских регионов, переменные, требующие проверки качества информации.
ЗАКЛЮЧЕНИЕ ПО ПРИМЕРУ: судя по границам статистической нормы, наиболее вариабельными данные по профессиональной заболеваемости в регионах России были в начале исследуемого периода – в 2007 г., наименее – в 2011, 2014 гг. Размах значений очень велик, распределение асимметрично, имеются регионы-лидеры (так как интервал верхней границы нормы намного больше интервала нижней границы нормы). Положение Региона в совокупности российских регионов по показателям профессиональной заболеваемости в течение 2007 – 2015 гг. существенно менялось. Если в начале периода показатели в Регионе приближались к нижней границе статистической нормы, то спустя 3 года – в 2010 году – Регион находился на верхней границе нормы; если в 2012 – 2014 гг. показатели в Регионе были на уровне средних в стране (близки к медиане), то к концу периода положение Региона вновь изменилось в сторону увеличения. Другими словами, в Регионе были иные тенденции динамики показателя по сравнению со всей совокупностью регионов, качество учета профессиональной заболеваемости в Регионе требует проверки.

Анализ динамических рядов

Ряды динамики – это ряды последовательно расположенных в хронологическом порядке статистических показателей, которые характеризуют развитие явления во времени. Ряды динамики могут состоять из абсолютных, относительных и средних величин. В зависимости от характера изучаемого явления ряды динамики подразделяются на моментные и интервальные. Моментные ряды динамики отражают состояние изучаемых явлений на определенные моменты времени. В медико-демографических исследованиях это, например, общая инвалидность (число инвалидов на 01.01). Интервальные ряды динамики состоят из интервальных величин и отражают итоги развития изучаемых явлений за отдельные периоды времени. В медико-демографических исследованиях это, например, первичная заболеваемость (число впервые выявленных случаев за год).
В каждом ряду динамики имеются два основных элемента: 1) показатели времени – t; 2) уровни развития изучаемого явления – y. Отсюда различаются: 1) начальный уровень ряда y1 – это величина первого показателя ряда; 2) конечный уровень ряда yn – это величина последнего члена ряда. В основе анализа показателей рядов динамики лежит сравнение уровней ряда за различные периоды.
К показателям рядов динамики относятся: 1) определение интенсивности изменения уровня за период (абсолютный прирост, темп роста и темп прироста) и 2) расчет средних по рядам динамики (средний уровень ряда, средний абсолютный прирост, средний темп роста, средний темп прироста).
Абсолютный прирост (ДЕЛЬТА) – это разница между двумя уровнями ряда динамики в единицах измерения исходной информации.
Темп роста (Тр) – это показатель, характеризующий соотношение двух уровней ряда и выражающийся в процентах. Если темпы роста больше 100%, то это показывает, что значение изучаемого явления в рассматриваемом году выросло по сравнению с базисным уровнем. Темп роста, равный 100%, говорит о том, что величина явления в рассматриваемом периоде не изменилась по сравнению с базисным периодом. Темпы роста меньше 100% показывают на уменьшение величины изучаемого явления по сравнению с базисным уровнем. Темпы роста всегда имеют положительный знак.
Темп прироста (Тпр) характеризует прирост в относительных величинах. Вычисленный в процентах темп прироста показывает, на сколько процентов изменился рассматриваемый уровень по сравнению с уровнем, принятым за базу сравнения.
Средний уровень ряда динамики характеризует типичную для данного динамического ряда величину.
Средний абсолютный прирост – это разность между конечным yn и первым y1 уровнями изучаемого периода.
Средний темп роста – это обобщающая характеристика темпов роста ряда динамики, которая показывает, как в среднем изменялось изучаемое явление в течение рассматриваемого периода.
Средний темп прироста – это обобщающая характеристика темпов роста ряда динамики, которая показывает, как в среднем изменялось изучаемое явление в течение рассматриваемого периода, выражается в процентах.
Показатели интенсивности изменения уровня за период могут быть базисными и цепными. Базисные показатели рассчитываются путем сравнения каждого уровня ряда с одним и тем же базисным (исходным) уровнем и отражают итог роста (снижения) явления за изучаемый период. Цепные показатели рассчитываются путем сравнения каждого последующего уровня с предыдущим, взятым в качестве базы сравнения. С помощью цепных показателей измеряют, каковы изменения в отдельные годы рассматриваемого периода.
Анализ динамических рядов имеет важнейшее значение в ходе медико-демографических исследований, так как позволяет решить ряд основных вопросов: выявить изменение изучаемого явления (например, медико-демографических процессов) во времени, прогнозировать на его основе дальнейшее развитие ситуации с целью своевременного принятия мер профилактики, оценить эффективность принятых мер, предполагать влияние на процесс каких-либо факторов.

Пошаговая инструкция
Пример. Требуется провести анализ динамики численности населения Региона.
ШАГ N 1. В файле Microsoft Excel сформировать динамический ряд по образцу столбцов табл. 4 Год и Численность населения.
ШАГ N 2. Провести расчеты базисных и цепных показателей интенсивности динамики (абсолютного прироста, темпа роста и темпа прироста) численности населения в Регионе по формулам, приведенным в табл. 4.

Таблица 4

РАСЧЕТ ПОКАЗАТЕЛЕЙ ИНТЕНСИВНОСТИ ИЗМЕНЕНИЯ
ЧИСЛЕННОСТИ НАСЕЛЕНИЯ РЕГИОНА ЗА ПЕРИОД 2013-2018 ГГ.

┌────┬───────┬───────────────────────────────────────────────────────────────────────────────────────────┐
│Год │Числен-│                                    Расчет показателей                                     │
│    │ность │                                                                                           │
│    │населе-├───────────────────────────────────────────┬───────────────────────────────────────────────┤
│    │ния,   │                 базисных                  │                    цепных                     │
│    │тыс.   │                                           │                                               │
│    │чел.   │                                           │                                               │
├────┴───────┴───────────────────────────────────────────┴───────────────────────────────────────────────┤
│                                       Абсолютный прирост, ДЕЛЬТА                                       │
├────────────┬───────────────────────────────────────────┬───────────────────────────────────────────────┤
│формула:    │           ДЕЛЬТА      = y – y            │           ДЕЛЬТА        = y – y              │
│            │                 альфа    i    1           │                 омикрон    i    i-1           │
├────┬───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2013│2075,4 │                                           │                                               │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2014│2058,5 │2058 – 2075,4 = -16,9                      │2058 – 2075,4 = -16,9                          │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2015│2046,6 │2046,6 – 2075,4 = -28,8                    │2046,6 – 2058,5 = -11,9                        │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2016│2034,6 │2034,6 – 2075,4 = -40,8                    │2034,6 – 2046,6 = -12,0                        │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2017│2025,6 │2025,6 – 2075,4 = -49,8                    │2025,6 – 2034,6 = -9,0                         │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2018│2018,0 │2018,0 – 2075,4 = -57,4                    │2018,0 – 2025,6 = -7,6                         │
├────┴───────┴───────────────────────────────────────────┴───────────────────────────────────────────────┤
│                                             Темп роста, Тр                                             │
├────────────┬───────────────────────────────────────────┬───────────────────────────────────────────────┤
│            │                      y                    │                         y                     │
│            │                       i                   │                          i                    │
│формула:    │            Тр      = -- × 100%            │            Тр        = ---- × 100%            │
│            │              альфа   y                    │              омикрон   y                      │
│            │                       1                   │                         i-1                   │
├────┬───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2013│2075,4 │                                           │                                               │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2014│2058,5 │2058 / 2075,4 × 100% = 99,2%               │2058 / 2075,4 × 100% = 99,2%                   │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2015│2046,6 │2046,6 / 2075,4 × 100% = 98,6%             │2046,6 / 2058,5 × 100% = 99,4%                 │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2016│2034,6 │2034,6 / 2075,4 × 100% = 98,0%             │2034,6 / 2046,6 × 100% = 99,4%                 │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2017│2025,6 │2025,6 / 2075,4 × 100% = 97,6%             │2025,6 / 2034,6 × 100% = 99,6%                 │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2018│2018,0 │2018,0 / 2075,4 × 100% = 97,2%             │2018,0 / 2025,6 × 100% = 99,6%                 │
├────┴───────┴───────────────────────────────────────────┴───────────────────────────────────────────────┤
│                                           Темп прироста, Тпр                                           │
├────────────┬───────────────────────────────────────────┬───────────────────────────────────────────────┤
│формула:    │ОМИКРОН йота d      = ОМИКРОН d      – 100%│ОМИКРОН йота d       = ОМИКРОН d        – 100%│
│            │              альфа            альфа       │              омикрон            омикрон       │
├────┬───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2013│2075,4 │                                           │                                               │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2014│2058,5 │99,2% – 100% = -0,8%                      │99,2% – 100% = -0,8%                           │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2015│2046,6 │98,6% – 100% = -1,4%                       │99,4% – 100% = -0,6%                           │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2016│2034,6 │98,0% – 100% = -2,0%                       │99,4% – 100% = -0,6%                           │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2017│2025,6 │97,6% – 100% = -2,4%                       │99,6% – 100% = -0,4%                           │
├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤
│2018│2018,0 │97,2% – 100% = -2,8%                       │99,6% – 100% = -0,4%                           │
└────┴───────┴───────────────────────────────────────────┴───────────────────────────────────────────────┘

ШАГ N 3. Провести расчет средних по ряду динамики (среднего уровня ряда, среднего абсолютного прироста, среднего темпа роста, среднего темпа прироста) численности населения Региона по формулам, приведенным в табл. 5.

Таблица 5

РАСЧЕТ СРЕДНИХ ПО РЯДУ ДИНАМИКИ ПОКАЗАТЕЛЕЙ
ЧИСЛЕННОСТИ НАСЕЛЕНИЯ РЕГИОНА ЗА ПЕРИОД 2013-2018 ГГ.
┌───────────────────────────────┬────────────────────────────────────────────────────────────────────┐
│            Формула            │                               Расчет                               │
├───────────────────────────────┴────────────────────────────────────────────────────────────────────┤
│                                        Средний уровень ряда                                        │
├───────────────────────────────┬────────────────────────────────────────────────────────────────────┤
│    1                      1   │    1                                              1                │
│    – y + y +...+ y    + – y │    – 2075,4 + 2058,5 + 2046,6 + 2034,6 + 2025,6 + – 2018,0         │
│_   2 1    2        n-1   2 n│_   2                                              2                │
│y = ---------------------------│y = ------------------------------------------------------- = 2042,4│
│               n – 1           │                             6 – 1                                  │
├───────────────────────────────┴────────────────────────────────────────────────────────────────────┤
│                                     Средний абсолютный прирост                                     │
├───────────────────────────────┬────────────────────────────────────────────────────────────────────┤
│                 y – y        │                                                                    │
│        _         n    1      │ _        2018,0 – 2075,4                                          │
│      ДЕЛЬТА y = -------       │ДЕЛЬТА y = --------------- = -11,48                                 │
│                  n – 1        │                6 – 1                                               │
├───────────────────────────────┴────────────────────────────────────────────────────────────────────┤
│                                         Средний темп роста                                         │
├───────────────────────────────┬────────────────────────────────────────────────────────────────────┤
│                 __            │                                                                    │
│                /y             │           ______                                                   │
│     _         / n            │_         / 2018                                                    │
│     Т = n-1 / -- × 100%     │Т = 6-1 / ------ × 100% = 99,4%                                    │
│      d     \/   y             │ d     \/ 2075,4                                                   │
│                  1            │                                                                    │
├───────────────────────────────┴────────────────────────────────────────────────────────────────────┤
│                                        Средний темп прироста                                       │
├───────────────────────────────┬────────────────────────────────────────────────────────────────────┤
│      _         _              │_                                                                   │
│      Т       = Т – 100%      │Т       = 99,4% – 100% = -0,6%                                      │
│       йота d    d             │ йота d                                                             │
└───────────────────────────────┴────────────────────────────────────────────────────────────────────┘

ШАГ N 4. Проанализировать полученные результаты (табл. 4, 5).
ЗАКЛЮЧЕНИЕ ПО ПРИМЕРУ. Судя по показателям абсолютного прироста, в Регионе с каждым годом численность населения снижается. В 2018 г. она была на 57,4 тыс. человек меньше, чем в 2013 г. Вместе с тем уменьшается разница по численности населения от года к году: если в 2014 г. по сравнению с предыдущим 2013 г. численность населения снизилась на 16,9 тыс. чел., то в 2018 г. по сравнению с 2017 г. – только на 7,6 тыс. чел. (табл. 4).
Судя по показателям темпа роста, в 2018 году численность составила 97,2% от уровня 2013 года. Наибольшее же уменьшение показателя за год отмечено в 2014 году, когда численность населения составила 99,2% по отношению к 2013 г., а наименьшее – в 2017 – 2018 гг., когда численность населения составила 99,6% от предыдущего уровня. Судя по показателям темпа прироста, в течение всего изученного периода отмечался отрицательный прирост или убыль населения. К концу периода произошло уменьшение численности населения на 2,8% по сравнению с началом. Темпы убыли населения снижались: в 2014 показатель сократился на 0,8%, а в 2018 году – на 0,4% по сравнению с предыдущим годом (табл. 4). В среднем за период 2013 – 2018 гг. численность населения в Регионе составляла 2042,4 тыс. чел., убывала в среднем на 11,48 тыс. чел., то есть со скоростью 0,6% в год, составляла в среднем 99,4% в каждом последующем году по сравнению с предыдущим (табл. 5).
Примечания.
Расчет среднего уровня ряда для интервального ряда динамики, если все интервалы равны между собой, рассчитывается как средняя арифметическая простая по формуле:

_   SUM y
y = -----,
      n

где:
SUM y – сумма уровней ряда;
n – число уровней.
Все расчеты следует проводить автоматически в Microsoft Excel.

[1] Социально-гигиенический мониторинг – государственная система наблюдений за состоянием здоровья населения и среды обитания, их анализа, оценки и прогноза, а также определения причинно-следственных связей между состоянием здоровья населения и воздействием факторов среды обитания.

[2] Федеральный информационный фонд данных социально-гигиенического мониторинга – база данных о состоянии здоровья населения и среды обитания человека, сформированная на основе постоянных системных наблюдений, а также совокупность нормативных правовых актов и методических документов по вопросам анализа, прогноза и определения причинно-следственных связей между состоянием здоровья населения и воздействием факторов среды обитания человека.

[3] Статистическая значимость результата (p-уровень) – оцененная мера уверенности в "истинности" результата представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю популяцию. Например, p-уровень = 0,05 (т.е. 1/20) показывает, что имеется 5% вероятность, что найденная в выборке связь между переменными является лишь случайной особенностью данной выборки. p = 0,05 рассматривается как "приемлемая граница" уровня ошибки. Значение уровня значимости следует приводить с точностью до трех знаков за запятой (как = 0,000..., а не < 0,05).

[4] Переменные – это то, что можно измерять, контролировать или изменять в анализе.

[5] Графический анализ – анализ, проводимый на основе визуальной информации (диаграммы, картограммы).

[6] Безусловно, анализ можно проводить и в других пакетах прикладных программ статистического анализа данных. В данных Рекомендациях приведены примеры в формате Statistica с целью сохранения возможности приведения пошаговых инструкций, способствующих воспроизведению анализа.

[7] Персентиль (Р) – непараметрическая мера разброса данных вариационного ряда, когда минимальному значению в ряду присваивается значение Р0, а максимальному – Р100. Серединой ряда является медиана – Р50. Если ряд делится на пять равных частей, части называются квинтили, на четыре равные части – квартили, на десять равных частей – децили. Этот метод часто используется для разработки границ статистической нормы.

[8] Здесь и далее используются следующие знаки: "*" – знак умножения; "/" – знак деления; "|" – знак модуля.

Другие статьи по теме

Статистические методы анализа медико-демографических показателей (часть 2)

Категория: Медицинская статистика | Добавил: zdrav1 (21.06.2020)

Просмотров: 1706 | Теги: Статистические методы анализа

Всего комментариев: 0