Главная » Статьи » Медицинская статистика |
Статистические методы анализа медико-демографических показателей (часть 1)
Медико-демографическая ситуация в нашей стране является объектом самого пристального внимания в виду возрастающей депопуляции. Уменьшение численности населения и трудовых ресурсов, высокие показатели смертности, низкая рождаемость, постарение нации вызывают самые мрачные прогнозы в отношении стратегического развития страны. Известна высокая информативная значимость медико-демографических показателей в отношении влияния факторов среды обитания различной природы – физических, химических, биологических и социально-экономических. Ввиду вышеизложенного анализ медико-демографической ситуации имеет первостепенное значение в рамках социально-гигиенического мониторинга[1]. Многими научными исследованиями показана основная роль социально-экономических факторов среды обитания в ухудшении медико-демографической ситуации в стране, чем и объясняется введение в Федеральный информационный фонд данных социально-гигиенического мониторинга (ФИФ СГМ)[2] раздела "Сведения о социально-экономическом состоянии территории". На данном этапе развития социально-гигиенического мониторинга задачей первостепенной важности является анализ накопленных информационных массивов и получение результата многолетней деятельности по организации системы социально-гигиенического мониторинга и сбору данных в виде регионально-ориентированных профилактических программ. Несмотря на разработанные методические подходы к анализу медико-демографической ситуации, для практики социально-гигиенического мониторинга он все еще представляет определенные трудности ввиду отсутствия подготовленных статистиков-аналитиков и специально разработанных технологий. Задачами статистического анализа медико-демографических показателей территорий являются: 1) определение основных пространственных и временных закономерностей изменения медико-демографических показателей; 2) определение территорий риска по медико-демографической ситуации в общей совокупности территорий; 3) оценка качества статистики по медико-демографическим показателям; 4) выявление причин (условий) формирования той или иной медико-демографической ситуации в регионе (районе), ведущих социально-экономических факторов, способствующих ухудшению медико-демографической ситуации; 5) определение основных направлений регионально-ориентированных профилактических программ. Сбор данных и формирование базы данных Сбор данных является одним из основных разделов деятельности специалистов исходя из задач социально-гигиенического мониторинга. Сбор данных должен осуществляться параллельно с формированием базы данных. База данных – упорядоченный массив чисел, электронная таблица вида m × n, где m – число строк и n – число столбцов. База данных играет решающую роль в анализе и его результатах, отражает план и потенциал работы. От качества базы данных зависят точность результатов и достоверность выводов, полученных в результате ее статистической обработки. Строки базы данных – это, как правило, наименования единиц совокупности, включенных в анализ (фамилии участников групп, номера животных, административные территории и др.). На языке статистики единицы совокупности называются случаями. Чем больше случаев, тем больше численность выборки, что имеет решающее значение для статистической значимости результатов[3]. Так, результаты корреляционного анализа на выборке численностью менее 10 весьма сомнительны. Столбцы – это те характеристики совокупности, которые решено изучить (заболеваемость, смертность, численность и плотность населения, удельный вес жителей села, характеристики загрязнения и проч.; для выборки, состоящей из людей, – это пол, возраст и т.п.). На языке статистики характеристики совокупности называются переменные[4]. База данных предназначена для накопления, структурирования, обработки с помощью компьютера и хранения информации. С использованием базы данных проводится анализ, оценка и прогноз ситуации на основе определения причинно-следственных связей между состоянием здоровья населения и воздействием факторов среды обитания с последующей разработкой мер профилактики. Пошаговая инструкция по формированию базы данных ШАГ N 1. Сформировать макет базы данных с названиями строк и столбцов. Первичная база данных должна включать всю совокупность регионов или муниципальных образований, выделяемых Федеральной службой статистики (названия строк), и весь перечень медико-демографических и социально-экономических показателей, определенных приказом Роспотребнадзора от 30.12.2005 N 810 "О Перечне показателей и данных для формирования Федерального информационного фонда социально-гигиенического мониторинга". ШАГ N 2. Сформировать перечень полных и кратких названий мониторируемых показателей (столбцов базы данных). Краткие названия необходимы для обозначения показателей в электронных таблицах, где объем названия ограничен по техническим причинам (табл. 1). Таблица 1
ФРАГМЕНТ ПЕРЕЧНЯ НАИМЕНОВАНИЙ БАЗЫ МЕДИКО-ДЕМОГРАФИЧЕСКИХ ДАННЫХ
ШАГ N 3. Сформировать базу данных в формате Microsoft Excel вручную либо вставляя табличные данные из Microsoft Word или других программ. ШАГ N 4. Следует избегать пробелов базы данных. В некоторых случаях пустые клетки могут быть заполнены путем введения средних величин по совокупности, за период, либо за два соседних периода. ШАГ N 5. Проверить правильность формирования базы данных методом графического анализа[5]. Следует построить точечную диаграмму, используя функции Мастер диаграмм Microsoft Excel – Точечная. В случае получения сильно отличающихся от основного массива данных следует проверить эти данные в источнике исходной информации. ШАГ N 6. Сформировать ту же базу данных в формате пакета прикладных программ Statistica[6], используя опцию Открытие. В окне Тип файлов выбрать Все, найти и открыть нужный файл Microsoft Excel – Импортировать выбранный лист в электронную таблицу. Выбрать нужный лист, отжать флажки Получить имена случаев и Получить имена переменных. Нажать ОК. ШАГ N 7. В базе данных формата Statistica ввести полные наименования показателей в окне Переменные, которое должно быть получено двойным щелчком на названии столбца (кратком наименовании). ШАГ N 8. Организовать хранение исходной базы в неизменном виде, все виды анализа проводить в копиях базы данных. ШАГ N 9. Руководителям отделов социально-гигиенического мониторинга вести личный контроль за ведением и хранением баз данных. Описательная статистика Описательная статистика – комплекс базовых приемов анализа данных вариационного ряда, дающий наиболее общее представление о распределении той или иной характеристики в изучаемой совокупности. Этапы анализа распределения: 1) расчет параметров описательной статистики (распределения); 2) графический анализ графика распределения (гистограммы) с визуальной оценкой смещения центра распределения ряда; 3) расчет критериев нормальности распределения. Параметры описательной статистики (распределения): среднее арифметическое, ошибка среднего, медиана (срединное значение вариационного ряда), мода (наиболее частое значение ряда), стандартное отклонение (мера вариабельности данных в ряду), минимум (минимальное значение в ряду), максимум (максимальное значение в ряду), счет (количество членов ряда). Гистограмма – столбиковая диаграмма, позволяющая судить о том, сколько элементов совокупности попало в тот или иной диапазон значений. Асимметрия – смещение центра, вершины гистограммы в горизонтальном отношении (вправо – влево), эксцесс – в вертикальном (вверх – вниз) относительно колоколообразной формы нормального распределения. Критерии нормальности – критерии, позволяющие оценить характер распределения, значимость его отклонения от нормального: хи-квадрат, критерий Колмогорова-Смирнова, W критерий Шапиро-Уилка. Значение p < 0,05 критерия указывает на значимое отклонение распределения от нормального и предпочтение непараметрических методов статистического анализа (хи-квадрат, ранговую корреляцию и др.). Описательная статистика позволяет получить первое общее представление, например, о том или ином медико-демографическом показателе на изучаемой территории. Числовые и визуальные результаты описательной статистики позволяют также решить вопрос выбора параметрических или непараметрических методов дальнейшего анализа данных. Описательная статистика обладает самостоятельным значением и обязательна для применения в медико-демографических и социально-экономических исследованиях. Пошаговая инструкция Пример. Требуется изучить рождаемость среди населения в муниципальных образованиях Региона за ШАГ N 1. В файле Microsoft Excel сформировать вариационный ряд: в столбце А – названия районов Региона, в столбце Б – значения рождаемости в этих районах, на 100 тыс. ШАГ N 2. Рассчитать на основе этого ряда числовые параметры описательной статистики, применив соответствующие статистические функции: среднее арифметическое (СРЗНАЧ), значения медианы (МЕДИАНА), мода (МОДА), стандартное отклонение (СТАНДОТКЛОН), минимального и максимального значений ряда (МИН, МАХ), размера совокупности (СЧЕТ). Например, рассчитать медиану следует путем введения в окно формул со значком f на панели инструментов формулы =МЕДИАНА(B2:B30). ШАГ N 3. В случае необходимости анализа нескольких медико-демографических характеристик расчеты следует проводить в ППП Statistica. Там же следует построить гистограмму и рассчитать критерии нормальности всех медико-демографических характеристик путем применения опции Основные статистики – Описательная статистика – Расширенный анализ – Нормальность – Гистограмма. ШАГ N 4. Проанализировать результаты. ЗАКЛЮЧЕНИЕ ПО ПРИМЕРУ. В Регионе в Примечания. Существуют определенные правила ввода формул в Microsoft Excel: все формулы в Microsoft Excel начинаются со знака "="; не следует допускать лишних пробелов, знаков препинания; нельзя путать знаки препинания, например запятую и точку с запятой; названия функций писать по-русски, а диапазоны обозначать английскими буквами (диапазоны лучше выделять мышкой). Следует всегда проверять формулы, поставив курсор сразу после формулы в окне со значком fx на панели инструментов. При этом формула в окне должна быть неизменна, ссылка должна занимать нужный диапазон, а меняться должно только значение конкретного элемента совокупности. Обращать также внимание на диапазон, сравнивая выделение соответствующих элементов разными цветами в формуле и на листе. Неопытному пользователю следует посоветовать пользоваться услугами Функция в меню Вставка и изучать детальнейшую Справку Microsoft Excel. Сравнение данных: методы сравнения групп Методы сравнения групп являются классическими и наиболее распространенными методами сравнения данных. Группами в случае мониторинга медико-демографических показателей будут совокупности районов двух регионов, разных территорий региона, объединенных по какому-либо признаку и т.д. Существует довольно много методов сравнения групп. Все они основаны на применении т.н. нулевой гипотезы (о том, что различия между группами не значимы, не существенны) и определении ее справедливости. Если вероятность получить наблюдаемые или более сильные различия в повторных выборках мала (максимально приемлемая вероятность ее отвергнуть – уровень значимости p = 0,05), то нулевая гипотеза отвергается, то есть различия между группами значимы. Один из основных методов оценки различий между группами – дисперсионный анализ, основанный на сравнении разброса выборочных средних в группах с разбросом значений внутри группы с помощью дисперсии и расчета критерия F. Разновидностью дисперсионного анализа в случае сравнения двух групп является t-критерий, который также имеет варианты – сравнение независимых групп (например, в случае сравнения рождаемости в совокупностях районов двух регионов) и сравнение зависимых групп (например, в случае сравнения рождаемости в районах области в Непараметрическими аналогами дисперсионного анализа и t-критерия являются в случае сравнения двух независимых групп критерий Манна-Уитни, нескольких независимых групп – критерий Крускала-Уоллиса, двух зависимых групп – критерий Уилкоксона. Расчет этих критериев следует проводить на базе Statistica с применением опций Основные статистики (t-критерий), ANOVA (дисперсионный анализ) и Непараметрические методы (критерии Манна-Уитни, Крускала-Уоллиса, Уилкоксона). Все опции предполагают также графический анализ данных. Сравнение данных с указанием значимости различий – основа статистического анализа данных. Только таким образом можно оценивать, насколько случайны различия между группами, следует ли принимать во внимание различия, являются ли они следствием влияния каких-то важных факторов. Пошаговая инструкция. ПРИМЕР 1. Требуется сравнить показатели заболеваемости детей в возрасте 0 – 14 лет и заболеваемости подростков в возрасте 15 – 17 лет в районах Региона в ШАГ N 1. В файле Statistica сформировать базу данных вида m × n, где m – перечень районов Региона, а n – переменные Заболеваемость детей и Заболеваемость подростков. ШАГ N 2. Провести оценку распределения по алгоритму, приведенному в предыдущем разделе. Убедиться, что обе переменные распределены нормально. ШАГ N 3. Провести расчеты t-критерия, применив опции Статистика – Основные статистики – t-тест для зависимых выборок. В результате будет получена таблица с итогами расчетов (табл. 2). Таблица 2
РЕЗУЛЬТАТЫ РАСЧЕТА t-КРИТЕРИЯ В ФОРМАТЕ STATISTICA
ПРИ СРАВНЕНИИ ЗАБОЛЕВАЕМОСТИ ДЕТЕЙ И ПОДРОСТКОВ В РЕГИОНЕ
ШАГ N 4. Проанализировать результаты. ЗАКЛЮЧЕНИЕ ПО ПРИМЕРУ. В ПРИМЕР 2. Требуется сравнить показатели рождаемости среди населения в ШАГ N 1. В файле Statistica сформировать базу данных вида m × n, где m – перечень районов Региона, а n – две переменные: Географ и Рождаемость. Обратить внимание на группирующую переменную Географ. Она имеет ключевое значение для анализа, так как таким образом автор дает понять программе Statistica, на какие же группы разделена совокупность. В данном случае совокупность разделена на четыре группы – зоны Региона согласно делению, принятому официально: 1 – северная зона, 2 – северная лесостепь, 3 – южная лесостепь, 4 – степная. ШАГ N 2. Провести расчеты критерия Краскела-Уоллиса, применив опцию Статистика – Непараметрические методы – Независимые выборки. Выбрать переменные в окне Переменные: как группирующую – переменную Географ, как зависимую – переменную Рождаемость. В результате будет получена таблица с итогами расчетов: H(3, N = 32) = 8,8707, p = 0,031. ШАГ N 3. Для визуализации результатов применить опцию Объемно-точечная диаграмма. ШАГ N 4. Проанализировать результаты. ЗАКЛЮЧЕНИЕ ПО ПРИМЕРУ. В Сравнение данных: картографический анализ Картографический анализ данных является разновидностью географических методов исследования, которые применяют для количественной и качественной характеристик объектов внешней среды на территории больших регионов. Картографический анализ данных на современном уровне позволяют провести геоинформационные системы. Современные геоинформационные системы предлагают ряд других способов – совокупность может быть разделена на квартили (4 равных интервала), квинтили (5 равных интервалов), по методу персентилей[7] (вводятся другие значения Р), по сигмальному методу (использовать в случае нормального распределения данных) и вручную, когда для обозначения границ интервалов имеется возможность вводить любые цифры. В случае отсутствия соответствующих функций в геоинформационной системе значения границ интервалов рассчитать для каждого класса болезней и ввести вручную. Картографический анализ данных позволяет визуально получить представление о распространении того или иного явления на территории, выделить территории риска. В ряде случаев в результате картографического анализа данных возможна формулировка гипотез о факторах, способствующих формированию изучаемого явления. Пошаговая инструкция Пример. Требуется провести картографический анализ инвалидности детей в регионах России с выделением медико-географических закономерностей ее формирования и территорий риска по той или иной нозологической форме. ШАГ N 1. Сформировать базу данных вида m × n, где m – перечень регионов страны, а n – инвалидность детей вследствие разных болезней (17 классов болезней). ШАГ N 2. Для всех классов болезней по методу персентилей рассчитать границы четырех интервалов (квартилей), на которые будет разделена совокупность регионов в процессе построения карт: интервал низких значений – Р0 – Р25, значений ниже средних – Р25 – Р50, значений выше средних – Р50 – Р75, высокие значения – Р75 – Р100 (разделение по квартилям). ШАГ N 3. Проанализировать полученные карты. ЗАКЛЮЧЕНИЕ ПО ПРИМЕРУ. Судя по приведенным картам, в России существуют определенные географические различия инвалидизации детей. Так, Сибирь и Дальний Восток следует считать территорий риска инвалидизации детей вследствие инфекционных и паразитарных заболеваний (чаще всего это туберкулез), так как большинство регионов этих федеральных округов вошли в верхний и третий квартили ряда (выше среднего по России). Другими центрами этой патологии в России следует считать некоторые регионы Приволжского, Южного федеральных округов, севера европейской части России. Европейскую часть России следует признать территорией риска инвалидизации детей вследствие болезней эндокринной системы, расстройств питания и нарушений обмена веществ: подавляющее большинство европейских регионов составили верхний и третий квартили ряда. Визуально четко прослеживается уменьшение показателей с запада на восток страны. Примечания. В случае нормального распределения данных вариационного ряда границы интервалов для картографирования следует рассчитывать по методу сигмальных отклонений (табл. 3). Не следует увеличивать количество интервалов, особенно в случае небольшого числа субтерриторий, так как визуальный анализ затрудняется. Таблица 3
РАСЧЕТ ГРАНИЦ ИНТЕРВАЛОВ СТАТИСТИЧЕСКОЙ НОРМЫ
ПО МЕТОДУ СИГМАЛЬНЫХ ОТКЛОНЕНИЙ (дельта)
Сравнение данных: структурный профиль Структурный профиль – это визуальное представление числовых выражений частей многокомпонентного явления на столбиковой диаграмме с нанесением интервалов статистической нормы. Способ основан на определении границ статистической нормы методом персентилей для каждого класса болезни: Р25 – Р75. Суть анализа в том, чтобы можно было определить, попадает ли тот или иной регион в интервал статистической нормы. Если регион попадает в интервал "выше нормы" (> Р75), то этот показатель является болезнью (группой) риска для данной территории и в первую очередь нуждается в изучении и коррекции. Анализ структурных профилей необходим для получения наглядного представления об особенностях конкретного показателя на территории в сравнении с генеральными показателями, о разбросе, вариабельности данных по каждой нозологической форме на генеральной территории, о нозологических особенностях конкретного признака среды или здоровья на данной территории по сравнению с аналогичными данными всей совокупности. Дает возможность выделить патологию риска (группу риска, фактор риска) для конкретной территории, с последующими целенаправленными действиями по ее изучению и профилактике. Пошаговая инструкция Пример. Требуется провести анализ профессиональной заболеваемости в совокупности регионов России за период 2007 – 2015 гг. с определением вариабельности показателей и оценкой положения конкретного Региона. В анализ включены сведения по профессиональной заболеваемости во всех регионах страны за 2007 – 2015 гг. (всего 9 показателей по 89 регионам). Анализ следует проводить в Microsoft Excel. ШАГ N 1. В файле Microsoft Excel в интервале A1-I89 сформировать базу данных вида m × n, где m – перечень регионов (89), а n – период (годы) наблюдений с 2007 по 2015 гг. ШАГ N 2. С помощью функции ПЕРСЕНТИЛЬ рассчитать персентили 25, 75 и 50 (Р25, Р75, Р50) для каждого года наблюдений. ШАГ N 3. Рассчитать стандартизованные в персентилях Интервал нормы выше среднего и Интервал нормы ниже среднего для каждого периода наблюдений по формулам, соответственно: =Р75-Р50. =Р50-Р25. ШАГ N 4. Провести стандартизацию всех значений базы данных как отношение данных в каждом из регионов за конкретный год к соответствующей медиане, выраженное в процентах по формуле: =данные каждого региона/Р50*100.[8] ШАГ N 5. Рассчитать стандартизованные относительно медианы значения верхней и нижней границы нормы, медианы, Интервала выше среднего и Интервала ниже среднего как отношение ранее полученных данных (шаги 2 и 3) к соответствующей медиане, выраженное в процентах. Стандартизованные значения медианы всего периода должны составить 100%. ШАГ N 6. Используя функции Мастера диаграмм на диапазоне полученных значений медианы, выраженной как 100%, построить точечный график . ШАГ N 7. Щелкнув правой кнопкой на одной из точек графика, выбрать опцию Формат рядов данных, выбрать окно "Y-погрешности", из предлагаемых Величин погрешности выбрать Пользовательскую. Поставив курсор в ее верхнее окно, внести в него диапазон нормализованных значений Интервала нормы выше среднего и в нижнее окно – Интервал нормы ниже среднего. В результате на графике будет получен российский межрегиональный профиль профессиональной заболеваемости. ШАГ N 8. Выделив диаграмму и расширив ее ссылку на вставленную строку с показателями конкретного Региона, получить график профессиональной заболеваемости в Регионе относительно межрегионального профиля за изучаемый период. ШАГ N 9. Проанализировать с указанием: 1) разброса (вариабельности) показателей на конкретной территории по сравнению со среднероссийскими данными; 2) определением "попадания" Региона в интервал статистической нормы по каждому из признаков; 3) выявлением "проблемных мест" для Региона – показателей, превышающих верхнюю границу статистической нормы для российских регионов, переменные, требующие проверки качества информации. ЗАКЛЮЧЕНИЕ ПО ПРИМЕРУ: судя по границам статистической нормы, наиболее вариабельными данные по профессиональной заболеваемости в регионах России были в начале исследуемого периода – в Анализ динамических рядов Ряды динамики – это ряды последовательно расположенных в хронологическом порядке статистических показателей, которые характеризуют развитие явления во времени. Ряды динамики могут состоять из абсолютных, относительных и средних величин. В зависимости от характера изучаемого явления ряды динамики подразделяются на моментные и интервальные. Моментные ряды динамики отражают состояние изучаемых явлений на определенные моменты времени. В медико-демографических исследованиях это, например, общая инвалидность (число инвалидов на 01.01). Интервальные ряды динамики состоят из интервальных величин и отражают итоги развития изучаемых явлений за отдельные периоды времени. В медико-демографических исследованиях это, например, первичная заболеваемость (число впервые выявленных случаев за год). В каждом ряду динамики имеются два основных элемента: 1) показатели времени – t; 2) уровни развития изучаемого явления – y. Отсюда различаются: 1) начальный уровень ряда y1 – это величина первого показателя ряда; 2) конечный уровень ряда yn – это величина последнего члена ряда. В основе анализа показателей рядов динамики лежит сравнение уровней ряда за различные периоды. К показателям рядов динамики относятся: 1) определение интенсивности изменения уровня за период (абсолютный прирост, темп роста и темп прироста) и 2) расчет средних по рядам динамики (средний уровень ряда, средний абсолютный прирост, средний темп роста, средний темп прироста). Абсолютный прирост (ДЕЛЬТА) – это разница между двумя уровнями ряда динамики в единицах измерения исходной информации. Темп роста (Тр) – это показатель, характеризующий соотношение двух уровней ряда и выражающийся в процентах. Если темпы роста больше 100%, то это показывает, что значение изучаемого явления в рассматриваемом году выросло по сравнению с базисным уровнем. Темп роста, равный 100%, говорит о том, что величина явления в рассматриваемом периоде не изменилась по сравнению с базисным периодом. Темпы роста меньше 100% показывают на уменьшение величины изучаемого явления по сравнению с базисным уровнем. Темпы роста всегда имеют положительный знак. Темп прироста (Тпр) характеризует прирост в относительных величинах. Вычисленный в процентах темп прироста показывает, на сколько процентов изменился рассматриваемый уровень по сравнению с уровнем, принятым за базу сравнения. Средний уровень ряда динамики характеризует типичную для данного динамического ряда величину. Средний абсолютный прирост – это разность между конечным yn и первым y1 уровнями изучаемого периода. Средний темп роста – это обобщающая характеристика темпов роста ряда динамики, которая показывает, как в среднем изменялось изучаемое явление в течение рассматриваемого периода. Средний темп прироста – это обобщающая характеристика темпов роста ряда динамики, которая показывает, как в среднем изменялось изучаемое явление в течение рассматриваемого периода, выражается в процентах. Показатели интенсивности изменения уровня за период могут быть базисными и цепными. Базисные показатели рассчитываются путем сравнения каждого уровня ряда с одним и тем же базисным (исходным) уровнем и отражают итог роста (снижения) явления за изучаемый период. Цепные показатели рассчитываются путем сравнения каждого последующего уровня с предыдущим, взятым в качестве базы сравнения. С помощью цепных показателей измеряют, каковы изменения в отдельные годы рассматриваемого периода. Анализ динамических рядов имеет важнейшее значение в ходе медико-демографических исследований, так как позволяет решить ряд основных вопросов: выявить изменение изучаемого явления (например, медико-демографических процессов) во времени, прогнозировать на его основе дальнейшее развитие ситуации с целью своевременного принятия мер профилактики, оценить эффективность принятых мер, предполагать влияние на процесс каких-либо факторов. Пошаговая инструкция Пример. Требуется провести анализ динамики численности населения Региона. ШАГ N 1. В файле Microsoft Excel сформировать динамический ряд по образцу столбцов табл. 4 Год и Численность населения. ШАГ N 2. Провести расчеты базисных и цепных показателей интенсивности динамики (абсолютного прироста, темпа роста и темпа прироста) численности населения в Регионе по формулам, приведенным в табл. 4. Таблица 4
РАСЧЕТ ПОКАЗАТЕЛЕЙ ИНТЕНСИВНОСТИ ИЗМЕНЕНИЯ
┌────┬───────┬───────────────────────────────────────────────────────────────────────────────────────────┐ЧИСЛЕННОСТИ НАСЕЛЕНИЯ РЕГИОНА ЗА ПЕРИОД 2013-2018 ГГ. │Год │Числен-│ Расчет показателей │ │ │ность │ │ │ │населе-├───────────────────────────────────────────┬───────────────────────────────────────────────┤ │ │ния, │ базисных │ цепных │ │ │тыс. │ │ │ │ │чел. │ │ │ ├────┴───────┴───────────────────────────────────────────┴───────────────────────────────────────────────┤ │ Абсолютный прирост, ДЕЛЬТА │ ├────────────┬───────────────────────────────────────────┬───────────────────────────────────────────────┤ │формула: │ ДЕЛЬТА = y – y │ ДЕЛЬТА = y – y │ │ │ альфа i 1 │ омикрон i i-1 │ ├────┬───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2013│2075,4 │ │ │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2014│2058,5 │2058 – 2075,4 = -16,9 │2058 – 2075,4 = -16,9 │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2015│2046,6 │2046,6 – 2075,4 = -28,8 │2046,6 – 2058,5 = -11,9 │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2016│2034,6 │2034,6 – 2075,4 = -40,8 │2034,6 – 2046,6 = -12,0 │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2017│2025,6 │2025,6 – 2075,4 = -49,8 │2025,6 – 2034,6 = -9,0 │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2018│2018,0 │2018,0 – 2075,4 = -57,4 │2018,0 – 2025,6 = -7,6 │ ├────┴───────┴───────────────────────────────────────────┴───────────────────────────────────────────────┤ │ Темп роста, Тр │ ├────────────┬───────────────────────────────────────────┬───────────────────────────────────────────────┤ │ │ y │ y │ │ │ i │ i │ │формула: │ Тр = -- × 100% │ Тр = ---- × 100% │ │ │ альфа y │ омикрон y │ │ │ 1 │ i-1 │ ├────┬───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2013│2075,4 │ │ │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2014│2058,5 │2058 / 2075,4 × 100% = 99,2% │2058 / 2075,4 × 100% = 99,2% │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2015│2046,6 │2046,6 / 2075,4 × 100% = 98,6% │2046,6 / 2058,5 × 100% = 99,4% │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2016│2034,6 │2034,6 / 2075,4 × 100% = 98,0% │2034,6 / 2046,6 × 100% = 99,4% │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2017│2025,6 │2025,6 / 2075,4 × 100% = 97,6% │2025,6 / 2034,6 × 100% = 99,6% │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2018│2018,0 │2018,0 / 2075,4 × 100% = 97,2% │2018,0 / 2025,6 × 100% = 99,6% │ ├────┴───────┴───────────────────────────────────────────┴───────────────────────────────────────────────┤ │ Темп прироста, Тпр │ ├────────────┬───────────────────────────────────────────┬───────────────────────────────────────────────┤ │формула: │ОМИКРОН йота d = ОМИКРОН d – 100%│ОМИКРОН йота d = ОМИКРОН d – 100%│ │ │ альфа альфа │ омикрон омикрон │ ├────┬───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2013│2075,4 │ │ │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2014│2058,5 │99,2% – 100% = -0,8% │99,2% – 100% = -0,8% │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2015│2046,6 │98,6% – 100% = -1,4% │99,4% – 100% = -0,6% │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2016│2034,6 │98,0% – 100% = -2,0% │99,4% – 100% = -0,6% │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2017│2025,6 │97,6% – 100% = -2,4% │99,6% – 100% = -0,4% │ ├────┼───────┼───────────────────────────────────────────┼───────────────────────────────────────────────┤ │2018│2018,0 │97,2% – 100% = -2,8% │99,6% – 100% = -0,4% │ └────┴───────┴───────────────────────────────────────────┴───────────────────────────────────────────────┘ ШАГ N 3. Провести расчет средних по ряду динамики (среднего уровня ряда, среднего абсолютного прироста, среднего темпа роста, среднего темпа прироста) численности населения Региона по формулам, приведенным в табл. 5. Таблица 5 РАСЧЕТ СРЕДНИХ ПО РЯДУ ДИНАМИКИ ПОКАЗАТЕЛЕЙ ЧИСЛЕННОСТИ НАСЕЛЕНИЯ РЕГИОНА ЗА ПЕРИОД 2013-2018 ГГ. ┌───────────────────────────────┬────────────────────────────────────────────────────────────────────┐ │ Формула │ Расчет │ ├───────────────────────────────┴────────────────────────────────────────────────────────────────────┤ │ Средний уровень ряда │ ├───────────────────────────────┬────────────────────────────────────────────────────────────────────┤ │ 1 1 │ 1 1 │ │ – y + y +...+ y + – y │ – 2075,4 + 2058,5 + 2046,6 + 2034,6 + 2025,6 + – 2018,0 │ │_ 2 1 2 n-1 2 n│_ 2 2 │ │y = ---------------------------│y = ------------------------------------------------------- = 2042,4│ │ n – 1 │ 6 – 1 │ ├───────────────────────────────┴────────────────────────────────────────────────────────────────────┤ │ Средний абсолютный прирост │ ├───────────────────────────────┬────────────────────────────────────────────────────────────────────┤ │ y – y │ │ │ _ n 1 │ _ 2018,0 – 2075,4 │ │ ДЕЛЬТА y = ------- │ДЕЛЬТА y = --------------- = -11,48 │ │ n – 1 │ 6 – 1 │ ├───────────────────────────────┴────────────────────────────────────────────────────────────────────┤ │ Средний темп роста │ ├───────────────────────────────┬────────────────────────────────────────────────────────────────────┤ │ __ │ │ │ /y │ ______ │ │ _ / n │_ / 2018 │ │ Т = n-1 / -- × 100% │Т = 6-1 / ------ × 100% = 99,4% │ │ d \/ y │ d \/ 2075,4 │ │ 1 │ │ ├───────────────────────────────┴────────────────────────────────────────────────────────────────────┤ │ Средний темп прироста │ ├───────────────────────────────┬────────────────────────────────────────────────────────────────────┤ │ _ _ │_ │ │ Т = Т – 100% │Т = 99,4% – 100% = -0,6% │ │ йота d d │ йота d │ └───────────────────────────────┴────────────────────────────────────────────────────────────────────┘ ШАГ N 4. Проанализировать полученные результаты (табл. 4, 5). ЗАКЛЮЧЕНИЕ ПО ПРИМЕРУ. Судя по показателям абсолютного прироста, в Регионе с каждым годом численность населения снижается. В Судя по показателям темпа роста, в 2018 году численность составила 97,2% от уровня 2013 года. Наибольшее же уменьшение показателя за год отмечено в 2014 году, когда численность населения составила 99,2% по отношению к Примечания. Расчет среднего уровня ряда для интервального ряда динамики, если все интервалы равны между собой, рассчитывается как средняя арифметическая простая по формуле: _ SUM y y = -----, n где: SUM y – сумма уровней ряда; n – число уровней. Все расчеты следует проводить автоматически в Microsoft Excel. [1] Социально-гигиенический мониторинг – государственная система наблюдений за состоянием здоровья населения и среды обитания, их анализа, оценки и прогноза, а также определения причинно-следственных связей между состоянием здоровья населения и воздействием факторов среды обитания.
[2] Федеральный информационный фонд данных социально-гигиенического мониторинга – база данных о состоянии здоровья населения и среды обитания человека, сформированная на основе постоянных системных наблюдений, а также совокупность нормативных правовых актов и методических документов по вопросам анализа, прогноза и определения причинно-следственных связей между состоянием здоровья населения и воздействием факторов среды обитания человека.
[3] Статистическая значимость результата (p-уровень) – оцененная мера уверенности в "истинности" результата представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю популяцию. Например, p-уровень = 0,05 (т.е. 1/20) показывает, что имеется 5% вероятность, что найденная в выборке связь между переменными является лишь случайной особенностью данной выборки. p = 0,05 рассматривается как "приемлемая граница" уровня ошибки. Значение уровня значимости следует приводить с точностью до трех знаков за запятой (как = 0,000..., а не < 0,05).
[4] Переменные – это то, что можно измерять, контролировать или изменять в анализе.
[5] Графический анализ – анализ, проводимый на основе визуальной информации (диаграммы, картограммы).
[6] Безусловно, анализ можно проводить и в других пакетах прикладных программ статистического анализа данных. В данных Рекомендациях приведены примеры в формате Statistica с целью сохранения возможности приведения пошаговых инструкций, способствующих воспроизведению анализа.
[7] Персентиль (Р) – непараметрическая мера разброса данных вариационного ряда, когда минимальному значению в ряду присваивается значение Р0, а максимальному – Р100. Серединой ряда является медиана – Р50. Если ряд делится на пять равных частей, части называются квинтили, на четыре равные части – квартили, на десять равных частей – децили. Этот метод часто используется для разработки границ статистической нормы.
[8] Здесь и далее используются следующие знаки: "*" – знак умножения; "/" – знак деления; "|" – знак модуля.
| ||||||||||||||||||||||||||||||||||||||||||||||||
Категория: Медицинская статистика | Добавил: zdrav1 (21.06.2020) | ||||||||||||||||||||||||||||||||||||||||||||||||
Просмотров: 1345 | |
Всего комментариев: 0 | |