URSS.ru - Издательская группа URSS. Научная и учебная литература
Об издательстве Интернет-магазин Контакты Оптовикам и библиотекам Вакансии Пишите нам
КНИГИ НА РУССКОМ ЯЗЫКЕ


 
Вернуться в: Каталог  
Обложка Халафян А.А. Современные статистические методы медицинских исследований
Id: 182460
 
699 руб.

Современные статистические методы медицинских исследований. Изд.3

URSS. 2014. 320 с. Твердый переплетISBN 978-5-9710-1010-4.

 Аннотация

В настоящей монографии приведены результаты научных исследований, проведенных автором совместно с врачами-исследователями. На основе реальных медицинских показателей изложена технология современного статистического анализа данных в среде пакета прикладных программ STATISTICA. Представлены классические многомерные и современные углубленные методы анализа данных: множественный регрессионный анализ, кластерный анализ, факторный анализ, анализ главных компонент и классификация, многомерное шкалирование, анализ соответствий, канонический анализ, дискриминантный анализ, общие модели дискриминантного анализа, дисперсионный анализ, деревья классификации, анализ выживаемости, моделирование структурными уравнениями, временные ряды и прогнозирование.

Уделено внимание постановочной части рассмотренных методов и интерпретации результатов. Показаны возможности пакета при разработке диагностических программ.

Книга рассчитана на широкий круг читателей, в числе которых: врачи, занимающиеся исследовательской работой, профессорско-преподавательский состав, аспиранты, студенты и научные работники медико-билогических вузов, заинтересованные в применении современных технологий статистического анализа данных; а также все специалисты, использующие анализ данных в различных прикладных областях знаний.


 Оглавление

ВВЕДЕНИЕ
ГЛАВА 1. СИСТЕМНЫЙ ПОДХОД И ПРОБЛЕМЫ ИНФОРМАТИЗАЦИИ В СОВРЕМЕННОЙ МЕДИЦИНЕ
 1.1. Системный анализ в медицине
 1.2. Проблемы информатизации в медицине
 1.3. Детерминированные и стохастические математические модели в медицинских исследованиях
ГЛАВА 2. МНОГОМЕРНЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ СТРУКТУРЫ МЕДИЦИНСКИХ ДАННЫХ
 2.1. Кластерный анализ
  2.1.1. Кластерный анализ больных нефроптозом методом к-средних
  2.1.2. Кластерный анализ больных нефроптозом методом иерархическая классификация
 2.2. Дисперсионный анализ
  2.2.1. Дисперсионный анализ клинико-лабораторных показателей больных нефроптозом
 2.3. Факторный анализ
  2.3.1. Факторный анализ клинико-лабораторных показателей больных лептоспирозом
 2.4. Анализ главных компонент и классификация
  2.4.1. Классификация больных гипертонией при наличии или отсутствии сахарного диабета методом анализ главных компонент
 2.5. Многомерное шкалирование
  2.5.1. Многомерное шкалирование больных гипертонией
 2.6. Анализ соответствий
  2.6.1. Анализ соответствий углов ротации и степени опущения почек у больных нефроптозом
 2.7. Канонический анализ
  2.7.1. Канонический анализ клинико-лабораторных показателей больных лептоспирозом
ГЛАВА 3. УГЛУБЛЕННЫЕ МЕТОДЫ АНАЛИЗА
 3.1. Анализ выживаемости
  3.1.1. Анализ таблицы времен жизни больных лептоспирозом
  3.1.2. Оценка функции выживаемости
  3.1.3. Выживаемость в различных группах больных
  3.1.4. Модель зависимости времени жизни больных от возраста
 3.2. Моделирование структурными уравнениями
  3.2.1. Моделирование структурными уравнениями факторов заболеваемости больных лептоспирозом
 3.3. Прогнозирование временными рядами
  3.3.1. Анализ динамики заболеваемости лептоспирозом в г. Краснодаре. Исследование структуры временного ряда
  3.3.2. Модель проинтегрированного скользящего среднего АРПСС
  3.3.3. Экспоненциальное сглаживание и прогноз
ГЛАВА 4. МНОГОМЕРНЫЕ МЕТОДЫ ИДЕНТИФИКАЦИИ СОСТОЯНИЯ БОЛЬНЫХ
 4.1. Множественный регрессионный анализ
  4.1.1. Построение регрессионной модели 6-минутного теста
  4.1.2. Программа DIREAN прогнозирования функционального класса хронической сердечной недостаточности
 4.2. Дискриминантный анализ
  4.2.1. Дискриминантный анализ больных, страдающих хронической сердечной недостаточностью
  4.2.2. Программа DIXCH определения функционального класса хронической сердечной недостаточности
  4.2.3. Дискриминантный анализ больных лептоспирозом
  4.2.4. Программа DILEPTS идентификации состояния больных лептоспирозом
  4.2.5. Дискриминантный анализ больных нефроптозом
  4.2.6. Программа SEAR определения степени ротации патологически подвижной почки
 4.3. Общие модели дискриминантного анализа
  4.3.1. Общие модели дискриминантного анализа больных, страдающих хронической сердечной недостаточностью
  4.3.2. Программа ODAXCH определения функционального класса хронической сердечной недостаточности
 4.4. Деревья классификации
  4.4.1. Построение дерева классификации больных, страдающих хронической сердечной недостаточностью
  4.4.2. Программа DITREAN определения функциональных классов хронической сердечной недостаточности
  4.4.3. Построение дерева классификации больных нефроптозом
  4.4.4. Программа TREENEF определения групп больных по степени ротации почки
  4.4.5. Построение дерева классификации больных лептоспирозом
  4.4.6. Программа TREELEPTS идентификации состояния больных лептоспирозом
 4.5. Программный комплекс идентификации состояния больных
 4.6. Сравнительный анализ методов идентификации состояния больных
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА

 Введение

Посвящается
моей сестре Амбарцумян Огиде Альбертовне
и брату Халафян Андранику Альбертовичу

Человеческий организм -- это функциональная биологическая система со сложными и еще далеко не изученными взаимосвязями как между элементами внутри системы, так и с окружающей средой. Поэтому медицинские исследования должны проводиться на основе системного анализа. Одним из этапов или методов системного анализа является математическое моделирование, включающее построение и анализ как детерминированных, так и вероятностно-статистических моделей. Таким образом, математическое моделирование и применение вероятностно-статистических методов анализа данных должны быть неотъемлемой частью исследований в области медицины.

Конечная цель научного исследования заключается в нахождении связей (зависимостей) между признаками, характеризующими объекты исследования. В частности математическая статистика разрабатывает вероятностные модели установления статистических закономерностей и получения научно обоснованных выводов о массовых явлениях из данных наблюдений или экспериментов. В медицине в качестве объектов исследования могут выступать больные, а в качестве признаков -- клинико-лабораторные показатели, характеризующие состояние больного. Поэтому применение вероятностно-статистического моделирования как метода системного анализа в медицинских исследованиях направлено на исследование закономерностей функционирования человеческого организма как биологической системы.

При этом особую актуальность приобретают методы многомерного статистического анализа, при помощи которых можно строить не только оптимальные планы сбора, систематизации и обработки медицинских данных, но и выявить характер и структуру сложных взаимосвязей между компонентами исследуемого многомерного признака. Под многомерным признаком понимается совокупность показателей, характеризующих исследуемый объект. В данном случае -- это человек, как биологическая система с совокупностью показателей, характеризующих его состояние. Результаты анализа данных и построенные вероятностно-статистические модели могут быть использованы при принятии медицинских решений по стратегии и тактике лечения больных.

Развитие современных информационных технологий, в частности статистических пакетов прикладных программ (ППП), делает возможным более эффективно использовать, как правило, достаточно трудоемкие многомерные статистические методы. Одним из наиболее известных и широко применяемых статистических ППП является программа STATISTICA (USA).

В монографии приведены результаты научных исследований, проведенных автором совместно с учеными и врачами Кубанского государственного медицинского университета -- доктором медицинских наук, профессором, заведующей кафедрой факультетской терапии Л.Н.Елисеевой; доктором медицинских наук, профессором кафедры госпитальной хирургии с курсом урологии А.С.Татевосяном; кандидатом медицинских наук, главным врачом ГУЗ "Специализированная клиническая инфекционная больница" департамента здравоохранения Краснодарского края В.Н.Городиным; кандидатом медицинских наук, врачом-урологом Краснодарской городской клинической больницы скорой медицинской помощи А.Г.Тоняном; кандидатом медицинских наук, врачом Центра медицинской профилактики департамента здравоохранения Краснодарского края С.Г.Сафоновой в таких областях медицины, как кардиология, урология, инфекционные болезни. Статистическими методами (множественный регрессионный анализ, кластерный анализ, факторный анализ, анализ главных компонент и классификация, многомерное шкалирование, анализ соответствий, канонический анализ, дискриминантный анализ, общие модели дискриминантного анализа, дисперсионный анализ, деревья классификации, анализ выживаемости, моделирование структурными уравнениями) была исследована структура медицинских данных.

Исследование и анализ данных позволили решить задачу идентификации состояния больных. В качестве инструментария исследований и диагностики использованы ППП STATISTICA 6.0 и разработанный под руководством автора комплекс программ в среде ППП STATISTICA 6.0.

Подробное описание технологии работы с ППП STATISTICA 6.0 дано в другом издании автора -- учебном пособии "Статистический анализ данных. STATISTICA 6.0", изданном в  г. Москве, в 2007 г.

При работе со статистическими методами и моделями важными являются содержательная часть решаемых задач, идеология методов, ограничения на характер исходных данных и интерпретация результатов. Поэтому в описании статистических методов дан тот необходимый объем информации, который нужен читателю для полного понимания результатов исследований. С этой целью в монографии достаточно подробно описываются задачи, решаемые данным методом, требования к исходным данным, построенные таблицы и графики.

Все таблицы и графики сопровождаются указанием "пути", в котором прописаны названия модулей, вкладок и кнопок, последовательная активация которых приводит к построению данной таблицы или графика. Читатель при проведении собственных исследований сможет воспроизвести получение тех или иных таблиц и графиков по указанному пути и правильно их интерпретировать.

Исходные данные для статистического анализа представляют таблицу, строки которой обозначают объекты исследования (например, больных). В терминологии ППП STATISTICA строки называются наблюдениями. Столбцы обозначают переменные (признаки), описывающие наблюдения, например клинико-лабораторные показатели больного. Переменные могут быть количественными и качественными. Качественные переменные измеряются в классификационной шкале (номинальной), когда в результате измерения определяется принадлежность объекта к определенному классу или в порядковой шкале, когда в результате измерения также определяется принадлежность объекта к некоторому классу, но дополнительно можно упорядочить объекты, сравнив их в каком-то отношении друг с другом. Например, диагноз заболевания -- это измерение в классификационной шкале, а определение степени тяжести заболевания -- измерение в порядковой шкале. Качественные переменные называются группирующими, или категориальными. Количественные переменные могут быть измерены в интервальной шкале (например, температура больного), в шкале отношений (например, вес больного) или абсолютной шкале (например, некоторый безразмерный клинико-лабораторный показатель).

Статистические методы используют гипотезы (некоторые предположения), которые принимаются или не принимаются в результате проведения исследования. При этом, если гипотеза была верна, но ее отвергли, совершается ошибка, которая называется ошибкой 1-го рода. Вероятность совершить ошибку 1-го рода называется уровнем значимости критерия и обозначается р-уров. Если р-уров. больше чем 0,05 (5 %), то считается, что вероятность совершить ошибку велика и гипотезу принимают, в противном случае гипотезу отвергают, т. е. p-уров. представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю совокупность изучаемых объектов. Например, p-уров. = 0,05 показывает: имеется 5-процентная вероятность, что выявленная в результате анализа взаимосвязь между переменными вызвана стечением случайных обстоятельств. Значение 0,05 в ППП STATISTICA принято по умолчанию, но может быть изменено исследователем. Например, если речь идет о жизни человека, целостности важных объектов, конструкций и т. д., то значение р-уров. может быть уменьшено до 0,01 или 0,001.

Некоторые методы многомерного анализа являются параметрическими методами, другие -- непараметрическими. При реализации параметрических методов предполагается выполнение основного требования к исходным данным -- количественный признак измерен как минимум в интервальной шкале и его выборочное распределение соответствует нормальному закону. Непараметрические методы не требуют знания закона распределения количественного признака.

В первой главе книги автором затрагиваются проблемы использования системного анализа в медицине, обосновывается системный подход к пониманию функций всего организма. Анализируются проблемы информатизации в медицине и здравоохранении. Показана актуальность применения статистических пакетов при создании программ, диагностирующих и прогнозирующих состояние больных для практической и исследовательской медицины с максимально дружественным интерфейсом для пользователя, не требующих специальных знаний в области математики, программирования или информационных технологий. Показано, что стохастические модели в равной степени с детерминированными моделями могут быть использованы в качестве инструментария системного анализа в медицинских исследованиях. Сделан аналитический обзор работ, посвященных применению статистических методов в медицинских исследованиях. Это монографии, сборники научных трудов, учебные пособия, научные статьи, а также изобретения, в основе которых лежат статистические методы.

Во второй главе приведены результаты использования многомерных статистических методов для исследования структуры анализируемых медицинских данных: Кластерный анализ позволяет произвести разбиение множества исследуемых объектов и признаков на однородные в некотором смысле группы, или кластеры.

Проведено разбиение больных нефроптозом на группы однородности методом k-средних и методом иерархической классификации, показано, что по сравнению с общепринятым разделением больных на группы по величине опущения почки наиболее адекватной классификацией является распределение больных на группы по степени ротации почки в трех координатных плоскостях. Дисперсионный анализ посредством сравнения средних количественной переменной в группах, полученных разбиением всей совокупности наблюдений по одной или нескольким категориальным (качественным) переменным, позволяет исследовать зависимост ь количественной переменной от данных качественных переменных. Например, количественная переменная -- величина опущения почки, группирующая переменная -- степень опущения почки, которая разбивает больных на группы 1, 2, 3, соответствующие 1-й, 2-й и 3-й степ ени опущения почки.Дисперсионным анализом установлено различие средних клинико-лабораторных показателей, характеризующих состояние больных нефроптозом, в группах по степени опущения и ротации почки. Показано, что в группах по степени ротации почек различие средних более выражено. То есть установлена зависимость между величинами указанных показателей и степенью опущения и ротации почки. Причем для степени ротации почки эта зависимость сильнее.

Главной целью факторного анализа является сокращение числа пере менных. Сокращение достигается посредством выделения скрытых (латентных) общих факторов, объясняющих связи между наблюдаемыми признаками исследуемых объектов, т.  е. вместо исходного набора переменных анализируются данные по выделенным факторам, число кото р ых значительно меньше исходного числа признаков. Факторным анализом выявлены латентные показатели, характеризующие состояние больных лептоспирозом в остром периоде заболевания (первые 3 недели). Так, на 1-й неделе заболевания выделены следующие: фактор 1 -- синдром интоксикации, фактор 2 -- синдром органной дисфункции, фактор 3 -- синдром неспецифической адаптационной реакции; на 2-й неделе заболевания выделены фактор 1 -- синдром эндогенной интоксикации и органной дисфункции, фактор 2 -- синдром воспалительной реакции периферической крови, фактор 3 -- синдром водно-электролитных нарушений; на 3-й неделе заболевания выделены фактор 1 -- синдром органных и метаболических нарушений, фактор 2 -- синдром диспротеинемии, фактор 3 -- синдром воспалительной реакции периферической крови. Анализ главных компонент и классификация предназначены для уменьшения общего числа переменных (редукция данных) для того, чтобы получить "главные" и "некоррелирующие" переменные и классификации переменных и наблюдений.

Методом выявлены факторы, наиболее полно описывающие состояние больных гипертонической болезнью. Выявлено различие между группами больных гипертонией, страдающих и не страдающих сахарным диабетом. Так, показано, что больных гипертонической болезнью, не страдающих сахарным диабетом, можно объединить в группу однородности, так как они имеют идентичное распределение значений основных клинико-лабораторных показателей. Для больных гипертонической болезнью, страдающих сахарным диабетом, эти показатели ведут себя весьма хаотично и непредсказуемо, принимая различные значения, поэтому не приходится говорить об идентичности больных, а следовательно, и об одинаковых методах их лечения. Причем "индивидуальность" больных сахарным диабетом не зависит от длительности заболевания сахарным диабетом или гипертонической болезнью, от возраста или пола больного. Многомерное шкалирование представляет собой совокупность методов, с помощью которых определяется размерность пространства базовых характеристик объектов и конструируется конфигурация объектов в этом пространстве значительно меньшей размерности, чем исходное. Это пространство (многомерная шкала) аналогично обычно используемым шкалам в том смысле, что значениям базовых характеристик объектов соответствуют определенные значе н ия на осях пространства. Другими словами многомерное шкалирование -- это способы наиболее эффективного размещения объектов в пространстве меньшей размерности, приближенно сохраняющие наблюдаемые между ними расстояния. Например, если состояние больных характеризуется несколькими десятками клинико -лабораторных показателей, значения которых косвенно характеризуют "сходство" в состоянии больных, то методами многомерного шкалирования можно построить пространство значительно меньшей размерности, максимально сохран ив "сходство" между больными. Малая размерность пространства, например 2, позволяет исследователю визуализировать объекты исследования на плоскости, оценивая степень сходства между объектами расстоянием между ними.

* * *


 Об авторе

Алексан Альбертович ХАЛАФЯН

В 1972 г. окончил математический факультет Кубанского государственного университета по специальности "Математика". В 1987 г. под руководством лауреата Государственной премии, профессора А.А.Красовского подготовил и защитил диссертацию на соискание ученой степени кандидата технических наук по специальности "Автоматизация технологических процессов и производств".

В настоящее время докторант кафедры прикладной математики Кубанского государственного университета. В 2006 г. за активную работу в научно-инновационной и образовательной сферах ему была присуждена именная стипендия Олега Дерипаски. Имеет более 60 научных работ.

За время работы на кафедре прикладной математики им читались лекции и велись семинарские и лабораторные занятия по курсам: высшая математика, исследование операций, системный анализ, теория вероятностей и математическая статистика, многомерные статистические методы, методы социально-экономического прогнозирования, статистический анализ данных.

Круг научных интересов -- решение задач управления комбинаторного типа, прикладные статистические исследования в экономике, медицине. Автор учебника "STATISTICA 6. Статистический анализ данных" (М., 2007).

 
© URSS 2016.

Информация о Продавце