Математические методы

Автор работы: Пользователь скрыл имя, 03 Февраля 2013 в 15:01, реферат

Краткое описание

Математические методы в медицине — совокупность методов количественного изучения и анализа состояния и (или) поведения объектов и систем, относящихся к медицине и здравоохранению. В биологии, медицине и здравоохранении в круг явлений, изучаемых с помощью Математических методов, входят процессы, происходящие на уровне целостного организма, его систем, органов и тканей (в норме и при патологии); заболевания и способы их лечения; приборы и системы медицинской техники; популяционные и организационные аспекты поведения сложных систем в здравоохранении; биологические процессы, происходящие на молекулярном уровне.

Прикрепленные файлы: 1 файл

реферат - копия.docx

— 45.78 Кб (Скачать документ)

 

    Проверка статистических  гипотез используется чаще всего  для определения принадлежности  двух имеющихся выборок к одной  и той же генеральной совокупности. Подобные задачи возникают, например, при анализе заболеваемости, эффективности  лекарственных препаратов и т.п.

 

    Гипотеза о  том, что обе выборки не различаются,  т.е. принадлежат к одной генеральной  совокупности, называется иногда  нуль-гипотезой. Эта гипотеза  принимается, если ее значимость, получаемая на основании статистических  критериев, превышает допустимый  порог (р > 0,95). Однако при р  < 0,95 отвергнуть эту гипотезу  нельзя: ответ остается неопределенным, и для получения окончательного  вывода требуются дополнительные  данные. Гипотеза отвергается в  том случае, если ее значимость (вероятность правильности) становится  меньше заданного стандартного  порога.

 

    При проверке  статистических гипотез используются  параметрические и непараметрические  критерии. В первом случае производится  сравнение параметров двух выборочных  распределений (средних и дисперсий)  и делается заключение о равенстве  или различии этих параметров  в генеральных совокупностях.  Гипотеза о равенстве средних  значений проверяется по критерию  Стьюдента, равенство дисперсий  — по критерию Фишера. Описание  соответствующих процедур можно  найти в любом пособии по  математической статистике.

 

    В последние  годы большую популярность приобрели  непараметрические критерии (Уилкоксона, Колмогорова — Смирнова и др.). Их достоинством является то, что они не содержат ограничений,  вытекающих из гипотез о типе  распределения случайных величин,  а опираются на единый принцип  — непрерывности распределений.

 

    Эти критерии  применимы и для анализа порядковых  данных. Однако по сравнению с  параметрическими методами они  менее чувствительны к различиям  в выборках. Чаще всего непараметрические  критерии используются для сравнения  эмпирического распределения с  теоретическим, в частности при  проверке имеющейся статистической  совокупности на принадлежность  к типу нормальных распределений.

 

    Дисперсионный  анализ — статистический метод,  применяемый для выявления влияния  отдельных факторов (количественных, порядковых или качественных) на изучаемый признак и оценку степени этого влияния. Если изучается действие количественного фактора, то предварительно производится его разбивка на градации. Для каждой градации подсчитывается среднее значение изучаемого признака, затем дисперсия среднего по градациям фактора относительно общего среднего и, наконец, общая дисперсия изучаемого показателя (независимо от значения фактора).

 

    В теории дисперсионного  анализа показано, что общая дисперсия  D равна дисперсии средних по  градациям фактора DF (доля дисперсии  за счет действия исследуемого  фактора — объясненная дисперсия)  плюс остаточная дисперсия за  счет действия случайных факторов (DS): D = DF + DS. Чем больше эта величина, тем сильнее влияние фактора  на изучаемый признак.

 

    Для количественной  оценки степени влияния вычисляют  показатель F по формуле:

 где L — число градаций фактора, N — объем статистической совокупности.

 

    Показатель влияния  F затем сравнивается со стандартным  значением Fst в таблице Фишера (для выбранного уровня значимости  при соответствующем числе степеней  свободы). Если F > Fst то факт влияния  считается достоверно доказанным.

 

    Описанная схема  называется однофакторным дисперсионным  анализом.

 

    Анализ зависимости  между признаками. Для оценки  степени взаимозависимости двух  количественных признаков чаще  всего используют коэффициент  ковариации или его нормированное  значение — коэффициент корреляции:

где xi и yi — значения первого  и второго признаков в 1-м наблюдении, sx и sy — стандартные отклонения первого  и второго признаков; N — объем  выборки, Х и Y — математические ожидания х и у.

 При отсутствии связи  между признаками величина R равна  0, при возрастании степени связи  абсолютная величина R увеличивается.  При наличии детерминированной  (функциональной) связи величина R равна  + 1 или - 1 (если увеличение одного  признака сопровождается соответственно  увеличением или уменьшением  другого). При промежуточных значениях  R каждому фиксированному значению  одного признака отвечает некоторое  распределение значений другого,  с тем меньшей дисперсией, чем  больше абсолютная величина R. В  простейшем виде коэффициент  корреляции отражает линейную  связь между признаками, когда  изменения обоих признаков пропорциональны  во всем диапазоне.

 

    При наличии  нелинейной связи, например при  квадратичной зависимости одного  признака от другого, коэффициент  корреляции может быть равен  нулю. В таких случаях для выявления  связи применяют другой показатель  — корреляционное отношение,  которое фиксирует наличие любой  связи между признаками. Область  значений одного признака разбивается  на участки, для каждого из  них определяется среднее значение  другого признака. Далее вычисляется  корреляционное отношение:

 где DF — дисперсия второго  признака за счет влияния первого, D — общая дисперсия второго  признака. Величина корреляционного  отношения, как и коэффициента  корреляции, лежит между нулем  и единицей.

 

    Если исследуется  группа тесно связанных между  собой признаков, то корреляция  между двумя из них может  сильно изменяться под влиянием  третьего. Так, зависимость АД  от минутного выброса сердца  существенно меняется при изменениях  сосудистого сопротивления. Для  анализа подобных случаев применяют  показатели частной корреляции, позволяющие нейтрализовать влияние  третьих признаков. Частный коэффициент корреляции вычисляется на основе парных коэффициентов корреляции:

 где Rxy (z) — частный коэффициент  корреляции между признаками  Х и Y при нейтрализации влияния  признака Z, а Rxy, Rxz Ryz — парные  коэффициенты корреляции.

В случае необходимости анализа  влияния нескольких признаков на один (множественная корреляция) применяется  более громоздкая, требующая больших  объемов вычислений процедура.

 

    Если исследованию  подлежит связь между порядковыми  признаками (например, связь между  выраженностью реакции Манту  и степенью развития туберкулезного  процесса), то применяют так называемый  ранговый коэффициент корреляции  — каждому уровню признака  присваивается свой ранг, для  каждого наблюдения вычисляется  разница рангов.

 

    Регрессионный  анализ. Регрессией называется зависимость  среднего значения одной случайной  величины от некоторой другой (или от нескольких случайных  величин), а регрессионным анализом  — раздел математической статистики, объединяющий прикладные методы  исследования регрессионных зависимостей. Регрессионный анализ приобрел  большую популярность в связи  с распространением ЭВМ.

 

    Если xi и yi —  наблюдаемые случайные величины, ei — случайная ошибка с нулевым  математическим ожиданием, то  регрессия записывается в виде:

 

yi = f (xi) + ei, i = 1, 2,..., N,

 

    где f — функция  регрессии.

 

    Если xi — скалярная  величина (число), то регрессия называется  парной (связывающей пару случайных  величин), если xi — вектор, то множественной.

 

    Задачей регрессионного  анализа является нахождение  «наилучшей» функции f, описывающей  зависимость у от х. Оценка  производится либо по методу  наименьших квадратов, либо по  методу максимума правдоподобия  (что возможно только при известном  распределении величин у).

 

    При использовании  регрессионного анализа важно  правильно выбрать вид и степень  сложности регрессионной модели. Классический путь состоит в  учете биологических, физических  и других предпосылок, а качество  полученной модели оценивается  по величине остаточных отклонений. Возможен способ проверки гипотезы  линейности по остаточным отклонениям  — вычисляется показатель нелинейности  и производится проверка достоверности  его отличия от нуля по критерию  Фишера. Другой подход предложен  в 1970-х гг. В.Н. Вапником: при  малых выборках сложность регрессионной  модели должна быть тем меньше, чем меньше объем выборки, имеющейся  в распоряжении исследователя.  Разработаны критерии оптимальной  сложности регрессии в зависимости  от дисперсии остаточных отклонений  и объема выборки.

 

    Факторный анализ  — совокупность методов исследования  многомерных признаков за счет  снижения их размерности (путем  введения так называемых общих  факторов, которые непосредственно  наблюдаться не могут). В медицине  методы факторного анализа применяются  для решения двух взаимосвязанных  задач: группировки исходной системы  признаков на основе их корреляционных  связей и сжатия информации  за счет построения системы  обобщенных индикаторов.

 

    В факторной  модели каждый исходный признак  представляется в виде комбинации  новых показателей (общих факторов), число которых, как правило, устанавливается меньше числа исходных. Такой метод описания удобен, например, для получения обобщенных индексов, характеризующих состояние системы здравоохранения различных регионов или однородных учреждений (исходные показатели — заболеваемость, смертность, количество профосмотров — заменяются набором обобщенных показателей, определяющих ресурсное обеспечение, качество врачебного обслуживания и т.п.).

 

    Недостатком факторного  анализа является трудность содержательной  интерпретации общих факторов.

 

    Кластерный анализ  — группа методов статистической  обработки, которая включает методы  классификации объектов, в т.ч.  автоматические, на основе их  сходства. Кластерный анализ, как  и факторный, «сжимает» информацию. Но если факторный анализ снижает  размерность пространства признаков,  то кластерный уменьшает число  рассматриваемых объектов. Совокупность  объектов разбивается на кластеры  — группы объектов, обладающие  сходными свойствами, поэтому вместо  всей группы можно рассматривать  один объект, характеризующий ее. Так, ряд административных территорий  может быть представлен в виде  одного кластера, объединяющего  регионы с одинаковой эпидемиологической  обстановкой. Кластерный анализ  включает методы, которые исходно  не принимают во внимание вероятностную  природу обрабатываемых данных. При постановке задач кластеризации  число кластеров, на которое  должно быть разбито исходное  множество объектов, может задаваться  заранее или выявляться в процессе  решения.

 

    Алгоритмы кластерного  анализа направлены на получение  наилучшего в определенном смысле  качества разбиения совокупности  объектов на группы.

 

    Распознавание  образов. Характерной особенностью  одного из подходов к разработке  алгоритма распознавания является  применение обучающей выборки  («обучение с учителем»). В качестве  обучающей выборки используется группа объектов с заранее установленным классом принадлежности. При реализации другого подхода распознавания («без учителя») задача состоит в поиске такого способа классификации, который позволяет получать наилучшее разбиение групп объектов на классы (образы). Методы распознавания образов широко распространены в медицине — в машинной диагностике, при выделении групп риска, выборе альтернативных тактик лечения и т.д.

 

    Разработано большое  число подходов к распознаванию  образов. Наиболее часто применяются  методы дискриминантного анализа,  метод Бейеса, метод обобщенного  портрета, метод ближайшего соседа.

 

    Другие методы  прикладной статистики (исследование  временных рядов и краткосрочное  прогнозирование развивающихся  во времени процессов, планирование  эксперимента и др.) учитывают  специфику задач и возможности  использования для их решения  ЭВМ.

 

    Если для решения  каких-либо задач не удается  найти строгие формальные методы, то прибегают к интуитивно  найденным способам, эффективность  которых проверяется на практике. Поскольку подобные приемы являются  результатом и имитируют интеллектуальную  деятельность человека, они получили  название эвристик. Эвристические  методы применяются для таких  задач анализа данных, как классификация,  распознавание образов и т.п.

 

    Математическое  моделирование систем является  вторым кардинальным направлением  применения М.м. в медицине. Основным  понятием, используемым при таком  анализе, является математическая  модель системы.

 

    Под математической  моделью понимается описание  какого-либо класса объектов или  явлений, выполненное с помощью  математической символики. Модель  представляет собой компактную  запись некоторых существенных сведений о моделируемом явлении, накопленных специалистами в конкретной области (физиологии, биологии, медицине). Иногда можно встретить и устаревшее значение термина «математическое моделирование» как процесса анализа модели на ЭВМ. Чтобы избежать путаницы, во втором случае используют понятие «вычислительный эксперимент».

 

    В математическом  моделировании выделяют несколько  этапов. Основным является формулирование  качественных и количественных  закономерностей, описывающих основные  черты явления. На этом этапе  необходимо широкое привлечение  знаний и фактов о структуре  и характере функционирования  рассматриваемой системы, ее свойствах  и проявлениях. Этап завершается  созданием качественной (описательной) модели объекта, явления или  системы. Этот этап не является  специфическим для математического  моделирования. Словесное (вербальное) описание (часто с использованием  цифрового материала) в ряде  случаев является конечным результатом  физиологических, психологических,  медицинских исследований. Математической  моделью описание объекта становится  только после того, как оно  на последующих этапах переводится  на язык математических терминов. Модели в зависимости от используемого  математического аппарата подразделяются  на несколько классов. В медицине  и биологии чаще всего применяются  описания с помощью уравнений.  В связи с созданием компьютерных  методов решения так называемых  интеллектуальных задач начали  распространяться логико-семантические  модели. Этот тип моделей используется  для описания процессов принятия  решений, психической и поведенческой  деятельности и других явлений.  Часто они принимают форму  своеобразных «сценариев», отражающих  врачебную или иную деятельность. При формализации более простых  процессов, описывающих поведение  биохимических, физиологических  систем, задач управления функциями  организма, применяются уравнения  различных типов.

Информация о работе Математические методы