отношение шансов в статистике
Блог странного учёного
Заметки о жизни и об исследованиях
25 жовт. 2009 р.
Расчёт и интерпретация отношения шансов
Отношение шансов (OR, odds ratio) — это широко используемый статистический показатель, позволяющий сравнивать частоту воздействия факторов риска в эпидемиологических исследованиях. Отношение шансов является ретроспективным сравнением влияния данного фактора риска на две группы лиц.
Термин « шанс » пришёл из азартных игр и означает отношение числа выигрышей к числу проигрышей или, другими словами, отношение числа случаев, когда событие наступило, к числу случаев, когда оно не наступило.
Расчёт отношения шансов
Расчёт отношения шансов для набора данных несложен: необходимо построить таблицу сопряжённости так, чтобы в первой строке стояла группа испытуемых, а в первом столбце — фактор риска.
Рассмотрим первый пример
Представьте, что Вы решили провести обследование мутации в гене X, предположительно вызывающего некую болезнь. Вы проанализировали гены однородных групп заболевших и здоровых и нашли, что распределение мутаций выглядит так (табл. 1):
Таблица 1.
| Наличие мутации | Отсутствие мутации | Всего | |
| Группа заболевших | A = 332 | B = 164 | 496 |
| Контрольная группа (оставшиеся здоровыми) | C = 230 | D = 262 | 492 |
| Всего | 562 | 426 | 988 |
Сначала необходимо вычислить вероятность воздействия факторов риска (в данном случае, наличия мутации) в группе заболевших и в группе оставшихся здоровыми. Шанс того, что фактор риска есть в этих группах, рассчитывается так:
Шанс найти мутацию в группе заболевших = (A x (A + B))/(B x (A + B)) = A/B = 332/164 = 2.0244
Шанс найти мутацию в контрольной группе = (C x (C + D))/(D x (C + D)) = C/D = 230/262 = 0.8779
Затем следует найти OR путём деления шансов найти мутацию в группе заболевших и в контрольной группе:
OR = 2.0244/0.8779 = 2.306
Если свести все эти действия в одну формулу, то получим
OR = (A/B)/(C/D) = (А x D)/(В х С) = (332×262)/(164×230) = 2.306
. и это именно та формула, которая используется для определения OR.
Рассмотрим второй пример
Предположим, что в выборке из 100 мужчин 90 пили вино в предыдущую неделю, а в выборке из 100 женщин только 20 пили вино в тот же период (табл. 2).
Таблица 2.
| Пили | Не пили | Всего | |
| Мужчины | A = 90 | B = 10 | 100 |
| Женщины | C = 20 | D = 80 | 100 |
| Всего | 110 | 90 | 200 |
Шанс мужчины быть в группе пивших вино 90:10 или 9:1, в то время как шанс женщины быть в группе пивших только 20:80 или 1:4 (0.25:1). Отношение шансов, таким образом, 9/0.25 = 36 показывает, что мужчины склонны гораздо чаще пить вино, чем женщины.
Расчет OR (воздействия фактора риска) является хорошим инструментом, но поскольку он основан на выборке, то он является не более чем оценкой. Точность этой оценки отчасти зависит от размера выборки, и, в целом, чем больше выборка, тем правдоподобнее оценка (хотя следует с большой осторожностью подходить к интерпретации OR в исследованиях с огромными размерами выборки). По этой причине кроме расчёта OR обычно вычисляют и стандартное отклонение (SE) с доверительным интервалом ( p ) 95%.
Есть несколько различных способов расчёта SE при заданном p для отношения шансов. Приведём один из них:
при p = 95% ln(SE) = 1.96(1/A + 1/B + 1/C + 1/D)^0.5
Для первого примера :
при p = 95% ln(SE) = 1.96(1/332 + 1/164 + 1/230 + 1/262)^0.5 = 0.25760567, соответственно
OR ± SE = от e^0.57790875 до e^0.25760567 или от 1.7823073 до 2.9835686
Для второго примера :
при p = 95% ln(SE) = 1.96(1/90 + 1/10 + 1/20 + 1/80)^0.5 = 0.817
В этих примерах доверительный интервал составляет 95%, но если нужно воспользоваться другой шириной доверительного интервала, то следует заменить 1.96 в уравнении соответствующим стандартным для нормального распределения значением.
Интерпретация отношения шансов
Предполагаемый фактор риска является значимым (т. е. с большой вероятностью вызовет наступление события, напр. болезнь), если OR больше единицы.
Следует иметь в виду, что само по себе значение OR нечувствительно к размеру выборки (напр., если во втором примере мы используем вдесятеро меньшие значения, то тоже получим OR = 36), однако от размера выборки зависит размер стандартного отклонения (так, во втором примере при вдесятеро меньших значениях мы вместо 2.26 получим SE = 13, т. е. ошибка измерения составит 37%).
Медстатистика (медицинская статистика): основные понятия
Медстатистика, медицинская статистика
А. Радостный
Доверительный интервал
Доверительный интервал ДИ (confidence interval, CI ) — это диапазон значений, который с заданной степенью вероятности включает полученные данные.
Пример. Исследуемая величина — количество заболеваний на тысячу человек. Выяснилось, что в среднем было 60 заболеваний, а ДИ 95% (52, 73). Это означает, что, с вероятностью 95% заболеет не менее 52 и не более 73 человека.
Клиническая значимость эффекта велика, когда доверительный интервал узок.
Отношение шансов
Сначала давайте обсудим понятие «шанс», а потом перейдём к отношению шансов.
Существует несколько дефиниций, однако в целях вычисления отношения шансов используется понятие «шансы в пользу». Вы часто слышали выражение типа: «пять к одному, что он выиграет». Это как раз шансы в пользу.
Итак, в рассматриваемом контексте:
шанс — это отношение вероятности того, что событие произойдёт, к вероятности того, что событие не произойдёт: да/нет, выиграет/проиграет, упадёт/вырастет и т.п.
Хотя в русском языке слова «шанс» и «вероятность» часто используются как синонимы, но здесь шанс не равен вероятности.
Например, вероятность того, случайная карта, извлечённая из колоды, в которой 36 карт, окажется красной масти составит 0,5 = 50% = (16 карт красных мастей / 32 карты в колоде). А шанс того, что такая карта будет красной масти составит: 1:1 = (16 карт красных мастей / 32 карты в колоде) : (16 не красных / 32 карты).
ВАЖНО! Врачи склонны рассматривать риск с точки зрения группы пациентов, тогда как пациенты интерпретируют риск применительно к себе-любимому.
Например, психиатр сообщал пациентам, что при приеме флуоксетина была «30–50% вероятность развития сексуальной проблемы». При этом оказалось, что, по мнению пациентов, это означало трудности во время половины их сексуальных контактов. Между тем доктор желал проинформировать, что из каждых десяти человек, принимающих флуоксетин, три-пять будут испытывать затруднения [1].
Отношение шансов
Отношение шансов ОШ (OR — odds ratio) – это величина, которая количественно определяет силу связи между двумя событиями (признаками) A и B в пределах одной и той-же выборки (пример см. далее).
OШ=(A+/А-) : (В+/В-).
СОДЕРЖАНИЕ
Определение и основные свойства
Убедительный пример в контексте предположения о редком заболевании
Определение с точки зрения групповых шансов
Определение в терминах совместной и условной вероятностей
Таким образом, отношение шансов
Симметрия
мы получили бы тот же результат
Отношение к статистической независимости
Если X и Y независимы, их совместные вероятности могут быть выражены через их предельные вероятности p x = P ( X = 1) и p y = P ( Y = 1) следующим образом
Восстановление вероятностей ячеек из отношения шансов и предельных вероятностей
Пример
Предположим, что в выборке из 100 мужчин 90 пили вино на предыдущей неделе (значит, 10 не пили), в то время как в выборке из 80 женщин только 20 пили вино за тот же период (то есть 60 не пили). Это формирует таблицу непредвиденных обстоятельств:
Отношение шансов (OR) можно напрямую рассчитать из этой таблицы как:
В качестве альтернативы, шансы мужчины, пьющего вино, составляют 90 к 10, или 9: 1, в то время как шансы женщины, пьющей вино, составляют всего 20 к 60, или 1: 3 = 0,33. Соотношение шансов, таким образом, составляет 9 / 0,33, или 27, что показывает, что мужчины гораздо чаще пьют вино, чем женщины. Подробный расчет:
Статистические выводы
Было разработано несколько подходов к статистическому выводу для отношений шансов.
Один из подходов к выводу использует приближения большой выборки к выборочному распределению логарифмического отношения шансов ( натуральный логарифм отношения шансов). Если мы используем обозначение совместной вероятности, определенное выше, логарифмическое отношение шансов популяции будет
то вероятности в совместном распределении можно оценить как
L знак равно бревно ( п ^ 11 п ^ 00 п ^ 10 п ^ 01 ) знак равно бревно ( п 11 п 00 п 10 п 01 ) <\ displaystyle > _ <00>> <<\ hat > _ <10>) <\ hat > _ <01>>> \ right) = \ log \ left ( <\ dfrac Распределение логарифмического отношения шансов приблизительно нормальное при: Стандартная ошибка для логарифмического отношения шансов приблизительно S E знак равно 1 п 11 + 1 п 10 + 1 п 01 + 1 п 00 <\ displaystyle <<\ rm Этот факт используется в двух важных ситуациях: В обеих этих настройках отношение шансов может быть рассчитано на основе выбранной выборки без смещения результатов по сравнению с тем, что было бы получено для выборки населения. Если доступен абсолютный риск в неэкспонированной группе, конверсия между ними рассчитывается следующим образом: Если предположение о редком заболевании неприменимо, отношение шансов может сильно отличаться от относительного риска и вводить в заблуждение. Рассмотрим уровень смертности пассажиров-мужчин и женщин, когда затонул Титаник. Из 462 женщин 154 умерли и 308 выжили. Из 851 мужчины 709 умерли, 142 выжили. Очевидно, что у мужчины на «Титанике» больше шансов умереть, чем у женщины, но насколько больше? Поскольку более половины пассажиров погибли, предположение о редкой болезни сильно нарушается. Чтобы вычислить отношение шансов, обратите внимание, что для женщин шансы умереть были 1: 2 (154/308). У мужчин шансы были 5 к 1 (709/142). Отношение шансов составляет 9,99 (4,99 / 0,5). У мужчин в десять раз больше шансов умереть, чем у женщин. Для женщин вероятность смерти составила 33% (154/462). Для мужчин вероятность составила 83% (709/851). Относительный риск смерти составляет 2,5 (0,83 / 0,33). Вероятность смерти мужчины в 2,5 раза выше, чем у женщины. Какое число правильно представляет, насколько опаснее было находиться на Титанике? Относительный риск имеет то преимущество, что его легче понять и лучше представить, как думают люди. В медицинской литературе отношение шансов часто путают с относительным риском. Для нестатистиков понятие отношения шансов является трудным для понимания, и оно дает более впечатляющую цифру для эффекта. Однако большинство авторов считают, что относительный риск легко понять. В одном исследовании члены национального фонда борьбы с болезнями на самом деле были в 3,5 раза чаще, чем не члены, слышали об общем лечении этого заболевания, но отношение шансов составляло 24, и в документе говорилось, что члены были более чем в 20 раз более вероятны. слышать о лечении. Исследование статей, опубликованных в двух журналах, показало, что 26% статей, в которых использовалось отношение шансов, интерпретировали его как отношение рисков. Это может отражать простой процесс, когда непонимающие авторы выбирают наиболее впечатляющую и пригодную для публикации фигуру. Но в некоторых случаях его использование может быть заведомо вводящим в заблуждение. Было высказано предположение, что отношение шансов следует представлять как меру величины эффекта только в том случае, если отношение рисков невозможно оценить напрямую. Это снова то, что называется «инвариантностью отношения шансов», и почему RR для выживания не то же самое, что RR для риска, в то время как OR имеет это симметричное свойство при анализе либо выживаемости, либо неблагоприятного риска. Опасность клинической интерпретации OR возникает, когда частота нежелательных явлений не является редкой, что приводит к преувеличению различий, когда предположение OR редкого заболевания не выполняется. С другой стороны, когда заболевание встречается редко, использование RR для выживаемости (например, RR = 0,9796 из приведенного выше примера) может клинически скрыть и скрыть важное удвоение неблагоприятного риска, связанного с лекарством или воздействием. Следующие четыре таблицы непредвиденных обстоятельств содержат наблюдаемое количество клеток, а также соответствующее отношение шансов выборки ( OR ) и отношение шансов журнала выборки ( LOR ): Следующие совместные распределения вероятностей содержат вероятности ячеек популяции, а также соответствующее отношение шансов популяции ( OR ) и логарифмическое отношение шансов популяции ( LOR ): Отношение шансов позволяет оценить связь между определенным исходом и фактором риска. Отношение шансов позволяет сравнить группы исследуемых по частоте выявления определенного исхода. Важно, что результатом применения отношения шансов является не только определение статистической значимости связи между фактором и исходом, но и ее количественная оценка. Отношение шансов при сравнении двух групп рассчитывается как частное от деления шансов развития исхода в основной группе к шансам развития исхода в контрольной группе. В свою очередь, шансами называют отношение числа исследуемых с наличием исхода к числу исследуемых с отсутствием исхода. Также для рассчитанного ОШ рассчитывается 95% доверительный интервал (95% ДИ). Отношение шансов – это значение дроби, в числителе которой, находятся шансы определённого события для первой группы, а в знаменателе шансы того же события для второй группы. Шансом является отношение числа исследуемых, имеющих определенный признак (исход или фактор), к числу исследуемых, у которых данный признак отсутствует. Например, была отобрана группа пациентов, прооперированных по поводу панкреонекроза, число которых составило 100 человек. Через 5 лет из их числа в живых осталось 80 человек. Соответственно, шанс выжить составил 80 к 20, или 4. Удобным способом является расчёт отношения шансов со сведением данных в таблицу 2х2: Для данной таблицы отношение шансов рассчитывается по следующей формуле: Очень важно оценить статистическую значимость выявленной связи между исходом и фактором риска. Связано это с тем, что даже при невысоких значениях отношения шансов, близких к единице, связь, тем не менее, может оказаться существенной и должна учитываться в статистических выводах. И наоборот, при больших значениях OR, показатель оказывается статистически незначимым, и, следовательно, выявленной связью можно пренебречь. Для оценки значимости отношения шансов рассчитываются границы 95% доверительного интервала (используется абрревиатура 95% ДИ или 95% CI от англ. «confidence interval»). Формула для нахождения значения верхней границы 95% CI: Формула для нахождения значения нижней границы 95% CI: Дополнительно в каждом случае обязательно оценивается статистическая значимость отношения шансов исходя из значений 95% доверительного интервала. 1. Составим четырехпольную таблицу сопряженности: 2. Рассчитаем значение отношения шансов: OR = (A * D) / (B * C) = (50 * 90) / (150 * 10) = 3. Таким образом, исследование показало, что шансы встретить курящую женщину среди пациенток с диагностированным ВПР плода в 3 раза выше, чем среди женщин без признаков ВПР плода. Наблюдаемая зависимость является статистически значимой, так как 95% CI не включает 1, значения его нижней и верхней границ больше 1. Рассмотрим принцип вычисления этого показателя на гипотетическом примере. Предположим, что нескольким добровольцам задают два вопроса: Каково ваше артериальное давление? Для каждого наблюдения, обладающего свойством «Б», вычислить шансы того, что данное наблюдение обладает свойством «A». Для каждого наблюдения, которое не обладает свойством «Б», вычислить шансы того, что данное наблюдение обладает свойством «A». Разделить шансы, полученные в п.1 на шансы, полученные в п.2 — это и будет отношение шансов (ОШ).Термин «участник» не обязательно обозначает человека, популяция может объединять любые объекты, как живой так и неживой природы. Если ОШ превышает 1, наличие признака «А» ассоциируется с признаком «Б» в том смысле, что наличие «Б» повышает (по отношению к отсутствию «Б») шансы наличия «A». Важное замечание: несмотря на наличие такой ассоциации из нее, однако, не вытекает факт существования причинно-следственных связей между «Б» и «A», вполне возможен вариант наличия ложной связи, опосредованной некоторым другим свойством «C», которое индуцирует оба признака «A» и «Б» (Ложная корреляция). В нашем примере ложная корреляция могла бы проявиться так: в исследуемой группе добровольцев выявляется тенденция к снижению АД у лиц умеренно употребляющих алкоголь, но при попытке принуждения к употреблению алкоголя (в умеренных количествах, естественно) добровольцев, которые ранее алкоголь не принимали мы бы обнаружили, что АД у них в среднем не изменяется. Такие противоречивые результаты можно было бы объяснить, гипотетически, влиянием постороннего фактора: к примеру, в исследуемой группе представлены, в основном, лица давно и регулярно употребляющие алкоголь в умеренных количествах, у которых ярко выражены механизмы адаптации, которые, гипотетически, могут проявляться снижением АД. Таким образом, фактор «адаптация» является здесь посторонним. Другие два способа количественной оценки связи двух качественных признаков — это относительный риск («ОР») и абсолютное снижение риска («АСР»). В клинических исследованиях и во многих других случаях, наибольший интерес представляет характеристика ОР, которая вычисляется аналогичным образом за исключением того, что вместо шансов используются вероятности. К сожалению, исследователи часто сталкиваются с ситуацией, когда имеющиеся данные позволяют рассчитать только ОШ, особенно это касается исследований типа случай-контроль. Тем не менее, когда один из признаков, например A, встречается достаточно редко («предположение о редком случае»), тогда ОШ для наличия «A» при условии, что участник обладает «Б» является хорошим приближением для ОР (требование «A при условии Б» обязательно, так как ОШ учитывает оба свойства симметрично, а ОР и другие характеристики — нет). Говоря техническим языком, отношение шансов является мерой величины эффекта, описывающей силу связи или зависимости между двумя двузначными (бинарными) величинами. Она используется в качестве описательной статистики и играет важную роль в логистической регрессии..
.
Роль в логистической регрессии
Нечувствительность к типу отбора проб
Использование в количественных исследованиях
Отношение к относительному риску
Замешательство и преувеличение
Обратимость и инвариантность
Оценщики отношения шансов
Отношение шансов выборки
Альтернативные оценщики
Числовые примеры
Числовой пример
Связанная статистика
Библиотека постов MEDSTATISTIC об анализе медицинских данных
Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic
Критерии и методы
ОТНОШЕНИЕ ШАНСОВ
1. История разработки показателя отношения шансов
2. Для чего используется показатель отношения шансов?
3. Условия и ограничения применения отношения шансов
4. Как рассчитать отношение шансов?
Исход есть (1) Исхода нет (0) Всего Фактор риска есть (1) A B A + B Фактор риска отсутствует (0) C D C + D Всего A + C B + D A + B + C + D 5. Как интерпретировать значение отношения шансов?
6. Пример расчета показателя отношения шансов
ВПР плода диагностирован ВПР плода отсутствует Всего Курящие 50 (А) 10 (В) 60 Некурящие 150 (С) 90 (D) 240 Всего 200 100 300 Отношение шансов



