Предоставлено Вамmsd logo
This site is not intended for use in the Russian Federation

Понимание медицинских тестов и их результатов

Авторы:Brian F. Mandell, MD, PhD, Cleveland Clinic Lerner College of Medicine at Case Western Reserve University
Проверено/пересмотрено мая 2021
Вид

Результаты теста могут помочь поставить диагноз пациентам с симптомами (диагностическое тестирование) или определить наличие скрытых заболеваний у бессимптомных пациентов (скрининг). Если тесты были соответствующим образом упорядочены на основании клинической картины, в определении или исключении возможных диагнозов должны помочь любые результаты. Результаты тестирования могут помешать процессу принятия клинического решения, если тестирование плохо разграничивает пациентов с и без подозреваемого заболевания или если результат тестирования неправильно интегрированы в клинический контекст.

Лабораторные тесты несовершенны и могут ошибочно определить некоторых здоровых людей как больных (ложноположительный результат) или могут ошибочно определить некоторых больных людей как здоровых (ложноотрицательный результат). Способность теста правильно выделять пациентов с заболеванием зависит от того, насколько вероятно то, что у человека имеется заболевание (априорная вероятность), и от сущностных рабочих характеристик теста.

Хотя диагностическое тестирование зачастую вносит решающий вклад в принятие точного клинического решения, тестирование может иметь нежелательные или непредвиденные последствия. Тестирование следует проводить вдумчиво и с определенной целью, с ожиданием того, что результат теста уменьшит неясность окружающих пациента проблем и способствует улучшению его здоровья. В дополнение к риску предоставить неверную информацию (и, тем самым, задержать начало лечения или проводить ненужное лечение), лабораторные исследования потребляют ограниченные ресурсы и сами по себе могут оказывать неблагоприятное воздействие (например, пневмоторакс, вызванный биопсией легкого) или может подтолкнуть к проведению дополнительных ненужных тестов.

Определение положительного результата теста

Наиболее распространенными тестами являются те, которые дают результаты в непрерывном, количественном режиме (например, уровень глюкозы в крови, количества лейкоцитов). Такие тесты могут дать полезную клиническую информацию во всех их диапазонах, но клиницисты часто используют их для диагностики состояния, требуя, чтобы результат был классифицирован как положительный или отрицательный (т.е., наличие или отсутствие болезни), основанный на сравнении с некоторыми установленными критериями или пороговыми точками. Такие точки отсечки обычно выбираются на основе статистического и концептуального анализа, который старается сбалансировать долю ложноположительных (вызывающих проведение ненужных, дорогих и, возможно, опасных тестов или видов лечения) и ложноотрицательных результатов (не способных диагностировать болезнь, поддающуюся лечению). Определение пороговой точки также зависит от наличия золотого стандарта определения заболевания, о котором идет речь.

Как правило, результаты таких количественных тестов (например, количество лейкоцитов при подозрении на бактериальную пневмонию) принимают вид кривой распределения (не обязательно нормальной кривой, хотя обычно изображается именно таковая). Дистрибуция результатов теста для пациентов с заболеванием сосредоточено в другой точке, чем у пациентов без заболевания. Некоторые пациенты с заболеванием будут иметь очень высокий или очень низкий результат, но большинство из них имеют средний результат. И наоборот, некоторые пациенты без признаков заболевания имеют очень высокий или очень низкий результат, но большинство из них имеют средний результат, отличающийся от такового у пациентов с болезнью. В случае большинства тестов распределения результатов перекрываются таким образом, что многие допустимые результаты теста встречаются среди пациентов с наличием и с отсутствием заболевания; такие результаты более очевидны, когда кривые изображены на одном графике (см. рисунок Распределения результатов теста [Distributions of test results]). Некоторые пациенты выше и ниже выбранной пороговой точки будут охарактеризованы неправильно. Регулировка пороговой точки для выявления большего числа пациентов с болезнью (повышение чувствительности теста) также увеличивает количество ложноположительных результатов (низкая специфичность), а перемещение пороговой точки другим способом, чтобы избежать ложных диагнозов у пациентов, имеющих заболевания, увеличивает количество ложноотрицательных результатов. Каждая пороговая точка является связанной с определенной вероятностью истинно положительных и ложноположительных результатов.

Распределение результатов тестов

Пациенты с заболеванием показаны в верхнем распределении; пациенты без заболевания показаны в нижнем распределении. Для пациентов с заболеванием, область под распределением результатов, которая находится справа от (см. выше) критерия порога соответствует доле истинно-положительных результатов теста (т.е., его чувствительность); область, которая лежит слева (см. ниже) от критерия порога, соответствует ложно отрицательным результатам. Для пациентов без заболевания, область справа от критерия отсечки соответствует ложноположительным, а область слева соответствует доле истинно-отрицательных результатов (то есть, его специфичности). В пределах 2-х наложенных друг на друга распределений (например, больных с наличием и с отсутствием болезней), перемещение линии критерия порога влияет на чувствительность и специфичность, но в противоположных направлениях; изменение критерия порога от 1 до 2 снижает количество ложноотрицательных результатов (увеличение чувствительности), но при этом увеличивает количество ложно позитивных результатов (уменьшается специфичность).

График зависимости чувствительности от частоты ложноположительных заключений (кривая ROC)

Графическое изображение соотношения доли истинно положительных результатов (количество истинно положительных/число больных с болезнью) и доли ложноположительных результатов (количество ложных срабатываний/число больных без заболевания) в ряду пороговых точек генерирует то, что называется кривой ROC. Графически ROC-кривая изображает соотношение между чувствительностью и специфичностью при коррекции порогового значения (см. рисунок Типичная кривая соотношений правильного и ложного обнаружения сигналов [ROC-кривая] [Typical receiver operating characteristic (ROC) curve]). По общему соглашению истинно положительные доли находятся на оси ординат, а ложноположительные доли помещаются на оси абсцисс. Чем больше площадь под кривой ROC, тем лучше тест различает пациентов с наличием болезни или без нее.

ROC-кривые позволяют сравнивать тесты по множеству пороговых точек. В данном примере, тест А работает лучше, чем тест В во всех диапазонах. Кривые ROC также помогают выбрать пороговые точки, предназначенные для увеличения значимости теста. Если тест предназначен для подтверждения заболевания, выбирается пороговая точка с большей специфичностью и более низкой чувствительностью. Если тест предназначен для выявления скрытой болезни, выбирается пороговая точка с большей чувствительностью и более низкой специфичностью.

Типичная ROC-кривая

Характеристики теста

Такие клинические переменные имеют только 2 возможных результата (например, жив/мертв, беременна/не беременна). Такие переменные называются категорическими и дихотомическими. Другие категорические результаты могут иметь много дискретных значений (например, группа крови, шкала комы Глазго) и называются номинальными или порядковыми. Номинальные переменные, такие как группа крови, не имеют определенного порядка. Порядковые переменные, такие как шкала комы Глазго, имеют дискретные значения, расположенные в определенном порядке. Другие клинические показатели, в том числе многие типичные диагностические тесты, непрерывны и имеют бесконечное число возможных результатов (например, число лейкоцитов, уровень глюкозы в крови). Многие клиницисты выбирают пороговые точки, способные привести к непрерывной переменной, которые следует рассматривать в качестве дихотомической переменной (например, считается, что больные с уровнем глюкозы во взятой натощак крови > 126 мг/дл [7,0 ммоль/л] имеют диабет). Другие непрерывные диагностические тесты обладают диагностической значимостью, когда у них есть несколько пороговых точек или когда диапазоны результатов имеют разное диагностическое значение.

Когда результаты тестов будут определены как положительные или отрицательные, все возможные результаты можно записать в простой таблице 2×2 (см. таблицу Распределение гипотетических результатов теста [Distribution of Hypothetical Test Results]), по которой можно вычислить важные отличительные характеристики теста, включая чувствительность, специфичность, положительную и отрицательную прогностические ценности и коэффициент вероятности (КВ) (см. таблицу Распределение гипотетических результатов теста на лейкоцитарную эстеразу в группе из 1000 женщин с предполагаемой 30% заболеваемостью инфекции мочевыводящих путей [Distribution of Test Results of a Hypothetical Leukocyte Esterase Test in a Cohort of 1000 Women With an Assumed 30% Prevalence of UTI]).

Таблица
Таблица

Чувствительность, специфичность и прогностическая ценность

Чувствительность и специфичность, как правило, считаются характеристиками самого теста, независимыми от популяции пациентов.

  • Чувствительность это вероятность того, что у пациентов с болезнью будет положительный результат теста (истинно-положительная частота)

Таким образом, тест, который положителен у 8 из 10 пациентов при наличии заболевания имеет чувствительность 0,8 (также значение выражается как 80%). Чувствительность представляет, насколько хорошо тест обнаруживает заболевание; тест с низкой чувствительностью не идентифицирует многих пациентов с заболеванием, а тест с высокой чувствительностью полезен, чтобы исключить диагноз при отрицательных результатах. Чувствительность является дополнением ложноотрицательных результатов (т.е., ложноотрицательные результаты плюс чувствительность = 100%).

  • Специфичность это вероятность того, что пациенты без заболевания будут иметь отрицательный результат теста у пациентов без заболевания (истинно-отрицательная частота)

Таким образом, тест, который отрицателен у 9 из 10 пациентов при отсутствии заболевания имеет специфичность 0,9 (или 90%). Специфичность представляет, насколько хорошо тест правильно идентифицирует пациентов с болезнью, потому что тесты с высокой специфичностью обладают малой долей ложноположительных результатов. Тест с низкой специфичностью диагностирует многих пациентов без заболеваний как имеющих заболевания. Он является дополнением ложноположительных результатов.

Прогнозные значения описывают тестовое поведение пациентов в данной популяции, не знающих, имеют ли они заболевание. Для данного теста прогнозные значения варьируются в зависимости от распространенности заболевания в исследуемой популяции пациентов.

  • Положительная прогностическая значимость (ППЗ) является долей пациентов с позитивным результатом теста, у которых на самом деле присутствует заболевание

Таким образом, если 9 из 10 положительных результатов тестов верны (истинно-положительные результаты), то значение ППЗ (PPV) составляет 90%. Так как все положительные результаты теста состоят из некоторого числа истинно положительных и некоторого числа ложно позитивных, ППЗ описывает, какова вероятность того, что результат положительного теста в данной популяции пациентов представляет собой истинно положительный.

  • Отрицательная прогностическая значимость (ОПЗ) является долей пациентов с отрицательным результатом теста, у которых на самом деле отсутствуют признаки наличия заболевания

Чувствительность, специфичность и прогностическая ценность

ПЦОР = прогностическая ценность отрицательного результата; ППЦ = положительная прогностическая ценность.

Таким образом, в случае, если 8 из 10 отрицательных результатов теста корректны (истинно отрицательные результаты), тогда ОПЗ составляет 80%. Так как не все отрицательные результаты испытаний являются истинно отрицательными, некоторые пациенты с отрицательным результатом теста на самом деле имеют заболевания. ОПЗ описывает, какова вероятность того, что отрицательный результат теста в данной популяции пациентов представляет собой истинно отрицательный результат.

Клинический калькулятор
Клинический калькулятор

Коэффициент вероятности (КВ)

В отличие от чувствительности и специфичности, которые не относятся к вероятностям конкретного пациента, КВ позволяет клиницистам интерпретировать результаты теста у конкретного больного при наличии известной (оценочной) предтестовой вероятности болезни.

При условии известного результата теста КВ описывает изменение предтестовой вероятности заболевания и отвечает на вопрос

  • Насколько посттестовая вероятность изменилась по сравнению с предтестовой вероятностью теперь, когда результат теста известен?

Многие клинические тесты дихотомические; они либо выше точки отсечки (положительные), либо ниже пороговой точки (отрицательные) и есть только 2 возможных результата. Другие тесты дают результаты, которые непрерывны или происходят в диапазоне, в котором выбрано несколько пороговых точек. Фактическая послетестовая вероятность зависит от величины КВ (которая зависит от рабочих характеристик теста) и оценки предтестовой вероятности заболевания. Когда проведенный тест дихотомичен и результат может быть либо положительным, либо отрицательным, чувствительность и специфичность могут быть использованы, чтобы вычислить положительные КВ (КВ+) или отрицательные КВ (КВ-).

  • КВ+: коэффициент вероятности положительного результата теста, наблюдаемого у пациентов с болезнью (истинно положительного), к вероятности положительного результата теста у пациентов без заболеваний (ложноположительного)

  • КВ-: коэффициент вероятности отрицательных результатов теста у пациентов с болезнью (ложноотрицательный) к вероятности отрицательных результатов теста у пациентов без заболеваний (истинно отрицательный)

Когда результат непрерывен или имеет несколько точек отсечки, для расчета КВ, которое больше не описывается как КВ+ или КВ-, используются не чувствительность и специфичность, а характеристическая кривая.

Поскольку КВ является отношением взаимоисключающих событий, а не долей общего, он представляет скорее шансы, а не вероятность. Для данного теста КВ отличается для положительных и отрицательных результатов.

К примеру, с учетом положительного результата теста КВ 2,0 указывает на вероятность 2:1 (истинно положительные: ложнопозитивные), где положительный результат теста представляет как пациента с болезнью. Из 3 положительных тестов 2 были бы у больных с заболеванием (истинно положительный) и 1 – у пациента без заболевания (ложнопозитивный). Так как истинно положительный и ложноположительный являются компонентами расчетов чувствительности и специфичности, КВ+ также можно рассчитать как чувствительность/(1специфичность). Чем больше КВ+, тем больше информации предоставляет результат положительного теста; положительный результат теста с КВ+ > 10 считается убедительным доказательством в пользу диагноза. Другими словами, оценка претестовой вероятности сильно приближается к вероятности 100%, когда положительный тест имеет высокий КВ+.

При отрицательном результате теста КВ- в 0,25 показывает, что возможность равна 1:4 (ложноотрицательный: истинно отрицательный), где отрицательный результат теста представляет пациента с болезнью. Из 5 отрицательных результатов тестов 1 будет наблюдаться у пациента с заболеванием (ложноотрицательный), а 4 – у пациентов без заболеваний (истинно отрицательный). КВ- также можно рассчитать как (1-чувствительность)/специфичность. Чем меньше КВ-, тем больше информации предоставляет отрицательный результат теста; отрицательный результат теста с КВ < 0,1 считается сильным свидетельством против диагноза. Другими словами, оценка предтестовой вероятности сильно приближается к вероятности 0%, когда отрицательный тест имеет низкий КВ-.

Результаты испытаний с КВ в 1,0 не несут никакой информации и не влияют на послетестовую вероятность заболевания.

КВ удобны для сравнения тестов и также в байесовском анализе для интерпретации результатов теста. Так же как изменяются чувствительность и специфичность, как изменяются пороговые точки, так же изменяются и КВ. В качестве гипотетического примера высокий порог лейкоцитов (БКТ) (например, 20000/μl (мкл) более характерен при возможном случае острого аппендицита и будет иметь высокий КВ+, но и высокий (и поэтому не очень информативный) КВ-; выбор гораздо более низкого и очень чувствительного порога (например, 10000/μL (мкл) будет иметь более низкий КВ-, а также низкий КВ+.

Клинический калькулятор

Дихотомические тесты

Идеальный дихотомический тест не давал бы ложноположительных или ложноотрицательных результатов, все пациенты с положительным результатом теста имели бы заболевания (100% ППЗ) и у всех пациентов с отрицательным результатом теста заболевание не наблюдалось бы (100% ОПЗ).

В действительности, все тесты имеют ложноположительные и ложноотрицательные результаты, некоторые тесты больше, чем другие. Чтобы визуально показать последствия несовершенной чувствительности и специфичности по результатам тестов, рассмотрим гипотетические результаты теста на лейкоцитарную эстеразу в моче с помощью тест-полосок в группе из 1000 женщин, у 300 (30%) из которых наблюдается инфекция мочевыводящих путей (как определено золотым стандартом теста, таким как посев мочи – см. таблицу Распределение результатов гипотетического теста на лейкоцитарную эстеразу в когорте из 1000 женщин с предполагаемой 30% распространенностью ИМП [Distribution of Test Results of a Hypothetical Leukocyte Esterase Test in a Cohort of 1000 Women With an Assumed 30% Prevalence of UTI]). Этот сценарий предполагает в целях наглядности то, что чувствительность анализа с помощью тест-полосок составляет 71%, а специфичность 85%.

Чувствительность 71% означает, что только у 213 (71% от 300) женщин с инфекции мочевыводящих путей результат теста будет положительным. У остальных 87 результат теста будет отрицательный. Специфичность 85% означает, что у 595 (85% из 700) женщин без инфекций мочевыводящих путей результат теста будет отрицательный. У остальных 105 будет положительный результат теста. Таким образом, из 213 + 115 = 318 положительных результатов теста только 213 были бы правильными (213/318 = 67% ППЗ); положительный результат теста делает диагноз инфекции мочевыводящих путей более вероятным, чем невероятным, но неопределенным. Также будет 87 + 595 = 682 отрицательных теста, из которых 595 являются правильными (595/682 = 87% ОПЗ), что делает диагноз инфекции мочевыводящих путей гораздо менее вероятным, но все еще возможным; у 13% пациентов с отрицательным результатом теста действительно была бы обнаружена инфекция мочевыводящих путей.

Таблица
Таблица

Тем не менее, ППЗ и ОПЗ, полученные в этой группе пациентов, не могут быть использованы для интерпретации результатов того же анализа, когда основная заболеваемость (предтестовая или предварительная вероятность) различная. Обратите внимание на последствия изменения заболеваемости до 5% (см. таблицу Распределение гипотетических результатов теста на лейкоцитарную эстеразу в группе из 1000 женщин с предполагаемой 5% заболеваемостью инфекции мочевыводящих путей [Distribution of Test Results of a Hypothetical Leukocyte Esterase Test in a Cohort of 1000 Women With an Assumed 5% Prevalence of UTI]). Теперь большинство положительных результатов испытаний являются ложными и ППЗ составляет только 20%; у пациента с положительным результатом анализа на самом деле скорее всего не наблюдается инфекция мочевыводящих путей. Тем не менее, ОПЗ является теперь очень высоким (98%); отрицательный результат, по существу, исключает инфекцией мочевыводящих путей.

Таблица
Таблица

Обратите внимание, что в обеих когортах пациентов, даже несмотря на то что ППЗ и ОПЗ очень разные, КВ не изменяется, потому что КВ определяются только чувствительностью и специфичностью анализа.

Очевидно, что результат теста не обеспечивает точный диагноз, но только оценивает вероятность наличия или отсутствия заболевания, и эта посттестовая вероятность (вероятность болезни исходя из результата конкретного теста) изменяется в значительной степени на основе предтестовой вероятности заболевания, а также чувствительности и специфичности теста (и, следовательно, его КВ).

Претестовая вероятность

Пре-тестовая вероятность не является точным измерением, она основана на клиническом суждении о том, насколько убедительно симптомы и признаки свидетельствуют о том, что болезнь действительно присутствует, что именно в истории пациента и факторах риска подтверждается диагноз, а также насколько распространена данная болезнь среди населения. Многие системы клинической оценки предназначены для оценки предтестовой вероятности; добавление баллов за различные клинические особенности облегчает вычисление общей оценки. Эти примеры иллюстрируют важность точной оценки пре-тестовой распространенности, поскольку распространенность заболевания в данной популяции сильно влияет на применимость теста. Необходимо использовать валидированные, опубликованные методики оценки распространенности, если таковые существуют. К примеру, существуют критерии для прогнозирования пре-тестовой вероятности развития эмболии легочной артерии. Более высокие рассчитанные оценки дают более высокие расчетные вероятности.

Непрерывное тестирование

Многие результаты испытаний являются непрерывными и могут дать клиническую информацию в широком диапазоне результатов. Врачи часто выбирают определенную пороговую точку, чтобы повысить до максимума полезность теста. Например, количество лейкоцитов > 15 000 можно охарактеризовать как положительное, количество < 15 000 – как отрицательное. Когда тест дает непрерывные результаты при выбранной определенной пороговой точке, то тест действует как дихотомический. Можно выбрать несколько пороговых точек. Чувствительность, специфичность, ППЗ, ОПЗ, КВ+ и КВ- можно рассчитать для одной или нескольких пороговых точек. В таблице Влияние изменения предельной концентрации лейкоцитов у пациентов с подозрением на аппендицит показано Влияние изменения предельной концентрации лейкоцитов у пациентов с подозрением на аппендицит.

Таблица
Таблица

Кроме того, может быть полезно группировать результаты непрерывного тестирования по уровням. В этом случае, результаты не характеризуются как положительные или отрицательные, потому что существует несколько возможных результатов, так что, хотя ОП может быть определено для каждого уровня результатов, больше не существует четких ОП+ или ОП-. К примеру, в таблице Использование групп лейкоцитов для определения соотношения вероятности бактериемии при лихорадочных состояниях у детей показана взаимосвязь между концентрацией лейкоцитов и бактериемии у детей в состоянии лихорадки. Поскольку ОП является вероятностью данного результата у пациентов с заболеванием, деленной на вероятность того, что результат у пациентов без заболевания, ОП для каждой группы лейкоцитов является вероятностью бактериемии в этой группе, деленной на вероятность отсутствия бактериемии.

Таблица
Таблица

Группировка непрерывных переменных позволяет гораздо шире использовать результаты теста, чем при одной установленной пороговой точке. Применяя байесовский анализ, ЛР в таблице Использование групировки за количеством лейкоцитов для определения коэффициента вероятности бактериемии у детей при лихорадке могут использоваться для расчета положительного предсказательного значения.

Для результатов непрерывного тестирования, если кривая ROC известна, расчеты, как показано в таблице, делать не надо; КВ можно найти в различных точках в диапазоне результатов, используя наклон кривой ROC в нужной точке.

Теорема Байеса

Процесс использования претестовой вероятности заболевания и характеристик теста для подсчета послетестовой вероятности называют теоремой Байеса или байесовским пересмотром. Для рутинного клинического использования байесовская методология обычно принимает несколько форм:

  • Формула коэффициента правдоподобия (расчет или номограмма)

  • Табличный подход

Расчет возможностей

Если предварительное исследование вероятности заболевания виражается в шансах эго наличия, и КВ представляет возможность, произведение 2 представляет собой пост-тестовую возможность заболевания (аналогичные умножению 2 вероятностей вместе, чтобы вычислить вероятность одновременного происхождения 2 событий):

Пре-тестовая возможность × КВ = пост-тестовая возможность

Так как клиницисты обычно размышляют терминами вероятностей, а не шансов, вероятность может быть преобразована в шансы (и наоборот), пользуясь этими формулами:

Возможность = вероятность/1 вероятность

Вероятность = возможность/возможность + 1

Рассмотрим пример инфекции мочевыводящих путей, как показано в таблице Распределение гипотетических результатов теста на лейкоцитарную эстеразу в группе из 1000 женщин с предполагаемой 30% заболеваемостью инфекции мочевыводящих путей, у которой предтестовая вероятность инфекции мочевыводящих путей состовляет 0,3, а у применяемого теста КВ+ 4,73 и КВ- 0,34. Пре-тестовая вероятность 0,3 соответствует возможности 0,3/(10,3) = 0,43. Таким образом, посттестовая вероятность того, что у пациента с положительным результатом анализа наблюдается инфекция мочевыводящих путей, равна произведению предтестовой возможности и КВ+; (4,73 × 0,43 = 2,03), что представляет собой посттестовую вероятность 2,03/(1 + 2,03) = 0,67. Таким образом, байесовские расчеты показывают, что положительный результат теста повышает пре-тестовую вероятность с 30% до 67%, такой же результат, полученный в расчете ППЦ в таблице.

Аналогичный расчет делается для отрицательного теста; пост-тестовая возможность = 0,34 × 0,43 = 0,15, что соответствует вероятности 0,15/(1 + 0,15) = 0,13. Таким образом, отрицательный результат теста снижает пре-тестовую вероятность с 30% до 13%, опять тот же результат, полученный в расчете ОПЗ в таблице.

Многие медицинские вычислительные программы, установленные в карманных устройствах, пригодны для расчета пост-тестовой вероятности из пре-тестовой вероятности и КВ.

Клинический калькулятор
Клинический калькулятор
Клинический калькулятор
Клинический калькулятор

Номограмма «возможность–вероятность»

Использование номограммы особенно удобно тем, что позволяет избежать необходимости конвертировать между возможностью и вероятностью или создавать таблицы в 2×2 столбцах.

Для использования номограммы Фагана проводится линия от пре-тестовой вероятности через КВ. Пост-тестовая вероятность является точкой, в которой эта линия пересекает после тестирования линию вероятности. Базовые линии на рисунке построены с учетом данных теста на инфекцию мочевыводящих путей, указанных в таблице Распределение гипотетических результатов теста на лейкоцитарную эстеразу в группе из 1000 женщин с предполагаемой 30% заболеваемостью инфекции мочевыводящих путей. Линия А представляет собой положительный результат теста; она проведена от пре-тестовой вероятности 0,3 через КВ+ 4,73 и дает пост-тестовое значение чуть < 0,7 схожее с расчетной вероятностью 0,67. Линия B представляет собой отрицательный результат теста, она проведена от предтестовой вероятности 0,3 через значение КВ-, равное 0,34, и дает пост-тестовое значение чуть > 0,1, схожее с расчетной вероятностью 13%.

Хотя номограмма менее точна, чем расчеты, типичные значения для предтестовой вероятности часто являются оценками, поэтому кажущаяся точность расчетов, как правило, вводит в заблуждение.

Номограмма Фагана

Иллюстративные линии построены на основе данных теста на инфекции мочевыводящих путей (ИМП) в таблице Распределение результатов гипотетического теста на лейкоцитарную эстеразу в когорте из 1000 женщин с предполагаемой распространенностью ИМП 30%. Линия А представляет положительный результат теста. Она проведена от пре-тестовой вероятности 0,3 через КВ+ 4,73 к пост-тестовому значению чуть < 0,7, схожему с расчетной вероятностью 0,67. Линия B представляет отрицательный результат теста. Она проведена от пре-тестовой вероятности 0,3 через КВ- 0,34 к пост-тестовому значению чуть > 0,1, схожему с расчетной вероятностью 13%.

КВ+= коэффициент вероятности для положительного результата ; КВ- = КВ для отрицательного результата.

Adapted from Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Табличный подход

Часто КВ теста не известны, однако известны чувствительность и специфичность, и может быть оценена пре-тестовая вероятность. В этом случае байесовская методология может быть применена с использованием таблицы 2×2, приведенной в таблице Интерпретация результатов теста на гипотетическую лейкоцитарную эстеразу (ЛЭ) на примере таблицы Распределение гипотетических результатов теста на лейкоцитарную эстеразу в группе из 1000 женщин с предполагаемой 30% заболеваемостью инфекции мочевыводящих путей. Следует отметить, что этот метод показывает, что положительный результат теста повышает вероятность инфекции мочевыводящих путей до 67%, а отрицательный результат уменьшает ее до 13%, те же результаты получены расчетным путем с использованием КВ.

Таблица
Таблица

Последовательное тестирование

Клиницисты часто делают тесты последовательно на протяжении многих диагностических оценок. Если известна пре-тестовая возможность перед последовательным тестированием и известен КВ для каждого из тестов в последовательности, пост-тестовая возможность может быть вычислена с использованием следующей формулы:

Пре-тестовая возможность × КВ1 × КВ2 × КВ3 = пост-тестовая возможность

Этот способ ограничен важным предположением, что каждый из тестов условно независим друг от друга.

Скрининговые исследования

Пациенты часто должны решать вопрос о целесообразности проходить обследование на скрытую болезнь. Принципы успешных программы скрининга заключаются в том, что раннее выявление улучшает клинически значимый исход у пациентов со скрытой болезнью и что ложноположительные результаты, которые часто наблюдаются при скрининге, не становятся бременем (например, затраты и негативные последствия подтверждающего тестирования, беспокойство, вызванное тестированием, необоснованное лечение), т.к. пользы больше. Для минимизации этого возможного бремени клиницисты должны выбрать надлежащий критерий отбора. Скрининг не подходит, когда лечение или превентивные меры неэффективны или заболевание очень редкое (если не будет идентифицирована субпопуляция, в которой заболеваемость выше).

Теоретически лучший тест для скрининга и диагностики тот, который обладает наибольшей чувствительностью и специфичностью. Однако, такие высокоточные тесты часто являются сложными, дорогими и инвазивными (например, коронарная ангиография) и, таким образом, непрактичны для скрининга большого количества бессимптомных людей. Как правило, при выборе скрининг-теста следует делать некоторую уступку в отношении его чувствительности, специфичности или того и другого.

Если врач выбирает тест, который оптимизирует чувствительность или специфичность зависит от последствий ложноположительных или ложноотрицательных результатов теста, а также от пре-тестовой вероятности заболевания. Идеальным является тот скрининг-тест, который всегда положительный почти у каждого пациента с болезнью, так что отрицательный результат уверенно исключает наличие заболевания у здоровых пациентов. К примеру, при тестировании серьезного заболевания, для которого имеется эффективное лечение (например, ишемическая болезнь сердца), врачи были бы готовы терпеть больше ложноположительных результатов, чем ложноотрицательных (низкая специфичность и высокая чувствительность). Хотя высокая чувствительность является очень важным атрибутом скрининг-тестов, специфичность также играет важную роль в определенных стратегиях скрининга. Среди населения с более высокой распространенностью заболевания ППЗ скрининг-теста увеличивается; по мере уменьшения распространенности, пост-тестовая вероятность или апостериорная вероятность положительного результата уменьшается. Поэтому при скрининге болезни в группах высокого риска более предпочтительны тесты с более высокой чувствительностью, чем тесты с более высокой специфичностью, потому что они лучше исключают заболевания (меньше ложноотрицательных результатов). С другой стороны, в популяциях низкого риска или для редких заболеваний, лечение которых менее выгодно или обладает большим риском, предпочтительнее тесты с более высокой специфичностью.

Многопрофильные скрининг-тесты

С расширением спектра доступных скрининговых тестов врачи должны учитывать последствия применения диагностической панели таких тестов. К примеру, панели теста, содержащие 8, 12, а иногда и 20 анализов крови, часто делают при поступлении пациентов больницу или при первом осмотре новым врачом. Хотя этот тип тестирования может быть полезен для скрининга пациентов, наличие определенных болезней, использование большой панели тестов имеют потенциально негативные последствия. По определению, тест со специфичностью 95% дает ложноположительные результаты у 5% здоровых, нормальных пациентов. Если выполнить 2 различных теста с такими характеристиками, каждый для различных скрытых заболеваний, у пациента, у которого фактически нет ни одной болезни, вероятность того, что оба теста будут отрицательными, составляет 95% × 95%, или примерно 90%, таким образом, существует 10% шанс того, что будет, по крайней мере, один ложноположительный результат. Для 3 таких тестов вероятность того, что все 3 будут отрицательными, составляет 95% × 95%× 95% или 86%, что соответствует 14% вероятности того, что будет, по крайней мере, один ложноположительный результат. Если выполнить 12 различных тестов на наличие 12 различных заболеваний, вероятность получения по меньшей мере одного ложноположительного результата равна 46%. Эта высокая вероятность подчеркивает необходимость в осторожности при принятии решения выполнить панельный скрининг-тест и при интерпретации его результатов.

Порог тестирования

Лабораторный тест следует выполнять, только если его результаты повлияют на управление лечением; в противном случае, стоимость и риски для пациента будут бесполезны. Клиницисты иногда решают, когда выполнять тест путем сравнения пре-тестовой и пост-тестовой вероятностей с определенными порогами. Выше определенного порога вероятности преимущества лечения перевешивают риски (в том числе, риск ошибочного лечения пациента без заболевания) и назначается лечение. Эта точка называется порогом лечения и определяется в соответствии с описанием, предложенным в разделе Стратегия принятия клинического решения: оценки вероятности и порог лечения. По определению тестирование нецелесообразно, если пре-тестовая вероятность уже выше ПЛ. Но тестирование назначается, если пост-тестовая вероятность меньше ПЛ до тех пор, пока положительный результат теста может поднять пост-тестовую вероятность выше ПЛ. Самая низкая предтестовая вероятность, при которой это может происходить, зависит от характеристик теста (например, КВ+) и называется порогом тестирования.

Концептуально, если лучший тест для серьезного заболевания имеет низкий КВ+, а ПЛ высокий, то понятно, что положительный результат теста не может поднять пост-тестовую вероятность выше ПЛ у пациентов с низкой, но вызывающей беспокойство пре-тестовой вероятностью (например, возможно 10% или 20%).

Для числового примера рассмотрим ранее описанный случай возможного острого инфаркта миокарда, в котором баланс между риском и выгодой определяет ПЛ в 25%. Когда вероятность инфаркта миокарда превышает 25%, проводится тромболитическая терапия. Когда необходимо выполнить быструю эхокардиограмму, прежде чем провести тромболитическую терапию? Предположим гипотетическую чувствительность 60% и специ-фичность 70%эхокардиографии при диагностике инфаркта миокарда; эти проценты соответствуют КВ+ 60/(100 70) = 2 и КВ (100 − 60)/70 = 0,57.

Вопрос можно решить математически (пре-тестовая возможность × КВ = пост-тестовая возможность) или более интуитивно графически с помощью номограммы Фагана. На номограмме линия, соединяющая ПЛ (25%) на линии пост-тестовой вероятности, проходящей через КВ+ (2,0) на средней линии КВ пересекает пре-тестовую вероятность около 0,14. Очевидно, положительный тест у пациента с любой пре-тестовой вероятностью менее 14% по-прежнему приведет к пост-тестовой вероятности меньше ПЛ. В этом случае эхокардиография была бы бесполезна, потому что даже положительный результат не приведет к принятию решения о лечении; таким образом, 14% предтестовая вероятность является порогом тестирования для данного конкретного теста (см. рисунок Описание порогов тестирования и лечения [Depiction of testing and treatment thresholds]). Другой тест с другим КВ+ будет иметь другой порог тестирования.

Номограмма Фагана, используемая для определения потребности в проведении теста

В этом примере предполагается, что пациент имеет порог лечения для острого инфаркта миокарда (ИМ) 25%. Когда вероятность инфаркта миокарда превышает 25%, проводится тромболитическая терапия. Клиницисты могут использовать номограммы Фагана, чтобы определить, когда следует выполнить быструю эхокардиографию, прежде чем проводить тромболитическую терапию. Если предположить, что эхокардиография имеет гипотетическую чувствительность в 60% и специфичность в 70% для нового инфаркта миокарда, эти проценты соответствуют коэффициенту вероятности (КВ) положительного результата теста (КВ+) 60/(100 70) = 2. Линия, соединяющая 25%-ный ПЛ на линии пост-тестовой вероятности соответствии с КВ+ (2,0) на средней линии КВ пересекает пре-тестовую вероятность примерно в 0,14. Положительный результат теста у пациента с пре-тестовой вероятностью < 14% по-прежнему приводит к пост-тестовой вероятности меньшей, чем ПЛ.

Adapted from Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Изображение порогов тестирования и лечения

Горизонтальная линия представляет пост-тестовую вероятность.

Поскольку 14% по-прежнему представляют значительный риск возникновения инфаркта миокарда, ясно, что вероятность заболевания ниже порога тестирования (например, 10% пре-тестовая вероятность) не обязательно означает исключительно заболевание, просто потому, что положительный результат исследуемого теста не изменит управления, и, таким образом, этот тест не указывается. В этой ситуации клиницист будет наблюдать пациента, чтобы сделать дальнейшие выводы, которые могли бы повысить пре-тестовую вероятность выше порога тестирования. На практике, поскольку для данного заболевания часто доступно несколько тестов, можно применить последовательное тестирование.

Этот пример рассматривает тест, который сам по себе не создает опасности для пациента. Если тест имеет серьезные риски (например, сердечной катетеризации), порог тестирования должен быть выше; можно выполнить количественные расчеты, но они являются сложными. Таким образом, снижение чувствительности и специфичности теста или повышение его риска сужает диапазон вероятностей возникновения заболевания, по которым тестирование является наилучшей стратегией. Улучшение способности теста отделять или уменьшение его риска расширяет диапазон вероятностей, по которым тестирование является наилучшей стратегией.

Возможно исключение из запрета против тестирования, когда претестовая вероятность меньше порога тестирования (но по-прежнему сомнительна). Это рассматривается в том случае, если отрицательный результат теста снизит пост-тестовую вероятность ниже точки, в которой заболевание можно считать исключенным. Это решение требует субъективной оценки степени определенности, необходимой для заявления, что заболевание исключено и, из-за его низкой вероятности, особого внимания к любым рискам тестирования.

quizzes_lightbulb_red
Test your KnowledgeTake a Quiz!
Загрузите приложение "Справочник MSD"! ANDROID iOS
Загрузите приложение "Справочник MSD"! ANDROID iOS
Загрузите приложение "Справочник MSD"! ANDROID iOS