Понятие нормы в лабораторной диагностике
Все мы, наверняка, хоть раз в жизни сдавали какие-нибудь анализы. Получив результат мы в большинстве случаев видим какую-то цифру и рядом с ней диапазон нормальных значений в который, как считается, данная цифра должна укладываться если человек здоров. Но на самом деле все не так просто. Пожалуй, мало существует в лабораторной медицине тем, вокруг которых существует столько предрассудков и неверно истолкованных случаев, чем диапазоны нормальных значений. Потому что с одной стороны тема кажется очень простой, ведь наш результат либо попадает, либо не попадает в нормальный диапазон. Но с другой стороны существует множество случаев неверно истолкованных результатов анализов, когда пациенту ставится неправильный диагноз и назначается необоснованная терапия его лечащим врачом или самим пациентом в случае самолечения. И даже специалисты лабораторной-диагностики часто не могут внятно объяснить, что же это все-таки такое.
Откуда берутся нормы.
Для начала, давайте разберемся откуда же все-таки берутся эти две цифры: верхняя и нижняя границы нормы. В основе всего, как бы это скучно не звучало лежат принципы математической статистики.
Для установления диапазона нормальных значений (референтного диапазона) проводится довольно серьезное исследование.
Например, нужно разработать референтный диапазон для концентрации общего белка в сыворотке крови. Начинается все с набора референтных индивидуумов. Это люди, которые являются здоровыми на основании всех доступных на данный момент медицинских данных. У них определяется концентрация общего белка. Практически любой показатель, измеряемый в лаборатории имеет нормальное распределение в популяции. То есть чем ближе значение признака к среднему, тем оно чаще встречается.
В нашем случае допустим, что среднее значение концентрации общего белка составляет 75 г/л. Это означает, что большинство здоровый людей имеет значение концентрации общего белка близко к 75, а здоровые люди со значениями гораздо больше или гораздо меньше 75 встречаются значительно реже.
На основании нашего исследования мы можем определить среднее значение измеряемого признака (общий белок) в популяции, а также определить его дисперсию. То есть количественно определить насколько далеко наш показатель разбросан относительно среднего значения. Соответственно при большой дисперсии график распределения более вытянут вдоль оси X при маленькой дисперсии график более компактно сгруппирован возле среднего значения.
Теперь нужно выбрать доверительный интервал, то есть тот процент популяции, в которой значение нашего показателя мы будем считать нормальным.
Исторически так сложилось, что в биологии и медицине обычно берут 95%-ный интервал. То есть это интервал вокруг среднего, в который укладывается 95% всех значений, а следовательно, и всех людей в популяции. Нетрудно догадаться в таком случае, что 5% выходит за пределы этого диапазона, соответственно 2,5% выше верхней границы и 2,5% ниже нижней границы.
Кроме того, в России 95%-ный интервал для установления лабораторных референтных интервалов нас обязывает использовать законодательство.
Итак, на основании исследования неких здоровых добровольцев мы установили, что среднее значение концентрации общего белка в популяции 75г/л, а применив 95%-ный интервал еще и установили нужный нам диапазон (допустим 65-85 г/л). Это и есть диапазон нормальных значений (референтный диапазон), который будет использоваться в дальнейшем (такие нормы называются эпидемиологическими).
Очень важная вещь, которую следует понять на данном этапе это то, что, устанавливая интервал 95%, мы уже заранее оставляем 5% наших добровольцев за пределами нормы (а, следовательно, и 5% всей популяции здоровых людей). Нет оснований подозревать, что они чем-то больны. Их полностью обследовали перед включением в группу референтных индивидуумов и тем не менее в соответствии с нашими правилами стат. обработки данных результаты их анализов находятся за пределами нормальных значений.
А что при патологических состояниях?
До сих пор мы рассматривали измерение какого-либо показателя только у здоровых людей. Но основной смысл существования медицины заключается в назначении лечения, а до этого нужно узнать, чем человек болен и болен ли вообще. Для этих целей как раз служит диагностика в том числе лабораторная.
Во-первых, следует остановиться на понятии "маркер заболевания". В лабораторном смысле это такое вещество, концентрация которого изменяется при определенных заболеваниях и, определяя которое можно понять болен ли человек данным заболеванием или нет. Для того чтобы какой-либо аналит (определяемое в лаборатории вещество) являлся маркером заболевания он должен быт патогенетически связан с этим заболеванием. Идеальным маркером заболевания является такое вещество, концентрация которого изменяется только при одном определенном заболевании и не изменяется при других заболеваниях или в состоянии здоровья. Тогда измеряя это вещество можно было бы однозначно утверждать страдает ли человек соответствующим заболеванием или нет. Но так как в организме человека все очень тесно взаимосвязано идеальных маркеров не существует. Одно и то же определяемое вещество может как повышаться, так и понижаться при нескольких (иногда очень многих) патологических состояниях, то есть быть маркером сразу нескольких заболеваний. Однако одновременно при одном заболевании можно увидеть изменения концентрации сразу нескольких веществ, которые могут служить маркерами при его диагностике. Поэтому грамотный подход в назначении анализов и интерпретации полученных результатов залог правильной диагностики, а следовательно, и успешного лечения.
Примером маркера, близкого по своим характеристикам к идеальному может служить тропонин при диагностике инфаркта миокарда. Данный белок всегда повышен при инфаркте только за исключением некоторых мелкоочаговых случаев. Одновременно его концентрация повышается практически только при инфаркте миокарда, опять же за редким исключением.
Пожалуй, наиболее далеким от идеального маркера является определение скорости оседания эритроцитов. И если в случае с повышением концентрации тропонина у пациента с очень большой вероятностью можно заподозрить инфаркт, то при повышенном СОЭ у пациента можно смело подозревать как минимум половину из медицинской энциклопедии. Данный показатель повышается практически при любом заболевании в том числе и инфаркте миокарда.
Для простоты предположим, что существует какой-то маркер определенного заболевания, концентрация которого у больных выше чем у здоровых и на основании определения этого маркера мы будим пытаться определить болен ли человек данным заболеванием или нет. При этом все обследуемые нами люди делятся на две популяции которые в статистике называются генеральными совокупностями (больные и здоровые). По аналогии с графиком распределения признака в популяции здоровый можно построить график распределения нашего абстрактного маркера в популяции больных.
При этом возможно несколько ситуаций:
Идеальный маркер.
В идеальной ситуации диапазоны концентраций маркера у больных и здоровый вообще не перекрываются. Как уже упоминалось ранее такие ситуации в реальной жизни в чистом виде практически не встречаются.
Никуда не годится.
В данном случае диапазоны концентраций у больных и здоровых перекрываются слишком сильно. Данный показатель вообще лучше не использовать для диагностики нашего гипотетического заболевания и поискать более специфичный для него маркер.
В реальной жизни как правило стараются всячески избегать ситуации из примера 2. Но и найти идеальный маркер примера 1 как правило невозможно. Поэтому диапазоны концентраций у больных и здоровый в той или иной степени перекрываются.
Поэтому всегда существует диапазон концентрации в который попадают как больные, так и здоровые.
Чувствительность и специфичность лабораторных тестов.
Для большинства исследований, проводимых в лаборатории, существуют понятия чувствительности и специфичности. К сожалению, с трактованием данных понятий существует некоторая путаница. Дело в том, что существуют чувствительность и специфичность в смысле аналитических свойств диагностической системы. Обсуждение этих понятий выходит за рамки темы данной статьи.
Остановимся на понятиях клинической (диагностической) чувствительности и специфичности.
В уже упомянутом выше ГОСТе даны следующие определения этих понятий:
- "Клиническая (диагностическая) чувствительность лабораторного теста: число лиц, точно классифицированных по результатам исследования как находящихся в определенном состоянии, деленное на число всех лиц в этом состоянии."
- "Клиническая (диагностическая) специфичность лабораторного теста: число лиц, правильно классифицированных по результатам исследования как не находящихся в определенном состоянии, деленное на число всех лиц, не находящихся в определенном состоянии."
Лаконично, правда!?
Теперь давайте разберем ситуацию немного подробнее.
У нас существует некая популяция людей, которую нужно обследовать на конкретное заболевание (например, сифилис). В популяции при этом существуют люди как больные сифилисом, так и здоровые. На основании результатов проведенного нами лабораторного исследования мы решаем болен ли каждый конкретный обследуемый сифилисом (положительный результат) или нет (отрицательный результат). При этом мы всегда помним, что прерогатива постановки диагноза конечно же принадлежит лечащему врачу.
Из-за того, что как у больных, так и у здоровых может быть, как положительный, так и отрицательный результат все наши обследуемые теперь делятся на четыре группы:
Заболевание | Здоровье | |
---|---|---|
Положительный результат | И.П. | Л.П. |
Отрицательный результат | Л.О. | И.О. |
- И.П. - истинно положительный результат: группа больных сифилисом с положительным результатом теста.
- Л.П. - ложно положительный результат: группа здоровый с положительным результатом теста.
- Л.О. - ложно отрицательный результат: группа больных сифилисом с отрицательным результатом лабораторного теста.
- и наконец И.О. - истинно отрицательный результат: группа здоровых с отрицательным результатом.
Таким образом диагностическую чувствительность лабораторного теста можно формализовать как:
В то время как диагностическая специфичность это:
То есть отношение здоровых с отрицательным результатом ко всем здоровым.
Естественно, чем выше значения чувствительности и специфичности, тем лучше.
Порог принятия клинического решения.
В предыдущем разделе было сказано, что на основании результатов лабораторного исследование принимается решение о постановке диагноза.
Теперь давайте посмотрим, как именно это делается.
На первый взгляд все просто: врач смотрит на результаты анализов и если они выше верхней границы нормы, то ставит диагноз. На самом деле все не совсем так.
На практике в некоторых случаях врач ставит диагноз на основании порога принятия клинического решения (или по крайней мере должен так делать). Данную цифру уже не указывают в результатах анализов и пациенту о ней как правило ничего не известно.
Итак, порог принятия клинического решения это некоторое пороговое числовое значение нашего показателя, принятое в качестве критерия наличия или отсутствия конкретного заболевания.
Еще раз стоит отметить что эта цифра не имеет ни чего общего с референтными интервалами.
О теоретических основах определения порога клинического решения будет сказано ниже.
Сейчас рассмотрим несколько вариантов существования порога принятия клинического решения:
Максимальная диагностическая чувствительность теста.
Порог принятия клинического решения установлен так, чтобы добиться максимальной чувствительности.
Плюсы: Таким образом можно добиться чувствительности - 100%, так как все больные на основании данного теста будут отнесены к группе больных.
Минусы: Вместе с больными захватывается множество людей из здоровой популяции, результаты которых в данном случае являются ложно положительными, специфичность теста при этом уменьшается.
Максимальная диагностическая специфичность теста.
Противоположная ситуация. Порог сдвинут так, чтобы добиться максимальной специфичности теста, так как всем действительно здоровым людям на основании результатов такого теста не поставят неправильный диагноз.
Очевидный минус такого метода: здоровыми так же будет считаться часть больных, результаты которых в данном случае будут ложно отрицательными, чувствительность теста при этом уменьшается.
Как видно из предыдущих примеров невозможно одновременно добиться максимальной чувствительности и специфичности теста. При увеличении чувствительности теста падает его специфичность и наоборот. Поэтому в реальной жизни, конечно же никто в такие крайности не впадает и порог принятия клинического решения ставится в некоторой средней точке, где чувствительность и специфичность теста максимально сбалансированы.
При этом вблизи порога существуют как ложно положительные, так и ложно отрицательные результаты.
Серая зона.
До сих пор рассматривались случаи, так называемой биномиальной классификации. Единственный существующий порог принятия клинического решения делил всех пациентов на две группы (больных и здоровых).
Но так происходит не всегда.
Совершим небольшой экскурс в историю. Во второй половине XX века, после появления методов определения холестерина, возможных для массового применения в лабораторной диагностике, естественно встал вопрос об определении референтных интервалов. Что и было сделано в рамках эпидемиологического исследования. Но затем (через несколько лет) оказалось, что у пациентов, имевших значение концентрации холестерина близкое к верхней границе нормы (но все-таки находящееся в диапазоне нормальных значений) гораздо чаще возникают сердечно-сосудистые заболевания и смертность от их осложнений у этих пациентов гораздо выше. Появилась мысль о том, что данные пациенты на момент проведения исследования были не совсем здоровы, они были включены в референтную группу обследуемых ошибочно и, соответственно верхняя граница нормы холестерина должна быть ниже. Возникла следующая дилемма: с одной стороны, невозможно выработать критерии для исключения таких людей из группы обследуемых для установления референтных интервалов, так как по всем доступным даже на данный момент медицинским исследованиям они здоровы. С другой стороны, из-за корреляции верхних значений нормы с неблагоприятным прогнозом очевидно, что эти люди обладают какими-то минимальными нарушениями и должны быть исключены из группы обследуемых.
Вопрос решили просто: поделили диапазон нормальных значений еще на два, таким образом получаем:
- нижний диапазон нормы - целевое значение концентрации холестерина (в том смысле, что к нему нужно стремиться как к цели)
- верхний диапазон нормы - она же зона риска, по большому счету патологией не является, но считается фактором риска развития сердечно-сосудистых заболеваний
- и, наконец, выход за верхний диапазон нормальных значений
В настоящее время градаций по холестерину уже может быть гораздо больше трех. Нужно отметить, что конкретные значения всех пределов зависит от организации проводившей исследования. Относительно холестерина можно отметить таких гигантов как ВОЗ, National Cholesterol Education Program Adult Treatment Panel (США), European Atherosclerosis Society. В нашей стране, на этот счет, естественно, существует свое мнение.
Таким образом мы постепенно подошли к понятию "серая зона" - в лаборатории это такое значение измеряемого параметра, когда невозможно однозначно принять решение о том, болен человек или нет.
Серая зона не всегда является фактором риска. Например, при проведении ИФА исследований с целью диагностики инфекционных заболеваний пациенту, зачастую выдается результат в качественном формате, но само измерение проводится как количественное. При превышении верхнего порога серой зоны результат интерпретируется как положительный. Если значение не достигает нижнего порога серой зоны результат считается отрицательным. Но при попадании результата в серую зону он интерпретируется как неопределенный и просто требует дополнительных исследований для подтверждения или опровержения наличия заболевания.
Какой тест лучше. ROC-анализ.
Как уже упоминалось ранее для диагностики одного и того же заболевания может быть использовано несколько биологических маркеров и соответственно несколько лабораторных методов. Например, для диагностики острого инфаркта миокарда используются такие лабораторные показатели как тропонин, АЛТ, ЛДГ и т.д. Конечно на практике они, чаще всего используются все в совокупности, но давайте предположим, что нам нужно выбрать один, но лучший тест (так как такой вопрос иногда возникает при выборе одного метода для скрининга). Ответ на этот вопрос дает ROC-анализ.
ROC ( receiver operating characteristic). Метод впервые был применен для распознавания самолетов противника радарами США во время Второй мировой войны. Теперь используется повсеместно в том числе в медицине.
Как уже говорилось ранее чувствительность и специфичность теста находятся в обратной зависимости друг от друга. Для начала представим эту зависимость в графическом виде.
Данный график выглядит не так, как вы возможно ожидали. Потому что исторически сложилось так, что на оси абсцисс откладывается значение 1-специфичность.
Теперь мы наглядно видим, что рост чувствительности теста сводит на ноль его специфичность (величина 1-специфичность достигает 100%) и наоборот.
Данный график построен для конкретного метода при диагностике одного определенного заболевания. Если для того же заболевания построить несколько графиков по разным методам, может получиться следующая картина:
Очевидно, что метод, ROC-кривая которого проходит максимально близко к левому верхнему углу является наилучшим (зеленый график), так как при значительном увеличении чувствительности падение специфичности не так ярко выражено, как на остальных графиках. И при прочих равных условиях, для диагностики выбирают именно этот метод.
Количественным выражением этого является характеристика, называемая площадью под кривой (AUC - Area Under Curve). Это площадь фигуры, ограниченной правым нижним углом и кривой. В случае идеального маркера кривая проходит через левый верхний угол, а AUC=1. То есть чем ближе AUC к единице, тем лучше тест. В случае с кривой красного цвета, она проходит через центр и AUC=0.5, что соответствует, например, подбрасыванию монеты для диагностики какого-либо заболевания. И хотя в ряде случаев примерно так и поступают этот метод не является предпочтительным
Порог принятия клинического решения.
Ответ на вопрос о том, как же все-таки устанавливается порог принятия клинического решения так же дает ROC-анализ.
На приведенных ранее графиках представлены все возможные для данного метода варианты сочетаний чувствительности и специфичности в виде линии. Но когда мы устанавливаем порог принятия клинического решения мы останавливаемся в какой-то одной точке этой кривой с определенными значениями чувствительности и специфичности. При этом передвигая порог принятия клинического решения на графике распределения, мы одновременно передвигаем и соответствующую ему точка на ROC-кривой.
Порог принятия клинического решения устанавливается так, чтобы площадь прямоугольника с левым верхним углом в точке соответствующей порогу принятия решения была максимальной.
Прогностическая значимость результата.
Теперь давайте наконец поговорим о том, что же все-таки значит получение результата, который трактуется как положительный в пользу какого-либо заболевания. Как мы уже поняли, результаты могут быть ложными (ложно положительными или ложно отрицательными). Так вот для каждого варианта результата существует его прогностическая значимость.
Прогностическая значимость положительного результата - это отношение истинно положительных результатов ко всем положительным результатам и находится по формуле:
Иными словами, это вероятность того, что человек, получивший положительный результат действительно болен.
Из приведенной формулы однозначно следует, что прогностическая значимость положительного результата зависит в том числе и от распространенности заболевания в популяции. Так как с уменьшением частоты встречаемости заболевания доля ложно положительных результатов в группе всех положительных результатов возрастает в силу несовершенства методов диагностики о которых упоминалось выше.
В силу этих обстоятельств лабораторные методы так же делятся на скрининговые и назначаемые только по показания.
Скрининговые методы - это методы исследования, которые могут проводится в популяции поголовно для выявления какого-либо заболевания. Скрининговыми могут стать только методы, значения чувствительности и специфичности которых настолько высоки, что они нивелируют малую частоту встречаемости заболевания во всей популяции обследуемых. В то время как остальные методы, не обладающие такими характеристиками, используются только по назначению врача. Направляя на обследование только тех пациентов, у которых есть, например, клинические признаки данного заболевания врач формирует группу, где вероятность обнаружить это заболевание гораздо выше чем во всей популяции в целом, тем самым повышая прогностическую значимость положительного результата.
Для наглядности давайте проведем следующий мысленный эксперимент. Что будет, если мы попытаемся использовать "обычную" диагностическую систему для скрининга?
Например, в настоящее время в России обязательно проводятся скрининговые обследования всех новорожденных на фенилкетонурию (ФКУ). Неплохим показателем специфичности для среднестатистической диагностической системы является цифра 95%. При этом распространенность заболевания в российской популяции 1/10000. Если бы скрининговая система для выявления ФКУ обладала такими характеристиками, то на 500 положительных результатов приходился бы только один больной ребенок. Вероятность заболевания при получении положительного результата составляла бы 0,2%. Поэтому для скрининга таких заболеваний используются диагностические системы с параметрами чувствительности и специфичности максимально близкими к 100%.
Чтобы эти рассуждения не были настолько абстрактными обратимся к реальным случаям из жизни. Казалось бы, никто не использует "обычные" диагностические системы для поголовного скрининга, ведь это противоречит здравому смыслу. На самом деле это происходит повсеместно. В связи с существованием частных лабораторий и широким внедрением платных услуг в государственных, любой желающий может сдать любой анализ безо всякого направления врача. Зачастую сотрудники лабораторий, пользуясь служебным положением делают ненужные анализы себе, своим родным и знакомым (а также знакомым знакомых). Наконец клинические врачи, опять же пользуясь положением, и назначая анализы себе, своим родственника, знакомым или знакомым главного врача, представителям администрации и прочим "блатным" зачастую ставят в направлении лишние "галочки". Основной аргумент в такой ситуации "все равно вену колоть будут". Все эти случаи объединяет отсутствие медицинских показаний для проведения обследования. А, следовательно, использование "обычных" диагностических систем для скрининга в общей популяции. Прогностическая значимость положительный результатов таких обследований ничтожно мала. Практически она может мало отличаться от частоты распространения заболевания в популяции. То есть и без проведения анализа можно сказать, что человек болен этим заболеванием с определенной вероятностью и положительный результат анализа (пост-тестовая вероятность) ничего не меняет.
Опять же рассуждая логически; референтный диапазон рассчитывается таким образом, что 5% абсолютно здоровых людей в него заведомо не попадаю. Но это если показатель только один. А если взять группу космонавтов и провести среди них поголовный скрининг по 20 разным тестам, тогда за пределы нормы выпадает уже 64% всех обследуемых. Вы только вдумайтесь в эти результаты: больше чем у половины обследуемых есть отклонение хотя бы одному тесту и при этом все абсолютно здоровы. С ростом числа проведенных тестов цифра асимптотически приближается к 100%. На момент написания этой статьи одна из крупнейший российских частных лабораторий декларировала на своем сайте о том, что она "предлагает более 1000 видов исследований".
Резюмируя вышесказанное стоит отметить, что конечно же каждый человек имеет полное право распоряжаться своим здоровьем, в том числе и получать любую информацию о его состоянии. Но прежде чем делать какое-либо обследование или назначать его пациенту, наверное, стоит заранее задуматься о том, что вы будите делать с результатом этого обследования и какова его цель. Потому что зачастую встречается следующая ситуация: человек сдал куча каких-то анализов результаты части которых оказались за пределами нормы. По результатам анализов он обращается за консультацией к специалисту. На вопрос кем были назначены эти анализы или какова цель проведения исследования ответить затрудняется или говорит "чтобы посмотреть вдруг что-нибудь не так". Но если целью было найти "что-нибудь", то вы эту цель обязательно достигните вопрос только в том сколько анализов для этого придется сдать. Самое главное, что потом с этим делать!? Поэтому назначение и проведение каждого анализа должно быть клинические обосновано.
Нормативное регулирование.
Основным документом, регулирующим на территории России все затронутые в статье вопросы, является уже упомянутый в статье приказ Ростехрегулирования носящий статус Государственного стандарта. По каким-то странным причинам мин.здрав в регулировании данного вопроса не участвует.
Из наиболее интересного стоит отметить что документ рекомендует каждой лаборатории устанавливать свои референтные диапазоны, на основании собственных исследований (в документе есть подробная инструкция о том, как это делать со всеми стат. инструментами, которые могут понадобится при обработке данных). Что в принципе считается хорошей общемировой практикой.
С другой стороны, понимая трудности такого подхода, а иногда даже невозможность, особенно для малых лабораторий документом допускается заимствование референтных интервалов из различных источников (справочники, инструкции к реагентам, другие лаборатории). Но при этом нужно провести некоторую валидацию данных диапазонов, правила которой опять же подробно описаны в "приложении А" данного документа.
22.03.2018