вслепую вынимать блох из мешочка и класть на стол, а сам приказывал блохам прыгать и только после этого исследовал, есть у блохи лапки или нет. Очевидно, что и в этом случае прыгать не будут только блохи без лапок, и учёный окончательно «убедится», что орган слуха находится в лапках. При этом, как мы видим, соблюдены все формальные признаки правильного двойного слепого исследования:
• лапки отрывали не всем блохам (эффект «пустышки», т. е. контролируемость);
• лапки отрывали случайно (рандомизация);
• учёный, выбирающий блох, не знал, с лапками или нет блоха (первое «ослепление»);
• основной исследователь блох, который отдавал приказ блохам прыгать, не видел, есть ли у блохи лапки (второе «ослепление»).
И всё же вывод оказался неверен. Если эксперимент в целом неверно спланирован, даже самые изощрённые технические приёмы его организации ничего исправить не могут. В чём ошибка? В методе исследования, который не соответствует поставленной задаче – изучению слуха у блохи. Выбор движения живого существа в ответ на звук в качестве критерия «слышит/не слышит» в принципе не вызывает особых возражений, так как это общеизвестное наблюдение. Однако для этого животное должно обладать, по крайней мере, возможностью двигаться, которой учёный лишил блоху, отрывая ей лапки.
Исходя из этого, очевидно, что современная диагностика болезней должна быть основана на надёжных научных фактах, а это непросто, так как не все факты, опубликованные в научных статьях, доказанные.
В 2002 г. была предложена классификация степени надёжности научных данных[1], в которой оценивают риск медицинского вмешательства, методологическое качество исследования, и на основании этого дают рекомендации (табл. 2.1).
Степень 1 – преимущества медицинского вмешательства над вредом здоровью очевидны и полностью оправдывают затраты, в то время как при степени 2 рекомендации менее убедительны. Буквенная степень отражает качество исследования:
• А – РКИ с несомненно надёжными результатами;
• B – РКИ с менее надёжными научными результатами;
• С – наблюдательные исследования или результаты РКИ, полученные на одной группе, эстраполируются на другие группы;
• С+ – работы с недостаточно надёжными результатами из-за малого объёма исследования или по другим причинам.
Таблица 2.1.
Классификация степени надёжности научного исследования
В этой классификации важную роль в оценке надёжности диагностического теста играет расчёт его чувствительности и специфичности. Чувствительность теста вычисляют по формуле:
ЧТ = ИП/(ИП + ЛО),
где ЧТ – чувствительность теста; ИП – истинно положительный результат теста; ЛО – ложноотрицательный результат теста.
– отношение числа больных с диагнозом, подтверждённым тестом (истинно положительный результат