Объективизация достоверности при планировании и оценке результатов клинических исследований

Статьи

Опубликовано в журнале:
Качественная клиническая практика »» 2 / 2001 О. И. Мохов
Москва

Клинические испытания - важный этап разработки современных лекарственных средств и составной элемент формирования базы данных, необходимых для регистрации новых препаратов. Планирование многоцентровых международных исследований IVфазы, определяющих безопасность и эффективность препарата на большой популяции пациентов, требует разработки дизайна, плана и определенной последовательности с той же тщательностью, которая присуща научному эксперименту в лабораторных условиях, но с учетом особых обстоятельств: высокой стоимости испытаний, вариабельности терапевтического эффекта и частых ограничений по времени, обусловленных принятым, в большинстве развитых стран лимитированным сроком действия патента на лекарственные препараты. Цель статьи - определить основные принципы дизайна и проведения клинических испытаний, при соблюдении которых достигается научная обоснованность конечных результатов. При этом следует учитывать, что несмотря на максимум усилий, направленных на формирование адекватного протокола и последовательности проведения испытаний, конечный результат во многом зависит от эффективности и безопасности основного действующего вещества, гипотетическое или теоретическое прогнозирование которых выходит за рамки возможностей специалистов по клиническим испытаниям.

Определение цели, программы и объектов исследования. Соблюдение принципов статистического планирования при разработке протокола исследования имеет большое значение при подготовке клинического испытания. Очень важно добиться реалистичности протокола с клинических, функциональных и организационных позиций и сделать так, чтобы результаты испытаний поддавались бы обобщениям и были воспроизводимыми.

Планирование начинается с конкретизации цели исследования, например определения адекватной дозировки, демонстрации ее эффективности, количественно оцененной определенным параметром, или подтверждения того, что испытываемый препарат по эффективности эквивалентен контрольному препарату или комбинации препаратов или даже превосходит его.

Цель испытания должна быть сформулирована в виде математической модели (гипотезы) испытаний, которая затем оценивается с позиций альтернативной модели, основанной на результатах испытаний. Примеры таких моделей могут выглядеть так: средняя величина изменения артериального давления на фоне курса лечения А равна или меньше таковой при назначении курса Б. Согласно альтернативной модели среднее значение изменений после лечения А больше, чем гаковое при лечении Б.

Целевая группа клинических испытаний состоит из пациентов с определенным заболеванием. Диагностические критерии и сопутствующие заболевания обычнo в деталях определяют, какие именно пациенты могут быть включены в испытания. Это так называемые критерии включения/исключения, которые следует основывать на соответствующих клинических данных. Критерии не должны быть слишком конкретными по формулировке; такой подход позволяет правильно описывать во вкладыше к препарату перечень возможных данных о препарате и правильно интерпретировать их врачами и пациентами.

За исключением случаев очень редких заболеваний клинические испытания, как правило, охватывают достаточно ограниченную группу тех пациентов, которые в принципе подходят для выбранного лечения. Для того чтобы результаты лечения поддавались обобщению по критериям изучения испытываемого препарата, объекты исследования должны представлять собой потенциальную терапевтическую группу настолько достоверно, насколько при этом можно было бы не принимать во внимание любые случайные отклонения, т.е. являться рандомизированной целевой выборкой.

На практике пациенты, включаемые в исследование, выбираются из целевой группы не произвольно, а целенаправленно либо врачами стационаров, либо врачами амбулаторных лечебных учреждений. И хотя такой подход ограничивает возможности статистической экстраполяции результатов на все население в целом, принцип рандомизации позволяет делать статистически достоверные выводы относительно эффекта терапии в отобранной группе пациентов. .В рамках любого крупного многоцентрового исследования результаты, полученные в отдельно взятом испытании, должны быть экстраполируемы на всю популяцию и учитывать расовые, возрастные, половые и другие различия.

Для того чтобы дать всестороннюю и единообразную оценку лекарственному средству, проходящему испытание, необходимо определить, какие именно исследования должен пройти каждый пациент и в каком временном режиме. Четкий и ясный план исследования может быть получен с помощью четкой схемы.

Ключевой элемент здесь - определение первичного целевого параметра (время, метод и другие условия исследования), измерение которого ляжет в основу качественной и количественной оценки эффекта лечения. Все это должно быть оправдано как с медицинской, так и со статистической точки зрения.

Структурная однородность исследования.

Обычная проблема клинических испытаний, проводимых с целью сопоставления нескольких схем лечения, особенно с потенциально небольшим суммарным эффектом (например, лечение анксиолитиками, антидепрессантами, анальгетиками и т.п.), состоит в том, что на конечный результат могут влиять дополнительные факторы, в том числе возраст, тяжесть заболевания, назначение сопутствующей терапии. Эти факторы, как правило, имеют гетерогенный характер и проявляются независимо от вида терапии. На стадии планирования и оценки испытания учет таких факторов должен быть обязательным. Их неравномерное распределение между целевыми группами может послужить препятствием к достоверной оценке результатов лечения. Методологически существует несколько принципов планирования, позволяющих предупредить данную проблему, среди них - рандомизация и стратификация.

Рандомизация обеспечивает желаемую гомогенность пациентов в целевых группах независимо от случайных отклонений. На практике рандомизация обычно предполагает формирование с помощью компьютера до начала испытаний рандомизированного списка, в котором четко определяется схема лечения для первой, второй, третьей, четвертой и т.д. групп участников. Таким образом закладывается основа распределения пациентов по целевым группам, обычно в соответствии с очередностью их включения в испытания. В случае стратификации рандомизация выполняется по типичным группам (уровням или стратам).

Именно рандомизированное клиническое испытание, при котором имеет место научно обоснованное, сбалансированное распределение пациентов по целевым группам, в зависимости от соответствующих характеристик, позволяет получить наиболее убедительное подтверждение эффективности той или иной схемы лечения. Именно на результаты таких контролируемых клинических испытаний опираются при оценке эффективности лекарственных препаратов и подготовке инструкций по их применению в виде вкладыша к препарату или научному обоснованию схем лечения.

Стратификация представляет собой систему создания сбалансированного распределения различных значимых факторов между лечебными группами. Возможность четко определять вид сопутствующего заболевания или параллельного лечения важна для оценки их влияния на динамику основного заболевания или соответственно эффект базовой терапии.

Стратификация по сопутствующей патологии может использоваться с целью сбалансированного распределения пациентов различных прогностических групп между терапевтическими группами. Если, например, такой фактор, как пол, существенно влияет на результат лечения, скажем, по той причине, что женщины лучше реагируют на лечение, чем мужчины, целесообразно проводить стратификацию по половому признаку - женщины (уровень 1), мужчины (уровень 2), чтобы обеспечить равную численность женщин в каждой терапевтической группе. Такая схема стратификации позволяет провести анализ популяции в целом в сравниваемых группах независимо от того или иного прогностического параметра.

Стратификация дает возможность сделать одновременный анализ схемы лечения, уровневых эффектов и механизмов взаимодействия в пределах одной аналитической модели. Однако, если необходимо до начала испытаний добиться стратификации на уровни, размер которых был бы достаточным для выполнения значимого внутриуровневого анализа (что, как правило, de facto означает проведение двух отдельных исследований), это должно быть отражено в протоколе клинического испытания и использовано для определения размера выборки как для каждого уровня (типической группы), так и для всего исследования в целом.

Существует только одно обстоятельство, ограничивающее применение метода стратификации. Число индивидуальных ячеек (комбинаций значений параметров стратификации) возрастает с увеличением числа параметров стратификации. Например, в исследовании с двумя схемами лечения и двумя бинарными параметрами стратификации образуется уже 23 = 8 отдельных подгрупп пациентов. При многоцентровом исследовании с небольшим числом пациентов в каждом центре использование множественных параметров стратификации может сделать включение сбалансированной выборки во все лечебные группы весьма затруднительным. По этой причине схемы стратификации следует ограничивать максимум 1-2 наиболее значимыми параметрами при соблюдении тщательного мониторинга.

Таковы практические ограничения метода стратификации, но, несмотря на наиболее важные сопутствующие прогностические факторы, стратификация реально призвана обеспечить баланс между сравнительными группами только по вышеуказанным характеристикам, а не по каким-либо важным, но неизвестным дополнительным факторам. Поэтому целесообразно ориентироваться при создании протокола испытания на произвольное распределение участников по терапевтическим группам, т.е. на так называемый принцип рандомизации.

Существуют также и адаптивные подходы, представляющие собой попытку сочетать преимущества стратификации и рандомизации.

С помощью этих формализованных методов пациенты распределяются по терапевтическим группам таким образом, чтобы оптимально сбалансировать заранее определенные значимые параметры. Однако аспекты организации набора пациентов в исследование, проведение необходимых лабораторных и клинических процедур и мониторинга при таких подходах требуют больших усилий, чем при классических методах (например, центральная рандомизация по телефону), а теоретическая основа недостаточно разработана.

Очень важно стремиться к максимальному уровню слепого метода, особенно на этапе рандомизации пациентов, несмотря на умение квалифицированных исследователей дифференцировать у некоторых пациентов активные формулы от плацебо во время проведения испытаний.

Дизайн, оценка размеров выборки и тестирование целевых параметров испытаний

Адекватная оценка новых фармацевтических препаратов - творческий процесс, и не существует единого протокола, который был бы универсален для всех известных заболеваний и действующих терапевтических режимов. Чаще всего применяются три варианта дизайна (схемы) испытаний, к которым относятся: наблюдение без контрольной группы (неконтролируемое исследование), схема параллельного группового анализа и перекрестное исследование (две последние схемы относятся к контролируемым видам испытаний).

Исследование методом наблюдения без контрольной группы представляет собой клинические испытания, при которых для всех пациентов используется один и тот же терапевтический режим. При этом на основании полученных результатов возможны лишь наблюдение и оценка динамики заболевания, но не принятие решения о наличии, отсутствии или величине конечного эффекта лечения.

Нередко возникает желание сравнить результат такого исследования с базовыми величинами или ранее описанной в литературе контрольной группой со сходным заболеванием. Однако только в экстраординарных ситуациях, при которых естественное течение заболевания, включенного в испытания, имеет четкие диагностические рамки, например в случае стойкой длительной ремиссии при раке с метастазами, подобные наблюдения и выводы ложились в основу создания новых видов терапии. Чаще различия между полученными результатами и предшествующими данными по контрольным группам неправильно истолковывались, как это было в середине 70-х гг., когда значительное повышение коэффициентов эффективности антилейкемической терапии было ошибочно приписано новой комбинации препаратов; не был адекватно учтен факт внедрения аминогликозидов, лечение которыми позволило радикально снизить роль инфекции Pseudomonas у больных с лейкемией и главным образом за счет этого изменить естественное течение заболевания в благоприятную сторону.

Метод наблюдения преследует следующие цели: определить, насколько целесообразно с организационно-административной точки зрения исследование большего масштаба, дать основному целевому параметру характеристики, необходимые при повторном расширенном испытании и создании соответствующей гипотезы при очень большом числе целевых параметров.

Для демонстрации эффекта лечения наиболее приемлемой и удобной в практическом отношении является схема параллельного группового анализа, так как здесь действуют минимальные ограничения по основной патологии и меньше проблем, связанных с организацией и мониторингом. В этом случае каждый пациент попадает под одну из схем лечения, проходящих испытания. Каждой схеме лечения соответствует своя терапевтическая группа, и все пациенты, отнесенные к той или иной терапевтической группе, получают одинаковое лечение. Такой протокол не зависит от тех или иных особенностей характера течения заболевания в рамках проводимых испытаний.

Разработаны два существенно важных вида лечебной тактики, применяемой при схеме рандомизированного параллельного группового анализа: групповой анализ с фиксированной дозой и анализ с титрованием дозы.

Групповой анализ с фиксированной дозой в основном при плацебо-контроле позволяет надежно определить начальную дозу препарата и наличие или отсутствие эффекта на таковую, а также оценить ее взаимосвязь с развитием неблагоприятных реакций. Данная лечебная тактика обеспечивает возможность дифференцировать эффекты терапии, обусловленные ее продолжительностью или дозировкой препарата, и является особенно информативной при определении минимальной эффективной дозы и дозы, вызывающей неблагоприятные реакции.

Недостаток схемы - отсутствие возможности изучения реальных условий применения препарата и потенциальная переоценка действительной частоты неблагоприятных реакций, выявляемых клинически, поскольку лечение лучше переносится, если эффективная доза подбирается титрованием в отличие от назначения таковой сразу после рандомизации. Исследования по подбору дозы следует проводить на начальных этапах программы клинических испытаний, а их результаты использовать при планировании будущих испытаний.

Второй вид лечебной тактики, применяемой при параллельном групповом анализе, предусматривает титрование дозы. В одном из вариантов при форсированном титровании дозы пациентов, в том числе получающих плацебо, переводят на фиксированные дозы в соответствии с установленным графиком. Если период титрования относительно короткий, данные, полученные при такой схеме, можно интерпретировать аналогично протоколу с фиксированными дозами. Так называемое гибкое титрование дозы включает два или более анализируемых терапевтических режима и предполагает как повышение, так и понижение дозы через определенный интервал в зависимости от оценки исследователями эффективности и безопасности препарата.

Недостатком такого варианта лечебной тактики является то, что она дает ограниченную информацию относительно дозозависимого эффекта или связи дозы с неблагоприятной реакцией, поскольку тот или иной эффект, наблюдаемый в определенный момент времени, может быть эффектом инициации при текущей дозе, - по сути эффектом переноса действия дозы предыдущей, - или в большей степени зависеть от общей продолжительности терапии, а не реально полученной дозы препарата.

Дифференциация эффектов при таких условиях затруднена в случае выбора описанной схемы исследования. Следовательно, необходима осторожность при интерпретации данных, полученных с помощью схем титрования из-за таких неоднозначных факторов, как выбор препарата, дозы и продолжительность лечения. Тем не менее, включение в качестве составной части в общий план разработки новых препаратов обеих схем с фиксированной дозой и титрованием дозы весьма полезно.

Третьей широко применяемой на практике схемой клинических испытаний является перекрестное исследование. В этом случае анализ терапевтических групп проводят после того, как пациента последовательно переводят на каждый из выбранных режимов в различные интервалы времени. Простейший вариант перекрестного исследования можно представить на примере двух схем лечения "А" и "Б", назначаемых в определенные периоды, последовательно, в двух группах "АБ" и "БА". Первая группа "АБ" получает схему "А" в начальный период времени 1, схему "Б" в последующий период времени 2; вторая группа "БА" - сначала схему "Б", затем — схему "А".

Преимущество такого дизайна состоит в том, что для уменьшения возможности ошибки можно использовать внутри групповую корреляцию, поскольку разброс данных уменьшается при измерении параметров у одного и того же пациента в различные моменты времени по сравнению с регистрацией данных у разных пациентов в одинаковое время. Такой подход обеспечивает более надежное тестирование терапевтического эффекта при меньшей численности пациентов, чем схема параллельного группового анализа. Недостатком данного дизайна исследования является то, что течение основного заболевания должно быть относительно стабильным у всех пациентов, а фармакологические и иные эффекты начального периода не должны перекрывать таковые последующих этапов испытаний (так называемый эффект переноса). Кроме того, при этом дизайне требуются большие организационные усилия, а нередко -ограничение сроков проведения лечения, периоды выведения препаратов могут считаться не соответствующими этическим критериям.

В целом только стабильное течение или медленно прогрессирующие хронические заболевания, такие как астма, подходят для перекрестных исследовании, при этом периоды терапии должны чередоваться с достаточно продолжительными паузами - этапами выведения препаратов.

Если наблюдаемый терапевтический эффект накладывается на следующий период лечения, нарушается основа межиндивидуального анализа, и сопоставление возможно только с учетом результатов первого этапа терапии, охватывающего скорее всего недостаточное число пациентов. Кроме того, высокий процент отсева при перекрестных исследованиях может свидетельствовать о несоответствии дальнейших этапов исходной модели.

Повторяя схему лечения второго этапа на третьем этапе ("АББ" и "БАА"), можно добиться достоверных оценок терапевтического эффекта. Таким образом, можно обойти проблему эффекта переноса, что, однако, не исключает необходимость применения более сложных аналитических процедур.

Перекрестные варианты дизайна часто находят свое место при проведении клинико-фармакологических испытаний. В целом они в наибольшей степени удовлетворяют задачам анализа эффективности различных комбинаций активных компонентов в испытаниях на здоровых добровольцах. В частности, это относится к препаратам, назначаемым перорально, скорость абсорбции которых у разных субъектов может широко варьировать. Перекрестная схема с такими препаратами может существенно снизить влияние такого фактора, как внутригрупповая вариабельность.

Следует упомянуть и о некоторых последних разработках, роль которых в будущем может возрасти, особенно во II фазе испытаний за счет оптимизации решений относительно дальнейшего развития проекта:

• групповые методы с эскалацией дозы препарата;
• методы, основанные на теории принятия решений и концепции Томаса Байеса (Thomas Bayes).

Типы ошибок при тестировании гипотезы. На стадии планирования испытаний соответствующие методы статистического анализа исходного (первичного) целевого параметра должны быть определены как контрольные. При заданном уровне значимости можно проанализировать только ограниченное число вторичных целевых параметров. Все остальные статистические тесты носят исследовательский характер. В статистическую модель необходимо включать параметры основного дизайна.

При проведении статистического анализа следует максимально придерживаться запланированной стратегии. Необходимо указывать причины необходимых отклонений, а установки на структурную однородность и специфическое распределение параметров проверять соответствующими способами.

В большинстве клинических испытаний, особенно тех, которые включают контрольные плацебо-группы, тестируется нулевая гипотеза, означающая отсутствие различий в конечных результатах двух и более терапевтических схем, проходящих испытания.

Таблица 1.Решение по результатам исследования

Верное решение	Гипотеза правомочна	Гипотеза отвергнута
Гипотеза верна (различий в терапевтическом эффекте нет)	Правильное решение	Ошибка I типа с вероятностью а
Гипотеза неверна (есть различия в терапевтическом эффекте	Ошибка II типа с вероятностью b	Правильное решение (с вероятностью 1-b)

В табл. 1 приведены правильные и ошибочные решения, связанные с нулевой гипотезой.

Для ошибки I рода (а), определяющей вероятность ошибочного отклонения нулевой гипотезы, может быть выбрано любое положительное число, меньшее или равное 1, хотя наиболее частое значение а = 0,05. В клинических исследованиях это вероятность того, что одно лечение будет считаться эффективнее другого, когда в действительности это различие отсутствует. Данная величина устанавливается на этапе планирования и фиксируется в протоколе испытания.

Ошибка II рода (b) определяет вероятность ошибочного принятия нулевой гипотезы. Вероятность ошибки II типа (b) выявляет риск оценки тестируемой терапии как неэффективной, даже если получен прямо противоположный результат. В клинических исследованиях это вероятность того, что оба вида лечения или препарата будут считаться равно эффективными, когда в действительности одно лечение лучше другого.

Если цель исследования - ограничить риск ошибки выбора действительно эффективного препарата, то диапазон ошибки II типа также следует сузить, стремясь к значению Р = 0,1 или р = 0,2 (90 или 80% соответственно). Чтобы этого добиться, необходимо правильно определять число пациентов для исследования.

Определение размера выборки. Часто приходится сталкиваться с двумя типами клинических критериев определения эффективности: доказательством того, что тестируемая терапия эффективнее плацебо (например, назначение блокаторов кальциевых каналов для усиления терапии при инсульте) или демонстрацией равнозначности различных схем активной терапии (чаще всего в случае клинических испытаний антибиотиков).

Чтобы определить число случаев, достаточное для подтверждения преимущества того или иного вида активной терапии, прежде всего необходимо получить от врача предполагаемую вероятность ответа на плацебо (для данного примера возьмем таковую за 50%) и клинически обоснованную более высокую вероятность ответа на активную медикаментозную терапию (например, 70%).

Затем подбираются уровень значимости (скажем, а = 0,05) и соответствующая статистическая сила исследования например b-ошибка, равная 0,1 (т.е. статистическая достоверность 1-b = 90%), которая подразумевает, что, если различие в эффективности активной терапии и плацебо будет на расчетном уровне или больше, то при данном испытании вероятность вывода об эффективности препарата составит > 90%.

В данном примере, предполагающем однократный статистический анализ в конце исследования, результатом будет выборка численностью 125 случаев на терапевтическую группу. Если вероятность терапевтического эффекта выбранного активного препарата меньше или вероятность эффекта на плацебо превышает 50%, результатом будет то, что величина ошибки II рода будет больше 0,1. Наоборот, при вероятности "терапевтического эффекта" плацебо меньше 50% и вероятности эффекта на активный препарат больше 70% ошибка II типа реально будет меньше заложенной в протокол.

Подобная методика определения размера выборки применима в ситуациях, когда ответы могут быть подразделены по категориям, т.е. каждый пациент отнесен к отвечающим или не отвечающим на терапию группам, а параметр не является непрерывным, измеряемым. Если же основной критерий эффективности - измеряемая величина, например падение диастолического давления на фоне гипотензивной терапии, то оценка числа случаев, необходимых для выявления клинически значимой разницы (например, 5 мм рт.ст.), будет зависеть от ожидаемой вариантности определения первичного параметра эффективности по данным литературных источников или результатам ранее проведенных испытаний. Чем больше внутренняя вариабельность измерений непрерывного параметра, тем больше будет размер выборки.

Еще одной целью клинических испытаний может быть подтверждение эквивалентности различных терапевтических схем. Теоретически установить истинную равноценность тех или иных видов лечения невозможно, поскольку для этого пришлось бы взять бесконечно большую выборку; максимум, что можно сделать, -это показать сходство терапевтических режимов в рамках заранее установленных границ. Для этого необходимо определить оценки эффективности стандартной и тестируемой схем лечения, а также допустимый уровень различия, который был бы приемлемым, с практической точки зрения, для лечащего врача и позволил бы считать оба вида терапии взаимозаменяемыми. Например, достаточно важной может быть задача показать, что различие двух антибиотиков по чувствительности к патогенной флоре составляет не более 10%.

Важно понимать, что по завершении исследования полученные результаты можно представить в четком и сжатом виде в тех пределах достоверности, которые увязаны с наблюдаемой разницей между схемами терапии. Чем уже границы, тем проще сделать вывод об эквивалентности терапевтических режимов. По возможности предпочтительнее давать расчет доверительных интервалов расхождения терапевтических эффектов, чем просто приводить значение степени вероятности (P-values).

При масштабных испытаниях необходимо обсуждать результаты чаще, чем только на конечном этапе, и по возможности раньше заканчивать исследование, например при очевидной эффективности препарата. Методы группового последовательного анализа, предусматривающие обычно от двух до пяти выверок, вполне уместны и не требуют завышения ос-уровня. Например, если в дополнение к окончательному запланированы два промежуточных анализа после подбора одной и двух третей пациентов, а суммарное а взято за 5%, то для первого, второго и окончательного анализов можно запланировать номинальные статистические тесты, скажем, при а₁ = 1,2%, а₂ = 2,1 и а₃ = 3,3%. Тем не менее проведение промежуточного анализа требует дополнительных организационных усилий. Сама методика и принципы принятия решений должны быть отражены в протоколе испытаний.

Слепые методы исследования являются сегодня наиболее распространенными. Они дают достаточно обоснованные доказательства, подтверждающие эффективность и безопасность тестируемых препаратов или методов лечения.

Чтобы получить целостные научные результаты, максимум усилий при проведении испытаний должен быть направлен на уменьшение или устранение ошибок оценки. Даже при наличии структурной однородности в терапевтических сравнительных группах искажения в результаты часто вносятся самими врачами и/или пациентами вследствие различия в тщательности регистрации данных наблюдения ("Нужно ли с особым вниманием обследовать пациентов, получающих новый препарат?") или под воздействием субъективных ожиданий, влияющих на оценку эффективности ("Новый препарат выглядит особенно перспективным"). Влияние всех этих факторов может скрывать прямой эффект терапии. Поэтому и в первой, и во второй терапевтических группах крайне важно точно следовать протоколу и выполнять все необходимые клинические, лабораторные обследования или диагностические процедуры по графику, чтобы максимально сузить возможность ошибки.

Уровень слепых методов исследования может быть различным, и от этого зависит достоверность анализа и интерпретация конечных результатов. При простом слепом исследовании только пациент не знает, какое именно лечение ему выбрано. Если это неизвестно и врачу, то говорят о двойном слепом методе. Сведения о назначенной схеме лечения не должны сообщаться представителям стороны-разработчика нового препарата. В том случае, когда данная информация закрыта и для статистиков в период проведения анализа результатов испытания, т.е. все, что им известно, это то, что пациенту назначены схемы А, Б, В, Г и т.п., говорят о тройном слепом методе исследования.

Нередко контрольный препарат или схему лечения можно идентифицировать по различным химическим характеристикам или иным признакам (внешний вид, вкус, формула, способ назначения). При таких обстоятельствах слепой вариант исследования достигается с помощью так называемой методики двойного плацебо. Например, при сравнении схем лечения «А» и «Б» пациенты группы "А" получат препарат А в оригинальной форме и нейтральные компоненты препарата Б в виде плацебо, тогда как пациентам, принимающим препарат Б будут назначены плацебо А плюс активная форма препарата Б.

Важность определения условий сбора и анализа данных по безопасности препарата. Оценка данных по безопасности препарата является таким же важным критерием, как и его эффективность, поэтому при проведении испытания необходимо проводить описательный анализ, в том числе демонстрацию индивидуальных данных. Однако на настоящий момент не существует каких-либо схем, явно подтверждающих необходимость в статистическом тестировании параметров таких типов. Для сбора информации, отчетности и аналитической работы рекомендуются следующие правила:

1. Масштаб сбора данных по безопасности препарата зависит от стадии его клинической разработки и исходной информации о ранее установленном профиле неблагоприятных реакций.

2. Все данные по безопасности препарата необходимо регистрировать и анализировать на предмет частоты и тяжести любых неблагоприятных реакций независимо от типа препарата. Такой консервативный подход чрезвычайно важен, поскольку литературные источники изобилуют примерами о лекарственно-зависимых нежелательных реакциях, наблюдавшихся во время испытаний, но впоследствии неучтенных из-за того, что они не были расценены как связанные с действием препарата.

Заболевания или реакции, выявленные ранее или имевшие место до включения пациента в исследование и не изменившиеся по характеру течения, например сахарный диабет, не следует считать нежелательными. Однако если наблюдается прогрессирование сопутствующей патологии в той или иной степени, скажем, выраженное снижение толерантности к глюкозе (возможное явление при лечении глюкокортикоидами), или после лечения развивается ранее отсутствовавшая реакция, по тем или иным причинам расцениваемая как не связанная с препаратом, необходимо учитывать потенциальную зависимость этих признаков от действия препарата, если отсутствуют доказательства обратного, и вести регистрацию всей информации по безопасности лекарственного средства (дата появления реакции, ее продолжительность, тяжесть, обратимость, назначение той или иной дополнительной терапии).

Если при итоговом анализе устанавливается, что между терапевтическими группами нет различий по частоте или тяжести предположительно самостоятельных неблагоприятных реакций, можно говорить об отсутствии лекарственной зависимости последних; если же частота неблагоприятных реакций больше в одной группе без видимых на то объективных причин, такие реакции следует расценивать как лекарственно-обусловленные, если нет четких доказательств обратного.

3. Анализ лекарственно-зависимых или связанных с приемом лекарств (медикаментозных) неблагоприятных реакций в соотношении со всем спектром таковых следует считать вторичным из-за возможной ошибки исследователя на получаемые результаты. Эти данные можно использовать для подтверждения вывода о самостоятельном характере нежелательной реакции только тогда, когда первичный анализ свидетельствует в пользу противоположного. Однако задача поиска доказательств лежит на разработчике нового лекарственного препарата, например подбор информации, выходящей за рамки проводимого испытания, в частности публикаций или данных других исследований, с целью опровержения тезисов о неблагоприятном действии препарата.

4. Показатель анализа неблагоприятных реакций должен объединять всех пролеченных пациентов с эквивалентным риском.

По этой причине комбинацию показателей частоты неблагоприятных реакций исследований с однократной дозой и долгосрочных испытаний на безопасность препарата иногда дополняют адекватны ми статистическими методами, например с использованием таблиц смертности по поколениям.

Важно понимать, что бывает недостаточно объединить все уровни дозировки того или иного препарата в рамках одного анализа неблагоприятных реакций, если обнаруживаются значительные различия в развитии таковых при назначении разных доз или варьировании продолжительности лечения. Например, для большинства препаратов характерно возрастание гепатотоксичности с увеличением продолжительности лечения. Такая закономерность иногда не срабатывает при испытаниях с неизменной дозой; по этой причине объединять результаты подобных испытаний с данными по получавшим терапию длительный период времени (недели, месяцы или годы) пациентам с целью выхода на итоговую оценку риска гепатотоксичного действия было бы неправильно.

5. Анализ лабораторных изменений, не сопровождающихся клинически очевидными нежелательными реакциями, представляет собой особенно сложную проблему, так и не получившую окончательного решения. Метод анализа неблагоприятных реакций при таких обстоятельствах состоит в группировании пациентов в соответствии с изменениями показателей на основе заранее установленных клинически значимых отклонений.

6. В рамках анализа неблагоприятных реакций следует всегда отмечать и отдельно рассматривать три особых типа реакций, связанных с аспектом безопасности препарата: реакции, считающиеся фатально тяжелыми; реакции, приводящие к исключению из испытаний; реакции с летальным исходом. В то время как вполне оправдана оценка общих показателей частоты неблагоприятных реакций, в том числе и по степени тяжести, все эти данные существенно менее значимы с точки зрения безопасности препарата, чем информация по указанным выше трем типам неблагоприятных реакций.

Например, в США помимо описательного анализа некоторые представители Федерального управления по контролю качества лекарственных средств (FDA) требуют проведения статистических тестов для препаратов, поступающих в страну (определение частоты кумулятивных реакций по таблицам смертности). Однако размеры выборки базируются отнюдь не на способности выявлять различия в многочисленных параметрах безопасности с контролируемым уровнем значения а.

Поскольку для определения статистически значимых различий нужны большие числа, при редких, но существенных реакциях, необходима осторожность в интерпретации результатов анализа показателей безопасности. Часто важно не пропустить лекарственно-зависимые нежелательные реакции, особенно на начальных этапах программы клинических испытаний небольшого масштаба.

Выводы. Основные направления планирования и оценки клинических испытаний, изложенные в этом обзоре, не являются всеобъемлющими. Важно понимать, что дизайн клинических испытаний - процесс творческий, здесь могут потребоваться уникальные определения и подходы при работе с инновационными продуктами. Тесное взаимодействие между специалистами разных уровней как клинической, так и фундаментальной медицины имеет существенное значение при создании дизайна испытаний и проведении аналитической работы, так как ошибки в формировании адекватной стратегии и недостаток внимания к деталям на этапе планирования способны привести к таким крайне отрицательным последствиям, как нерациональное использование ресурсов, провал внедрения новых эффективных видов лечения.

ЛИТЕРАТУРА

1.Флетчер Р., Флетчер С, Вагнер Э. Клиническая эпидемиология. М.: Медиа Сфера, 1998.
2. Bailor IIU. С., /Hosteller, F. (eds.). Medical Uses of Statistics. Waltham, New England Journal of Medicine Books, 1986.
3. Pocock S.J. Clinical Trials: A Practical Approach. Chichester-New York-Brisbane-Toronto-Singapore, Wiley, 1983.
4. Планирование и проведение клинических исследований лекарственных средств / Под ред. Ю.Б. Белоусова. М., 2000.
5. Мохов О.И., Белоусов Д.Ю. Методология планирования клинических исследований // Качественная клиническая практика. 2001, №1. С. 8-20.

1 апреля 2002 г.

Объективизация достоверности при планировании и оценке результатов клинических исследований

Комментарии