PHQ-9 и GAD-7: почему эти два опросника стали золотым стандартом скрининга депрессии и тревоги
Почему именно эта пара стала стандартом
В 2001 году Kurt Kroenke, Robert Spitzer и Janet Williams опубликовали PHQ-9 — короткую шкалу депрессии из 9 пунктов. Через пять лет те же авторы плюс Bernd Löwe выпустили GAD-7 — парный инструмент для тревоги из 7 пунктов. За двадцать лет эта пара вытеснила более длинные шкалы в первичной помощи почти повсеместно. USPSTF, NICE, HEDIS — все крупные клинические руководства рекомендуют именно её.
Причин ровно три, и они действуют вместе. Краткость: 16 пунктов суммарно, 3–5 минут заполнения. Общественное достояние: бесплатны, без лицензирования, переведены на 80+ языков. Прямое соответствие DSM: 9 пунктов PHQ-9 — это буквально 9 критериев большого депрессивного расстройства по DSM-IV и DSM-5. GAD-7 создан той же группой как парный инструмент, с той же логикой шкалы (0–3) и тем же порогом (≥10). Получается единый рабочий процесс, а не два разных инструмента.
Оба инструмента находятся в общественном достоянии. Разрешение на использование не требуется — воспроизведение, перевод и цифровая интеграция свободны при сохранении формулировок пунктов. Это принципиальное отличие от BDI-II, Шкалы тревоги Бека и Maslach Burnout Inventory, которые остаются коммерческими.
Что измеряет PHQ-9
PHQ-9 — это 9 пунктов, каждый соответствует одному симптому большого депрессивного расстройства по DSM-IV. Период оценки — последние 2 недели. Шкала 0 («никогда») — 3 («почти каждый день»). Диапазон общего балла: 0–27. Оригинальная валидация Kroenke et al. (2001) проводилась на выборке 6 000 пациентов первичного звена. При пороге ≥10 инструмент показал чувствительность 88% и специфичность 88% против слепого клинического интервью — редкое совпадение двух высоких параметров одновременно.
Через восемнадцать лет мета-анализ индивидуальных данных Levis, Benedetti & Thombs (2019) в BMJ повторил этот результат почти в точности: 58 исследований, 17 357 участников, 2 312 случаев большой депрессии. Против полуструктурированного интервью (ближайший к клинической практике референс) — чувствительность 88%, специфичность 85% при пороге ≥10. Цифры 2001 года устояли против самой крупной проверки, которую можно было организовать.
- Пункт 1: Мало интереса или удовольствия от занятий — ангедония
- Пункт 2: Подавленность, тоска или безнадёжность — сниженное настроение
- Пункт 3: Трудности со сном — нарушения сна
- Пункт 4: Усталость или отсутствие сил — утомляемость
- Пункт 5: Плохой аппетит или переедание — нарушение аппетита
- Пункт 6: Ощущение неудачника, чувство вины — самообесценивание
- Пункт 7: Трудности с концентрацией — когнитивные нарушения
- Пункт 8: Замедленность или, наоборот, суетливость — психомоторные изменения
- Пункт 9: Мысли о том, что лучше было бы умереть — суицидальные мысли, сигнал немедленной клинической оценки
«Балл PHQ-9 ≥10 показал чувствительность 88% и специфичность 88% при выявлении большого депрессивного расстройства. Эти характеристики вместе с краткостью делают PHQ-9 полезным клиническим и исследовательским инструментом.»— Kroenke, Spitzer & Williams, 2001, Journal of General Internal Medicine
Что измеряет GAD-7
GAD-7 создан через 5 лет после PHQ-9 той же исследовательской группой. Изначально было 13 пунктов-кандидатов; после факторного анализа, анализа корреляций и сопоставления с критериями DSM-IV для ГТР осталось 7. Шкала, период оценки и пороги — такие же, как у PHQ-9. Валидация на выборке 2 740 пациентов первичного звена (Spitzer et al., 2006) дала чувствительность 89% и специфичность 82% при пороге ≥10.
Важное свойство GAD-7, которое часто упускают: он валидирован не только для генерализованного тревожного расстройства. Kroenke et al. (2007) в Annals of Internal Medicine показали, что GAD-7 работает как скрининг для панического расстройства, социальной фобии и ПТСР с AUC 0,80–0,91. То есть один короткий опросник покрывает четыре тревожных синдрома. GAD-7 — не узкий инструмент ГТР, а общий скрининг тревоги. Первые два пункта GAD-7 образуют GAD-2 — ультракраткий двухпунктовый скрининг.
Пороги и интерпретация: одинаковая логика для двух шкал
Пороги у двух инструментов построены по одному принципу и легко запоминаются. 0–4 — минимальный уровень или его отсутствие. 5–9 — лёгкий. 10–14 — умеренный. 15+ — тяжёлый (у PHQ-9 есть дополнительная граница 20+ для «крайне тяжёлый»). Клинический порог ≥10 — основной для обоих инструментов. Ниже него — наблюдение, выше — показана интервенция.
Отдельно — пункт 9 PHQ-9. Это прямой вопрос о мыслях о смерти и самоповреждении. Любой балл выше нуля по этому пункту требует немедленной клинической оценки риска — независимо от общего балла опросника. Это правило, а не рекомендация: так же, как пункт 10 в EPDS, пункт 9 работает как отдельный сигнал немедленной клинической оценки, независимый от суммарного результата. GAD-7 аналогичного пункта не имеет — при подозрении на суицидальный риск у тревожного пациента добавляйте PHQ-9 или специализированный инструмент скрининга суицидальности.
PHQ-9 + GAD-7 в динамике: стандарт MBC
Краткость пары — не просто удобство, это то, что делает возможным еженедельный мониторинг без перегрузки клиента. Клиент, которого просят заполнять BDI-II или CORE-OM каждую неделю, быстро начинает сопротивляться. 3–5 минут PHQ-9 + GAD-7 проходят незаметно. Именно это превращает пару из скринингового инструмента в измерительный: серия замеров показывает траекторию терапии в реальном времени.
Löwe et al. (2004) установили минимально клинически значимое изменение (MCID) для PHQ-9 на уровне 5 баллов. Для GAD-7 обычно цитируется приблизительно 4 балла. Это рабочий ориентир для интерпретации динамики: снижение на 5+ пунктов PHQ-9 от исходного уровня — клинически заметное улучшение, а не шум измерения. Методика MBC предполагает построение графика баллов от сессии к сессии и обсуждение его с клиентом — это само по себе имеет терапевтический эффект, независимо от содержания терапии.
PHQ-9 и GAD-7 — это не «ещё один тест», а основа повторяемого измерения в клинической практике. Заполнение перед каждой сессией, обсуждение графика с клиентом, коррекция плана при отсутствии снижения балла за 4–6 сессий. Именно серия, а не одиночный замер, превращает опросник в работающий инструмент MBC.
Ограничения и когда дополнить другими инструментами
У пары есть границы применимости. PHQ-9 фокусирован на 9 критериях DSM для большой депрессии и не охватывает спектр депрессивных проявлений, которые лучше передаёт BDI-II (самообесценивание, чувство наказания, снижение образа тела). GAD-7 охватывает когнитивную тревогу и беспокойство, но менее чувствителен к соматической тревоге с выраженным физиологическим возбуждением — здесь BAI или HADS-A точнее. Для пациентов с преимущественно соматическими жалобами или в медицинских условиях часто предпочтительнее HADS, специально разработанный с исключением соматических пунктов.
- BDI-II — для более детальной оценки депрессии и при необходимости большего диапазона тяжести (0–63 против 0–27 PHQ-9)
- BAI — когда ведущие жалобы соматические: сердцебиение, головокружение, паника
- HADS — в соматических условиях, где физические симптомы могут искажать PHQ-9 и GAD-7
- DASS-21 — когда нужен третий конструкт (стресс) помимо депрессии и тревоги
- EPDS — в перинатальном периоде, где соматические пункты PHQ-9 дают ложноположительные результаты
Золотой стандарт — это не «лучший инструмент для всех случаев», а «инструмент, который стоит использовать по умолчанию». PHQ-9 + GAD-7 закрывают 80% клинических задач скрининга в первичной помощи и психотерапевтической практике. Для оставшихся 20% есть специализированные инструменты. Настоящая сила пары раскрывается не в одном замере, а в серии — когда клиент видит свой график, а специалист получает объективные данные для клинического решения. Это то, что превращает краткие 16 пунктов в основу измеримой терапии.