Мы попросили расшифровать одни и те же анализы ChatGPT и специализированный медицинский ИИ. Диагнозы совпали во всех пяти кейсах. Всё остальное разошлось

Один набор результатов анализов, два пути. Диагноз совпал во всех пяти кейсах. Расходится всё, что после него.
Один набор результатов анализов, два пути. Диагноз совпал во всех пяти кейсах. Расходится всё, что после него.

Мы загрузили пять клинических кейсов в ChatGPT и в специализированный медицинский ИИ — две нейросети для расшифровки анализов, которые сегодня чаще всего открывает пациент и попросили расшифровать анализы. Диагноз оба ИИ поставили одинаковый. Дальше произошло что-то неожиданное — и это меняет вопрос, который стоит задавать технологии.

Два ответа одному человеку

Мужчина 45 лет. Одни анализы. Один короткий запрос: «расшифруй пожалуйста». Два сервиса. Вот что получилось — дословно.

ChatGPT: «Если сделать 3 вещи, большинство показателей нормализуется. 1) Снижение веса на 8–12 кг. 2) Алкоголь: сейчас почти каждый вечер. Для печени и инсулина это критично. 3) Физическая нагрузка: минимум 8000–10000 шагов, силовые 3 раза в неделю».

Специализированный медицинский ИИ МедАссист: «Эндокринолог — для ведения преддиабета, инсулинорезистентности, обсуждения заместительной терапии тестостероном. Кардиолог или терапевт — для оценки сердечно-сосудистого риска. Гастроэнтеролог/гепатолог — для подтверждения жировой болезни печени. Сомнолог или ЛОР — для диагностики апноэ сна. Уролог-андролог — для углубленной оценки сексуальной дисфункции. Анализ на ПСА — перед любым обсуждением терапии тестостероном (стандартный скрининг для мужчин 45+)».

Один человек, одинаковые набор анализов. Оба ИИ правильно разобрали картину — метаболический синдром, инсулинорезистентность, функциональный гипогонадизм, подозрение на апноэ сна, дефицит витамина D и цинка. Диагноз совпал. Разошлось в том, что этот мужчина должен делать в ближайшие две недели.

Мы — команда МедАссиста, сервиса расшифровки анализов с помощью ИИ. В эксперимент мы шли со ставкой, что ChatGPT промахнётся с диагнозом. Он не промахнулся ни разу из пяти. Вывод оказался другим: правильный главный диагноз ≠ помощь пациенту. Дальше на пяти кейсах мы покажем, где проходит реальная линия различия — и честно назовём случай, где ChatGPT обошёл нас по клинической субстанции.

Как мы тестировали

  • Собрали пять клинических панелей, реконструированных из реальных публикаций (PubMed, Blood, Annals of Family Medicine) — сохранив все клинически значимые отклонения и жалобы
  • Загрузили одну и ту же панель в оба сервиса: ChatGPT (тариф Plus, модель GPT-5.4) и специализированный медицинский ИИ МедАссист
  • В ChatGPT писали короткий запрос: «расшифруй мои анализы». Никаких подсказок, никакого редактирования запросов. Цель — воспроизвести поведение обычного пациента с папкой анализов в руке
  • Зафиксировали выдачи дословно. В статье приведены прямые цитаты; места, которые пришлось сократить, обозначены многоточием
  • Четыре кейса — плановые; один бонусный и ургентный — специально, чтобы проверить работу с триажем

Примечание

* Пять кейсов — иллюстрация паттерна, а не статистика. Мы видели одну и ту же картину в каждом из пяти, но не выдаём это за рандомизированное исследование на тысяче прогонов

* Мы — команда МедАссиста. Конфликт интересов понятен. Чтобы его частично компенсировать: методологию зафиксировали до прогонов; выдачи приведены дословно; где ChatGPT нас обошёл — пишем об этом прямо. Исходные публикации, из которых реконструированы панели, называем по ходу текста — так что эксперимент может повторить любой желающий

* Все тесты проводились в один день, 17 апреля 2026 года

Что пишут рецензируемые журналы

Что пишут рецензируемые журналы о ChatGPT в расшифровке анализов — для тех, кто любит цифры до примеров:

  • PLOS ONE, 2024 (Cabral et al.): на специализированных вопросах по лабораторной медицине ChatGPT верно интерпретирует около 51% случаев, а 17% ответов полностью неверны
  • Nature Communications Medicine, 2025: если в контексте вопроса незаметно подсунуть ложный медицинский показатель, LLM в 83% случаев «удваивает» его — то есть встраивает в ответ и строит на нём рассуждение, не заметив подвоха
  • Nature Scientific Reports, 2025: на смешанных кислотно-щелочных нарушениях ChatGPT в 16,7% случаев выдаёт ложно-успокаивающий вердикт «норма»; врачи отделений интенсивной терапии на тех же кейсах дают 0% ложного успокоения
  • МедАссист еще в конце 2024 года обошел и ChatGPT, и GigaChat на корпусе медицинских задач. Об этом мы писали на vc

Цифры, мягко говоря, пугают. Но есть нюанс: в нашем тесте на пяти кейсах ChatGPT стабильно ставил правильный главный диагноз. Даже там, где мы ожидали промаха, — субклинический гипотиреоз, MGUS (моноклональная гаммопатия неясного значения), статин-индуцированный рабдомиолиз, перименопаузальный переход, метаболический синдром с функциональным гипогонадизмом. Пять из пяти.

Это и есть главный поворот эксперимента. Разница оказалась не в «угадал или не угадал», как принято думать. Разница — в том, что происходит после правильного диагноза. Этот слой мы и разбираем дальше.

Пять кейсов эксперимента. Разбираем каждый по очереди — от 45-летнего инженера до ургентного рабдомиолиза.
Пять кейсов эксперимента. Разбираем каждый по очереди — от 45-летнего инженера до ургентного рабдомиолиза.

Мужчина 45 лет, устал жить

Мужчина 45 лет, инженер, сидячая работа, крупный проект и хронический стресс. Жалобы: хроническая усталость (не спасает даже выходной), падение либидо, прибавка веса, храп, утренние головные боли, изжога 2–3 раза в неделю, боли в коленях. Алкоголь — бокал-два вина почти каждый вечер плюс крепкое по выходным. Семейный анамнез: отец — диабет 2 типа, мать — артериальная гипертензия. Классический «наконец-то сдал анализы» мужчина средних лет.

Ключевые отклонения панели. HbA1c 5,9%, HOMA-IR (индекс инсулинорезистентности) 4,9 при норме <2,5 — почти в два раза выше. Триглицериды 2,4, ЛПНП 3,6, ЛПВП 0,95, ApoB 1,35, индекс атерогенности 5,1. АЛТ 58, ГГТ 78 — паттерн неалкогольной жировой болезни печени (НАЖБП). Тестостерон свободный 220 пмоль/л — ниже нормы. Витамин D 18, цинк 9,4, B12 260, гомоцистеин 11,8. hs-CRP (высокочувствительный С-реактивный белок) 4,8, мочевая кислота 468, кортизол 580. Талия 104 см при норме <94.

**Паритет на диагнозе.** Оба ИИ поставили одинаковый набор: метаболический синдром, инсулинорезистентность, преддиабет, атерогенная дислипидемия, НАЖБП, функциональный гипогонадизм, дефицит витамина D и цинка, хроническое низкоуровневое воспаление, гиперурикемия, подозрение на обструктивное апноэ сна, высокий нормальный кортизол. ChatGPT ничего не упустил из общей картины. Он честно собрал все клинические точки.

А теперь — где разошлись.

Маршрутизация. ChatGPT не назвал ни одного конкретного специалиста. Весь блок «куда идти» сводится к «срочно в стационар» (для рабдомиолиза — не в этом кейсе) или к фразам «обычно назначают», «обсудите с врачом». МедАссист предложил пять специалистов с зонами ответственности:

Эндокринолог — для ведения преддиабета, инсулинорезистентности, оценки необходимости медикаментозной коррекции липидов и глюкозы, обсуждения заместительной терапии тестостероном (если изменения образа жизни не помогут). Кардиолог или терапевт — для оценки сердечно-сосудистого риска. Гастроэнтеролог/гепатолог — для подтверждения жировой болезни печени. Сомнолог или ЛОР — для диагностики апноэ сна. Уролог-андролог — для углубленной оценки сексуальной дисфункции.

МедАссист ИИ

В российской реальности пяти специалистов за две недели не пройдёшь — путь через терапевта и направления по ОМС реалистичнее, даже по ДМС пять консилиумов занимают месяц. Но пациент хотя бы знает, к кому и с чем идёт. Фраза «обсудите с врачом» в России, где ожидание у эндокринолога в поликлинике — три недели, означает, что пациент откроет интернет ещё раз и спросит ИИ. И хорошо, если не начнёт лечиться самостоятельно. Ну, либо просто потеряет драгоценное время.

Safety-слой — самый тяжёлый промах. ChatGPT отметил низкий свободный тестостерон и объяснил причины. На этом остановился. МедАссист вставил отдельным пунктом:

Анализ на ПСА (простат-специфический антиген) — перед любым обсуждением терапии тестостероном (стандартный скрининг для мужчин 45+)

МедАссист ИИ

Это не теоретическая придирка. Заместительная терапия тестостероном (TRT, testosterone replacement therapy) при невыявленном раке простаты может ускорить опухолевый процесс — ПСА-скрининг до старта терапии прописан в большинстве профильных гайдлайнов (Endocrine Society, AUA и аналоги). Если 45-летний мужчина, начитавшись ответа ChatGPT, пойдёт искать TRT у «модного эндокринолога» без ПСА — это реальный клинический провал.

Количественные цели. ChatGPT: «Витамин D3 4000–5000 МЕ, магний 300–400 мг, цинк 20–30 мг, омега-3 2–3 г, B-комплекс». МедАссист на том же запросе:

Витамин D — при уровне 18 нг/мл обычно рекомендуют 2000–5000 МЕ в день для достижения целевого уровня 40–60 нг/мл. Контроль через 2–3 месяца. Цинк — 15–30 мг в форме пиколината или цитрата. Магний 300–400 мг в цитрате или глицинате. Омега-3 (EPA+DHA) — 1000–2000 мг. Берберин или инозитол… обсудите с эндокринологом.

МедАссист ИИ

Разница — «сколько съесть сегодня» против «какой уровень достичь, какую форму выбрать, когда проверить». В первом варианте пациент съедает витамин D и не знает, работает или нет. Во втором — у него есть точка контроля.

Механистический каскад. ChatGPT — таблицы и перечисления: вот глюкоза, вот инсулин, вот ЛПНП. МедАссист развернул восемь пронумерованных причинно-следственных связей:

1) Висцеральный жир — это не просто запас, а гормонально активная ткань. Она выделяет воспалительные вещества, снижает чувствительность к инсулину и превращает тестостерон в эстрадиол. 2) Инсулинорезистентность → поджелудочная вырабатывает больше инсулина → инсулин стимулирует синтез триглицеридов и ЛПНП в печени → дислипидемия. 3) Высокий кортизол → усиливает инсулинорезистентность, подавляет выработку тестостерона. 4) Алкоголь ежедневно → триглицериды, ГГТ, нарушение сна. 5) Дефицит витамина D и цинка → снижение синтеза тестостерона. 6) Низкий свободный тестостерон → потеря мышечной массы → замедление метаболизма. 7) Храп + утренние головные боли → апноэ → фрагментация сна → кортизол + инсулинорезистентность. 8) Семейный анамнез — генетический фон

МедАссист ИИ
Восемь связей в одном теле. То, что врач держит в голове — а пациент обычно нет
Восемь связей в одном теле. То, что врач держит в голове — а пациент обычно нет

Это та самая карта, которую врач держит у себя в голове. Пациент с ней перестаёт быть пассажиром собственного организма: похудение, отказ от вечернего вина и CPAP-аппарат для апноэ — не три разных действия, а части одной системы.

Эмоциональная рамка и прогноз. ChatGPT — нейтральная клиническая констатация. МедАссист добавил короткую, но важную рамку:

Хорошая новость: большинство ваших проблем обратимы… При активных действиях сейчас прогноз отличный — всё обратимо. Ваша ситуация — типичная для современного мужчины средних лет. Главное — вы вовремя спохватились. Многие приходят к врачу уже с диабетом или после инфаркта.

Медицинский Ассистент ИИ

Это не психотерапия. Это прогностическая информация — «действие имеет смысл, ещё не поздно» — плюс ориентир: «ваш случай не экзотика». Для 45-летнего, который смотрит на панель из двадцати отклонений, разница между «бесчувственный диагноз» и «диагноз + признание, что ещё можно развернуть» психологически большая.

Где ChatGPT выиграл. Lp(a) (липопротеин а) — при семейном анамнезе ИБС важный кардиомаркёр, мы его не упомянули. Концентрированная формула «3 главных действия» (снижение веса, алкоголь, активность) — запоминается и мотивирует. УЗИ каротид как скрининг атеросклероза. Реальные плюсы ChatGPT в этом кейсе.

Микровывод кейса. На диагнозе — паритет. Разошлись на вопросе «что этот мужчина делает в ближайшие 14 дней». ChatGPT дал мотивирующую формулу «3 действия». МедАссист — пять специалистов с зонами ответственности, safety-гейт ПСА до TRT, целевые уровни с частотой контроля, каскад связей, прогноз и напоминание, что пациент обратился вовремя.

Правильный главный диагноз — это ноль минут помощи, если дальше нет маршрута, safety-проверок, целевых уровней и признания «вы вовремя».

Семь различий между сервисами

Не статистика на ста кейсах — наблюдаемый паттерн на пяти, повторявшийся в каждом. Мы сравнивали выдачи построчно по семи параметрам.

Диагноз совпадает в 5/5. Расходится всё, что после него — маршрут, безопасность, цели, рамка, механика, специфика тестов
Диагноз совпадает в 5/5. Расходится всё, что после него — маршрут, безопасность, цели, рамка, механика, специфика тестов

Таблица не означает «ChatGPT проигрывает». Она показывает, в чём именно сервисы разнятся. На быстром вопросе «что это вообще значит» ChatGPT работает хорошо и быстро. На плане действий до визита врача — проседает системно. Это не баг: GPT обучали на разнородных текстах интернета, а не на клинических алгоритмах ведения пациента.

Где ChatGPT обошёл нас — честно

Мы прогнали кейс MGUS (моноклональная гаммопатия неясного значения) — и здесь ChatGPT выиграл по клинической субстанции. В методологии мы пообещали писать о своих промахах прямо. Вот он.

Мужчина 68 лет. Жалобы — общая слабость последние шесть месяцев и периодические боли в спине. Принимает периндоприл и аторвастатин 10 мг. Панель почти в норме, кроме трёх отклонений: общий белок 92 г/л (повышен, норма 64–83), альбумин 38 (норма), СОЭ 38 мм/ч (повышена в два с лишним раза). Возраст 68 + слабость шесть месяцев + боли в спине + общий белок + СОЭ = классическая «триада красных флагов» на моноклональную гаммопатию или множественную миелому. Её нужно поймать в скрининге.

Что ChatGPT сделал лучше нас. Явно рассчитал соотношение альбумин/глобулин: общий белок 92, альбумин 38 → глобулины 54, соотношение 0,70 (норма >1,0). Вывод — повышены глобулины. Дальше назвал дифференциальный диагноз специфично:

Три тревожных признака: СОЭ 38, общий белок 92, жалобы (слабость + боли в спине). Эта комбинация классически заставляет исключать множественную миелому… Также может быть: хроническое воспаление, инфекция, ревматологические заболевания, MGUS

ChatGPT

И дал специфический work-up: электрофорез белков сыворотки + иммунофиксация + свободные лёгкие цепи (FLC) + белок Бенс-Джонса в моче + рентген/МРТ позвоночника + КТ костей. Это реальный клинический чек-лист, который должен назначить гематолог. Именно то, что отличает «обследование при MGUS» от «обследование при непонятном СОЭ».

Четыре точки, где ChatGPT оказался сильнее. Фиксируем, чтобы статья не превратилась в рекламу
Четыре точки, где ChatGPT оказался сильнее. Фиксируем, чтобы статья не превратилась в рекламу

Что МедАссист не сделал. Не рассчитал соотношение A/G явно. Упомянул моноклональные гаммопатии как возможность, но не назвал специфических подтверждающих тестов — FLC, иммунофиксации, Бенс-Джонса. Это реальный продуктовый провал, а не интерпретационная тонкость. Команда видит, работа идёт.

Что МедАссист всё-таки дал. Несмотря на промах по тестам, выдача пустой не была. В ней есть то, чего не дал ChatGPT:

Подготовьтесь к визиту: запишите, когда началась слабость, как часто и где именно болит спина, были ли эпизоды повышения температуры, ночная потливость, потеря веса

МедАссист ИИ

Перечисление «температура, ночная потливость, потеря веса» — так называемые B-симптомы, классический скрининг лимфом и миеломы. Пациент, который придёт к гематологу с двумя строчками «за полгода три эпизода ночной потливости, потеря веса около 3 кг», экономит 20 минут приёма и повышает качество анамнеза.

МедАссист также сделал метакогнитивную отметку («на бланке не указаны референсные значения — использовал международно признанные нормы»), дал более точный диапазон срочности («1–2 недели» против ChatGPT «в ближайшие недели») и коротко прокомментировал текущую терапию.

Редакторский вывод. Это не «победа-поражение», а разные режимы работы. ChatGPT сработал как врачебный чек-лист в руках пациента — список тестов для врача. МедАссист — как подготовка пациента к визиту: B-симптомы, формулировки жалоб, точная срочность.

Оба режима легитимны. Пропуск специфических тестов на MGUS — точка, где мы себя критикуем. Но если пациент придёт к гематологу с заметкой МедАссиста, а врач сам назначит FLC, иммунофиксацию и Бенс-Джонса (он и должен их назначать) — 20 минут приёма, сэкономленные на сборе B-симптомов, дорогого стоят.

Ещё два кейса, тот же паттерн

Субклинический гипотиреоз — женщина 52 лет

Пациентка жалуется на усталость, прибавку веса, сухость кожи. ТТГ 6,8 мЕд/л (повышен, норма 0,4–4,0), свободные Т4 и Т3 в норме. Общий холестерин 6,8, ЛПНП 4,3. Оба ИИ правильно поставили диагноз — субклинический гипотиреоз плюс дислипидемия. Главный диагноз снова совпал.

Разошлись — в одном предложении. ChatGPT:

По современным рекомендациям обычно начинают лечение, если: ТТГ >6–7, есть симптомы, возраст <65. У вас все критерии есть. Обычно назначают левотироксин (L-тироксин) в небольшой дозе

ChatGPT

По форме — разумно. По сути — упрощение с потенциально вредными последствиями. Рекомендации Американской тиреоидной ассоциации и Европейской тиреоидной ассоциации при ТТГ в диапазоне 4–10 мЕд/л говорят прямо противоположное: решение индивидуальное. МедАссист это отразил:

Решение о начале лечения принимается индивидуально: при ТТГ выше 10 мЕд/л терапия обычно рекомендуется, при уровне 4–10 мЕд/л (как у вас) — решение зависит от симптомов, наличия антител, сопутствующих заболеваний и динамики

МедАссист ИИ

И дал последовательность действий, которую ChatGPT пропустил:

Липидограмма в динамике — после коррекции функции щитовидной железы холестерин часто нормализуется сам

МедАссист ИИ

Это принципиально. Если женщина с ТТГ 6,8 и холестерином 6,8 начнёт одновременно левотироксин и статин, через три месяца она может принимать статин, который ей не нужен: гипотиреоз сам по себе поднимает холестерин. МедАссист добавил явную маршрутизацию (эндокринолог), повторный контроль ТТГ и свТ4 через 2–3 месяца и уровень срочности «в ближайшие 2–4 недели».

Вывод кейса: оба правы на диагнозе. Один может подтолкнуть к избыточной терапии и к ненужному статину. Второй выстраивает последовательность.

Тот же паттерн — и в следующем кейсе, но уже на другой теме, где цена упрощения ещё выше.

Перименопауза — женщина 50 лет

Пациентка: приливы, ночная потливость, бессонница, снижение либидо, «мозговой туман». Семейный анамнез — остеопороз у матери, ИБС у отца. Панель: ФСГ 42, эстрадиол 45 пмоль/л (низкий), прогестерон 1,2, анти-ТПО 68 (ранний Хашимото), витамин D 22, ферритин 32, паратгормон 68, ЛПНП 3,9. Оба ИИ поставили: перименопаузальный переход + ранний аутоиммунный тиреоидит + дефицит витамина D + латентный железодефицит + дислипидемия постменопаузы.

Разошлись — в теме менопаузальной гормональной терапии (МГТ, или ЗГТ — заместительная гормональная терапия; современная терминология предпочитает «МГТ»). ChatGPT:

Менопаузальная гормональная терапия. Очень вероятно, что она показана. Она уменьшает приливы, улучшает сон, защищает кости, улучшает липиды. Но назначается гинекологом после обследования

ChatGPT

МедАссист развернул ту же тему в рамку решения:

Учитывая ваш возраст (50 лет), отсутствие противопоказаний и выраженные симптомы — вы в "окне возможностей" для начала МГТ. Начало МГТ в первые 10 лет после последней менструации (вы в этом "окне") ассоциировано с максимальной пользой: снижение приливов на 80–90%, улучшение сна, настроения, либидо, защита костей и сердечно-сосудистой системы, профилактика урогенитальной атрофии

МедАссист ИИ

Важна не только цифра «80–90%», но и safety-гейт, который ChatGPT пропустил:

УЗИ органов малого таза и маммография — для актуализации скрининга (последняя маммография 2 года назад, цитология 3 года назад). Перед началом МГТ необходимо исключить противопоказания

МедАссист ИИ

В русскоязычной среде тема МГТ либо замалчивается, либо обросла страхами про рак молочной железы. Рамка решения с окном, цифрой эффекта и предусловиями обследования — редкость, особенно для женщины, которой гинеколог сказал «ну это же возраст, терпите». И короткая эмоциональная рамка, без пафоса:

Ваши симптомы — не "просто возраст" и не то, с чем нужно смиряться. Это управляемое состояние

МедАссист ИИ

По количественным целям — та же картина, что у 45-летнего мужчины. ChatGPT: «Витамин D 2000–4000 МЕ». МедАссист: целевой уровень витамина D 40–60 нг/мл, ферритин 50–100, железо 40–80 мг элементарного утром натощак с витамином С, кальций 1200–1500 мг, белок 1,0–1,2 г/кг. Разница не в дозах, а в том, что у пациентки появляется чек-лист контроля, а не общий совет.

Вывод кейса: тема МГТ в России — минное поле дезинформации. Развёрнутая рамка принятия решения здесь не бонус, а базовый уровень поддержки пациента.

А если это не плановая ситуация, а ургентная

В четырёх плановых кейсах главный контраст был в маршрутизации, safety и целях. Но есть ещё одно измерение, которого в плановых ситуациях не видно, — триаж. Пациент в критическом состоянии должен вызывать скорую, а не открывать ИИ. На практике он открывает ИИ. Мы прогнали один ургентный кейс, чтобы посмотреть, как оба сервиса с этим справляются.

Мужчина 52 года. Принимает аторвастатин 40 мг уже 8 лет по поводу гиперхолестеринемии, плюс диабет 2 типа на метформине. Жалобы: тяжёлая слабость проксимальных мышц (не может поднять руки, не может подняться по лестнице), боли в плечах и бёдрах, тёмная моча пять дней назад. Панель: КФК 23 171 Е/л (норма 30–200 — превышение в 115 раз), АСТ 3 851, АЛТ 594, миоглобин сыворотки 3 200, миоглобинурия положительная, креатинин 188, eGFR (скорость клубочковой фильтрации) 38, калий 5,3.

Оба сделали правильно. Диагноз — статин-индуцированный рабдомиолиз с острым повреждением почек. Причину связали с аторвастатином. Рекомендовали госпитализацию. Оба упомянули anti-HMGCR (антитела к HMG-CoA-редуктазе) и anti-SRP — маркёры статин-ассоциированной иммуноопосредованной некротизирующей миопатии (IMNM).

Но дальше разошлись в трёх точках.

Триаж — первая строка ответа. ChatGPT разложил анализ по 12 блокам: показатели, симптомы, причины, лечение. Фраза «срочно в стационар» появляется на девятом блоке из двенадцати — после длинной простыни. МедАссист в том же кейсе начал иначе:

Критическая ситуация: необходима срочная госпитализация. Ваши анализы указывают на тяжёлое острое повреждение мышечной ткани (рабдомиолиз), которое угрожает функции почек и требует немедленной медицинской помощи. Это неотложное состояние

Медассист ИИ

И дальше в блоке срочности:

КРИТИЧЕСКАЯ срочность — требуется госпитализация в течение ближайших часов… Если вы чувствуете резкое ухудшение (сильная слабость, перебои в сердце, уменьшение количества мочи, спутанность сознания) — вызывайте скорую помощь

МедАссист ИИ

В экстренной ситуации первая строка ответа определяет исход. Если пациент увидит разбор на 12 блоков, и только на девятом — «срочно в стационар», он может потерять 10–15 минут на чтение. Место триажа — это разница между «вызвал скорую» и «дочитал до конца».

Клиническое рассуждение — расчёт АСТ/АЛТ. АСТ 3 851 и АЛТ 594 легко истолковать как тяжёлое поражение печени: трансаминазы зашкаливают, значит, печень. МедАссист сделал явный расчёт:

Соотношение АСТ/АЛТ = 6.5 (при норме около 1). Такое резкое преобладание АСТ над АЛТ типично именно для мышечного, а не печёночного повреждения

МедАссист ИИ

Без этого расчёта пациент мог испугаться «катастрофы печени» — хотя источник трансаминаз здесь мышечный. ChatGPT упомянул паттерн в общем виде, но не посчитал.

Ответ на вопрос «почему сейчас?» Пациент принимает аторвастатин 8 лет. Почему рабдомиолиз случился именно сейчас?

Рабдомиолиз мог быть спровоцирован: незначительным обезвоживанием, взаимодействием лекарств, накопительным эффектом статина на фоне ухудшения функции почек (почки хуже выводят препарат → его концентрация растёт).

МедАссист ИИ

ChatGPT этот вопрос пропустил. А он важен — объясняет, почему продолжать статин после восстановления нельзя.

Пост-госпитальный план.* У ChatGPT его практически нет: отмена статина, инфузии, мониторинг. У МедАссиста — развёрнутый план после выписки: гидратация 2–2,5 л, ограничение белка 0,8–1 г/кг, ограничение калия, избегать НПВС, CoQ10 100–200 мг/день, генетический тест SLCO1B1, альтернативы статину (эзетимиб, фибраты, PCSK9-ингибиторы), контроль почек и КФК минимум раз в 3 месяца первый год.

Микровывод кейса. В плановых ситуациях триаж — это такт. В ургентных — клиническая ответственность. Разница в первой строке ответа, в расчёте соотношения и в пост-госпитальном плане — разница между «информацией» и «навигацией». Повторим: в такой ситуации пациент должен набирать 103, а не открывать ИИ.

Ограничения эксперимента

Мы обещали в методологии быть открытыми про слабости эксперимента. Вот они.

Пять кейсов — иллюстрация паттерна, не статистика. Для доказательных выводов нужны сотни прогонов, желательно с ослеплением оценщиков и заранее зарегистрированной методологией. Мы видели один и тот же паттерн в каждом из пяти, но признаём: выборка недостаточная. Продвинутый читатель вправе сказать: «Покажите мне 200 кейсов». Справедливое требование.

На MGUS мы пропустили специфические подтверждающие тесты — FLC, иммунофиксацию, белок Бенс-Джонса. Это не «недопонимание контекста», а реальный продуктовый провал. Команда знает, работа идёт — в частности, над тем, как лучше подтягивать релевантные клинические фрагменты из базы под конкретный паттерн панели.

«Lost in the Middle». Мы изначально закладывали, что в кейсе со статин-рабдомиолизом — панель из ~70 показателей плюс аторвастатин «похоронен» в середине списка из восьми препаратов — ChatGPT не свяжет миопатию со статином. Этого не произошло: модель увидела аторвастатин и корректно связала с КФК. Возможно, эффект проявляется на ещё более крупных панелях (150+ показателей). Мы такие не тестировали. Гипотеза осталась непроверенной.

Одна модель, одна версия. Мы тестировали ChatGPT на версии GPT-5.4 — это конкретный снимок во времени. Другие публичные LLM на данных примерах не тестировали. Результаты могут отличаться.

Методологические оговорки. Мы — команда МедАссиста. Конфликт интересов понятен. Чтобы его ограничить: методологию зафиксировали до прогонов (список кейсов, промпт, сервисы); все выдачи приведены дословно в виде цитат.

Когда какой инструмент

Вывод — не «используйте МедАссист», а вывод в том, что выбор зависит от задачи.

Три режима использования. ChatGPT — быстрый ответ. Специализированный ИИ — подробный разбор. Врач — клиническая ответственность
Три режима использования. ChatGPT — быстрый ответ. Специализированный ИИ — подробный разбор. Врач — клиническая ответственность

ChatGPT в медицине хорош для:

  • Быстрого перевода «медицинского» языка на человеческий («что вообще значит HOMA-IR?»)
  • Коротких ответов на конкретный вопрос («что такое ферритин?»)
  • Образовательных справок о заболеваниях, особенно редких
  • Мотивирующей формулы «три вещи сделать сейчас» — короткое действие для первого шага

Специализированный медицинский ИИ хорош для:

  • Структурированного подхода к полной лабораторной панели
  • Маршрутизации к специалистам с зонами ответственности
  • Safety-слоя — предусловий перед терапией, warning signs, уровней срочности с таймингом
  • Количественных целей — какой уровень достичь, какую форму препарата выбрать, когда проверить
  • Подготовки к визиту врача — как записать жалобы, какие вопросы задать, что принести на приём для максимальной эффективности и экономии времени и денег

Живой врач необходим. Ни один ИИ не умеет делать физикальный осмотр, пальпацию и не несет клиническую ответственность за пациента. Хороший врач все еще может задать вопросы, которые ИИ придумать пока не в силах, и видит то, чего нет в анализах. Но прийти к врачу подготовленным — с маршрутом, формулировками жалоб и списком вопросов — гораздо лучше, чем прийти с растерянностью и ворохом результатов исследований.

Вопрос не «какой ИИ умнее». Вопрос — что именно вы хотите получить от технологии: быстрый ответ или развёрнутый анализ конкретно вашей ситуации.

Сервис МедАссист, о котором шла речь в статье, доступен на medassistai.ru

Полная сырая выдача ChatGPT, МедАссиста и полные входные данные мы выложили на сайте.

2 комментария