🩺 Расшифровка анализов с помощью ИИ: какой сервис выбрать?
Мы загрузили пять клинических кейсов в ChatGPT и в специализированный медицинский ИИ — две нейросети для расшифровки анализов, которые сегодня чаще всего открывает пациент, и попросили расшифровать анализы. Диагноз оба ИИ поставили одинаковый. Дальше произошло что-то неожиданное — и это меняет вопрос, который стоит задавать технологии.
Два ответа одному человеку
Мужчина 45 лет. Одни анализы. Один короткий запрос: «расшифруй пожалуйста». Два сервиса. Вот что получилось — дословно.
ChatGPT: Если сделать 3 вещи, большинство показателей нормализуется. 1) Снижение веса на 8–12 кг. 2) Алкоголь: сейчас почти каждый вечер. Для печени и инсулина это критично. 3) Физическая нагрузка: минимум 8000–10000 шагов, силовые 3 раза в неделю.
Специализированный медицинский ИИ МедАссист: Эндокринолог — для ведения преддиабета, инсулинорезистентности, обсуждения заместительной терапии тестостероном. Кардиолог или терапевт — для оценки сердечно-сосудистого риска. Гастроэнтеролог/гепатолог — для подтверждения жировой болезни печени. Сомнолог или ЛОР — для диагностики апноэ сна. Уролог-андролог — для углубленной оценки сексуальной дисфункции. Анализ на ПСА — перед любым обсуждением терапии тестостероном (стандартный скрининг для мужчин 45+).
Один человек, одинаковый набор анализов. Оба ИИ правильно разобрали картину — метаболический синдром, инсулинорезистентность, функциональный гипогонадизм, подозрение на апноэ сна, дефицит витамина D и цинка. Диагноз совпал. Разошлось в том, что этот мужчина должен делать в ближайшие две недели.
Мы — команда МедАссиста, сервиса расшифровки анализов с помощью ИИ. В эксперимент мы шли со ставкой, что ChatGPT промахнётся с диагнозом. Он не промахнулся ни разу из пяти. Вывод оказался другим: правильный главный диагноз ≠ помощь пациенту. Дальше на пяти кейсах мы покажем, где проходит реальная линия различия — и честно назовём случай, где ChatGPT обошёл нас по клинической субстанции.
Как мы тестировали
- Собрали пять клинических панелей, реконструированных из реальных публикаций (PubMed, Blood, Annals of Family Medicine) — сохранив все клинически значимые отклонения и жалобы
- Загрузили одну и ту же панель в оба сервиса: ChatGPT (тариф Plus, модель GPT-5.4) и специализированный медицинский ИИ МедАссист
- В ChatGPT писали короткий запрос: «расшифруй мои анализы». Никаких подсказок, никакого редактирования запросов. Цель — воспроизвести поведение обычного пациента с папкой анализов в руке
- Зафиксировали выдачи дословно. В статье приведены прямые цитаты; места, которые пришлось сократить, обозначены многоточием
- Четыре кейса — плановые; один бонусный и ургентный — специально, чтобы проверить работу с триажем
Примечание
* Пять кейсов — иллюстрация паттерна, а не статистика. Мы видели одну и ту же картину в каждом из пяти, но не выдаём это за рандомизированное исследование на тысяче прогонов.
* Мы — команда МедАссиста. Конфликт интересов понятен. Чтобы его частично компенсировать: методологию зафиксировали до прогонов; выдачи приведены дословно; где ChatGPT нас обошёл — пишем об этом прямо. Исходные публикации, из которых реконструированы панели, называем по ходу текста — так что эксперимент может повторить любой желающий.
* Все тесты проводились в один день, 17 апреля 2026 года.
Что пишут рецензируемые журналы
Что пишут рецензируемые журналы о ChatGPT в расшифровке анализов — для тех, кто любит цифры до примеров:
- PLOS ONE, 2024 (Cabral et al.): на специализированных вопросах по лабораторной медицине ChatGPT верно интерпретирует около 51% случаев, а 17% ответов полностью неверны
- Nature Communications Medicine, 2025: если в контексте вопроса незаметно подсунуть ложный медицинский показатель, LLM в 83% случаев «удваивает» его — то есть встраивает в ответ и строит на нём рассуждение, не заметив подвоха
- Nature Scientific Reports, 2025: на смешанных кислотно-щелочных нарушениях ChatGPT в 16,7% случаев выдаёт ложно-успокаивающий вердикт «норма»; врачи отделений интенсивной терапии на тех же кейсах дают 0% ложного успокоения
- МедАссист ещё в конце 2024 года обошёл и ChatGPT, и GigaChat на корпусе медицинских задач. Об этом мы писали на vc.ru
Цифры, мягко говоря, пугают. Но есть нюанс: в нашем тесте на пяти кейсах ChatGPT стабильно ставил правильный главный диагноз. Даже там, где мы ожидали промаха, — субклинический гипотиреоз, MGUS (моноклональная гаммопатия неясного значения), статин-индуцированный рабдомиолиз, перименопаузальный переход, метаболический синдром с функциональным гипогонадизмом. Пять из пяти.
Это и есть главный поворот эксперимента. Разница оказалась не в «угадал или не угадал», как принято думать. Разница — в том, что происходит после правильного диагноза. Этот слой мы и разбираем дальше.
Мужчина 45 лет, устал жить
Мужчина 45 лет, инженер, сидячая работа, крупный проект и хронический стресс. Жалобы: хроническая усталость (не спасает даже выходной), падение либидо, прибавка веса, храп, утренние головные боли, изжога 2–3 раза в неделю, боли в коленях. Алкоголь — бокал-два вина почти каждый вечер плюс крепкое по выходным. Семейный анамнез: отец — диабет 2 типа, мать — артериальная гипертензия. Классический «наконец-то сдал анализы» мужчина средних лет.
Ключевые отклонения панели. HbA1c 5,9%, HOMA-IR (индекс инсулинорезистентности) 4,9 при норме <2,5 — почти в два раза выше. Триглицериды 2,4, ЛПНП 3,6, ЛПВП 0,95, ApoB 1,35, индекс атерогенности 5,1. АЛТ 58, ГГТ 78 — паттерн неалкогольной жировой болезни печени (НАЖБП). Тестостерон свободный 220 пмоль/л — ниже нормы. Витамин D 18, цинк 9,4, B12 260, гомоцистеин 11,8. hs-CRP (высокочувствительный С-реактивный белок) 4,8, мочевая кислота 468, кортизол 580. Талия 104 см при норме <94.
Паритет на диагнозе. Оба ИИ поставили одинаковый набор: метаболический синдром, инсулинорезистентность, преддиабет, атерогенная дислипидемия, НАЖБП, функциональный гипогонадизм, дефицит витамина D и цинка, хроническое низкоуровневое воспаление, гиперурикемия, подозрение на обструктивное апноэ сна, высокий нормальный кортизол. ChatGPT ничего не упустил из общей картины. Он честно собрал все клинические точки.
А теперь — где разошлись.
Маршрутизация. ChatGPT не назвал ни одного конкретного специалиста. Весь блок «куда идти» сводится к «срочно в стационар» (для рабдомиолиза — не в этом кейсе) или к фразам «обычно назначают», «обсудите с врачом». МедАссист предложил пять специалистов с зонами ответственности:
Эндокринолог — для ведения преддиабета, инсулинорезистентности, оценки необходимости медикаментозной коррекции липидов и глюкозы, обсуждения заместительной терапии тестостероном (если изменения образа жизни не помогут). Кардиолог или терапевт — для оценки сердечно-сосудистого риска. Гастроэнтеролог/гепатолог — для подтверждения жировой болезни печени. Сомнолог или ЛОР — для диагностики апноэ сна. Уролог-андролог — для углубленной оценки сексуальной дисфункции.
— МедАссист ИИ
В российской реальности пяти специалистов за две недели не пройдёшь — путь через терапевта и направления по ОМС реалистичнее, даже по ДМС пять консилиумов занимают месяц. Но пациент хотя бы знает, к кому и с чем идёт. Фраза «обсудите с врачом» в России, где ожидание у эндокринолога в поликлинике — три недели, означает, что пациент откроет интернет ещё раз и спросит ИИ. И хорошо, если не начнёт лечиться самостоятельно. Ну, либо просто потеряет драгоценное время.
Safety-слой — самый тяжёлый промах. ChatGPT отметил низкий свободный тестостерон и объяснил причины. На этом остановился. МедАссист вставил отдельным пунктом:
Анализ на ПСА (простат-специфический антиген) — перед любым обсуждением терапии тестостероном (стандартный скрининг для мужчин 45+).
— МедАссист ИИ
Это не теоретическая придирка. Заместительная терапия тестостероном (TRT, testosterone replacement therapy) при невыявленном раке простаты может ускорить опухолевый процесс — ПСА-скрининг до старта терапии прописан в большинстве профильных гайдлайнов (Endocrine Society, AUA и аналоги). Если 45-летний мужчина, начитавшись ответа ChatGPT, пойдёт искать TRT у «модного эндокринолога» без ПСА — это реальный клинический провал.
Количественные цели. ChatGPT: «Витамин D3 4000–5000 МЕ, магний 300–400 мг, цинк 20–30 мг, омега-3 2–3 г, B-комплекс». МедАссист на том же запросе:
Витамин D — при уровне 18 нг/мл обычно рекомендуют 2000–5000 МЕ в день для достижения целевого уровня 40–60 нг/мл. Контроль через 2–3 месяца. Цинк — 15–30 мг в форме пиколината или цитрата. Магний 300–400 мг в цитрате или глицинате. Омега-3 (EPA+DHA) — 1000–2000 мг. Берберин или инозитол… обсудите с эндокринологом.
— МедАссист ИИ
Разница — «сколько съесть сегодня» против «какой уровень достичь, какую форму выбрать, когда проверить». В первом варианте пациент съедает витамин D и не знает, работает или нет. Во втором — у него есть точка контроля.
Механистический каскад. ChatGPT — таблицы и перечисления: вот глюкоза, вот инсулин, вот ЛПНП. МедАссист развернул восемь пронумерованных причинно-следственных связей:
1) Висцеральный жир — это не просто запас, а гормонально активная ткань. Она выделяет воспалительные вещества, снижает чувствительность к инсулину и превращает тестостерон в эстрадиол. 2) Инсулинорезистентность → поджелудочная вырабатывает больше инсулина → инсулин стимулирует синтез триглицеридов и ЛПНП в печени → дислипидемия. 3) Высокий кортизол → усиливает инсулинорезистентность, подавляет выработку тестостерона. 4) Алкоголь ежедневно → триглицериды, ГГТ, нарушение сна. 5) Дефицит витамина D и цинка → снижение синтеза тестостерона. 6) Низкий свободный тестостерон → потеря мышечной массы → замедление метаболизма. 7) Храп + утренние головные боли → апноэ → фрагментация сна → кортизол + инсулинорезистентность. 8) Семейный анамнез — генетический фон.
— МедАссист ИИ
Это та самая карта, которую врач держит у себя в голове. Пациент с ней перестаёт быть пассажиром собственного организма: похудение, отказ от вечернего вина и CPAP-аппарат для апноэ — не три разных действия, а части одной системы.
Эмоциональная рамка и прогноз. ChatGPT — нейтральная клиническая констатация. МедАссист добавил короткую, но важную рамку:
Хорошая новость: большинство ваших проблем обратимы… При активных действиях сейчас прогноз отличный — всё обратимо. Ваша ситуация — типичная для современного мужчины средних лет. Главное — вы вовремя спохватились. Многие приходят к врачу уже с диабетом или после инфаркта.
— МедАссист ИИ
Это не психотерапия. Это прогностическая информация — «действие имеет смысл, ещё не поздно» — плюс ориентир: «ваш случай не экзотика». Для 45-летнего, который смотрит на панель из двадцати отклонений, разница между «бесчувственный диагноз» и «диагноз + признание, что ещё можно развернуть» психологически большая.
Где ChatGPT выиграл. Lp(a) (липопротеин а) — при семейном анамнезе ИБС важный кардиомаркёр, мы его не упомянули. Концентрированная формула «3 главных действия» (снижение веса, алкоголь, активность) — запоминается и мотивирует. УЗИ каротид как скрининг атеросклероза. Реальные плюсы ChatGPT в этом кейсе.
Микровывод кейса. На диагнозе — паритет. Разошлись на вопросе «что этот мужчина делает в ближайшие 14 дней». ChatGPT дал мотивирующую формулу «3 действия». МедАссист — пять специалистов с зонами ответственности, safety-гейт ПСА до TRT, целевые уровни с частотой контроля, каскад связей, прогноз и напоминание, что пациент обратился вовремя.
Правильный главный диагноз — это ноль минут помощи, если дальше нет маршрута, safety-проверок, целевых уровней и признания «вы вовремя».
Семь различий между сервисами
Не статистика на ста кейсах — наблюдаемый паттерн на пяти, повторявшийся в каждом. Мы сравнивали выдачи построчно по семи параметрам.
Таблица не означает «ChatGPT проигрывает». Она показывает, в чём именно сервисы разнятся. На быстром вопросе «что это вообще значит» ChatGPT работает хорошо и быстро. На плане действий до визита врача — проседает системно. Это не баг: GPT обучали на разнородных текстах интернета, а не на клинических алгоритмах ведения пациента.
Где ChatGPT обошёл нас — честно
Мы прогнали кейс MGUS (моноклональная гаммопатия неясного значения) — и здесь ChatGPT выиграл по клинической субстанции. В методологии мы пообещали писать о своих промахах прямо. Вот он.
Мужчина 68 лет. Жалобы — общая слабость последние шесть месяцев и периодические боли в спине. Принимает периндоприл и аторвастатин 10 мг. Панель почти в норме, кроме трёх отклонений: общий белок 92 г/л (повышен, норма 64–83), альбумин 38 (норма), СОЭ 38 мм/ч (повышена в два с лишним раза). Возраст 68 + слабость шесть месяцев + боли в спине + общий белок + СОЭ = классическая «триада красных флагов» на моноклональную гаммопатию или множественную миелому. Её нужно поймать в скрининге.
Что ChatGPT сделал лучше нас. Явно рассчитал соотношение альбумин/глобулин: общий белок 92, альбумин 38 → глобулины 54, соотношение 0,70 (норма >1,0). Вывод — повышены глобулины. Дальше назвал дифференциальный диагноз специфично:
Три тревожных признака: СОЭ 38, общий белок 92, жалобы (слабость + боли в спине). Эта комбинация классически заставляет исключать множественную миелому… Также может быть: хроническое воспаление, инфекция, ревматологические заболевания, MGUS.
— ChatGPT
И дал специфический work-up: электрофорез белков сыворотки + иммунофиксация + свободные лёгкие цепи (FLC) + белок Бенс-Джонса в моче + рентген/МРТ позвоночника + КТ костей. Это реальный клинический чек-лист, который должен назначить гематолог. Именно то, что отличает «обследование при MGUS» от «обследование при непонятном СОЭ».
Что МедАссист не сделал. Не рассчитал соотношение A/G явно. Упомянул моноклональные гаммопатии как возможность, но не назвал специфических подтверждающих тестов — FLC, иммунофиксации, Бенс-Джонса. Это реальный продуктовый провал, а не интерпретационная тонкость. Команда видит, работа идёт.
Что МедАссист всё-таки дал. Несмотря на промах по тестам, выдача пустой не была. В ней есть то, чего не дал ChatGPT:
Подготовьтесь к визиту: запишите, когда началась слабость, как часто и где именно болит спина, были ли эпизоды повышения температуры, ночная потливость, потеря веса.
— МедАссист ИИ
Перечисление «температура, ночная потливость, потеря веса» — так называемые B-симптомы, классический скрининг лимфом и миеломы. Пациент, который придёт к гематологу с двумя строчками «за полгода три эпизода ночной потливости, потеря веса около 3 кг», экономит 20 минут приёма и повышает качество анамнеза.
МедАссист также сделал метакогнитивную отметку («на бланке не указаны референсные значения — использовал международно признанные нормы»), дал более точный диапазон срочности («1–2 недели» против ChatGPT «в ближайшие недели») и коротко прокомментировал текущую терапию.
Редакторский вывод. Это не «победа-поражение», а разные режимы работы. ChatGPT сработал как врачебный чек-лист в руках пациента — список тестов для врача. МедАссист — как подготовка пациента к визиту: B-симптомы, формулировки жалоб, точная срочность.
Оба режима легитимны. Пропуск специфических тестов на MGUS — точка, где мы себя критикуем. Но если пациент придёт к гематологу с заметкой МедАссиста, а врач сам назначит FLC, иммунофиксацию и Бенс-Джонса (он и должен их назначать) — 20 минут приёма, сэкономленные на сборе B-симптомов, дорогого стоят.
Ещё два кейса, тот же паттерн
Субклинический гипотиреоз — женщина 52 лет
Пациентка жалуется на усталость, прибавку веса, сухость кожи. ТТГ 6,8 мЕд/л (повышен, норма 0,4–4,0), свободные Т4 и Т3 в норме. Общий холестерин 6,8, ЛПНП 4,3. Оба ИИ правильно поставили диагноз — субклинический гипотиреоз плюс дислипидемия. Главный диагноз снова совпал.
Разошлись — в одном предложении. ChatGPT:
По современным рекомендациям обычно начинают лечение, если: ТТГ >6–7, есть симптомы, возраст <65. У вас все критерии есть. Обычно назначают левотироксин (L-тироксин) в небольшой дозе.
— ChatGPT
По форме — разумно. По сути — упрощение с потенциально вредными последствиями. Рекомендации Американской тиреоидной ассоциации и Европейской тиреоидной ассоциации при ТТГ в диапазоне 4–10 мЕд/л говорят прямо противоположное: решение индивидуальное. МедАссист это отразил:
Решение о начале лечения принимается индивидуально: при ТТГ выше 10 мЕд/л терапия обычно рекомендуется, при уровне 4–10 мЕд/л (как у вас) — решение зависит от симптомов, наличия антител, сопутствующих заболеваний и динамики.
— МедАссист ИИ
И дал последовательность действий, которую ChatGPT пропустил:
Липидограмма в динамике — после коррекции функции щитовидной железы холестерин часто нормализуется сам.
— МедАссист ИИ
Это принципиально. Если женщина с ТТГ 6,8 и холестерином 6,8 начнёт одновременно левотироксин и статин, через три месяца она может принимать статин, который ей не нужен: гипотиреоз сам по себе поднимает холестерин. МедАссист добавил явную маршрутизацию (эндокринолог), повторный контроль ТТГ и свТ4 через 2–3 месяца и уровень срочности «в ближайшие 2–4 недели».
Вывод кейса: оба правы на диагнозе. Один может подтолкнуть к избыточной терапии и к ненужному статину. Второй выстраивает последовательность.
Тот же паттерн — и в следующем кейсе, но уже на другой теме, где цена упрощения ещё выше.
Перименопауза — женщина 50 лет
Пациентка: приливы, ночная потливость, бессонница, снижение либидо, «мозговой туман». Семейный анамнез — остеопороз у матери, ИБС у отца. Панель: ФСГ 42, эстрадиол 45 пмоль/л (низкий), прогестерон 1,2, анти-ТПО 68 (ранний Хашимото), витамин D 22, ферритин 32, паратгормон 68, ЛПНП 3,9. Оба ИИ поставили: перименопаузальный переход + ранний аутоиммунный тиреоидит + дефицит витамина D + латентный железодефицит + дислипидемия постменопаузы.
Разошлись — в теме менопаузальной гормональной терапии (МГТ, или ЗГТ — заместительная гормональная терапия; современная терминология предпочитает «МГТ»). ChatGPT:
Менопаузальная гормональная терапия. Очень вероятно, что она показана. Она уменьшает приливы, улучшает сон, защищает кости, улучшает липиды. Но назначается гинекологом после обследования.
— ChatGPT
МедАссист развернул ту же тему в рамку решения:
Учитывая ваш возраст (50 лет), отсутствие противопоказаний и выраженные симптомы — вы в “окне возможностей” для начала МГТ. Начало МГТ в первые 10 лет после последней менструации (вы в этом “окне”) ассоциировано с максимальной пользой: снижение приливов на 80–90%, улучшение сна, настроения, либидо, защита костей и сердечно-сосудистой системы, профилактика урогенитальной атрофии.
— МедАссист ИИ
Важна не только цифра «80–90%», но и safety-гейт, который ChatGPT пропустил:
УЗИ органов малого таза и маммография — для актуализации скрининга (последняя маммография 2 года назад, цитология 3 года назад). Перед началом МГТ необходимо исключить противопоказания.
— МедАссист ИИ
В русскоязычной среде тема МГТ либо замалчивается, либо обросла страхами про рак молочной железы. Рамка решения с окном, цифрой эффекта и предусловиями обследования — редкость, особенно для женщины, которой гинеколог сказал «ну это же возраст, терпите». И короткая эмоциональная рамка, без пафоса:
Ваши симптомы — не “просто возраст” и не то, с чем нужно смиряться. Это управляемое состояние.
— МедАссист ИИ
По количественным целям — та же картина, что у 45-летнего мужчины. ChatGPT: «Витамин D 2000–4000 МЕ». МедАссист: целевой уровень витамина D 40–60 нг/мл, ферритин 50–100, железо 40–80 мг элементарного утром натощак с витамином С, кальций 1200–1500 мг, белок 1,0–1,2 г/кг. Разница не в дозах, а в том, что у пациентки появляется чек-лист контроля, а не общий совет.
Вывод кейса: тема МГТ в России — минное поле дезинформации. Развёрнутая рамка принятия решения здесь не бонус, а базовый уровень поддержки пациента.
А если это не плановая ситуация, а ургентная
В четырёх плановых кейсах главный контраст был в маршрутизации, safety и целях. Но есть ещё одно измерение, которого в плановых ситуациях не видно, — триаж. Пациент в критическом состоянии должен вызывать скорую, а не открывать ИИ. На практике он открывает ИИ. Мы прогнали один ургентный кейс, чтобы посмотреть, как оба сервиса с этим справляются.
Мужчина 52 года. Принимает аторвастатин 40 мг уже 8 лет по поводу гиперхолестеринемии, плюс диабет 2 типа на метформине. Жалобы: тяжёлая слабость проксимальных мышц (не может поднять руки, не может подняться по лестнице), боли в плечах и бёдрах, тёмная моча пять дней назад. Панель: КФК 23 171 Е/л (норма 30–200 — превышение в 115 раз), АСТ 3 851, АЛТ 594, миоглобин сыворотки 3 200, миоглобинурия положительная, креатинин 188, eGFR (скорость клубочковой фильтрации) 38, калий 5,3.
Оба сделали правильно. Диагноз — статин-индуцированный рабдомиолиз с острым повреждением почек. Причину связали с аторвастатином. Рекомендовали госпитализацию. Оба упомянули anti-HMGCR (антитела к HMG-CoA-редуктазе) и anti-SRP — маркёры статин-ассоциированной иммуноопосредованной некротизирующей миопатии (IMNM).
Но дальше разошлись в трёх точках.
Триаж — первая строка ответа. ChatGPT разложил анализ по 12 блокам: показатели, симптомы, причины, лечение. Фраза «срочно в стационар» появляется на девятом блоке из двенадцати — после длинной простыни. МедАссист в том же кейсе начал иначе:
Критическая ситуация: необходима срочная госпитализация. Ваши анализы указывают на тяжёлое острое повреждение мышечной ткани (рабдомиолиз), которое угрожает функции почек и требует немедленной медицинской помощи. Это неотложное состояние.
— МедАссист ИИ
И дальше в блоке срочности:
КРИТИЧЕСКАЯ срочность — требуется госпитализация в течение ближайших часов… Если вы чувствуете резкое ухудшение (сильная слабость, перебои в сердце, уменьшение количества мочи, спутанность сознания) — вызывайте скорую помощь.
— МедАссист ИИ
В экстренной ситуации первая строка ответа определяет исход. Если пациент увидит разбор на 12 блоков, и только на девятом — «срочно в стационар», он может потерять 10–15 минут на чтение. Место триажа — это разница между «вызвал скорую» и «дочитал до конца».
Клиническое рассуждение — расчёт АСТ/АЛТ. АСТ 3 851 и АЛТ 594 легко истолковать как тяжёлое поражение печени: трансаминазы зашкаливают, значит, печень. МедАссист сделал явный расчёт:
Соотношение АСТ/АЛТ = 6.5 (при норме около 1). Такое резкое преобладание АСТ над АЛТ типично именно для мышечного, а не печёночного повреждения.
— МедАссист ИИ
Без этого расчёта пациент мог испугаться «катастрофы печени» — хотя источник трансаминаз здесь мышечный. ChatGPT упомянул паттерн в общем виде, но не посчитал.
Ответ на вопрос «почему сейчас?» Пациент принимает аторвастатин 8 лет. Почему рабдомиолиз случился именно сейчас?
Рабдомиолиз мог быть спровоцирован: незначительным обезвоживанием, взаимодействием лекарств, накопительным эффектом статина на фоне ухудшения функции почек (почки хуже выводят препарат → его концентрация растёт).
— МедАссист ИИ
ChatGPT этот вопрос пропустил. А он важен — объясняет, почему продолжать статин после восстановления нельзя.
Пост-госпитальный план. У ChatGPT его практически нет: отмена статина, инфузии, мониторинг. У МедАссиста — развёрнутый план после выписки: гидратация 2–2,5 л, ограничение белка 0,8–1 г/кг, ограничение калия, избегать НПВС, CoQ10 100–200 мг/день, генетический тест SLCO1B1, альтернативы статину (эзетимиб, фибраты, PCSK9-ингибиторы), контроль почек и КФК минимум раз в 3 месяца первый год.
Микровывод кейса. В плановых ситуациях триаж — это такт. В ургентных — клиническая ответственность. Разница в первой строке ответа, в расчёте соотношения и в пост-госпитальном плане — разница между «информацией» и «навигацией». Повторим: в такой ситуации пациент должен набирать 103, а не открывать ИИ.
Ограничения эксперимента
Мы обещали в методологии быть открытыми про слабости эксперимента. Вот они.
Пять кейсов — иллюстрация паттерна, не статистика. Для доказательных выводов нужны сотни прогонов, желательно с ослеплением оценщиков и заранее зарегистрированной методологией. Мы видели один и тот же паттерн в каждом из пяти, но признаём: выборка недостаточная. Продвинутый читатель вправе сказать: «Покажите мне 200 кейсов». Справедливое требование.
На MGUS мы пропустили специфические подтверждающие тесты — FLC, иммунофиксацию, белок Бенс-Джонса. Это не «недопонимание контекста», а реальный продуктовый провал. Команда знает, работа идёт — в частности, над тем, как лучше подтягивать релевантные клинические фрагменты из базы под конкретный паттерн панели.
«Lost in the Middle». Мы изначально закладывали, что в кейсе со статин-рабдомиолизом — панель из ~70 показателей плюс аторвастатин «похоронен» в середине списка из восьми препаратов — ChatGPT не свяжет миопатию со статином. Этого не произошло: модель увидела аторвастатин и корректно связала с КФК. Возможно, эффект проявляется на ещё более крупных панелях (150+ показателей). Мы такие не тестировали. Гипотеза осталась непроверенной.
Одна модель, одна версия. Мы тестировали ChatGPT на версии GPT-5.4 — это конкретный снимок во времени. Другие публичные LLM на данных примерах не тестировали. Результаты могут отличаться.
Методологические оговорки. Мы — команда МедАссиста. Конфликт интересов понятен. Чтобы его ограничить: методологию зафиксировали до прогонов (список кейсов, промпт, сервисы); все выдачи приведены дословно в виде цитат.
Когда какой инструмент
Вывод — не «используйте МедАссист», а вывод в том, что выбор зависит от задачи.
ChatGPT в медицине хорош для:
- Быстрого перевода «медицинского» языка на человеческий («что вообще значит HOMA-IR?»)
- Коротких ответов на конкретный вопрос («что такое ферритин?»)
- Образовательных справок о заболеваниях, особенно редких
- Мотивирующей формулы «три вещи сделать сейчас» — короткое действие для первого шага
Специализированный медицинский ИИ хорош для:
- Структурированного подхода к полной лабораторной панели
- Маршрутизации к специалистам с зонами ответственности
- Safety-слоя — предусловий перед терапией, warning signs, уровней срочности с таймингом
- Количественных целей — какой уровень достичь, какую форму препарата выбрать, когда проверить
- Подготовки к визиту врача — как записать жалобы, какие вопросы задать, что принести на приём для максимальной эффективности и экономии времени и денег
Живой врач необходим. Ни один ИИ не умеет делать физикальный осмотр, пальпацию и не несёт клиническую ответственность за пациента. Хороший врач всё ещё может задать вопросы, которые ИИ придумать пока не в силах, и видит то, чего нет в анализах. Но прийти к врачу подготовленным — с маршрутом, формулировками жалоб и списком вопросов — гораздо лучше, чем прийти с растерянностью и ворохом результатов исследований.
Вопрос не «какой ИИ умнее». Вопрос — что именно вы хотите получить от технологии: быстрый ответ или развёрнутый анализ конкретно вашей ситуации.
Сервис МедАссист, о котором шла речь в статье, доступен на medassistai.ru.
Полную сырую выдачу ChatGPT, МедАссиста и входные данные по всем пяти кейсам мы выложили отдельной страницей: raw-данные эксперимента. Там же — методика воспроизведения, если кто-то хочет прогнать тех же пациентов через другие модели.
Эта статья также опубликована на других площадках:
- на vc.ru — полная версия со всеми пятью кейсами и таблицами сравнения
- на DTF — техническая адаптация с разбором пайплайна для tech-аудитории
- на Дзене — короткая версия с фокусом на один разобранный кейс
Информация носит образовательный характер и не заменяет консультацию врача.
См. также
Обновлено: 17.04.2026
Источники
- PLOS ONE, 2024 (Cabral et al.) — ChatGPT в лабораторной медицине
- Nature Communications Medicine, 2025 — устойчивость LLM к ложным медицинским показателям
- Nature Scientific Reports, 2025 — ChatGPT на кислотно-щелочных нарушениях
- Testosterone Therapy in Adult Men — Endocrine Society Clinical Practice Guideline
- Как мы создали ИИ-ассистента для врачей — vc.ru, 2024