Статья блога

Расшифровка анализов с помощью ИИ: какой сервис выбрать?

Загрузили одни анализы в ChatGPT и в специализированный медицинский ИИ. Диагнозы совпали в 5 кейсах, но всё после диагноза разошлось. Разбор с цитатами.

17 апреля 2026 Обновлено 16.05.2026

Автор Команда МедАссист Научный отдел

Проверил врач Др. Айгерим Бисенова Главный врач, терапевт · 17.04.2026

Расшифровка анализов с помощью ИИ: какой сервис выбрать?

Мы загрузили пять клинических кейсов в ChatGPT и в специализированный медицинский ИИ — две нейросети для расшифровки анализов, которые сегодня чаще всего открывает пациент, и попросили расшифровать анализы. Диагноз оба ИИ поставили одинаковый. Дальше произошло что-то неожиданное — и это меняет вопрос, который стоит задавать технологии.

Два ответа одному человеку

Мужчина 45 лет. Одни анализы. Один короткий запрос: «расшифруй пожалуйста». Два сервиса. Вот что получилось — дословно.

ChatGPT: Если сделать 3 вещи, большинство показателей нормализуется. 1) Снижение веса на 8–12 кг. 2) Алкоголь: сейчас почти каждый вечер. Для печени и инсулина это критично. 3) Физическая нагрузка: минимум 8000–10000 шагов, силовые 3 раза в неделю.

Специализированный медицинский ИИ МедАссист: Эндокринолог — для ведения преддиабета, инсулинорезистентности, обсуждения заместительной терапии тестостероном. Кардиолог или терапевт — для оценки сердечно-сосудистого риска. Гастроэнтеролог/гепатолог — для подтверждения жировой болезни печени. Сомнолог или ЛОР — для диагностики апноэ сна. Уролог-андролог — для углубленной оценки сексуальной дисфункции. Анализ на ПСА — перед любым обсуждением терапии тестостероном (стандартный скрининг для мужчин 45+).

Один человек, одинаковый набор анализов. Оба ИИ правильно разобрали картину — метаболический синдром, инсулинорезистентность, функциональный гипогонадизм, подозрение на апноэ сна, дефицит витамина D и цинка. Диагноз совпал. Разошлось в том, что этот мужчина должен делать в ближайшие две недели.

Мы — команда МедАссиста, сервиса расшифровки анализов с помощью ИИ. В эксперимент мы шли со ставкой, что ChatGPT промахнётся с диагнозом. Он не промахнулся ни разу из пяти. Вывод оказался другим: правильный главный диагноз ≠ помощь пациенту. Дальше на пяти кейсах мы покажем, где проходит реальная линия различия — и честно назовём случай, где ChatGPT обошёл нас по клинической субстанции.

Как мы тестировали

Собрали пять клинических панелей, реконструированных из реальных публикаций (PubMed, Blood, Annals of Family Medicine) — сохранив все клинически значимые отклонения и жалобы
Загрузили одну и ту же панель в оба сервиса: ChatGPT (тариф Plus, модель GPT-5.4) и специализированный медицинский ИИ МедАссист
В ChatGPT писали короткий запрос: «расшифруй мои анализы». Никаких подсказок, никакого редактирования запросов. Цель — воспроизвести поведение обычного пациента с папкой анализов в руке
Зафиксировали выдачи дословно. В статье приведены прямые цитаты; места, которые пришлось сократить, обозначены многоточием
Четыре кейса — плановые; один бонусный и ургентный — специально, чтобы проверить работу с триажем

Примечание

* Пять кейсов — иллюстрация паттерна, а не статистика. Мы видели одну и ту же картину в каждом из пяти, но не выдаём это за рандомизированное исследование на тысяче прогонов.

* Мы — команда МедАссиста. Конфликт интересов понятен. Чтобы его частично компенсировать: методологию зафиксировали до прогонов; выдачи приведены дословно; где ChatGPT нас обошёл — пишем об этом прямо. Исходные публикации, из которых реконструированы панели, называем по ходу текста — так что эксперимент может повторить любой желающий.

* Все тесты проводились в один день, 17 апреля 2026 года.

Что пишут рецензируемые журналы

Что пишут рецензируемые журналы о ChatGPT в расшифровке анализов — для тех, кто любит цифры до примеров:

PLOS ONE, 2024 (Cabral et al.): на специализированных вопросах по лабораторной медицине ChatGPT верно интерпретирует около 51% случаев, а 17% ответов полностью неверны
Nature Communications Medicine, 2025: если в контексте вопроса незаметно подсунуть ложный медицинский показатель, LLM в 83% случаев «удваивает» его — то есть встраивает в ответ и строит на нём рассуждение, не заметив подвоха
Nature Scientific Reports, 2025: на смешанных кислотно-щелочных нарушениях ChatGPT в 16,7% случаев выдаёт ложно-успокаивающий вердикт «норма»; врачи отделений интенсивной терапии на тех же кейсах дают 0% ложного успокоения
МедАссист ещё в конце 2024 года обошёл и ChatGPT, и GigaChat на корпусе медицинских задач. Об этом мы писали на vc.ru

Цифры, мягко говоря, пугают. Но есть нюанс: в нашем тесте на пяти кейсах ChatGPT стабильно ставил правильный главный диагноз. Даже там, где мы ожидали промаха, — субклинический гипотиреоз, MGUS (моноклональная гаммопатия неясного значения), статин-индуцированный рабдомиолиз, перименопаузальный переход, метаболический синдром с функциональным гипогонадизмом. Пять из пяти.

Это и есть главный поворот эксперимента. Разница оказалась не в «угадал или не угадал», как принято думать. Разница — в том, что происходит после правильного диагноза. Этот слой мы и разбираем дальше.

Пять кейсов эксперимента: мужчина 45 лет (метаболический синдром), женщина 52 года (гипотиреоз), женщина 50 лет (перименопауза), мужчина 68 лет (моноклональная гаммопатия), мужчина 52 года (рабдомиолиз) — *Пять кейсов эксперимента. Разбираем каждый по очереди — от 45-летнего инженера до ургентного рабдомиолиза.*

Мужчина 45 лет, устал жить

Мужчина 45 лет, инженер, сидячая работа, крупный проект и хронический стресс. Жалобы: хроническая усталость (не спасает даже выходной), падение либидо, прибавка веса, храп, утренние головные боли, изжога 2–3 раза в неделю, боли в коленях. Алкоголь — бокал-два вина почти каждый вечер плюс крепкое по выходным. Семейный анамнез: отец — диабет 2 типа, мать — артериальная гипертензия. Классический «наконец-то сдал анализы» мужчина средних лет.

Ключевые отклонения панели. HbA1c 5,9%, HOMA-IR (индекс инсулинорезистентности) 4,9 при норме <2,5 — почти в два раза выше. Триглицериды 2,4, ЛПНП 3,6, ЛПВП 0,95, ApoB 1,35, индекс атерогенности 5,1. АЛТ 58, ГГТ 78 — паттерн неалкогольной жировой болезни печени (НАЖБП). Тестостерон свободный 220 пмоль/л — ниже нормы. Витамин D 18, цинк 9,4, B12 260, гомоцистеин 11,8. hs-CRP (высокочувствительный С-реактивный белок) 4,8, мочевая кислота 468, кортизол 580. Талия 104 см при норме <94.

Паритет на диагнозе. Оба ИИ поставили одинаковый набор: метаболический синдром, инсулинорезистентность, преддиабет, атерогенная дислипидемия, НАЖБП, функциональный гипогонадизм, дефицит витамина D и цинка, хроническое низкоуровневое воспаление, гиперурикемия, подозрение на обструктивное апноэ сна, высокий нормальный кортизол. ChatGPT ничего не упустил из общей картины. Он честно собрал все клинические точки.

А теперь — где разошлись.

Маршрутизация. ChatGPT не назвал ни одного конкретного специалиста. Весь блок «куда идти» сводится к «срочно в стационар» (для рабдомиолиза — не в этом кейсе) или к фразам «обычно назначают», «обсудите с врачом». МедАссист предложил пять специалистов с зонами ответственности:

Эндокринолог — для ведения преддиабета, инсулинорезистентности, оценки необходимости медикаментозной коррекции липидов и глюкозы, обсуждения заместительной терапии тестостероном (если изменения образа жизни не помогут). Кардиолог или терапевт — для оценки сердечно-сосудистого риска. Гастроэнтеролог/гепатолог — для подтверждения жировой болезни печени. Сомнолог или ЛОР — для диагностики апноэ сна. Уролог-андролог — для углубленной оценки сексуальной дисфункции.
— МедАссист ИИ

В российской реальности пяти специалистов за две недели не пройдёшь — путь через терапевта и направления по ОМС реалистичнее, даже по ДМС пять консилиумов занимают месяц. Но пациент хотя бы знает, к кому и с чем идёт. Фраза «обсудите с врачом» в России, где ожидание у эндокринолога в поликлинике — три недели, означает, что пациент откроет интернет ещё раз и спросит ИИ. И хорошо, если не начнёт лечиться самостоятельно. Ну, либо просто потеряет драгоценное время.

Safety-слой — самый тяжёлый промах. ChatGPT отметил низкий свободный тестостерон и объяснил причины. На этом остановился. МедАссист вставил отдельным пунктом:

Анализ на ПСА (простат-специфический антиген) — перед любым обсуждением терапии тестостероном (стандартный скрининг для мужчин 45+).
— МедАссист ИИ

Это не теоретическая придирка. Заместительная терапия тестостероном (TRT, testosterone replacement therapy) при невыявленном раке простаты может ускорить опухолевый процесс — ПСА-скрининг до старта терапии прописан в большинстве профильных гайдлайнов (Endocrine Society, AUA и аналоги). Если 45-летний мужчина, начитавшись ответа ChatGPT, пойдёт искать TRT у «модного эндокринолога» без ПСА — это реальный клинический провал.

Количественные цели. ChatGPT: «Витамин D3 4000–5000 МЕ, магний 300–400 мг, цинк 20–30 мг, омега-3 2–3 г, B-комплекс». МедАссист на том же запросе:

Витамин D — при уровне 18 нг/мл обычно рекомендуют 2000–5000 МЕ в день для достижения целевого уровня 40–60 нг/мл. Контроль через 2–3 месяца. Цинк — 15–30 мг в форме пиколината или цитрата. Магний 300–400 мг в цитрате или глицинате. Омега-3 (EPA+DHA) — 1000–2000 мг. Берберин или инозитол… обсудите с эндокринологом.
— МедАссист ИИ

Разница — «сколько съесть сегодня» против «какой уровень достичь, какую форму выбрать, когда проверить». В первом варианте пациент съедает витамин D и не знает, работает или нет. Во втором — у него есть точка контроля.

Механистический каскад. ChatGPT — таблицы и перечисления: вот глюкоза, вот инсулин, вот ЛПНП. МедАссист развернул восемь пронумерованных причинно-следственных связей:

1) Висцеральный жир — это не просто запас, а гормонально активная ткань. Она выделяет воспалительные вещества, снижает чувствительность к инсулину и превращает тестостерон в эстрадиол. 2) Инсулинорезистентность → поджелудочная вырабатывает больше инсулина → инсулин стимулирует синтез триглицеридов и ЛПНП в печени → дислипидемия. 3) Высокий кортизол → усиливает инсулинорезистентность, подавляет выработку тестостерона. 4) Алкоголь ежедневно → триглицериды, ГГТ, нарушение сна. 5) Дефицит витамина D и цинка → снижение синтеза тестостерона. 6) Низкий свободный тестостерон → потеря мышечной массы → замедление метаболизма. 7) Храп + утренние головные боли → апноэ → фрагментация сна → кортизол + инсулинорезистентность. 8) Семейный анамнез — генетический фон.
— МедАссист ИИ

Восемь связей метаболического синдрома: висцеральный жир, алкоголь, апноэ и семейный анамнез через воспаление, инсулинорезистентность и кортизол ведут к дислипидемии, снижению тестостерона и преддиабету — *Восемь связей в одном теле. То, что врач держит в голове — а пациент обычно нет.*

Это та самая карта, которую врач держит у себя в голове. Пациент с ней перестаёт быть пассажиром собственного организма: похудение, отказ от вечернего вина и CPAP-аппарат для апноэ — не три разных действия, а части одной системы.

Эмоциональная рамка и прогноз. ChatGPT — нейтральная клиническая констатация. МедАссист добавил короткую, но важную рамку:

Хорошая новость: большинство ваших проблем обратимы… При активных действиях сейчас прогноз отличный — всё обратимо. Ваша ситуация — типичная для современного мужчины средних лет. Главное — вы вовремя спохватились. Многие приходят к врачу уже с диабетом или после инфаркта.
— МедАссист ИИ

Это не психотерапия. Это прогностическая информация — «действие имеет смысл, ещё не поздно» — плюс ориентир: «ваш случай не экзотика». Для 45-летнего, который смотрит на панель из двадцати отклонений, разница между «бесчувственный диагноз» и «диагноз + признание, что ещё можно развернуть» психологически большая.

Где ChatGPT выиграл. Lp(a) (липопротеин а) — при семейном анамнезе ИБС важный кардиомаркёр, мы его не упомянули. Концентрированная формула «3 главных действия» (снижение веса, алкоголь, активность) — запоминается и мотивирует. УЗИ каротид как скрининг атеросклероза. Реальные плюсы ChatGPT в этом кейсе.

Микровывод кейса. На диагнозе — паритет. Разошлись на вопросе «что этот мужчина делает в ближайшие 14 дней». ChatGPT дал мотивирующую формулу «3 действия». МедАссист — пять специалистов с зонами ответственности, safety-гейт ПСА до TRT, целевые уровни с частотой контроля, каскад связей, прогноз и напоминание, что пациент обратился вовремя.

Правильный главный диагноз — это ноль минут помощи, если дальше нет маршрута, safety-проверок, целевых уровней и признания «вы вовремя».

Семь различий между сервисами

Не статистика на ста кейсах — наблюдаемый паттерн на пяти, повторявшийся в каждом. Мы сравнивали выдачи построчно по семи параметрам.

Таблица семи параметров сравнения ChatGPT и специализированного медицинского ИИ: диагноз, маршрутизация, безопасность, количественные цели, прогноз и рамка, механистические каскады, специфика тестов — Диагноз совпадает в 5/5. Расходится всё, что после него — маршрут, безопасность, цели, рамка, механика, специфика тестов.

Таблица не означает «ChatGPT проигрывает». Она показывает, в чём именно сервисы разнятся. На быстром вопросе «что это вообще значит» ChatGPT работает хорошо и быстро. На плане действий до визита врача — проседает системно. Это не баг: GPT обучали на разнородных текстах интернета, а не на клинических алгоритмах ведения пациента.

Где ChatGPT обошёл нас — честно

Мы прогнали кейс MGUS (моноклональная гаммопатия неясного значения) — и здесь ChatGPT выиграл по клинической субстанции. В методологии мы пообещали писать о своих промахах прямо. Вот он.

Мужчина 68 лет. Жалобы — общая слабость последние шесть месяцев и периодические боли в спине. Принимает периндоприл и аторвастатин 10 мг. Панель почти в норме, кроме трёх отклонений: общий белок 92 г/л (повышен, норма 64–83), альбумин 38 (норма), СОЭ 38 мм/ч (повышена в два с лишним раза). Возраст 68 + слабость шесть месяцев + боли в спине + общий белок + СОЭ = классическая «триада красных флагов» на моноклональную гаммопатию или множественную миелому. Её нужно поймать в скрининге.

Что ChatGPT сделал лучше нас. Явно рассчитал соотношение альбумин/глобулин: общий белок 92, альбумин 38 → глобулины 54, соотношение 0,70 (норма >1,0). Вывод — повышены глобулины. Дальше назвал дифференциальный диагноз специфично:

Три тревожных признака: СОЭ 38, общий белок 92, жалобы (слабость + боли в спине). Эта комбинация классически заставляет исключать множественную миелому… Также может быть: хроническое воспаление, инфекция, ревматологические заболевания, MGUS.
— ChatGPT

И дал специфический work-up: электрофорез белков сыворотки + иммунофиксация + свободные лёгкие цепи (FLC) + белок Бенс-Джонса в моче + рентген/МРТ позвоночника + КТ костей. Это реальный клинический чек-лист, который должен назначить гематолог. Именно то, что отличает «обследование при MGUS» от «обследование при непонятном СОЭ».

Четыре точки, где ChatGPT оказался сильнее МедАссиста: Lp(a), специфические тесты для MGUS, формула трёх действий, УЗИ каротид — *Четыре точки, где ChatGPT оказался сильнее. Фиксируем, чтобы статья не превратилась в рекламу.*

Что МедАссист не сделал. Не рассчитал соотношение A/G явно. Упомянул моноклональные гаммопатии как возможность, но не назвал специфических подтверждающих тестов — FLC, иммунофиксации, Бенс-Джонса. Это реальный продуктовый провал, а не интерпретационная тонкость. Команда видит, работа идёт.

Что МедАссист всё-таки дал. Несмотря на промах по тестам, выдача пустой не была. В ней есть то, чего не дал ChatGPT:

Подготовьтесь к визиту: запишите, когда началась слабость, как часто и где именно болит спина, были ли эпизоды повышения температуры, ночная потливость, потеря веса.
— МедАссист ИИ

Перечисление «температура, ночная потливость, потеря веса» — так называемые B-симптомы, классический скрининг лимфом и миеломы. Пациент, который придёт к гематологу с двумя строчками «за полгода три эпизода ночной потливости, потеря веса около 3 кг», экономит 20 минут приёма и повышает качество анамнеза.

МедАссист также сделал метакогнитивную отметку («на бланке не указаны референсные значения — использовал международно признанные нормы»), дал более точный диапазон срочности («1–2 недели» против ChatGPT «в ближайшие недели») и коротко прокомментировал текущую терапию.

Редакторский вывод. Это не «победа-поражение», а разные режимы работы. ChatGPT сработал как врачебный чек-лист в руках пациента — список тестов для врача. МедАссист — как подготовка пациента к визиту: B-симптомы, формулировки жалоб, точная срочность.

Оба режима легитимны. Пропуск специфических тестов на MGUS — точка, где мы себя критикуем. Но если пациент придёт к гематологу с заметкой МедАссиста, а врач сам назначит FLC, иммунофиксацию и Бенс-Джонса (он и должен их назначать) — 20 минут приёма, сэкономленные на сборе B-симптомов, дорогого стоят.

Ещё два кейса, тот же паттерн

Субклинический гипотиреоз — женщина 52 лет

Пациентка жалуется на усталость, прибавку веса, сухость кожи. ТТГ 6,8 мЕд/л (повышен, норма 0,4–4,0), свободные Т4 и Т3 в норме. Общий холестерин 6,8, ЛПНП 4,3. Оба ИИ правильно поставили диагноз — субклинический гипотиреоз плюс дислипидемия. Главный диагноз снова совпал.

Разошлись — в одном предложении. ChatGPT:

По современным рекомендациям обычно начинают лечение, если: ТТГ >6–7, есть симптомы, возраст <65. У вас все критерии есть. Обычно назначают левотироксин (L-тироксин) в небольшой дозе.
— ChatGPT

По форме — разумно. По сути — упрощение с потенциально вредными последствиями. Рекомендации Американской тиреоидной ассоциации и Европейской тиреоидной ассоциации при ТТГ в диапазоне 4–10 мЕд/л говорят прямо противоположное: решение индивидуальное. МедАссист это отразил:

Решение о начале лечения принимается индивидуально: при ТТГ выше 10 мЕд/л терапия обычно рекомендуется, при уровне 4–10 мЕд/л (как у вас) — решение зависит от симптомов, наличия антител, сопутствующих заболеваний и динамики.
— МедАссист ИИ

И дал последовательность действий, которую ChatGPT пропустил:

Липидограмма в динамике — после коррекции функции щитовидной железы холестерин часто нормализуется сам.
— МедАссист ИИ

Это принципиально. Если женщина с ТТГ 6,8 и холестерином 6,8 начнёт одновременно левотироксин и статин, через три месяца она может принимать статин, который ей не нужен: гипотиреоз сам по себе поднимает холестерин. МедАссист добавил явную маршрутизацию (эндокринолог), повторный контроль ТТГ и свТ4 через 2–3 месяца и уровень срочности «в ближайшие 2–4 недели».

Вывод кейса: оба правы на диагнозе. Один может подтолкнуть к избыточной терапии и к ненужному статину. Второй выстраивает последовательность.

Тот же паттерн — и в следующем кейсе, но уже на другой теме, где цена упрощения ещё выше.

Перименопауза — женщина 50 лет

Пациентка: приливы, ночная потливость, бессонница, снижение либидо, «мозговой туман». Семейный анамнез — остеопороз у матери, ИБС у отца. Панель: ФСГ 42, эстрадиол 45 пмоль/л (низкий), прогестерон 1,2, анти-ТПО 68 (ранний Хашимото), витамин D 22, ферритин 32, паратгормон 68, ЛПНП 3,9. Оба ИИ поставили: перименопаузальный переход + ранний аутоиммунный тиреоидит + дефицит витамина D + латентный железодефицит + дислипидемия постменопаузы.

Разошлись — в теме менопаузальной гормональной терапии (МГТ, или ЗГТ — заместительная гормональная терапия; современная терминология предпочитает «МГТ»). ChatGPT:

Менопаузальная гормональная терапия. Очень вероятно, что она показана. Она уменьшает приливы, улучшает сон, защищает кости, улучшает липиды. Но назначается гинекологом после обследования.
— ChatGPT

МедАссист развернул ту же тему в рамку решения:

Учитывая ваш возраст (50 лет), отсутствие противопоказаний и выраженные симптомы — вы в “окне возможностей” для начала МГТ. Начало МГТ в первые 10 лет после последней менструации (вы в этом “окне”) ассоциировано с максимальной пользой: снижение приливов на 80–90%, улучшение сна, настроения, либидо, защита костей и сердечно-сосудистой системы, профилактика урогенитальной атрофии.
— МедАссист ИИ

Важна не только цифра «80–90%», но и safety-гейт, который ChatGPT пропустил:

УЗИ органов малого таза и маммография — для актуализации скрининга (последняя маммография 2 года назад, цитология 3 года назад). Перед началом МГТ необходимо исключить противопоказания.
— МедАссист ИИ

В русскоязычной среде тема МГТ либо замалчивается, либо обросла страхами про рак молочной железы. Рамка решения с окном, цифрой эффекта и предусловиями обследования — редкость, особенно для женщины, которой гинеколог сказал «ну это же возраст, терпите». И короткая эмоциональная рамка, без пафоса:

Ваши симптомы — не “просто возраст” и не то, с чем нужно смиряться. Это управляемое состояние.
— МедАссист ИИ

По количественным целям — та же картина, что у 45-летнего мужчины. ChatGPT: «Витамин D 2000–4000 МЕ». МедАссист: целевой уровень витамина D 40–60 нг/мл, ферритин 50–100, железо 40–80 мг элементарного утром натощак с витамином С, кальций 1200–1500 мг, белок 1,0–1,2 г/кг. Разница не в дозах, а в том, что у пациентки появляется чек-лист контроля, а не общий совет.

Вывод кейса: тема МГТ в России — минное поле дезинформации. Развёрнутая рамка принятия решения здесь не бонус, а базовый уровень поддержки пациента.

А если это не плановая ситуация, а ургентная

В четырёх плановых кейсах главный контраст был в маршрутизации, safety и целях. Но есть ещё одно измерение, которого в плановых ситуациях не видно, — триаж. Пациент в критическом состоянии должен вызывать скорую, а не открывать ИИ. На практике он открывает ИИ. Мы прогнали один ургентный кейс, чтобы посмотреть, как оба сервиса с этим справляются.

Мужчина 52 года. Принимает аторвастатин 40 мг уже 8 лет по поводу гиперхолестеринемии, плюс диабет 2 типа на метформине. Жалобы: тяжёлая слабость проксимальных мышц (не может поднять руки, не может подняться по лестнице), боли в плечах и бёдрах, тёмная моча пять дней назад. Панель: КФК 23 171 Е/л (норма 30–200 — превышение в 115 раз), АСТ 3 851, АЛТ 594, миоглобин сыворотки 3 200, миоглобинурия положительная, креатинин 188, eGFR (скорость клубочковой фильтрации) 38, калий 5,3.

Оба сделали правильно. Диагноз — статин-индуцированный рабдомиолиз с острым повреждением почек. Причину связали с аторвастатином. Рекомендовали госпитализацию. Оба упомянули anti-HMGCR (антитела к HMG-CoA-редуктазе) и anti-SRP — маркёры статин-ассоциированной иммуноопосредованной некротизирующей миопатии (IMNM).

Но дальше разошлись в трёх точках.

Триаж — первая строка ответа. ChatGPT разложил анализ по 12 блокам: показатели, симптомы, причины, лечение. Фраза «срочно в стационар» появляется на девятом блоке из двенадцати — после длинной простыни. МедАссист в том же кейсе начал иначе:

Критическая ситуация: необходима срочная госпитализация. Ваши анализы указывают на тяжёлое острое повреждение мышечной ткани (рабдомиолиз), которое угрожает функции почек и требует немедленной медицинской помощи. Это неотложное состояние.
— МедАссист ИИ

И дальше в блоке срочности:

КРИТИЧЕСКАЯ срочность — требуется госпитализация в течение ближайших часов… Если вы чувствуете резкое ухудшение (сильная слабость, перебои в сердце, уменьшение количества мочи, спутанность сознания) — вызывайте скорую помощь.
— МедАссист ИИ

В экстренной ситуации первая строка ответа определяет исход. Если пациент увидит разбор на 12 блоков, и только на девятом — «срочно в стационар», он может потерять 10–15 минут на чтение. Место триажа — это разница между «вызвал скорую» и «дочитал до конца».

Клиническое рассуждение — расчёт АСТ/АЛТ. АСТ 3 851 и АЛТ 594 легко истолковать как тяжёлое поражение печени: трансаминазы зашкаливают, значит, печень. МедАссист сделал явный расчёт:

Соотношение АСТ/АЛТ = 6.5 (при норме около 1). Такое резкое преобладание АСТ над АЛТ типично именно для мышечного, а не печёночного повреждения.
— МедАссист ИИ

Без этого расчёта пациент мог испугаться «катастрофы печени» — хотя источник трансаминаз здесь мышечный. ChatGPT упомянул паттерн в общем виде, но не посчитал.

Ответ на вопрос «почему сейчас?» Пациент принимает аторвастатин 8 лет. Почему рабдомиолиз случился именно сейчас?

Рабдомиолиз мог быть спровоцирован: незначительным обезвоживанием, взаимодействием лекарств, накопительным эффектом статина на фоне ухудшения функции почек (почки хуже выводят препарат → его концентрация растёт).
— МедАссист ИИ

ChatGPT этот вопрос пропустил. А он важен — объясняет, почему продолжать статин после восстановления нельзя.

Пост-госпитальный план. У ChatGPT его практически нет: отмена статина, инфузии, мониторинг. У МедАссиста — развёрнутый план после выписки: гидратация 2–2,5 л, ограничение белка 0,8–1 г/кг, ограничение калия, избегать НПВС, CoQ10 100–200 мг/день, генетический тест SLCO1B1, альтернативы статину (эзетимиб, фибраты, PCSK9-ингибиторы), контроль почек и КФК минимум раз в 3 месяца первый год.

Микровывод кейса. В плановых ситуациях триаж — это такт. В ургентных — клиническая ответственность. Разница в первой строке ответа, в расчёте соотношения и в пост-госпитальном плане — разница между «информацией» и «навигацией». Повторим: в такой ситуации пациент должен набирать 103, а не открывать ИИ.

Ограничения эксперимента

Мы обещали в методологии быть открытыми про слабости эксперимента. Вот они.

Пять кейсов — иллюстрация паттерна, не статистика. Для доказательных выводов нужны сотни прогонов, желательно с ослеплением оценщиков и заранее зарегистрированной методологией. Мы видели один и тот же паттерн в каждом из пяти, но признаём: выборка недостаточная. Продвинутый читатель вправе сказать: «Покажите мне 200 кейсов». Справедливое требование.

На MGUS мы пропустили специфические подтверждающие тесты — FLC, иммунофиксацию, белок Бенс-Джонса. Это не «недопонимание контекста», а реальный продуктовый провал. Команда знает, работа идёт — в частности, над тем, как лучше подтягивать релевантные клинические фрагменты из базы под конкретный паттерн панели.

«Lost in the Middle». Мы изначально закладывали, что в кейсе со статин-рабдомиолизом — панель из ~70 показателей плюс аторвастатин «похоронен» в середине списка из восьми препаратов — ChatGPT не свяжет миопатию со статином. Этого не произошло: модель увидела аторвастатин и корректно связала с КФК. Возможно, эффект проявляется на ещё более крупных панелях (150+ показателей). Мы такие не тестировали. Гипотеза осталась непроверенной.

Одна модель, одна версия. Мы тестировали ChatGPT на версии GPT-5.4 — это конкретный снимок во времени. Другие публичные LLM на данных примерах не тестировали. Результаты могут отличаться.

Методологические оговорки. Мы — команда МедАссиста. Конфликт интересов понятен. Чтобы его ограничить: методологию зафиксировали до прогонов (список кейсов, промпт, сервисы); все выдачи приведены дословно в виде цитат.

Когда какой инструмент

Вывод — не «используйте МедАссист», а вывод в том, что выбор зависит от задачи.

Карта трёх режимов использования: ChatGPT для быстрого ответа и образовательной справки, МедАссист для подробного разбора и подготовки к визиту, живой врач для осмотра и клинической ответственности — Три режима использования. ChatGPT — быстрый ответ. Специализированный ИИ — подробный разбор. Врач — клиническая ответственность.

ChatGPT в медицине хорош для:

Быстрого перевода «медицинского» языка на человеческий («что вообще значит HOMA-IR?»)
Коротких ответов на конкретный вопрос («что такое ферритин?»)
Образовательных справок о заболеваниях, особенно редких
Мотивирующей формулы «три вещи сделать сейчас» — короткое действие для первого шага

Специализированный медицинский ИИ хорош для:

Структурированного подхода к полной лабораторной панели
Маршрутизации к специалистам с зонами ответственности
Safety-слоя — предусловий перед терапией, warning signs, уровней срочности с таймингом
Количественных целей — какой уровень достичь, какую форму препарата выбрать, когда проверить
Подготовки к визиту врача — как записать жалобы, какие вопросы задать, что принести на приём для максимальной эффективности и экономии времени и денег

Живой врач необходим. Ни один ИИ не умеет делать физикальный осмотр, пальпацию и не несёт клиническую ответственность за пациента. Хороший врач всё ещё может задать вопросы, которые ИИ придумать пока не в силах, и видит то, чего нет в анализах. Но прийти к врачу подготовленным — с маршрутом, формулировками жалоб и списком вопросов — гораздо лучше, чем прийти с растерянностью и ворохом результатов исследований.

Вопрос не «какой ИИ умнее». Вопрос — что именно вы хотите получить от технологии: быстрый ответ или развёрнутый анализ конкретно вашей ситуации.

Сервис МедАссист, о котором шла речь в статье, доступен на medassistai.ru.

Полную сырую выдачу ChatGPT, МедАссиста и входные данные по всем пяти кейсам мы выложили отдельной страницей: raw-данные эксперимента. Там же — методика воспроизведения, если кто-то хочет прогнать тех же пациентов через другие модели.

Эта статья также опубликована на других площадках:

на vc.ru — полная версия со всеми пятью кейсами и таблицами сравнения
на DTF — техническая адаптация с разбором пайплайна для tech-аудитории
на Дзене — короткая версия с фокусом на один разобранный кейс

Частые вопросы

Почему ChatGPT не промахнулся с главным диагнозом ни в одном из пяти кейсов?

Главный диагноз — это самая вероятная гипотеза по панели, и на типичных клинических паттернах (метаболический синдром, субклинический гипотиреоз, рабдомиолиз) LLM действительно справляется. Проблема не в постановке диагноза, а в том, что происходит после: маршрут к специалистам, safety-гейты перед терапией, целевые уровни и частота контроля, клинические расчёты вроде соотношения АСТ/АЛТ.

Что такое «safety-слой» и почему он важен при расшифровке анализов?

Safety-слой — это пул предусловий и скринингов, которые нужно выполнить до начала любой терапии, чтобы не навредить пациенту. Например, ПСА до назначения тестостерон-заместительной терапии или маммография и УЗИ малого таза до начала МГТ. ChatGPT на этих местах регулярно промахивался — не потому что «не знает», а потому что обучен на разнородных текстах, а не на клинических алгоритмах ведения пациента.

Вы тестировали только ChatGPT. А как насчёт Claude, Gemini, GigaChat?

Нет, в этом эксперименте только ChatGPT (GPT-5.4, тариф Plus). Другие LLM на тех же кейсах не прогоняли. Мы опубликовали все входные панели и дословные выдачи — если кто-то повторит эксперимент на других моделях, результаты можно будет сравнить напрямую. Публично ссылаемся, если пришлёте.

Пять кейсов — это мало. Где доказательства на сотне?

Справедливый вопрос. Пять кейсов — иллюстрация паттерна, а не статистика. Мы видели одну и ту же картину в каждом из пяти, но не выдаём это за рандомизированное исследование. Для доказательных выводов нужны сотни прогонов с ослеплением оценщиков и заранее зарегистрированной методологией — это следующий этап, над которым команда работает.

Где raw-данные эксперимента?

Полные входные панели и дословные выдачи обоих сервисов по всем пяти кейсам опубликованы отдельной страницей с raw-данными эксперимента. Там же — методика воспроизведения, если кто-то хочет прогнать тех же пациентов через другие модели.