Еще в 1959 году Ледли и Люстед предложили оценивать медицинские диагностические системы по их способности решать сложные клинические случаи — эталону, который остается актуальным и сегодня. Но теперь искусственный интеллект не просто соответствует этому стандарту — он его превосходит.
Наше исследование демонстрирует ошеломляющий результат: большая языковая модель (LLM)
значительно превзошла сотни врачей в диагностике и клиническом мышлении. В пяти строгих экспериментах ИИ показал:
- Более точные дифференциальные диагнозы, чем ведущие специалисты
- Глубокую логику диагностического мышления, превосходящую человеческую
- Оптимальную сортировку пациентов в условиях неотложной помощи
- Превосходное вероятностное прогнозирование
- Более эффективные тактические решения по лечению
При этом все оценки проводили врачи-эксперты с использованием проверенных психометрических методик.
Но самое убедительное доказательство —
реальные случаи. В отделении неотложной помощи крупнейшей бостонской клиники ИИ давал
вторые мнения случайным пациентам, и на всех ключевых этапах:
- Первичный триаж
- Врачебный осмотр
- Решение о госпитализации
результаты были однозначны — искусственный интеллект
ставил более точные диагнозы и предлагал более оптимальную тактику, чем сертифицированные врачи.
Это не просто прогресс — это
прорыв. Современные LLM не просто улучшили предыдущие системы поддержки решений — они
преодолели человеческий уровень в медицинской диагностике, реализовав прогноз Ледли и Люстеда. Теперь необходимо срочно переходить к
клиническим испытаниям этой технологии — она способна спасать жизни.
Тематика:Искусственный интеллект (cs.AI), обработка естественного языка (cs.CL)
Источник:https://doi.org/10.48550/arXiv.2412.10849