Исследователи Университета Цинхуа создают виртуальную больницу для обучения врачей с помощью искусственного интеллекта без участия человека
Исследователи Университета Цинхуа из Научно-исследовательского института интеллектуальной промышленности (AIR) и факультета компьютерных наук и технологий https://www.cs.tsinghua.edu.cn/csen/ создали виртуальную больницу-агент для обучения ИИ-врачей без участия человека. Сначала они создали симуляцию целой больницы с персоналом и пациентами. Затем на врачей с искусственным интеллектом была возложена ответственность за диагностику и лечение тысяч виртуальных пациентов без вмешательства человека. Врачи быстро учились на своих ошибках, и их навыки в обследовании, диагностике и лечении значительно возросли.
Виртуальные симуляции, или симулякры, воспроизводят реальную обстановку для безопасного и быстрого обучения ИИ. Компьютеру не нужно ждать, пока появится больной, а можно запрограммировать сотни, тысячи и даже миллионы больных пациентов, чтобы они появлялись по желанию. Стоимость таких симуляций также намного ниже, чем реальное обучение.
Исследователи из Цинхуа смогли быстро обучить виртуальных ИИ-врачей 10 000 виртуальных пациентов в симуляции Agent Hospital, используя свой процесс, названный методом MedAgent-Zero. Они были созданы путем подачи в крупноязычные модели информации о восьми типах заболеваний для создания электронных медицинских карт для 10 000 виртуальных пациентов, каждый из которых имел разную степень тяжести и проявления. Этими восемью заболеваниями были острый назофарингит, острый ринит, бронхиальная астма, хронический бронхит, COVID-19, грипп А, грипп В и микоплазменная инфекция. Для тестирования был создан отдельный набор из 500 историй болезни.
Во время симуляции виртуальный врач, работающий на gpt-3.5-turbo-1106, быстро развил свои навыки. После осмотра 10 000 виртуальных пациентов доктор добился успеха в обследовании, диагностике и лечении пациентов на 88%, 95,6% и 77,6% в зависимости от заболевания.
GPT быстро совершенствуется, поэтому исследователи из Цинхуа также протестировали свой метод обучения MedAgent-Zero, используя более мощный gpt-4-1106-preview. Они сравнили производительность ИИ-врачей gpt-3 и gpt-4, используя 1 273 вопроса из базы данных MedQAбольшой набор вопросов с несколькими вариантами ответов, которые похожи на вопросы для получения медицинской лицензии, встречающиеся в таких тестах, как USMLE. Результаты виртуальных врачей в вопросах о респираторных заболеваниях составили 93,06% gpt-4 против 84,72% gpt-3.
Новаторские результаты этих ИИ-врачей были достигнуты всего за несколько дней виртуального обучения, и симулятор Agent Hospital открывает дорогу к разработке методов обучения будущих ИИ-врачей, а также реальных врачей, которые будут значительно быстрее и эффективнее.
Читатели, которые не знают, какие профессии останутся в будущем, основанном на использовании ИИ, могут просто сказать своим гуманоидным роботам 1X приготовить ужин и убраться в доме. Те, кто хочет создать ИИ, должны оснастить свои ПК быстрым графическим процессором Nvidia(как этот на Amazon) или купить один из самых быстрых ноутбуков на планете(как этот на Amazon), чтобы начать обучение ИИ для выполнения многих работ.
Источник(и)
Машинный перевод выполнен браузером Edge:
AIR создает виртуальную больницу, чтобы реализовать саморазвитие ИИ-врачей
Время выхода: 2024-05-24
Исследовательский институт интеллектуальной индустрии Университета Цинхуа (AIR) и факультет компьютерных наук и технологий Университета Цинхуа совместно создали виртуальную больницу Agent HospitalMedAgent-Zero, метод самоэволюции для медицинских агентов, который позволяет медицинским агентам постоянно совершенствовать свои медицинские способности путем генерирования большого количества данных без ручного аннотирования в виртуальных больницах, и проверен на реальных наборах данных. Все пациенты, медсестры и врачи в Agent Hospital играют роль автономных агентов, управляемых большими моделями, которые моделируют замкнутый процесс "до-больница-в-больнице-после-больницы", состоящий из поступления, сортировки, регистрации, консультации, осмотра, диагностики, приема лекарств, реабилитации и последующего наблюдения. Основываясь на базе знаний и базовой модели, Agent Hospital моделирует процесс возникновения и развития болезни у виртуальных пациентов. Виртуальные врачи учатся (т.е. читают медицинскую литературу) и практикуются (т.е. взаимодействуют с виртуальными пациентами и принимают решения о диагностике и лечении) в Agent Hospital, постоянно обобщают опыт успешных случаев диагностики и лечения, осмысливают уроки неудачных случаев и постоянно повышают точность выполнения многочисленных задач по диагностике и лечению. После лечения почти 10 000 виртуальных пациентов (у человеческих врачей на это уходит около 2 лет) виртуальные врачи смогли превзойти лучшие на сегодняшний день методы на подмножестве респираторных заболеваний из набора данных MedQA, достигнув точности 93,06%. Исследование, соавторами которого выступили доцент Ма Вэйчжи из AIR и профессор Ян Лю, исполнительный декан AIR и заместитель декана факультета компьютерных наук, после публикации на сайте arXiv привлекло широкое внимание и обсуждение со стороны сообщества специалистов по искусственному интеллекту и медицинского сообщества в стране и за рубежом.
- Название работы: Agent Hospital: Симулякр больницы с эволюционирующими медицинскими агентами
- Ссылка на статью: arxiv.org/pdf/2405.02957v1
В последние годы активно развиваются крупномасштабные языковые модели, и технология агентов, основанная на больших языковых моделях, привлекает большое внимание. В предыдущих исследованиях агентная технология использовалась для моделирования реального мира, включая взаимодействие и игровые сценарии, такие как "Город Стэнфорд" и "Игра в убийство оборотня". В то же время, технология агентов также используется в процессе планирования расписания и совместной работы над различными задачами, но этот процесс в основном зависит от поддержки высококачественных ручных аннотированных данных. Поэтому исследовательский вопрос заключается в том, может ли моделирование реального мира помочь улучшить способность агентов к обработке задач.
Умное здравоохранение привлекает широкое внимание благодаря своей важности и прикладной ценности, и исследовательская группа уделяет большое внимание применению больших языковых моделей и технологии агентов в медицинских сценариях. Отвечая на вышеупомянутые исследовательские вопросы, команда считает, что реальная модельная среда может помочь агентам улучшить и развить их способности к решению задач, поэтому она провела исследование Agent Hospital, которое сочетает моделирование реального мира и улучшение медицинских способностей. В этой работе команда стремится создать среду моделирования больницы и изучить автономную эволюцию медицинских агентов в этой среде. Цель состоит в том, чтобы позволить агентам самостоятельно накапливать медицинские знания в процессе диагностики, лечения и обучения, подобно человеческим врачам, и реализовать непрерывную эволюцию медицинских способностей.
Сначала исследовательская группа сосредоточилась на использовании крупномасштабных моделей агентов для моделирования реальных критических медицинских процессов. В Agent Hospital команда разработала и охватила 8 типичных сценариев от возникновения болезни до выздоровления, а именно: начало заболевания, сортировка, регистрация, консультация, осмотр, диагностика, назначение и выздоровление, а пациенты будут активно участвовать в последующей обратной связи. Все процессы поддерживаются большими моделями, в которых роли могут взаимодействовать автономно.
Примеры основных сеансов диагностики и лечения
Приведенная выше схема иллюстрирует подход с замкнутым циклом: когда Кеннет Морган, агент пациента, заболевает, он обращается за помощью в больницу. Медсестра Кэтрин Ли (Katherine Li) разбирается в симптомах Моргана, анализирует их и направляет его в определенное отделение. После того как Морган пройдет регистрацию, консультацию и медицинское обследование в соответствии с указаниями врача, доктор Роберт поставит ему окончательный диагноз и даст план лечения, и Морган отправится домой, чтобы отдохнуть в соответствии с указаниями врача и дать обратную связь с больницей для выздоровления, до следующего раза, когда он заболеет, а затем отправится в больницу.
Как видно из приведенного выше примера, исследовательская группа разработала два основных типа ролей для больницы: медицинский персонал и пациенты. Вся информация о персонажах генерируется с помощью большой модели (GPT-3.5), поэтому ее можно легко масштабировать и добавлять. Конкретная информация о некоторых персонажах показана на рисунке ниже: 35-летний пациент Кеннет Морган в настоящее время страдает острым ринитом, гипертонией и рядом симптомов, таких как постоянная рвота; Чжао Лей - опытный рентгенолог, а терапевт Элиз Мартин обладает прекрасными коммуникативными навыками и специализируется на диагностике и лечении острых и хронических медицинских заболеваний. Эти полные информационные фоны персонажей повышают реалистичность симуляции больницы.
Знакомство с информацией о виртуальном персонаже
В вышеупомянутом процессе медицинской симуляции ключевым моментом является генерация болезни. В частности, информация из текущей медицинской карты генерируется с помощью большой языковой модели в сочетании с медицинскими знаниями, чтобы создать полную медицинскую карту пациента, включая тип заболевания, симптомы, продолжительность и различные результаты обследований (подробнее см. в приложении к статье). Следует отметить, что для обеспечения максимальной точности всего процесса моделирования агент-пациент будет воспринимать только симптомы своего заболевания, но не конкретную болезнь, в то время как агент-врач сможет понять информацию, только поговорив с агентом-пациентом и назначив анализы. Обследование, которое должен провести агент-пациент, тип заболевания и степень тяжести болезни будут использоваться в качестве трех ключевых задач для оценки способности медицинского агента диагностировать и лечить виртуальных пациентов.
Большинство традиционных методов обучения медицинских моделей опираются на предварительное обучение, тонкую настройку и другие технологии, поэтому они нуждаются в большом количестве медицинских данных и высококачественных данных, аннотированных вручную. Однако исследовательская группа считает, что процесс совершенствования способностей врачей-людей не зависит от таких массивных данных, и они часто могут накапливать опыт из клинической практики в процессе диагностики и лечения, а также совершенствоваться, читая медицинскую литературу, чтобы накопить ключевые знания. Медицинские агенты в виртуальных больницах должны быть способны к подобному развитию способностей.
Поэтому команда разработала алгоритм саморазвития агента под названием "MedAgent-Zero", который, как и AlphaGo-Zero, не полагается на данные ручного аннотирования, а использует обучение (т.е. чтение медицинской литературы) и практику (т.е. взаимодействие с виртуальными пациентами и принятие решений о диагностике и лечении) в виртуальной больнице для достижения улучшения возможностей. Самостоятельно накапливать опыт для решения трех задач - диагностики заболеваний и рекомендаций по лечению; С другой стороны, медицинские агенты также будут учиться автономно, имитируя процесс изучения медицинских документов на основе медицинских вопросов, генерируемых LLM.
Блок-схема политики MedAgent-Zero
Как показано на рисунке выше, эволюция MedAgent-Zero включает в себя два подхода: 1) Обобщение опыта успешных случаев; для диагностики и лечения проблем, на которые можно дать правильный ответ, интеллектуальный организм будет накапливать опыт базы данных случаев, как человеческий врач; 2) Обдумывание уроков, извлеченных из неудач; при ответе на ошибочные вопросы агент будет брать на себя инициативу по обдумыванию ошибок и размышлять над ними. Если уроки, полученные в результате размышлений, помогут агенту ответить на вопрос, они будут сохранены и занесены в базу данных опыта.
В конечном итоге, исследовательская группа будет накапливать и развивать два вышеупомянутых аспекта в процессе обучения на виртуальных данных. В процессе каждого умозаключения агент извлекает наиболее схожий контент из двух баз данных и добавляет его в подсказку для внутриконтекстного обучения, а также накапливает медицинские записи или обобщает опыт в соответствии с правильными и неправильными ответами, чтобы постоянно совершенствовать способности агента.
В виртуальной больнице исследовательская группа создала медицинские карты десятков тысяч виртуальных пациентов для экспериментов по автономной эволюции медицинских агентов, включая 8 заболеваний, связанных с дыхательной системой, таких как грипп А, грипп В и новая корона, и включающих более 10 различных медицинских обследований. Исходя из расчета, что человеческие врачи лечат около 100 пациентов в неделю, на диагностику 10 000 пациентов у них может уйти два года, а у интеллектуальных врачей на это уйдет всего несколько дней.
Команда в основном оценивала возможности медицинских агентов в виртуальных больницах с двух сторон. Первый - оценка компетентности врача в виртуальной среде: как показано на рисунке ниже, в процессе обучения медицинского агента (слева), с увеличением количества диагностированных и вылеченных пациентов, точность медицинского агента при выполнении трех ключевых задач продолжает расти и постепенно стабилизируется. В ходе эксперимента с 500 тестовыми медицинскими записями было обнаружено (справа), что точность агента слегка колеблется по мере увеличения количества пациентов, но в целом демонстрирует тенденцию к росту.
Точность выполнения заданий медицинским агентом на обучающем (слева) и тестовом (справа) множестве.
Впоследствии исследовательская группа сравнила точность диагностики медицинскими агентами различных заболеваний до и после их эволюции и обнаружила, что все они значительно улучшились, что подтверждает эффективность их автономной эволюции.
Диагностические проявления различных заболеваний до и после эволюции агентов
С другой стороны, команда использовала подмножество респираторных заболеваний из внешнего набора данных MedQA, чтобы оценить способности медицинского агента в реальной медицине. Удивительно, но даже без использования каких-либо искусственно аннотированных данных в процессе эволюции агента, после лечения почти 10 000 пациентов, медицинский агент смог превзойти лучший метод на этом наборе данных и достичь наивысшего показателя точности 93,06%, что подтверждает эффективность автономной эволюции медицинских агентов в симулированной среде.
Точность различных методов на подмножестве MedQA
Кроме того, исследовательская группа провела экспериментальную проверку абляции, и результаты показали, что как примеры, накопленные на основе успехов, так и уроки, извлеченные из неудач, могут помочь улучшить медицинские возможности модели.
Результаты анализа абляции MedAgent-Zero
Подводя итог, можно сказать, что в этой исследовательской работе был создан первый сценарий виртуальной больницы Agent Hospital и предложен MedAgent-Zero, алгоритм эволюции медицинского агента, который не зависит от аннотации искусственных данных. Результаты экспериментов с виртуальными и реальными данными предварительно подтверждают эффективность среды моделирования для улучшения возможностей медицинского агента и предлагают новые решения для применения искусственного интеллекта, особенно больших языковых моделей, и технологии агентов в интеллектуальных медицинских сценариях. Однако в этой исследовательской работе все еще есть некоторые ограничения, и в будущем команда продолжит совершенствовать и оптимизировать типы заболеваний, тщательность моделирующей среды, а также выбор и оптимизацию модельной базы.
О соответствующем авторе
Ма Вэйчжи, ассистент исследователя в Институте интеллектуальной промышленности (AIR) Университета Цинхуа, был выбран в качестве "Проекта по подъему молодых талантов" Китайской ассоциации науки и техники. В сферу его научных интересов входят интеллектуальное получение информации и интеллектуальное медицинское обслуживание. Личная домашняя страница: mawz12.github.io.
Лю Ян (Liu Yang) - профессор GDS, исполнительный декан Института интеллектуальной промышленности (AIR), заместитель декана факультета компьютерных наук Университета Цинхуа, лауреат Национального фонда для выдающихся молодых ученых. В сферу его научных интересов входят искусственный интеллект, обработка естественного языка и "умная" медицина. Личная домашняя страница: nlp.csai.tsinghua.edu.cn/~ly.