Специалисты Сбера нашли способ безопасно получать медицинские данные для обучения моделей искусственного интеллекта (AI)
Специалисты Сбера нашли способ безопасно получать медицинские данные для обучения моделей искусственного интеллекта (AI). Команда учёных Сбера и эксперты из MIL Team представили программную платформу MedSyn, которая позволяет создавать синтетические медицинские данные. Это значительно ускоряет разработку и тестирование медицинских приложений. MedSyn решает проблему нехватки данных для обучения моделей машинного обучения (ML) в здравоохранении. Об этом стало известно на третьем дне международной конференции AI Journey, посвящённой науке. Реальные медицинские карты пациентов содержат конфиденциальную информацию, которую нельзя использовать для обучения AI-моделей. Чтобы решить эту проблему, данные необходимо анонимизировать, что требует времени и ресурсов. Создание синтетических наборов медицинских данных — это оптимальное решение для развития AI-моделей в сфере здравоохранения. MedSyn объединяет большие языковые модели и медицинские графы знаний. Он позволяет генерировать большие объёмы медицинских записей, похожих на реальные. Эти данные помогают предсказывать коды заболеваний международной классификации болезней (МКБ). Использование медицинских графов знаний позволило повысить точность и разнообразие сгенерированных текстов. По оценкам учёных, в некоторых случаях точность предсказания сложных заболеваний из МКБ увеличивается почти на 20% по сравнению с системами, которые не используют синтетические данные. С помощью разработанного фреймворка учёные создали набор синтетических клинических записей. В него вошло более 41 тысячи примеров по более чем 200 заболеваниям. Этот датасет можно использовать как для научных исследований, так и для разработки продуктов в области здравоохранения. Глеб Гусев, директор Лаборатории искусственного интеллекта Сбербанка, отметил: «Результатом совместной работы двух команд стала разработка платформы MedSyn и создание крупнейшего набора синтетических медицинских записей на русском языке. Сегодня эти инструменты доступны в открытом доступе и могут использоваться для обучения и тестирования алгоритмов машинного обучения». Эксперименты в области медицины показали, что AI-модели, обученные на синтетических текстах, иногда могут придумывать несуществующие болезни или выдавать противоречивые симптомы. Для решения этой проблемы учёные использовали медицинские графы знаний, чтобы задавать априорную информацию в рамках конкретного случая или эпикриза. «Мы надеемся, что наши результаты будут полезны учёным, которые занимаются исследованиями в медицине, а также компаниям, разрабатывающим AI-приложения в сфере здравоохранения», — добавил Глеб Гусев. Источник: www.sberbank.ru
Пост взят с международного финтех-медиа ресурса
ДЛЯ ЛЮДЕЙ