Как с вами связаться

Введите сообщение

Как с вами связаться

Введите сообщение

Аватар сообщества СБЕРБАНК [новости]

СБЕРБАНК [новости]

НОВОСТИ АКЦИЙ РФ

Специалисты достигли значительных успехов в области идентификации эмоциональных оттенков в голосе с использованием искусственного интеллекта

12
Специалисты достигли значительных успехов в области идентификации эмоциональных оттенков в голосе с использованием искусственного интеллекта

Учёные сделали прорыв в распознавании эмоциональной окраски голоса с помощью AI. Группа исследователей из лаборатории искусственного интеллекта Сбербанка, Института AIRI и МФТИ разработала новую модель искусственного интеллекта, названную CA-SER (Cross-Attention Feature Fusion for Speech Emotion Recognition), которая предназначена для определения эмоций в речи человека. Эта модель достигла впечатляющей точности 74,6% на сложном датасете IEMOCAP, что превосходит результаты большинства существующих технологий. Научная работа о модельной архитектуре была опубликована в сборнике ECAI 2024, одной из ведущих конференций в области искусственного интеллекта в Европе. CA-SER объединяет подходы самообучения с предобученной моделью wav2vec 2.0 и акустическими характеристиками, такими как мел-кепстральные коэффициенты (MFCC), с применением механизма перекрёстного внимания. Модель позволяет эффективно объединять высокоуровневые и низкоуровневые представления, начиная с анализа ключевых характеристик речи, а затем добавляя детали о звучании, включая громкость и интонацию. Это ведёт к более точному распознаванию эмоций говорящего. CA-SER решает проблему несовпадения чистых аудиоданных, на которых проводилось обучение, с эмоционально окрашенными датасетами, что делает её полезной для систем автоматического взаимодействия, таких как голосовые чат-боты и кол-центры, а также в приложениях мониторинга психического здоровья. Исходный код модели доступен в открытом доступе, что позволяет другим исследователям использовать её для дополнительных экспериментов. Например, модель может быть адаптирована для работы с русскоязычными эмоциональными корпусами, чтобы применять её в голосовых помощниках и контактных центрах. Источник: www.sberbank.ru

Войти

Войдите, чтобы оставлять комментарии

Другие новости сообщества / НОВОСТИ АКЦИЙ РФ

Вы уверены, что хотите выйти из аккаунта?