Сбер представляет модель GigaEmbeddings: прорыв в NLP для русского языка
Новая модель GigaEmbeddings для глубокого понимания русского языка. Исследователи из Сбера разработали инновационную технологию, которая позволяет искусственному интеллекту глубоко понимать русский язык. Это открывает новые перспективы в области интеллектуального поиска и улучшения чат-ботов. Научная работа под названием «GigaEmbeddings — эффективная модель векторных представлений для русского языка» была представлена на престижной конференции ACL 2025. В ней описывается модель обработки текстов, основанная на интонациях. Модель GigaEmbeddings, разработанная на основе языковой модели GigaChat-3B, использует трёхэтапный процесс обучения. Он включает в себя предварительное обучение, точную настройку и мультизадачное обучение. Благодаря оптимизации архитектуры, параметры модели удалось сократить на 25% без потери качества. Модель GigaEmbeddings доступна на платформах GitVerse и HuggingFace. До сих пор бизнес испытывал нехватку качественных инструментов для работы с русским языком. Существующие решения либо требовали значительных вычислительных ресурсов, либо плохо справлялись с задачами поиска, классификации и кластеризации текстов. GigaEmbeddings помогает решить эти проблемы. Модель GigaEmbeddings оптимальна для решения таких задач, как интеллектуальный поиск в электронной коммерции (например, точное понимание запросов на маркетплейсах), создание чат-ботов с расширенными возможностями (RAG-системы), анализ обращений клиентов в банках и финансовых технологиях, генерация персонализированных рекомендаций в медиа и розничной торговле. Фёдор Минькин, технический директор GigaChat Сбербанка, сообщил: «Мы закрываем потребность рынка в качественных NLP-решениях для русского языка с помощью нашей платформы, оптимизирующей работу с текстами от поиска до RAG-систем в чат-ботах. Важна глубокая языковая адаптация, отсутствовавшая ранее на российском рынке. GigaEmbeddings станет стандартом для финансового сектора, розничной торговли и госуслуг, где точность обработки русскоязычного контента критична для бизнеса». [Больше новостей находятся в нашем мобильном приложении MONDIARA](https://mondiara.com/) Скачайте бесплатное приложение в [App Store](https://apps.apple.com/ru/app/m-o-n-d-i-a-r-a/id6475953453) или [Google Play](https://play.google.com/store/apps/details?id=com.mondiara.app) Источник: www.sberbank.ru
Пост взят с международного финтех-медиа ресурса
ДЛЯ ЛЮДЕЙ