![Аватар сообщества СБЕРБАНК [новости]](/uploads/community/1/1712224893_d234bcdf95d8b53e5cabc35f80fce0c3.jpg)
СБЕРБАНК [новости]
НОВОСТИ АКЦИЙ
Сбер сделал свои технологии искусственного интеллекта доступными для всех

Сбер сделал свои технологии искусственного интеллекта доступными для всех. Теперь любой желающий может использовать код и веса моделей, разработанные специалистами Сбера. Сегодня научная команда Сбера активно публикует в открытом доступе различные модели искусственного интеллекта, чтобы развивать русскоязычное AI-сообщество. В открытом доступе появились базовая и инструктивная версии самой быстрой модели GigaChat Lite и самая сильная модель на русском языке GigaEmbeddings-instruct. Также большое обновление получило семейство моделей машинного обучения для распознавания речи и эмоций GigaAM. Об этом рассказал технический директор GigaChat Фёдор Минькин на международной конференции AI Journey. В новой версии акустических моделей GigaAM улучшены подготовка данных и технология предобучения базовой модели. Благодаря этому удалось значительно снизить количество ошибок в словах при распознавании русскоязычных запросов. Для самой сильной модели семейства GigaAM этот показатель улучшен на 25% относительно предыдущей версии и на 56% превосходит OpenAI-Whisper-large-v3. Кроме того, за счёт перехода на другое позиционное кодирование, обновлённая линейка моделей GigaAM поддерживает дообучение и инференс с Flash Attention, что даёт существенное ускорение на современных видеокартах. Для повышения доступности использования моделей команда упростила код, снизила число зависимостей и подготовила конвертацию в формат ONNX. Новые модели публикуются с лицензией MIT, что допускает их коммерческое использование. Разработчикам и бизнесу также стали доступны в открытом доступе базовая и инструктивная версии GigaChat Lite. Эта модель очень сильная в своём классе, она отлично справляется с решением типовых задач, где важна скорость. Архитектура Lite 20B MoE (Mixture-of-Experts) с 3.3B активных параметров, при этом качество её работы соответствует уровню более мощных моделей. Ещё одна модель, которую выложили в открытый доступ — GigaEmbeddings-instruct — преобразует текст в его числовое представление (вектор), кодируя всю информацию, содержащуюся в запросе. Она подходит для решения задач с применением технологии RAG (Retrieval Augmented Generation). GigaEmbeddings-instruct является лучшей в своём классе по данным бенчмарка ruMTEB. Вся линейка больших языковых моделей, в том числе самая мощная GigaChat MAX, уже доступны бизнесу через облачный API. Теперь самую быструю модель из семейства — GigaChat Lite — можно использовать в своих проектах в открытом доступе, а также присоединиться к исследованию по её интерпретируемости. Также российское AI-сообщество сможет экспериментировать с GigaEmbeddings-instruct и GigaAM, которые не требуют больших вычислительных мощностей. Источник: www.sberbank.ru