![Аватар сообщества СБЕРБАНК [новости]](/uploads/community/1/1712224893_d234bcdf95d8b53e5cabc35f80fce0c3.jpg)
СБЕРБАНК [новости]
НОВОСТИ АКЦИЙ
AI-редактор MALVINA и модель Kandinsky 4.1 Image: новые возможности для нейрохудожников

Сбер представил новые нейросетевые модели, значительно расширяющие возможности создания и редактирования изображений. Одной из ключевых новинок стала модель Kandinsky 4.1 Image, которая позволяет генерировать более качественные и детализированные изображения по текстовым описаниям. Эта модель основана на обновленной архитектуре диффузионного трансформера (DiT), что обеспечивает улучшение качества и скорости работы. Kandinsky 4.1 прошла дополнительное обучение на тщательно отобранных изображениях, сбалансированных по различным категориям, таким как люди, техника, природа и другие. В этом процессе участвовали более 100 специалистов — фотографы, художники и дизайнеры, обладающие профессиональным художественным образованием и глубоким пониманием эстетики. В результате этого дообучения качество генерируемых изображений значительно повысилось, особенно в области текстур, сложных объектов и стилистических запросов. Модель отлично понимает сложные инструкции, включая пространственные запросы, и способна создавать изображения в стилях известных художников, таких как Айвазовский, Босх, Кандинский, а также в стилях импрессионизма, поп-арта и даже в стиле студии Ghibli. Особенно хорошо Kandinsky 4.1 работает с русским культурным кодом, умеет изображать матрёшки, богатырей, самовары, героев народных сказок и блюда национальной кухни, а также стили русской народной росписи, такие как гжель и хохлома. Для нейрохудожников и креативных специалистов также появился AI-редактор MALVINA (Multimodal Artificial Language VIsion Neural Assistant), интегрированный с GigaChat. Он позволяет редактировать изображения по текстовым командам, сохраняя при этом геометрию исходных объектов. Можно легко убрать лишние элементы, изменить фон, цвет волос, добавить или убрать объекты, исправить дефекты и даже реставрировать старые фотографии. В отличие от других моделей, MALVINA старается сохранять важные детали и текстуры, что делает редактирование максимально точным и аккуратным. Обучение нейросети проходило на массиве из более чем 10 миллионов примеров, а для дообучения использовали свыше 1,5 миллиона изображений, включая как реальные фотографии, так и синтетические данные. Андрей Белевцев, старший вице-президент Сбербанка, заявил, что новый редактор изображений в GigaChat — удобный и интеллектуальный помощник. Он работает с высокой точностью, позволяя менять фон, объекты и стиль фото с помощью текстовых команд. Это сокращает время на редактирование и делает творчество доступным для всех. Интеграция с GigaChat превращает языковую модель в универсальный инструмент. Источник: www.sberbank.ru
АДМИНИСТРАТОР
[mondiara.com](https://mondiara.com) - больше, чем социальная сеть. [mondiara.com](https://mondiara.com) - твой лучший друг в мире инвестиций.