![Аватар сообщества ЯНДЕКС [новости]](/uploads/community/2/dca78d58-9d3f-48a0-8d3a-7bf714273ff3.jpg)
ЯНДЕКС [новости]
НОВОСТИ АКЦИЙ РОССИИ
Внедрение нейросетей в небольших компаниях

Новый метод сжатия LLM: доступно для всех. Лаборатория Yandex Research совместно с ведущими университетами разработала метод сжатия больших языковых моделей (LLM) без потери качества. Теперь для работы с ними достаточно смартфона или ноутбука. Метод ускоряет тестирование и внедрение нейросетевых решений, делая LLM доступными для малых компаний, некоммерческих организаций и индивидуальных разработчиков. Раньше квантизация моделей занимала недели, теперь — минуты. Проблема больших моделей, таких как DeepSeek-R1 (671 млрд параметров), заключалась в необходимости мощного оборудования. Новый метод позволяет сжимать их до запуска на доступных устройствах. Это открывает возможности для использования LLM в ограниченных ресурсах сферах, таких как образование и соцсфера. Стартапы могут создавать инновационные продукты без дорогого оборудования. Яндекс использует метод для прототипирования, ускоряя тестирование сжатых моделей. Источник: www.cnews.ru