ALIBABA [новости]
НОВОСТИ АКЦИЙ КНР
Alibaba запускает математические модели искусственного интеллекта, которые, как утверждается, превосходят LLM-модели от OpenAI и Google
Alibaba запускает математические модели искусственного интеллекта, которые, как утверждается, превосходят LLM-модели от OpenAI и Google. Alibaba Group Holding стремится поднять планку в разработке искусственного интеллекта (ИИ), запустив группу специализированных математических моделей большого языка (LLM) под названием Qwen2-Math, которые, по утверждению гиганта электронной коммерции, могут превзойти возможности OpenAI GPT-4o в этой области. «За последний год мы приложили значительные усилия для исследования и улучшения возможностей рассуждений больших языковых моделей, уделяя особое внимание их способности решать арифметические и математические задачи», — заявила команда Qwen, часть подразделения облачных вычислений Alibaba , в сообщении, опубликованном на платформе разработчиков GitHub в четверг. Alibaba владеет South China Morning Post. Новейшие LLM — технология, лежащая в основе генеративных ИИ- сервисов, таких как ChatGPT , — были созданы на основе Qwen2 LLM, выпущенных Alibaba в июне, и охватывают три модели на основе шкалы параметров — термина в машинном обучении для обозначения переменных, присутствующих в системе ИИ во время обучения, что помогает установить, как запросы данных приводят к желаемому результату. У вас есть вопросы о самых важных темах и тенденциях со всего мира? Получите ответы с помощью SCMP Knowledge , нашей новой платформы курируемого контента с пояснениями, часто задаваемыми вопросами, анализами и инфографикой, предоставленными вам нашей отмеченной наградами командой. Модель с наибольшим количеством параметров, Qwen2-Math-72B-Instruct, превзошла фирменные американские LLM-модели в математических бенчмарках, согласно сообщению команды Qwen. К ним относятся GPT-4o, Claude 3.5 Sonnet от Anthropic , Gemini 1.5 Pro от Google и Llama -3.1-405B от Meta Platforms. Согласно сообщению, модели Qwen2-Math AI были протестированы на математических тестах как на английском, так и на китайском языках. Они включали GSM8K, набор данных из 8500 высококачественных лингвистически разнообразных математических задач для начальной школы; OlympiadBench, двуязычный мультимодальный научный тест высокого уровня; и gaokao , сложный вступительный экзамен в университет материкового Китая. Команда Qwen заявила, что новые модели все еще имеют некоторые ограничения из-за их «поддержки только на английском языке». По словам команды, план состоит в том, чтобы вскоре выпустить двуязычные модели, а многоязычные LLM также находятся в разработке. Математические модели Alibaba еще больше совершенствуют Ханчжоу-компания, основанная на искусственном интеллекте, недавно получила степень магистра права Qwen-72B-Instructвозглавил рейтинг 10 лучших моделей с открытым исходным кодом в мире. Tongyi Qianwen открыт для сторонних разработчиков уже больше года. Открытый исходный код предоставляет публичный доступ к исходному коду программы, позволяя сторонним разработчикам программного обеспечения изменять или делиться ее дизайном, исправлять неработающие ссылки или масштабировать ее возможности. В июле Qwen2-72B-Instruct оказался сразу за GPT-4o и Claude 3.5 Sonnet.в рейтинге LLM от SuperClue, платформа сравнительного анализа, которая оценивает модели на основе таких показателей, как вычисления, логическое мышление, кодирование и понимание текста, среди прочих. По данным SuperClue, разрыв между китайскими и американскими моделями искусственного интеллекта сокращается. По данным компании, в первой половине этого года материковая часть Китая добилась значительного прогресса в продвижении отечественных программ магистратуры по праву. В отдельном тесте, опубликованном в июле LMSYS — организацией по исследованию моделей искусственного интеллекта, поддерживаемой Калифорнийским университетом в Беркли, — Qwen2-72B заняла 20-е место, в то время как фирменные модели OpenAI, Anthropic и Google заняли большую часть позиций в первой десятке. Источник: www.scmp.com