Alibaba Cloud представила ИИ-модель Qwen2.5-Max, превосходящую DeepSeek

Китайская компания Alibaba Cloud анонсировала запуск новой языковой модели искусственного интеллекта Qwen2.5-Max, которая, по утверждению разработчиков, превосходит по производительности такие системы, как DeepSeek V3 и GPT-4o.

Модель Qwen2.5-Max основана на архитектуре Mixture-of-Experts (MoE) и обучена на более чем 20 триллионах токенов. Разработчики акцентируют внимание на значительном прогрессе в интеллектуальных возможностях модели, которая демонстрирует улучшенные результаты в анализе текста, переводе и генерации контента. В ходе тестирования на ключевых бенчмарках, таких как MMLU-Pro и LiveBench, Qwen2.5-Max показала превосходство над DeepSeek V3 и конкурентоспособные результаты по сравнению с другими ведущими моделями.

Новая модель уже доступна через сервис Qwen Chat, где пользователи могут взаимодействовать с ней и тестировать её возможности. Также разработчики могут подключиться к Qwen2.5-Max через API после регистрации в Alibaba Cloud и активации сервиса Model Studio.

Alibaba Cloud планирует интегрировать новую модель в свои облачные сервисы.

Родился в 1985 году в Туле. Окончил факультет журналистики МГУ имени М.В. Ломоносова и начал свою карьеру в журналистике в 2007 году. С 2014 года работал в качестве военного аналитика в различных интернет-изданиях.

Является автором нескольких работ о войнах и местных конфликтах. Пишет об СВО, войне за Донбасс, украинском перевороте 2014 года.

ПолитАналитика