Китайская компания Alibaba Cloud анонсировала запуск новой языковой модели искусственного интеллекта Qwen2.5-Max, которая, по утверждению разработчиков, превосходит по производительности такие системы, как DeepSeek V3 и GPT-4o.
Модель Qwen2.5-Max основана на архитектуре Mixture-of-Experts (MoE) и обучена на более чем 20 триллионах токенов. Разработчики акцентируют внимание на значительном прогрессе в интеллектуальных возможностях модели, которая демонстрирует улучшенные результаты в анализе текста, переводе и генерации контента. В ходе тестирования на ключевых бенчмарках, таких как MMLU-Pro и LiveBench, Qwen2.5-Max показала превосходство над DeepSeek V3 и конкурентоспособные результаты по сравнению с другими ведущими моделями.
Новая модель уже доступна через сервис Qwen Chat, где пользователи могут взаимодействовать с ней и тестировать её возможности. Также разработчики могут подключиться к Qwen2.5-Max через API после регистрации в Alibaba Cloud и активации сервиса Model Studio.
Alibaba Cloud планирует интегрировать новую модель в свои облачные сервисы.
