Создатели Qwen — флагманской LLM от Alibaba
Alibaba Cloud (также известная как Aliyun) — дочерняя компания Alibaba Group, основанная в 2009 году. За 15 лет компания превратилась в одного из крупнейших мировых провайдеров облачных услуг, занимая 4-е место в мире по доле рынка IaaS (Gartner, 2023). Штаб-квартира расположена в Ханчжоу, Китай, а дата-центры развернуты в 30 регионах по всему миру.
Миссия Alibaba Cloud — демократизация доступа к вычислительным ресурсам и AI-технологиям. Компания инвестирует более $10 млрд в год в R&D, фокусируясь на разработке собственных чипов (Yitian 710), моделей машинного обучения и edge-решений. Ключевое достижение последних лет — создание семейства LLM Qwen, которое по бенчмаркам (MMLU, HumanEval) конкурирует с GPT-4 и Llama 3.
Alibaba Cloud обслуживает более 4 млн клиентов, включая 60% китайских компаний из списка Fortune 500. Платформа поддерживает 300+ сервисов: от баз данных и Kubernetes до AI-пайплайнов и serverless-вычислений. В 2023 году выручка сегмента облачных услуг Alibaba составила $14,5 млрд.
Qwen является центральным элементом AI-стратегии Alibaba Cloud. Модель интегрирована с платформой машинного обучения PAI (Platform for AI), которая позволяет дообучать Qwen на корпоративных данных с использованием AutoML и distributed training. Через сервис Elasticsearch Alibaba Cloud можно организовать RAG-пайплайны, подключая Qwen к векторным базам данных. Для production-нагрузок используется serverless-инференс через Function Compute, автоматически масштабирующийся под запросы. Все компоненты объединены единой системой мониторинга и IAM, что упрощает compliance и audit.
Alibaba Cloud выпустила несколько конфигураций: Qwen-1.8B, Qwen-7B, Qwen-14B, Qwen-72B, а также специализированные версии Qwen-Coder (для кода) и Qwen-VL (мультимодальная). Все версии доступны под Apache 2.0.
Да, open-source лицензия Apache 2.0 позволяет коммерческое использование без ограничений. Для облачного API действует pay-as-you-go модель с SLA 99.95%.
Модель обучена на данных на 29 языках, включая английский, китайский, русский, испанский, французский и арабский. По тестам на русском языке Qwen-72B показывает качество, сопоставимое с GPT-4 (BLEU 42.3 на RuNMT).
На бенчмарке MMLU Qwen-72B (85.4%) незначительно уступает Llama 3-70B (86.1%), но превосходит её на задачах кодирования (HumanEval: 74.2% против 72.6%). При этом Qwen требует на 15% меньше VRAM благодаря оптимизации архитектуры.