Создатели Llama — самой популярной открытой LLM
Meta AI (ранее Facebook AI Research, FAIR) — исследовательское подразделение Meta Platforms, основанное в 2013 году под руководством Янна ЛеКуна. За десять лет команда превратилась из академической лаборатории в одного из ключевых игроков на рынке фундаментальных моделей, выпустив серию открытых LLM Llama, которые задали стандарт для open-source AI.
Миссия Meta AI — демократизация доступа к передовым AI-технологиям. В отличие от закрытых моделей OpenAI и Google, Meta последовательно публикует веса и архитектуру своих моделей под лицензией, допускающей коммерческое использование. Ключевые достижения: выпуск Llama 2 (2023) с 7B, 13B и 70B параметров, Llama 3 (2024) с улучшенной производительностью на бенчмарках, а также интеграция Llama в экосистему Meta (WhatsApp, Instagram, Facebook). По состоянию на 2025 год, семейство Llama — самая загружаемая открытая LLM в мире с более чем 350 миллионами скачиваний.
Meta AI также активно развивает направления компьютерного зрения (модель SAM), мультимодальности (ImageBind) и генеративного видео (Emu Video), но флагманским продуктом остаётся Llama, используемая тысячами стартапов и предприятий для построения собственных AI-решений.
В отличие от проприетарных моделей, Llama публикуется с открытыми весами, архитектурой и токенизатором. Это позволяет CTO и ML-инженерам проводить полный аудит безопасности, дообучать модели на собственных данных и развёртывать их в air-gapped средах без зависимости от API-провайдеров.
Начиная с Llama 2, Meta использует лицензию, разрешающую коммерческое использование для большинства сценариев (исключение — компании с более чем 700 млн MAU). Это делает Llama предпочтительным выбором для стартапов и среднего бизнеса, которые хотят избежать роялти и vendor lock-in.
Вокруг Llama сформировалось крупнейшее open-source сообщество: тысячи fine-tuned версий на Hugging Face, интеграции с LangChain, LlamaIndex, vLLM и всеми популярными фреймворками. Инженеры получают готовые инструменты для RAG, agentic workflows и deployment в production.
Llama 3 405B демонстрирует результаты, сопоставимые с GPT-4 и Claude 3.5 на бенчмарках MMLU (86.1%), HumanEval (84.2%) и GSM8K (93.0%), при этом inference на 70B модели возможен на одном A100 80GB, что радикально снижает TCO для B2B-сценариев.
Хотя в каталоге Qantcore представлена только Llama 3, важно понимать, что Meta AI строит целостную экосистему. Llama служит центральным языковым ядром, которое может быть объединено с моделями компьютерного зрения (SAM 2 — сегментация изображений) и мультимодальными энкодерами (ImageBind) для создания полноценных AI-систем. Например, типичный enterprise-пайплайн включает Llama для генерации текста, SAM для обработки визуальных данных и LlamaIndex для организации RAG-пайплайнов. Все компоненты оптимизированы для работы на собственном AI-железе Meta (MTIA) и через фреймворк PyTorch, что обеспечивает бесшовную интеграцию.
Llama 3 распространяется под лицензией Meta Llama 3 Community License. Она разрешает использование, копирование, модификацию и распространение модели и её производных для коммерческих целей. Основное ограничение: если у вашего сервиса более 700 миллионов месячных активных пользователей, необходимо запросить отдельное разрешение у Meta. Для 99% B2B-компаний это ограничение неактуально.
Llama 3 доступна в трёх конфигурациях: 8B (подходит для инференса на consumer GPU, например RTX 4090), 70B (требует A100 80GB или несколько GPU с tensor parallelism) и 405B (требует кластер из 8+ A100/H100 для инференса). Для fine-tuning 8B достаточно одного A100, для 70B — 4-8 GPU. Meta рекомендует использовать bfloat16 и Flash Attention 2 для оптимизации памяти.
Основное отличие — открытость. Llama 3 можно запускать локально, дообучать на приватных данных и модифицировать архитектуру. По производительности Llama 3 405B сопоставима с GPT-4 на большинстве академических бенчмарков, но может уступать в задачах, требующих специфических знаний (медицина, юриспруденция) без дополнительного fine-tuning. Для B2B-сценариев, где важны контроль данных и стоимость инференса, Llama 3 часто оказывается экономически эффективнее.
На странице продукта Llama 3 вы найдёте прямые ссылки на Hugging Face, официальный репозиторий Meta и готовые Docker-образы для развёртывания. Qantcore также предоставляет сравнительные бенчмарки и рекомендации по конфигурации для типовых B2B-сценариев (чат-боты, RAG, code generation).