8 июня 2026 года Apple представила третье поколение базовой модели Apple Intelligence. В его основе — третье поколение базовых моделей Apple Foundation Models (AFM), семейство из пяти моделей, разработанных в сотрудничестве с Google. Модели варьируются от устанавливаемых на устройствах до серверных, работающих в частных облачных вычислениях.
В семейство входят две встроенные модели: AFM 3 Core (с плотностью обработки 3 млрд параметров) и AFM 3 Core Advanced (с 20 млрд параметров). Последняя изначально мультимодальна — поддерживает выразительный голос и точную диктовку. Модель использует разреженную архитектуру: одновременно активируется от 1 до 4 млрд параметров в зависимости от запроса. AFM 3 Core Advanced оптимизирована для мощных кремниевых систем Apple.
Также в семейство включены три серверные модели для частных облачных вычислений, гарантирующие конфиденциальность пользовательских данных:
* AFM 3 Cloud — оптимизирована для скорости и эффективности;
* ADM 3 Cloud (Image) — предназначена для создания и редактирования изображений;
* AFM 3 Cloud Pro — самая мощная серверная модель для сложных задач, включая агентные инструменты и рассуждения.
AFM 3 Core, AFM 3 Core Advanced, AFM 3 Cloud и ADM 3 Cloud разработаны для Apple silicon. При создании AFM 3 Cloud Pro Apple совместно с Google и NVIDIA расширила возможности частных облачных вычислений на графические процессоры NVIDIA в Google Cloud, сохранив гарантии защиты конфиденциальности пользователей.
AFM 3 Core Advanced использует новую архитектуру с редкой активацией на основе метода обрезки по инструкции (IFP). Полная модель хранится во флэш-памяти (NAND), а не в DRAM. Модель принимает решения о маршрутизации по каждому запросу: лёгкий плотный блок выбирает фиксированный набор экспертов во время начальной обработки, периодически повторно выбирая их во время генерации. Для минимизации перемещения данных модель использует высокий процент постоянно активных «общих экспертов» и зависящих от ввода «перенаправленных экспертов», которые загружаются в DRAM только при необходимости.
Серверная модель AFM 3 Cloud — шаг вперёд в области мультимодальных решений на базе частных облачных вычислений. Apple внедрила обновления в систему параллельного взаимодействия экспертов (PT-MoE): архитектурные усовершенствования стабилизируют процесс обучения и улучшают способность модели анализировать и точно воспроизводить информацию в контекстном окне для сложных запросов.
Модель ADM 3 Cloud создана для создания высококачественных изображений, редактирования и работы с Genmoji. Она обобщает данные о различных соотношениях сторон и разрешениях, использует семейство моделей Apple Foundation для руководства при создании и редактировании. Также применяются специализированные адаптеры для функций последующего редактирования — например, пространственного изменения кадра на фотографиях, сенсорной модификации изображений и персонализации в Image Playground.
Для обучения моделей используются общедоступная информация, лицензированные и приобретённые данные, данные из открытых источников, результаты специальных исследований и синтетические данные. Личные данные пользователей и их взаимодействие не задействуются.
Предварительное обучение моделей расширено на облачных ускорителях TPU последнего поколения. Модели имели общую начальную основу, затем специализировались на архитектурах и вариантах использования, добавив мультимодальные возможности (понимание звука, изображений, анализ контекста, визуальная генерация). Процесс посттренинга объединил точную настройку под наблюдением с многоэтапным обучением с подкреплением. Модели оптимизированы для целевого оборудования: AFM 3 Core, AFM 3 Core Advanced, AFM 3 Cloud и ADM 3 Cloud — для кремния Apple, AFM 3 Cloud Pro — для графических процессоров NVIDIA. Обучение с учётом квантования позволило сократить объём моделей без потери точности.
Качество моделей оценивается на уровне как самих моделей, так и функциональных возможностей. Специалисты оценивают ответы моделей по ключевым параметрам: следование инструкциям, правдивость, презентация. Для подсказок на основе изображений проверяют способность модели идентифицировать, извлекать и обосновывать визуальный контент. Обновлённая базовая модель AFM 3 улучшилась по сравнению с предшественницей: преимущество в 45,6 % запросов против 23,3 % в базовой версии 2025 года.