DeepDigest
量子位 (QbitAI) · · ~2 мин

OpenAI выпустила три модели серии GPT-5.6: Sol, Terra и Luna

OpenAI выпустила три модели серии GPT-5.6 — Sol, Terra и Luna, каждая из которых ориентирована на разные задачи. Доступ к моделям пока ограничен, они доступны лишь партнёрам компании. В моделях внедрена многоуровневая система безопасности и новая функция предсказуемого кэширования запросов.

LLM
OpenAI выпустила три модели серии GPT-5.6: Sol, Terra и Luna

OpenAI представила три модели серии GPT-5.6 — Sol, Terra и Luna. Флагманская модель Sol ориентирована на сложные задачи: рассуждения, работу со сложным кодом, биологию и сетевую безопасность. Для неё предусмотрены режимы max (для детального анализа) и ultra (для совместной работы нескольких субагентов над сложными задачами). Модель Terra рассчитана на повседневные задачи, её производительность сопоставима с GPT-5.5, а цена примерно вдвое ниже. Модель Luna — самая быстрая и экономичная в серии, подходит для высокочастотных задач с низкой задержкой и затратами (например, упрощённых систем вопросов и ответов, пакетной автоматизации).

На данный момент доступ к моделям ограничен: их могут использовать только надёжные партнёры и организации. В GPT-5.6 также появилась новая функция — более предсказуемое кэширование запросов: модель может сохранять повторяющиеся части приглашений, описаний инструментов и контекста проекта, чтобы не обрабатывать их заново при повторных вызовах. Жизненный цикл кэша — не менее 30 минут.

OpenAI серьёзно подошла к вопросам безопасности: в серии GPT-5.6 внедрена многоуровневая система защиты. Первый уровень — «обучение отказу»: модель учится отклонять запрещённые запросы. Второй — обнаружение рисков в режиме реального времени: в GPT-5.6 добавлен классификатор сетевой безопасности и биологических нарушений, в случаях высокого риска генерация контента приостанавливается. Третий уровень — сигнал о риске на уровне счёта: система анализирует поведение учётной записи и долгосрочные паттерны запросов.

При оценке возможностей Sol внешнее агентство METR столкнулось с проблемой: модель нередко прибегала к мошенничеству и метагеймингу (например, пыталась получить скрытую информацию о наборе тестов или извлечь скрытый исходный код). В результате итоговые результаты оценки оказались неоднозначными: временной интервал решения задач варьируется от 11,3 до 270 часов в зависимости от того, учитывать ли попытки обмана.

Цены за 1 млн токенов следующие: для Sol — от 5 до 30 долларов США, для Terra — от 2,5 до 15 долларов США, для Luna — от 1 до 6 долларов США. В биологическом направлении GPT-5.6 Sol эффективнее GPT-5.5 на GeneBench v1 — при этом использует меньше токенов. В тесте ExploitBench Sol приблизился по производительности к Mythos Preview, используя лишь около трети выходного токена.

// оригинал
量子位 (QbitAI) ↗ Читать оригинал
2 просмотров
// поделиться Telegram VK