DeepDigest
ITmedia AI+ · · ~2 мин

Claude Fable 5: изменения в производительности после обновления

Модель ИИ Claude Fable 5 от Anthropic возобновила работу в США после приостановки из‑за уязвимостей. Оценки её производительности разошлись: одна компания зафиксировала снижение показателей, другая — практически не увидела изменений. Различия могут быть связаны с обновлением функции безопасности в модели.

LLM
Claude Fable 5: изменения в производительности после обновления

17:00 по местному времени в США возобновила работу модель искусственного интеллекта Claude Fable 5 (Fable 5) от компании Anthropic. Возникал вопрос: изменились ли её показатели после приостановки? Две американские компании в сфере ИИ поделились результатами оценок.

BridgeMind AI, которая разрабатывает сервисы ИИ-агентов, сообщила, что Fable 5 ослабла и возвращается к прежним показателям. Компания BridgeBench, занимающаяся тестированием ПО, зафиксировала снижение оценок производительности: при отладке — с 86,2 до 25,9, при рефакторинге — с 73,6 до 38,4, при тестировании на неполадки — с 75,9 до 61,7. При этом производительность самой модели не упала — по мнению компании, снижение оценок связано с улучшением функции безопасности.

В то же время Arena (ранее LMArena) в США, где пользователи оценивают эффективность моделей ИИ, сообщила, что производительность Fable 5 практически не изменилась до и после отключения. На основе тысяч оценок на Arena выяснилось, что модель сохраняет примерно одинаковые показатели по разным параметрам — например, по обработке текста и изображений. При этом Arena.ai отмечает, что текущий показатель — предварительное значение: планируется собрать больше данных и опубликовать детальный анализ.

Модель Claude Fable 5 вышла от Anthropic 9 сентября. После сообщений об уязвимости компания приостановила предоставление услуг 12 сентября по распоряжению правительства США и возобновила 1 сентября. В модели есть функция безопасности — «классификатор»: он обнаруживает инструкции, которые могут привести к вредоносному выводу, и реагирует на них. После возобновления работы классификатор обновили, чтобы устранить уязвимости. По словам Anthropic, это привело к росту числа ложных срабатываний при выполнении безобидных запросов — например, в повседневных задачах по кодированию и отладке.

// оригинал
ITmedia AI+ ↗ Читать оригинал
5 просмотров
// поделиться Telegram VK