Исследователи разработали тест NormAct, чтобы проверить, насколько многомодальные языковые модели (MLLM) способны учитывать скрытые социальные нормы при планировании действий. В ходе экспериментов с GPT-5.4, Claude Opus 4.7 и Gemini 3 Pro выяснилось, что модели достигают поставленных целей в 67,3% случаев, но соблюдают скрытые нормы лишь в 26,4%. Чтобы исправить ситуацию, авторы предложили NormPerceptor — генератор сигналов, который помогает моделям выявлять релевантные нормы до планирования. Благодаря этому решению успешность выполнения задач выросла с 24,2% до 46,7%. Это важный шаг к созданию более «социально грамотных» ИИ-агентов.
arXiv cs.AI
·
·
~1 мин
НормАкт: как ИИ справляется со скрытыми социальными нормами
Создан тест NormAct для оценки способности MLLM учитывать скрытые социальные нормы; предложен NormPerceptor, повышающий успешность задач с 24,2% до 46,7%.
// оригинал
arXiv cs.AI
↗ Читать оригинал
1 просмотров
// похожие статьи