НормАкт: как ИИ справляется со скрытыми социальными нормами

Создан тест NormAct для оценки способности MLLM учитывать скрытые социальные нормы; предложен NormPerceptor, повышающий успешность задач с 24,2% до 46,7%.

Исследователи разработали тест NormAct, чтобы проверить, насколько многомодальные языковые модели (MLLM) способны учитывать скрытые социальные нормы при планировании действий. В ходе экспериментов с GPT-5.4, Claude Opus 4.7 и Gemini 3 Pro выяснилось, что модели достигают поставленных целей в 67,3% случаев, но соблюдают скрытые нормы лишь в 26,4%. Чтобы исправить ситуацию, авторы предложили NormPerceptor — генератор сигналов, который помогает моделям выявлять релевантные нормы до планирования. Благодаря этому решению успешность выполнения задач выросла с 24,2% до 46,7%. Это важный шаг к созданию более «социально грамотных» ИИ-агентов.