DeepDigest
arXiv cs.AI · · ~1 мин

НормАкт: как ИИ справляется со скрытыми социальными нормами

Создан тест NormAct для оценки способности MLLM учитывать скрытые социальные нормы; предложен NormPerceptor, повышающий успешность задач с 24,2% до 46,7%.

cs.AI
arXiv
Cornell University Library

Исследователи разработали тест NormAct, чтобы проверить, насколько многомодальные языковые модели (MLLM) способны учитывать скрытые социальные нормы при планировании действий. В ходе экспериментов с GPT-5.4, Claude Opus 4.7 и Gemini 3 Pro выяснилось, что модели достигают поставленных целей в 67,3% случаев, но соблюдают скрытые нормы лишь в 26,4%. Чтобы исправить ситуацию, авторы предложили NormPerceptor — генератор сигналов, который помогает моделям выявлять релевантные нормы до планирования. Благодаря этому решению успешность выполнения задач выросла с 24,2% до 46,7%. Это важный шаг к созданию более «социально грамотных» ИИ-агентов.

// оригинал
arXiv cs.AI ↗ Читать оригинал
1 просмотров
// поделиться Telegram VK