DeepDigest
arXiv cs.CL · · ~1 мин

Yuvion LLM: новая модель ИИ с усиленной защитой от угроз

Yuvion LLM — модель ИИ с усиленной защитой от угроз, учитывающая «состязательный» характер атак; в тестах превзошла GPT-5.4 и Qwen3-MAX по показателям безопасности.

cs.CL
arXiv
Cornell University Library

Разработчики представили Yuvion LLM — масштабную языковую модель, которая надёжно защищает контент и ИИ от различных угроз. В отличие от существующих решений, Yuvion LLM учитывает «состязательный» характер атак: она готова противостоять стратегическим попыткам обойти защитные механизмы. Модель проходит многоэтапное обучение, включая работу с данными с учётом угроз, расширение знаний и обучение по технике безопасности. Для оценки эффективности Yuvion LLM создан специальный набор критериев Yuvion LLM RiskEval (YLRE) — он включает 93 критерия по четырём категориям. В тестах Yuvion-8B показала лучшие результаты по показателям безопасности, чем многие современные модели, в том числе более крупные GPT-5.4 и Qwen3-MAX.

// оригинал
arXiv cs.CL ↗ Читать оригинал
3 просмотров
// поделиться Telegram VK