Разработчики представили Yuvion LLM — масштабную языковую модель, которая надёжно защищает контент и ИИ от различных угроз. В отличие от существующих решений, Yuvion LLM учитывает «состязательный» характер атак: она готова противостоять стратегическим попыткам обойти защитные механизмы. Модель проходит многоэтапное обучение, включая работу с данными с учётом угроз, расширение знаний и обучение по технике безопасности. Для оценки эффективности Yuvion LLM создан специальный набор критериев Yuvion LLM RiskEval (YLRE) — он включает 93 критерия по четырём категориям. В тестах Yuvion-8B показала лучшие результаты по показателям безопасности, чем многие современные модели, в том числе более крупные GPT-5.4 и Qwen3-MAX.
arXiv cs.CL
·
·
~1 мин
Yuvion LLM: новая модель ИИ с усиленной защитой от угроз
Yuvion LLM — модель ИИ с усиленной защитой от угроз, учитывающая «состязательный» характер атак; в тестах превзошла GPT-5.4 и Qwen3-MAX по показателям безопасности.
// оригинал
arXiv cs.CL
↗ Читать оригинал
3 просмотров
// похожие статьи