DeepDigest
Golem.de / KI · · ~1 мин

Anthropic использует стеганографию в подсказках Claude

Anthropic встраивает едва заметные маркеры в подсказки Claude, чтобы передавать данные о пользователях на серверы. Для кодирования применяются апострофы и особые разделители в строках с датами, а также анализ домена хоста. Эксперты сомневаются в эффективности и этичности такой практики.

LLM
Anthropic использует стеганографию в подсказках Claude

Разработчик обнаружил, что Anthropic применяет стеганографию в подсказках Claude — встраивает едва заметные маркеры для передачи данных о пользователях на серверы компании. Для кодирования используются апострофы и особые разделители в строках с датами. Например, обычно цифры даты разделяются дефисами (2026-07-01), но если в системе пользователя установлен часовой пояс Азия/Шанхай или Азия/Урумчи, вместо дефисов используются косые черты (07/01/2026). Кроме того, код анализирует домен хоста компьютера. Если имя хоста соответствует одному из двух списков доменов (в них фигурируют китайские разработчики ИИ — Alibaba, Deepseek, Minimax, Moonshot), оно помечается тремя символами, похожими на апостроф в дате. В противном случае ставится обычный апостроф — различия практически незаметны. Некоторые эксперты считают такую скрытую маркировку нарушением доверия пользователей, хотя эффективность меток Anthropic под вопросом — их несложно обойти. Подобная практика не нова: например, Google SynthID использует похожие методы для маркировки текстов, сгенерированных ИИ, а ChatGPT иногда оставлял подобные маркеры в сгенерированных текстах.

// оригинал
Golem.de / KI ↗ Читать оригинал
6 просмотров
// поделиться Telegram VK