Anthropic предлагает отраслевую шкалу оценки тяжести джейлбрейков

Anthropic

исследования официальный 1 ист. ~1 мин

2 июля Anthropic опубликовала описание четырёхуровневого классификатора кибербезопасности Fable 5 и предложила шкалу Cyber Jailbreak Severity (CJS) — от CJS-0 до CJS-4, — оценивающую джейлбрейки по приросту возможностей, охвату атаки, лёгкости оружеизации и обнаруживаемости. Разработана совместно с партнёрами Project Glasswing, включая Amazon, Microsoft и Google, и предложена для принятия всей отраслью.

Почему это важно

Единый словарь серьёзности AI-джейлбрейков повторяет путь стандартизации уязвимостей через CVSS. Если CJS будет принята лабораториями повсеместно, это ускорит скоординированное реагирование на инциденты безопасности и даст регуляторам конкретную метрику.

Важность: 3/5

Кросс-отраслевая шкала серьёзности джейлбрейков, предложенная Anthropic при участии Amazon, Microsoft и Google; CVSS-подобная стандартизация для AI-безопасности

Источники