Anthropic предлагает отраслевую шкалу оценки тяжести джейлбрейков
Anthropic
2 июля Anthropic опубликовала описание четырёхуровневого классификатора кибербезопасности Fable 5 и предложила шкалу Cyber Jailbreak Severity (CJS) — от CJS-0 до CJS-4, — оценивающую джейлбрейки по приросту возможностей, охвату атаки, лёгкости оружеизации и обнаруживаемости. Разработана совместно с партнёрами Project Glasswing, включая Amazon, Microsoft и Google, и предложена для принятия всей отраслью.
Почему это важно
Единый словарь серьёзности AI-джейлбрейков повторяет путь стандартизации уязвимостей через CVSS. Если CJS будет принята лабораториями повсеместно, это ускорит скоординированное реагирование на инциденты безопасности и даст регуляторам конкретную метрику.
Важность: 3/5
Кросс-отраслевая шкала серьёзности джейлбрейков, предложенная Anthropic при участии Amazon, Microsoft и Google; CVSS-подобная стандартизация для AI-безопасности