Формализация латентных мыслей: аксиоматический фреймворк для оценки репрезентаций рассуждений LLM

University of British Columbia

исследования официальный 1 ист. ~1 мин

Представлен аксиоматический фреймворк для оценки репрезентаций латентных мыслей в LLM, не зависящий от результатов downstream-бенчмарков. Определены четыре аксиомы — Causality, Minimality, Separability и Stability — с количественными метриками. Тестирование на 23 задачах рассуждения на открытых весовых моделях показало, что ни одна модель не удовлетворяет всем четырём аксиомам одновременно, а репрезентации кодируют минимум информации сверх той, что уже содержится во входных эмбеддингах.

Почему это важно

Предоставляет принципиальный способ аудита, не зависящий от бенчмарков, — позволяет проверить, являются ли внутренние «мысли» модели содержательными. Важно для интерпретируемости и оценки chain-of-thought. 46 голосов на HuggingFace Daily Papers 29 июня 2026 года.

Важность: 2/5

46 голосов на HF Daily; фреймворк аудита интерпретируемости для chain-of-thought моделей, не зависящий от бенчмарков

Источники