Формализация латентных мыслей: аксиоматический фреймворк для оценки репрезентаций рассуждений LLM
University of British Columbia
Представлен аксиоматический фреймворк для оценки репрезентаций латентных мыслей в LLM, не зависящий от результатов downstream-бенчмарков. Определены четыре аксиомы — Causality, Minimality, Separability и Stability — с количественными метриками. Тестирование на 23 задачах рассуждения на открытых весовых моделях показало, что ни одна модель не удовлетворяет всем четырём аксиомам одновременно, а репрезентации кодируют минимум информации сверх той, что уже содержится во входных эмбеддингах.
Почему это важно
Предоставляет принципиальный способ аудита, не зависящий от бенчмарков, — позволяет проверить, являются ли внутренние «мысли» модели содержательными. Важно для интерпретируемости и оценки chain-of-thought. 46 голосов на HuggingFace Daily Papers 29 июня 2026 года.
Важность: 2/5
46 голосов на HF Daily; фреймворк аудита интерпретируемости для chain-of-thought моделей, не зависящий от бенчмарков