#mech-interp 2 пункта 18 мая Judge Circuits: механистическое объяснение непоследовательности LLM-as-judge по форматам research 11 июн Анатомия пост-обучения: использование интерпретируемости для аудита и исправления данных предпочтений research