Programming with Data: test-driven data engineering для самоулучшающихся LLM

Авторы переосмысляют data engineering для LLM как software engineering: training-данные = исходный код спецификации поведения модели, обучение = компиляция, бенчмарки = unit-тесты. Если структурированные знания извлекать из исходного корпуса и использовать одновременно для обучения и оценки, провалы модели трассируются до конкретных дефектов в данных и точечно чинятся. Метод применён к 16 дисциплинам; релизнуты knowledge base, бенчмарки и training-корпуса.

Почему это важно

77 upvotes на HF Daily. Подход формализует то, что и так делают на frontier-лабах вручную: traceability от метрики обратно к конкретному gap'у в данных. Релиз корпусов делает это воспроизводимым.

Importance: 2/5

Методологическая paper, 77 upvotes (<100 — без bump).

Почему это важно

Источники