Programming with Data: test-driven data engineering для самоулучшающихся LLM
OpenDataLab
Авторы переосмысляют data engineering для LLM как software engineering: training-данные = исходный код спецификации поведения модели, обучение = компиляция, бенчмарки = unit-тесты. Если структурированные знания извлекать из исходного корпуса и использовать одновременно для обучения и оценки, провалы модели трассируются до конкретных дефектов в данных и точечно чинятся. Метод применён к 16 дисциплинам; релизнуты knowledge base, бенчмарки и training-корпуса.
Почему это важно
77 upvotes на HF Daily. Подход формализует то, что и так делают на frontier-лабах вручную: traceability от метрики обратно к конкретному gap'у в данных. Релиз корпусов делает это воспроизводимым.
Importance: 2/5
Методологическая paper, 77 upvotes (<100 — без bump).