#benchmark 2 пункта 30 апр Programming with Data: test-driven data engineering для самоулучшающихся LLM OpenDataLab research 1 мая AutoResearchBench — бенчмарк автономного поиска научной литературы для AI-агентов BAAI research