software-engineering — AI Digest

11 июн Arbor: автономное ML-исследование через уточнение дерева гипотез NLPIR Lab research
11 июн DeNovoSWE: генерация полного репозитория с нуля — рост с 5.8% до 47.2% на синтетических обучающих данных AweAI Team research
16 июн FastContext: специализированный субагент-исследователь сокращает использование токенов агентами по коду на 60% Microsoft / Shanghai Jiao Tong University research
17 июн Исследование Anthropic: успех в агентном программировании определяется экспертизой в предметной области, а не навыками программирования Anthropic research
9 июн SWE-Explore: бенчмарк, выявляющий исследование репозитория как ключевое ограничение в агентах для написания кода Shanghai Jiao Tong University research