vLLM Semantic Router v0.3 Themis: производственная маршрутизация с сохранением состояния и Session-Aware Agentic Routing
vLLM Semantic Router v0.3 (кодовое имя Themis), выпущен 5 июня 2026, превращает маршрутизацию из инструмента классификации в полноценную производственную систему с сохранением состояния и наблюдаемостью. Ключевые нововведения: унифицированный формат конфигурации v0.3, устраняющий фрагментацию диалектов; обогащение сигналов с извлечением признаков из 15+ семейств сигналов (аутентификация, безопасность, структура диалога, обнаружение циклов инструментов); Session-Aware Agentic Routing (SAAR), объединяющий собственную память сессий роутера, блокировки безопасности во время циклов инструментов, проверки переносимости состояния провайдера и воспроизводимую диагностику; обновлённая панель оператора; и привязки Intel OpenVINO для интеграции с C++/Go. Релиз включает 350+ коммитов с версии v0.2.0. Роутер занял первое место в RouterArena с взвешенным Arena Score 75.4 и получил нативную поддержку протокола Anthropic `/v1/messages` наряду с совместимостью с OpenAI.
Почему это важно
SAAR напрямую решает практическую проблему развёртывания агентов — смена моделей многоходовыми агентами в середине сессии и дестабилизация поведения. Поддержка протокола Anthropic расширяет применимость за пределы чисто OpenAI-совместимых стеков, а первое место в RouterArena подтверждает производственную готовность.
Важность: 3/5
Мажорный релиз производственной инфраструктуры маршрутизации с новой возможностью SAAR; 350+ коммитов; лучший результат в бенчмарке RouterArena.