vLLM v0.21.0rc1: поддержка PyTorch 2.11, HuggingFace Transformers v5 и Python 3.14
12 мая 2026 года vLLM опубликовала v0.21.0rc1, повысив базовые версии до PyTorch 2.11 и HuggingFace Transformers v5 и добавив Python 3.14 в список поддерживаемых версий. RC следует за патчем v0.20.2 (10 мая), стабилизировавшим поддержку DeepSeek V4 и исправившим ошибки выделения KV-блоков в движке V1.
Почему это важно
Привязка к Transformers v5 и PyTorch 2.11 согласовывает vLLM с текущей upstream-экосистемой, открывая поддержку новых архитектур моделей, зависящих от этих версий.
Важность: 2/5
RC-версия vLLM — базовые версии PyTorch 2.11 + Transformers v5, выравнивание с экосистемой
Источники
официальный
Releases · vllm-project/vllm