vLLM v0.21.0rc1: поддержка PyTorch 2.11, HuggingFace Transformers v5 и Python 3.14

инструменты официальный 1 ист. ~1 мин

12 мая 2026 года vLLM опубликовала v0.21.0rc1, повысив базовые версии до PyTorch 2.11 и HuggingFace Transformers v5 и добавив Python 3.14 в список поддерживаемых версий. RC следует за патчем v0.20.2 (10 мая), стабилизировавшим поддержку DeepSeek V4 и исправившим ошибки выделения KV-блоков в движке V1.

Почему это важно

Привязка к Transformers v5 и PyTorch 2.11 согласовывает vLLM с текущей upstream-экосистемой, открывая поддержку новых архитектур моделей, зависящих от этих версий.

Важность: 2/5

RC-версия vLLM — базовые версии PyTorch 2.11 + Transformers v5, выравнивание с экосистемой

Источники

официальный Releases · vllm-project/vllm