#gpu 2 items 6 мая SGLang v0.5.11: Speculative Decoding V2 as Default and Eight New Model Architectures tools 6 мая vLLM v0.20.1: DeepSeek V4 Stabilization on CUDA 13 and PyTorch 2.11 tools