DeepSeek открыл исходный код DSpark: ускорение инференса V4 на 57–85% в продакшне

DeepSeek

инструменты офиц. + СМИ 3 ист. ~1 мин

DeepSeek совместно с лабораторией NLP Пекинского университета выпустили DSpark (Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation) — фреймворк, ускоряющий инференс DeepSeek-V4-Flash на 60–85% и V4-Pro на 57–78% по сравнению с базовым MTP-1. Фреймворк запущен в продакшне для обоих вариантов V4. Кодовая база для обучения и оценки DeepSpec опубликована под лицензией MIT на GitHub (`deepseek-ai/DeepSpec`); карточки моделей DeepSeek-V4-Pro-DSpark и DeepSeek-V4-Flash-DSpark размещены на HuggingFace.

Почему это важно

Ускорение инференса на 57–85% без потери качества — это немедленно применимый результат для всех, кто работает с DeepSeek V4 в масштабе. Открытый исходный код DeepSpec означает, что рецепт обучения модели-черновика доступен сообществу для адаптации под другие базовые модели.

Важность: 3/5

DSpark от DeepSeek опубликован в открытом доступе; ускорение инференса V4 на 57–85% работает в продакшне; официальное + медийное подтверждение

deepseek inference speculative-decoding open-source deepseek-v4 mit

Источники

официальный deepseek-ai/DeepSpec — MIT-licensed codebase for DSpark on GitHub

официальный DeepSeek-V4-Pro-DSpark model card — HuggingFace

СМИ DeepSeek Releases DSpark — MarkTechPost