DeepSeek открыл исходный код DSpark: ускорение инференса V4 на 57–85% в продакшне
DeepSeek
DeepSeek совместно с лабораторией NLP Пекинского университета выпустили DSpark (Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation) — фреймворк, ускоряющий инференс DeepSeek-V4-Flash на 60–85% и V4-Pro на 57–78% по сравнению с базовым MTP-1. Фреймворк запущен в продакшне для обоих вариантов V4. Кодовая база для обучения и оценки DeepSpec опубликована под лицензией MIT на GitHub (`deepseek-ai/DeepSpec`); карточки моделей DeepSeek-V4-Pro-DSpark и DeepSeek-V4-Flash-DSpark размещены на HuggingFace.
Почему это важно
Ускорение инференса на 57–85% без потери качества — это немедленно применимый результат для всех, кто работает с DeepSeek V4 в масштабе. Открытый исходный код DeepSpec означает, что рецепт обучения модели-черновика доступен сообществу для адаптации под другие базовые модели.
Важность: 3/5
DSpark от DeepSeek опубликован в открытом доступе; ускорение инференса V4 на 57–85% работает в продакшне; официальное + медийное подтверждение