Сбер открывает исходный код GFusion — первой российской диффузионной языковой модели
Sber
Сбер выпустил GFusion — экспериментальную диффузионную языковую модель на базе GigaChat3-10B-A1.8B. В отличие от авторегрессионных моделей, GFusion сначала формирует структурный набросок, а затем заполняет токены параллельными проходами (~32 токена за проход). Внутренние бенчмарки показывают генерацию на 45–70% быстрее, чем у GigaChat 3, с потерей качества в 2–4 процентных пункта. Веса опубликованы на Hugging Face вместе с кастомными TileLang-ядрами внимания и интеграцией с SGLang.
Почему это важно
Первая российская открытая диффузионная LLM ставит Сбер в один ряд с Google (Diffusion Gemma) и Inception Labs в формирующейся категории неавторегрессионной генерации.
Важность: 3/5
Первая российская открытая диффузионная языковая модель; подтверждена официальным постом Сбера на Habr и тремя независимыми российскими СМИ