Moebius: лёгкая модель инпейнтинга на 0,2 млрд параметров сравнялась с FLUX на 11,9 млрд

Huazhong University of Science and Technology

исследования официальный 1 ист. ~1 мин

Moebius представляет модель инпейнтинга изображений на 0,22 млрд параметров, которая сравнивается или превосходит FLUX.1-Fill-Dev (11,9 млрд параметров) за счёт блока Local-λ Mix Interaction, сжимающего пространственный контекст и глобальные семантические приоры в матрицы фиксированного размера. Адаптивная дистилляция в латентном пространстве с несколькими уровнями гранулярности обеспечивает 15-кратное ускорение инференса.

Почему это важно

Бумага с наибольшим числом голосов на HuggingFace Daily Papers (более 100). Демонстрирует, что экстремальная параметрическая эффективность (менее 2% от размера базовой модели) достижима для сложной задачи генерации без потери качества.

Важность: 4/5

100+ апвоутов на HF Daily; 50-кратное сокращение числа параметров по сравнению с FLUX.1-Fill-Dev при сопоставимом качестве — новая граница эффективности диффузионного инпейнтинга.

Источники