Google DeepMind выпускает Gemma 4 12B: мультимодальная модель без энкодера, работающая на ноутбуке с 16 ГБ VRAM
Google DeepMind
Google DeepMind выпустила Gemma 4 12B 3 июня 2026 года — открытую мультимодальную модель без энкодера, нативно воспринимающую аудио, видео и изображения, работающую локально на ноутбуке с 16 ГБ VRAM и лицензированную под Apache 2.0. Это первая модель среднего размера со встроенной нативной поддержкой аудио, предназначенная для полностью локальных агентных рабочих процессов через стек Google AI Edge.
Почему это важно
Переносит мультимодальные и аудиовозможности уровня frontier на потребительское железо без зависимости от облака; первая безэнкодерная архитектура такого масштаба.
Важность: 4/5
Открытая мультимодальная модель уровня frontier от Google DeepMind с нативной поддержкой аудио; официальный блог Google и два независимых медиаподтверждения.
Источники
официальный
Introducing Gemma 4 12B — Google Blog