Google DeepMind выпускает Gemma 4 12B: мультимодальная модель без энкодера, работающая на ноутбуке с 16 ГБ VRAM

Google DeepMind

модели/LLM офиц. + СМИ 3 ист. ~1 мин

Google DeepMind выпустила Gemma 4 12B 3 июня 2026 года — открытую мультимодальную модель без энкодера, нативно воспринимающую аудио, видео и изображения, работающую локально на ноутбуке с 16 ГБ VRAM и лицензированную под Apache 2.0. Это первая модель среднего размера со встроенной нативной поддержкой аудио, предназначенная для полностью локальных агентных рабочих процессов через стек Google AI Edge.

Почему это важно

Переносит мультимодальные и аудиовозможности уровня frontier на потребительское железо без зависимости от облака; первая безэнкодерная архитектура такого масштаба.

Важность: 4/5

Открытая мультимодальная модель уровня frontier от Google DeepMind с нативной поддержкой аудио; официальный блог Google и два независимых медиаподтверждения.

gemma open-weights multimodal on-device release

Источники

официальный Introducing Gemma 4 12B — Google Blog

СМИ Google's new open source Gemma 4 12B — VentureBeat

СМИ Google DeepMind's Gemma 4 12B — The Decoder