Gemini 3.5 Flash получает встроенный инструмент управления компьютером

Google DeepMind

инструменты офиц. + СМИ 2 ист. ~1 мин

24 июня Google объявила, что computer use теперь является нативным встроенным инструментом в Gemini 3.5 Flash, доступным через Gemini API и Gemini Enterprise Agent Platform. Прежде доступная только в виде отдельной специализированной модели, возможность теперь позволяет агентам видеть, кликать, печатать и прокручивать интерфейсы в браузере, на мобильных и десктопных средах. Целевое adversarial-обучение снижает риски prompt injection. Улучшены результаты на бенчмарке OSWorld по сравнению с предыдущими реализациями.

Почему это важно

Интеграция computer use непосредственно в основную модель Flash снижает порог для создания агентных рабочих процессов над реальными UI. В сочетании со скоростным и экономичным профилем Flash это делает автоматизацию на основе реальных интерфейсов доступнее для корпоративных развёртываний — и напрямую конкурирует с предложением Anthropic по computer use.

Важность: 3/5

Computer use как первоклассная возможность в модели с производственной скоростью; значимо для корпоративной агентной автоматизации

Источники