ByteDance выпускает Doubao-Seed-2.0-lite — первую омни-модальную модель в серии Seed

ByteDance

модели/LLM офиц. + СМИ 2 ист. ~1 мин

Volcano Engine компании ByteDance анонсировала Doubao-Seed-2.0-lite — первую модель полного мультимодального понимания в семействе Doubao Seed, нативно обрабатывающую видео, изображения, аудио и текст в рамках единой модели. Модель поддерживает транскрипцию на 19 языках, перевод на 14 языков и вводит возможности взаимодействия с GUI: распознавание и управление элементами интерфейса (клики, перетаскивание, ввод текста). Одновременно была выпущена более эффективная версия Doubao-Seed-2.0-mini для экономичного корпоративного развёртывания.

Почему это важно

Первая омни-модальная модель ByteDance в серии Seed сокращает разрыв с мультимодальными моделями типа GPT-4o и добавляет нативные возможности GUI-агента для сквозной автоматизации задач.

Важность: 3/5

Первая омни-модальная модель в линейке Seed от ByteDance с нативной обработкой видео/изображений/аудио/текста и управлением GUI на 19 входных языках и 14 языках перевода.

Источники