ByteDance выпускает Doubao-Seed-2.0-lite — первую омни-модальную модель в серии Seed
ByteDance
Volcano Engine компании ByteDance анонсировала Doubao-Seed-2.0-lite — первую модель полного мультимодального понимания в семействе Doubao Seed, нативно обрабатывающую видео, изображения, аудио и текст в рамках единой модели. Модель поддерживает транскрипцию на 19 языках, перевод на 14 языков и вводит возможности взаимодействия с GUI: распознавание и управление элементами интерфейса (клики, перетаскивание, ввод текста). Одновременно была выпущена более эффективная версия Doubao-Seed-2.0-mini для экономичного корпоративного развёртывания.
Почему это важно
Первая омни-модальная модель ByteDance в серии Seed сокращает разрыв с мультимодальными моделями типа GPT-4o и добавляет нативные возможности GUI-агента для сквозной автоматизации задач.
Важность: 3/5
Первая омни-модальная модель в линейке Seed от ByteDance с нативной обработкой видео/изображений/аудио/текста и управлением GUI на 19 входных языках и 14 языках перевода.