#speech
- Thinking Machines Lab представляет TML-Interaction-Small: мультимодальная модель MoE на 276B для работы в реальном времени Thinking Machines Lab models-llm
- EVA-Bench: сквозной фреймворк для оценки голосовых агентов ServiceNow AI research
- Gemini 3.5 Live Translate: синхронный перевод речи на 70+ языках Google DeepMind audio
- MiniCPM-o 4.5: полнодуплексное омнимодальное AI в реальном времени на граничных устройствах OpenBMB / Tsinghua University research
- Audio Interaction Model: унифицированный стриминговый фреймворк, объединяющий офлайн и реальновременную обработку аудио по инструкциям research
- В сборке приложения обнаружены следы Grok Voice Mode для Apple CarPlay xAI tools