#on-device
- Google DeepMind выпускает Gemma 4 12B: мультимодальная модель без энкодера, работающая на ноутбуке с 16 ГБ VRAM Google DeepMind models-llm
- MiniCPM-o 4.5: полнодуплексное омнимодальное AI в реальном времени на граничных устройствах OpenBMB / Tsinghua University research
- Google DeepMind публикует QAT-чекпоинты Gemma 4: модель E2B занимает менее 1 ГБ на устройстве Google DeepMind models-llm
- Яндекс выпускает Drops: первые носимые AI-наушники с Алисой Yandex tools
- Яндекс Дропс — первый российский AI-носимый гаджет с Alice AI — поступает в розничные магазины Yandex industry
- Ollama v0.23.0 добавляет поддержку Claude Desktop через Ollama Launch Ollama tools
- llama.cpp b9603: OpenCL-ядра Qualcomm Adreno для инференса на устройстве ggml-org tools
- Alibaba обновляет Qwen AI Glasses S1, добавляя проактивный AI и пространственный 3D-дисплей Alibaba tools
- Яндекс развернул NFC-кулоны с Alice AI на акции «Ночь в музее» Yandex industry