#local-ai
- Ollama v0.23.1: MTP-спекулятивное декодирование Gemma 4 даёт ускорение в 2× на Apple Silicon tools
- llama.cpp b9085: flash attention для MiMo-V2.5 и поддержка Vertex AI Server tools
- llama.cpp добавляет поддержку gpt-oss-20b в сборке от 12 мая tools
- Ollama v0.23.3: исправления MLX runner и совместимость с Metal в macOS 26 Ollama tools