Ollama v0.30.7: поддержка Hermes Desktop, Gemma 4 QAT и Nemotron-3-Ultra

Ollama

инструменты официальный 1 ист. ~1 мин

Ollama v0.30.7 (7 июня 2026) добавляет нативную поддержку Windows для Hermes Desktop и синхронизирует списки моделей OpenAI-совместимого API с доступными тегами. Релиз v0.30.6 (5 июня) добавил модели Gemma 4, оптимизированные с помощью Quantization-Aware Training (QAT), снижающего требования к памяти примерно на 72% при сохранении качества, близкого к оригинальному. Версия v0.30.4 (3 июня) представила поддержку Nemotron-3-Ultra для рассуждений и длительных агентных воркфлоу, а также исправила выгрузку на Metal GPU для мультимодальных моделей на Apple Silicon. Версия v0.30.2 добавила поддержку Qwen Code и улучшила подсчёт токенов для кешированных промптов.

Почему это важно

Поддержка Gemma 4 QAT резко снижает аппаратный порог для локального запуска мультимодальной модели Google, а поддержка Nemotron-3-Ultra открывает доступ к флагманской модели рассуждений NVIDIA для локального инференса. Шесть версий за пять дней отражает активную интеграцию нескольких новых семейств моделей.

Важность: 2/5

Кластер патч-релизов с поддержкой крупных моделей (Gemma 4 QAT, Nemotron-3-Ultra) для локального инференса.

ollama inference local-llm open-source

Источники

официальный Ollama Releases — GitHub