Kimi K2.7-Code HighSpeed: рост производительности в 6× для продакшн-пайплайнов агентов по коду

Moonshot AI

модели/LLM офиц. + СМИ 4 ист. ~1 мин

15 июня 2026 года Moonshot AI анонсировала вариант HighSpeed для Kimi K2.7-Code, доступный пользователям Kimi Code Beta и Kimi Business. Режим HighSpeed обеспечивает около 180 токенов/с на задачах медианной длины и до 260 токенов/с на коротких — примерно в шесть раз быстрее стандартного релиза. Базовая модель K2.7-Code (MoE с 1 трлн параметров, 32B активных, контекст 256K) вышла 12 июня и показала +21,8% на Kimi Code Bench v2 и примерно на 30% меньше токенов при рассуждении по сравнению с K2.6.

Почему это важно

При цене около $0,95 за миллион входных токенов и открытых весах для самостоятельного хостинга Kimi K2.7-Code HighSpeed напрямую атакует узкое место по пропускной способности в продакшн-пайплайнах агентов по коду — где скорость генерации токенов ограничивает количество итераций агента в единицу времени.

Важность: 3/5

Значительное улучшение пропускной способности (6×) для топовой модели с открытыми весами для работы с кодом по цене ниже доллара; прямая применимость для агентных задач в разработке ПО.

Источники