Ежедневный дайджест

4 пункта · ~4 мин · Неделя 2026-W25

Стоит знать (1)

GateMem: бенчмарк управления памятью в агентах с разделённым доступом

исследования официальный 1 ист. ~1 мин

GateMem — бенчмарк для оценки LLM-агентов, развёртываемых в многопользовательских институциональных средах (больницы, офисы, школы), по трём конкурирующим целям: полезность для легитимных запросов, ролевое управление доступом и надёжное удаление данных. Тестирование всех существующих методов показало, что ни один из них не обеспечивает все три свойства одновременно, что обнажает критический пробел перед реальным внедрением в организациях.

Почему это важно
Первый систематический бенчмарк управления памятью для агентов с разделённым доступом; напрямую релевантен для корпоративной безопасности и compliance по мере выхода агентных систем в регулируемые среды
Справочно (3)

S-Agent: пространственное использование инструментов активирует пространственный интеллект в VLM

Nanyang Technological University
исследования официальный 1 ист. ~1 мин

S-Agent переосмысляет пространственное рассуждение в vision-language моделях как агентный процесс: VLM-планировщик вызывает пространственные инструменты для накопления свидетельств по проекциям из 2D в 3D и во времени, сохраняя память о сцене и агенте между кадрами. Подход не требует дообучения существующих моделей, а fine-tuned S-Agent-8B достигает результатов закрытых моделей на пространственных бенчмарках.

Почему это важно
Показывает, что агентность с инструментами может заменить грубое масштабирование в пространственном интеллекте: модель на 8B параметров достигает уровня frontier-систем с закрытым исходным кодом

llama.cpp b9754: прогресс загрузки модели в реальном времени через SSE и PEG-парсер грамматик

инструменты официальный 1 ист. ~1 мин

llama.cpp выпустил ~12 тегированных сборок 21 июня 2026 года (b9743–b9754). Ключевые добавления: b9747 добавляет отслеживание прогресса загрузки модели в реальном времени через /models/sse (Server-Sent Events); b9750 реализует оператор call из Jinja для генерации шаблонов; b9754 добавляет автоматный PEG-парсер для более строгой генерации с грамматическими ограничениями. Все сборки поставляются с кросс-платформенными бинарными файлами для macOS, Linux, Windows и Android.

Почему это важно
SSE-стриминг прогресса в реальном времени снижает непрозрачную задержку при запуске для frontend-клиентов локального инференса; PEG-парсер повышает надёжность структурированного вывода

Яндекс добавил в чат Алисы более 30 AI-персонажей с уникальными личностями

Yandex
инструменты только СМИ 2 ист. ~1 мин

Яндекс запустил более 30 AI-персонажей с уникальными личностями в интерфейсе чата Алисы — от блогеров до аниме-героев, каждый предназначен для конкретных сценариев: эмоциональная поддержка, саморазвитие или развлечение. Пользователи также могут создавать собственных персонажей, задав имя и описание поведения; персонажи сохраняют историю разговора между сессиями и доступны на alice.yandex.ru, в приложениях для iOS/Android и в Яндекс Браузере.

Почему это важно
Сигнализирует о движении Яндекса в сегмент companion/social AI наряду с ассистентными функциями, в конкуренции с персонажными AI-платформами по всему миру