#ssm 2 пункта 3 июн Do Language Models Need Sleep? Offline Recurrence as Memory Consolidation for Improved Inference Google / CMU research 11 июн llama.cpp b9589–b9592: исправление синхронизации CUDA SSM и оптимизация памяти Mamba tools