ssm — AI Digest

3 июн Do Language Models Need Sleep? Offline Recurrence as Memory Consolidation for Improved Inference Google / CMU research
11 июн llama.cpp b9589–b9592: исправление синхронизации CUDA SSM и оптимизация памяти Mamba tools