IBM Granite Embedding Multilingual R2: контекст 32K и лучший результат среди моделей до 100M параметров

IBM

инструменты официальный 1 ист. ~1 мин

IBM выпустила две новые open embedding-модели: granite-embedding-311m-multilingual-r2 (MTEB Multilingual 65.2) и granite-embedding-97m-multilingual-r2 (60.3, лучший результат среди моделей до 100M параметров). Обе поддерживают контекстное окно в 32 768 токенов — в 64 раза больше, чем у R1, — более 200 языков и 9 языков программирования. Построены на ModernBERT с Flash Attention 2.0. Лицензия Apache 2.0; включены веса ONNX/OpenVINO.

Почему это важно

Контекст в 32K закрывает критический пробел для извлечения длинных документов в RAG-пайплайнах. Производительность модели до 100M параметров делает on-device embedding реальным без потери качества, а лицензия Apache 2.0 снимает барьеры для коммерческого использования.

Важность: 3/5

Лучшие мультиязычные embedding-модели до 100M параметров с 64-кратным расширением контекста; полностью открытая лицензия Apache 2.0

Источники