StylisticBias: 15 визуальных атрибутов объясняют 80% социальных предубеждений в мультимодальных LLM

исследования официальный 1 ист. ~1 мин

Контролируемый бенчмарк из ~25 000 фотореалистичных изображений — ~50 вариаций на атрибут для базового лица при фиксированной идентичности — показывает, что возраст и тип телосложения доминируют в предубеждениях на уровне идентичности в MLLM, тогда как стиль одежды создаёт наибольшие сдвиги на уровне атрибутов. На шести MLLM и 25 сценариях социальных суждений ~15 атрибутов объясняют ~80% вариации предубеждений. Принята на воркшопы ICML 2026.

Почему это важно

Даёт Pareto-объяснение социальных предубеждений MLLM: практики могут сосредоточиться на небольшом наборе высокоэффективных визуальных атрибутов вместо аудита всех возможных переменных. Методология изоляции атрибутов при фиксированной идентичности строже, чем в предыдущих целостных оценках.

Важность: 2/5

Добротная статья для воркшопа ICML с практически применимыми выводами для специалистов по предубеждениям MLLM.

multimodal bias benchmark paper

Источники

официальный arXiv:2606.20527 — StylisticBias