StylisticBias: 15 визуальных атрибутов объясняют 80% социальных предубеждений в мультимодальных LLM
Контролируемый бенчмарк из ~25 000 фотореалистичных изображений — ~50 вариаций на атрибут для базового лица при фиксированной идентичности — показывает, что возраст и тип телосложения доминируют в предубеждениях на уровне идентичности в MLLM, тогда как стиль одежды создаёт наибольшие сдвиги на уровне атрибутов. На шести MLLM и 25 сценариях социальных суждений ~15 атрибутов объясняют ~80% вариации предубеждений. Принята на воркшопы ICML 2026.
Почему это важно
Даёт Pareto-объяснение социальных предубеждений MLLM: практики могут сосредоточиться на небольшом наборе высокоэффективных визуальных атрибутов вместо аудита всех возможных переменных. Методология изоляции атрибутов при фиксированной идентичности строже, чем в предыдущих целостных оценках.
Важность: 2/5
Добротная статья для воркшопа ICML с практически применимыми выводами для специалистов по предубеждениям MLLM.