paper

Vision-Default, Prior-Override: Causal Mechanisms of Perception-Knowledge Conflict in Vision-Language Models

paperactiveprovisionalvision-default-prior-override-causal-mechanisms-of-perception-knowledge-conflict-in-vision-language-models-e164ae91·1 events·first seen 17h ago

Aliases: Vision-Default, Prior-Override: Causal Mechanisms of Perception-Knowledge Conflict in Vision-Language Models

More like this (12)

Vision-Language Models Vision-Language-Action models Does VLA Even Know the Basics? Measuring Commonsense and World Knowledge Retention in Vision-Language-Action Models Vision-Language-Action model Modeling Complex Behaviors: Multi-Personality Composition and Dynamic Switching in Vision-Language Models LabVLA: Grounding Vision-Language-Action Models in Scientific Laboratories visual language model contrastive vision-language pretraining The Lipreading Gap: Do VSR Models Perceive Visual Speech Like Human Lipreaders?How Robust is OCR-Reasoning? Evaluating OCR-Reasoning Robustness of Vision-Language Models under Visual Perturbations A Causal Model of Theory of Mind in Conflict for Artificial Intelligence TempoVLA: Learning Speed-Controllable Vision-Language-Action Policies

Recent events (1)

6arXiv · cs.CL·17h ago·source ↗

Causal circuit analysis reveals how vision-language models resolve perception-knowledge conflicts

A new arXiv preprint uses activation patching and ablation studies to identify the mechanistic basis of perception-knowledge conflict in vision-language models across three VLM families. The authors find that visual grounding is the default behavior, while knowledge-grounded responses depend on a small set of attention heads (2.5–4.8% of total) concentrated in the network's second half. Ablating these heads flips knowledge-grounded predictions to visually grounded ones in 68–96% of cases while barely affecting visually grounded predictions, revealing an asymmetric causal structure. The identified heads decompose into routing heads and writing heads, and the circuit is consistent across model families and scales.

Evaluation and Benchmarking AI Safety Research Vision-Default, Prior-Override: Causal Mechanisms of Perception-Knowledge Conflict in Vision-Language Models +1 more