Entity · paper

Visual Verification Enables Inference-time Steering and Autonomous Policy Improvement

paperactivevisual-verification-enables-inference-time-steering-and-autonomous-policy-improvement-d8a47cce·1 events·first seen Jun 17, 2026

Aliases: Visual Verification Enables Inference-time Steering and Autonomous Policy Improvement

Co-occurring entities

VERITAS

More like this (12)

Predicting Future Behaviors in Reasoning Models Enables Better Steering InSight: Self-Guided Skill Acquisition via Steerable VLAs InSight: Self-Guided Skill Acquisition via Steerable VLAs Agentic Chain-of-Thought Steering for Efficient and Controllable LLM Reasoning TempoVLA: Learning Speed-Controllable Vision-Language-Action Policies Efficient and Sound Probabilistic Verification for AI Agents State-Conditioned Dynamic Steering Self-Refining Agentic Reinforcement Learning for Vision-Conditioned UAV Navigation Where Does the Answer Come From? Benchmarking View-Level Visual Evidence Identification in Multi-View MLLMs for Autonomous Driving Learning Adaptive Safety Margins for Visual Navigation Learning Red Agent Policy from Observations for Neurosymbolic Autonomous Cyber Agents Activation Steering

Recent events (1)

6arXiv · cs.AI·Jun 17, 2026·source ↗

VERITAS: Visual verification enables inference-time steering and autonomous improvement for robot policies

Researchers introduce VERITAS, a generator-verifier framework pairing a pre-trained generalist robot policy with a gradient-free visual verifier to steer actions at inference time without additional training. Verified rollouts are also used for offline self-improvement via fine-tuning, achieving performance gains comparable to expert demonstrations but without human intervention. The work demonstrates that inference-time verification is a scalable mechanism for autonomous policy improvement during deployment.

Inference Economics Visual Verification Enables Inference-time Steering and Autonomous Policy Improvement VERITAS