Entity · paper

Difference-Aware Retrieval Policies for Imitation Learning

paperactivedifference-aware-retrieval-policies-for-imitation-learning-b0ce8e29·1 events·first seen Jun 9, 2026

Aliases: Difference-Aware Retrieval Policies for Imitation Learning

Co-occurring entities

More like this (12)

Language-Critique Imitation Learning from Suboptimal Demonstrations Imitation Learning Preference-Aware Rubric Learning One-Shot Imitation Learning Reasoning Imitation Learning to Reason by Analogy via Retrieval-Augmented Reinforcement Fine-Tuning Role-Aware Policy Optimization Copy Less, Ground More: Overcoming Repetitive Copying in Long-Context Reasoning via Evidence-Aware Reinforcement Learning Vector Search As Nearest Neighbor Matching: RAG-based Policy Learning in Causal Inference Self-Augmenting Retrieval for Diffusion Language Models Understanding the Behaviors of Environment-aware Information Retrieval Recalling Too Well: Sycophancy Evaluation and Mitigation in Memory-Augmented Models

Recent events (1)

5arXiv · cs.AI·Jun 9, 2026·source ↗

DARP: Semi-parametric retrieval-based imitation learning reduces compounding errors by 15-46%

Researchers introduce DARP (Difference-Aware Retrieval Policies), a semi-parametric imitation learning method that retrieves k-nearest neighbor demonstrations at inference time and predicts actions based on relative distance vectors between neighbor and query states. The approach reparameterizes behavior cloning around local neighborhood structure rather than global state-to-action mappings, requiring no additional data collection or online expert feedback. Across continuous control and robotic manipulation tasks, DARP shows 15-46% performance improvements over standard behavior cloning, including on high-dimensional visual inputs.

Agent and Tool Ecosystem DARP Difference-Aware Retrieval Policies for Imitation Learning