paper

Efficient and Sound Probabilistic Verification for AI Agents

paperactiveprovisionalefficient-and-sound-probabilistic-verification-for-ai-agents-e037a3d9·1 events·first seen 47h ago

Aliases: Efficient and Sound Probabilistic Verification for AI Agents

Co-occurring entities

Datalog distributionally robust optimization

More like this (12)

Towards a Science of AI Agent Reliability Concrete Problems in AI Safety Visual Verification Enables Inference-time Steering and Autonomous Policy Improvement Trustworthy AI ProvenanceGuard: Source-Aware Factuality Verification for MCP-Based LLM Agents Bayesian Inference and Decision Audits for Public Archives of Frontier AI Evaluations Learning Red Agent Policy from Observations for Neurosymbolic Autonomous Cyber Agents speculative execution (AI agents)third-party AI evaluations AI-assisted theorem proving Multi-Turn Evaluation of Deep Research Agents Under Process-Level Feedback APPO: Agentic Procedural Policy Optimization

Recent events (1)

5arXiv · cs.AI·47h ago·source ↗

Distributionally robust optimization framework for probabilistic runtime verification of AI agents

A new arXiv preprint introduces a sound and efficient framework for verifying probabilistic security policies for AI agents operating in complex digital environments, addressing limitations of prior Datalog-based approaches that assumed deterministic policies or predicate independence. The method uses distributionally robust optimization to compute sound upper bounds on policy violation probability without requiring independence assumptions between predicates. Evaluated on benchmarks for terminal and tool-calling agents, the approach outperforms prior art on the security-utility trade-off.

AI Safety Research Agent and Tool Ecosystem Datalog Efficient and Sound Probabilistic Verification for AI Agents distributionally robust optimization