Entity · technique

shielded reinforcement learning

techniqueactiveshielded-reinforcement-learning-116ea138·1 events·first seen Jun 12, 2026

Aliases: shielded reinforcement learning

Co-occurring entities

Reinforcement Learning Beyond Runtime Enforcement: Shield Synthesis as Defensibility Analysis for Adversarial Networks

More like this (12)

decoupled reinforcement learning Physics-EnhAnced Reinforcement Learning rule-based reinforcement learning rewards Reinforcement Learning for Code reinforcement learning from verifier feedback Active Offline-to-Online Reinforcement Learning Entropy-Regularized Reinforcement Learning sim-to-real reinforcement learning self-play reinforcement learning Holonomy Memory Reinforcement Learning Constrained Reinforcement Learning reinforcement learning with belief-state rewards

Recent events (1)

5arXiv · cs.LG·Jun 12, 2026·source ↗

Shield synthesis reframed as design-time defensibility analysis for adversarial network security games

A new arXiv preprint argues that shielded reinforcement learning's automata-theoretic machinery is better used as a design-time analytical tool than a runtime safety enforcer. The authors instantiate this via a two-player safety game for network defense, producing a 'defensibility verdict' — a formal certificate of whether a topology-specification pair can be defended — along with a 'defensibility fingerprint' combining formal safety properties and operational behavior under adaptive play. A what-if analysis reveals that formal defensibility and operational effectiveness are distinct dimensions: small architectural changes can shift operational outcomes dramatically while leaving formal safety margins nearly unchanged. The work reframes shield synthesis as an architectural analysis framework rather than a deployment mechanism.

Evaluation and Benchmarking AI Safety Research shielded reinforcement learning Reinforcement Learning Beyond Runtime Enforcement: Shield Synthesis as Defensibility Analysis for Adversarial Networks