Entity · technique

Preference Coordinated Multi-agent Policy Optimization

techniqueactivepreference-coordinated-multi-agent-policy-optimization-ab98f69f·1 events·first seen Jun 15, 2026

Aliases: Preference Coordinated Multi-agent Policy Optimization

More like this (12)

APPO: Agentic Procedural Policy Optimization Role-Aware Policy Optimization Pareto Optimal Policy Optimization multi-agent cooperative framework Proximal Policy Optimization multi-agent coordination Vector Policy Optimization Hierarchical Relative Policy Optimization Reward Modeling for Multi-Agent Orchestration GraphPO: Graph-based Policy Optimization for Reasoning Models Bayesian Multiobjective Optimization Collaborative Human-Agent Protocol

Recent events (1)

4arXiv · cs.AI·Jun 15, 2026·source ↗

PCMA: Learning coordinated agent-specific preferences for multi-objective multi-agent RL

A new arXiv preprint introduces Preference Coordinated Multi-agent Policy Optimization (PCMA), a method for cooperative multi-objective multi-agent reinforcement learning (MOMARL) that learns agent-specific preferences to enable complementary trade-offs across agents. The authors formulate cooperative MOMARL as a team-optimal game and provide a first-order improvement decomposition showing that preference diversity can induce team improvement. Experiments on cooperative MOMA environments and a traffic-control scenario demonstrate improvements in both performance and trade-off coordination.

Agent and Tool Ecosystem Preference Coordinated Multi-agent Policy Optimization