Entity · technique

Denoising Diffusion Policy Optimization

techniqueactivedenoising-diffusion-policy-optimization-c401f75b·1 events·first seen May 19, 2026

Aliases: Denoising Diffusion Policy Optimization

Co-occurring entities

DDPO Stable Diffusion 3 Hugging Face TRL

More like this (12)

Denoising Diffusion Probabilistic Models diffusion-based policy Beyond Fully Random Masking: Attention-Guided Denoising and Optimization for Diffusion Language Models Ambient Diffusion Policy Diffusion Policy Divergence Regularized Policy Optimization Kolmogorov Regression for Robust Diffusion Policies Proximal Policy Optimization On-Policy Distillation (OPD)Pareto Optimal Policy Optimization Vector Policy Optimization diffusion-based inpainting

Recent events (1)

5Hugging Face Blog·May 19, 2026·source ↗

Finetune Stable Diffusion Models with DDPO via TRL

Hugging Face's TRL library adds support for DDPO (Denoising Diffusion Policy Optimization), enabling reinforcement learning-based finetuning of Stable Diffusion models. This extends TRL's RLHF tooling beyond language models to image generation, allowing reward-driven optimization of diffusion models. The post demonstrates practical usage of the new DDPO trainer within the TRL ecosystem.

Agent and Tool Ecosystem Alignment and RLHF DDPO Denoising Diffusion Policy Optimization Stable Diffusion 3 +3 more