Entity · technique

TunerDiT

techniqueactivetunerdit-2da23f43·1 events·first seen Jun 1, 2026

Aliases: TunerDiT

Co-occurring entities

Meve Event-Partitioned Masking Cross-Event Prompt Fusion Linear Diffusion Transformer

More like this (12)

DiT TuneJury DiT-XL PixelDiT-XL Frontier Tuning DeiT Prefix Tuning SD-Turbo DiT-Reward PatchTSMixer TTT-Discover TTT-Discover

Recent events (1)

5arXiv · cs.AI·Jun 1, 2026·source ↗

TunerDiT: Training-free Progressive Steering of Diffusion Transformers for Multi-Event Video Generation

TunerDiT is a training-free method for steering video diffusion transformers (DiTs) to generate long-horizon videos containing multiple sequential events. The approach identifies intrinsic turning points in the DiT denoising trajectory where text conditioning shifts from global layout to fine-grained detail, then applies two steering mechanisms: Event-Partitioned Masking and Cross-Event Prompt Fusion. The authors also introduce Meve, a benchmark prompt suite for multi-event video generation, and report state-of-the-art results across 8 metrics with improved text alignment scaling with event count.

Evaluation and Benchmarking Inference Economics Meve TunerDiT Event-Partitioned Masking +3 more