paper

On The Effectiveness-Fluency Trade-Off In LLM Conditioning: A Systematic Study

paperactiveprovisionalon-the-effectiveness-fluency-trade-off-in-llm-conditioning-a-systematic-study-dcfa5cf6·1 events·first seen 6d ago

Aliases: On The Effectiveness-Fluency Trade-Off In LLM Conditioning: A Systematic Study

More like this (12)

Leveraging Audio-LLMs to Filter Speech-to-Speech Training Data When English Isn't the Best Teacher: Source Language Effects in Cross-Lingual In-Context Learning Janus: A Benchmark for Goal-Conditioned Information Distortion in LLMs EDIT: Evidence-Diagnosed Intervention Training for Rule-Faithful LLM Grading PC Layer: Polynomial Weight Preconditioning for Improving LLM Pre-Training Be My Tutor: On-Policy Co-Distillation for Mutual LLM Improvement via Peer Feedback A sleep-like consolidation mechanism for LLMs ExpRL: Exploratory RL for LLM Mid-Training Attention Amnesia in Hybrid LLMs: When CoT Fine-Tuning Breaks Long-Range Recall, and How to Fix It Learning to Hear Hesitation: Continual Learning for Disfluency-Aware ASR Continual LLM Upcycling: A Predictor-Gated Bank-Wise Sparsity Training Recipe for Dense-to-Sparse LLMs Training LLMs to Enforce Multi-Level Instruction Hierarchies via Gravity-Weighted Direct Preference Optimization

Recent events (1)

5arXiv · cs.CL·6d ago·source ↗

Systematic study reveals effectiveness-fluency trade-offs in LLM conditioning methods

A new arXiv paper systematically evaluates a range of LLM conditioning methods across both concept injection and removal scenarios, finding that efficient steering methods often degrade fluency significantly. A key finding is that activation steering is substantially less effective on instruction-tuned models than on base models, a previously overlooked interaction. Simple prompting and supervised fine-tuning work for concept injection but not removal, and cheap textual metrics are found to correlate well with expensive LLM-as-judge evaluations.

Evaluation and Benchmarking Alignment and RLHF On The Effectiveness-Fluency Trade-Off In LLM Conditioning: A Systematic Study