Entity · technique

Chain-of-Thought Fine-Tuning

techniqueactivechain-of-thought-fine-tuning-ebcb97eb·1 events·first seen May 26, 2026

Aliases: Chain-of-Thought Fine-Tuning

Co-occurring entities

BC Protocol Creative Quality Alignment (CQA)Zou LIMA Calibrated Surprise Xu

More like this (12)

fine-tuning Chain-of-Thought Self-Consistency behavioral fine-tuning Retrieval-Augmented Fine-Tuning Parameter-Efficient Fine-Tuning reinforcement fine-tuning Fine-tuning GPT-2 from Human Preferences chain-of-thought monitoring Language Model Finetuning malicious fine-tuning chain-of-thought prompting J-CoT: Chain-of-Thought in J-Space

Recent events (1)

4arXiv · cs.CL·May 26, 2026·source ↗

Creative Quality Alignment: Expert Tacit Knowledge Transfer via Chain-of-Thought Fine-Tuning

This paper empirically validates a creative quality metric from a companion work (Calibrated Surprise, Zou & Xu 2026a) under strict low-resource conditions: ~100 expert chain-of-thought annotations and a small base model. The authors introduce Creative Quality Alignment (CQA) as a class of engineering methods and identify a systematic bias in public alignment datasets toward craft knowledge, with weak coverage of audience modeling and reality-logic. A theoretical argument based on 'architectural duality' in single conditional distribution LLMs is offered to explain why so few examples suffice, distinguishing the result from purely empirical findings like LIMA.

Evaluation and Benchmarking Alignment and RLHF BC Protocol Creative Quality Alignment (CQA)Zou +4 more