Entity · organization

Tsinghua University KEG Lab

organizationactivetsinghua-university-keg-lab-b39f8c0d·1 events·first seen Jun 1, 2026

Aliases: Tsinghua University KEG Lab

Co-occurring entities

tiered distractors Knowledge Graph Random Walk Long-context Reasoning Benchmarks Multi-hop Question Answering Reinforcement Learning with Verifiable Rewards Tiered Distractor Construction LongTraceRL Rubric Reward

More like this (12)

Tsinghua University Tianjin University NLP Lab Zhejiang University NLP Lab Peking University HKU MMLab Kyutai Labs Wang-ML-Lab UC Berkeley Sky Lab Yuan Lab AI iLearn-Lab Cheeseman Lab Tianjin University

Recent events (1)

6arXiv · cs.CL·Jun 1, 2026·source ↗

LongTraceRL: Reinforcement Learning for Long-Context Reasoning via Search Agent Trajectories and Rubric Rewards

LongTraceRL is a new RL training framework for improving long-context reasoning in LLMs, addressing limitations of existing RLVR methods. It constructs challenging training data using multi-hop questions from knowledge graph random walks and tiered distractors derived from search agent trajectories (high-confusability: read but uncited; low-confusability: seen but unopened). A rubric reward provides entity-level process supervision along reasoning chains, applied only to correct responses to prevent reward hacking. Experiments across three LLMs (4B–30B parameters) on five long-context benchmarks show consistent improvements over strong baselines.

Long Context Evolution Evaluation and Benchmarking tiered distractors Knowledge Graph Random Walk Long-context Reasoning Benchmarks +8 more