Entity · technique

Knowledge Graph Random Walk

techniqueactiveknowledge-graph-random-walk-bef1aff1·1 events·first seen Jun 1, 2026

Aliases: Knowledge Graph Random Walk

Co-occurring entities

tiered distractors Long-context Reasoning Benchmarks Multi-hop Question Answering Reinforcement Learning with Verifiable Rewards Tiered Distractor Construction LongTraceRL Rubric Reward Tsinghua University KEG Lab

More like this (12)

Maximum Entropy Random Walk GraphWalks knowledge graph Monarch Knowledge Graph Multi-hop Graph Retrieval knowledge graph prompting temporal knowledge graph Achieving Precise Text-To-Cypher Via Grounded Knowledge Graph Data Generation Hierarchical Graph Memory Knowledge-Graph Grounding Helps LLMs Only for Out-of-Training Knowledge: A Controlled Study on Clinical Question Answering GLM-RAG: Graph Language Models for Graph-Based Retrieval-Augmented Generation LangGraph

Recent events (1)

6arXiv · cs.CL·Jun 1, 2026·source ↗

LongTraceRL: Reinforcement Learning for Long-Context Reasoning via Search Agent Trajectories and Rubric Rewards

LongTraceRL is a new RL training framework for improving long-context reasoning in LLMs, addressing limitations of existing RLVR methods. It constructs challenging training data using multi-hop questions from knowledge graph random walks and tiered distractors derived from search agent trajectories (high-confusability: read but uncited; low-confusability: seen but unopened). A rubric reward provides entity-level process supervision along reasoning chains, applied only to correct responses to prevent reward hacking. Experiments across three LLMs (4B–30B parameters) on five long-context benchmarks show consistent improvements over strong baselines.

Long Context Evolution Evaluation and Benchmarking tiered distractors Knowledge Graph Random Walk Long-context Reasoning Benchmarks +8 more