Fugu-MT 論文翻訳(概要): KG-Hopper: Empowering Compact Open LLMs with Knowledge Graph Reasoning via Reinforcement Learning

論文の概要: KG-Hopper: Empowering Compact Open LLMs with Knowledge Graph Reasoning via Reinforcement Learning

arxiv url: http://arxiv.org/abs/2603.21440v1
Date: Sun, 22 Mar 2026 23:07:29 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-24 19:11:39.423299
Title: KG-Hopper: Empowering Compact Open LLMs with Knowledge Graph Reasoning via Reinforcement Learning
Title（参考訳）: KG-Hopper:強化学習による知識グラフ推論によるコンパクトオープンLLMの強化
Authors: Shuai Wang, Yinan Yu,
Abstract要約: 大きな言語モデル(LLM)は、印象的な自然言語能力を示すが、知識集約的な推論タスクにしばしば苦労する。 KG-Hopperは,マルチホップKG推論を行う機能を備えた,コンパクトなオープンLLMを実現する,新しい強化学習フレームワークである。我々は、KG-Hopperがより大規模なマルチステップシステム(最大70B)を一貫して上回り、プロプライエタリモデルとの競合性能を達成することを示す。
参考スコア（独自算出の注目度）: 9.329800077564673
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs) demonstrate impressive natural language capabilities but often struggle with knowledge-intensive reasoning tasks. Knowledge Base Question Answering (KBQA), which leverages structured Knowledge Graphs (KGs) exemplifies this challenge due to the need for accurate multi-hop reasoning. Existing approaches typically perform sequential reasoning steps guided by predefined pipelines, restricting flexibility and causing error cascades due to isolated reasoning at each step. To address these limitations, we propose KG-Hopper, a novel Reinforcement Learning (RL) framework that empowers compact open LLMs with the ability to perform integrated multi-hop KG reasoning within a single inference round. Rather than reasoning step-by-step, we train a Reasoning LLM that embeds the entire KG traversal and decision process into a unified ``thinking'' stage, enabling global reasoning over cross-step dependencies and dynamic path exploration with backtracking. Experimental results on eight KG reasoning benchmarks show that KG-Hopper, based on a 7B-parameter LLM, consistently outperforms larger multi-step systems (up to 70B) and achieves competitive performance with proprietary models such as GPT-3.5-Turbo and GPT-4o-mini, while remaining compact, open, and data-efficient. The code is publicly available at: https://github.com/Wangshuaiia/KG-Hopper.
Abstract（参考訳）: 大きな言語モデル(LLM)は、印象的な自然言語能力を示すが、知識集約的な推論タスクにしばしば苦労する。構造化知識グラフ(KG)を活用する知識ベース質問回答(KBQA)は、正確なマルチホップ推論の必要性から、この課題を実証している。既存のアプローチは通常、事前に定義されたパイプラインによってガイドされるシーケンシャルな推論ステップを実行し、柔軟性を制限し、各ステップで分離された推論のためにエラーカスケードを発生させる。これらの制約に対処するために,単一推論ラウンド内で統合マルチホップKG推論を行う機能を備えた,コンパクトなオープンLLMを実現する,新しい強化学習(RL)フレームワークであるKG-Hopperを提案する。ステップバイステップの推論よりも、KGのトラバースと決定プロセス全体を統合された‘思考’ステージに組み込んだReasoning LLMをトレーニングすることで、ステップ間の依存関係に対するグローバルな推論と、バックトラックによる動的パス探索を可能にします。 8つのKG推論ベンチマークによる実験結果から、KG-Hopperは7BパラメータのLLMをベースとして、より大規模なマルチステップシステム(70Bまで)を一貫して上回り、GPT-3.5-TurboやGPT-4o-miniといったプロプライエタリなモデルと競合する性能を保ちながら、コンパクトでオープンでデータ効率を保ちながら達成している。コードは、https://github.com/Wangshuaiia/KG-Hopper.comで公開されている。

論文の概要: KG-Hopper: Empowering Compact Open LLMs with Knowledge Graph Reasoning via Reinforcement Learning

関連論文リスト