論文の概要: KG-Hopper: Empowering Compact Open LLMs with Knowledge Graph Reasoning via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2603.21440v1
- Date: Sun, 22 Mar 2026 23:07:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.423299
- Title: KG-Hopper: Empowering Compact Open LLMs with Knowledge Graph Reasoning via Reinforcement Learning
- Title(参考訳): KG-Hopper:強化学習による知識グラフ推論によるコンパクトオープンLLMの強化
- Authors: Shuai Wang, Yinan Yu,
- Abstract要約: 大きな言語モデル(LLM)は、印象的な自然言語能力を示すが、知識集約的な推論タスクにしばしば苦労する。
KG-Hopperは,マルチホップKG推論を行う機能を備えた,コンパクトなオープンLLMを実現する,新しい強化学習フレームワークである。
我々は、KG-Hopperがより大規模なマルチステップシステム(最大70B)を一貫して上回り、プロプライエタリモデルとの競合性能を達成することを示す。
- 参考スコア(独自算出の注目度): 9.329800077564673
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) demonstrate impressive natural language capabilities but often struggle with knowledge-intensive reasoning tasks. Knowledge Base Question Answering (KBQA), which leverages structured Knowledge Graphs (KGs) exemplifies this challenge due to the need for accurate multi-hop reasoning. Existing approaches typically perform sequential reasoning steps guided by predefined pipelines, restricting flexibility and causing error cascades due to isolated reasoning at each step. To address these limitations, we propose KG-Hopper, a novel Reinforcement Learning (RL) framework that empowers compact open LLMs with the ability to perform integrated multi-hop KG reasoning within a single inference round. Rather than reasoning step-by-step, we train a Reasoning LLM that embeds the entire KG traversal and decision process into a unified ``thinking'' stage, enabling global reasoning over cross-step dependencies and dynamic path exploration with backtracking. Experimental results on eight KG reasoning benchmarks show that KG-Hopper, based on a 7B-parameter LLM, consistently outperforms larger multi-step systems (up to 70B) and achieves competitive performance with proprietary models such as GPT-3.5-Turbo and GPT-4o-mini, while remaining compact, open, and data-efficient. The code is publicly available at: https://github.com/Wangshuaiia/KG-Hopper.
- Abstract(参考訳): 大きな言語モデル(LLM)は、印象的な自然言語能力を示すが、知識集約的な推論タスクにしばしば苦労する。
構造化知識グラフ(KG)を活用する知識ベース質問回答(KBQA)は、正確なマルチホップ推論の必要性から、この課題を実証している。
既存のアプローチは通常、事前に定義されたパイプラインによってガイドされるシーケンシャルな推論ステップを実行し、柔軟性を制限し、各ステップで分離された推論のためにエラーカスケードを発生させる。
これらの制約に対処するために,単一推論ラウンド内で統合マルチホップKG推論を行う機能を備えた,コンパクトなオープンLLMを実現する,新しい強化学習(RL)フレームワークであるKG-Hopperを提案する。
ステップバイステップの推論よりも、KGのトラバースと決定プロセス全体を統合された‘思考’ステージに組み込んだReasoning LLMをトレーニングすることで、ステップ間の依存関係に対するグローバルな推論と、バックトラックによる動的パス探索を可能にします。
8つのKG推論ベンチマークによる実験結果から、KG-Hopperは7BパラメータのLLMをベースとして、より大規模なマルチステップシステム(70Bまで)を一貫して上回り、GPT-3.5-TurboやGPT-4o-miniといったプロプライエタリなモデルと競合する性能を保ちながら、コンパクトでオープンでデータ効率を保ちながら達成している。
コードは、https://github.com/Wangshuaiia/KG-Hopper.comで公開されている。
関連論文リスト
- KG-o1: Enhancing Multi-hop Question Answering in Large Language Models via Knowledge Graph Integration [29.320693000484273]
KG-o1は、知識グラフを統合して、大規模言語モデルのマルチホップ推論能力を高める4段階のアプローチである。
簡単な2つのデータセットと複雑な2つのデータセットについて実験を行う。
その結果,KG-o1 モデルでは既存の LRM モデルと比較して,全タスクにおいて優れた性能を示した。
論文 参考訳(メタデータ) (2025-08-12T04:29:10Z) - Knowledge Graph-extended Retrieval Augmented Generation for Question Answering [10.49712834719005]
本稿では,Large Language Models (LLMs) とKGs (KGs) を統合するシステムを提案する。
結果として得られるアプローチは、KGを持つ検索拡張生成(RAG)の特定の形式に分類される。
質問分解モジュールを含み、マルチホップ情報検索と回答可能性を高める。
論文 参考訳(メタデータ) (2025-04-11T18:03:02Z) - LightPROF: A Lightweight Reasoning Framework for Large Language Model on Knowledge Graph [57.382255728234064]
大きな言語モデル(LLM)は、テキスト理解とゼロショット推論において素晴らしい能力を持っている。
知識グラフ(KG)は、LLMの推論プロセスに対して、リッチで信頼性の高いコンテキスト情報を提供する。
我々は、KGQA(LightPROF)のための新しい軽量で効率的なPrompt Learning-ReasOning Frameworkを提案する。
論文 参考訳(メタデータ) (2025-04-04T03:03:47Z) - Decoding on Graphs: Faithful and Sound Reasoning on Knowledge Graphs through Generation of Well-Formed Chains [66.55612528039894]
知識グラフ(KG)は質問応答(QA)のための信頼できる知識ソースとして機能する。
我々は、LLMとKGの深い相乗効果を促進する新しいフレームワークであるDoG(Decoding on Graphs)を提案する。
様々なKGQAタスクに対して異なるバックグラウンドKGを用いた実験により、DoGが優れた、堅牢なパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-10-24T04:01:40Z) - Graph-constrained Reasoning: Faithful Reasoning on Knowledge Graphs with Large Language Models [92.71304585906624]
大規模言語モデル(LLM)は知識ギャップと幻覚のために忠実な推論に苦しむ。
グラフ制約推論(GCR)は、KGにおける構造的知識とLLMにおける非構造的推論を橋渡しする新しいフレームワークである。
GCRは最先端のパフォーマンスを達成し、追加のトレーニングをすることなく、見えないKGに対して強力なゼロショット一般化性を示す。
論文 参考訳(メタデータ) (2024-10-16T22:55:17Z) - FiDeLiS: Faithful Reasoning in Large Language Model for Knowledge Graph Question Answering [46.41364317172677]
大規模言語モデル(LLM)は、しばしば誤ったあるいは幻覚的な応答を生成することで挑戦される。
本稿では,知識グラフから得られた検証可能な推論ステップに回答を固定することで,LLM応答の事実性を改善するための統合フレームワークFiDeLiSを提案する。
トレーニング不要のフレームワークである本手法は,性能の向上だけでなく,異なるベンチマークにおける現実性や解釈可能性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-05-22T17:56:53Z) - Reasoning on Graphs: Faithful and Interpretable Large Language Model
Reasoning [104.92384929827776]
大規模言語モデル(LLM)は複雑なタスクにおいて顕著な推論能力を示している。
彼らは推論中に最新の知識と幻覚を欠いている。
知識グラフ(KG)は、推論のための信頼できる知識源を提供する。
論文 参考訳(メタデータ) (2023-10-02T10:14:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。