Fugu-MT 論文翻訳(概要): KG-Reasoner: A Reinforced Model for End-to-End Multi-Hop Knowledge Graph Reasoning

論文の概要: KG-Reasoner: A Reinforced Model for End-to-End Multi-Hop Knowledge Graph Reasoning

arxiv url: http://arxiv.org/abs/2604.12487v1
Date: Tue, 14 Apr 2026 09:14:21 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-15 19:11:32.367773
Title: KG-Reasoner: A Reinforced Model for End-to-End Multi-Hop Knowledge Graph Reasoning
Title（参考訳）: KG-Reasoner:マルチホップ知識グラフ推論のための強化モデル
Authors: Shuai Wang, Yinan Yu,
Abstract要約: KG-Reasonerは、マルチステップ推論をReasoning LLMの統一された「思考」フェーズに統合するエンドツーエンドフレームワークである。 8つのマルチホップおよび知識集約推論ベンチマークの実験は、KG-Reasonerが競争力または優れた性能を達成することを示す。
参考スコア（独自算出の注目度）: 9.329800077564673
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs) exhibit strong abilities in natural language understanding and generation, yet they struggle with knowledge-intensive reasoning. Structured Knowledge Graphs (KGs) provide an effective form of external knowledge representation and have been widely used to enhance performance in classical Knowledge Base Question Answering (KBQA) tasks. However, performing precise multi-hop reasoning over KGs for complex queries remains highly challenging. Most existing approaches decompose the reasoning process into a sequence of isolated steps executed through a fixed pipeline. While effective to some extent, such designs constrain reasoning flexibility and fragment the overall decision process, often leading to incoherence and the loss of critical intermediate information from earlier steps. In this paper, we introduce KG-Reasoner, an end-to-end framework that integrates multi-step reasoning into a unified "thinking" phase of a Reasoning LLM. Through Reinforcement Learning (RL), the LLM is trained to internalize the KG traversal process, enabling it to dynamically explore reasoning paths, and perform backtracking when necessary. Experiments on eight multi-hop and knowledge-intensive reasoning benchmarks demonstrate that KG-Reasoner achieves competitive or superior performance compared to the state-of-the-art methods. Codes are available at the repository: https://github.com/Wangshuaiia/KG-Reasoner.
Abstract（参考訳）: 大規模言語モデル(LLM)は、自然言語の理解と生成において強力な能力を示すが、知識集約的な推論に苦しむ。構造化知識グラフ(KG)は、外部知識表現の効果的な形式を提供し、古典的知識ベース質問回答(KBQA)タスクのパフォーマンス向上に広く利用されている。しかし、複雑なクエリに対してKGに対して正確なマルチホップ推論を実行することは、依然として非常に困難である。既存のアプローチのほとんどは、推論プロセスを、固定パイプラインを通して実行される一連の独立したステップに分解する。ある程度は効果があるが、そのような設計は推論の柔軟性を制限し、全体的な決定過程を断片化する。本稿では、マルチステップ推論をReasoning LLMの統一的な「思考」フェーズに統合する、エンドツーエンドフレームワークであるKG-Reasonerを紹介する。強化学習(Reinforcement Learning, RL)を通じて、LLMはKGトラバーサルプロセスの内部化を訓練し、推論パスを動的に探索し、必要に応じてバックトラックを実行することができる。 8つのマルチホップおよび知識集約的推論ベンチマークの実験は、KG-Reasonerが最先端の手法と比較して、競争力や優れた性能を達成することを示した。コードは https://github.com/Wangshuaiia/KG-Reasoner.com で公開されている。

関連論文リスト

KG-Hopper: Empowering Compact Open LLMs with Knowledge Graph Reasoning via Reinforcement Learning [9.329800077564673]
大きな言語モデル(LLM)は、印象的な自然言語能力を示すが、知識集約的な推論タスクにしばしば苦労する。 KG-Hopperは,マルチホップKG推論を行う機能を備えた,コンパクトなオープンLLMを実現する,新しい強化学習フレームワークである。我々は、KG-Hopperがより大規模なマルチステップシステム(最大70B)を一貫して上回り、プロプライエタリモデルとの競合性能を達成することを示す。
論文参考訳（メタデータ） (2026-03-22T23:07:29Z)
ProgRAG: Hallucination-Resistant Progressive Retrieval and Reasoning over Knowledge Graphs [2.9539912037183362]
大きな言語モデル(LLM)は強い推論能力を示すが、幻覚と限られた透明性に苦しむ。本稿では,複雑な質問をサブクエストに分解し,部分的推論経路を拡張するマルチホップ知識グラフ質問応答(KGQA)フレームワークであるProgRAGを提案する。 3つのよく知られたデータセットの実験により、ProgRAGはマルチホップKGQAで既存のベースラインを上回っていることが示された。
論文参考訳（メタデータ） (2025-11-13T12:14:36Z)
Graph-constrained Reasoning: Faithful Reasoning on Knowledge Graphs with Large Language Models [92.71304585906624]
大規模言語モデル(LLM)は知識ギャップと幻覚のために忠実な推論に苦しむ。グラフ制約推論(GCR)は、KGにおける構造的知識とLLMにおける非構造的推論を橋渡しする新しいフレームワークである。 GCRは最先端のパフォーマンスを達成し、追加のトレーニングをすることなく、見えないKGに対して強力なゼロショット一般化性を示す。
論文参考訳（メタデータ） (2024-10-16T22:55:17Z)
GIVE: Structured Reasoning of Large Language Models with Knowledge Graph Inspired Veracity Extrapolation [108.2008975785364]
Graph Inspired Veracity Extrapolation (GIVE)は、パラメトリックメモリと非パラメトリックメモリを融合して、最小の外部入力で正確な推論を改善する新しい推論手法である。 GIVE は LLM エージェントをガイドして,最も関連する専門家データ (observe) を選択し,クエリ固有の発散思考 (reflect) に従事し,その情報を合成して最終的な出力 (speak) を生成する。
論文参考訳（メタデータ） (2024-10-11T03:05:06Z)
FiDeLiS: Faithful Reasoning in Large Language Model for Knowledge Graph Question Answering [46.41364317172677]
大規模言語モデル(LLM)は、しばしば誤ったあるいは幻覚的な応答を生成することで挑戦される。本稿では,知識グラフから得られた検証可能な推論ステップに回答を固定することで,LLM応答の事実性を改善するための統合フレームワークFiDeLiSを提案する。トレーニング不要のフレームワークである本手法は,性能の向上だけでなく,異なるベンチマークにおける現実性や解釈可能性の向上にも寄与する。
論文参考訳（メタデータ） (2024-05-22T17:56:53Z)
Reasoning on Graphs: Faithful and Interpretable Large Language Model Reasoning [104.92384929827776]
大規模言語モデル(LLM)は複雑なタスクにおいて顕著な推論能力を示している。彼らは推論中に最新の知識と幻覚を欠いている。知識グラフ(KG)は、推論のための信頼できる知識源を提供する。
論文参考訳（メタデータ） (2023-10-02T10:14:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。