Fugu-MT 論文翻訳(概要): Bounded Path Context: A Controlled Study of Visible Path History in LLM-Based Knowledge Graph Question Answering

論文の概要: Bounded Path Context: A Controlled Study of Visible Path History in LLM-Based Knowledge Graph Question Answering

arxiv url: http://arxiv.org/abs/2605.26645v1
Date: Tue, 26 May 2026 07:29:04 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-27 17:51:41.728338
Title: Bounded Path Context: A Controlled Study of Visible Path History in LLM-Based Knowledge Graph Question Answering
Title（参考訳）: 境界経路文脈:LLMに基づく知識グラフ質問応答における可視経路履歴の制御に関する研究
Authors: Xihang Shan, Ye Luo,
Abstract要約: 境界パスコンテキスト(BPC)は、回答抽出と監査のためのシンボルメモリの完全なパスを分離する。コントロールされた K 上のスイープは、有界歴史がフルヒストリーのプロンプトと一致するか、あるいは超えていることを示している。 4Bスケールでは、K=1は両方のベンチマークで最強の設定である。
参考スコア（独自算出の注目度）: 4.528144562342186
License: http://creativecommons.org/licenses/by/4.0/
Abstract: LLM-based knowledge-graph question answering (KGQA) delegates graph traversal to language models, turning each question into a sequence of local relation-selection decisions repeated across beams and hops. A common but untested default is to serialize the complete partial path into every routing prompt, even though the controller already maintains this path as exact symbolic state. Bounded Path Context (BPC) decouples these two roles: the controller retains full paths in symbolic memory for answer extraction and audit, while the relation-selection prompt exposes only the question, the current entity, outgoing relation candidates, and at most the last K hops. A controlled sweep over K -- fixing graph neighborhoods, beam budget, depth, decoding, and answer-extraction format -- shows that bounded histories match or exceed full-history prompting on complete WebQSP and CWQ test sets with Qwen3.5-9B-AWQ: K=1 achieves 0.487 answer-set F1 on WebQSP versus 0.472 for full history, and K=0 reaches 0.287 on CWQ versus 0.274, with 9.7% and 12.1% fewer input tokens respectively. At the 4B scale, K=1 remains the strongest setting on both benchmarks. Per-example analysis reveals that 71-84% of examples are unaffected by history length, while the affected cases expose when prior hops disambiguate versus distract. These results suggest that path serialization length is better treated as a tunable interface variable than as a default assumption in LLM-based graph controllers.
Abstract（参考訳）: LLMベースの知識グラフ質問応答(KGQA)は、グラフトラバースを言語モデルに委譲し、各質問をビームとホップをまたいだ局所的な関係選択決定のシーケンスに変換する。一般的にテストされていないデフォルトは、すべてのルーティングプロンプトに完全な部分パスをシリアライズすることである。 BPC(Bunded Path Context)は2つの役割を分離する: コントローラは答えの抽出と監査のためにシンボルメモリの完全なパスを保持し、リレーショナルセレクションプロンプトは質問、現在のエンティティ、発信する関係候補、そしてほとんどの最後のKホップのみを公開する。 K = 1 は完全な WebQSP に対して 0.487 の回答セット F1 を獲得し、K=0 は CWQ 対 0.274 で 0.287 に達し、それぞれ 9.7% と 12.1% の少ない入力トークンを持つ。 4Bスケールでは、K=1は両方のベンチマークで最強の設定である。サンプルごとの分析では、71～84%のサンプルが歴史によって影響を受けていないのに対し、前回のホップが違和感と気を散らすと、影響を受けるケースが露出することがわかった。これらの結果から,パスシリアライゼーション長は LLM ベースのグラフコントローラの既定の仮定よりもチューニング可能なインタフェース変数として扱えることが示唆された。

関連論文リスト

RFKG-CoT: Relation-Driven Adaptive Hop-count Selection and Few-Shot Path Guidance for Knowledge-Aware QA [21.760917997629317]
大規模言語モデル(LLM)は、パラメトリックな知識制限のため、知識集約型QAにおいて幻覚を引き起こすことが多い。剛性ホップ数セレクタをリレーショナル・アダプティブ・ホップ数セレクタに置き換えるRFKG-CoTを提案する。 4つのKGQAベンチマークの実験では、RFKG-CoTはKG-CoTよりも14.7 pp (Llama2-7B on WebQSP)の精度が向上した。
論文参考訳（メタデータ） (2025-12-17T09:14:08Z)
KBQA-R1: Reinforcing Large Language Models for Knowledge Base Question Answering [64.62317305868264]
テキスト模倣から強化学習によるインタラクション最適化へパラダイムをシフトするフレームワークである textbfKBQA-R1 を提案する。 KBQAを多ターン決定プロセスとして扱うことで,行動のリストを用いて知識ベースをナビゲートすることを学ぶ。 WebQSP、GrailQA、GraphQuestionsの実験では、KBQA-R1が最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (2025-12-10T17:45:42Z)
Efficient Multi-Hop Question Answering over Knowledge Graphs via LLM Planning and Embedding-Guided Search [2.744879848686032]
知識グラフに答えるマルチホップ問題はまだ計算が難しい。最近のアプローチでは、エンティティリンクとパスランキングの両方において、高価なLarge Language Model (LLM) の推論に依存している。効率性と妥当性の両方に対処する2つの相補的ハイブリッドアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-11-24T19:27:56Z)
Datarus-R1: An Adaptive Multi-Step Reasoning LLM for Automated Data Analysis [0.0]
本稿では,Qwen 2.5-14B-Instructの言語モデルであるDatarus-R1-14Bを提案する。 Datarusは、独立した問合せペアではなく、推論ステップ、コード実行、エラートレース、自己補正、最終的な結論を含む完全な分析トラジェクトリに基づいて訓練されている。
論文参考訳（メタデータ） (2025-08-18T21:58:18Z)
Pathformer: Recursive Path Query Encoding for Complex Logical Query Answering [20.521886749524814]
木のような計算グラフ,すなわちクエリツリーをベースとした,Pathformerと呼ばれるニューラルネットワークによる一点埋め込み手法を提案する。具体的には、Pathformerはクエリ計算ツリーを分岐によってパスクエリシーケンスに分解する。これにより、Pathformerは将来のコンテキスト情報を完全に活用して、パスクエリの様々な部分間の複雑な相互作用を明示的にモデル化することができる。
論文参考訳（メタデータ） (2024-06-21T06:02:58Z)
Open-Set Knowledge-Based Visual Question Answering with Inference Paths [79.55742631375063]
知識に基づく視覚的質問回答(KB-VQA)の目的は、外部知識ベースの助けを借りて質問に対する正しい回答を提供することである。 KB-VQA, Graph pATH ranker (GATHER for brevity) の新しいレトリバーランカパラダイムを提案する。具体的には、グラフの構築、プルーニング、パスレベルのランク付けが含まれており、正確な回答を検索するだけでなく、推論パスを提供して推論プロセスを説明する。
論文参考訳（メタデータ） (2023-10-12T09:12:50Z)
Single Sequence Prediction over Reasoning Graphs for Multi-hop QA [8.442412179333205]
局所推論グラフ(モデル)フットノートコード/モデル上での単一シーケンス予測手法を提案する。グラフニューラルネットワークを用いて、このグラフ構造を符号化し、結果の表現をモデルのエンティティ表現に融合する。実験の結果, 正確なマッチング/F1のスコアと, 推論経路におけるグラウンドの忠実度は有意に向上した。
論文参考訳（メタデータ） (2023-07-01T13:15:09Z)
UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文参考訳（メタデータ） (2022-12-02T04:08:09Z)
DecAF: Joint Decoding of Answers and Logical Forms for Question Answering over Knowledge Bases [81.19499764899359]
本稿では,論理形式と直解の両方を共同で生成する新しいフレームワークDecAFを提案する。 DecAFはWebQSP、FreebaseQA、GrailQAベンチマークで新しい最先端の精度を実現している。
論文参考訳（メタデータ） (2022-09-30T19:51:52Z)
Few-shot Reranking for Multi-hop QA via Language Model Prompting [56.454088569241534]
オープンドメイン質問を用いたマルチホップQAにおける数点のリランクについて検討した。本稿では,マルチホップパスの再ランク付けを促す大規模言語モデルに依存するPromptRankを提案する。 PromptRankは、HotpotQA上で128のトレーニング例で強力な検索性能を得る。
論文参考訳（メタデータ） (2022-05-25T10:45:55Z)
Learning to Ask Conversational Questions by Optimizing Levenshtein Distance [83.53855889592734]
明示的な編集動作によって最小レベンシュテイン距離(MLD)を最適化する強化反復シーケンス編集(RISE)フレームワークを導入する。 RISEは会話の特徴に関連するトークンに注意を払うことができる。 2つのベンチマークデータセットの実験結果から、RISEは最先端の手法を大幅に上回っていることがわかった。
論文参考訳（メタデータ） (2021-06-30T08:44:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。