論文の概要: Learning to Walk with Dual Agents for Knowledge Graph Reasoning
- arxiv url: http://arxiv.org/abs/2112.12876v1
- Date: Thu, 23 Dec 2021 23:03:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-28 16:05:05.074110
- Title: Learning to Walk with Dual Agents for Knowledge Graph Reasoning
- Title(参考訳): 知識グラフ推論のためのデュアルエージェントを用いた歩行学習
- Authors: Denghui Zhang, Zixuan Yuan, Hao Liu, Xiaodong Lin, Hui Xiong
- Abstract要約: マルチホップ推論アプローチは、短い推論パスでのみうまく機能し、パスの長さが増加するとターゲットエンティティを見逃しがちである。
そこで我々は,2つのエージェント(GIANTとDWARF)が共同でKGの上を歩き,協調して回答を検索するように訓練する,二重エージェント強化学習フレームワークを提案する。
提案手法は,クラスタレベルの経路を素早く探索するエージェント(GIANT)の1つを割り当て,別のエージェント(DWARF)にステージワイドヒントを提供することによって,長い経路における推論課題に対処する。
- 参考スコア(独自算出の注目度): 20.232810842082674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graph walking based on reinforcement learning (RL) has shown great success in
navigating an agent to automatically complete various reasoning tasks over an
incomplete knowledge graph (KG) by exploring multi-hop relational paths.
However, existing multi-hop reasoning approaches only work well on short
reasoning paths and tend to miss the target entity with the increasing path
length. This is undesirable for many reason-ing tasks in real-world scenarios,
where short paths connecting the source and target entities are not available
in incomplete KGs, and thus the reasoning performances drop drastically unless
the agent is able to seek out more clues from longer paths. To address the
above challenge, in this paper, we propose a dual-agent reinforcement learning
framework, which trains two agents (GIANT and DWARF) to walk over a KG jointly
and search for the answer collaboratively. Our approach tackles the reasoning
challenge in long paths by assigning one of the agents (GIANT) searching on
cluster-level paths quickly and providing stage-wise hints for another agent
(DWARF). Finally, experimental results on several KG reasoning benchmarks show
that our approach can search answers more accurately and efficiently, and
outperforms existing RL-based methods for long path queries by a large margin.
- Abstract(参考訳): 強化学習(RL)に基づくグラフウォーキングは,マルチホップリレーショナルパスを探索することにより,不完全知識グラフ(KG)上の様々な推論タスクを自動的に完了するエージェントのナビゲートに成功している。
しかし、既存のマルチホップ推論アプローチは短い推論経路でのみうまく機能し、経路長が増加すると対象エンティティを見逃してしまう傾向にある。
これは、ソースとターゲットエンティティを繋ぐ短いパスが不完全なkgsでは利用できない現実のシナリオでは、多くの推論タスクでは望ましくないため、エージェントが長い経路からより多くの手がかりを探さない限り、推論のパフォーマンスは劇的に低下する。
この課題に対処するため,本論文では,2人のエージェント(GIANTとDWARF)が共同でKGの上を歩き,協調して回答を探索する,二重エージェント強化学習フレームワークを提案する。
提案手法は,クラスタレベルの経路を素早く探索するエージェント(GIANT)の1つを割り当て,別のエージェント(DWARF)にステージワイドヒントを提供することによって,長い経路における推論課題に対処する。
最後に,いくつかのKG推論ベンチマークによる実験結果から,提案手法はより正確かつ効率的に解を探索できることを示すとともに,従来のRLに基づく長経路探索法よりも大きなマージンで優れていた。
関連論文リスト
- Talk to Right Specialists: Routing and Planning in Multi-agent System for Question Answering [47.29580414645626]
RopMuraは、複数の知識ベースを統一的なRAGベースのエージェントに統合する、新しいマルチエージェントシステムである。
RopMuraには2つの重要なコンポーネントがある。知識境界に基づいて最も関連性の高いエージェントをインテリジェントに選択するルータと、複雑なマルチホップクエリを管理可能なステップに分解するプランナだ。
論文 参考訳(メタデータ) (2025-01-14T03:25:26Z) - Multi-Agent Target Assignment and Path Finding for Intelligent Warehouse: A Cooperative Multi-Agent Deep Reinforcement Learning Perspective [6.148164795916424]
多エージェント目標割り当てと経路計画(TAPF)はインテリジェントウェアハウスにおける2つの重要な問題である。
協調型多エージェント深層強化学習(RL)の観点から目標の割り当てと経路計画を同時に解く方法を提案する。
実験結果から,本手法は様々なタスク設定において良好に動作することが示された。
論文 参考訳(メタデータ) (2024-08-25T07:32:58Z) - Walk Wisely on Graph: Knowledge Graph Reasoning with Dual Agents via Efficient Guidance-Exploration [6.137115941053124]
階層的強化学習(HRL)に基づく二重エージェントを用いたマルチホップ推論モデルを提案する。
FULORAは、二重エージェント間のeFficient GUidance-ExpLORAtionによる上記の推論課題に取り組む。
3つの実単語知識グラフデータセットで実施された実験では、FULORAがRLベースのベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2024-08-03T23:15:57Z) - FiDeLiS: Faithful Reasoning in Large Language Model for Knowledge Graph Question Answering [46.41364317172677]
大規模言語モデル(LLM)は、しばしば誤応答や幻覚応答を発生させることによって挑戦される。
我々は,KGから検索した検証可能な推論ステップに回答をアンカーすることで,LLM応答の事実性を改善するための統合フレームワークFiDeLiSを提案する。
論文 参考訳(メタデータ) (2024-05-22T17:56:53Z) - PathFinder: Guided Search over Multi-Step Reasoning Paths [80.56102301441899]
木探索に基づく推論経路生成手法であるPathFinderを提案する。
動的デコードの統合により、多様な分岐とマルチホップ推論を強化する。
我々のモデルは、大きな分岐因子を持つビームサーチに類似した複雑さを反映して、よく、長く、目に見えない推論連鎖を一般化する。
論文 参考訳(メタデータ) (2023-12-08T17:05:47Z) - Monte-Carlo Tree Search for Multi-Agent Pathfinding: Preliminary Results [60.4817465598352]
マルチエージェントパスフィンディングに適したモンテカルロ木探索(MCTS)のオリジナル版を紹介する。
具体的には,エージェントの目標達成行動を支援するために,個別の経路を用いる。
また,木探索手順の分岐係数を低減するために,専用の分解手法を用いる。
論文 参考訳(メタデータ) (2023-07-25T12:33:53Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - SQUIRE: A Sequence-to-sequence Framework for Multi-hop Knowledge Graph
Reasoning [21.53970565708247]
トリプルクエリを与えられたマルチホップ推論タスクは、推論プロセスを示す明確なパスを提供することを目的としている。
SQUIREはSequence-to-Sequenceベースのマルチホップ推論フレームワークである。
論文 参考訳(メタデータ) (2022-01-17T04:22:54Z) - Distributed Heuristic Multi-Agent Path Finding with Communication [7.854890646114447]
大規模ロボットシステムにはMAPF(Multi-Agent Path Finding)が不可欠である。
近年,部分観測可能な環境下での分散警察の学習に強化学習(RL)を適用している。
本稿では,深層学習とコミュニケーションを組み合わせることで,MAPFの新たな学習手法を提案する。
論文 参考訳(メタデータ) (2021-06-21T18:50:58Z) - Meta Reinforcement Learning with Autonomous Inference of Subtask
Dependencies [57.27944046925876]
本稿では,タスクがサブタスクグラフによって特徴づけられるような,新しい数発のRL問題を提案し,対処する。
メタ政治を直接学習する代わりに、Subtask Graph Inferenceを使ったメタラーナーを開発した。
実験の結果,2つのグリッドワールド領域とStarCraft II環境において,提案手法が潜在タスクパラメータを正確に推定できることが確認された。
論文 参考訳(メタデータ) (2020-01-01T17:34:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。