論文の概要: Learning to Walk with Dual Agents for Knowledge Graph Reasoning
- arxiv url: http://arxiv.org/abs/2112.12876v1
- Date: Thu, 23 Dec 2021 23:03:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-28 16:05:05.074110
- Title: Learning to Walk with Dual Agents for Knowledge Graph Reasoning
- Title(参考訳): 知識グラフ推論のためのデュアルエージェントを用いた歩行学習
- Authors: Denghui Zhang, Zixuan Yuan, Hao Liu, Xiaodong Lin, Hui Xiong
- Abstract要約: マルチホップ推論アプローチは、短い推論パスでのみうまく機能し、パスの長さが増加するとターゲットエンティティを見逃しがちである。
そこで我々は,2つのエージェント(GIANTとDWARF)が共同でKGの上を歩き,協調して回答を検索するように訓練する,二重エージェント強化学習フレームワークを提案する。
提案手法は,クラスタレベルの経路を素早く探索するエージェント(GIANT)の1つを割り当て,別のエージェント(DWARF)にステージワイドヒントを提供することによって,長い経路における推論課題に対処する。
- 参考スコア(独自算出の注目度): 20.232810842082674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graph walking based on reinforcement learning (RL) has shown great success in
navigating an agent to automatically complete various reasoning tasks over an
incomplete knowledge graph (KG) by exploring multi-hop relational paths.
However, existing multi-hop reasoning approaches only work well on short
reasoning paths and tend to miss the target entity with the increasing path
length. This is undesirable for many reason-ing tasks in real-world scenarios,
where short paths connecting the source and target entities are not available
in incomplete KGs, and thus the reasoning performances drop drastically unless
the agent is able to seek out more clues from longer paths. To address the
above challenge, in this paper, we propose a dual-agent reinforcement learning
framework, which trains two agents (GIANT and DWARF) to walk over a KG jointly
and search for the answer collaboratively. Our approach tackles the reasoning
challenge in long paths by assigning one of the agents (GIANT) searching on
cluster-level paths quickly and providing stage-wise hints for another agent
(DWARF). Finally, experimental results on several KG reasoning benchmarks show
that our approach can search answers more accurately and efficiently, and
outperforms existing RL-based methods for long path queries by a large margin.
- Abstract(参考訳): 強化学習(RL)に基づくグラフウォーキングは,マルチホップリレーショナルパスを探索することにより,不完全知識グラフ(KG)上の様々な推論タスクを自動的に完了するエージェントのナビゲートに成功している。
しかし、既存のマルチホップ推論アプローチは短い推論経路でのみうまく機能し、経路長が増加すると対象エンティティを見逃してしまう傾向にある。
これは、ソースとターゲットエンティティを繋ぐ短いパスが不完全なkgsでは利用できない現実のシナリオでは、多くの推論タスクでは望ましくないため、エージェントが長い経路からより多くの手がかりを探さない限り、推論のパフォーマンスは劇的に低下する。
この課題に対処するため,本論文では,2人のエージェント(GIANTとDWARF)が共同でKGの上を歩き,協調して回答を探索する,二重エージェント強化学習フレームワークを提案する。
提案手法は,クラスタレベルの経路を素早く探索するエージェント(GIANT)の1つを割り当て,別のエージェント(DWARF)にステージワイドヒントを提供することによって,長い経路における推論課題に対処する。
最後に,いくつかのKG推論ベンチマークによる実験結果から,提案手法はより正確かつ効率的に解を探索できることを示すとともに,従来のRLに基づく長経路探索法よりも大きなマージンで優れていた。
関連論文リスト
- Multi-Agent Target Assignment and Path Finding for Intelligent Warehouse: A Cooperative Multi-Agent Deep Reinforcement Learning Perspective [6.148164795916424]
多エージェント目標割り当てと経路計画(TAPF)はインテリジェントウェアハウスにおける2つの重要な問題である。
協調型多エージェント深層強化学習(RL)の観点から目標の割り当てと経路計画を同時に解く方法を提案する。
実験結果から,本手法は様々なタスク設定において良好に動作することが示された。
論文 参考訳(メタデータ) (2024-08-25T07:32:58Z) - Walk Wisely on Graph: Knowledge Graph Reasoning with Dual Agents via Efficient Guidance-Exploration [6.137115941053124]
階層的強化学習(HRL)に基づく二重エージェントを用いたマルチホップ推論モデルを提案する。
FULORAは、二重エージェント間のeFficient GUidance-ExpLORAtionによる上記の推論課題に取り組む。
3つの実単語知識グラフデータセットで実施された実験では、FULORAがRLベースのベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2024-08-03T23:15:57Z) - PathFinder: Guided Search over Multi-Step Reasoning Paths [80.56102301441899]
木探索に基づく推論経路生成手法であるPathFinderを提案する。
動的デコードの統合により、多様な分岐とマルチホップ推論を強化する。
我々のモデルは、大きな分岐因子を持つビームサーチに類似した複雑さを反映して、よく、長く、目に見えない推論連鎖を一般化する。
論文 参考訳(メタデータ) (2023-12-08T17:05:47Z) - Monte-Carlo Tree Search for Multi-Agent Pathfinding: Preliminary Results [60.4817465598352]
マルチエージェントパスフィンディングに適したモンテカルロ木探索(MCTS)のオリジナル版を紹介する。
具体的には,エージェントの目標達成行動を支援するために,個別の経路を用いる。
また,木探索手順の分岐係数を低減するために,専用の分解手法を用いる。
論文 参考訳(メタデータ) (2023-07-25T12:33:53Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - SQUIRE: A Sequence-to-sequence Framework for Multi-hop Knowledge Graph
Reasoning [21.53970565708247]
トリプルクエリを与えられたマルチホップ推論タスクは、推論プロセスを示す明確なパスを提供することを目的としている。
SQUIREはSequence-to-Sequenceベースのマルチホップ推論フレームワークである。
論文 参考訳(メタデータ) (2022-01-17T04:22:54Z) - Distributed Heuristic Multi-Agent Path Finding with Communication [7.854890646114447]
大規模ロボットシステムにはMAPF(Multi-Agent Path Finding)が不可欠である。
近年,部分観測可能な環境下での分散警察の学習に強化学習(RL)を適用している。
本稿では,深層学習とコミュニケーションを組み合わせることで,MAPFの新たな学習手法を提案する。
論文 参考訳(メタデータ) (2021-06-21T18:50:58Z) - Language-guided Navigation via Cross-Modal Grounding and Alternate
Adversarial Learning [66.9937776799536]
新たなビジョン・アンド・ランゲージナビゲーション(VLN)問題は、見えない写真リアリスティック環境において、エージェントがターゲットの場所に向かうことを学習することを目的としている。
VLNの主な課題は、主に2つの側面から生じている: まず、エージェントは動的に変化する視覚環境に対応する言語命令の有意義な段落に出席する必要がある。
そこで本稿では,エージェントにテキストと視覚の対応性を追跡する機能を持たせるために,クロスモーダルグラウンドモジュールを提案する。
論文 参考訳(メタデータ) (2020-11-22T09:13:46Z) - Planning to Explore via Self-Supervised World Models [120.31359262226758]
Plan2Exploreは自己監督型強化学習エージェントである。
我々は、自己監督型探索と、新しいタスクへの迅速な適応に対する新しいアプローチを提案する。
Plan2Exploreは、訓練の監督やタスク固有の相互作用がなければ、自己監督型の探査方法よりも優れている。
論文 参考訳(メタデータ) (2020-05-12T17:59:45Z) - Meta Reinforcement Learning with Autonomous Inference of Subtask
Dependencies [57.27944046925876]
本稿では,タスクがサブタスクグラフによって特徴づけられるような,新しい数発のRL問題を提案し,対処する。
メタ政治を直接学習する代わりに、Subtask Graph Inferenceを使ったメタラーナーを開発した。
実験の結果,2つのグリッドワールド領域とStarCraft II環境において,提案手法が潜在タスクパラメータを正確に推定できることが確認された。
論文 参考訳(メタデータ) (2020-01-01T17:34:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。