論文の概要: Learning Two-Step Hybrid Policy for Graph-Based Interpretable
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2201.08520v1
- Date: Fri, 21 Jan 2022 03:06:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-24 13:08:29.584799
- Title: Learning Two-Step Hybrid Policy for Graph-Based Interpretable
Reinforcement Learning
- Title(参考訳): グラフに基づく解釈可能な強化学習のための2段階ハイブリッド政策の学習
- Authors: Tongzhou Mu, Kaixiang Lin, Feiyang Niu, Govind Thattai
- Abstract要約: 本稿では,グラフベース入力を用いたRL問題に対して,解釈可能かつ堅牢な階層型ポリシを生成するための2段階のハイブリッド強化学習(RL)ポリシーを提案する。
この2段階のハイブリッドポリシは、人間フレンドリーな解釈を示し、一般化と堅牢性の観点から、より良いパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 7.656272344163665
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a two-step hybrid reinforcement learning (RL) policy that is
designed to generate interpretable and robust hierarchical policies on the RL
problem with graph-based input. Unlike prior deep reinforcement learning
policies parameterized by an end-to-end black-box graph neural network, our
approach disentangles the decision-making process into two steps. The first
step is a simplified classification problem that maps the graph input to an
action group where all actions share a similar semantic meaning. The second
step implements a sophisticated rule-miner that conducts explicit one-hop
reasoning over the graph and identifies decisive edges in the graph input
without the necessity of heavy domain knowledge. This two-step hybrid policy
presents human-friendly interpretations and achieves better performance in
terms of generalization and robustness. Extensive experimental studies on four
levels of complex text-based games have demonstrated the superiority of the
proposed method compared to the state-of-the-art.
- Abstract(参考訳): 本稿では,グラフベース入力を用いたRL問題に対して,解釈可能かつ堅牢な階層的ポリシを生成するための2段階のハイブリッド強化学習(RL)ポリシーを提案する。
エンドツーエンドのブラックボックスグラフニューラルネットワークによってパラメータ化された事前の強化学習ポリシーとは異なり、我々のアプローチは意思決定プロセスを2つのステップに分割する。
最初のステップは、グラフ入力をすべてのアクションが同様の意味を持つアクショングループにマッピングする単純化された分類問題である。
第2のステップは、グラフ上で明示的なワンホップ推論を実行し、重いドメイン知識を必要とせずにグラフ入力における決定的なエッジを識別する、洗練されたルールマイナを実装する。
この2段階のハイブリッドポリシーは、人間にやさしい解釈を示し、一般化と堅牢性の観点からより良いパフォーマンスを達成する。
4段階の複雑なテキストベースのゲームに関する大規模な実験的研究は、提案手法の最先端性を示した。
関連論文リスト
- Disentangled Generative Graph Representation Learning [51.59824683232925]
本稿では,自己教師型学習フレームワークであるDiGGR(Disentangled Generative Graph Representation Learning)を紹介する。
潜伏要因を学習し、それをグラフマスクモデリングのガイドとして活用することを目的としている。
2つの異なるグラフ学習タスクのための11の公開データセットの実験は、DiGGRが従来よりも一貫して多くの自己教師付きメソッドを上回っていることを示している。
論文 参考訳(メタデータ) (2024-08-24T05:13:02Z) - Balanced Multi-Relational Graph Clustering [5.531383184058319]
マルチリレーショナルグラフクラスタリングは、複雑なネットワークの基盤となるパターンを明らかにすることに顕著な成功を収めた。
我々の実証的研究は、現実のグラフにおいて不均衡が広範に存在することを発見し、これは原則的にアライメントの動機と矛盾する。
我々は、教師なしの主観的マイニングと二重信号誘導表現学習からなるバランス付きマルチリレーショナルグラフクラスタリング(BMGC)を提案する。
論文 参考訳(メタデータ) (2024-07-23T22:11:13Z) - Domain Adaptive Graph Classification [0.0]
本稿では,グラフトポロジを二分枝から探索し,二分枝学習による領域差を緩和するDual Adversarial Graph Representation Learning(DAGRL)を提案する。
提案手法では,適応的な摂動を二重分岐に組み込み,ソースとターゲット分布をドメインの整合性に対応させる。
論文 参考訳(メタデータ) (2023-12-21T02:37:56Z) - Learning High-level Semantic-Relational Concepts for SLAM [10.528810470934781]
低レベル因子グラフから推定できる高レベル意味関連概念を学習するためのアルゴリズムを提案する。
提案手法をシミュレーションと実データの両方で検証し, 2つのベースラインアプローチによる性能向上を実証した。
論文 参考訳(メタデータ) (2023-09-30T14:54:31Z) - From Cluster Assumption to Graph Convolution: Graph-based Semi-Supervised Learning Revisited [51.24526202984846]
グラフベースの半教師付き学習(GSSL)は、長い間ホットな研究トピックだった。
グラフ畳み込みネットワーク (GCN) は, 有望な性能を示す主要な技術となっている。
論文 参考訳(メタデータ) (2023-09-24T10:10:21Z) - A Survey of Imbalanced Learning on Graphs: Problems, Techniques, and
Future Directions [64.84521350148513]
グラフは、現実世界の無数に存在する相互接続構造を表す。
グラフ学習方法のような効果的なグラフ分析により、ユーザはグラフデータから深い洞察を得ることができる。
しかし、これらの手法はデータ不均衡に悩まされることが多く、グラフデータでは、あるセグメントが豊富なデータを持っているのに、他のセグメントが不足しているのが一般的な問題である。
これは、より正確で代表的な学習結果のために、これらのデータ分散スキューを補正することを目的として、グラフ上の不均衡学習の出現する分野を必要とする。
論文 参考訳(メタデータ) (2023-08-26T09:11:44Z) - State of the Art and Potentialities of Graph-level Learning [54.68482109186052]
グラフレベルの学習は、比較、回帰、分類など、多くのタスクに適用されている。
グラフの集合を学習する伝統的なアプローチは、サブストラクチャのような手作りの特徴に依存している。
ディープラーニングは、機能を自動的に抽出し、グラフを低次元表現に符号化することで、グラフレベルの学習をグラフの規模に適応させるのに役立っている。
論文 参考訳(メタデータ) (2023-01-14T09:15:49Z) - Localized Contrastive Learning on Graphs [110.54606263711385]
局所グラフコントラスト学習(Local-GCL)という,シンプルだが効果的なコントラストモデルを導入する。
その単純さにもかかわらず、Local-GCLは、様々なスケールと特性を持つグラフ上の自己教師付きノード表現学習タスクにおいて、非常に競争力のある性能を達成する。
論文 参考訳(メタデータ) (2022-12-08T23:36:00Z) - Counterfactual Intervention Feature Transfer for Visible-Infrared Person
Re-identification [69.45543438974963]
視覚赤外人物再識別タスク(VI-ReID)におけるグラフベースの手法は,2つの問題により,悪い一般化に悩まされている。
十分に訓練された入力特徴は、グラフトポロジーの学習を弱め、推論過程において十分に一般化されない。
本稿では,これらの問題に対処するためのCIFT法を提案する。
論文 参考訳(メタデータ) (2022-08-01T16:15:31Z) - Pairwise Half-graph Discrimination: A Simple Graph-level Self-supervised
Strategy for Pre-training Graph Neural Networks [17.976090901276905]
我々はPairwise Half-graph Discrimination(PHD)という,シンプルで効果的な自己指導型事前学習戦略を提案する。
PHDはグラフレベルでグラフニューラルネットワークを明示的に事前トレーニングする。
論文 参考訳(メタデータ) (2021-10-26T10:51:13Z) - Compositional Reinforcement Learning from Logical Specifications [21.193231846438895]
最近のアプローチでは、与えられた仕様から報酬関数を自動的に生成し、適切な強化学習アルゴリズムを用いてポリシーを学習する。
我々は、高レベルの計画と強化学習をインターリーブする、DiRLと呼ばれる構成学習手法を開発した。
提案手法では,各エッジ(サブタスク)のニューラルネットワークポリシをDijkstraスタイルの計画アルゴリズムで学習し,グラフの高レベルプランを計算する。
論文 参考訳(メタデータ) (2021-06-25T22:54:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。