論文の概要: Bigraph Matching Weighted with Learnt Incentive Function for Multi-Robot
Task Allocation
- arxiv url: http://arxiv.org/abs/2403.07131v1
- Date: Mon, 11 Mar 2024 19:55:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 23:44:11.310375
- Title: Bigraph Matching Weighted with Learnt Incentive Function for Multi-Robot
Task Allocation
- Title(参考訳): マルチロボットタスクアロケーションのための学習インセンティブ関数を重み付けしたBigraph Matching
- Authors: Steve Paul, Nathan Maurer, Souma Chowdhury
- Abstract要約: 本稿では,マルチロボットタスクアロケーションに対する二部グラフマッチング手法の堅牢性やインセンティブを学習するためのグラフ強化学習フレームワークを開発する。
GRL誘導インセンティブを付加したこの新しい複グラフマッチング手法の性能は,元の複グラフマッチング手法と同等であることがわかった。
- 参考スコア(独自算出の注目度): 5.248564173595024
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most real-world Multi-Robot Task Allocation (MRTA) problems require fast and
efficient decision-making, which is often achieved using heuristics-aided
methods such as genetic algorithms, auction-based methods, and bipartite graph
matching methods. These methods often assume a form that lends better
explainability compared to an end-to-end (learnt) neural network based policy
for MRTA. However, deriving suitable heuristics can be tedious, risky and in
some cases impractical if problems are too complex. This raises the question:
can these heuristics be learned? To this end, this paper particularly develops
a Graph Reinforcement Learning (GRL) framework to learn the heuristics or
incentives for a bipartite graph matching approach to MRTA. Specifically a
Capsule Attention policy model is used to learn how to weight task/robot
pairings (edges) in the bipartite graph that connects the set of tasks to the
set of robots. The original capsule attention network architecture is
fundamentally modified by adding encoding of robots' state graph, and two
Multihead Attention based decoders whose output are used to construct a
LogNormal distribution matrix from which positive bigraph weights can be drawn.
The performance of this new bigraph matching approach augmented with a
GRL-derived incentive is found to be at par with the original bigraph matching
approach that used expert-specified heuristics, with the former offering
notable robustness benefits. During training, the learned incentive policy is
found to get initially closer to the expert-specified incentive and then
slightly deviate from its trend.
- Abstract(参考訳): MRTA(Multi-Robot Task Allocation)問題の多くは高速かつ効率的な意思決定を必要としており、遺伝的アルゴリズムやオークションベースの手法、二部グラフマッチング法といったヒューリスティックな手法を用いてしばしば達成される。
これらの手法は、mtaのエンドツーエンド(learnt)ニューラルネットワークベースのポリシーと比較して、より説明しやすい形態をとることが多い。
しかし、適切なヒューリスティックを導出することは退屈でリスクがあり、問題が非常に複雑すぎる場合、実用的でない場合もある。
これらのヒューリスティックは学べるのか?
そこで本稿では,MRTAに対する二部グラフマッチング手法のヒューリスティックやインセンティブを学習するためのグラフ強化学習(GRL)フレームワークについて述べる。
具体的には、タスクセットとロボットセットを接続する2部グラフでタスク/ロボットペアリング(エッジ)を重み付けする方法を学ぶためにカプセル注意ポリシーモデルが使用される。
オリジナルのカプセルアテンションネットワークアーキテクチャは、ロボットの状態グラフのエンコーディングと、2つのマルチヘッドアテンションベースのデコーダを加えて、正の複グラフ重みを描画できるLogNormal分布行列を構築することによって、根本的に変更されている。
GRL由来のインセンティブを付加したこの新しいバイグラフマッチング手法の性能は、専門家が特定したヒューリスティックスを用いたオリジナルのバイグラフマッチング手法と同等であり、前者は顕著な堅牢性をもたらす。
トレーニング中、学習されたインセンティブポリシーは、最初は専門家が特定したインセンティブに近づき、その後、そのトレンドからわずかに逸脱する。
関連論文リスト
- HGPROMPT: Bridging Homogeneous and Heterogeneous Graphs for Few-shot Prompt Learning [16.587427365950838]
本稿では,HGPROMPTを提案する。HGPROMPTは,事前学習タスクと下流タスクだけでなく,均一かつ均一なグラフを統一するための,新しい事前学習および促進フレームワークである。
我々は3つの公開データセットの広範な実験を通してHGPROMPTを徹底的に評価・解析した。
論文 参考訳(メタデータ) (2023-12-04T13:20:15Z) - Adapting to Change: Robust Counterfactual Explanations in Dynamic Data
Landscapes [9.943459106509687]
我々は、新しい半教師付きグラフカウンターファクトExplainer(GCE)方法論、ダイナミックGRAphカウンタファクトExplainer(DyGRACE)を紹介する。
これは、データ配布に関する初期知識を活用して、有効な偽物を探すと同時に、後続の時間ステップにおいて、潜在的に時代遅れな決定関数からの情報を使用することを避けます。
DyGRACEは非常に効果的でドリフト検出器として機能し、反復間の再構成誤差の違いに基づいて分布ドリフトを識別する。
論文 参考訳(メタデータ) (2023-08-04T14:41:03Z) - SimTeG: A Frustratingly Simple Approach Improves Textual Graph Learning [131.04781590452308]
テキストグラフ学習におけるフラストレーションに富んだアプローチであるSimTeGを提案する。
まず、下流タスクで予め訓練されたLM上で、教師付きパラメータ効率の微調整(PEFT)を行う。
次に、微調整されたLMの最後の隠れ状態を用いてノード埋め込みを生成する。
論文 参考訳(メタデータ) (2023-08-03T07:00:04Z) - Subgraph Matching via Query-Conditioned Subgraph Matching Neural
Networks and Bi-Level Tree Search [33.9052190473029]
サブグラフマッチングは、グラフデータベース検索、バイオメディカル分析、ソーシャルグループ検索などにおける中核的な操作である。
本稿では,クエリと対象グラフのマッチング情報を動的に計算する,新しいエンコーダ・デコーダニューラルネットワークアーキテクチャを提案する。
5つの大きな実世界のターゲットグラフの実験により、N-BLSはサブグラフマッチング性能を大幅に改善できることが示された。
論文 参考訳(メタデータ) (2022-07-21T04:47:21Z) - Multi-Robot Active Mapping via Neural Bipartite Graph Matching [49.72892929603187]
本稿では,最小時間ステップにおけるシーンマップ構築の完全化を目的としたマルチロボットアクティブマッピングの問題点について検討する。
この問題の鍵は、より効率的なロボットの動きを可能にするゴール位置推定にある。
本稿では,ニューラルコマッピング(NeuralCoMapping)という新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-30T14:03:17Z) - MGAE: Masked Autoencoders for Self-Supervised Learning on Graphs [55.66953093401889]
Masked Graph Autoencoder (MGAE) フレームワークは、グラフ構造データの効果的な学習を行う。
自己指導型学習から洞察を得て、私たちはランダムに大量のエッジを隠蔽し、トレーニング中に欠落したエッジを再構築しようとします。
論文 参考訳(メタデータ) (2022-01-07T16:48:07Z) - ROD: Reception-aware Online Distillation for Sparse Graphs [23.55530524584572]
疎グラフ学習のための新しいレセプション対応オンライン知識蒸留手法 ROD を提案する。
RODのための3つの監視信号: マルチスケールの受信対応グラフ知識、タスクベース監視、豊富な蒸留知識。
我々のアプローチは9つのデータセットと様々なグラフベースのタスクで広く評価されている。
論文 参考訳(メタデータ) (2021-07-25T11:55:47Z) - Learnable Graph Matching: Incorporating Graph Partitioning with Deep
Feature Learning for Multiple Object Tracking [58.30147362745852]
フレーム間のデータアソシエーションは、Multiple Object Tracking(MOT)タスクの中核にある。
既存の手法は、主にトラックレットとフレーム内検出の間のコンテキスト情報を無視する。
そこで本研究では,学習可能なグラフマッチング手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T08:58:45Z) - Deep Reinforcement Learning of Graph Matching [63.469961545293756]
ノードとペアの制約下でのグラフマッチング(GM)は、最適化からコンピュータビジョンまでの領域におけるビルディングブロックである。
GMのための強化学習ソルバを提案する。
rgmはペアワイズグラフ間のノード対応を求める。
本手法は,フロントエンドの特徴抽出と親和性関数学習に焦点をあてるという意味において,従来のディープグラフマッチングモデルと異なる。
論文 参考訳(メタデータ) (2020-12-16T13:48:48Z) - Self-supervised Auxiliary Learning with Meta-paths for Heterogeneous
Graphs [21.617020380894488]
ヘテロジニアスグラフ上のグラフニューラルネットワークを学習するための,新しい自己教師付き補助学習法を提案する。
本手法は,任意のグラフニューラルネットワークに対して,手動ラベリングや追加データなしでプラグイン方式で適用することができる。
論文 参考訳(メタデータ) (2020-07-16T12:32:11Z) - Learning to Hash with Graph Neural Networks for Recommender Systems [103.82479899868191]
グラフ表現学習は、大規模に高品質な候補探索をサポートすることに多くの注目を集めている。
ユーザ・イテム相互作用ネットワークにおけるオブジェクトの埋め込みベクトルの学習の有効性にもかかわらず、連続的な埋め込み空間におけるユーザの好みを推測する計算コストは膨大である。
連続的かつ離散的なコードとを協調的に学習するための,単純かつ効果的な離散表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-04T06:59:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。