論文の概要: Policies over Poses: Reinforcement Learning based Distributed Pose-Graph Optimization for Multi-Robot SLAM
- arxiv url: http://arxiv.org/abs/2510.22740v1
- Date: Sun, 26 Oct 2025 16:21:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.351191
- Title: Policies over Poses: Reinforcement Learning based Distributed Pose-Graph Optimization for Multi-Robot SLAM
- Title(参考訳): Posesに関するポリシー: 強化学習に基づくマルチロボットSLAMのための分散Pose-Graph最適化
- Authors: Sai Krishna Ghanta, Ramviyas Parasuraman,
- Abstract要約: 多ボットローカライゼーションにおける逐次分散ポーズグラフ最適化(PGO)について検討する。
我々は,PGOをマルコフニューラルネットワーク(GNN)上で定義された部分観測可能なゲームとみなし,各アクションが単一エッジのポーズ推定を洗練させる。
学習者の平均軌道は37.5%減少し,効率は少なくとも6倍向上した。
- 参考スコア(独自算出の注目度): 1.3750624267664158
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the distributed pose-graph optimization (PGO) problem, which is fundamental in accurate trajectory estimation in multi-robot simultaneous localization and mapping (SLAM). Conventional iterative approaches linearize a highly non-convex optimization objective, requiring repeated solving of normal equations, which often converge to local minima and thus produce suboptimal estimates. We propose a scalable, outlier-robust distributed planar PGO framework using Multi-Agent Reinforcement Learning (MARL). We cast distributed PGO as a partially observable Markov game defined on local pose-graphs, where each action refines a single edge's pose estimate. A graph partitioner decomposes the global pose graph, and each robot runs a recurrent edge-conditioned Graph Neural Network (GNN) encoder with adaptive edge-gating to denoise noisy edges. Robots sequentially refine poses through a hybrid policy that utilizes prior action memory and graph embeddings. After local graph correction, a consensus scheme reconciles inter-robot disagreements to produce a globally consistent estimate. Our extensive evaluations on a comprehensive suite of synthetic and real-world datasets demonstrate that our learned MARL-based actors reduce the global objective by an average of 37.5% more than the state-of-the-art distributed PGO framework, while enhancing inference efficiency by at least 6X. We also demonstrate that actor replication allows a single learned policy to scale effortlessly to substantially larger robot teams without any retraining. Code is publicly available at https://github.com/herolab-uga/policies-over-poses.
- Abstract(参考訳): 複数ロボットの同時局所化とマッピング(SLAM)における正確な軌道推定の基礎となる分散ポーズグラフ最適化(PGO)問題を考察する。
従来の反復的アプローチは、非常に非凸な最適化目標を線形化し、正規方程式の繰り返し解法を必要とする。
MARL(Multi-Agent Reinforcement Learning)を用いた拡張性のある分散平面PGOフレームワークを提案する。
我々は分散PGOを局所的なポーズグラフ上に定義された部分的に観測可能なマルコフゲームとしてキャストし、各アクションが単一エッジのポーズ推定を洗練させる。
グラフ分割器は、グローバルポーズグラフを分解し、各ロボットは、適応エッジゲーティングを備えた繰り返しエッジ条件グラフニューラルネットワーク(GNN)エンコーダを実行してノイズの多いエッジを識別する。
ロボットは、先行するアクションメモリとグラフの埋め込みを利用するハイブリッドポリシーを通じて、連続的にポーズを洗練する。
局所的なグラフ補正の後、コンセンサススキームはロボット間の不一致を調整し、グローバルに一貫した推定を生成する。
総合的な合成および実世界のデータセットに対する広範な評価は、学習したMARLベースのアクターが、最先端の分散PGOフレームワークよりも平均37.5%、推論効率を少なくとも6倍向上していることを示している。
また、アクターレプリケーションにより、単一の学習ポリシーが、再トレーニングなしに、より大規模なロボットチームに努力せずにスケールできることを実証する。
コードはhttps://github.com/herolab-uga/policies-over-posesで公開されている。
関連論文リスト
- Contrastive Matrix Completion with Denoising and Augmented Graph Views for Robust Recommendation [1.0128808054306186]
マトリックス補完は推薦システムにおいて広く採用されているフレームワークである。
コントラスト学習(MCCL)を用いた行列補完法を提案する。
提案手法は,予測スコアの数値精度を向上するだけでなく,ランキング指標の最大36%を向上する上で,優れたランキングを生成する。
論文 参考訳(メタデータ) (2025-06-12T12:47:35Z) - APGL4SR: A Generic Framework with Adaptive and Personalized Global
Collaborative Information in Sequential Recommendation [86.29366168836141]
逐次推薦のための適応およびパーソナライズされたグラフ学習(APGL4SR)というグラフ駆動型フレームワークを提案する。
APGL4SRは、適応的でパーソナライズされたグローバルな協調情報をシーケンシャルレコメンデーションシステムに組み込む。
一般的なフレームワークとして、APGL4SRは大きなマージンを持つ他のベースラインよりも優れている。
論文 参考訳(メタデータ) (2023-11-06T01:33:24Z) - Global-to-Local Modeling for Video-based 3D Human Pose and Shape
Estimation [53.04781510348416]
フレーム内精度とフレーム間スムーズさにより,映像に基づく3次元人間のポーズと形状推定を評価する。
エンドツーエンドフレームワークGLoT(Global-to-Local Transformer)における長期的・短期的相関のモデル化を構造的に分離することを提案する。
我々のGLoTは、一般的なベンチマーク(3DPW、MPI-INF-3DHP、Human3.6M)において、最も低いモデルパラメータを持つ従来の最先端の手法を上回る。
論文 参考訳(メタデータ) (2023-03-26T14:57:49Z) - ReVoLT: Relational Reasoning and Voronoi Local Graph Planning for
Target-driven Navigation [1.0896567381206714]
Embodied AIは、知的な実体と現実世界の相互作用を強調する必然的なトレンドである。
グラフニューラルネットワーク(GNN)によるレイアウト関係の活用に関する研究
このタスクを分離し、階層的なフレームワークであるReVoLTを提案する。
論文 参考訳(メタデータ) (2023-01-06T05:19:56Z) - Optimal Propagation for Graph Neural Networks [51.08426265813481]
最適グラフ構造を学習するための二段階最適化手法を提案する。
また、時間的複雑さをさらに軽減するために、低ランク近似モデルについても検討する。
論文 参考訳(メタデータ) (2022-05-06T03:37:00Z) - Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。
我々の手法は古典的DPベースの推論に広く適用できる。
また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文 参考訳(メタデータ) (2021-12-07T11:26:41Z) - BayGo: Joint Bayesian Learning and Information-Aware Graph Optimization [48.30183416069897]
BayGoは、ベイズ学習とグラフ最適化のフレームワークである。
本研究の枠組みは、完全連結および恒星トポロジーグラフと比較して、より高速な収束と精度を実現する。
論文 参考訳(メタデータ) (2020-11-09T11:16:55Z) - Graph Ordering: Towards the Optimal by Learning [69.72656588714155]
グラフ表現学習は、ノード分類、予測、コミュニティ検出など、多くのグラフベースのアプリケーションで顕著な成功を収めている。
しかし,グラフ圧縮やエッジ分割などのグラフアプリケーションでは,グラフ表現学習タスクに還元することは極めて困難である。
本稿では,このようなアプリケーションの背後にあるグラフ順序付け問題に対して,新しい学習手法を用いて対処することを提案する。
論文 参考訳(メタデータ) (2020-01-18T09:14:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。