論文の概要: RL-PGO: Reinforcement Learning-based Planar Pose-Graph Optimization
- arxiv url: http://arxiv.org/abs/2202.13221v1
- Date: Sat, 26 Feb 2022 20:10:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-01 17:19:04.863555
- Title: RL-PGO: Reinforcement Learning-based Planar Pose-Graph Optimization
- Title(参考訳): RL-PGO:強化学習に基づく平面ポーズグラフ最適化
- Authors: Nikolaos Kourtzanidis, Sajad Saeedi
- Abstract要約: 本稿では,最新のDeep Reinforcement Learning (DRL) ベースの環境と2次元ポーズグラフ最適化のためのエージェントを提案する。
本研究では、ポーズグラフ最適化問題を部分的に観測可能な決定プロセスとしてモデル化し、実世界および合成データセットの性能を評価することを実証する。
- 参考スコア(独自算出の注目度): 1.4884785898657995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The objective of pose SLAM or pose-graph optimization (PGO) is to estimate
the trajectory of a robot given odometric and loop closing constraints.
State-of-the-art iterative approaches typically involve the linearization of a
non-convex objective function and then repeatedly solve a set of normal
equations. Furthermore, these methods may converge to a local minima yielding
sub-optimal results. In this work, we present to the best of our knowledge the
first Deep Reinforcement Learning (DRL) based environment and proposed agent
for 2D pose-graph optimization. We demonstrate that the pose-graph optimization
problem can be modeled as a partially observable Markov Decision Process and
evaluate performance on real-world and synthetic datasets. The proposed agent
outperforms state-of-the-art solver g2o on challenging instances where
traditional nonlinear least-squares techniques may fail or converge to
unsatisfactory solutions. Experimental results indicate that iterative-based
solvers bootstrapped with the proposed approach allow for significantly higher
quality estimations. We believe that reinforcement learning-based PGO is a
promising avenue to further accelerate research towards globally optimal
algorithms. Thus, our work paves the way to new optimization strategies in the
2D pose SLAM domain.
- Abstract(参考訳): ポーズSLAMまたはポーズグラフ最適化 (PGO) の目的は、オドメトリおよびループ閉鎖制約を与えられたロボットの軌道を推定することである。
最先端の反復的アプローチは典型的には非凸目的関数の線型化を伴い、次に正規方程式の集合を何度も解く。
さらに、これらの手法は局所最小値に収束し、準最適結果が得られる。
本研究では,最初のDeep Reinforcement Learning (DRL) ベースの環境と2次元ポーズグラフ最適化のためのエージェントを提案する。
本研究では,ポーズグラフ最適化問題を部分可観測マルコフ決定プロセスとしてモデル化し,実世界および合成データセットの性能評価を行う。
提案手法は,従来の非線形最小二乗法が故障したり,不満足な解に収束する難題に対して,最先端の解法g2oより優れていた。
実験の結果,提案手法でブートストラップした反復型ソルバにより,高い品質推定が可能となった。
我々は、強化学習に基づくPGOが、グローバルな最適アルゴリズム研究をさらに加速する有望な道であると信じている。
このように、我々の研究は2次元のSLAMドメインにおける新しい最適化戦略の道を開いた。
関連論文リスト
- Fast Two-Time-Scale Stochastic Gradient Method with Applications in Reinforcement Learning [5.325297567945828]
本稿では,従来の手法よりもはるかに高速な収束を実現する2段階最適化手法を提案する。
提案アルゴリズムは,様々な条件下で特徴付けられ,オンラインサンプルベース手法に特化していることを示す。
論文 参考訳(メタデータ) (2024-05-15T19:03:08Z) - Model Uncertainty in Evolutionary Optimization and Bayesian Optimization: A Comparative Analysis [5.6787965501364335]
ブラックボックス最適化問題は、多くの現実世界のアプリケーションで一般的な問題である。
これらの問題はインプット・アウトプット・インタラクションを通じて内部動作へのアクセスなしに最適化する必要がある。
このような問題に対処するために2つの広く使われている勾配のない最適化手法が用いられている。
本稿では,2つの手法間のモデル不確実性の類似点と相違点を明らかにすることを目的とする。
論文 参考訳(メタデータ) (2024-03-21T13:59:19Z) - Learning Constrained Optimization with Deep Augmented Lagrangian Methods [54.22290715244502]
機械学習(ML)モデルは、制約付き最適化ソルバをエミュレートするために訓練される。
本稿では,MLモデルを用いて2つの解推定を直接予測する手法を提案する。
これにより、双対目的が損失関数であるエンドツーエンドのトレーニングスキームと、双対上昇法をエミュレートした原始的実現可能性への解推定を可能にする。
論文 参考訳(メタデータ) (2024-03-06T04:43:22Z) - Reducing the Need for Backpropagation and Discovering Better Optima With
Explicit Optimizations of Neural Networks [4.807347156077897]
本稿では,ニューラルネットワークの最適化のための計算効率のよい代替案を提案する。
我々は、単純なフィードフォワード言語モデルに対する明確な解決策を導出する。
実験では,明示的な解がほぼ最適であることを示す。
論文 参考訳(メタデータ) (2023-11-13T17:38:07Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Backpropagation of Unrolled Solvers with Folded Optimization [55.04219793298687]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
1つの典型的な戦略はアルゴリズムのアンローリングであり、これは反復解法の操作による自動微分に依存している。
本稿では,非ロール最適化の後方通過に関する理論的知見を提供し,効率よく解けるバックプロパゲーション解析モデルを生成するシステムに繋がる。
論文 参考訳(メタデータ) (2023-01-28T01:50:42Z) - An Online Prediction Approach Based on Incremental Support Vector
Machine for Dynamic Multiobjective Optimization [19.336520152294213]
インクリメンタルサポートベクトルマシン(ISVM)に基づく新しい予測アルゴリズムを提案する。
動的多目的最適化問題(DMOP)の解決をオンライン学習プロセスとして扱う。
提案アルゴリズムは動的多目的最適化問題に効果的に取り組むことができる。
論文 参考訳(メタデータ) (2021-02-24T08:51:23Z) - Zeroth-Order Hybrid Gradient Descent: Towards A Principled Black-Box
Optimization Framework [100.36569795440889]
この作業は、一階情報を必要としない零次最適化(ZO)の反復である。
座標重要度サンプリングにおける優雅な設計により,ZO最適化法は複雑度と関数クエリコストの両面において効率的であることを示す。
論文 参考訳(メタデータ) (2020-12-21T17:29:58Z) - An AI-Assisted Design Method for Topology Optimization Without
Pre-Optimized Training Data [68.8204255655161]
トポロジ最適化に基づくAI支援設計手法を提示し、最適化された設計を直接的に得ることができる。
設計は、境界条件と入力データとしての充填度に基づいて、人工ニューラルネットワーク、予測器によって提供される。
論文 参考訳(メタデータ) (2020-12-11T14:33:27Z) - A Primer on Zeroth-Order Optimization in Signal Processing and Machine
Learning [95.85269649177336]
ZO最適化は、勾配推定、降下方向、ソリューション更新の3つの主要なステップを反復的に実行する。
我々は,ブラックボックス深層学習モデルによる説明文の評価や生成,効率的なオンラインセンサ管理など,ZO最適化の有望な応用を実証する。
論文 参考訳(メタデータ) (2020-06-11T06:50:35Z) - Objective-Sensitive Principal Component Analysis for High-Dimensional
Inverse Problems [0.0]
本稿では,大規模乱数場の適応的,微分可能なパラメータ化手法を提案する。
開発した手法は主成分分析(PCA)に基づくが,目的関数の振る舞いを考慮した主成分の純粋にデータ駆動に基づく基礎を変更する。
最適パラメータ分解のための3つのアルゴリズムを2次元合成履歴マッチングの目的に適用した。
論文 参考訳(メタデータ) (2020-06-02T18:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。