論文の概要: Can Euclidean Symmetry be Leveraged in Reinforcement Learning and
Planning?
- arxiv url: http://arxiv.org/abs/2307.08226v1
- Date: Mon, 17 Jul 2023 04:01:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 14:53:57.824638
- Title: Can Euclidean Symmetry be Leveraged in Reinforcement Learning and
Planning?
- Title(参考訳): ユークリッド対称性は強化学習と計画に活用できるのか?
- Authors: Linfeng Zhao, Owen Howell, Jung Yeon Park, Xupeng Zhu, Robin Walters,
and Lawson L.S. Wong
- Abstract要約: ロボットの作業では、参照フレームの変化は一般にシステムの基盤となる物理的特性に影響を与えない。
我々は、強化学習、計画、最適制御における離散的かつ連続的な対称性に関する先行研究を統一する理論を提唱した。
- 参考スコア(独自算出の注目度): 5.943193860994729
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In robotic tasks, changes in reference frames typically do not influence the
underlying physical properties of the system, which has been known as
invariance of physical laws.These changes, which preserve distance, encompass
isometric transformations such as translations, rotations, and reflections,
collectively known as the Euclidean group. In this work, we delve into the
design of improved learning algorithms for reinforcement learning and planning
tasks that possess Euclidean group symmetry. We put forth a theory on that
unify prior work on discrete and continuous symmetry in reinforcement learning,
planning, and optimal control. Algorithm side, we further extend the 2D path
planning with value-based planning to continuous MDPs and propose a pipeline
for constructing equivariant sampling-based planning algorithms. Our work is
substantiated with empirical evidence and illustrated through examples that
explain the benefits of equivariance to Euclidean symmetry in tackling natural
control problems.
- Abstract(参考訳): ロボット作業において、参照フレームの変化は、通常、物理的法則の不変(invariance)として知られるシステムの基盤となる物理的性質に影響を与えない。
本研究では,ユークリッド群対称性を持つ強化学習と計画タスクのための改良学習アルゴリズムの設計について考察する。
強化学習,計画,最適制御における離散的および連続的対称性に関する先行研究を統一する理論を提唱した。
アルゴリズム側では、値ベースプランニングによる2次元経路計画をさらに連続的なMDPに拡張し、同変サンプリングベースプランニングアルゴリズムを構築するパイプラインを提案する。
我々の研究は経験的証拠で証明され、自然制御問題に取り組む際のユークリッド対称性に対する等分散の利点を説明する例を通して示される。
関連論文リスト
- A Unified Framework to Enforce, Discover, and Promote Symmetry in
Machine Learning [5.582881461692378]
機械学習モデルに対称性を組み込むための統一理論および方法論の枠組みを提供する。
対称性の強制と発見は、リー微分の双線型構造に対して双対である線形代数的タスクであることを示す。
これらのアイデアを、基底関数回帰、動的システム発見、多層パーセプトロン、画像などの空間場に作用するニューラルネットワークなど、幅広い機械学習モデルに適用する方法について説明する。
論文 参考訳(メタデータ) (2023-11-01T01:19:54Z) - Learning Layer-wise Equivariances Automatically using Gradients [66.81218780702125]
畳み込みは等価対称性をニューラルネットワークにエンコードし、より優れた一般化性能をもたらす。
対称性は、ネットワークが表現できる機能、事前に指定する必要、適応できない機能に対して、固定されたハード制約を提供する。
私たちのゴールは、勾配を使ってデータから自動的に学習できるフレキシブル対称性の制約を可能にすることです。
論文 参考訳(メタデータ) (2023-10-09T20:22:43Z) - Symmetry Preservation in Hamiltonian Systems: Simulation and Learning [0.9208007322096532]
この研究は、ハミルトン系の力学をシミュレートし、学習するための一般的な幾何学的枠組みを示す。
我々は、$G$-不変ラグランジアン部分多様体の構築を通して興味ある写像をシミュレートし、学習することを提案する。
我々の設計は、シンプレクティック幾何学と幾何学力学において重要な技術と概念を活用する。
論文 参考訳(メタデータ) (2023-08-30T21:34:33Z) - Oracle-Preserving Latent Flows [58.720142291102135]
我々はラベル付きデータセット全体にわたって複数の非自明な連続対称性を同時に発見するための方法論を開発する。
対称性変換と対応するジェネレータは、特別に構築された損失関数で訓練された完全連結ニューラルネットワークでモデル化される。
この研究における2つの新しい要素は、縮小次元の潜在空間の使用と、高次元のオラクルに関して不変な変換への一般化である。
論文 参考訳(メタデータ) (2023-02-02T00:13:32Z) - Generative Adversarial Symmetry Discovery [19.098785309131458]
リーGANは対称性を解釈可能なリー代数基底として表現し、様々な対称性を発見できる。
学習された対称性は、予測の精度と一般化を改善するために、既存の同変ニューラルネットワークで容易に利用することができる。
論文 参考訳(メタデータ) (2023-02-01T04:28:36Z) - Deep Learning Symmetries and Their Lie Groups, Algebras, and Subalgebras
from First Principles [55.41644538483948]
ラベル付きデータセットに存在する連続した対称性群の検出と同定のためのディープラーニングアルゴリズムを設計する。
完全に接続されたニューラルネットワークを用いて、変換対称性と対応するジェネレータをモデル化する。
また,Lie群とその性質の数学的研究に機械学習アプローチを使うための扉を開く。
論文 参考訳(メタデータ) (2023-01-13T16:25:25Z) - Neural Bregman Divergences for Distance Learning [60.375385370556145]
本稿では,入力凸ニューラルネットワークを用いて任意のブレグマン分岐を微分可能な方法で学習するための新しいアプローチを提案する。
提案手法は,新しいタスクと以前に研究されたタスクのセットにおいて,より忠実に相違点を学習することを示す。
我々のテストはさらに、既知の非対称なタスクにまで拡張するが、Bregmanでないタスクでは、不特定性にもかかわらず、我々のメソッドは競争的に機能する。
論文 参考訳(メタデータ) (2022-06-09T20:53:15Z) - Integrating Symmetry into Differentiable Planning with Steerable
Convolutions [5.916280909373456]
等変畳み込みネットワークによって動機付けられた経路計画問題を,グリッド上のテキスト信号として扱う。
この場合の値反復は線型同変作用素であり、これは(ステアブルな)畳み込みであることを示す。
我々の実装はVINに基づいており、対称性を取り入れるためにステアブル畳み込みネットワークを使用している。
論文 参考訳(メタデータ) (2022-06-08T04:58:48Z) - Geometric Methods for Sampling, Optimisation, Inference and Adaptive
Agents [102.42623636238399]
我々は,サンプリング,最適化,推論,適応的意思決定といった問題に根ざした基本的な幾何学的構造を同定する。
これらの問題を効率的に解くためにこれらの幾何学的構造を利用するアルゴリズムを導出する。
論文 参考訳(メタデータ) (2022-03-20T16:23:17Z) - Equivariant neural networks for inverse problems [1.7942265700058986]
群同変畳み込み演算は自然に学習された再構成法に組み込むことができることを示す。
近位作用素を群等価畳み込みニューラルネットワークとしてモデル化する学習反復手法を設計した。
論文 参考訳(メタデータ) (2021-02-23T05:38:41Z) - Meta-Learning Symmetries by Reparameterization [63.85144439337671]
データから対応するパラメータ共有パターンを学習し、等価性をネットワークに学習し、符号化する手法を提案する。
本実験は,画像処理タスクで使用される共通変換に等価性をエンコードして自動的に学習できることを示唆する。
論文 参考訳(メタデータ) (2020-07-06T17:59:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。