論文の概要: Can Euclidean Symmetry be Leveraged in Reinforcement Learning and
Planning?
- arxiv url: http://arxiv.org/abs/2307.08226v1
- Date: Mon, 17 Jul 2023 04:01:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 14:53:57.824638
- Title: Can Euclidean Symmetry be Leveraged in Reinforcement Learning and
Planning?
- Title(参考訳): ユークリッド対称性は強化学習と計画に活用できるのか?
- Authors: Linfeng Zhao, Owen Howell, Jung Yeon Park, Xupeng Zhu, Robin Walters,
and Lawson L.S. Wong
- Abstract要約: ロボットの作業では、参照フレームの変化は一般にシステムの基盤となる物理的特性に影響を与えない。
我々は、強化学習、計画、最適制御における離散的かつ連続的な対称性に関する先行研究を統一する理論を提唱した。
- 参考スコア(独自算出の注目度): 5.943193860994729
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In robotic tasks, changes in reference frames typically do not influence the
underlying physical properties of the system, which has been known as
invariance of physical laws.These changes, which preserve distance, encompass
isometric transformations such as translations, rotations, and reflections,
collectively known as the Euclidean group. In this work, we delve into the
design of improved learning algorithms for reinforcement learning and planning
tasks that possess Euclidean group symmetry. We put forth a theory on that
unify prior work on discrete and continuous symmetry in reinforcement learning,
planning, and optimal control. Algorithm side, we further extend the 2D path
planning with value-based planning to continuous MDPs and propose a pipeline
for constructing equivariant sampling-based planning algorithms. Our work is
substantiated with empirical evidence and illustrated through examples that
explain the benefits of equivariance to Euclidean symmetry in tackling natural
control problems.
- Abstract(参考訳): ロボット作業において、参照フレームの変化は、通常、物理的法則の不変(invariance)として知られるシステムの基盤となる物理的性質に影響を与えない。
本研究では,ユークリッド群対称性を持つ強化学習と計画タスクのための改良学習アルゴリズムの設計について考察する。
強化学習,計画,最適制御における離散的および連続的対称性に関する先行研究を統一する理論を提唱した。
アルゴリズム側では、値ベースプランニングによる2次元経路計画をさらに連続的なMDPに拡張し、同変サンプリングベースプランニングアルゴリズムを構築するパイプラインを提案する。
我々の研究は経験的証拠で証明され、自然制御問題に取り組む際のユークリッド対称性に対する等分散の利点を説明する例を通して示される。
関連論文リスト
- Approximate Equivariance in Reinforcement Learning [35.04248486334824]
等変ニューラルネットワークは強化学習において大きな成功を収めている。
多くの問題において、近似対称性のみが存在しており、これは正確な対称性を不適切なものにしている。
我々は、強化学習におけるほぼ同変のアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-11-06T19:44:46Z) - Learning Infinitesimal Generators of Continuous Symmetries from Data [15.42275880523356]
1-パラメータ群で定義された変換に基づく新しい対称性学習アルゴリズムを提案する。
この手法は最小限の帰納バイアスに基づいて構築され、リー群に根付いた一般的な対称性だけでなく、非線形発生器由来の対称性にまで拡張される。
論文 参考訳(メタデータ) (2024-10-29T08:28:23Z) - Current Symmetry Group Equivariant Convolution Frameworks for Representation Learning [5.802794302956837]
ユークリッドの深層学習はしばしば、表現空間が不規則で複雑な位相で湾曲した実世界の信号に対処するのに不十分である。
我々は、対称性群同変深層学習モデルの重要性と、グラフや3次元形状、非ユークリッド空間における畳み込みのような操作の実現に焦点を当てる。
論文 参考訳(メタデータ) (2024-09-11T15:07:18Z) - Equivariant Ensembles and Regularization for Reinforcement Learning in Map-based Path Planning [5.69473229553916]
本稿では,特定のニューラルネットワーク成分を使わずに,同変ポリシーと不変値関数を構築する手法を提案する。
等変アンサンブルと正則化がサンプル効率と性能にどのような影響を与えるかを示す。
論文 参考訳(メタデータ) (2024-03-19T16:01:25Z) - Learning Layer-wise Equivariances Automatically using Gradients [66.81218780702125]
畳み込みは等価対称性をニューラルネットワークにエンコードし、より優れた一般化性能をもたらす。
対称性は、ネットワークが表現できる機能、事前に指定する必要、適応できない機能に対して、固定されたハード制約を提供する。
私たちのゴールは、勾配を使ってデータから自動的に学習できるフレキシブル対称性の制約を可能にすることです。
論文 参考訳(メタデータ) (2023-10-09T20:22:43Z) - Oracle-Preserving Latent Flows [58.720142291102135]
我々はラベル付きデータセット全体にわたって複数の非自明な連続対称性を同時に発見するための方法論を開発する。
対称性変換と対応するジェネレータは、特別に構築された損失関数で訓練された完全連結ニューラルネットワークでモデル化される。
この研究における2つの新しい要素は、縮小次元の潜在空間の使用と、高次元のオラクルに関して不変な変換への一般化である。
論文 参考訳(メタデータ) (2023-02-02T00:13:32Z) - Deep Learning Symmetries and Their Lie Groups, Algebras, and Subalgebras
from First Principles [55.41644538483948]
ラベル付きデータセットに存在する連続した対称性群の検出と同定のためのディープラーニングアルゴリズムを設計する。
完全に接続されたニューラルネットワークを用いて、変換対称性と対応するジェネレータをモデル化する。
また,Lie群とその性質の数学的研究に機械学習アプローチを使うための扉を開く。
論文 参考訳(メタデータ) (2023-01-13T16:25:25Z) - Neural Bregman Divergences for Distance Learning [60.375385370556145]
本稿では,入力凸ニューラルネットワークを用いて任意のブレグマン分岐を微分可能な方法で学習するための新しいアプローチを提案する。
提案手法は,新しいタスクと以前に研究されたタスクのセットにおいて,より忠実に相違点を学習することを示す。
我々のテストはさらに、既知の非対称なタスクにまで拡張するが、Bregmanでないタスクでは、不特定性にもかかわらず、我々のメソッドは競争的に機能する。
論文 参考訳(メタデータ) (2022-06-09T20:53:15Z) - Integrating Symmetry into Differentiable Planning with Steerable
Convolutions [5.916280909373456]
等変畳み込みネットワークによって動機付けられた経路計画問題を,グリッド上のテキスト信号として扱う。
この場合の値反復は線型同変作用素であり、これは(ステアブルな)畳み込みであることを示す。
我々の実装はVINに基づいており、対称性を取り入れるためにステアブル畳み込みネットワークを使用している。
論文 参考訳(メタデータ) (2022-06-08T04:58:48Z) - Geometric Methods for Sampling, Optimisation, Inference and Adaptive
Agents [102.42623636238399]
我々は,サンプリング,最適化,推論,適応的意思決定といった問題に根ざした基本的な幾何学的構造を同定する。
これらの問題を効率的に解くためにこれらの幾何学的構造を利用するアルゴリズムを導出する。
論文 参考訳(メタデータ) (2022-03-20T16:23:17Z) - Meta-Learning Symmetries by Reparameterization [63.85144439337671]
データから対応するパラメータ共有パターンを学習し、等価性をネットワークに学習し、符号化する手法を提案する。
本実験は,画像処理タスクで使用される共通変換に等価性をエンコードして自動的に学習できることを示唆する。
論文 参考訳(メタデータ) (2020-07-06T17:59:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。