論文の概要: Hereditary Geometric Meta-RL: Nonlocal Generalization via Task Symmetries
- arxiv url: http://arxiv.org/abs/2603.00396v1
- Date: Sat, 28 Feb 2026 00:57:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.169883
- Title: Hereditary Geometric Meta-RL: Nonlocal Generalization via Task Symmetries
- Title(参考訳): 遺伝幾何学的メタRL:タスク対称性による非局所一般化
- Authors: Paul Nitschke, Shahriar Talebi,
- Abstract要約: 本研究は,タスク空間に基本システム固有の対称性によって誘導される「遺伝的幾何学」を付与する幾何学的視点を開発する。
タスク空間が基礎となるシステムの対称性から継承された場合、タスク空間は、その動作が線形化可能で、接続可能で、かつ、テスト時に効率的な学習と推論を可能にするコンパクトなプロパティを持つこれらの対称性のサブグループに埋め込まれることを示す。
- 参考スコア(独自算出の注目度): 3.2228025627337864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Meta-Reinforcement Learning (Meta-RL) commonly generalizes via smoothness in the task encoding. While this enables local generalization around each training task, it requires dense coverage of the task space and leaves richer task space structure untapped. In response, we develop a geometric perspective that endows the task space with a "hereditary geometry" induced by the inherent symmetries of the underlying system. Concretely, the agent reuses a policy learned at the train time by transforming states and actions through actions of a Lie group. This converts Meta-RL into symmetry discovery rather than smooth extrapolation, enabling the agent to generalize to wider regions of the task space. We show that when the task space is inherited from the symmetries of the underlying system, the task space embeds into a subgroup of those symmetries whose actions are linearizable, connected, and compact--properties that enable efficient learning and inference at the test time. To learn these structures, we develop a differential symmetry discovery method. This collapses functional invariance constraints and thereby improves numerical stability and sample efficiency over functional approaches. Empirically, on a two-dimensional navigation task, our method efficiently recovers the ground-truth symmetry and generalizes across the entire task space, while a common baseline generalizes only near training tasks.
- Abstract(参考訳): メタ強化学習(Meta-RL)は、タスクエンコーディングのスムーズ性を通じて一般的に一般化される。
これにより、各トレーニングタスクの局所的な一般化が可能になるが、タスク空間の密接なカバレッジが必要であり、タスク空間構造を未使用のままにしておくことができる。
そこで本研究では,課題空間に基本システム固有の対称性によって誘導される「遺伝的幾何学」を付与する幾何学的視点を構築した。
具体的には、エージェントは、リーグループの動作を通じて状態や動作を変化させることで、列車時に学んだポリシーを再利用する。
これによりMeta-RLは滑らかな外挿ではなく対称性の発見に変換され、エージェントはタスク空間の広い領域に一般化できる。
タスク空間が基礎となるシステムの対称性から継承された場合、タスク空間は、その動作が線形化可能で、接続可能で、かつ、テスト時に効率的な学習と推論を可能にするコンパクトなプロパティを持つこれらの対称性のサブグループに埋め込まれることを示す。
これらの構造を学習するために,差分対称性探索法を開発した。
これにより機能的不変性の制約が崩壊し、関数的アプローチよりも数値的安定性とサンプル効率が向上する。
経験的に,2次元ナビゲーションタスクにおいて,本手法は地上構造対称性を効率的に回復し,タスク空間全体にわたって一般化する一方で,共通ベースラインは訓練タスク近傍のみを一般化する。
関連論文リスト
- Intrinsic Task Symmetry Drives Generalization in Algorithmic Tasks [4.075225553131796]
グラッキングの基礎となる3段階の動的トレーニングを一貫した3段階に分類する。
我々は、対称性獲得フェーズ中に一般化が現れることを示す。
一般化の開始を予想する対称性に基づく診断を導入し,それを加速するための戦略を提案する。
論文 参考訳(メタデータ) (2026-03-02T15:19:24Z) - Neural Isometries: Taming Transformations for Equivariant ML [8.203292895010748]
本稿では,観測空間を汎用潜在空間にマップする方法を学習する自動エンコーダフレームワークであるNeural Isometriesを紹介する。
トレーニング済みの潜伏空間で動作する単純なオフ・ザ・シェルフ同変ネットワークは、巧妙に設計された手作りのネットワークと同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2024-05-29T17:24:25Z) - Symmetry Considerations for Learning Task Symmetric Robot Policies [12.856889419651521]
シンメトリーは多くの現実世界のロボットタスクの基本的な側面である。
現在の深層強化学習(DRL)アプローチは、対称性を効果的に活用することは滅多にない。
論文 参考訳(メタデータ) (2024-03-07T09:41:11Z) - Human-Timescale Adaptation in an Open-Ended Task Space [56.55530165036327]
大規模にRLエージェントを訓練することで、オープンエンドの新規な3D問題に人間と同じくらい早く適応できる一般的なコンテキスト内学習アルゴリズムが実現可能であることを示す。
我々の研究は、より大規模で適応的なRLエージェントの基礎を築いた。
論文 参考訳(メタデータ) (2023-01-18T15:39:21Z) - Continual Vision-based Reinforcement Learning with Group Symmetries [18.7526848176769]
我々は,COVERSと呼ばれるグループ対称性を認識する,ユニークな連続視覚に基づく強化学習手法を提案する。
その結果, COVERS は各グループにタスクを正確に割り当て, 一般化能力において既存手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2022-10-21T23:41:02Z) - Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors [72.62423312645953]
人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変化させる。
現在のImitation Learningアルゴリズムは、通常、単調な専門家によるデモンストレーションのみを考慮し、状態アクションベースの設定で行動する。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
論文 参考訳(メタデータ) (2022-10-17T16:42:59Z) - Multi-Agent MDP Homomorphic Networks [100.74260120972863]
協調型マルチエージェントシステムでは、エージェントの異なる構成とそれらの局所的な観察の間に複雑な対称性が生じる。
単エージェント強化学習における既存の対称性の研究は、完全に集中した環境にのみ一般化できる。
本稿では,ローカル情報のみを用いた分散実行が可能なネットワークのクラスであるマルチエージェントMDPホモモルフィックネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-09T07:46:25Z) - Introducing Symmetries to Black Box Meta Reinforcement Learning [26.338797667571693]
いわゆるブラックボックスアプローチでは、ポリシーと学習アルゴリズムは1つのニューラルネットワークによって共同で表現される。
メタラーンがバックプロパゲーションに基づく学習の目標となるメタRLアプローチが,特定の対称性を示すことを示す。
これらの対称性はメタ一般化において重要な役割を果たす。
論文 参考訳(メタデータ) (2021-09-22T15:09:58Z) - Distribution Matching for Heterogeneous Multi-Task Learning: a
Large-scale Face Study [75.42182503265056]
マルチタスク学習は、共有学習アルゴリズムによって複数のタスクを共同で学習する方法論として登場した。
我々は異種mtlに対処し,検出,分類,回帰問題を同時に解決する。
大規模な顔分析のための最初のフレームワークであるFaceBehaviorNetを構築し、すべての顔行動タスクを共同で学習する。
論文 参考訳(メタデータ) (2021-05-08T22:26:52Z) - The Advantage of Conditional Meta-Learning for Biased Regularization and
Fine-Tuning [50.21341246243422]
バイアスレギュラー化と微調整は、最近の2つのメタラーニングアプローチである。
本稿では,条件付き関数マッピングタスクの側情報をメタパラメータベクトルに推論する条件付きメタラーニングを提案する。
次に、実際には同等の利点をもたらす凸メタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-08-25T07:32:16Z) - Improving Generalization in Meta-learning via Task Augmentation [69.83677015207527]
本稿ではMetaMixとChannel Shuffleの2つのタスク拡張手法を提案する。
MetaMixとChannel Shuffleはどちらも、多くのデータセットにまたがる大きなマージンによって、最先端の結果を上回っている。
論文 参考訳(メタデータ) (2020-07-26T01:50:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。