論文の概要: Multi-Group Equivariant Augmentation for Reinforcement Learning in Robot Manipulation
- arxiv url: http://arxiv.org/abs/2508.11204v1
- Date: Fri, 15 Aug 2025 04:30:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.741613
- Title: Multi-Group Equivariant Augmentation for Reinforcement Learning in Robot Manipulation
- Title(参考訳): ロボット操作における強化学習のための多群同変強化
- Authors: Hongbin Lin, Juan Rojas, Kwok Wai Samuel Au,
- Abstract要約: 実世界のロボット操作における視覚運動学習の展開には、サンプリング効率が不可欠である。
非等尺対称性構造を含む部分可観測マルコフ決定過程(POMDP)の新規な定式化を導入する。
我々はMEAとオフライン強化学習を統合し、サンプリング効率を向上させるとともに、ボクセルに基づく視覚表現を導入する。
- 参考スコア(独自算出の注目度): 3.842041548518154
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sampling efficiency is critical for deploying visuomotor learning in real-world robotic manipulation. While task symmetry has emerged as a promising inductive bias to improve efficiency, most prior work is limited to isometric symmetries -- applying the same group transformation to all task objects across all timesteps. In this work, we explore non-isometric symmetries, applying multiple independent group transformations across spatial and temporal dimensions to relax these constraints. We introduce a novel formulation of the partially observable Markov decision process (POMDP) that incorporates the non-isometric symmetry structures, and propose a simple yet effective data augmentation method, Multi-Group Equivariance Augmentation (MEA). We integrate MEA with offline reinforcement learning to enhance sampling efficiency, and introduce a voxel-based visual representation that preserves translational equivariance. Extensive simulation and real-robot experiments across two manipulation domains demonstrate the effectiveness of our approach.
- Abstract(参考訳): 実世界のロボット操作における視覚運動学習の展開には、サンプリング効率が不可欠である。
タスク対称性は効率を改善するために有望な帰納バイアスとして現れてきたが、以前の作業のほとんどは等尺対称性に限られており、すべてのタイムステップにわたって全てのタスクオブジェクトに同じグループ変換を適用している。
本研究では、非等尺対称性を探求し、空間的および時間的次元にわたる複数の独立群変換を適用してこれらの制約を緩和する。
本稿では、非等尺対称性構造を組み込んだ部分的に観測可能なマルコフ決定過程(POMDP)の新規な定式化を提案し、単純で効果的なデータ拡張法であるMulti-Group Equivariance Augmentation(MEA)を提案する。
我々は,MEAとオフライン強化学習を統合してサンプリング効率を向上させるとともに,翻訳等価性を保ったボクセルに基づく視覚表現を導入する。
2つの操作領域にわたる大規模なシミュレーションと実ロボット実験により,本手法の有効性が示された。
関連論文リスト
- Symmetries-enhanced Multi-Agent Reinforcement Learning [25.383183391244373]
エージェントが複雑な協調行動を学ぶための強力なフレームワークとして、マルチエージェント強化学習が登場した。
近年の進歩は、システム固有の対称性を政策に組み込むことによって、これらの問題を緩和しようとしている。
本稿では,マルチエージェントシステムに外部対称性を組み込むための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2025-01-02T08:41:31Z) - Equivariant Reinforcement Learning under Partial Observability [18.87759041528553]
本稿では,対称性が効果的な学習に有用な帰納的バイアスとなる部分観測可能な領域を同定する。
我々のアクター批判型強化学習エージェントは、過去におけるソリューションを、関連するシナリオで再利用することができる。
論文 参考訳(メタデータ) (2024-08-26T15:07:01Z) - Interpetable Target-Feature Aggregation for Multi-Task Learning based on Bias-Variance Analysis [53.38518232934096]
マルチタスク学習(MTL)は、タスク間の共有知識を活用し、一般化とパフォーマンスを改善するために設計された強力な機械学習パラダイムである。
本稿では,タスククラスタリングと特徴変換の交点におけるMTL手法を提案する。
両段階において、鍵となる側面は減った目標と特徴の解釈可能性を維持することである。
論文 参考訳(メタデータ) (2024-06-12T08:30:16Z) - The Common Stability Mechanism behind most Self-Supervised Learning
Approaches [64.40701218561921]
自己指導型学習手法の安定性のメカニズムを説明するための枠組みを提供する。
我々は,BYOL,SWAV,SimSiam,Barlow Twins,DINOなどの非コントラスト技術であるSimCLRの動作メカニズムについて議論する。
私たちは異なる仮説を定式化し、Imagenet100データセットを使ってそれらをテストします。
論文 参考訳(メタデータ) (2024-02-22T20:36:24Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Learning Multiscale Consistency for Self-supervised Electron Microscopy
Instance Segmentation [48.267001230607306]
本稿では,EMボリュームのマルチスケール一貫性を高める事前学習フレームワークを提案する。
当社のアプローチでは,強力なデータ拡張と弱いデータ拡張を統合することで,Siameseネットワークアーキテクチャを活用している。
効果的にボクセルと機能の一貫性をキャプチャし、EM分析のための転送可能な表現を学習する。
論文 参考訳(メタデータ) (2023-08-19T05:49:13Z) - Exploiting Symmetry and Heuristic Demonstrations in Off-policy
Reinforcement Learning for Robotic Manipulation [1.7901837062462316]
本稿では,物理ロボット環境に存在する自然対称性を定義し,組み込むことを目的とする。
提案手法は,産業用アームの2つのポイント・ツー・ポイント・リーチタスクによって,障害物を伴わずに検証される。
提案手法と従来の非政治強化学習アルゴリズムとの比較研究は,アプリケーションにおける学習性能と潜在的価値の優位性を示している。
論文 参考訳(メタデータ) (2023-04-12T11:38:01Z) - Multi-Symmetry Ensembles: Improving Diversity and Generalization via
Opposing Symmetries [14.219011458423363]
我々は,対称性軸に沿った仮説の多重性を捉えることで,多様なアンサンブルを構築するためのフレームワークであるマルチサイメトリ・アンサンブル(MSE)を提案する。
MSEは、ImageNetのような大規模で多様なデータセットでしばしば必要とされる矛盾する仮説の多重性を効果的にキャプチャする。
その固有の多様性の結果、MSEは分類性能、不確実な定量化、一連の伝達タスクの一般化を改善している。
論文 参考訳(メタデータ) (2023-03-04T19:11:54Z) - MAML is a Noisy Contrastive Learner [72.04430033118426]
モデルに依存しないメタラーニング(MAML)は、今日では最も人気があり広く採用されているメタラーニングアルゴリズムの1つである。
我々は、MAMLの動作メカニズムに対する新たな視点を提供し、以下に示すように、MAMLは、教師付きコントラスト目的関数を用いたメタラーナーに類似している。
このような干渉を軽減するため, 単純だが効果的な手法であるゼロ化手法を提案する。
論文 参考訳(メタデータ) (2021-06-29T12:52:26Z) - Task-Feature Collaborative Learning with Application to Personalized
Attribute Prediction [166.87111665908333]
本稿では,TFCL(Task-Feature Collaborative Learning)と呼ばれる新しいマルチタスク学習手法を提案する。
具体的には、まず、特徴とタスクの協調的なグループ化を活用するために、不均一なブロック対角構造正規化器を用いたベースモデルを提案する。
実際の拡張として,重なり合う機能と難易度を区別することで,基本モデルを拡張します。
論文 参考訳(メタデータ) (2020-04-29T02:32:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。