論文の概要: RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations
- arxiv url: http://arxiv.org/abs/2411.16959v1
- Date: Mon, 25 Nov 2024 21:57:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-27 13:33:13.983036
- Title: RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations
- Title(参考訳): RoCoDA:実証から学ぶデータ効率の良いロボットのための対物的データ拡張
- Authors: Ezra Ameperosa, Jeremy A. Collins, Mrinal Jain, Animesh Garg,
- Abstract要約: 本稿では,模倣学習のためのデータ強化手法であるRoCoDAを紹介する。
我々は5つのロボット操作タスクに関する広範な実験を通じてRoCoDAを検証する。
我々の政策は、目に見えない物体のポーズ、テクスチャ、および邪魔者の存在に対する堅牢な一般化を示す。
- 参考スコア(独自算出の注目度): 32.829038346130375
- License:
- Abstract: Imitation learning in robotics faces significant challenges in generalization due to the complexity of robotic environments and the high cost of data collection. We introduce RoCoDA, a novel method that unifies the concepts of invariance, equivariance, and causality within a single framework to enhance data augmentation for imitation learning. RoCoDA leverages causal invariance by modifying task-irrelevant subsets of the environment state without affecting the policy's output. Simultaneously, we exploit SE(3) equivariance by applying rigid body transformations to object poses and adjusting corresponding actions to generate synthetic demonstrations. We validate RoCoDA through extensive experiments on five robotic manipulation tasks, demonstrating improvements in policy performance, generalization, and sample efficiency compared to state-of-the-art data augmentation methods. Our policies exhibit robust generalization to unseen object poses, textures, and the presence of distractors. Furthermore, we observe emergent behavior such as re-grasping, indicating policies trained with RoCoDA possess a deeper understanding of task dynamics. By leveraging invariance, equivariance, and causality, RoCoDA provides a principled approach to data augmentation in imitation learning, bridging the gap between geometric symmetries and causal reasoning.
- Abstract(参考訳): ロボット工学における模倣学習は、ロボット環境の複雑さとデータ収集のコストが高いため、一般化において大きな課題に直面している。
本稿では,データ拡張を模倣学習に役立てるために,単一のフレームワーク内での不変性,等分散性,因果性の概念を統一する新しい手法であるRoCoDAを紹介する。
RoCoDAは、ポリシーの出力に影響を与えることなく、環境状態のタスク非関連サブセットを変更することで因果不変性を利用する。
同時に、物体のポーズに剛体変換を適用し、対応する動作を調整することで、SE(3)の等価性を生かし、合成デモを生成する。
我々は,5つのロボット操作タスクに関する広範な実験を通じてRoCoDAを検証し,最新のデータ拡張手法と比較して,ポリシー性能,一般化,サンプル効率の改善を実証した。
我々の政策は、目に見えない物体のポーズ、テクスチャ、および邪魔者の存在に対する堅牢な一般化を示す。
さらに,リグラスピングなどの創発的行動も観察し,RoCoDAでトレーニングしたポリシーがタスクダイナミクスをより深く理解していることを示す。
不変性、等分散性、因果性を活用することで、RoCoDAは、幾何対称性と因果推論の間のギャップを埋める、模倣学習におけるデータ拡張に対する原則化されたアプローチを提供する。
関連論文リスト
- Towards Robust Out-of-Distribution Generalization: Data Augmentation and Neural Architecture Search Approaches [4.577842191730992]
我々は、ディープラーニングのための堅牢なOoD一般化への道を探る。
まず,認識に必須でない特徴間の素早い相関を解消するための,新しい効果的なアプローチを提案する。
次に,OoDシナリオにおけるニューラルアーキテクチャ探索の強化問題について検討する。
論文 参考訳(メタデータ) (2024-10-25T20:50:32Z) - Heterogeneous Learning Rate Scheduling for Neural Architecture Search on Long-Tailed Datasets [0.0]
本稿では,DARTSのアーキテクチャパラメータに適した適応学習率スケジューリング手法を提案する。
提案手法は,学習エポックに基づくアーキテクチャパラメータの学習率を動的に調整し,よく訓練された表現の破壊を防止する。
論文 参考訳(メタデータ) (2024-06-11T07:32:25Z) - The Risk of Federated Learning to Skew Fine-Tuning Features and
Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。
3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。
提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文 参考訳(メタデータ) (2024-01-25T09:18:51Z) - Understanding Robust Overfitting from the Feature Generalization Perspective [61.770805867606796]
逆行訓練(AT)は、逆行摂動を自然データに組み込むことで、堅牢なニューラルネットワークを構築する。
これはロバストオーバーフィッティング(RO)の問題に悩まされ、モデルのロバスト性を著しく損なう。
本稿では,新しい特徴一般化の観点からROを考察する。
論文 参考訳(メタデータ) (2023-10-01T07:57:03Z) - Implicit Counterfactual Data Augmentation for Robust Learning [24.795542869249154]
本研究では, 突発的相関を除去し, 安定した予測を行うために, インプリシト・カウンセショナル・データ拡張法を提案する。
画像とテキストのデータセットをカバーする様々なバイアス付き学習シナリオで実験が行われてきた。
論文 参考訳(メタデータ) (2023-04-26T10:36:40Z) - Improving GANs with A Dynamic Discriminator [106.54552336711997]
我々は、オンザフライで調整可能な判別器は、そのような時間変化に適応できると論じる。
総合的な実証研究により、提案したトレーニング戦略がDynamicDと呼ばれ、追加のコストやトレーニング目標を発生させることなく、合成性能を向上させることが確認された。
論文 参考訳(メタデータ) (2022-09-20T17:57:33Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - Knothe-Rosenblatt transport for Unsupervised Domain Adaptation [8.945289838882857]
教師なしドメイン適応(UDA)は、対象ドメインの共通タスクに取り組むために、関連するが異なるデータソースを活用することを目的としている。
我々はKnothe-Rosenblattトランスポートに基づくKnothe-Rosenblatt Domain Adaptation (KRDA)を提案する。
我々は,KRDAが,合成UDA問題と実世界のUDA問題の両方において最先端の性能を有することを示す。
論文 参考訳(メタデータ) (2021-10-06T13:04:28Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。