論文の概要: Shortcut Learning in Generalist Robot Policies: The Role of Dataset Diversity and Fragmentation
- arxiv url: http://arxiv.org/abs/2508.06426v1
- Date: Fri, 08 Aug 2025 16:14:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-11 20:39:06.29707
- Title: Shortcut Learning in Generalist Robot Policies: The Role of Dataset Diversity and Fragmentation
- Title(参考訳): 汎用ロボット政策におけるショートカット学習 : データセットの多様性とフラグメンテーションの役割
- Authors: Youguang Xing, Xu Luo, Junlin Xie, Lianli Gao, Hengtao Shen, Jingkuan Song,
- Abstract要約: Open X-Embodiment (OXE)のような大規模データセットでトレーニングされた汎用的なロボットポリシーは、幅広いタスクにわたって強力なパフォーマンスを示している。
彼らはしばしば、トレーニングデータの分布を超えて一般化するのに苦労する。
我々は,ショートカット学習を一般化の鍵となる障害として認識する。
- 参考スコア(独自算出の注目度): 117.54237701533805
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalist robot policies trained on large-scale datasets such as Open X-Embodiment (OXE) demonstrate strong performance across a wide range of tasks. However, they often struggle to generalize beyond the distribution of their training data. In this paper, we investigate the underlying cause of this limited generalization capability. We identify shortcut learning -- the reliance on task-irrelevant features -- as a key impediment to generalization. Through comprehensive theoretical and empirical analysis, we uncover two primary contributors to shortcut learning: (1) limited diversity within individual sub-datasets, and (2) significant distributional disparities across sub-datasets, leading to dataset fragmentation. These issues arise from the inherent structure of large-scale datasets like OXE, which are typically composed of multiple sub-datasets collected independently across varied environments and embodiments. Our findings provide critical insights into dataset collection strategies that can reduce shortcut learning and enhance the generalization ability of generalist robot policies. Moreover, in scenarios where acquiring new large-scale data is impractical, we demonstrate that carefully selected robotic data augmentation strategies can effectively reduce shortcut learning in existing offline datasets, thereby improving generalization capabilities of generalist robot policies, e.g., $\pi_0$, in both simulation and real-world environments. More information at https://lucky-light-sun.github.io/proj/shortcut-learning-in-grps/.
- Abstract(参考訳): Open X-Embodiment (OXE)のような大規模データセットでトレーニングされた汎用的なロボットポリシーは、幅広いタスクにわたって強力なパフォーマンスを示している。
しかし、彼らはトレーニングデータの分布を超えて一般化するのに苦労することが多い。
本稿では,この限定的な一般化能力の根本原因について考察する。
我々は、タスク非関連機能に依存しているショートカット学習を、一般化の鍵となる障害として認識する。
包括的理論的および経験的分析により,(1)個々のサブデータセット内での多様性の制限,(2)サブデータセット間での分布格差の顕著化,およびデータセットの断片化につながる2つの主要な要因が明らかになった。
これらの問題は、OXEのような大規模データセットの固有の構造から生じており、通常、様々な環境や実施形態で独立して収集された複数のサブデータセットから構成される。
本研究は,機械学習のショートカットを削減し,汎用的なロボットポリシーの一般化能力を高めるための,データセット収集戦略に関する重要な知見を提供する。
さらに,新たな大規模データ取得が現実的でないシナリオでは,慎重に選択したロボットデータ拡張戦略が,既存のオフラインデータセットにおけるショートカット学習を効果的に削減し,シミュレーションと実環境の両方において一般的なロボットポリシーである$\pi_0$の一般化能力を向上させることを実証する。
詳細はhttps://lucky-light-sun.github.io/proj/shortcut-learning-in-grps/を参照のこと。
関連論文リスト
- What Matters in Learning from Large-Scale Datasets for Robot Manipulation [12.703188997313223]
我々はこの質問に答えるために大規模なデータセット合成研究を行っている。
既存のデータセットの多様性の共通源を手続き的にエミュレートするデータ生成フレームワークを開発した。
カメラのポーズや空間配置は、収集における多様性と検索におけるアライメントの両方にとって重要な次元であることがわかった。
論文 参考訳(メタデータ) (2025-06-16T14:25:29Z) - STRAP: Robot Sub-Trajectory Retrieval for Augmented Policy Learning [8.860366821983211]
STRAPは、トレーニング済みの視覚基盤モデルと動的時間ワープを利用して、大規模なトレーニングコーパスからトラジェクトリのサブシーケンスを堅牢に検索する技術である。
本研究では、事前学習された視覚基盤モデルと動的時間ワープを活用して、大規模学習コーパスからのトラジェクトリのサブシーケンスをロバストに検索するSTRAPを提案する。
論文 参考訳(メタデータ) (2024-12-19T18:54:06Z) - Efficient Data Collection for Robotic Manipulation via Compositional Generalization [70.76782930312746]
本研究では, 環境要因をデータから構成し, 未確認の要因の組み合わせに遭遇した場合に成功できることを示す。
コンポジションを利用したドメイン内データ収集手法を提案する。
ビデオはhttp://iliad.stanford.edu/robot-data-comp/で公開しています。
論文 参考訳(メタデータ) (2024-03-08T07:15:38Z) - Generalization with Lossy Affordances: Leveraging Broad Offline Data for
Learning Visuomotor Tasks [65.23947618404046]
本研究では,広範囲なデータを用いたオフライン強化学習を通じて,時間的拡張タスクの目標条件付きポリシを取得するフレームワークを提案する。
新たなタスク目標に直面した場合、フレームワークは余裕モデルを使用して、元のタスクをより簡単な問題に分解するサブゴールとして、損失のある表現のシーケンスを計画する。
我々は,従来の作業からロボット体験の大規模データセットを事前学習し,手動の報酬工学を使わずに視覚入力から,新しいタスクを効率的に微調整できることを実証した。
論文 参考訳(メタデータ) (2022-10-12T21:46:38Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Few-Shot Unsupervised Continual Learning through Meta-Examples [21.954394608030388]
教師なしメタコンチネンタル学習とタスクのバランスが取れない新しい複雑な設定を導入する。
我々は、破滅的な忘れを同時に軽減し、新しいタスクへの一般化を優先するメタラーニング手法を利用する。
数ショットの学習ベンチマークによる実験結果から, 教師付きケースと比較して, 競争性能が向上した。
論文 参考訳(メタデータ) (2020-09-17T07:02:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。