論文の概要: Towards Generalizable Robotic Data Flywheel: High-Dimensional Factorization and Composition
- arxiv url: http://arxiv.org/abs/2603.25583v1
- Date: Thu, 26 Mar 2026 16:00:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.371618
- Title: Towards Generalizable Robotic Data Flywheel: High-Dimensional Factorization and Composition
- Title(参考訳): 一般化可能なロボットデータフライホイールを目指して -高次元因子化と構成-
- Authors: Yuyang Xiao, Yifei Zhou, Haoran Wang, Wenxuan Ou, Yuxiao Liu,
- Abstract要約: 十分な多様なデータがないことは、ジェネラリストロボットモデルにとって大きなボトルネックとなっている。
本研究では,F-ACILを提案する。F-ACILは,構造化されたデータ因子化を実現するための反復学習フレームワークである。
実世界の大規模な実験により,F-ACILは45%以上の性能向上を達成できることが示されている。
- 参考スコア(独自算出の注目度): 15.755384541529098
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The lack of sufficiently diverse data, coupled with limited data efficiency, remains a major bottleneck for generalist robotic models, yet systematic strategies for collecting and curating such data are not fully explored. Task diversity arises from implicit factors that are sparsely distributed across multiple dimensions and are difficult to define explicitly. To address this challenge, we propose F-ACIL, a heuristic factor-aware compositional iterative learning framework that enables structured data factorization and promotes compositional generalization. F-ACIL decomposes the data distribution into structured factor spaces such as object, action, and environment. Based on the factorized formulation, we develop a factor-wise data collection and an iterative training paradigm that promotes compositional generalization over the high-dimensional factor space, leading to more effective utilization of real-world robotic demonstrations. With extensive real-world experiments, we show that F-ACIL can achieve more than 45% performance gains with 5-10$\times$ fewer demonstrations comparing to that of which without the strategy. The results suggest that structured factorization offers a practical pathway toward efficient compositional generalization in real-world robotic learning. We believe F-ACIL can inspire more systematic research on building generalizable robotic data flywheel strategies. More demonstrations can be found at: https://f-acil.github.io/
- Abstract(参考訳): 十分な多様なデータと限られたデータ効率の欠如は、ジェネラリストのロボットモデルにとって依然として大きなボトルネックとなっているが、そのようなデータの収集とキュレーションのための体系的な戦略は、完全には解明されていない。
タスクの多様性は、複数の次元に分散し、明確に定義することが難しい暗黙の要因から生じます。
この課題に対処するために、構造化されたデータ因子化を実現し、構成一般化を促進するヒューリスティックな因子を考慮した構成的反復学習フレームワークであるF-ACILを提案する。
F-ACILは、データ分散をオブジェクト、アクション、環境などの構造化された因子空間に分解する。
因子化定式化に基づいて,高次元因子空間における構成一般化を促進する因子データ収集と反復訓練パラダイムを開発し,実世界のロボットデモをより効果的に活用する。
実世界の大規模な実験により,F-ACILは5~10$\timesで45%以上の性能向上を達成できることを示す。
以上の結果から,構造化因子化は実世界のロボット学習における効率的な構成一般化への実践的な道筋となることが示唆された。
F-ACILは、汎用可能なロボットデータフライホイール戦略の構築において、より体系的な研究を促すことができると考えている。
さらなるデモは、https://f-acil.github.io/で見ることができる。
関連論文リスト
- Data Value in the Age of Scaling: Understanding LLM Scaling Dynamics Under Real-Synthetic Data Mixtures [32.89034139737846]
大規模言語モデル(LLM)は、実データと合成データをブレンドするデータセット上に構築されている。
合成データはスケーラビリティとコスト効率を提供するが、しばしば系統的な分散の相違をもたらす。
本稿では,大規模データセットにスケールする効果的なデータ評価手法を提案する。
論文 参考訳(メタデータ) (2025-11-17T17:53:12Z) - Fidelity-Aware Data Composition for Robust Robot Generalization [39.69070982795268]
大規模で視覚的に均質なデータセットで訓練された汎用的なロボットポリシーは、学習のショートカットに影響を受けやすい。
本稿では、ロバストな一般化は、原理的、忠実なデータ構成に依存することを示唆する。
本稿では,データ合成を最適化問題として扱うフレームワークであるCoherent Information Fidelity Tuning(CIFT)を紹介する。
論文 参考訳(メタデータ) (2025-09-29T13:48:36Z) - Shortcut Learning in Generalist Robot Policies: The Role of Dataset Diversity and Fragmentation [117.54237701533805]
Open X-Embodiment (OXE)のような大規模データセットでトレーニングされた汎用的なロボットポリシーは、幅広いタスクにわたって強力なパフォーマンスを示している。
彼らはしばしば、トレーニングデータの分布を超えて一般化するのに苦労する。
我々は,ショートカット学習を一般化の鍵となる障害として認識する。
論文 参考訳(メタデータ) (2025-08-08T16:14:01Z) - Does Data Scaling Lead to Visual Compositional Generalization? [21.242714408660508]
構成一般化は単なるデータスケールではなく,データの多様性によってもたらされる。
この構造が効率の鍵であることを証明し、ほとんど観測されていない組み合わせから完全な一般化を可能にする。
論文 参考訳(メタデータ) (2025-07-09T17:59:03Z) - Leveraging Large Language Models to Address Data Scarcity in Machine Learning: Applications in Graphene Synthesis [0.0]
材料科学における機械学習は、限られた実験データのために困難に直面している。
大規模言語モデル(LLM)を用いて機械学習の性能を向上させる戦略を提案する。
論文 参考訳(メタデータ) (2025-03-06T16:04:01Z) - Efficient Data Collection for Robotic Manipulation via Compositional Generalization [70.76782930312746]
本研究では, 環境要因をデータから構成し, 未確認の要因の組み合わせに遭遇した場合に成功できることを示す。
コンポジションを利用したドメイン内データ収集手法を提案する。
ビデオはhttp://iliad.stanford.edu/robot-data-comp/で公開しています。
論文 参考訳(メタデータ) (2024-03-08T07:15:38Z) - How Abilities in Large Language Models are Affected by Supervised Fine-tuning Data Composition [64.86360698067764]
本研究は, 教師付き微調整における数学的推論, コード生成, 一般人適応能力間のデータ合成の相互作用に着目した。
我々の実験では、異なる能力のスケールが異なり、より大きなモデルでは、通常、同じ量のデータで優れたパフォーマンスを示す。
その結果, 合成データの量は, 合成比よりも性能に影響を及ぼすことが示唆された。
論文 参考訳(メタデータ) (2023-10-09T07:56:16Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - Efficient Data-specific Model Search for Collaborative Filtering [56.60519991956558]
協調フィルタリング(CF)はレコメンダシステムの基本的なアプローチである。
本稿では,機械学習(AutoML)の最近の進歩を動機として,データ固有のCFモデルを設計することを提案する。
ここでキーとなるのは、最先端(SOTA)のCFメソッドを統一し、それらを入力エンコーディング、埋め込み関数、インタラクション、予測関数の非結合ステージに分割する新しいフレームワークである。
論文 参考訳(メタデータ) (2021-06-14T14:30:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。