論文の概要: Diversity You Can Actually Measure: A Fast, Model-Free Diversity Metric for Robotics Datasets
- arxiv url: http://arxiv.org/abs/2603.11634v1
- Date: Thu, 12 Mar 2026 07:54:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.715271
- Title: Diversity You Can Actually Measure: A Fast, Model-Free Diversity Metric for Robotics Datasets
- Title(参考訳): ロボットデータセットのための高速でモデルなしの多様性メトリクス
- Authors: Sreevardhan Sirigiri, Nathan Samuel de Lara, Christopher Agia, Florian Shkurti, Fabio Ramos,
- Abstract要約: ロボット模倣学習におけるデータセットの多様性が一般化性能に与える影響について検討する。
本稿では、エントロピーを最大化するデモのサブセットを選択するデータキュレーションアルゴリズムであるFAKTUALを紹介する。
FAKTUALは,ロボット模倣学習において,データセットの多様性を理解し,改善するための実用的なツールであることが示唆された。
- 参考スコア(独自算出の注目度): 12.45101201787042
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robotics datasets for imitation learning typically consist of long-horizon trajectories of different lengths over states, actions, and high-dimensional observations (e.g., RGB video), making it non-trivial to quantify diversity in a way that respects the underlying trajectory structure and geometry. We extend Shannon and von Neumann entropy to this setting by defining signature transform-based entropy on the Gram matrix of a signature kernel over demonstrations, yielding entropy and diversity metrics that operate directly on the demonstration dataset. Building on these metrics, we study how dataset diversity affects generalization performance in robot imitation learning and propose a simple, model-free way to curate diverse demonstrations. We introduce FAKTUAL (FAst trajectory Kernel enTropy cUration for imitation Learning), a data curation algorithm that selects a subset of demonstrations maximizing entropy given a subset-size budget. FAKTUAL is fully model-free, requires no access to the imitation policy or rollouts, and adds negligible overhead relative to policy training. We evaluate our approach on image and state-based RoboMimic and MetaWorld benchmarks, as well as four real-world manipulation tasks. Across tasks and architectures, diversity-aware curation with FAKTUAL consistently improves downstream success rates over random selection, while being substantially more computationally efficient compared to recent robot data curation methods. Our results suggest that the entropy of demonstration datasets is a practical tool for understanding and improving dataset diversity in robot imitation learning.
- Abstract(参考訳): 模倣学習のためのロボットデータセットは、通常、状態、行動、高次元の観察(例えばRGBビデオ)に対して異なる長さの長い水平軌道から成り、基礎となる軌道構造と幾何学を尊重する方法で多様性を定量化することは簡単ではない。
我々は、シグネチャカーネルのグラム行列上で、シグネチャ変換に基づくエントロピーを定義することで、シグネチャカーネルのエントロピーとフォン・ノイマンエントロピーをこの設定に拡張し、デモデータセット上で直接動作するエントロピーと多様性のメトリクスを得る。
これらの指標に基づいて、ロボット模倣学習におけるデータセットの多様性が一般化性能にどのように影響するかを考察し、多様な実演をカリキュラム化するための単純でモデルなしの方法を提案する。
本稿では,データキュレーションアルゴリズムであるFAKTUAL(FAst trajectory Kernel enTropy cUration for mimicion Learning)を紹介する。
FAKTUALは完全にモデルフリーで、模倣ポリシーやロールアウトへのアクセスを必要としない。
画像および状態に基づくRoboMimicおよびMetaWorldベンチマークおよび4つの実世界の操作タスクに対するアプローチを評価した。
タスクやアーキテクチャ全体にわたって、FAKTUALによる多様性を意識したキュレーションは、最近のロボットデータキュレーション法に比べてはるかに計算効率が良く、ランダム選択よりも下流の成功率を一貫して改善する。
この結果から,ロボット模倣学習におけるデータセットの多様性の理解と改善のための実践的ツールとして,実証データセットのエントロピーが示唆された。
関連論文リスト
- ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning [31.000965640377128]
ABot-M0は、システマティックデータキュレーションパイプラインを構築するフレームワークである。
これは不均一な生データを統一的で効率的な表現にエンドツーエンドに変換することを可能にする。
ABot-M0はデュアルストリーム機構を通じてモジュール認識をサポートする。
論文 参考訳(メタデータ) (2026-02-11T16:47:01Z) - Is Diversity All You Need for Scalable Robotic Manipulation? [50.747150672933316]
ロボット学習におけるデータ多様性の役割について,従来の「より多様な方がよい」という直観に固執する3つの重要な次元(タスク),実施形態(ロボットの使用方法),専門家(専門家)を用いて検討する。
タスクの多様性は、タスクごとのデモンストレーション量よりも重要であり、多様な事前学習タスクから新しい下流シナリオへの移行に有効であることを示す。
本稿では,速度のあいまいさを緩和する分散デバイアス法を提案する。GO-1-Proは,2.5倍の事前学習データを用いて,15%の性能向上を実現している。
論文 参考訳(メタデータ) (2025-07-08T17:52:44Z) - What Matters in Learning from Large-Scale Datasets for Robot Manipulation [12.703188997313223]
我々はこの質問に答えるために大規模なデータセット合成研究を行っている。
既存のデータセットの多様性の共通源を手続き的にエミュレートするデータ生成フレームワークを開発した。
カメラのポーズや空間配置は、収集における多様性と検索におけるアライメントの両方にとって重要な次元であることがわかった。
論文 参考訳(メタデータ) (2025-06-16T14:25:29Z) - AdaDemo: Data-Efficient Demonstration Expansion for Generalist Robotic Agent [75.91274222142079]
本研究では,汎用ロボットエージェントの学習を容易にするために,データ効率のよい方法で実演をスケールアップすることを目的とする。
AdaDemoは、デモデータセットを積極的に継続的に拡張することで、マルチタスクポリシー学習を改善するように設計されたフレームワークである。
論文 参考訳(メタデータ) (2024-04-11T01:59:29Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Curriculum-Based Imitation of Versatile Skills [15.97723808124603]
模倣による学習スキルは、ロボットの直感的な教育にとって有望な概念である。
このようなスキルを学ぶ一般的な方法は、デモが与えられた可能性の最大化によってパラメトリックモデルを学ぶことである。
しかし、人間のデモンストレーションはしばしばマルチモーダルであり、同じタスクは複数の方法で解決される。
論文 参考訳(メタデータ) (2023-04-11T12:10:41Z) - A System for Morphology-Task Generalization via Unified Representation
and Behavior Distillation [28.041319351752485]
本研究では,多量の熟練した行動データを蒸留することにより,様々な形態のエージェントを操り,様々なタスクをこなす単一ポリシーを学習する方法について検討する。
本稿では, 観測, 行動, 目標/タスクを統一されたグラフ表現で扱うモルフォロジー・タスクグラフを紹介する。
また,多種多様な形態とタスクの組み合わせの手続き的生成を支援する高速な大規模行動生成のためのMxT-Benchを開発した。
論文 参考訳(メタデータ) (2022-11-25T18:52:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。