論文の概要: Geometric Entropy: When Trajectory Diversity Helps and Hurts in Imitation Learning
- arxiv url: http://arxiv.org/abs/2606.20871v1
- Date: Thu, 18 Jun 2026 19:02:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 12:22:57.21477
- Title: Geometric Entropy: When Trajectory Diversity Helps and Hurts in Imitation Learning
- Title(参考訳): 幾何学的エントロピー:模倣学習における軌跡の多様性とハート
- Authors: Qian Luo, Ruizhe Liu, Pei Zhou, Xunzhe Zhou, Yanchao Yang,
- Abstract要約: 本研究では,実演における軌道形状の多様性がモデル,タスク,データスケール間での模倣学習(IL)のパフォーマンスに与える影響について検討する。
本稿では,移動軌跡の内在的な多様性を定量化するタスク非依存の指標であるGeometric Entropy (H_G)を紹介する。
- 参考スコア(独自算出の注目度): 16.153147572760883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study how trajectory-shape diversity in demonstrations affects imitation learning (IL) performance across models, tasks, and data scales. We introduce Geometric Entropy (H_G), a task-agnostic metric that quantifies the intrinsic diversity of transit trajectories after normalizing away extrinsic variation, such as goal pose and workspace scale, via target-frame alignment. Across multiple IL architectures and both simulated and real-robot contact-rich manipulation tasks, we observe a consistent inverted-U relationship between success and H_G: increasing geometric diversity improves robustness in low-diversity regimes but degrades performance once diversity induces strategy ambiguity. Moreover, the optimal entropy shifts toward lower values as task mastery increases through more data, easier tasks, or stronger priors, and for a pretrained vision-language-action model the trend becomes effectively monotonic decreasing. Practically, H_G enables fast pre-training auditing of demonstration datasets and offers a simple guideline for calibrating demonstrations toward the learnable regime.
- Abstract(参考訳): 本研究では,実演における軌道形状の多様性がモデル,タスク,データスケール間での模倣学習(IL)のパフォーマンスに与える影響について検討する。
本稿では,目標ポーズやワークスペーススケールといった外在的変動を正規化した後の移動軌跡の内在的多様性を目標フレームアライメントによって定量化するタスク非依存的指標であるGeometric Entropy(H_G)を紹介する。
複数のILアーキテクチャと、シミュレーションおよび実ロボットのコンタクトリッチな操作タスクの両方にわたって、我々は成功とH_Gの間の一貫した逆U関係を観察する。
さらに、タスクマスタリーがより多くのデータ、より簡単なタスク、より強力な事前処理を通じて増加するにつれて、最適なエントロピーは低い値へとシフトする。
実際に、H_Gは、デモデータセットの高速な事前トレーニング監査を可能にし、学習可能な体制に向けたデモを校正するための簡単なガイドラインを提供する。
関連論文リスト
- SPARD: Self-Paced Curriculum for RL Alignment via Integrating Reward Dynamics and Data Utility [71.76390626651254]
本研究では,学習の進捗を把握し,多目的報酬重み付けとデータ重要度を動的に調整し,自己完結型カリキュラムを構築するフレームワークであるSPARDを提案する。
複数のベンチマークにわたる大規模な実験により、SPARDはすべてのドメインにわたるモデル機能を大幅に強化することが示された。
論文 参考訳(メタデータ) (2026-04-09T05:37:22Z) - One-Policy-Fits-All: Geometry-Aware Action Latents for Cross-Embodiment Manipulation [51.66470249744105]
ロボット操作のスケーラビリティ向上には,クロス・エボディメント操作が不可欠である。
我々は,複数の実施形態をまたいだ多目的政策を学習可能なフレームワークであるOneFits-All(OPFA)を提案する。
論文 参考訳(メタデータ) (2026-03-15T17:59:08Z) - Diversity You Can Actually Measure: A Fast, Model-Free Diversity Metric for Robotics Datasets [12.45101201787042]
ロボット模倣学習におけるデータセットの多様性が一般化性能に与える影響について検討する。
本稿では、エントロピーを最大化するデモのサブセットを選択するデータキュレーションアルゴリズムであるFAKTUALを紹介する。
FAKTUALは,ロボット模倣学習において,データセットの多様性を理解し,改善するための実用的なツールであることが示唆された。
論文 参考訳(メタデータ) (2026-03-12T07:54:43Z) - Gradient Similarity Surgery in Multi-Task Deep Learning [1.2299544525529198]
本研究は、最適化過程を導くために、勾配等級類似度尺度に基づく新しい勾配手術法を導入する。
similarity-Aware Momentum Gradient Surgery (SAM-GS) は1次運動量の勾配等化と変調を採用する。
論文 参考訳(メタデータ) (2025-06-06T14:40:50Z) - Self-Controlled Dynamic Expansion Model for Continual Learning [10.447232167638816]
本稿では, 自己制御型動的拡張モデル(SCDEM)を提案する。
SCDEMは複数のトレーニング可能なトレーニング済みのViTバックボーンを編成し、多様で意味的に豊かな表現を提供する。
提案手法の有効性を評価するため,幅広い実験が実施されている。
論文 参考訳(メタデータ) (2025-04-14T15:22:51Z) - Beyond Losses Reweighting: Empowering Multi-Task Learning via the Generalization Perspective [61.10883077161432]
マルチタスク学習(MTL)は、共有バックボーンを使用して複数の目的を同時に最適化するために、ディープニューラルネットワークを訓練する。
本稿では,重み摂動を利用して勾配ノルムを規制し,一般化を改善する新しいMTLフレームワークを提案する。
本手法は,タスク性能とモデル全体のロバスト性の観点から,既存の勾配に基づくMTL技術よりも大幅に優れる。
論文 参考訳(メタデータ) (2022-11-24T17:19:30Z) - Revisiting Consistency Regularization for Semi-Supervised Learning [80.28461584135967]
そこで我々は,FeatDistLossというシンプルな手法により,一貫性の規則化を改良したフレームワークを提案する。
実験結果から,本モデルは様々なデータセットや設定のための新しい技術状態を定義する。
論文 参考訳(メタデータ) (2021-12-10T20:46:13Z) - Visual Adversarial Imitation Learning using Variational Models [60.69745540036375]
逆関数仕様は、深い強化学習を通しての学習行動にとって大きな障害であり続けている。
望ましい行動の視覚的なデモンストレーションは、エージェントを教えるためのより簡単で自然な方法を示すことが多い。
変動モデルに基づく対向的模倣学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-07-16T00:15:18Z) - Task-Feature Collaborative Learning with Application to Personalized
Attribute Prediction [166.87111665908333]
本稿では,TFCL(Task-Feature Collaborative Learning)と呼ばれる新しいマルチタスク学習手法を提案する。
具体的には、まず、特徴とタスクの協調的なグループ化を活用するために、不均一なブロック対角構造正規化器を用いたベースモデルを提案する。
実際の拡張として,重なり合う機能と難易度を区別することで,基本モデルを拡張します。
論文 参考訳(メタデータ) (2020-04-29T02:32:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。