論文の概要: Zero-Shot Generalization from Motion Demonstrations to New Tasks
- arxiv url: http://arxiv.org/abs/2603.15445v1
- Date: Mon, 16 Mar 2026 15:46:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.875455
- Title: Zero-Shot Generalization from Motion Demonstrations to New Tasks
- Title(参考訳): 動作デモから新しいタスクへのゼロショット一般化
- Authors: Kilian Freitag, Alvin Combrink, Nadia Figueroa,
- Abstract要約: 専門家によるデモンストレーションから行動ポリシーを学ぶことは、現代ロボット工学において必須のパラダイムである。
本研究では,共有作業空間内で孤立的な実演を組み合わせることの問題を定式化し,課題の一般化を可能にする。
このグラフを利用する2つのフレームワークを提案する: 時変DSを構築するためのスティッチングと、複雑な動きのためのシーケンスベースのDSを提供するチェインニングである。
- 参考スコア(独自算出の注目度): 7.359962178534361
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning motion policies from expert demonstrations is an essential paradigm in modern robotics. While end-to-end models aim for broad generalization, they require large datasets and computationally heavy inference. Conversely, learning dynamical systems (DS) provides fast, reactive, and provably stable control from very few demonstrations. However, existing DS learning methods typically model isolated tasks and struggle to reuse demonstrations for novel behaviors. In this work, we formalize the problem of combining isolated demonstrations within a shared workspace to enable generalization to unseen tasks. The Gaussian Graph is introduced, which reinterprets spatial components of learned motion primitives as discrete vertices with connections to one another. This formulation allows us to bridge continuous control with discrete graph search. We propose two frameworks leveraging this graph: Stitching, for constructing time-invariant DSs, and Chaining, giving a sequence-based DS for complex motions while retaining convergence guarantees. Simulations and real-robot experiments show that these methods successfully generalize to new tasks where baseline methods fail.
- Abstract(参考訳): 専門家によるデモンストレーションから行動ポリシーを学ぶことは、現代ロボット工学において必須のパラダイムである。
エンド・ツー・エンドのモデルは広範な一般化を目指しているが、大きなデータセットと計算学的に重い推論が必要である。
逆に、動的システム(DS)の学習は、非常に少数のデモから高速で、リアクティブで、確実に安定した制御を提供する。
しかし、既存のDS学習手法は、通常、孤立したタスクをモデル化し、新しい振る舞いのデモを再利用するのに苦労する。
本研究では,共有作業空間内で孤立的な実演を組み合わせることの問題を定式化し,課題の一般化を可能にする。
ガウスグラフ(英: Gaussian Graph)は、学習された運動プリミティブの空間成分を互いに接続した離散頂点として再解釈するグラフである。
この定式化により、離散グラフ探索による連続的な制御をブリッジできる。
このグラフを利用する2つのフレームワークを提案する: 時間不変のDSを構築するためのスティッチングと、コンバージェンス保証を維持しつつ複雑な動きに対してシーケンスベースのDSを与えるチェインニングである。
シミュレーションと実ロボット実験により、これらの手法がベースライン法が失敗する新しいタスクにうまく一般化できることが示されている。
関連論文リスト
- Learning with Preserving for Continual Multitask Learning [4.847042727427382]
タスク出力の保存から共有表現空間の維持に焦点を移す新しいフレームワークであるLawP(Learning with Preserving)を紹介した。
LwPは破滅的な忘れを緩和するだけでなく、CMTLタスクにおける最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-11-11T22:23:20Z) - Cross-Modal Instructions for Robot Motion Generation [7.445072780282545]
本稿では,ロボットが粗いアノテーションの形でデモによって形づくられる,クロスモーダルな指示からの学習を紹介する。
そこで,CrossInstructフレームワークを紹介した。このフレームワークは,視覚言語モデルに対する文脈入力の例として,クロスモーダル命令を統合する。
次に、VLMは小さな細調整されたモデルを反復的にクエリし、複数の2Dビュー上で所望の動作を合成する。
大規模VLMの推論をきめ細かなポインティングモデルに組み込むことで、CrossInstructは限られた指導例の環境を超えて一般化する実行可能なロボット動作を生成する。
論文 参考訳(メタデータ) (2025-09-25T12:54:00Z) - Sports-Traj: A Unified Trajectory Generation Model for Multi-Agent Movement in Sports [53.637837706712794]
任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。
具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを紹介する。
バスケットボールU,サッカーU,サッカーUの3つの実践的スポーツデータセットをベンチマークして評価を行った。
論文 参考訳(メタデータ) (2024-05-27T22:15:23Z) - Deep Learning for Koopman-based Dynamic Movement Primitives [0.0]
実証から学ぶために,クープマン演算子と動的運動プリミティブの理論を結合して新しいアプローチを提案する。
我々のアプローチは glsadmd と呼ばれ、非線形力学系を線形潜在空間に射影し、解が所望の複素運動を再現する。
我々の結果は、LASAハンドライトデータセット上の拡張動的モード分解に匹敵するが、わずかな文字のトレーニングしか行わない。
論文 参考訳(メタデータ) (2023-12-06T07:33:22Z) - Contrastive Example-Based Control [163.6482792040079]
報酬関数ではなく多段階遷移の暗黙的なモデルを学ぶオフラインのサンプルベース制御法を提案する。
状態ベースおよび画像ベースのオフライン制御タスクの範囲で、学習された報酬関数を使用するベースラインよりも優れています。
論文 参考訳(メタデータ) (2023-07-24T19:43:22Z) - Interactive Character Control with Auto-Regressive Motion Diffusion Models [18.727066177880708]
リアルタイム動作合成のためのA-MDM(Auto-Regressive Motion Diffusion Model)を提案する。
我々の条件拡散モデルは初期ポーズを入力とし、前者のフレームに条件付けられた連続した動きフレームを自動回帰的に生成する。
本稿では,タスク指向サンプリング,インペインティング,階層的強化学習など,対話型制御をA-MDMに組み込む一連の手法を紹介する。
論文 参考訳(メタデータ) (2023-06-01T07:48:34Z) - Leveraging Demonstrations with Latent Space Priors [90.56502305574665]
本稿では,スキル学習とシーケンスモデリングを組み合わせることで,実演データセットを活用することを提案する。
本研究では、国家のみのモーションキャプチャーの実証から、そのような先行情報をどうやって取得するかを示し、政策学習に組み込むためのいくつかの方法を探る。
実験結果から, 学習速度と最終性能において, 遅延空間が顕著に向上することが確認された。
論文 参考訳(メタデータ) (2022-10-26T13:08:46Z) - Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors [72.62423312645953]
人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変化させる。
現在のImitation Learningアルゴリズムは、通常、単調な専門家によるデモンストレーションのみを考慮し、状態アクションベースの設定で行動する。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
論文 参考訳(メタデータ) (2022-10-17T16:42:59Z) - Motion Aware Self-Supervision for Generic Event Boundary Detection [14.637933739152315]
ジェネリックイベント境界検出(GEBD)は、人間によって自然に認識されるビデオのモーメントを、ジェネリックおよび分類なしのイベント境界として検出することを目的としている。
既存のアプローチは、アーキテクチャ設計の選択の観点から非常に複雑で洗練されたパイプラインを含んでいる。
我々は,GEBDタスクにおける空間的・時間的多様性に対処するため,簡便で効果的な自己教師付き手法を再検討し,異なる動作特徴学習モジュールで拡張する。
論文 参考訳(メタデータ) (2022-10-11T16:09:13Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。