論文の概要: Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors
- arxiv url: http://arxiv.org/abs/2210.08121v1
- Date: Mon, 17 Oct 2022 16:42:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 21:34:12.247540
- Title: Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors
- Title(参考訳): 幾何ディスクリプタのマッチングによる多用途行動の推定
- Authors: Niklas Freymuth, Nicolas Schreiber, Philipp Becker, Aleksander
Taranovic, Gerhard Neumann
- Abstract要約: 人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変化させる。
現在のImitation Learningアルゴリズムは、通常、単調な専門家によるデモンストレーションのみを考慮し、状態アクションベースの設定で行動する。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
- 参考スコア(独自算出の注目度): 72.62423312645953
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans intuitively solve tasks in versatile ways, varying their behavior in
terms of trajectory-based planning and for individual steps. Thus, they can
easily generalize and adapt to new and changing environments. Current Imitation
Learning algorithms often only consider unimodal expert demonstrations and act
in a state-action-based setting, making it difficult for them to imitate human
behavior in case of versatile demonstrations. Instead, we combine a mixture of
movement primitives with a distribution matching objective to learn versatile
behaviors that match the expert's behavior and versatility. To facilitate
generalization to novel task configurations, we do not directly match the
agent's and expert's trajectory distributions but rather work with concise
geometric descriptors which generalize well to unseen task configurations. We
empirically validate our method on various robot tasks using versatile human
demonstrations and compare to imitation learning algorithms in a state-action
setting as well as a trajectory-based setting. We find that the geometric
descriptors greatly help in generalizing to new task configurations and that
combining them with our distribution-matching objective is crucial for
representing and reproducing versatile behavior.
- Abstract(参考訳): 人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変える。
したがって、彼らは簡単に一般化し、新しく変化する環境に適応できる。
現在の模倣学習アルゴリズムは、ユニモーダルな専門家によるデモンストレーションのみを考慮し、状態に基づく設定で行動することが多いため、多用途なデモンストレーションの場合、人間の行動を模倣することが困難である。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
新たなタスク構成への一般化を容易にするため、エージェントとエキスパートの軌道分布を直接一致させるのではなく、見当たらないタスク構成に一般化した簡潔な幾何学的記述子で作業する。
本手法は,多彩な人間の実演を用いて,様々なロボットタスクにおいて実験的に検証し,状態動作設定と軌道に基づく設定で模倣学習アルゴリズムと比較する。
幾何学的記述子は,新しいタスク構成への一般化に大きく寄与し,分布マッチングの目的と組み合わせることが,多目的行動の表現と再現に不可欠であることがわかった。
関連論文リスト
- One-shot Imitation in a Non-Stationary Environment via Multi-Modal Skill [6.294766893350108]
本稿では,ワンショット模倣とゼロショット適応が可能なスキルベース模倣学習フレームワークを提案する。
視覚言語モデルを利用して、オフラインのビデオデータセットから設定したセマンティックスキルを学習する。
拡張された多段階のメタワールドタスクに対して,様々なワンショットの模倣シナリオでフレームワークを評価した。
論文 参考訳(メタデータ) (2024-02-13T11:01:52Z) - Leveraging sparse and shared feature activations for disentangled
representation learning [112.22699167017471]
本稿では,教師付きタスクの多種多様な集合から抽出した知識を活用し,共通不整合表現を学習することを提案する。
我々は6つの実世界分布シフトベンチマークと異なるデータモダリティに対するアプローチを検証する。
論文 参考訳(メタデータ) (2023-04-17T01:33:24Z) - Build generally reusable agent-environment interaction models [28.577502598559988]
本稿では,モデルの事前学習の問題に対処し,ダウンストリームタスク学習のためのバックボーンを一般に再利用する。
本稿では,様々なタスクをカバーしたエージェントの膨大な経験から,ドメイン不変な後継特徴を学習してエージェント環境相互作用モデルを構築し,それらを行動プロトタイプに識別する手法を提案する。
本研究では,事前学習した組立構造に基づく下流タスク学習が課題目標,環境力学,センサのモダリティの未確認変化を処理できる予備的な結果を提供する。
論文 参考訳(メタデータ) (2022-11-13T07:33:14Z) - Eliciting Compatible Demonstrations for Multi-Human Imitation Learning [16.11830547863391]
人間による実演からの模倣学習は、ロボット操作の学習ポリシーに対する強力なアプローチである。
自然の人間の行動は、タスクを示すのに最適な方法がいくつかあるため、多くの異種性を持っている。
このミスマッチは、インタラクティブな模倣学習の課題であり、ユーザのシーケンスは、新しい、おそらく矛盾するデモを反復的に収集することによって、ポリシーを改善する。
我々は、ポストホックフィルタリングにより互換性のないデモを識別し、新しいユーザから互換性のないデモを積極的に引き出すために互換性対策を適用することができることを示す。
論文 参考訳(メタデータ) (2022-10-14T19:37:55Z) - ASE: Large-Scale Reusable Adversarial Skill Embeddings for Physically
Simulated Characters [123.88692739360457]
汎用運動技術により、人間は複雑な作業を行うことができる。
これらのスキルは、新しいタスクを学ぶときの振る舞いを導くための強力な先駆者も提供します。
物理シミュレーション文字のための汎用的で再利用可能なスキル埋め込みを学習するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-04T06:13:28Z) - Leveraging convergence behavior to balance conflicting tasks in
multi-task learning [3.6212652499950138]
マルチタスク学習は、パフォーマンスの一般化を改善するために相関タスクを使用する。
タスクは互いに衝突することが多いため、複数のタスクの勾配をどのように組み合わせるべきかを定義するのは難しい。
バックプロパゲーション中の各タスクの重要度を調整する動的バイアスを生成するために,勾配の時間的挙動を考慮した手法を提案する。
論文 参考訳(メタデータ) (2022-04-14T01:52:34Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Distribution Matching for Heterogeneous Multi-Task Learning: a
Large-scale Face Study [75.42182503265056]
マルチタスク学習は、共有学習アルゴリズムによって複数のタスクを共同で学習する方法論として登場した。
我々は異種mtlに対処し,検出,分類,回帰問題を同時に解決する。
大規模な顔分析のための最初のフレームワークであるFaceBehaviorNetを構築し、すべての顔行動タスクを共同で学習する。
論文 参考訳(メタデータ) (2021-05-08T22:26:52Z) - Conditional Meta-Learning of Linear Representations [57.90025697492041]
表現学習のための標準メタラーニングは、複数のタスク間で共有される共通の表現を見つけることを目的とする。
本研究では,タスクの側情報を手作業に適した表現にマッピングし,条件付け関数を推定することで,この問題を克服する。
この利点を実用的に活用できるメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-30T12:02:14Z) - Meta Adaptation using Importance Weighted Demonstrations [19.37671674146514]
エージェントが新しいタスクを推測することが困難である場合も少なくない。
本稿では,特定のタスクの集合に関する事前知識を活用することで,関連するタスクを一般化する新しいアルゴリズムを提案する。
環境タスクの多様性からロボットを訓練し、目に見えない環境に適応できる実験を行った。
論文 参考訳(メタデータ) (2019-11-23T07:22:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。