論文の概要: Learning from demonstration using products of experts: applications to
manipulation and task prioritization
- arxiv url: http://arxiv.org/abs/2010.03505v1
- Date: Wed, 7 Oct 2020 16:24:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 00:24:17.715214
- Title: Learning from demonstration using products of experts: applications to
manipulation and task prioritization
- Title(参考訳): 専門家の製品を用いた実演から学ぶ:操作とタスク優先順位付けへの応用
- Authors: Emmanuel Pignat, Jo\~ao Silv\'erio and Sylvain Calinon
- Abstract要約: 異なるタスク空間におけるモデルの融合は、専門家(PoE)の積として表現できることを示す。
複数の実験を行い、PoEフレームワークで異なるモデルを共同で学習することで、モデルの品質が大幅に向上することを示した。
- 参考スコア(独自算出の注目度): 12.378784643460474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Probability distributions are key components of many learning from
demonstration (LfD) approaches. While the configuration of a manipulator is
defined by its joint angles, poses are often best explained within several task
spaces. In many approaches, distributions within relevant task spaces are
learned independently and only combined at the control level. This
simplification implies several problems that are addressed in this work. We
show that the fusion of models in different task spaces can be expressed as a
product of experts (PoE), where the probabilities of the models are multiplied
and renormalized so that it becomes a proper distribution of joint angles.
Multiple experiments are presented to show that learning the different models
jointly in the PoE framework significantly improves the quality of the model.
The proposed approach particularly stands out when the robot has to learn
competitive or hierarchical objectives. Training the model jointly usually
relies on contrastive divergence, which requires costly approximations that can
affect performance. We propose an alternative strategy using variational
inference and mixture model approximations. In particular, we show that the
proposed approach can be extended to PoE with a nullspace structure (PoENS),
where the model is able to recover tasks that are masked by the resolution of
higher-level objectives.
- Abstract(参考訳): 確率分布は、実演(lfd)アプローチからの多くの学習の重要な要素である。
マニピュレータの構成は関節角度によって定義されるが、ポーズはしばしばいくつかのタスク空間内で説明される。
多くのアプローチでは、関連するタスク空間内の分布は独立して学習され、制御レベルでのみ結合される。
この単純化は、この仕事で対処されるいくつかの問題を意味する。
異なるタスク空間におけるモデルの融合は専門家(PoE)の積として表現でき、そこではモデルの確率が乗算されて再正規化され、それが結合角の適切な分布となることを示す。
複数の実験を行い、PoEフレームワークで異なるモデルを共同で学習することで、モデルの品質が大幅に向上することを示した。
提案手法はロボットが競争的あるいは階層的な目的を学習しなければならない場合に特に顕著である。
モデルの共同トレーニングは通常、パフォーマンスに影響を与えるコストのかかる近似を必要とする、対照的な分岐に依存する。
変分推論と混合モデル近似を用いた代替戦略を提案する。
特に,提案手法は,高次目的の解決によって隠蔽されるタスクをモデルが回復できるような,Nullspace Structure (PoENS) を用いてPoEに拡張可能であることを示す。
関連論文リスト
- Revisiting SMoE Language Models by Evaluating Inefficiencies with Task Specific Expert Pruning [78.72226641279863]
SMOE(Sparse Mixture of Expert)モデルは、言語モデリングにおける高密度モデルに代わるスケーラブルな代替品として登場した。
本研究は,SMoEアーキテクチャの設計に関する意思決定を行うために,タスク固有のモデルプルーニングについて検討する。
適応型タスク対応プルーニング手法 UNCURL を導入し,MoE 層当たりの専門家数をオフラインで学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-02T22:35:03Z) - Concrete Subspace Learning based Interference Elimination for Multi-task
Model Fusion [86.6191592951269]
一般的な事前訓練された大規模モデルから微調整されたマージングモデルは、様々なタスクに特化しているが、様々なタスクでうまく機能するマルチタスクモデルを構築するための安価でスケーラブルな戦略として実証されている。
本稿では、共通低次元部分空間を同定し、その共有情報トラック干渉問題を性能を犠牲にすることなく利用するための連続緩和(Concrete)部分空間学習法を提案する。
論文 参考訳(メタデータ) (2023-12-11T07:24:54Z) - Mitigating Shortcut Learning with Diffusion Counterfactuals and Diverse Ensembles [95.49699178874683]
拡散確率モデル(DPM)を利用したアンサンブル多様化フレームワークDiffDivを提案する。
DPMは、相関した入力特徴を示すサンプルを用いて訓練しても、新しい特徴の組み合わせで画像を生成することができることを示す。
そこで本研究では,DPM誘導の多様化は,教師付き信号の追加を必要とせず,ショートカットキューへの依存を取り除くのに十分であることを示す。
論文 参考訳(メタデータ) (2023-11-23T15:47:33Z) - Leveraging Diffusion Disentangled Representations to Mitigate Shortcuts
in Underspecified Visual Tasks [92.32670915472099]
拡散確率モデル(DPM)を用いた合成カウンターファクトの生成を利用したアンサンブルの多様化フレームワークを提案する。
拡散誘導型分散化は,データ収集を必要とする従来の手法に匹敵するアンサンブル多様性を達成し,ショートカットからの注意を回避できることを示す。
論文 参考訳(メタデータ) (2023-10-03T17:37:52Z) - SeMAIL: Eliminating Distractors in Visual Imitation via Separated Models [22.472167814814448]
本稿では,SeMAIL(Separated Model-based Adversarial Imitation Learning)というモデルベース模倣学習アルゴリズムを提案する。
本手法は, 様々な視覚的制御タスクにおいて, 複雑な観察と, 専門的な観察から異なる背景を持つより困難なタスクにおいて, ほぼ専門的な性能を実現する。
論文 参考訳(メタデータ) (2023-06-19T04:33:44Z) - Switchable Representation Learning Framework with Self-compatibility [50.48336074436792]
自己整合性(SFSC)を考慮した交換可能な表現学習フレームワークを提案する。
SFSCは1つのトレーニングプロセスを通じて、異なる能力を持つ一連の互換性のあるサブモデルを生成する。
SFSCは評価データセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-06-16T16:46:32Z) - Ensemble Making Few-Shot Learning Stronger [4.17701749612924]
本稿では,差分低減のためのアンサンブル手法について検討し,関係レベルの特徴をキャリブレーションするための微調整と特徴的注意戦略を提案する。
数ショットの相関学習タスクの結果、我々のモデルは従来の最先端モデルよりも大幅に優れていた。
論文 参考訳(メタデータ) (2021-05-12T17:11:10Z) - Learning Diverse Representations for Fast Adaptation to Distribution
Shift [78.83747601814669]
本稿では,複数のモデルを学習する手法を提案する。
分散シフトへの迅速な適応を促進するフレームワークの能力を実証する。
論文 参考訳(メタデータ) (2020-06-12T12:23:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。