論文の概要: From Demonstrations to Task-Space Specifications: Using Causal Analysis
to Extract Rule Parameterization from Demonstrations
- arxiv url: http://arxiv.org/abs/2006.11300v1
- Date: Mon, 8 Jun 2020 00:21:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 02:18:40.313309
- Title: From Demonstrations to Task-Space Specifications: Using Causal Analysis
to Extract Rule Parameterization from Demonstrations
- Title(参考訳): デモからタスク空間仕様へ:因果解析を用いてデモからルールパラメータを抽出する
- Authors: Daniel Angelov, Yordan Hristov, Subramanian Ramamoorthy
- Abstract要約: 本研究では,人間の実演から抽出した異なるユーザ行動型の生成モデルを学習することが可能であることを示す。
これらのモデルを使って、ユーザタイプを区別し、重複するソリューションのケースを見つけます。
本手法は, 99%[97.8~99.8]の症例において, 所定の時間内に正しい型を同定し, IRLベースラインを上回った。
- 参考スコア(独自算出の注目度): 16.330400985738205
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning models of user behaviour is an important problem that is broadly
applicable across many application domains requiring human-robot interaction.
In this work, we show that it is possible to learn generative models for
distinct user behavioural types, extracted from human demonstrations, by
enforcing clustering of preferred task solutions within the latent space. We
use these models to differentiate between user types and to find cases with
overlapping solutions. Moreover, we can alter an initially guessed solution to
satisfy the preferences that constitute a particular user type by
backpropagating through the learned differentiable models. An advantage of
structuring generative models in this way is that we can extract causal
relationships between symbols that might form part of the user's specification
of the task, as manifested in the demonstrations. We further parameterize these
specifications through constraint optimization in order to find a safety
envelope under which motion planning can be performed. We show that the
proposed method is capable of correctly distinguishing between three user
types, who differ in degrees of cautiousness in their motion, while performing
the task of moving objects with a kinesthetically driven robot in a tabletop
environment. Our method successfully identifies the correct type, within the
specified time, in 99% [97.8 - 99.8] of the cases, which outperforms an IRL
baseline. We also show that our proposed method correctly changes a default
trajectory to one satisfying a particular user specification even with unseen
objects. The resulting trajectory is shown to be directly implementable on a
PR2 humanoid robot completing the same task.
- Abstract(参考訳): ユーザー行動の学習モデルは、人間とロボットの相互作用を必要とする多くのアプリケーションドメインに広く適用できる重要な問題である。
本研究では,人間の実演から抽出した異なるユーザの行動型に対して,潜在空間内で望ましいタスクソリューションをクラスタリングすることにより生成モデルを学ぶことができることを示す。
これらのモデルを使って、ユーザタイプを区別し、重複するソリューションのケースを見つけます。
さらに、学習可能な微分モデルを通して、特定のユーザタイプを構成する嗜好を満たすために、初期推定されたソリューションを変更することもできる。
このように生成モデルを構成する利点は、デモンストレーションで示されたように、ユーザのタスクの仕様の一部を構成するシンボル間の因果関係を抽出することができることである。
さらに,これらの仕様を制約最適化によりパラメータ化することで,動作計画を行う安全エンベロープを求める。
提案手法は, テーブル上環境において, 審美的に駆動するロボットで物体を移動させる作業を行いながら, 動作の注意度が異なる3つのユーザタイプを正しく識別できることを示す。
本手法は, 99%[97.8~99.8]の症例において, 所定の時間内に正しい型を同定し, IRLベースラインを上回った。
また,提案手法は,未確認オブジェクトであっても,特定のユーザ仕様を満たすものに対して,デフォルトの軌道を正しく変更することを示す。
得られた軌道は、同じタスクを完了したPR2ヒューマノイドロボットに直接実装可能である。
関連論文リスト
- NegMerge: Consensual Weight Negation for Strong Machine Unlearning [21.081262106431506]
機械学習は、モデルから特定の知識を選択的に除去することを目的としている。
現在の手法は、左折セットの微調整モデルに依存し、タスクベクトルを生成し、元のモデルからそれを減算する。
1つのモデルを選択するのではなく、与えられた細調整されたモデルをすべて活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-10-08T00:50:54Z) - DeTra: A Unified Model for Object Detection and Trajectory Forecasting [68.85128937305697]
提案手法は,2つのタスクの結合を軌道修正問題として定式化する。
この統合タスクに対処するために、オブジェクトの存在, ポーズ, マルチモーダルな将来の振る舞いを推測する精細化変換器を設計する。
実験では、我々のモデルはArgoverse 2 Sensor and Openデータセットの最先端性よりも優れています。
論文 参考訳(メタデータ) (2024-06-06T18:12:04Z) - Merging Multi-Task Models via Weight-Ensembling Mixture of Experts [64.94129594112557]
異なるタスクでトレーニングされたTransformerベースのモデルを単一の統一モデルにマージすることで、すべてのタスクを同時に実行できる。
従来の手法は、タスク演算によって例示され、効率的かつスケーラブルであることが証明されている。
本稿では,Transformer層をMoEモジュールにアップスケーリングしながら,ほとんどのパラメータをマージすることを提案する。
論文 参考訳(メタデータ) (2024-02-01T08:58:57Z) - Concrete Subspace Learning based Interference Elimination for Multi-task
Model Fusion [86.6191592951269]
一般的な事前訓練された大規模モデルから微調整されたマージングモデルは、様々なタスクに特化しているが、様々なタスクでうまく機能するマルチタスクモデルを構築するための安価でスケーラブルな戦略として実証されている。
本稿では、共通低次元部分空間を同定し、その共有情報トラック干渉問題を性能を犠牲にすることなく利用するための連続緩和(Concrete)部分空間学習法を提案する。
論文 参考訳(メタデータ) (2023-12-11T07:24:54Z) - Integrating LLMs and Decision Transformers for Language Grounded
Generative Quality-Diversity [0.0]
品質多様性(Quality-Diversity)は最適化の一分野であり、強化学習と制御ドメインの問題によく適用される。
本稿では,レパートリーをトラジェクトリの自然言語記述で拡張する大規模言語モデルを提案する。
また、このような生成エージェントの性能を評価するためのLCMベースのアプローチを提案する。
論文 参考訳(メタデータ) (2023-08-25T10:00:06Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - Learning Models as Functionals of Signed-Distance Fields for
Manipulation Planning [51.74463056899926]
本研究では,シーン内のオブジェクトを表す符号付き距離場の目的を学習する,最適化に基づく操作計画フレームワークを提案する。
オブジェクトを符号付き距離場として表現することは、ポイントクラウドや占有率の表現よりも高い精度で、様々なモデルの学習と表現を可能にする。
論文 参考訳(メタデータ) (2021-10-02T12:36:58Z) - Learning from demonstration using products of experts: applications to
manipulation and task prioritization [12.378784643460474]
異なるタスク空間におけるモデルの融合は、専門家(PoE)の積として表現できることを示す。
複数の実験を行い、PoEフレームワークで異なるモデルを共同で学習することで、モデルの品質が大幅に向上することを示した。
論文 参考訳(メタデータ) (2020-10-07T16:24:41Z) - Active Preference Learning using Maximum Regret [10.317601896290467]
本研究では,自律ロボットの動作を直感的に特定するための枠組みとして,能動的嗜好学習について検討する。
能動的嗜好学習では、ロボットがユーザの嗜好を学習する一連の選択肢から好む行動を選択する。
論文 参考訳(メタデータ) (2020-05-08T14:31:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。