論文の概要: Causal Transfer for Imitation Learning and Decision Making under
Sensor-shift
- arxiv url: http://arxiv.org/abs/2003.00806v1
- Date: Mon, 2 Mar 2020 12:37:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 05:16:51.395468
- Title: Causal Transfer for Imitation Learning and Decision Making under
Sensor-shift
- Title(参考訳): センサシフトによる模倣学習と意思決定のための因果伝達
- Authors: Jalal Etesami and Philipp Geiger
- Abstract要約: このような「センサシフト」下での伝達学習のための因果モデルに基づくフレームワークを提案する。
我々は、人口レベルで、関連するメカニズムをどの程度特定し、転送できるかを厳格に分析する。
計算しやすく, 有限データから推定し, 正確な解よりも解釈し易いプロキシ手法をいくつか導入する。
- 参考スコア(独自算出の注目度): 13.477892615179485
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning from demonstrations (LfD) is an efficient paradigm to train AI
agents. But major issues arise when there are differences between (a) the
demonstrator's own sensory input, (b) our sensors that observe the demonstrator
and (c) the sensory input of the agent we train. In this paper, we propose a
causal model-based framework for transfer learning under such "sensor-shifts",
for two common LfD tasks: (1) inferring the effect of the demonstrator's
actions and (2) imitation learning. First we rigorously analyze, on the
population-level, to what extent the relevant underlying mechanisms (the action
effects and the demonstrator policy) can be identified and transferred from the
available observations together with prior knowledge of sensor characteristics.
And we device an algorithm to infer these mechanisms. Then we introduce several
proxy methods which are easier to calculate, estimate from finite data and
interpret than the exact solutions, alongside theoretical bounds on their
closeness to the exact ones. We validate our two main methods on simulated and
semi-real world data.
- Abstract(参考訳): デモンストレーションから学ぶこと(LfD)は、AIエージェントを訓練するための効率的なパラダイムである。
しかし、大きな問題は、違いがあるときに起こります。
(a)デモ参加者自身の感覚入力。
b) デモ参加者を観察するセンサーと
c) 訓練中のエージェントの感覚入力。
本稿では,(1)実証者の行動の効果を推定し,(2)模倣学習を行う2つの共通LfDタスクに対して,そのような「センサシフト」の下での伝達学習のための因果モデルに基づくフレームワークを提案する。
まず,人口レベルでは,センサ特性の事前知識と合わせて,適切なメカニズム(行動効果と実証者ポリシー)を特定・伝達できるかどうかを厳密に分析する。
これらのメカニズムを推測するアルゴリズムを開発しました
次に, 計算が容易で, 有限データから推定し, 厳密解よりも解釈しやすいいくつかのプロキシ手法と, 厳密解との密接性に関する理論的境界について紹介する。
シミュレーションと半実世界のデータの2つの方法を検証する。
関連論文リスト
- Conditional Neural Expert Processes for Learning Movement Primitives from Demonstration [1.9336815376402723]
条件付きニューラルネットワークプロセス(CNEP)は、異なるモードから異なる専門家ネットワークにデモを割り当てることを学ぶ。
CNEPは、軌道がどのモードに属するかの監督を必要としない。
本システムは,オンラインコンディショニング機構を用いて,環境変化へのオンザフライ適応が可能なシステムである。
論文 参考訳(メタデータ) (2024-02-13T12:52:02Z) - Counterfactual Explanation via Search in Gaussian Mixture Distributed
Latent Space [19.312306559210125]
対実説明(CE)は2つの問題に対処するアルゴリズム・リコースにおいて重要なツールである。
簡単に理解しやすい説明を提供することによって、AIシステムに対するユーザのインタラクションを導くことは、AIシステムの信頼できる採用と長期的な受け入れに不可欠である。
本稿では,まずオートエンコーダの潜伏空間をガウス分布の混合として形成することにより,事前学習されたバイナリ分類器のCEを生成する手法を提案する。
論文 参考訳(メタデータ) (2023-07-25T10:21:26Z) - Output Feedback Tube MPC-Guided Data Augmentation for Robust, Efficient
Sensorimotor Policy Learning [49.05174527668836]
シミュレーション学習(IL)は、計算コストのかかるモデルベースセンシングと制御アルゴリズムによって提供されるデモから、計算効率のよいセンセータポリシーを生成することができる。
本研究では,ILと出力フィードバック頑健な管モデル予測コントローラを組み合わせることで,実演とデータ拡張戦略を併用し,ニューラルネットワークに基づくセンサモジュレータポリシーを効率的に学習する。
提案手法は,従来のIL法と比較して,実演効率が2桁向上した1つの実演から,ロバストなビズモータポリシーを学習できることを数値的に示す。
論文 参考訳(メタデータ) (2022-10-18T19:59:17Z) - Learning Physical Concepts in Cyber-Physical Systems: A Case Study [72.74318982275052]
本稿では,時系列データにおける物理概念の学習方法に関する研究の現状について概説する。
また,3タンクシステムの例を用いて,最先端技術から最も重要な手法を分析した。
論文 参考訳(メタデータ) (2021-11-28T14:24:52Z) - Attention-based Adversarial Appearance Learning of Augmented Pedestrians [49.25430012369125]
本稿では,歩行者認識タスクのための現実的なデータを合成する手法を提案する。
本手法は, 対向的損失によって駆動される注意機構を用いて, ドメインの相違を学習する。
提案手法はこのような不一致に対して頑健であり,視覚的リアリズムと意味的整合性の両方を明らかにする。
論文 参考訳(メタデータ) (2021-07-06T15:27:00Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z) - Semantics-aware Adaptive Knowledge Distillation for Sensor-to-Vision
Action Recognition [131.6328804788164]
本稿では,視覚・センサ・モダリティ(動画)における行動認識を強化するためのフレームワーク,Semantics-Aware Adaptive Knowledge Distillation Networks (SAKDN)を提案する。
SAKDNは複数のウェアラブルセンサーを教師のモダリティとして使用し、RGB動画を学生のモダリティとして使用している。
論文 参考訳(メタデータ) (2020-09-01T03:38:31Z) - Understanding Multi-Modal Perception Using Behavioral Cloning for
Peg-In-a-Hole Insertion Tasks [21.275342989110978]
本稿では,実世界の組立作業における制御器を学習するために,複数のセンサモードが組み合わさった場合の利点について検討する。
動作クローン法の性能を向上させるために, マルチステップ・アヘッド・ロス関数を提案する。
論文 参考訳(メタデータ) (2020-07-22T19:46:51Z) - Adversarial Transferability in Wearable Sensor Systems [19.391920824853344]
最近の研究では、機械学習アルゴリズムは、入力に逆方向の摂動を加えることで、容易に騙されることがわかった。
ある機械学習システムに対して生成された逆例も、他のシステムに対して有効である。
本研究は,ウェアラブルセンサシステムにおける対向移動性の研究において,最初の一歩を踏み出したものである。
論文 参考訳(メタデータ) (2020-03-17T23:19:52Z) - End-to-End Models for the Analysis of System 1 and System 2 Interactions
based on Eye-Tracking Data [99.00520068425759]
本稿では,よく知られたStroopテストの視覚的修正版において,様々なタスクと潜在的な競合事象を特定するための計算手法を提案する。
統計的分析により、選択された変数は、異なるシナリオにおける注意負荷の変動を特徴付けることができることが示された。
機械学習技術は,異なるタスクを分類精度良く区別できることを示す。
論文 参考訳(メタデータ) (2020-02-03T17:46:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。