論文の概要: Semi-supervised Learning From Demonstration Through Program Synthesis:
An Inspection Robot Case Study
- arxiv url: http://arxiv.org/abs/2007.12500v1
- Date: Thu, 23 Jul 2020 01:32:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 12:57:18.303140
- Title: Semi-supervised Learning From Demonstration Through Program Synthesis:
An Inspection Robot Case Study
- Title(参考訳): プログラム合成による実証から半教師付き学習:検査ロボットのケーススタディ
- Authors: Sim\'on C. Smith (The University of Edinburgh), Subramanian
Ramamoorthy (The University of Edinburgh)
- Abstract要約: 本稿では,実証実験から解釈可能なモデルと検証可能なモデルを学習できるハイブリッドセミ教師システムを提案する。
本システムは、逐次重要サンプリングを用いて没入型デモンストレーションから学習することで、コントローラプログラムを誘導する。
我々は、無人地上車両が特定の順序で環境の異なる領域を検査しなければならない検査シナリオからハイブリッドシステムの学習に成功した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised learning improves the performance of supervised machine
learning by leveraging methods from unsupervised learning to extract
information not explicitly available in the labels. Through the design of a
system that enables a robot to learn inspection strategies from a human
operator, we present a hybrid semi-supervised system capable of learning
interpretable and verifiable models from demonstrations. The system induces a
controller program by learning from immersive demonstrations using sequential
importance sampling. These visual servo controllers are parametrised by
proportional gains and are visually verifiable through observation of the
position of the robot in the environment. Clustering and effective particle
size filtering allows the system to discover goals in the state space. These
goals are used to label the original demonstration for end-to-end learning of
behavioural models. The behavioural models are used for autonomous model
predictive control and scrutinised for explanations. We implement causal
sensitivity analysis to identify salient objects and generate counterfactual
conditional explanations. These features enable decision making interpretation
and post hoc discovery of the causes of a failure. The proposed system expands
on previous approaches to program synthesis by incorporating repellers in the
attribution prior of the sampling process. We successfully learn the hybrid
system from an inspection scenario where an unmanned ground vehicle has to
inspect, in a specific order, different areas of the environment. The system
induces an interpretable computer program of the demonstration that can be
synthesised to produce novel inspection behaviours. Importantly, the robot
successfully runs the synthesised program on an unseen configuration of the
environment while presenting explanations of its autonomous behaviour.
- Abstract(参考訳): 半教師付き学習は教師なし学習の手法を利用してラベルに明記されていない情報を抽出することで教師なし機械学習の性能を向上させる。
ロボットが人間の操作者から検査戦略を学習できるシステムの設計を通じて,実演から解釈可能かつ検証可能なモデルを学習できるハイブリッド半教師付きシステムを提案する。
本システムは、逐次重要サンプリングを用いて没入型デモンストレーションから学習することで、コントローラプログラムを誘導する。
これらのビジュアルサーボコントローラは比例ゲインによってパラメトリされ、環境中のロボットの位置を観察することで視覚的に検証可能である。
クラスタリングと効率的な粒子サイズフィルタリングにより、システムは状態空間における目標を発見できる。
これらの目標は、振る舞いモデルのエンドツーエンド学習のためのオリジナルのデモンストレーションのラベル付けに使用される。
行動モデルは自律的モデル予測制御に使われ、説明のために精査される。
有意義な対象を識別するために因果的感度分析を実施し,反事実的条件付き説明を生成する。
これらの機能は、意思決定の解釈と失敗の原因の発見を可能にする。
提案システムは, サンプリング前の属性にレペラを組み込むことにより, プログラム合成への従来のアプローチを拡張した。
我々は、無人地上車両が特定の順序で環境の異なる領域を検査しなければならない検査シナリオからハイブリッドシステムの学習に成功した。
このシステムは、新しい検査行動を生成するために合成できるデモの解釈可能なコンピュータプログラムを誘導する。
重要なことに、ロボットは、その自律的な振る舞いの説明を提示しながら、環境の見えない構成で合成プログラムをうまく実行します。
関連論文リスト
- Learning Manipulation by Predicting Interaction [85.57297574510507]
本稿では,インタラクションを予測して操作を学習する一般的な事前学習パイプラインを提案する。
実験の結果,MPIは従来のロボットプラットフォームと比較して10%から64%向上していることがわかった。
論文 参考訳(メタデータ) (2024-06-01T13:28:31Z) - DiffGen: Robot Demonstration Generation via Differentiable Physics Simulation, Differentiable Rendering, and Vision-Language Model [72.66465487508556]
DiffGenは、微分可能な物理シミュレーション、微分可能なレンダリング、ビジョン言語モデルを統合する新しいフレームワークである。
言語命令の埋め込みとシミュレートされた観察の埋め込みとの距離を最小化することにより、現実的なロボットデモを生成することができる。
実験によると、DiffGenを使えば、人間の努力やトレーニング時間を最小限に抑えて、ロボットデータを効率よく、効果的に生成できる。
論文 参考訳(メタデータ) (2024-05-12T15:38:17Z) - A Mathematical Model of the Hidden Feedback Loop Effect in Machine Learning Systems [44.99833362998488]
意図しない隠れフィードバックループに起因するいくつかの現象を共同で記述するために,繰り返し学習プロセスを導入する。
このような繰り返し学習設定の特徴は、環境の状態が時間とともに学習者自身に因果的に依存することである。
本稿では,繰り返し学習過程の力学系モデルを提案し,正および負のフィードバックループモードに対する確率分布の制限セットを証明した。
論文 参考訳(メタデータ) (2024-05-04T17:57:24Z) - Model-free tracking control of complex dynamical trajectories with
machine learning [0.2356141385409842]
我々は,2腕ロボットマニピュレータを制御するモデルフリーの機械学習フレームワークを開発した。
様々な周期的信号とカオス的信号を用いた制御フレームワークの有効性を示す。
論文 参考訳(メタデータ) (2023-09-20T17:10:10Z) - Visual Affordance Prediction for Guiding Robot Exploration [56.17795036091848]
我々は,ロボット探索を導くための視覚能力の学習手法を開発した。
VQ-VAEの潜伏埋め込み空間における条件分布の学習にはTransformerベースのモデルを用いる。
本稿では,ロボット操作における視覚的目標条件付きポリシー学習において,目標サンプリング分布として機能することで探索を導くために,トレーニングされた余裕モデルをどのように利用できるかを示す。
論文 参考訳(メタデータ) (2023-05-28T17:53:09Z) - Continually Learned Pavlovian Signalling Without Forgetting for
Human-in-the-Loop Robotic Control [0.8258451067861933]
パヴロヴィアン・シグナリング(Pavlovian signalling)は、義肢のフィードバックを改善するためのアプローチである。
ひとつの課題は、ユーザがデリバリされたフィードバックでうまく行動し始めると、これまで学んだ予測を忘れてしまうことだ。
この研究は、人工装具から学習した予測フィードバックを提供するという課題に対する新たな洞察に貢献する。
論文 参考訳(メタデータ) (2023-05-16T15:37:16Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - A Novel Anomaly Detection Algorithm for Hybrid Production Systems based
on Deep Learning and Timed Automata [73.38551379469533]
DAD:DeepAnomalyDetectionは,ハイブリッド生産システムにおける自動モデル学習と異常検出のための新しいアプローチである。
深層学習とタイムドオートマトンを組み合わせて、観察から行動モデルを作成する。
このアルゴリズムは実システムからの2つのデータを含む少数のデータセットに適用され、有望な結果を示している。
論文 参考訳(メタデータ) (2020-10-29T08:27:43Z) - Learning a generative model for robot control using visual feedback [7.171234436165255]
本稿では,ロボット制御に視覚フィードバックを取り入れた新しい定式化を提案する。
モデルにおける推論により,特徴のターゲット位置に対応するロボット状態を推測することができる。
本研究では,不正確な制御を行うロボットに対して,握りとタイトな挿入を実行することで,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2020-03-10T00:34:01Z) - Counter-example Guided Learning of Bounds on Environment Behavior [11.357397596759172]
本稿では, 環境の正確なモデルなしで, 仕様適合性を評価可能なデータ駆動型ソリューションを提案する。
私たちのアプローチでは、データとシステムの望ましい振る舞いの仕様を使用して、環境の振る舞いの保守的な反応性境界を学習する。
論文 参考訳(メタデータ) (2020-01-20T19:58:24Z) - Learning Predictive Models From Observation and Interaction [137.77887825854768]
世界との相互作用から予測モデルを学ぶことで、ロボットのようなエージェントが世界がどのように働くかを学ぶことができる。
しかし、複雑なスキルのダイナミクスを捉えるモデルを学ぶことは大きな課題である。
本研究では,人間などの他のエージェントの観察データを用いて,トレーニングセットを増強する手法を提案する。
論文 参考訳(メタデータ) (2019-12-30T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。