論文の概要: Explainable Hierarchical Imitation Learning for Robotic Drink Pouring
- arxiv url: http://arxiv.org/abs/2105.07348v1
- Date: Sun, 16 May 2021 04:30:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 14:37:20.579712
- Title: Explainable Hierarchical Imitation Learning for Robotic Drink Pouring
- Title(参考訳): ロボットドリンク注ぐための説明可能な階層的模倣学習
- Authors: Dandan Zhang, Yu Zheng, Qiang Li, Lei Wei, Dongsheng Zhang, Zhengyou
Zhang
- Abstract要約: 本稿では,説明可能な階層学習(EHIL)手法を提案する。
フレームワークは異なる目標を達成するために操作可能であり、見えないシナリオへの適応性は説明可能な方法で達成できる。
その結果, ehilは, 成功率, 適応性, マニピュラビリティ, 説明可能性の観点から, 従来の行動クローニング法よりも優れていた。
- 参考スコア(独自算出の注目度): 16.344642585754205
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To accurately pour drinks into various containers is an essential skill for
service robots. However, drink pouring is a dynamic process and difficult to
model. Traditional deep imitation learning techniques for implementing
autonomous robotic pouring have an inherent black-box effect and require a
large amount of demonstration data for model training. To address these issues,
an Explainable Hierarchical Imitation Learning (EHIL) method is proposed in
this paper such that a robot can learn high-level general knowledge and execute
low-level actions across multiple drink pouring scenarios. Moreover, with EHIL,
a logical graph can be constructed for task execution, through which the
decision-making process for action generation can be made explainable to users
and the causes of failure can be traced out. Based on the logical graph, the
framework is manipulable to achieve different targets while the adaptability to
unseen scenarios can be achieved in an explainable manner. A series of
experiments have been conducted to verify the effectiveness of the proposed
method. Results indicate that EHIL outperforms the traditional behavior cloning
method in terms of success rate, adaptability, manipulability and
explainability.
- Abstract(参考訳): さまざまな容器に飲み物を正確に注ぐことは、サービスロボットにとって必須の技術である。
しかし、飲み物を注ぐことはダイナミックなプロセスであり、モデル化が難しい。
自律型ロボットインダクションを実装するための従来の深い模倣学習技術は、固有のブラックボックス効果を持ち、モデルトレーニングに大量の実演データを必要とする。
そこで,本稿では,ロボットが高水準の一般知識を学習し,複数のドリンク注水シナリオで低レベルな行動を行うように,説明可能な階層的模倣学習(ehil)手法を提案する。
さらに、ehilを用いてタスク実行のための論理グラフを構築し、ユーザに対してアクション生成の意思決定プロセスを説明可能にし、失敗の原因を突き止めることができる。
論理グラフに基づいて、フレームワークは異なる目標を達成するために操作可能であり、見えないシナリオへの適応性は説明可能な方法で達成できる。
提案手法の有効性を検証するため,いくつかの実験を行った。
その結果, ehilは, 成功率, 適応性, マニピュラビリティ, 説明可能性の観点から, 従来の行動クローニング法よりも優れていた。
関連論文リスト
- SkillDiffuser: Interpretable Hierarchical Planning via Skill
Abstractions in Diffusion-Based Task Execution [79.74387890290451]
拡散モデルは、ロボット軌道計画の強力な可能性を示している。
高レベルの命令からコヒーレントな軌道を生成することは依然として困難である。
エンド・ツー・エンドの階層的計画フレームワークであるSkillDiffuserを提案する。
論文 参考訳(メタデータ) (2023-12-18T18:16:52Z) - Does Your Model Think Like an Engineer? Explainable AI for Bearing Fault
Detection with Deep Learning [20.488966890562004]
本研究では,振動信号から転がり要素軸受の欠陥を検知する作業に焦点をあてる。
本稿では,モデルの基本となる論理が専門家の推論とどの程度うまく対応しているかを評価するための,新しい,ドメイン固有の属性フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-19T17:58:11Z) - On-Robot Bayesian Reinforcement Learning for POMDPs [16.667924736270415]
本稿では,ロボット工学におけるベイズ強化学習を,物理システムのための特殊フレームワークの提案により進める。
この知識を因子表現で捉え、後続の分解を同様の形で示し、最終的にベイズ的枠組みでモデルを定式化する。
次に,モンテカルロ木探索と粒子フィルタリングに基づくサンプルベースオンライン解法を提案する。
論文 参考訳(メタデータ) (2023-07-22T01:16:29Z) - Exploiting Symmetry and Heuristic Demonstrations in Off-policy
Reinforcement Learning for Robotic Manipulation [1.7901837062462316]
本稿では,物理ロボット環境に存在する自然対称性を定義し,組み込むことを目的とする。
提案手法は,産業用アームの2つのポイント・ツー・ポイント・リーチタスクによって,障害物を伴わずに検証される。
提案手法と従来の非政治強化学習アルゴリズムとの比較研究は,アプリケーションにおける学習性能と潜在的価値の優位性を示している。
論文 参考訳(メタデータ) (2023-04-12T11:38:01Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z) - Divide & Conquer Imitation Learning [75.31752559017978]
模倣学習は学習プロセスをブートストラップするための強力なアプローチである。
本稿では,専門的軌道の状態から複雑なロボットタスクを模倣する新しいアルゴリズムを提案する。
提案手法は,非ホロノミックナビゲーションタスクを模倣し,非常に高いサンプル効率で複雑なロボット操作タスクにスケールすることを示す。
論文 参考訳(メタデータ) (2022-04-15T09:56:50Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z) - Human-in-the-Loop Imitation Learning using Remote Teleoperation [72.2847988686463]
6-DoF操作設定に合わせたデータ収集システムを構築します。
システムによって収集された新しいデータに基づいて,ポリシーを反復的にトレーニングするアルゴリズムを開発した。
介入型システムで収集したデータに基づいて訓練されたエージェントと、非介入型デモ参加者が収集した同等数のサンプルで訓練されたアルゴリズムを上回るエージェントを実証する。
論文 参考訳(メタデータ) (2020-12-12T05:30:35Z) - Actionable Interpretation of Machine Learning Models for Sequential
Data: Dementia-related Agitation Use Case [0.0]
アクション可能な解釈は、ほとんどの伝統的なブラックボックス機械学習モデルで実装できる。
既にトレーニング済みのモデル、トレーニングデータ、データ処理技術を使って実行可能なアイテムを抽出する。
また, 家庭内光レベル低下など, 扇動現象を誘発する動作可能な項目を抽出できることが示唆された。
論文 参考訳(メタデータ) (2020-09-10T19:04:12Z) - Explainable robotic systems: Understanding goal-driven actions in a
reinforcement learning scenario [1.671353192305391]
強化学習のシナリオでは、データ駆動アプローチによる説明の提供に多くの努力が注がれている。
本研究では,ロボットシナリオにおけるタスクを実行する強化学習エージェントの意思決定プロセスに焦点をあてる。
我々は、メモリベース、学習ベース、イントロスペクションベースの3つの異なるアプローチによって計算される成功確率を利用する。
論文 参考訳(メタデータ) (2020-06-24T10:51:14Z) - Scalable Multi-Task Imitation Learning with Autonomous Improvement [159.9406205002599]
我々は、自律的なデータ収集を通じて継続的に改善できる模倣学習システムを構築している。
我々は、ロボット自身の試行を、実際に試みたタスク以外のタスクのデモとして活用する。
従来の模倣学習のアプローチとは対照的に,本手法は,継続的改善のための疎い監視によるデータ収集を自律的に行うことができる。
論文 参考訳(メタデータ) (2020-02-25T18:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。