論文の概要: Adaptive Manipulation using Behavior Trees
- arxiv url: http://arxiv.org/abs/2406.14634v1
- Date: Thu, 20 Jun 2024 18:01:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-24 18:23:10.667418
- Title: Adaptive Manipulation using Behavior Trees
- Title(参考訳): 行動木を用いた適応マニピュレーション
- Authors: Jacques Cloete, Wolfgang Merkt, Ioannis Havoutis,
- Abstract要約: 同じ動作の異なるインスタンスは、成功するためには異なる操作戦略を必要とすることが多い。
本稿では,ロボットがタスク実行中に個別の操作戦略を選択・切り替えする,適応的操作のための行動木に基づくアプローチを提案する。
われわれのアプローチでは、ロボットがタスクの失敗をプリエンプトし、より実現可能な戦略に変更するか、破滅的な失敗が起こる前にタスクを安全に終了させることもできる。
- 参考スコア(独自算出の注目度): 12.061325774210392
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many manipulation tasks use instances of a set of common motions, such as a twisting motion for tightening or loosening a valve. However, different instances of the same motion often require different environmental parameters (e.g. force/torque level), and thus different manipulation strategies to successfully complete; for example, grasping a valve handle from the side rather than head-on to increase applied torque. Humans can intuitively adapt their manipulation strategy to best suit such problems, but representing and implementing such behaviors for robots remains an open question. We present a behavior tree-based approach for adaptive manipulation, wherein the robot can reactively select from and switch between a discrete set of manipulation strategies during task execution. Furthermore, our approach allows the robot to learn from past attempts to optimize performance, for example learning the optimal strategy for different task instances. Our approach also allows the robot to preempt task failure and either change to a more feasible strategy or safely exit the task before catastrophic failure occurs. We propose a simple behavior tree design for general adaptive robot behavior and apply it in the context of industrial manipulation. The adaptive behavior outperformed all baseline behaviors that only used a single manipulation strategy, markedly reducing the number of attempts and overall time taken to complete the example tasks. Our results demonstrate potential for improved robustness and efficiency in task completion, reducing dependency on human supervision and intervention.
- Abstract(参考訳): 多くの操作タスクは、バルブの締め付けや緩めるためのねじれ運動のような一連の共通の動きのインスタンスを使用する。
しかし、同じ動きの異なるインスタンスは、しばしば異なる環境パラメータ(例えば、力/トルクレベル)を必要とするため、異なる操作戦略をうまく完成させる必要がある。
人間はこのような問題に最も適した操作戦略を直感的に適応することができるが、そのような動作をロボットに表現し実装することは未解決の問題である。
本稿では,ロボットがタスク実行中に個別の操作戦略を選択・切り替えする,適応的操作のための行動木に基づくアプローチを提案する。
さらに,提案手法は,例えばタスクインスタンスの最適戦略を学習するなど,過去の課題からパフォーマンスを最適化しようとする試みを学習することを可能にする。
われわれのアプローチでは、ロボットがタスクの失敗をプリエンプトし、より実現可能な戦略に変更するか、破滅的な失敗が起こる前にタスクを安全に終了させることもできる。
本稿では,一般適応型ロボット行動のためのシンプルな行動木設計法を提案し,産業的操作の文脈で適用する。
適応的な振る舞いは、単一の操作戦略のみを使用したすべてのベースライン動作よりも優れており、サンプルタスクの完了に要する試行回数と全体的な時間を大幅に削減した。
この結果から,タスク完了時の堅牢性や効率性の向上,人的監督や介入への依存の低減が示唆された。
関連論文リスト
- Offline Imitation Learning Through Graph Search and Retrieval [57.57306578140857]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。
本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。
GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文 参考訳(メタデータ) (2024-07-22T06:12:21Z) - Rapid Motor Adaptation for Robotic Manipulator Arms [7.592744797132762]
汎用的な操作スキルの開発は、AIの具体化における中核的な課題である。
Rapid Motor Adaptation (RMA)はこの課題に対して有望な解決策を提供する。
我々は、様々な操作タスクにおいて、迅速な運動適応に適したエージェントを開発する。
論文 参考訳(メタデータ) (2023-12-07T20:11:03Z) - BC-Z: Zero-Shot Task Generalization with Robotic Imitation Learning [108.41464483878683]
本稿では,視覚に基づくロボット操作システムにおいて,新しいタスクを一般化することの課題について検討する。
実演と介入の両方から学ぶことができるインタラクティブで柔軟な模倣学習システムを開発した。
実際のロボットにおけるデータ収集を100以上のタスクにスケールすると、このシステムは平均的な成功率44%で24の目に見えない操作タスクを実行できる。
論文 参考訳(メタデータ) (2022-02-04T07:30:48Z) - Efficiently Identifying Task Groupings for Multi-Task Learning [55.80489920205404]
マルチタスク学習は、あるタスクによって学習された情報を活用して、他のタスクのトレーニングに役立てることができる。
マルチタスク学習モデルにおいて、どのタスクを一緒にトレーニングすべきかを選択するアプローチを提案する。
本手法は,全タスクを協調学習し,タスクの勾配が他のタスクの損失に影響を及ぼす影響を定量化する。
論文 参考訳(メタデータ) (2021-09-10T02:01:43Z) - Behavior Self-Organization Supports Task Inference for Continual Robot
Learning [18.071689266826212]
本稿では,ロボット制御タスクの連続学習に対する新しいアプローチを提案する。
本手法は, 漸進的に自己組織化された行動によって, 行動埋め込みの教師なし学習を行う。
従来の手法とは異なり,本手法ではタスク分布の仮定は行わず,タスクを推論するタスク探索も必要としない。
論文 参考訳(メタデータ) (2021-07-09T16:37:27Z) - Evolving Hierarchical Memory-Prediction Machines in Multi-Task
Reinforcement Learning [4.030910640265943]
行動エージェントは、時間とともに様々な環境や目的にまたがって一般化されなければならない。
遺伝的プログラミングを用いて、制御文献から6つのユニークな環境で動作可能な、高度に一般化されたエージェントを進化させる。
進化するプログラムにおける創発的階層構造は、時間分解とメモリ上の問題環境の符号化を成功させるマルチタスクエージェントをもたらすことを示す。
論文 参考訳(メタデータ) (2021-06-23T21:34:32Z) - Modeling Long-horizon Tasks as Sequential Interaction Landscapes [75.5824586200507]
本稿では,一連のデモビデオからのみ,サブタスク間の依存関係と遷移を学習するディープラーニングネットワークを提案する。
これらのシンボルは、画像観察から直接学習し、予測できることが示される。
我々は,(1)人間によって実行されるパズル片のブロック積み重ね,(2)物体のピック・アンド・プレイスとキャビネットドアを7-DoFロボットアームで滑らせるロボット操作という,2つの長期水平作業において,我々の枠組みを評価する。
論文 参考訳(メタデータ) (2020-06-08T18:07:18Z) - Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。
このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-01T05:23:34Z) - Hierarchical Reinforcement Learning as a Model of Human Task
Interleaving [60.95424607008241]
我々は、強化学習によって駆動される監督制御の階層モデルを開発する。
このモデルは、タスクインターリービングの既知の経験的効果を再現する。
その結果、階層的RLがタスクインターリービングのもっともらしいモデルとして支持された。
論文 参考訳(メタデータ) (2020-01-04T17:53:28Z) - Meta Adaptation using Importance Weighted Demonstrations [19.37671674146514]
エージェントが新しいタスクを推測することが困難である場合も少なくない。
本稿では,特定のタスクの集合に関する事前知識を活用することで,関連するタスクを一般化する新しいアルゴリズムを提案する。
環境タスクの多様性からロボットを訓練し、目に見えない環境に適応できる実験を行った。
論文 参考訳(メタデータ) (2019-11-23T07:22:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。