論文の概要: Combining Planning and Learning of Behavior Trees for Robotic Assembly
- arxiv url: http://arxiv.org/abs/2103.09036v1
- Date: Tue, 16 Mar 2021 13:11:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 13:19:20.070871
- Title: Combining Planning and Learning of Behavior Trees for Robotic Assembly
- Title(参考訳): ロボット組み立てのための行動木計画と学習の融合
- Authors: Jonathan Styrud, Matteo Iovino, Mikael Norrl\"of, M{\aa}rten
Bj\"orkman and Christian Smith
- Abstract要約: 遺伝的プログラミングアルゴリズムを用いて行動木を生成する手法を提案する。
このタイプの高レベルな行動木学習は,さらなる学習をすることなく実システムへ移行できることを示す。
- 参考スコア(独自算出の注目度): 0.9262157005505219
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial robots can solve very complex tasks in controlled environments,
but modern applications require robots able to operate in unpredictable
surroundings as well. An increasingly popular reactive policy architecture in
robotics is Behavior Trees but as with other architectures, programming time
still drives cost and limits flexibility. There are two main branches of
algorithms to generate policies automatically, automated planning and machine
learning, both with their own drawbacks. We propose a method for generating
Behavior Trees using a Genetic Programming algorithm and combining the two
branches by taking the result of an automated planner and inserting it into the
population. Experimental results confirm that the proposed method of combining
planning and learning performs well on a variety of robotic assembly problems
and outperforms both of the base methods used separately. We also show that
this type of high level learning of Behavior Trees can be transferred to a real
system without further training.
- Abstract(参考訳): 産業用ロボットは、制御された環境で非常に複雑なタスクを解決できるが、現代のアプリケーションでは予測不能な環境でもロボットを操作できる必要がある。
ロボティクスにおけるリアクティブポリシアーキテクチャは行動木が主流ですが、他のアーキテクチャと同様、プログラミング時間は依然としてコストと柔軟性を制限します。
ポリシを自動的に生成するアルゴリズムには、自動化された計画と機械学習の2つの大きなブランチがある。
本研究では,遺伝的プログラミングアルゴリズムを用いて行動木を生成する手法を提案し,これら2つの枝を組み合わせ,自動プランナーの結果を集団に挿入する手法を提案する。
実験の結果, 計画と学習を組み合わせる手法は, 様々なロボット組立問題に対して良好に動作し, 両者を別々に比較できることがわかった。
また,このような高レベルな行動木学習は,さらなる学習をすることなく実システムへ移行できることを示した。
関連論文リスト
- $π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.32743739202543]
本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。
我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文 参考訳(メタデータ) (2024-10-31T17:22:30Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation [68.70755196744533]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。
我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文 参考訳(メタデータ) (2023-11-02T17:59:21Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Using Deep Learning to Bootstrap Abstractions for Hierarchical Robot
Planning [27.384742641275228]
階層的な計画プロセス全体をブートストラップするための新しいアプローチを提案する。
これは、新しい環境に対する抽象状態とアクションが自動的に計算される方法を示している。
学習した抽象概念を、新しいマルチソース双方向階層型ロボット計画アルゴリズムに用いている。
論文 参考訳(メタデータ) (2022-02-02T08:11:20Z) - Learning and Executing Re-usable Behaviour Trees from Natural Language
Instruction [1.4824891788575418]
ビヘイビアツリーは、堅牢でモジュラーな制御アーキテクチャを提供するために、自然言語命令と組み合わせて使用することができる。
提案手法を用いて生成した行動木を,新しいシナリオに一般化する方法を示す。
本研究は,既存の自然言語命令コーパスに対して検証する。
論文 参考訳(メタデータ) (2021-06-03T07:47:06Z) - Behavior coordination for self-adaptive robots using constraint-based
configuration [0.0]
本稿では,自己適応型ロボットの制御アーキテクチャを動的に構成するアルゴリズムを提案する。
このアルゴリズムは制約に基づく構成アプローチを用いて、反応イベントと熟考イベントの両方に対応して、どの基本的なロボット動作をアクティベートするかを決定する。
このソリューションは、ROSとオープンソースをベースとした、Behavior Coordinator CBCと呼ばれるソフトウェア開発ツールとして実装されている。
論文 参考訳(メタデータ) (2021-03-24T12:09:44Z) - Learning Behavior Trees with Genetic Programming in Unpredictable
Environments [7.839247285151348]
遺伝的プログラミングは行動木の構造を学習するのに有効であることを示す。
我々は,学習したBTが現実的なシミュレータで同じタスクを解くことを実証し,タスク特定を必要とせずに収束することを示した。
論文 参考訳(メタデータ) (2020-11-06T09:28:23Z) - Thinking While Moving: Deep Reinforcement Learning with Concurrent
Control [122.49572467292293]
本研究では,制御システムの時間的進化とともに,ポリシーからのアクションのサンプリングを同時に行わなければならないような環境下での強化学習について検討する。
人や動物のように、ロボットは思考と移動を同時に行わなければならず、前の動作が完了する前に次の動作を決定する。
論文 参考訳(メタデータ) (2020-04-13T17:49:29Z) - Automatic Gesture Recognition in Robot-assisted Surgery with
Reinforcement Learning and Tree Search [63.07088785532908]
共同手術におけるジェスチャー分割と分類のための強化学習と木探索に基づく枠組みを提案する。
我々のフレームワークは,JIGSAWSデータセットのサチューリングタスクにおいて,精度,編集スコア,F1スコアの点で,既存の手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2020-02-20T13:12:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。