論文の概要: Learning Behavior Trees with Genetic Programming in Unpredictable
Environments
- arxiv url: http://arxiv.org/abs/2011.03252v1
- Date: Fri, 6 Nov 2020 09:28:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 05:06:48.312777
- Title: Learning Behavior Trees with Genetic Programming in Unpredictable
Environments
- Title(参考訳): 予測不能環境における遺伝的プログラミングによる行動木学習
- Authors: Matteo Iovino, Jonathan Styrud, Pietro Falco and Christian Smith
- Abstract要約: 遺伝的プログラミングは行動木の構造を学習するのに有効であることを示す。
我々は,学習したBTが現実的なシミュレータで同じタスクを解くことを実証し,タスク特定を必要とせずに収束することを示した。
- 参考スコア(独自算出の注目度): 7.839247285151348
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern industrial applications require robots to be able to operate in
unpredictable environments, and programs to be created with a minimal effort,
as there may be frequent changes to the task. In this paper, we show that
genetic programming can be effectively used to learn the structure of a
behavior tree (BT) to solve a robotic task in an unpredictable environment.
Moreover, we propose to use a simple simulator for the learning and demonstrate
that the learned BTs can solve the same task in a realistic simulator, reaching
convergence without the need for task specific heuristics. The learned solution
is tolerant to faults, making our method appealing for real robotic
applications.
- Abstract(参考訳): 現代の産業用途では、ロボットは予測不可能な環境で動作し、タスクに頻繁に変更があるため、最小限の努力でプログラムを作成する必要がある。
本稿では,遺伝的プログラミングを用いて行動木(BT)の構造を学習し,予測不能な環境下でのロボット作業の解決が可能であることを示す。
さらに,学習に簡単なシミュレータを用い,学習したBTが現実的なシミュレータで同じタスクを解くことを実証し,タスク固有のヒューリスティックを必要とせずに収束に達することを提案する。
学習した解決策は欠点に寛容であり、実際のロボット応用にアピールする。
関連論文リスト
- RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation [68.70755196744533]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。
我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文 参考訳(メタデータ) (2023-11-02T17:59:21Z) - Learning Tool Morphology for Contact-Rich Manipulation Tasks with
Differentiable Simulation [27.462052737553055]
本稿では,異なる物理シミュレータを応用して,コンタクトリッチな操作タスクのためのツール形態を自動学習するエンドツーエンドフレームワークを提案する。
提案手法では,タスク性能に関する目的を定義し,タスクの変動をランダムにすることで,頑健な形態学の学習を可能にする。
提案手法の有効性を, ロープの巻き上げ, 箱をひっくり返し, ピースをスクープに押し付けるなど, 様々なシナリオにおける新しいツールの設計手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-11-04T00:57:36Z) - Don't Start From Scratch: Leveraging Prior Data to Automate Robotic
Reinforcement Learning [70.70104870417784]
強化学習(RL)アルゴリズムは、ロボットシステムの自律的なスキル獲得を可能にするという約束を持っている。
現実のロボットRLは、通常、環境をリセットするためにデータ収集と頻繁な人間の介入を必要とする。
本研究では,従来のタスクから収集した多様なオフラインデータセットを効果的に活用することで,これらの課題にどのように対処できるかを検討する。
論文 参考訳(メタデータ) (2022-07-11T08:31:22Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - Learning and Executing Re-usable Behaviour Trees from Natural Language
Instruction [1.4824891788575418]
ビヘイビアツリーは、堅牢でモジュラーな制御アーキテクチャを提供するために、自然言語命令と組み合わせて使用することができる。
提案手法を用いて生成した行動木を,新しいシナリオに一般化する方法を示す。
本研究は,既存の自然言語命令コーパスに対して検証する。
論文 参考訳(メタデータ) (2021-06-03T07:47:06Z) - Combining Planning and Learning of Behavior Trees for Robotic Assembly [0.9262157005505219]
遺伝的プログラミングアルゴリズムを用いて行動木を生成する手法を提案する。
このタイプの高レベルな行動木学習は,さらなる学習をすることなく実システムへ移行できることを示す。
論文 参考訳(メタデータ) (2021-03-16T13:11:39Z) - Error-Aware Policy Learning: Zero-Shot Generalization in Partially
Observable Dynamic Environments [18.8481771211768]
新しい環境に適応できる政策を開発することで、このようなシム・トゥ・リアル問題に取り組むための新しいアプローチを紹介します。
私たちのアプローチの鍵は、トレーニング中に観察できない要因の影響を明示的に認識するエラー認識ポリシー(EAP)です。
ヒップトルク補助装置の訓練されたEAPは, 生体力学的特性の異なる異なる人体エージェントに転送可能であることを示す。
論文 参考訳(メタデータ) (2021-03-13T15:36:44Z) - Never Stop Learning: The Effectiveness of Fine-Tuning in Robotic
Reinforcement Learning [109.77163932886413]
本稿では,ロボットによるロボット操作ポリシーを,政治以外の強化学習を通じて微調整することで,新たなバリエーションに適応する方法を示す。
この適応は、タスクをゼロから学習するために必要なデータの0.2%未満を使用する。
事前訓練されたポリシーを適用するという私たちのアプローチは、微調整の過程で大きなパフォーマンス向上につながります。
論文 参考訳(メタデータ) (2020-04-21T17:57:04Z) - SAPIEN: A SimulAted Part-based Interactive ENvironment [77.4739790629284]
SAPIENは現実的で物理に富んだシミュレートされた環境であり、音声オブジェクトのための大規模なセットをホストしている。
部品検出と動作特性認識のための最先端の視覚アルゴリズムの評価を行い,ロボットインタラクションタスクの実証を行った。
論文 参考訳(メタデータ) (2020-03-19T00:11:34Z) - The Chef's Hat Simulation Environment for Reinforcement-Learning-Based
Agents [54.63186041942257]
本稿では,人間-ロボットインタラクションのシナリオで使用されるように設計されたChef's Hatカードゲームを実装する仮想シミュレーション環境を提案する。
本稿では,強化学習アルゴリズムにおける制御可能かつ再現可能なシナリオを提案する。
論文 参考訳(メタデータ) (2020-03-12T15:52:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。