論文の概要: An Extended Convergence Result for Behaviour Tree Controllers
- arxiv url: http://arxiv.org/abs/2308.08994v1
- Date: Thu, 17 Aug 2023 14:05:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 16:34:17.118994
- Title: An Extended Convergence Result for Behaviour Tree Controllers
- Title(参考訳): 行動木制御系に対する拡張収束結果
- Authors: Christopher Iliffe Sprague, Petter \"Ogren
- Abstract要約: 振舞い木(BT)は階層的なハイブリッド制御ポリシーを組み立てるための最適なモジュラー・フレームワークである。
我々は、状態空間の所望部分に到達するという意味で、BTsの収束について研究する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Behavior trees (BTs) are an optimally modular framework to assemble
hierarchical hybrid control policies from a set of low-level control policies
using a tree structure. Many robotic tasks are naturally decomposed into a
hierarchy of control tasks, and modularity is a well-known tool for handling
complexity, therefor behavior trees have garnered widespread usage in the
robotics community. In this paper, we study the convergence of BTs, in the
sense of reaching a desired part of the state space. Earlier results on BT
convergence were often tailored to specific families of BTs, created using
different design principles. The results of this paper generalize the earlier
results and also include new cases of cyclic switching not covered in the
literature.
- Abstract(参考訳): 振舞い木(BT)は、木構造を用いた低レベル制御ポリシーの集合から階層的なハイブリッド制御ポリシーを組み立てる最適なモジュラーフレームワークである。
多くのロボットタスクは自然に制御タスクの階層に分解され、モジュラリティは複雑性を扱うツールとしてよく知られている。
本稿では,状態空間の所望の部分に到達するという意味で,btsの収束について検討する。
BTのコンバージェンスに関する初期の結果は、異なる設計原則を用いて作成されたBTの特定のファミリーに合わせることが多かった。
本稿は, 先行研究結果を一般化し, 文献に記載されていない循環切替の新しい事例を含む。
関連論文リスト
- Verifying Safety of Behaviour Trees in Event-B [0.0]
行動木(BT)はロボティクスコミュニティでますます人気が高まっている。
本稿では,すでに使用されている木の不変性を証明するために,行動木の公式な仕様と方法論を提案する。
論文 参考訳(メタデータ) (2022-09-28T12:26:50Z) - SoftTreeMax: Policy Gradient with Tree Search [72.9513807133171]
我々は、ツリー検索をポリシー勾配に統合する最初のアプローチであるSoftTreeMaxを紹介します。
Atariでは、SoftTreeMaxが分散PPOと比較して、実行時のパフォーマンスを最大5倍向上させる。
論文 参考訳(メタデータ) (2022-09-28T09:55:47Z) - Behavior Trees in Robot Control Systems [0.0]
振舞い木の主な考え方は、モジュラリティ、階層、フィードバックを活用することである。
ロボットタスクは、しばしばサブタスクの階層に分解されるため、そのようなモジュールの階層は自然である。
フィードバック制御は、低レベル制御システムにおける不確実性と障害を扱うための基本的なツールである。
論文 参考訳(メタデータ) (2022-03-24T14:16:15Z) - Provable Hierarchy-Based Meta-Reinforcement Learning [50.17896588738377]
HRLをメタRL設定で解析し、下流タスクで使用するメタトレーニング中に学習者が潜在階層構造を学習する。
我々は、この自然階層の標本効率の回復を保証し、抽出可能な楽観主義に基づくアルゴリズムとともに「多様性条件」を提供する。
我々の境界は、時間的・状態的・行動的抽象化などのHRL文献に共通する概念を取り入れており、我々の設定と分析が実際にHRLの重要な特徴を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-10-18T17:56:02Z) - Continuous-Time Behavior Trees as Discontinuous Dynamical Systems [0.0]
振舞い木は、いくつかの低レベル制御ポリシーをハイレベルなタスクスイッチングポリシーに結合する。
行動木の公式な連続時間定式化は欠如している。
行動木は不連続な力学系と見なすことができる。
論文 参考訳(メタデータ) (2021-09-03T15:11:42Z) - An expressiveness hierarchy of Behavior Trees and related architectures [0.0]
行動ツリー(BT)の表現力と他の行動選択アーキテクチャを比較するための正式なフレームワークを提供します。
これにより、BT、Decision Trees(DT)、Teleo-Reactive Programs(TR)、FSMs(Finite State Machines)など、制御アーキテクチャの階層化が実現します。
論文 参考訳(メタデータ) (2021-04-16T06:46:52Z) - Convex Polytope Trees [57.56078843831244]
コンベックスポリトープ木(CPT)は、決定境界の解釈可能な一般化によって決定木の系統を拡張するために提案される。
木構造が与えられたとき,木パラメータに対するCPTおよび拡張性のあるエンドツーエンドトレーニングアルゴリズムを効率的に構築する。
論文 参考訳(メタデータ) (2020-10-21T19:38:57Z) - Deep Imitation Learning for Bimanual Robotic Manipulation [70.56142804957187]
本稿では,ロボットによるバイマニュアル操作のための深層模倣学習フレームワークを提案する。
中心となる課題は、操作スキルを異なる場所にあるオブジェクトに一般化することである。
i)マルチモーダルダイナミクスを要素運動プリミティブに分解し、(ii)リカレントグラフニューラルネットワークを用いて各プリミティブをパラメータ化して相互作用を捕捉し、(iii)プリミティブを逐次的に構成する高レベルプランナと、プリミティブダイナミクスと逆運動学制御を組み合わせた低レベルコントローラを統合することを提案する。
論文 参考訳(メタデータ) (2020-10-11T01:40:03Z) - A principled analysis of Behavior Trees and their generalisations [0.0]
私たちは、ますます人気が高まっている木構造制御アーキテクチャである振舞い木(BT)の背景にある原則を分析します。
これらの原則を通した推論が、互換性のあるソリューションに繋がることを示す。
我々は、一般化BTまたは$k$-BTと呼ばれる新しい制御アーキテクチャを導入する。
論文 参考訳(メタデータ) (2020-08-27T04:09:31Z) - Tree-structured Attention with Hierarchical Accumulation [103.47584968330325]
階層的累積」は解析木構造を一定時間複雑度で自己注意に符号化する。
提案手法は,4つの IWSLT 翻訳タスクと WMT'14 翻訳タスクにおいて,SOTA 法より優れている。
論文 参考訳(メタデータ) (2020-02-19T08:17:00Z) - Parameterizing Branch-and-Bound Search Trees to Learn Branching Policies [76.83991682238666]
Branch and Bound (B&B) は、Mixed-Integer Linear Programming Problem (MILP) の解法として一般的に用いられる木探索法である。
本稿では,新しい模倣学習フレームワークを提案し,分岐を表現するための新しい入力機能とアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-12T17:43:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。