論文の概要: Active Inference and Behavior Trees for Reactive Action Planning and
Execution in Robotics
- arxiv url: http://arxiv.org/abs/2011.09756v3
- Date: Wed, 9 Jun 2021 10:07:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 21:36:20.385978
- Title: Active Inference and Behavior Trees for Reactive Action Planning and
Execution in Robotics
- Title(参考訳): ロボティクスにおける行動計画と実行のためのアクティブ推論と行動ツリー
- Authors: Corrado Pezzato, Carlos Hernandez, Stefan Bonhof, Martijn Wisse
- Abstract要約: 本研究では,動的環境における動的行動計画と実行のための活性推論と行動木(BT)の組み合わせを提案する。
提案手法により、部分的に観測可能な初期状態を扱うことができ、予期せぬ事態に対する古典的なBTの堅牢性を向上させることができる。
- 参考スコア(独自算出の注目度): 2.040132783511305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a hybrid combination of active inference and behavior trees (BTs)
for reactive action planning and execution in dynamic environments, showing how
robotic tasks can be formulated as a free-energy minimization problem. The
proposed approach allows to handle partially observable initial states and
improves the robustness of classical BTs against unexpected contingencies while
at the same time reducing the number of nodes in a tree. In this work, the
general nominal behavior is specified offline through BTs, where a new type of
leaf node, the prior node, is introduced to specify the desired state to be
achieved rather than an action to be executed as typically done in BTs. The
decision of which action to execute to reach the desired state is performed
online through active inference. This results in the combination of continual
online planning and hierarchical deliberation, that is an agent is able to
follow a predefined offline plan while still being able to locally adapt and
take autonomous decisions at runtime. The properties of our algorithm, such as
convergence and robustness, are thoroughly analyzed, and the theoretical
results are validated in two different mobile manipulators performing similar
tasks, both in a simulated and real retail environment.
- Abstract(参考訳): 本稿では,動的環境における動的行動計画と実行のためのアクティブ推論とビヘイビアツリー(bts)のハイブリッド結合を提案し,ロボットタスクを自由エネルギー最小化問題として定式化する方法を示す。
提案手法では, 部分観測可能な初期状態の処理が可能であり, 従来のbtsのロバスト性を改善しつつ, ツリー内のノード数を削減できる。
この作業では、一般的な名目動作はBTを通してオフラインで指定され、BTで通常実行される動作ではなく、達成すべき状態を指定するために、新しいタイプの葉ノードである先行ノードが導入された。
どの動作を実行して所望の状態に達するかの決定は、アクティブ推論によってオンラインで実行される。
エージェントは、ローカルに適応し、実行時に自律的な決定を行うことができながら、事前定義されたオフライン計画に従うことができる。
コンバージェンスやロバスト性などのアルゴリズムの特性を網羅的に解析し, シミュレーションおよび実店舗環境において, 同様の作業を行う2つの移動マニピュレータにおいて理論的結果が検証された。
関連論文リスト
- Unified Task and Motion Planning using Object-centric Abstractions of
Motion Constraints [56.283944756315066]
本稿では,タスクとモーションプランニングを一つの検索に統一するTAMP手法を提案する。
我々のアプローチは、オフザシェルフAIサーチの計算効率を活用して、物理的に実現可能な計画が得られるような、オブジェクト中心の動作制約の抽象化に基づいている。
論文 参考訳(メタデータ) (2023-12-29T14:00:20Z) - Interactive Joint Planning for Autonomous Vehicles [19.479300967537675]
対話的な運転シナリオでは、あるエージェントの行動が隣人の行動に大きな影響を及ぼす。
本稿では,MPCを学習予測モデルでブリッジする対話型共同計画(Interactive Joint Planning, IJP)を提案する。
IJPは、共同最適化やサンプリングベースの計画を実行することなく、ベースラインを大幅に上回る。
論文 参考訳(メタデータ) (2023-10-27T17:48:25Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - On efficient computation in active inference [1.1470070927586016]
計算量を大幅に減らした有限時間地平線に対する新しい計画アルゴリズムを提案する。
また、新規かつ既存のアクティブな推論計画スキームに対して適切な目標分布を設定するプロセスを簡単にする。
論文 参考訳(メタデータ) (2023-07-02T07:38:56Z) - Generating Dispatching Rules for the Interrupting Swap-Allowed Blocking
Job Shop Problem Using Graph Neural Network and Reinforcement Learning [21.021840570685264]
割り込みスワップ可能なブロッキングジョブショップ問題(ISBJSSP)は、多くの製造計画やロジスティクスアプリケーションを現実的にモデル化することができる。
連続的な削除や加算を受けるノードとエッジを特徴とする動的解離グラフの定式化を導入する。
ISBJSSP設定の割り込み、スワップ、ブロッキングをシミュレートするシミュレータが開発された。
論文 参考訳(メタデータ) (2023-02-05T23:35:21Z) - Hyper-Learning for Gradient-Based Batch Size Adaptation [2.944323057176686]
バッチサイズをスケジューリングして拡大することは、ディープニューラルネットワークをトレーニングする際のノイズを制御する効果的な戦略である。
学習可能なスケジューリングのためのバッチサイズ適応を行うためのアルゴリズムとしてArbiterを導入する。
いくつかの実験でArbiterの有効性を実証した。
論文 参考訳(メタデータ) (2022-05-17T11:01:14Z) - Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in
Latent Space [76.46113138484947]
汎用ロボットは、現実世界の非構造環境において困難なタスクを完了するために、多様な行動レパートリーを必要とする。
この問題に対処するため、目標条件強化学習は、コマンド上の幅広いタスクの目標に到達可能なポリシーを取得することを目的としている。
本研究では,長期的課題に対する目標条件付き政策を実践的に訓練する手法であるPlanning to Practiceを提案する。
論文 参考訳(メタデータ) (2022-05-17T06:58:17Z) - Visual Learning-based Planning for Continuous High-Dimensional POMDPs [81.16442127503517]
Visual Tree Search (VTS)は、オフラインで学習した生成モデルとオンラインモデルベースのPOMDP計画を組み合わせた学習と計画の手順である。
VTSは、モンテカルロの木探索プランナーにおける画像観測の可能性を予測し評価するために、一連の深部生成観測モデルを利用することで、オフラインモデルトレーニングとオンラインプランニングを橋渡しする。
VTSは、異なる観測ノイズに対して堅牢であり、オンラインのモデルベースプランニングを利用するため、再トレーニングを必要とせずに、異なる報酬構造に適応できることを示す。
論文 参考訳(メタデータ) (2021-12-17T11:53:31Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z) - Deliberative Acting, Online Planning and Learning with Hierarchical
Operational Models [5.597986898418404]
AI研究では、アクションの計画は通常、アクションの結果として起こる可能性のあることを抽象的に特定するアクションの記述モデルを使用してきた。
計画されたアクションの実行には、リッチな計算制御構造とクローズドループオンライン意思決定を使用する運用モデルが必要である。
我々は、計画と行動の両方が同じ運用モデルを使用する統合された行動計画システムを実装している。
論文 参考訳(メタデータ) (2020-10-02T14:50:05Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。