Fugu-MT 論文翻訳(概要): Active Inference and Behavior Trees for Reactive Action Planning and Execution in Robotics

論文の概要: Active Inference and Behavior Trees for Reactive Action Planning and Execution in Robotics

arxiv url: http://arxiv.org/abs/2011.09756v3
Date: Wed, 9 Jun 2021 10:07:30 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-23 21:36:20.385978
Title: Active Inference and Behavior Trees for Reactive Action Planning and Execution in Robotics
Title（参考訳）: ロボティクスにおける行動計画と実行のためのアクティブ推論と行動ツリー
Authors: Corrado Pezzato, Carlos Hernandez, Stefan Bonhof, Martijn Wisse
Abstract要約: 本研究では,動的環境における動的行動計画と実行のための活性推論と行動木(BT)の組み合わせを提案する。提案手法により、部分的に観測可能な初期状態を扱うことができ、予期せぬ事態に対する古典的なBTの堅牢性を向上させることができる。
参考スコア（独自算出の注目度）: 2.040132783511305
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose a hybrid combination of active inference and behavior trees (BTs) for reactive action planning and execution in dynamic environments, showing how robotic tasks can be formulated as a free-energy minimization problem. The proposed approach allows to handle partially observable initial states and improves the robustness of classical BTs against unexpected contingencies while at the same time reducing the number of nodes in a tree. In this work, the general nominal behavior is specified offline through BTs, where a new type of leaf node, the prior node, is introduced to specify the desired state to be achieved rather than an action to be executed as typically done in BTs. The decision of which action to execute to reach the desired state is performed online through active inference. This results in the combination of continual online planning and hierarchical deliberation, that is an agent is able to follow a predefined offline plan while still being able to locally adapt and take autonomous decisions at runtime. The properties of our algorithm, such as convergence and robustness, are thoroughly analyzed, and the theoretical results are validated in two different mobile manipulators performing similar tasks, both in a simulated and real retail environment.
Abstract（参考訳）: 本稿では,動的環境における動的行動計画と実行のためのアクティブ推論とビヘイビアツリー(bts)のハイブリッド結合を提案し,ロボットタスクを自由エネルギー最小化問題として定式化する方法を示す。提案手法では, 部分観測可能な初期状態の処理が可能であり, 従来のbtsのロバスト性を改善しつつ, ツリー内のノード数を削減できる。この作業では、一般的な名目動作はBTを通してオフラインで指定され、BTで通常実行される動作ではなく、達成すべき状態を指定するために、新しいタイプの葉ノードである先行ノードが導入された。どの動作を実行して所望の状態に達するかの決定は、アクティブ推論によってオンラインで実行される。エージェントは、ローカルに適応し、実行時に自律的な決定を行うことができながら、事前定義されたオフライン計画に従うことができる。コンバージェンスやロバスト性などのアルゴリズムの特性を網羅的に解析し, シミュレーションおよび実店舗環境において, 同様の作業を行う2つの移動マニピュレータにおいて理論的結果が検証された。

関連論文リスト

Scalable Decision-Making in Stochastic Environments through Learned Temporal Abstraction [7.918703013303246]
我々は,高次元連続行動空間における決定を学習する上での課題に対処する潜在マクロ行動プランナー(L-MAP)を提案する。 L-MAPは状態条件ベクトル量子変分オートエンコーダ(VQ-VAE)を通して時間的に拡張されたマクロアクションの集合を学習する連続制御タスクを含むオフラインRL設定では、L-MAPは離散潜在アクションを効率よく探索し、高い期待値が得られる。
論文参考訳（メタデータ） (2025-02-28T16:02:23Z)
Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling [51.38330727868982]
双方向デコーディング(BID)は、クローズドループ操作で動作チャンキングをブリッジするテスト時間推論アルゴリズムである。 BIDは、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させることを示す。
論文参考訳（メタデータ） (2024-08-30T15:39:34Z)
Planning with Adaptive World Models for Autonomous Driving [50.4439896514353]
マルチエージェントインタラクションをキャプチャする実世界のモーションプランニングベンチマークであるnuPlanを提案する。我々は、グラフ畳み込みニューラルネットワーク(GCNN)であるBehaviorNetを用いて、このようなユニークな振る舞いをモデル化することを学ぶ。また、モデル予測制御(MPC)ベースのプランナであるAdaptiveDriverについても紹介する。
論文参考訳（メタデータ） (2024-06-15T18:53:45Z)
Integrating Intent Understanding and Optimal Behavior Planning for Behavior Tree Generation from Human Instructions [5.31484618181979]
動作木(BT)は、人間の指示に従ってタスクを実行するロボットのための適切な制御アーキテクチャである。本稿では,BT生成のための2段階のフレームワークを提案する。我々は、一階述語論理における目的と十分に整形された公式を表現し、意図の理解と最適な行動計画を効果的にブリッジする。
論文参考訳（メタデータ） (2024-05-13T05:23:48Z)
Distributed Autonomous Swarm Formation for Dynamic Network Bridging [40.27919181139919]
離散化された部分観測可能なマルコフ決定過程(Dec-POMDP)における動的ネットワークブリッジ問題について定式化する。グラフ畳み込み強化学習(DGN)に基づく問題に対するマルチエージェント強化学習(MARL)アプローチを提案する。提案手法はシミュレーション環境で評価し,将来性を示す集中型ベースラインと比較した。
論文参考訳（メタデータ） (2024-04-02T01:45:03Z)
Deep hybrid models: infer and plan in a dynamic world [0.0]
複雑な制御タスクに対する能動推論に基づく解を提案する。提案したアーキテクチャは、ハイブリッド(離散および連続)処理を利用する。モデルが異なる条件下で提示された課題に対処できることが示される。
論文参考訳（メタデータ） (2024-02-01T15:15:25Z)
Unified Task and Motion Planning using Object-centric Abstractions of Motion Constraints [56.283944756315066]
本稿では,タスクとモーションプランニングを一つの検索に統一するTAMP手法を提案する。我々のアプローチは、オフザシェルフAIサーチの計算効率を活用して、物理的に実現可能な計画が得られるような、オブジェクト中心の動作制約の抽象化に基づいている。
論文参考訳（メタデータ） (2023-12-29T14:00:20Z)
PPAD: Iterative Interactions of Prediction and Planning for End-to-end Autonomous Driving [57.89801036693292]
PPAD(Iterative Interaction of Prediction and Planning Autonomous Driving)は、予測と計画のより良い統合を目的とした、タイムステップワイドなインタラクションである。我々は,階層的動的キーオブジェクトに着目したego-to-agent,ego-to-map,ego-to-BEVインタラクション機構を設計し,インタラクションをモデル化する。
論文参考訳（メタデータ） (2023-11-14T11:53:24Z)
AI planning in the imagination: High-level planning on learned abstract search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文参考訳（メタデータ） (2023-08-16T22:47:16Z)
On efficient computation in active inference [1.1470070927586016]
計算量を大幅に減らした有限時間地平線に対する新しい計画アルゴリズムを提案する。また、新規かつ既存のアクティブな推論計画スキームに対して適切な目標分布を設定するプロセスを簡単にする。
論文参考訳（メタデータ） (2023-07-02T07:38:56Z)
Generating Dispatching Rules for the Interrupting Swap-Allowed Blocking Job Shop Problem Using Graph Neural Network and Reinforcement Learning [21.021840570685264]
割り込みスワップ可能なブロッキングジョブショップ問題(ISBJSSP)は、多くの製造計画やロジスティクスアプリケーションを現実的にモデル化することができる。連続的な削除や加算を受けるノードとエッジを特徴とする動的解離グラフの定式化を導入する。 ISBJSSP設定の割り込み、スワップ、ブロッキングをシミュレートするシミュレータが開発された。
論文参考訳（メタデータ） (2023-02-05T23:35:21Z)
Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文参考訳（メタデータ） (2021-01-14T22:21:25Z)
Deliberative Acting, Online Planning and Learning with Hierarchical Operational Models [5.597986898418404]
AI研究では、アクションの計画は通常、アクションの結果として起こる可能性のあることを抽象的に特定するアクションの記述モデルを使用してきた。計画されたアクションの実行には、リッチな計算制御構造とクローズドループオンライン意思決定を使用する運用モデルが必要である。我々は、計画と行動の両方が同じ運用モデルを使用する統合された行動計画システムを実装している。
論文参考訳（メタデータ） (2020-10-02T14:50:05Z)
Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文参考訳（メタデータ） (2020-03-19T13:10:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。