論文の概要: Deep hybrid models: infer and plan in the real world
- arxiv url: http://arxiv.org/abs/2402.10088v2
- Date: Fri, 21 Jun 2024 16:46:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-24 19:58:24.471043
- Title: Deep hybrid models: infer and plan in the real world
- Title(参考訳): 深層ハイブリッドモデル:現実世界における推論と計画
- Authors: Matteo Priorelli, Ivilin Peev Stoianov,
- Abstract要約: 複雑な制御タスクに対する能動推論に基づく効果的な解を提案する。
提案したアーキテクチャは、ハイブリッド(離散的かつ連続的な)処理を利用して、自己と環境の階層的かつ動的表現を構築する。
我々は、このディープハイブリッドモデルを、移動ツールを選択した後、動く物体に到達するという、非自明なタスクで評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Determining an optimal plan to accomplish a goal is a hard problem in realistic scenarios, which often comprise dynamic and causal relationships between several entities. Although traditionally such problems have been tackled with optimal control and reinforcement learning, a recent biologically-motivated proposal casts planning and control as an inference process. Among these new approaches, one is particularly promising: active inference. This new paradigm assumes that action and perception are two complementary aspects of life whereby the role of the former is to fulfill the predictions inferred by the latter. In this study, we present an effective solution, based on active inference, to complex control tasks. The proposed architecture exploits hybrid (discrete and continuous) processing to construct a hierarchical and dynamic representation of the self and the environment, which is then used to produce a flexible plan consisting of subgoals at different temporal scales. We evaluate this deep hybrid model on a non-trivial task: reaching a moving object after having picked a moving tool. This study extends past work on planning as inference and advances an alternative direction to optimal control and reinforcement learning.
- Abstract(参考訳): 目標を達成するための最適な計画を決定することは、現実的なシナリオにおいて難しい問題であり、しばしば複数のエンティティ間の動的および因果関係を構成する。
伝統的にこのような問題は最適制御と強化学習に取り組んできたが、最近の生物学的に動機づけられた提案では、推論プロセスとしての計画と制御が提案されている。
これらの新しいアプローチの中で、特に有望なのがアクティブ推論である。
この新たなパラダイムは、行動と知覚が生活の2つの相補的な側面であり、前者の役割は後者によって推測される予測を満たすことであると仮定する。
本研究では,複雑な制御タスクに対する能動推論に基づく効果的な解を提案する。
提案したアーキテクチャはハイブリッド(離散的かつ連続的)処理を利用して自己と環境の階層的・動的表現を構築し、異なる時間スケールのサブゴールからなる柔軟なプランを作成する。
我々は、このディープハイブリッドモデルを、移動ツールを選択した後、動く物体に到達するという、非自明なタスクで評価する。
本研究は、予測としての計画の過去の作業を拡張し、最適制御と強化学習への代替の方向性を推し進める。
関連論文リスト
- Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning [51.52387511006586]
本稿では,HOP(Hierarchical Opponent Modeling and Planning)を提案する。
HOPは階層的に2つのモジュールから構成される: 相手の目標を推論し、対応する目標条件のポリシーを学ぶ、反対モデリングモジュール。
HOPは、さまざまな未確認エージェントと相互作用する際、優れた少数ショット適応能力を示し、セルフプレイのシナリオで優れている。
論文 参考訳(メタデータ) (2024-06-12T08:48:06Z) - Dynamic planning in hierarchical active inference [0.0]
人間の脳が認知決定に関連する運動軌跡を推論し、導入する能力について述べる。
この研究は、ニューラルネットワークと強化学習を中心とした従来の見解とは距離を置き、アクティブ推論においてまだ探索されていない方向に向かっている。
論文 参考訳(メタデータ) (2024-02-18T17:32:53Z) - Compositional Foundation Models for Hierarchical Planning [52.18904315515153]
本稿では,言語,視覚,行動データを個別に訓練し,長期的課題を解決するための基礎モデルを提案する。
我々は,大規模なビデオ拡散モデルを用いて,環境に根ざした記号的計画を構築するために,大規模言語モデルを用いている。
生成したビデオプランは、生成したビデオからアクションを推論する逆ダイナミクスモデルを通じて、視覚運動制御に基礎を置いている。
論文 参考訳(メタデータ) (2023-09-15T17:44:05Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in
Latent Space [76.46113138484947]
汎用ロボットは、現実世界の非構造環境において困難なタスクを完了するために、多様な行動レパートリーを必要とする。
この問題に対処するため、目標条件強化学習は、コマンド上の幅広いタスクの目標に到達可能なポリシーを取得することを目的としている。
本研究では,長期的課題に対する目標条件付き政策を実践的に訓練する手法であるPlanning to Practiceを提案する。
論文 参考訳(メタデータ) (2022-05-17T06:58:17Z) - Active Inference for Stochastic Control [1.3124513975412255]
能動推論は直感的な(確率的な)形式主義を考えると、問題を制御するための代替手法として登場した。
本研究は,制御設定のためのアクティブ推論の有用性を評価するために構築される。
本研究は, 強化学習と比較して, 決定論的・部分的可観測性の両方において, 能動推論の利点を示すものである。
論文 参考訳(メタデータ) (2021-08-27T12:51:42Z) - Behavior Priors for Efficient Reinforcement Learning [97.81587970962232]
本稿では,情報とアーキテクチャの制約を,確率論的モデリング文献のアイデアと組み合わせて行動の事前学習を行う方法について考察する。
このような潜伏変数の定式化が階層的強化学習(HRL)と相互情報と好奇心に基づく目的との関係について論じる。
シミュレーションされた連続制御領域に適用することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-27T13:17:18Z) - Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。
本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。
提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:42:59Z) - Path Planning in Dynamic Environments using Generative RNNs and Monte
Carlo Tree Search [11.412720572948086]
群衆や交通などの動的環境におけるロボット経路計画のための最先端の手法は、エージェントのための手作りのモーションモデルに依存している。
本稿では,モンテカルロ木探索(MCTS)における生成的リカレントニューラルネットワークを用いた統合経路計画フレームワークを提案する。
提案手法は,対話時の動作予測精度を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2020-01-30T22:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。