論文の概要: Hierarchical hybrid modeling for flexible tool use
- arxiv url: http://arxiv.org/abs/2402.10088v1
- Date: Thu, 1 Feb 2024 15:15:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-18 12:38:57.455091
- Title: Hierarchical hybrid modeling for flexible tool use
- Title(参考訳): フレキシブルツールのための階層型ハイブリッドモデリング
- Authors: Matteo Priorelli, Ivilin Peev Stoianov
- Abstract要約: 本稿では,エージェントの構成を複製する複数のハイブリッドユニットで構成され,高レベル離散モデルによって制御されるアーキテクチャを提案する。
我々はこの階層的ハイブリッドモデルを非自明なタスクで評価し、移動ツールを選択した後、移動物体に到達した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In a recent computational framework called active inference, discrete models
can be linked to their continuous counterparts to perform decision-making in
changing environments. From another perspective, simple agents can be combined
to better capture the causal relationships of the world. How can we use these
two features together to achieve efficient goal-directed behavior? We present
an architecture composed of several hybrid -- continuous and discrete -- units
replicating the agent's configuration, controlled by a high-level discrete
model that achieves dynamic planning and synchronized behavior. Additional
factorizations within each level allow to represent hierarchically other agents
and objects in relation to the self. We evaluate this hierarchical hybrid model
on a non-trivial task: reaching a moving object after having picked a moving
tool. This study extends past work on control as inference and proposes an
alternative direction to deep reinforcement learning.
- Abstract(参考訳): アクティブ推論と呼ばれる最近の計算フレームワークでは、離散モデルは連続的なモデルとリンクして、変化する環境における意思決定を行うことができる。
別の観点からは、単純なエージェントを組み合わせることで、世界の因果関係をよりよく捉えることができる。
この2つの機能を組み合わせて、効率的なゴール指向行動を実現するにはどうすればよいのか?
本稿では,エージェントの構成を複製し,動的計画と同期動作を実現する高レベル離散モデルにより制御する,複数のハイブリッドな,連続的かつ離散的なユニットからなるアーキテクチャを提案する。
各レベル内の追加の因子化により、階層的に他のエージェントやオブジェクトを自己と関連づけることができる。
我々はこの階層的ハイブリッドモデルを非自明なタスクで評価し、移動ツールを選択した後、移動物体に到達した。
本研究は,制御に関する過去の研究を推論として拡張し,深層強化学習に代わる方向性を提案する。
関連論文リスト
- Relax, it doesn't matter how you get there: A new self-supervised
approach for multi-timescale behavior analysis [8.543808476554695]
我々は,2つの新しい構成要素を組み合わせた行動のマルチタスク表現学習モデルを開発した。
我々のモデルは、全体およびすべてのグローバルタスクにおいて、9つのフレームレベルタスクのうち7つのうち1番目または2番目をランク付けします。
論文 参考訳(メタデータ) (2023-03-15T17:58:48Z) - Rethinking Trajectory Prediction via "Team Game" [118.59480535826094]
本稿では,対話型グループコンセンサスの概念を明示的に導入した,マルチエージェント軌道予測の新しい定式化について述べる。
チームスポーツと歩行者の2つのマルチエージェント設定において,提案手法は既存手法と比較して常に優れた性能を達成している。
論文 参考訳(メタデータ) (2022-10-17T07:16:44Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Learning to Compose Hierarchical Object-Centric Controllers for Robotic
Manipulation [26.24940293693809]
本稿では、強化学習を用いて、操作タスクのための階層型オブジェクト中心コントローラを構築することを提案する。
シミュレーションと実世界の双方での実験では、提案手法がサンプル効率の向上、ゼロショットの一般化、微調整なしでのシミュレーションと現実の移動にどのように寄与するかが示されている。
論文 参考訳(メタデータ) (2020-11-09T18:38:29Z) - Behavior Priors for Efficient Reinforcement Learning [97.81587970962232]
本稿では,情報とアーキテクチャの制約を,確率論的モデリング文献のアイデアと組み合わせて行動の事前学習を行う方法について考察する。
このような潜伏変数の定式化が階層的強化学習(HRL)と相互情報と好奇心に基づく目的との関係について論じる。
シミュレーションされた連続制御領域に適用することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-27T13:17:18Z) - Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。
本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。
提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:42:59Z) - S2RMs: Spatially Structured Recurrent Modules [105.0377129434636]
モジュール構造とテンポラル構造の両方を同時に活用できる動的構造を利用するための一歩を踏み出します。
我々のモデルは利用可能なビューの数に対して堅牢であり、追加のトレーニングなしで新しいタスクに一般化できる。
論文 参考訳(メタデータ) (2020-07-13T17:44:30Z) - From proprioception to long-horizon planning in novel environments: A
hierarchical RL model [4.44317046648898]
本稿では,異なるタイプの推論を反映した,単純で3段階の階層型アーキテクチャを提案する。
本手法をMujoco Ant環境における一連のナビゲーションタスクに適用する。
論文 参考訳(メタデータ) (2020-06-11T17:19:12Z) - Multi-Agent Interactions Modeling with Correlated Policies [53.38338964628494]
本稿では,マルチエージェントインタラクションモデリング問題をマルチエージェント模倣学習フレームワークに実装する。
相関ポリシー(CoDAIL)を用いた分散型適応模倣学習アルゴリズムの開発
様々な実験により、CoDAILはデモレーターに近い複雑な相互作用をより良く再生できることが示されている。
論文 参考訳(メタデータ) (2020-01-04T17:31:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。