論文の概要: Hierarchical hybrid modeling for flexible tool use
- arxiv url: http://arxiv.org/abs/2402.10088v1
- Date: Thu, 1 Feb 2024 15:15:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-18 12:38:57.455091
- Title: Hierarchical hybrid modeling for flexible tool use
- Title(参考訳): フレキシブルツールのための階層型ハイブリッドモデリング
- Authors: Matteo Priorelli, Ivilin Peev Stoianov
- Abstract要約: 本稿では,エージェントの構成を複製する複数のハイブリッドユニットで構成され,高レベル離散モデルによって制御されるアーキテクチャを提案する。
我々はこの階層的ハイブリッドモデルを非自明なタスクで評価し、移動ツールを選択した後、移動物体に到達した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In a recent computational framework called active inference, discrete models
can be linked to their continuous counterparts to perform decision-making in
changing environments. From another perspective, simple agents can be combined
to better capture the causal relationships of the world. How can we use these
two features together to achieve efficient goal-directed behavior? We present
an architecture composed of several hybrid -- continuous and discrete -- units
replicating the agent's configuration, controlled by a high-level discrete
model that achieves dynamic planning and synchronized behavior. Additional
factorizations within each level allow to represent hierarchically other agents
and objects in relation to the self. We evaluate this hierarchical hybrid model
on a non-trivial task: reaching a moving object after having picked a moving
tool. This study extends past work on control as inference and proposes an
alternative direction to deep reinforcement learning.
- Abstract(参考訳): アクティブ推論と呼ばれる最近の計算フレームワークでは、離散モデルは連続的なモデルとリンクして、変化する環境における意思決定を行うことができる。
別の観点からは、単純なエージェントを組み合わせることで、世界の因果関係をよりよく捉えることができる。
この2つの機能を組み合わせて、効率的なゴール指向行動を実現するにはどうすればよいのか?
本稿では,エージェントの構成を複製し,動的計画と同期動作を実現する高レベル離散モデルにより制御する,複数のハイブリッドな,連続的かつ離散的なユニットからなるアーキテクチャを提案する。
各レベル内の追加の因子化により、階層的に他のエージェントやオブジェクトを自己と関連づけることができる。
我々はこの階層的ハイブリッドモデルを非自明なタスクで評価し、移動ツールを選択した後、移動物体に到達した。
本研究は,制御に関する過去の研究を推論として拡張し,深層強化学習に代わる方向性を提案する。
関連論文リスト
- Planning-Guided Diffusion Policy Learning for Generalizable Contact-Rich Bimanual Manipulation [16.244250979166214]
Generalizable Planning-Guided Diffusion Policy Learning (GLIDE)は、コンタクトリッチな双方向操作タスクを解決するためのアプローチである。
本稿では,特徴抽出,タスク表現,行動予測,データ拡張における重要な設計オプションのセットを提案する。
本手法は, 多様な地形, 寸法, 物理的特性の物体を効果的に操作することができる。
論文 参考訳(メタデータ) (2024-12-03T18:51:39Z) - Adaptive Planning with Generative Models under Uncertainty [20.922248169620783]
生成モデルによる計画は、幅広い領域にわたる効果的な意思決定パラダイムとして現れてきた。
最新の環境観測に基づいて決定を下すことができるため、各段階での継続的再計画は直感的に思えるかもしれないが、かなりの計算上の課題をもたらす。
本研究は,長軸状態軌跡を予測できる生成モデルの能力を活用する,シンプルな適応計画手法を導入することで,この問題に対処する。
論文 参考訳(メタデータ) (2024-08-02T18:07:53Z) - Online Pareto-Optimal Decision-Making for Complex Tasks using Active Inference [14.470714123175972]
本稿では,多目的強化学習のための新しいフレームワークを提案する。
安全なタスク実行を保証し、目的間のトレードオフを最適化し、ユーザの好みに準拠します。
操作と移動ロボットのケーススタディとベンチマークは、我々のフレームワークが他の方法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-06-17T18:03:45Z) - Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning [51.52387511006586]
本稿では,HOP(Hierarchical Opponent Modeling and Planning)を提案する。
HOPは階層的に2つのモジュールから構成される: 相手の目標を推論し、対応する目標条件のポリシーを学ぶ、反対モデリングモジュール。
HOPは、さまざまな未確認エージェントと相互作用する際、優れた少数ショット適応能力を示し、セルフプレイのシナリオで優れている。
論文 参考訳(メタデータ) (2024-06-12T08:48:06Z) - Compositional Foundation Models for Hierarchical Planning [52.18904315515153]
本稿では,言語,視覚,行動データを個別に訓練し,長期的課題を解決するための基礎モデルを提案する。
我々は,大規模なビデオ拡散モデルを用いて,環境に根ざした記号的計画を構築するために,大規模言語モデルを用いている。
生成したビデオプランは、生成したビデオからアクションを推論する逆ダイナミクスモデルを通じて、視覚運動制御に基礎を置いている。
論文 参考訳(メタデータ) (2023-09-15T17:44:05Z) - Optimal task and motion planning and execution for human-robot
multi-agent systems in dynamic environments [54.39292848359306]
本稿では,タスクのシーケンシング,割り当て,実行を最適化するタスクと動作計画の組み合わせを提案する。
このフレームワークはタスクとアクションの分離に依存しており、アクションはシンボル的タスクの幾何学的実現の可能な1つの可能性である。
ロボットアームと人間の作業員がモザイクを組み立てる共同製造シナリオにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-03-27T01:50:45Z) - Scene Transformer: A unified multi-task model for behavior prediction
and planning [42.758178896204036]
実世界の運転環境における全てのエージェントの行動予測モデルを定式化する。
近年の言語モデリングアプローチにインスパイアされた我々は、マスキング戦略をモデルに対するクエリとして使用しています。
我々は,行動予測のための自律走行データセットに対するアプローチを評価し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-06-15T20:20:44Z) - A Consciousness-Inspired Planning Agent for Model-Based Reinforcement
Learning [104.3643447579578]
本稿では、その状態の関連部分に動的に対応できるエンドツーエンドのモデルベース深層強化学習エージェントを提案する。
この設計により、エージェントは関連するオブジェクトに参画することで効果的に計画を学ぶことができ、配布外一般化がより良くなる。
論文 参考訳(メタデータ) (2021-06-03T19:35:19Z) - Behavior Priors for Efficient Reinforcement Learning [97.81587970962232]
本稿では,情報とアーキテクチャの制約を,確率論的モデリング文献のアイデアと組み合わせて行動の事前学習を行う方法について考察する。
このような潜伏変数の定式化が階層的強化学習(HRL)と相互情報と好奇心に基づく目的との関係について論じる。
シミュレーションされた連続制御領域に適用することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-27T13:17:18Z) - Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。
本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。
提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:42:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。