論文の概要: Coupled autoregressive active inference agents for control of multi-joint dynamical systems
- arxiv url: http://arxiv.org/abs/2410.10415v1
- Date: Mon, 14 Oct 2024 12:04:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-29 21:44:49.438070
- Title: Coupled autoregressive active inference agents for control of multi-joint dynamical systems
- Title(参考訳): 多関節系制御のための結合自己回帰活性推論剤
- Authors: Tim N. Nisslbeck, Wouter M. Kouw,
- Abstract要約: 関節によって接続された複数の体を持つ機械系を同定・制御するための能動的推論エージェントを提案する。
本研究は, 複合エージェントが, ダブル・マス・スプリング・ダンパーシステムの力学を学習し, 爆発的, 搾取的行動のバランスによって, 所望の位置に移動できることを実証する。
- 参考スコア(独自算出の注目度): 3.4069627091757178
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose an active inference agent to identify and control a mechanical system with multiple bodies connected by joints. This agent is constructed from multiple scalar autoregressive model-based agents, coupled together by virtue of sharing memories. Each subagent infers parameters through Bayesian filtering and controls by minimizing expected free energy over a finite time horizon. We demonstrate that a coupled agent of this kind is able to learn the dynamics of a double mass-spring-damper system, and drive it to a desired position through a balance of explorative and exploitative actions. It outperforms the uncoupled subagents in terms of surprise and goal alignment.
- Abstract(参考訳): 関節によって接続された複数の体を持つ機械系を同定・制御するための能動的推論エージェントを提案する。
複数のスカラー自己回帰モデルベースエージェントから構成され、記憶を共有することによって結合される。
各サブエージェントはベイズフィルタを通してパラメータを推論し、有限時間地平線上で期待される自由エネルギーを最小化することによって制御する。
本研究は, 複合エージェントが, ダブル・マス・スプリング・ダンパーシステムの力学を学習し, 爆発的, 搾取的行動のバランスによって, 所望の位置に移動できることを実証する。
これは、サプライズとゴールアライメントの点で、未結合のサブエージェントよりも優れています。
関連論文リスト
- Multi-agent assignment via state augmented reinforcement learning [3.4992411324493515]
本稿では,制約付き強化学習を通じて,マルチエージェント配置問題の矛盾する要件に対処する。
我々は,2変数の振動をエージェントに利用してタスク間の交互化を行う状態拡張アプローチを再帰する。
論文 参考訳(メタデータ) (2024-06-03T20:56:12Z) - Neural Interaction Energy for Multi-Agent Trajectory Prediction [55.098754835213995]
ニューラル・インタラクション・エナジー(MATE)によるマルチエージェント軌道予測(Multi-Agent Trajectory Prediction)というフレームワークを導入する。
MATEは神経相互作用エネルギーを用いてエージェントの対話運動を評価する。
時間的安定性を高めるために,エージェント間相互作用制約とエージェント内動作制約という2つの制約を導入する。
論文 参考訳(メタデータ) (2024-04-25T12:47:47Z) - Function Approximation for Reinforcement Learning Controller for Energy from Spread Waves [69.9104427437916]
マルチジェネレータ・ウェーブ・エナジー・コンバータ(WEC)は、スプレッド・ウェーブと呼ばれる異なる方向から来る複数の同時波を処理しなければならない。
これらの複雑な装置は、エネルギー捕獲効率、維持を制限する構造的ストレスの低減、高波に対する積極的な保護という複数の目的を持つコントローラを必要とする。
本稿では,システム力学のシーケンシャルな性質をモデル化する上で,ポリシーと批判ネットワークの異なる機能近似について検討する。
論文 参考訳(メタデータ) (2024-04-17T02:04:10Z) - DCIR: Dynamic Consistency Intrinsic Reward for Multi-Agent Reinforcement
Learning [84.22561239481901]
本稿では,エージェントの行動が他のエージェントの行動と一致しているかどうかを学習するための新しいアプローチを提案する。
マルチエージェント粒子, Google Research Football および StarCraft II Micromanagement を含む複数の環境における DCIR の評価を行った。
論文 参考訳(メタデータ) (2023-12-10T06:03:57Z) - A Policy Iteration Approach for Flock Motion Control [5.419608513284392]
全体的な制御プロセスは、群れの粘着性と局在性を監視しながらエージェントを誘導する。
ここでは、独立したコマンドジェネレータに従うためにエージェント群を誘導するために、オンラインモデルフリーのポリシーイテレーションメカニズムが開発されている。
政策反復機構のシミュレーション結果から,計算労力の少ない高速学習と収束挙動が明らかになった。
論文 参考訳(メタデータ) (2023-03-17T15:04:57Z) - IPCC-TP: Utilizing Incremental Pearson Correlation Coefficient for Joint
Multi-Agent Trajectory Prediction [73.25645602768158]
IPCC-TPはインクリメンタルピアソン相関係数に基づく新しい関連認識モジュールであり,マルチエージェントインタラクションモデリングを改善する。
我々のモジュールは、既存のマルチエージェント予測手法に便利に組み込んで、元の動き分布デコーダを拡張することができる。
論文 参考訳(メタデータ) (2023-03-01T15:16:56Z) - Learning Individual Policies in Large Multi-agent Systems through Local
Variance Minimization [8.140037969280716]
多くのエージェントを持つマルチエージェントシステムでは、各エージェントの他のエージェントの価値への貢献は最小限である。
エージェントの値の分散を最小限に抑える新しいマルチエージェント強化学習(MARL)機構を提案する。
提案手法は, タクシー運転手の収益のばらつきを低減しつつ, 先行するアプローチよりも高いジョイント収益を提供できることを示す。
論文 参考訳(メタデータ) (2022-12-27T06:59:00Z) - Multi-agent Deep Covering Skill Discovery [50.812414209206054]
本稿では,複数エージェントの結合状態空間の予測被覆時間を最小化し,マルチエージェントオプションを構築するマルチエージェントDeep Covering Option Discoveryを提案する。
また、MARLプロセスにマルチエージェントオプションを採用するための新しいフレームワークを提案する。
提案アルゴリズムは,アテンション機構とエージェントの相互作用を効果的に把握し,マルチエージェントオプションの同定に成功した。
論文 参考訳(メタデータ) (2022-10-07T00:40:59Z) - Stochastic Multi Configuration Time-Dependent Hartree for Dissipative
Quantum Dynamics with Strong Intramolecular Coupling [0.0]
マルコフ浴と強く結合した多次元接触の散逸ダイナミクスをシステムバスアプローチにより検討する。
分子内カップリングが弱い場合, ウェーブパケットの熱的アンサンブルが得られた。
新しいリンドブラッド散逸作用素は系座標と関連するモータの線形結合として構成される。
論文 参考訳(メタデータ) (2022-06-16T15:19:35Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Learning emergent PDEs in a learned emergent space [0.6157382820537719]
我々は結合エージェントシステムの集合記述のための偏微分方程式(PDE)の形式で予測モデルを学習する。
スロー多様体上の集団ダイナミクスは、創発座標における局所的"空間的"部分微分に基づく学習モデルによって近似できることを示した。
提案手法はエージェントダイナミクスをパラメータとする創発的空間座標の自動抽出とデータ駆動抽出を統合する。
論文 参考訳(メタデータ) (2020-12-23T15:17:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。