Fugu-MT 論文翻訳(概要): Cooperative Path Integral Control for Stochastic Multi-Agent Systems

論文の概要: Cooperative Path Integral Control for Stochastic Multi-Agent Systems

arxiv url: http://arxiv.org/abs/2009.14775v2
Date: Sun, 21 Mar 2021 03:28:03 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-13 00:41:45.066271
Title: Cooperative Path Integral Control for Stochastic Multi-Agent Systems
Title（参考訳）: 確率的マルチエージェントシステムのための協調経路積分制御
Authors: Neng Wan, Aditya Gahlawat, Naira Hovakimyan, Evangelos A. Theodorou, and Petros G. Voulgaris
Abstract要約: 協調型マルチエージェントシステムのための分散最適制御ソリューションを提案する。エージェントの局所的な観測のみに依存する局所的な制御行動は、サブシステムの共同コスト関数を最適化するために設計されている。
参考スコア（独自算出の注目度）: 20.731989147508983
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A distributed stochastic optimal control solution is presented for cooperative multi-agent systems. The network of agents is partitioned into multiple factorial subsystems, each of which consists of a central agent and neighboring agents. Local control actions that rely only on agents' local observations are designed to optimize the joint cost functions of subsystems. When solving for the local control actions, the joint optimality equation for each subsystem is cast as a linear partial differential equation and solved using the Feynman-Kac formula. The solution and the optimal control action are then formulated as path integrals and approximated by a Monte-Carlo method. Numerical verification is provided through a simulation example consisting of a team of cooperative UAVs.
Abstract（参考訳）: 協調型マルチエージェントシステムのための分散確率最適制御ソリューションを提案する。エージェントのネットワークは複数の因子サブシステムに分割され、それぞれ中央エージェントと隣接エージェントで構成されている。エージェントの局所観測のみに依存する局所制御アクションは、サブシステムの合同コスト関数を最適化するように設計されている。局所制御作用を解くとき、各サブシステムの合同最適式を線形偏微分方程式としてキャストし、ファインマン・カック公式を用いて解く。解と最適制御作用は経路積分として定式化され、モンテカルロ法で近似される。数値検証は、協力型UAVチームからなるシミュレーション例を通して行われる。

関連論文リスト

Steering Large Agent Populations using Mean-Field Schrodinger Bridges with Gaussian Mixture Models [13.03355083378673]
Mean-Field Schrodinger Bridge (MFSB) 問題は、最小の作業制御ポリシーを見つけることを目的とした最適化問題である。マルチエージェント制御の文脈において、目的は同一の相互作用する協調エージェントの群の構成を制御することである。
論文参考訳（メタデータ） (2025-03-31T04:01:04Z)
Hypernetwork-based approach for optimal composition design in partially controlled multi-agent systems [5.860363407227059]
部分的に制御されたマルチエージェントシステム(PCMAS)は、システムデザイナが管理する制御可能なエージェントと、自律的に動作する制御不能エージェントで構成されている。本研究は,PCMASにおける最適構成設計問題に対処し,システム設計者の問題,制御不能エージェントの最適数とポリシー,制御不能エージェントの問題について検討する。本稿では,システムの構成とエージェントポリシーを協調的に最適化する,新しいハイパーネットワークベースのフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-18T07:35:24Z)
Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-12-14T06:17:33Z)
Stochastic Optimal Control Matching [53.156277491861985]
最適制御のための新しい反復拡散最適化(IDO)技術である最適制御マッチング(SOCM)を導入する。この制御は、一致するベクトル場に適合しようとすることで、最小二乗問題を通じて学習される。実験により,本アルゴリズムは最適制御のための既存のすべての IDO 手法よりも低い誤差を実現する。
論文参考訳（メタデータ） (2023-12-04T16:49:43Z)
Optimal State Manipulation for a Two-Qubit System Driven by Coherent and Incoherent Controls [77.34726150561087]
2量子ビット量子系の最適制御には状態準備が重要である。物理的に異なる2つのコヒーレント制御を利用し、ヒルベルト・シュミット目標密度行列を最適化する。
論文参考訳（メタデータ） (2023-04-03T10:22:35Z)
Multi-Resource Allocation for On-Device Distributed Federated Learning Systems [79.02994855744848]
本研究は,デバイス上の分散フェデレーション学習(FL)システムにおいて,レイテンシとエネルギー消費の重み付け和を最小化する分散マルチリソース割り当て方式を提案する。システム内の各モバイルデバイスは、指定された領域内でモデルトレーニングプロセスを実行し、それぞれパラメータの導出とアップロードを行うための計算と通信資源を割り当てる。
論文参考訳（メタデータ） (2022-11-01T14:16:05Z)
Fully Decentralized, Scalable Gaussian Processes for Multi-Agent Federated Learning [14.353574903736343]
マルチエージェントシステムにおけるGPトレーニングと予測のための分散およびスケーラブルなアルゴリズムを提案する。提案手法の有効性を,合成および実データに関する数値実験で示す。
論文参考訳（メタデータ） (2022-03-06T02:54:13Z)
Multi-Agent MDP Homomorphic Networks [100.74260120972863]
協調型マルチエージェントシステムでは、エージェントの異なる構成とそれらの局所的な観察の間に複雑な対称性が生じる。単エージェント強化学習における既存の対称性の研究は、完全に集中した環境にのみ一般化できる。本稿では,ローカル情報のみを用いた分散実行が可能なネットワークのクラスであるマルチエージェントMDPホモモルフィックネットワークを提案する。
論文参考訳（メタデータ） (2021-10-09T07:46:25Z)
Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。コア最適化問題の実用的なパラメトリゼーションを提供する。
論文参考訳（メタデータ） (2021-07-08T18:01:02Z)
Distributed Algorithms for Linearly-Solvable Optimal Control in Networked Multi-Agent Systems [15.782670973813774]
ネットワーク化されたMASの最適制御問題を複数の局所最適制御問題に分割する分散フレームワークを提案する。離散時間系では、各サブシステムの合同ベルマン方程式は線形方程式系に変換される。連続時間系では、各サブシステムの合同最適方程式は線形偏微分方程式に変換される。
論文参考訳（メタデータ） (2021-02-18T01:31:17Z)
Compositionality of Linearly Solvable Optimal Control in Networked Multi-Agent Systems [27.544923751902807]
マルチエージェントシステム(MAS)における学習されたコンポーネントタスクから未学習の複合タスクへの最適制御則の一般化手法について議論する。提案手法は, 離散時間と連続時間の両方において, 協調MASフレームワーク内で同時に制御動作の構成性と最適性を実現する。
論文参考訳（メタデータ） (2020-09-28T20:21:48Z)
A Multi-Agent Primal-Dual Strategy for Composite Optimization over Distributed Features [52.856801164425086]
目的関数を滑らかな局所関数と凸(おそらく非滑らか)結合関数の和とするマルチエージェント共有最適化問題について検討する。
論文参考訳（メタデータ） (2020-06-15T19:40:24Z)
Distributed Voltage Regulation of Active Distribution System Based on Enhanced Multi-agent Deep Reinforcement Learning [9.7314654861242]
本稿では,スペクトルクラスタリングと拡張マルチエージェント深部強化学習(MADRL)アルゴリズムに基づくデータ駆動分散電圧制御手法を提案する。提案手法は,システムパラメータの通信と知識の要求を大幅に低減することができる。また、不確実性を効果的に処理し、最新のローカル情報に基づいたオンライン協調制御を提供する。
論文参考訳（メタデータ） (2020-05-31T15:48:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。