論文の概要: Compositionality of Linearly Solvable Optimal Control in Networked
Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2009.13609v2
- Date: Mon, 22 Mar 2021 19:33:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 22:49:09.927032
- Title: Compositionality of Linearly Solvable Optimal Control in Networked
Multi-Agent Systems
- Title(参考訳): ネットワーク型マルチエージェントシステムにおける線形可解最適制御の構成性
- Authors: Lin Song, Neng Wan, Aditya Gahlawat, Naira Hovakimyan, and Evangelos
A. Theodorou
- Abstract要約: マルチエージェントシステム(MAS)における学習されたコンポーネントタスクから未学習の複合タスクへの最適制御則の一般化手法について議論する。
提案手法は, 離散時間と連続時間の両方において, 協調MASフレームワーク内で同時に制御動作の構成性と最適性を実現する。
- 参考スコア(独自算出の注目度): 27.544923751902807
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we discuss the methodology of generalizing the optimal control
law from learned component tasks to unlearned composite tasks on Multi-Agent
Systems (MASs), by using the linearity composition principle of linearly
solvable optimal control (LSOC) problems. The proposed approach achieves both
the compositionality and optimality of control actions simultaneously within
the cooperative MAS framework in both discrete- and continuous-time in a
sample-efficient manner, which reduces the burden of re-computation of the
optimal control solutions for the new task on the MASs. We investigate the
application of the proposed approach on the MAS with coordination between
agents. The experiments show feasible results in investigated scenarios,
including both discrete and continuous dynamical systems for task
generalization without resampling.
- Abstract(参考訳): 本稿では、線形可解最適制御(LSOC)問題の線形性合成原理を用いて、学習されたコンポーネントタスクから学習されていない複合タスクへの最適制御則を一般化する手法について論じる。
提案手法は, 離散時間と連続時間の両方において, 協調MASフレームワーク内で同時に制御動作の構成性および最適性を両立させ, 新たなタスクに対する最適制御解の再計算の負担を軽減する。
エージェント間の協調によるMASに対する提案手法の適用について検討する。
本実験は,タスク一般化のための離散的および連続的力学系を含む研究シナリオにおいて,再サンプリングなしで実現可能な結果を示す。
関連論文リスト
- Sample-Efficient Multi-Agent RL: An Optimization Perspective [103.35353196535544]
一般関数近似に基づく汎用マルコフゲーム(MG)のためのマルチエージェント強化学習(MARL)について検討した。
汎用MGに対するマルチエージェントデカップリング係数(MADC)と呼ばれる新しい複雑性尺度を導入する。
我々のアルゴリズムは既存の研究に匹敵するサブリニアな後悔を与えることを示す。
論文 参考訳(メタデータ) (2023-10-10T01:39:04Z) - Clustered Multi-Agent Linear Bandits [5.893124686141782]
クラスタ化多重エージェント線形バンドイットと呼ばれる,マルチエージェント線形バンドイット問題の特定の事例に対処する。
本稿では,エージェント間の効率的な協調を利用して最適化問題を高速化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-15T19:01:42Z) - Active RIS-aided EH-NOMA Networks: A Deep Reinforcement Learning
Approach [66.53364438507208]
アクティブな再構成可能なインテリジェントサーフェス(RIS)支援マルチユーザダウンリンク通信システムについて検討した。
非直交多重アクセス(NOMA)はスペクトル効率を向上させるために使用され、活性RISはエネルギー回収(EH)によって駆動される。
ユーザの動的通信状態を予測するために,高度なLSTMベースのアルゴリズムを開発した。
増幅行列と位相シフト行列RISを結合制御するためにDDPGに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-11T13:16:28Z) - A Learning-based Adaptive Compliance Method for Symmetric Bi-manual
Manipulation [12.1653210014464]
本稿では,対称的双方向操作の効率性とロバスト性を向上させる学習型適応コンプライアンスアルゴリズム(LAC)を提案する。
LSTMネットワークを用いたActor-Criticフレームワークを導入し、双方向操作の同期性を向上させる。
両腕協調処理およびペグ・イン・ホール組立実験で評価すると,本手法は最適性とロバスト性の観点からベースラインアルゴリズムより優れている。
論文 参考訳(メタデータ) (2023-03-27T14:51:29Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - A Two-stage Framework and Reinforcement Learning-based Optimization
Algorithms for Complex Scheduling Problems [54.61091936472494]
本稿では、強化学習(RL)と従来の運用研究(OR)アルゴリズムを組み合わせた2段階のフレームワークを開発する。
スケジューリング問題は,有限マルコフ決定過程 (MDP) と混合整数計画過程 (mixed-integer programming process) の2段階で解決される。
その結果,本アルゴリズムは,アジャイルな地球観測衛星スケジューリング問題に対して,安定かつ効率的に十分なスケジューリング計画を得ることができた。
論文 参考訳(メタデータ) (2021-03-10T03:16:12Z) - Distributed Algorithms for Linearly-Solvable Optimal Control in
Networked Multi-Agent Systems [15.782670973813774]
ネットワーク化されたMASの最適制御問題を複数の局所最適制御問題に分割する分散フレームワークを提案する。
離散時間系では、各サブシステムの合同ベルマン方程式は線形方程式系に変換される。
連続時間系では、各サブシステムの合同最適方程式は線形偏微分方程式に変換される。
論文 参考訳(メタデータ) (2021-02-18T01:31:17Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - A Novel Multi-Agent System for Complex Scheduling Problems [2.294014185517203]
本稿では,様々な問題領域に適用可能なマルチエージェントシステムの概念と実装について述べる。
提案手法の有効性を示すため,NP-hardスケジューリング問題をシミュレートする。
本稿では,レイアウトの複雑さの低減,複雑なシステムの制御の改善,拡張性など,エージェントベースのアプローチの利点を強調した。
論文 参考訳(メタデータ) (2020-04-20T14:04:58Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。