論文の概要: Deep Reinforcement Learning for Wireless Scheduling in Distributed
Networked Control
- arxiv url: http://arxiv.org/abs/2109.12562v1
- Date: Sun, 26 Sep 2021 11:27:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-29 11:58:27.732289
- Title: Deep Reinforcement Learning for Wireless Scheduling in Distributed
Networked Control
- Title(参考訳): 分散ネットワーク制御における無線スケジューリングのための深層強化学習
- Authors: Wanchun Liu, Kang Huang, Daniel E. Quevedo, Branka Vucetic and Yonghui
Li
- Abstract要約: この研究は、分散植物、センサー、アクチュエータ、コントローラを備えた完全な分散WNCSを考慮し、限られた数の周波数チャネルを共有する。
最適な送信スケジューリング問題を決定プロセス問題に定式化し、それを解くための深層強化学習アルゴリズムを開発する。
- 参考スコア(独自算出の注目度): 56.77877237894372
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the literature of transmission scheduling in wireless networked control
systems (WNCSs) over shared wireless resources, most research works have
focused on partially distributed settings, i.e., where either the controller
and actuator, or the sensor and controller are co-located. To overcome this
limitation, the present work considers a fully distributed WNCS with
distributed plants, sensors, actuators and a controller, sharing a limited
number of frequency channels. To overcome communication limitations, the
controller schedules the transmissions and generates sequential predictive
commands for control. Using elements of stochastic systems theory, we derive a
sufficient stability condition of the WNCS, which is stated in terms of both
the control and communication system parameters. Once the condition is
satisfied, there exists at least one stationary and deterministic scheduling
policy that can stabilize all plants of the WNCS. By analyzing and representing
the per-step cost function of the WNCS in terms of a finite-length countable
vector state, we formulate the optimal transmission scheduling problem into a
Markov decision process problem and develop a deep-reinforcement-learning-based
algorithm for solving it. Numerical results show that the proposed algorithm
significantly outperforms the benchmark policies.
- Abstract(参考訳): 共有無線リソースを用いた無線ネットワーク制御システム(wncss)における伝送スケジューリングの文献では、ほとんどの研究は、部分的に分散された設定、すなわち、コントローラとアクチュエータ、またはセンサとコントローラが同じ位置にあることに焦点を当てている。
この制限を克服するため,本研究では,分散プラント,センサ,アクチュエータ,コントローラを備えた完全分散wncについて検討する。
通信制限を克服するため、コントローラは送信をスケジュールし、制御のための逐次予測コマンドを生成する。
確率的システム理論の要素を用いて、制御系パラメータと通信系パラメータの両方で記述されるWNCSの十分な安定性条件を導出する。
条件が満たされると、wncの全プラントを安定化できる少なくとも1つの定常的かつ決定論的スケジューリングポリシーが存在する。
有限長可算ベクトル状態を用いてWNCSのステップ毎のコスト関数を解析・表現することにより、マルコフ決定プロセス問題に最適な送信スケジューリング問題を定式化し、それを解くための深層強化学習に基づくアルゴリズムを開発する。
数値計算の結果,提案アルゴリズムはベンチマーク・ポリシーを著しく上回る結果となった。
関連論文リスト
- Learning Robust and Correct Controllers from Signal Temporal Logic
Specifications Using BarrierNet [5.809331819510702]
我々は,STL定量的セマンティクスを利用して,ロバスト満足度の概念を定義した。
本研究では,STLのフラグメント内の式を満足させる訓練可能な高次制御バリア関数(HOCBF)を構築する。
我々は、他のニューラルネットワークパラメータとともにHOCBFをトレーニングし、コントローラの堅牢性をさらに向上させる。
論文 参考訳(メタデータ) (2023-04-12T21:12:15Z) - A Deep Reinforcement Learning Framework for Optimizing Congestion
Control in Data Centers [2.310582065745938]
異なるネットワーク環境において高い性能を達成するために,様々な渋滞制御プロトコルが設計されている。
集中制御アクションをマシンに委譲する現代のオンライン学習ソリューションは、データセンターの厳格な時間スケールに適切に収束できない。
我々はマルチエージェント強化学習を利用して、データセンターのエンドホストにおける混雑制御パラメータを動的にチューニングするシステムを設計する。
論文 参考訳(メタデータ) (2023-01-29T22:08:35Z) - Robust Control for Dynamical Systems With Non-Gaussian Noise via Formal
Abstractions [59.605246463200736]
雑音分布の明示的な表現に依存しない新しい制御器合成法を提案する。
まず、連続制御系を有限状態モデルに抽象化し、離散状態間の確率的遷移によってノイズを捕捉する。
我々は最先端の検証技術を用いてマルコフ決定プロセスの間隔を保証し、これらの保証が元の制御システムに受け継がれるコントローラを演算する。
論文 参考訳(メタデータ) (2023-01-04T10:40:30Z) - Deep Learning for Wireless Networked Systems: a joint
Estimation-Control-Scheduling Approach [47.29474858956844]
ワイヤレスネットワーク制御システム(Wireless Networked Control System, WNCS)は、無線通信を介してセンサ、コントローラ、アクチュエータを接続する技術であり、産業用 4.0 時代において、高度にスケーラブルで低コストな制御システムの展開を可能にする技術である。
WNCSにおける制御と通信の密接な相互作用にもかかわらず、既存のほとんどの研究は分離設計アプローチを採用している。
モデルフリーデータとモデルベースデータの両方を利用する制御と最適化のための,DRLに基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-03T01:29:40Z) - State-Augmented Learnable Algorithms for Resource Management in Wireless
Networks [124.89036526192268]
本稿では,無線ネットワークにおける資源管理問題を解決するためのステート拡張アルゴリズムを提案する。
提案アルゴリズムは, RRM決定を可能, ほぼ最適に行うことができることを示す。
論文 参考訳(メタデータ) (2022-07-05T18:02:54Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Stable Online Control of Linear Time-Varying Systems [49.41696101740271]
COCO-LQは、大規模なLTVシステムの入出力安定性を保証する効率的なオンライン制御アルゴリズムである。
COCO-LQの性能を実証実験とパワーシステム周波数制御の両例で実証した。
論文 参考訳(メタデータ) (2021-04-29T06:18:49Z) - Communication Topology Co-Design in Graph Recurrent Neural Network Based
Distributed Control [4.492630871726495]
分散コントローラのコンパクトかつ表現力のあるグラフ繰り返しニューラルネットワーク(GRNN)パラメータ化について紹介する。
提案されたパラメータ化は,従来のGNN(Graph Neural Network)ベースのパラメータ化に類似した,ローカルおよび分散アーキテクチャである。
本研究では,性能/通信密度のトレードオフ曲線を効率よく近似できることを示す。
論文 参考訳(メタデータ) (2021-04-28T16:30:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。