Fugu-MT 論文翻訳(概要): A mirror descent approach for Mean Field Control applied to Demande-Side management

論文の概要: A mirror descent approach for Mean Field Control applied to Demande-Side management

arxiv url: http://arxiv.org/abs/2302.08190v1
Date: Thu, 16 Feb 2023 10:15:08 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-17 14:15:30.936059
Title: A mirror descent approach for Mean Field Control applied to Demande-Side management
Title（参考訳）: 需要側管理に適用した平均場制御のためのミラー降下法
Authors: Bianca Marin Moreno (EDF R&D, Thoth), Margaux Br\'eg\`ere (SU, LPSM, EDF R&D), Pierre Gaillard (Thoth), Nadia Oudjane (EDF R&D)
Abstract要約: マルコフ模型に対する有限水平平均場制御問題を考える。我々は,非標準ブレグマン発散に付随するミラーDescentであることが証明された反復アルゴリズムを導入する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We consider a finite-horizon Mean Field Control problem for Markovian models. The objective function is composed of a sum of convex and Lipschitz functions taking their values on a space of state-action distributions. We introduce an iterative algorithm which we prove to be a Mirror Descent associated with a non-standard Bregman divergence, having a convergence rate of order 1/ $\sqrt$ K. It requires the solution of a simple dynamic programming problem at each iteration. We compare this algorithm with learning methods for Mean Field Games after providing a reformulation of our control problem as a game problem. These theoretical contributions are illustrated with numerical examples applied to a demand-side management problem for power systems aimed at controlling the average power consumption profile of a population of flexible devices contributing to the power system balance.
Abstract（参考訳）: マルコフ模型に対する有限水平平均場制御問題を考える。目的関数は、状態-作用分布の空間にそれらの値を取る凸関数とリプシッツ関数の和からなる。我々は,非標準ブレグマン発散に付随するミラー・ダイアンスであることが証明され,次数 1/$\sqrt$K の収束率を持つ反復アルゴリズムを導入する。本アルゴリズムを平均フィールドゲームにおける学習法と比較し,ゲーム問題として制御問題の再構成を行った。これらの理論的貢献は、電力系統のバランスに寄与するフレキシブルデバイス群の平均消費電力プロファイルを制御することを目的とした電力系統の需要側管理問題に適用した数値例で示される。

関連論文リスト

LMask: Learn to Solve Constrained Routing Problems with Lazy Masking [4.693576188349811]
動的マスキングを利用して制約付きルーティング問題に対する高品質な実現可能なソリューションを生成する新しい学習フレームワークであるLMaskを提案する。 LMaskは最先端の実現率とソリューションの品質を達成し、既存のニューラルメソッドを上回っている。
論文参考訳（メタデータ） (2025-05-23T14:15:26Z)
Communication-Control Codesign for Large-Scale Wireless Networked Control Systems [80.30532872347668]
無線ネットワーク制御システム(Wireless Networked Control Systems, WNCS)は、ドローン群や自律ロボットなどのアプリケーションにおいて柔軟な制御を可能にする産業用4.0に必須である。本稿では,マルチ状態マルコフブロックフェーディングチャネル上で限られた無線リソースを共有するセンサやアクチュエータを用いて,複数の制御ループ間の相関ダイナミクスを捕捉する実用的WNCSモデルを提案する。本研究では,ハイブリッドな動作空間を効率的に処理し,通信制御の相関関係を捉え,疎域変数や浮動小数点制御の入力に拘わらず堅牢なトレーニングを確実にするDeep Reinforcement Learning (DRL)アルゴリズムを開発した。
論文参考訳（メタデータ） (2024-10-15T06:28:21Z)
Optimal Control of Agent-Based Dynamics under Deep Galerkin Feedback Laws [0.0]
本稿では,Deep Galerkin法が適用すべきサンプリング問題について検討する。高分散政策近似の症状を軽減するためのドリフト緩和に基づくサンプリング手法を提案する。結果として、手動で最適化された制御関数よりも大幅なコスト削減がもたらされ、線形量子レギュレータの問題が改善された。
論文参考訳（メタデータ） (2024-06-13T14:10:57Z)
Towards Model-Free LQR Control over Rate-Limited Channels [2.908482270923597]
作業者エージェントが(LQRコストの)量子化ポリシー勾配を有限ビットレートのノイズレスチャネル上でサーバに送信する環境について検討する。我々は、適応量子化グラディエントDescent (textttAQGD) という新しいアルゴリズムを提案し、ある有限しきい値ビットレートを超えると、textttAQGDは、グローバルな最適ポリシーへの指数的に高速な収束を保証することを証明した。
論文参考訳（メタデータ） (2024-01-02T15:59:00Z)
Unsupervised Optimal Power Flow Using Graph Neural Networks [172.33624307594158]
グラフニューラルネットワークを用いて、要求された電力と対応するアロケーションとの間の非線形パラメトリゼーションを学習する。シミュレーションを通して、この教師なし学習コンテキストにおけるGNNの使用は、標準解法に匹敵するソリューションにつながることを示す。
論文参考訳（メタデータ） (2022-10-17T17:30:09Z)
State-Augmented Learnable Algorithms for Resource Management in Wireless Networks [124.89036526192268]
本稿では,無線ネットワークにおける資源管理問題を解決するためのステート拡張アルゴリズムを提案する。提案アルゴリズムは, RRM決定を可能, ほぼ最適に行うことができることを示す。
論文参考訳（メタデータ） (2022-07-05T18:02:54Z)
Learning Resilient Radio Resource Management Policies with Graph Neural Networks [124.89036526192268]
我々は、ユーザ当たりの最小容量制約でレジリエントな無線リソース管理問題を定式化する。有限個のパラメータ集合を用いてユーザ選択と電力制御ポリシーをパラメータ化できることを示す。このような適応により,提案手法は平均レートと5番目のパーセンタイルレートとの良好なトレードオフを実現する。
論文参考訳（メタデータ） (2022-03-07T19:40:39Z)
Learning Solution Manifolds for Control Problems via Energy Minimization [32.59818752168615]
様々な制御タスクは一般にエネルギー最小化問題として定式化されている。このような問題に対する数値解は十分に確立されているが、しばしばリアルタイムアプリケーションで直接使用されるには遅すぎる。本稿では,効率的かつ数値的に堅牢な行動クローニング(BC)の代替手法を提案する。
論文参考訳（メタデータ） (2022-03-07T14:28:57Z)
Short-Term Load Forecasting Using Time Pooling Deep Recurrent Neural Network [0.0]
再生可能エネルギー源と電気自動車などの新興負荷をスマートグリッドに統合することは、配電系統管理に不確実性をもたらす。デマンドサイドマネジメント(DSM)は、不確実性を低減するためのアプローチの一つである。 Nonintrusive Load Monitoring (NILM) のようなアプリケーションは DSM をサポートすることができるが、高解像度データの正確な予測は必要である。高いボラティリティのため、一戸建て住宅のような単一負荷の場合、これは難しい。
論文参考訳（メタデータ） (2021-09-26T05:20:48Z)
Solving MKP Applied to IoT in Smart Grid Using Meta-heuristics Algorithms: A Parallel Processing Perspective [0.22940141855172028]
南アフリカの電力価格の上昇は、スマートグリッドのようなデマンドサイドマネジメント(DSM)デバイスの必要性を招いている。スマートグリッドがピークに達するためには、そのエネルギー管理コントローラ(EMC)システムを最適化する必要がある。
論文参考訳（メタデータ） (2020-06-29T10:49:18Z)
Strictly Batch Imitation Learning by Energy-based Distribution Matching [104.33286163090179]
すなわち、強化信号へのアクセスがなく、遷移力学の知識がなく、環境とのさらなる相互作用もない。 1つの解決策は、既存のアルゴリズムをオフライン環境で動作させるために、見習いの学習に適合させることである。しかし、このようなアプローチは、政治外の評価やオフラインモデルの推定に大きく依存しており、間接的で非効率である可能性がある。優れたソリューションは、ポリシーを明示的にパラメータ化し、ロールアウトダイナミクスから暗黙的に学習し、完全にオフラインで運用できるべきだ、と私たちは主張する。
論文参考訳（メタデータ） (2020-06-25T03:27:59Z)
Adaptive Control and Regret Minimization in Linear Quadratic Gaussian (LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。 LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文参考訳（メタデータ） (2020-03-12T19:56:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。