論文の概要: Nonconvex Optimization Framework for Group-Sparse Feedback Linear-Quadratic Optimal Control. I: Penalty Approach
- arxiv url: http://arxiv.org/abs/2507.18114v2
- Date: Tue, 29 Jul 2025 06:21:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 12:52:36.82585
- Title: Nonconvex Optimization Framework for Group-Sparse Feedback Linear-Quadratic Optimal Control. I: Penalty Approach
- Title(参考訳): グループスパースフィードバック線形量子最適制御のための非凸最適化フレームワーク I:ペナルティアプローチ
- Authors: Lechen Feng, Xun Li, Yuan-Hua Ni,
- Abstract要約: 本稿では,無限水平線形四元数(LQ)問題における設計グループパースフィードバックコントローラの統一的非最適化フレームワークを開発する。
- 参考スコア(独自算出の注目度): 3.585860184121598
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper develops a unified nonconvex optimization framework for the design of group-sparse feedback controllers in infinite-horizon linear-quadratic (LQ) problems. We address two prominent extensions of the classical LQ problem: the distributed LQ problem with fixed communication topology (DFT-LQ) and the sparse feedback LQ problem (SF-LQ), both of which are motivated by the need for scalable and structure-aware control in large-scale systems. Unlike existing approaches that rely on convex relaxations or are limited to block-diagonal structures, we directly formulate the controller synthesis as a finite-dimensional nonconvex optimization problem with group $\ell_0$-norm regularization, capturing general sparsity patterns. We establish a connection between DFT-LQ and SF-LQ problems, showing that both can be addressed within our unified framework. Furthermore, we propose a penalty-based proximal alternating linearized minimization (PALM) algorithm and provide a rigorous convergence analysis under mild assumptions, overcoming the lack of coercivity in the objective function. The proposed method admits efficient solvers for all subproblems and guarantees global convergence to critical points. Our results fill a key gap in the literature by enabling the direct design of group-sparse feedback gains with theoretical guarantees, without resorting to convex surrogates or restrictive structural assumptions.
- Abstract(参考訳): 本稿では,無限水平線形四元数(LQ)問題におけるグループスパースフィードバックコントローラの設計のための統一された非凸最適化フレームワークを開発する。
固定通信トポロジを用いた分散LQ問題 (DFT-LQ) とスパースフィードバックLQ問題 (SF-LQ) の2つの古典的LQ問題に対処する。
凸緩和に依存する既存のアプローチやブロック対角構造に制限されるアプローチとは異なり、制御器合成は群 $\ell_0$-norm 正規化を用いて有限次元の非凸最適化問題として直接定式化し、一般的な空間パターンを捉える。
DFT-LQ と SF-LQ の接続を確立することで,両者が統合されたフレームワーク内で対処可能であることを示す。
さらに,ペナルティに基づく近似交互線形化最小化(PALM)アルゴリズムを提案し,目的関数における保磁力の欠如を克服し,軽度な仮定の下で厳密な収束解析を行う。
提案手法は全てのサブプロブレムに対する効率的な解法を認め, 臨界点への大域収束を保証する。
本研究は,群分離フィードバックゲインの直接設計を理論的保証とすることで,凸代理や制限的構造仮定に頼らずに,文献における重要なギャップを埋めるものである。
関連論文リスト
- Optimization over Sparse Support-Preserving Sets: Two-Step Projection with Global Optimality Guarantees [34.164821598251315]
スパース最適化では、$ell_$ pseudo-normを使ってハード制約を強制することは、制御されたスパーシリティのような利点を提供する。
多くの現実世界のアプリケーションは、余分な制約だけでなく、余分な制約も要求します。
本稿では,これらの制約をカスタマイズした2ステップのプロジェクション演算子を備えた,保存困難な反復アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-10T08:27:01Z) - Learning based convex approximation for constrained parametric optimization [11.379408842026981]
本稿では、制約付き最適化問題を解決するために、入力ニューラルネットワーク(ICNN)に基づく自己教師付き学習フレームワークを提案する。
厳密な収束解析を行い、このフレームワークが元の問題のKKT近似点に収束することを示す。
提案手法は精度,実現可能性,計算効率の両立を実現している。
論文 参考訳(メタデータ) (2025-05-07T00:33:14Z) - Cons-training Tensor Networks: Embedding and Optimization Over Discrete Linear Constraints [2.8834278113855896]
我々は,制約行列積状態(MPS)と呼ばれるテンソルネットワークの新たなファミリーを導入する。
MPSは、不等式を含む正確に任意の離散線型制約をスパースブロック構造に組み込む。
これらのネットワークは、特に、可能空間上で厳密にサポートされた分散をモデル化するために調整されている。
論文 参考訳(メタデータ) (2024-05-15T00:13:18Z) - A Near-Optimal Single-Loop Stochastic Algorithm for Convex Finite-Sum Coupled Compositional Optimization [53.14532968909759]
ALEXRと呼ばれる,効率的な単ループプリマル・デュアルブロック座標アルゴリズムを提案する。
本研究では, ALEXR の凸面および強凸面の収束速度を滑らか性および非滑らか性条件下で確立する。
CFCCO の ROC 曲線の下での GDRO および部分領域の実験結果から,提案アルゴリズムの有望な性能を示す。
論文 参考訳(メタデータ) (2023-12-04T19:00:07Z) - PARL: A Unified Framework for Policy Alignment in Reinforcement Learning from Human Feedback [106.63518036538163]
我々は、強化学習におけるポリシーアライメントの最近強調された重要な問題に対処するために、新しい統合された二段階最適化ベースのフレームワーク、textsfPARLを提案する。
本フレームワークは, 上向きの目標(逆設計)の分布を, 下向きの最適変数で明示的にパラメータ化することにより, これらの問題に対処する。
その結果,提案したtextsfPARL が RL のアライメントの懸念に対処できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-08-03T18:03:44Z) - Fully Stochastic Trust-Region Sequential Quadratic Programming for
Equality-Constrained Optimization Problems [62.83783246648714]
目的と決定論的等式制約による非線形最適化問題を解くために,逐次2次プログラミングアルゴリズム(TR-StoSQP)を提案する。
アルゴリズムは信頼領域半径を適応的に選択し、既存の直線探索StoSQP方式と比較して不確定なヘッセン行列を利用することができる。
論文 参考訳(メタデータ) (2022-11-29T05:52:17Z) - Faster Algorithm and Sharper Analysis for Constrained Markov Decision
Process [56.55075925645864]
制約付き意思決定プロセス (CMDP) の問題点について検討し, エージェントは, 複数の制約を条件として, 期待される累積割引報酬を最大化することを目的とする。
新しいユーティリティ・デュアル凸法は、正規化ポリシー、双対正則化、ネステロフの勾配降下双対という3つの要素の新たな統合によって提案される。
これは、凸制約を受ける全ての複雑性最適化に対して、非凸CMDP問題が$mathcal O (1/epsilon)$の低い境界に達する最初の実演である。
論文 参考訳(メタデータ) (2021-10-20T02:57:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。