Fugu-MT 論文翻訳(概要): Online Control of Linear Systems with Unbounded and Degenerate Noise

論文の概要: Online Control of Linear Systems with Unbounded and Degenerate Noise

arxiv url: http://arxiv.org/abs/2402.10252v1
Date: Thu, 15 Feb 2024 16:16:30 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-19 18:44:18.301419
Title: Online Control of Linear Systems with Unbounded and Degenerate Noise
Title（参考訳）: 非有界・縮退騒音を有する線形系のオンライン制御
Authors: Kaito Ito, Taira Tsuchiya
Abstract要約: 本稿では,未知のコスト関数を持つ非有界・退化雑音下での線形系制御の問題について検討する。ノイズの有界性を仮定する既存の研究とは対照的に、凸コストに対して$ widetildeO(sqrtT) $ regret bound は非有界ノイズに対しても達成可能である。
参考スコア（独自算出の注目度）: 7.469588051458094
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper investigates the problem of controlling a linear system under possibly unbounded and degenerate noise with unknown cost functions, known as an online control problem. In contrast to the existing work, which assumes the boundedness of noise, we reveal that for convex costs, an $ \widetilde{O}(\sqrt{T}) $ regret bound can be achieved even for unbounded noise, where $ T $ denotes the time horizon. Moreover, when the costs are strongly convex, we establish an $ O({\rm poly} (\log T)) $ regret bound without the assumption that noise covariance is non-degenerate, which has been required in the literature. The key ingredient in removing the rank assumption on noise is a system transformation associated with the noise covariance. This simultaneously enables the parameter reduction of an online control algorithm.
Abstract（参考訳）: 本稿では,オンライン制御問題として知られる未知コスト関数を持つ非有界・縮退騒音下での線形システム制御の問題について検討する。ノイズの有界性を仮定する既存の研究とは対照的に、凸コストに対して、$ \widetilde{O}(\sqrt{T}) $ regret bound は非有界ノイズに対しても達成可能である。さらに、コストが強凸である場合、ノイズ共変性が非退化であると仮定せずに o({\rm poly} (\log t)) $ regret bound を確立する。ノイズのランク推定を除去する鍵となる要素は、ノイズの共分散に関連するシステム変換である。これにより、オンライン制御アルゴリズムのパラメータ削減が可能となる。

関連論文リスト

Optimal High-probability Convergence of Nonlinear SGD under Heavy-tailed Noise via Symmetrization [50.49466204159458]
雑音対称性に基づく2つの新しい推定器を提案する。よりシャープな分析と改善されたレートを提供します。モーメントと対称雑音を仮定する作業と比較して、よりシャープな解析と改善率を提供する。
論文参考訳（メタデータ） (2025-07-12T00:31:13Z)
Boosting-Enabled Robust System Identification of Partially Observed LTI Systems Under Heavy-Tailed Noise [2.07180164747172]
部分的に観測された線形時間不変(LTI)システムのシステム同定の問題点を考察する。一般的な重み付きノイズプロセスの下でシステムパラメータを識別するための漸近的でない保証を提供する。提案アルゴリズムは,ガウス以下の雑音下で導出されたものとほぼ一致するような,サンプルの複雑性境界を実現する。
論文参考訳（メタデータ） (2025-04-25T15:57:13Z)
Nonlinear Stochastic Gradient Descent and Heavy-tailed Noise: A Unified Framework and High-probability Guarantees [56.80920351680438]
本研究では,重音の存在下でのオンライン学習における高確率収束について検討する。切断のみを考慮し、有界な$p$-thモーメントでノイズを必要とする最先端技術と比較して、幅広い非線形性の保証を提供する。
論文参考訳（メタデータ） (2024-10-17T18:25:28Z)
High-probability Convergence Bounds for Nonlinear Stochastic Gradient Descent Under Heavy-tailed Noise [59.25598762373543]
重み付き雑音の存在下でのストリーミングデータにおける学習の精度保証について検討した。解析的に、与えられた問題に対する設定の選択に$ta$を使うことができることを実証する。
論文参考訳（メタデータ） (2023-10-28T18:53:41Z)
Noisy Demkov-Kunike model [6.8634330648628215]
我々はコヒーレントなDemkov-Kunike(DK)モデルを拡張して、ノイズの多い結合項$Jrightarrow J_textnoisy(t)$を考慮に入れます。ノイズDKモデルの生存確率 $Qtextnoisy_textDK$ の正確な解を示す。この研究は、ノイズの多いLandau-Zenerモデルに関する既存の研究を補完するだけでなく、2レベル量子系の制御に有用な洞察を与える。
論文参考訳（メタデータ） (2023-09-12T02:19:44Z)
Finite-time System Identification and Adaptive Control in Autoregressive Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文参考訳（メタデータ） (2021-08-26T18:00:00Z)
Black-Box Control for Linear Dynamical Systems [40.352938608995174]
ブラックボックス相互作用の単一連鎖から未知の線形時間不変力学系を制御する問題を考える。システムが制御可能であるという仮定の下で、サブ線形後悔を達成できる最初の効率的なアルゴリズムを与える。
論文参考訳（メタデータ） (2020-07-13T19:43:19Z)
Bandit Linear Control [0.0]
ノイズ, 逆選択コスト, および帯域フィードバックの下で既知の線形力学系を制御することの問題点を考察する。我々は,強い凸とスムーズなコストのために,時間的地平線の平方根で成長する後悔を得る,新しい効率的アルゴリズムを提案する。
論文参考訳（メタデータ） (2020-07-01T21:12:19Z)
Making Non-Stochastic Control (Almost) as Easy as Stochastic [27.736345095024276]
より一般的な非確率的制御モデルにおいても、同じ後悔率が達成可能であることを示す。学習者にとってダイナミクスが不明な場合に、最適な$widetildemathcalO(sqrtT)$ regretを得る。
論文参考訳（メタデータ） (2020-06-10T16:00:14Z)
Logarithmic Regret for Adversarial Online Control [56.12283443161479]
対数的後悔を伴う最初のアルゴリズムを任意対数外乱列に対して与える。我々のアルゴリズムと分析はオフライン制御法の特徴を利用してオンライン制御問題を(遅延)オンライン学習に還元する。
論文参考訳（メタデータ） (2020-02-29T06:29:19Z)
Naive Exploration is Optimal for Online LQR [49.681825576239355]
最適後悔尺度は$widetildeTheta(sqrtd_mathbfu2 d_mathbfx T)$で、$T$は時間ステップの数、$d_mathbfu$は入力空間の次元、$d_mathbfx$はシステム状態の次元である。我々の下界は、かつての$mathrmpoly(logT)$-regretアルゴリズムの可能性を排除する。
論文参考訳（メタデータ） (2020-01-27T03:44:54Z)
Improper Learning for Non-Stochastic Control [78.65807250350755]
逆方向の摂動, 逆方向に選択された凸損失関数, 部分的に観察された状態を含む, 未知の線形力学系を制御することの問題点を考察する。このパラメトリゼーションにオンライン降下を適用することで、大規模なクローズドループポリシーに対してサブリニア後悔を実現する新しいコントローラが得られる。我々の境界は、線形力学コントローラの安定化と競合する非確率的制御設定における最初のものである。
論文参考訳（メタデータ） (2020-01-25T02:12:48Z)
Contextual Linear Bandits under Noisy Features: Towards Bayesian Oracles [65.9694455739978]
特徴不確実性の下での文脈線形帯域問題について検討する。本分析により, 最適仮説は, 雑音特性に応じて, 基礎となる実現可能性関数から著しく逸脱しうることが明らかとなった。これは、古典的アプローチが非自明な後悔境界を保証できないことを意味する。
論文参考訳（メタデータ） (2017-03-03T21:39:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。