論文の概要: On the Convergence Rates of Set Membership Estimation of Linear Systems with Disturbances Bounded by General Convex Sets
- arxiv url: http://arxiv.org/abs/2406.00574v2
- Date: Thu, 28 Nov 2024 05:41:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-02 15:15:40.176176
- Title: On the Convergence Rates of Set Membership Estimation of Linear Systems with Disturbances Bounded by General Convex Sets
- Title(参考訳): 一般凸集合による外乱を含む線形系の集合メンバーシップ推定の収束率について
- Authors: Haonan Xu, Yingying Li,
- Abstract要約: 本稿では、(ロバスト制約のある)制御文献でよく用いられる手法であるセットメンバーシップ推定(SME)に焦点を当てる。
システム障害が境界付けられた場合、中小企業はLSEの信頼性境界よりも経験的なパフォーマンスを享受する傾向にある。
本研究の主な貢献は、外乱支援に関する仮定を緩和し、一般凸支援のための中小企業の収束率を確立することである。
- 参考スコア(独自算出の注目度): 10.543371327361074
- License:
- Abstract: This paper studies the uncertainty set estimation of system parameters of linear dynamical systems with bounded disturbances, which is motivated by robust (adaptive) constrained control. Departing from the confidence bounds of least square estimation from the machine-learning literature, this paper focuses on a method commonly used in (robust constrained) control literature: set membership estimation (SME). SME tends to enjoy better empirical performance than LSE's confidence bounds when the system disturbances are bounded. However, the theoretical guarantees of SME are not fully addressed even for i.i.d. bounded disturbances. In the literature, SME's convergence has been proved for general convex supports of the disturbances, but SME's convergence rate assumes a special type of disturbance support: $ \ell_\infty $ ball. The main contribution of this paper is relaxing the assumption on the disturbance support and establishing the convergence rates of SME for general convex supports, which closes the gap on the applicability of the convergence and convergence rates results. Numerical experiments on SME and LSE's confidence bounds are also provided for different disturbance supports.
- Abstract(参考訳): 本稿では,頑健な(適応的な)制約制御を動機とする境界障害を持つ線形力学系のシステムパラメータの不確実性セットの推定について検討する。
本稿では,最小二乗推定の信頼性境界を機械学習文献から切り離して,(ロバスト制約による)制御文献によく用いられる手法であるセットメンバシップ推定(SME)に焦点を当てる。
システム障害が境界付けられた場合、中小企業はLSEの信頼性境界よりも経験的なパフォーマンスを享受する傾向にある。
しかし、中小企業の理論的保証は、すなわち有界乱れに対しても完全には解決されない。
文献では、SMEの収束は、乱れの一般凸支持に対して証明されているが、SMEの収束速度は特別な種類の乱れ支援を仮定する:$ \ell_\infty $ ball。
本研究の主な貢献は、外乱支援に関する仮定を緩和し、一般凸支持のための中小企業の収束率を確立し、収束率と収束率の差を埋めることである。
SMEとLSEの信頼性境界に関する数値実験も、異なる外乱支援のために提供される。
関連論文リスト
- Polynomial Regret Concentration of UCB for Non-Deterministic State Transitions [18.347534843178355]
本稿ではモンテカルロ木探索(MCTS)の理論的枠組みを非決定論的状態遷移に拡張する。
私たちの主な貢献は、これらの境界が非決定論的環境にも適用され、設定における堅牢なパフォーマンスが保証されることを示すことです。
これにより、自律システムや金融意思決定など、現実的な意思決定問題に対するMCTSの適用性が拡大する。
論文 参考訳(メタデータ) (2025-02-09T15:46:42Z) - Beyond Non-Degeneracy: Revisiting Certainty Equivalent Heuristic for Online Linear Programming [18.371947752008744]
この結果から,不確実性等価性は分布の微妙な仮定の下で一様に近い最適後悔を達成できることが示唆された。
以上の結果から,CE は従来の信念とは対照的に,幅広い問題事例に対する退化の呪いを効果的に打ち負かしていると考えられる。
これらの手法は、より広範なオンライン意思決定コンテキストにおける潜在的な応用を見出すことができる。
論文 参考訳(メタデータ) (2025-01-03T09:21:27Z) - f-FERM: A Scalable Framework for Robust Fair Empirical Risk Minimization [9.591164070876689]
本稿では、f-divergence measures(f-FERM)に基づく公正な経験的リスクに対する統一的な最適化フレームワークを提案する。
さらに,f-FERMによるほぼ全てのバッチサイズに対するフェアネス・精度トレードオフの優位性を実証した。
我々の拡張は、不確実集合として$L_p$ノルムの下で f-FERM の目的を分布的に頑健に最適化する手法に基づいている。
論文 参考訳(メタデータ) (2023-12-06T03:14:16Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Learning the Uncertainty Sets for Control Dynamics via Set Membership: A Non-Asymptotic Analysis [18.110158316883403]
本稿では,未知の線形システムに対するセットメンバシップ推定(SME)に焦点を当てる。
本稿では,中小企業の収束率境界について述べるとともに,緩和された仮定の下での中小企業の変動について論じる。
また,中小企業の実用性を示す数値的な結果も提供する。
論文 参考訳(メタデータ) (2023-09-26T03:58:06Z) - A Robustness Analysis of Blind Source Separation [91.3755431537592]
ブラインドソース分離(BSS)は、変換$f$が可逆であるが未知であるという条件の下で、その混合である$X=f(S)$から観測されていない信号を復元することを目的としている。
このような違反を分析し、その影響を$X$から$S$のブラインドリカバリに与える影響を定量化するための一般的なフレームワークを提案する。
定義された構造的仮定からの偏差に対する一般的なBSS溶出は、明示的な連続性保証という形で、利益的に分析可能であることを示す。
論文 参考訳(メタデータ) (2023-03-17T16:30:51Z) - Monotonic Improvement Guarantees under Non-stationarity for
Decentralized PPO [66.5384483339413]
我々は,MARL(Multi-Agent Reinforcement Learning)における分散政策の最適化のための新しい単調改善保証を提案する。
本研究では,訓練中のエージェント数に基づいて,独立した比率を限定することにより,信頼領域の制約を原則的に効果的に実施可能であることを示す。
論文 参考訳(メタデータ) (2022-01-31T20:39:48Z) - Tight Mutual Information Estimation With Contrastive Fenchel-Legendre
Optimization [69.07420650261649]
我々はFLOと呼ばれる新しい,シンプルで強力なコントラストMI推定器を提案する。
実証的に、我々のFLO推定器は前者の限界を克服し、より効率的に学習する。
FLOの有効性は、広範囲なベンチマークを用いて検証され、実際のMI推定におけるトレードオフも明らかにされる。
論文 参考訳(メタデータ) (2021-07-02T15:20:41Z) - Relative Deviation Margin Bounds [55.22251993239944]
我々はRademacher複雑性の観点から、分布依存と一般家庭に有効な2種類の学習境界を与える。
有限モーメントの仮定の下で、非有界な損失関数に対する分布依存的一般化境界を導出する。
論文 参考訳(メタデータ) (2020-06-26T12:37:17Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。