論文の概要: Exact Recovery Guarantees for Parameterized Nonlinear System Identification Problem under Sparse Disturbances or Semi-Oblivious Attacks
- arxiv url: http://arxiv.org/abs/2409.00276v3
- Date: Thu, 20 Mar 2025 19:48:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 15:40:09.724636
- Title: Exact Recovery Guarantees for Parameterized Nonlinear System Identification Problem under Sparse Disturbances or Semi-Oblivious Attacks
- Title(参考訳): スパース外乱やセミオープン攻撃時のパラメータ化非線形システム同定問題に対する厳密な回復保証
- Authors: Haixiang Zhang, Baturalp Yalcin, Javad Lavaei, Eduardo D. Sontag,
- Abstract要約: 本研究では,非線形力学系を基底関数を用いてパラメータ化することで,非線形力学系を学習する問題について検討する。
p$ が 1 に近づくときでさえ、有限時間正確な回復は高い確率で達成されることを示す。
- 参考スコア(独自算出の注目度): 16.705631360131886
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this work, we study the problem of learning a nonlinear dynamical system by parameterizing its dynamics using basis functions. We assume that disturbances occur at each time step with an arbitrary probability $p$, which models the sparsity level of the disturbance vectors over time. These disturbances are drawn from an arbitrary, unknown probability distribution, which may depend on past disturbances, provided that it satisfies a zero-mean assumption. The primary objective of this paper is to learn the system's dynamics within a finite time and analyze the sample complexity as a function of $p$. To achieve this, we examine a LASSO-type non-smooth estimator, and establish necessary and sufficient conditions for its well-specifiedness and the uniqueness of the global solution to the underlying optimization problem. We then provide exact recovery guarantees for the estimator under two distinct conditions: boundedness and Lipschitz continuity of the basis functions. We show that finite-time exact recovery is achieved with high probability, even when $p$ approaches 1. Unlike prior works, which primarily focus on independent and identically distributed (i.i.d.) disturbances and provide only asymptotic guarantees for system learning, this study presents the first finite-time analysis of nonlinear dynamical systems under a highly general disturbance model. Our framework allows for possible temporal correlations in the disturbances and accommodates semi-oblivious adversarial attacks, significantly broadening the scope of existing theoretical results.
- Abstract(参考訳): 本研究では,非線形力学系を基底関数を用いてパラメータ化することで,非線形力学系を学習する問題について検討する。
乱れは、時間とともに乱れベクトルの空間レベルをモデル化する任意の確率$p$で、各ステップで発生すると仮定する。
これらの外乱は、ゼロ平均仮定を満たすことを前提として、過去の外乱に依存する可能性のある任意の未知の確率分布から引き出される。
本論文の主な目的は,システムの力学を有限時間以内に学習し,サンプルの複雑性を$p$の関数として解析することである。
これを実現するために、LASSO型非滑らかな推定器について検討し、その厳密さと、基礎となる最適化問題に対する大域的解の特異性について、必要かつ十分な条件を確立する。
次に、基底関数の有界性とリプシッツ連続性という2つの異なる条件の下で、推定器の正確な回復保証を与える。
p$ が 1 に近づくときでさえ、有限時間正確な回復は高い確率で達成されることを示す。
システム学習における漸近的保証のみを提供する独立かつ同一に分散された障害に主に焦点をあてた先行研究とは異なり、本研究では、高次乱れモデルの下での非線形力学系の有限時間解析を初めて提示する。
筆者らのフレームワークは、障害の時間的相関を許容し、半文的な敵攻撃を許容し、既存の理論的結果の範囲を大きく広げる。
関連論文リスト
- Error Feedback under $(L_0,L_1)$-Smoothness: Normalization and Momentum [56.37522020675243]
機械学習の幅広い問題にまたがる正規化誤差フィードバックアルゴリズムに対する収束の最初の証明を提供する。
提案手法では,許容可能なステップサイズが大きくなったため,新しい正規化エラーフィードバックアルゴリズムは,各種タスクにおける非正規化エラーよりも優れていた。
論文 参考訳(メタデータ) (2024-10-22T10:19:27Z) - Embedding generalization within the learning dynamics: An approach based-on sample path large deviation theory [0.0]
本研究では,持続的視点から手法を利用する経験的リスク摂動に基づく学習問題を考察する。
大規模偏差のFreidlin-Wentzell理論に基づく小雑音限界の推定を行う。
また、最適点推定に繋がる変分問題を解く計算アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-04T23:31:35Z) - Randomized algorithms and PAC bounds for inverse reinforcement learning in continuous spaces [47.907236421762626]
本研究は、連続状態と作用空間を持つ離散時間割引マルコフ決定過程を研究する。
まず、専門家の政策全体にアクセスでき、逆問題に対する解決策の集合を特徴づけるケースについて考察する。
論文 参考訳(メタデータ) (2024-05-24T12:53:07Z) - A least-square method for non-asymptotic identification in linear switching control [17.938732931331064]
基礎となる部分観測線形力学系は、既知の候補モデルの有限集合内にあることが知られている。
線形最小二乗法の非漸近解析における最近の進歩を活用して、この問題の有限時間サンプル複雑性を特徴づける。
基礎となるシステムの未知のパラメータを識別するデータ駆動型スイッチング戦略を提案する。
論文 参考訳(メタデータ) (2024-04-11T20:55:38Z) - Global Convergence of Online Identification for Mixed Linear Regression [1.9295130374196499]
混合線形回帰(MLR)は非線形関係を特徴づける強力なモデルである。
本稿では,MLRの2つの基本クラスにおけるオンライン識別とデータクラスタリングの問題について検討する。
期待最大化原理に基づく新しいオンライン識別アルゴリズムを2つ導入する。
論文 参考訳(メタデータ) (2023-11-30T12:30:42Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Exact Recovery for System Identification with More Corrupt Data than Clean Data [17.310966086344777]
本稿では,線形離散時間系における逆問題に対するシステム同定問題について検討する。
システムが安定しており、攻撃が定期的に注入される場合、システムダイナミクスの正確な回復のためのサンプルの複雑さは線形であることを示す。
副産物として、データの半分以上が漏洩した場合でも、私たちの推定者はシステムを正しく学習します。
論文 参考訳(メタデータ) (2023-05-17T18:21:37Z) - A Robustness Analysis of Blind Source Separation [91.3755431537592]
ブラインドソース分離(BSS)は、変換$f$が可逆であるが未知であるという条件の下で、その混合である$X=f(S)$から観測されていない信号を復元することを目的としている。
このような違反を分析し、その影響を$X$から$S$のブラインドリカバリに与える影響を定量化するための一般的なフレームワークを提案する。
定義された構造的仮定からの偏差に対する一般的なBSS溶出は、明示的な連続性保証という形で、利益的に分析可能であることを示す。
論文 参考訳(メタデータ) (2023-03-17T16:30:51Z) - PAPAL: A Provable PArticle-based Primal-Dual ALgorithm for Mixed Nash Equilibrium [58.26573117273626]
2プレイヤゼロサム連続ゲームにおける非AL平衡非漸近目的関数について考察する。
連続分布戦略のための粒子ベースアルゴリズムに関する新しい知見を述べる。
論文 参考訳(メタデータ) (2023-03-02T05:08:15Z) - A Learning-Based Optimal Uncertainty Quantification Method and Its
Application to Ballistic Impact Problems [1.713291434132985]
本稿では、入力(または事前)測度が部分的に不完全であるシステムに対する最適(最大および無限)不確実性境界について述べる。
本研究では,不確実性最適化問題に対する学習基盤の枠組みを実証する。
本手法は,工学的実践における性能証明と安全性のためのマップ構築に有効であることを示す。
論文 参考訳(メタデータ) (2022-12-28T14:30:53Z) - Robust identification of non-autonomous dynamical systems using
stochastic dynamics models [0.0]
本稿では, 非線形・非線形非自律系における雑音・スパースデータからのシステム識別(ID)の問題について考察する。
隠れマルコフモデル学習のためのベイズ式から導かれる目的関数を提案し,解析する。
提案手法は,システムIDに適合するスムーズさと本質的な正規化を改善したことを示す。
論文 参考訳(メタデータ) (2022-12-20T16:36:23Z) - Fully Stochastic Trust-Region Sequential Quadratic Programming for
Equality-Constrained Optimization Problems [62.83783246648714]
目的と決定論的等式制約による非線形最適化問題を解くために,逐次2次プログラミングアルゴリズム(TR-StoSQP)を提案する。
アルゴリズムは信頼領域半径を適応的に選択し、既存の直線探索StoSQP方式と比較して不確定なヘッセン行列を利用することができる。
論文 参考訳(メタデータ) (2022-11-29T05:52:17Z) - Log Barriers for Safe Black-box Optimization with Application to Safe
Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。
LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。
安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-21T11:14:47Z) - Reinforcement Learning Policies in Continuous-Time Linear Systems [0.0]
パラメータ推定を慎重にランダムにすることで、最適行動の学習を迅速に行うオンラインポリシーを提案する。
非接触系の力学に対する鋭い安定性を証明し、準最適動作による無限小の後悔を厳密に特定する。
我々の分析は、継続的強化学習における基本的な課題に光を当て、同様の問題に対する有用な基礎となることを示唆している。
論文 参考訳(メタデータ) (2021-09-16T00:08:50Z) - A general sample complexity analysis of vanilla policy gradient [101.16957584135767]
政策勾配(PG)は、最も一般的な強化学習(RL)問題の1つである。
PG軌道の「バニラ」理論的理解は、RL問題を解く最も一般的な方法の1つである。
論文 参考訳(メタデータ) (2021-07-23T19:38:17Z) - Nonasymptotic Guarantees for Spiked Matrix Recovery with Generative
Priors [12.798687476698063]
そこで本研究では,低ランク成分が訓練された生成ネットワークの範囲内にある場合について検討する。
非線形最小二乗の目的に対して好適な大域的最適化の展望を確立する。
この結果から、生成前兆は構造化されたランク1行列回復のための計算と統計のギャップを持たないことが示唆された。
論文 参考訳(メタデータ) (2020-06-14T16:46:16Z) - On dissipative symplectic integration with applications to
gradient-based optimization [77.34726150561087]
本稿では,離散化を体系的に実現する幾何学的枠組みを提案する。
我々は、シンプレクティックな非保守的、特に散逸的なハミルトン系への一般化が、制御された誤差まで収束率を維持することができることを示す。
論文 参考訳(メタデータ) (2020-04-15T00:36:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。