論文の概要: Online Parameter Identification of Generalized Non-cooperative Game
- arxiv url: http://arxiv.org/abs/2310.09511v1
- Date: Sat, 14 Oct 2023 06:43:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-18 02:07:41.239664
- Title: Online Parameter Identification of Generalized Non-cooperative Game
- Title(参考訳): 汎用非協力ゲームのオンラインパラメータ同定
- Authors: Jianguo Chen and Jinlong Lei and Hongsheng Qi and Yiguang Hong
- Abstract要約: 非協調ゲームでは、各プレイヤーのコスト関数は観測可能な信号と未知のパラメータに影響される。
このパラメータ識別問題をオンライン最適化として構築し、新しいオンラインパラメータ識別アルゴリズムを導入する。
プレイヤーのコスト関数が未知のパラメータに対して線形であり、提案アルゴリズムの学習速度が mu_k propto 1/sqrtk を満たす場合、他の仮定と同様に、提案アルゴリズムの後悔境界は O(sqrtK) であることを示す。
- 参考スコア(独自算出の注目度): 11.437559388675625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work studies the parameter identification problem of a generalized
non-cooperative game, where each player's cost function is influenced by an
observable signal and some unknown parameters. We consider the scenario where
equilibrium of the game at some observable signals can be observed with noises,
whereas our goal is to identify the unknown parameters with the observed data.
Assuming that the observable signals and the corresponding noise-corrupted
equilibriums are acquired sequentially, we construct this parameter
identification problem as online optimization and introduce a novel online
parameter identification algorithm. To be specific, we construct a regularized
loss function that balances conservativeness and correctiveness, where the
conservativeness term ensures that the new estimates do not deviate
significantly from the current estimates, while the correctiveness term is
captured by the Karush-Kuhn-Tucker conditions. We then prove that when the
players' cost functions are linear with respect to the unknown parameters and
the learning rate of the online parameter identification algorithm satisfies
\mu_k \propto 1/\sqrt{k}, along with other assumptions, the regret bound of the
proposed algorithm is O(\sqrt{K}). Finally, we conduct numerical simulations on
a Nash-Cournot problem to demonstrate that the performance of the online
identification algorithm is comparable to that of the offline setting.
- Abstract(参考訳): 本研究は、各プレイヤーのコスト関数が観測可能な信号と未知のパラメータによって影響を受ける一般化された非協力ゲームにおけるパラメータ識別問題を研究する。
観測可能な信号におけるゲームの平衡がノイズで観測できるシナリオを考察する一方、我々の目標は未知のパラメータを観測データで識別することである。
このパラメータ識別問題をオンライン最適化として構築し,新しいオンラインパラメータ識別アルゴリズムを導入する。
具体的には、保守性と補正性のバランスをとる正規化損失関数を構築し、保守性項は、新しい推定値が現在の推定値から大きくずれないように保証し、補正性項はカルス=クーン=タッカー条件によってキャプチャされる。
次に,オンラインパラメータ同定アルゴリズムの未知パラメータと学習率についてプレイヤーのコスト関数が線形である場合,他の仮定とともに,提案アルゴリズムの後悔境界は o(\sqrt{k}) であることを示す。
最後に,nash-cournot問題に対する数値シミュレーションを行い,オンライン同定アルゴリズムの性能がオフライン設定と同等であることを示す。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Low-rank extended Kalman filtering for online learning of neural
networks from streaming data [71.97861600347959]
非定常データストリームから非線形関数のパラメータを推定するための効率的なオンライン近似ベイズ推定アルゴリズムを提案する。
この方法は拡張カルマンフィルタ (EKF) に基づいているが、新しい低ランク+斜角行列分解法を用いている。
変分推論に基づく手法とは対照的に,本手法は完全に決定論的であり,ステップサイズチューニングを必要としない。
論文 参考訳(メタデータ) (2023-05-31T03:48:49Z) - Robust identification of non-autonomous dynamical systems using
stochastic dynamics models [0.0]
本稿では, 非線形・非線形非自律系における雑音・スパースデータからのシステム識別(ID)の問題について考察する。
隠れマルコフモデル学習のためのベイズ式から導かれる目的関数を提案し,解析する。
提案手法は,システムIDに適合するスムーズさと本質的な正規化を改善したことを示す。
論文 参考訳(メタデータ) (2022-12-20T16:36:23Z) - Partial Identification with Noisy Covariates: A Robust Optimization
Approach [94.10051154390237]
観測データセットからの因果推論は、しばしば共変量の測定と調整に依存する。
このロバストな最適化手法により、広範囲な因果調整法を拡張し、部分的同定を行うことができることを示す。
合成および実データセット全体で、このアプローチは既存の手法よりも高いカバレッジ確率でATEバウンダリを提供する。
論文 参考訳(メタデータ) (2022-02-22T04:24:26Z) - A Priori Denoising Strategies for Sparse Identification of Nonlinear
Dynamical Systems: A Comparative Study [68.8204255655161]
本研究では, 局所的およびグローバルな平滑化手法の性能と, 状態測定値の偏差について検討・比較する。
一般に,測度データセット全体を用いたグローバルな手法は,局所点の周辺に隣接するデータサブセットを用いる局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-29T23:31:25Z) - Optimal Rates for Random Order Online Optimization [60.011653053877126]
敵が損失関数を選択できるカテットガルバー2020onlineについて検討するが、一様にランダムな順序で提示される。
2020onlineアルゴリズムが最適境界を達成し,安定性を著しく向上することを示す。
論文 参考訳(メタデータ) (2021-06-29T09:48:46Z) - Concurrent Learning Based Tracking Control of Nonlinear Systems using
Gaussian Process [2.7930955543692817]
本稿では,パラメータ推定ツールとしての並列学習と,オンライン外乱学習における非パラメトリックガウス過程の適用性を示す。
制御法則は、フィードバック線形化の文脈において、両方の手法を逐次的に用いて開発される。
n階系の閉ループ系安定性はリャプノフ安定性定理を用いて証明される。
論文 参考訳(メタデータ) (2021-06-02T02:59:48Z) - System identification using Bayesian neural networks with nonparametric
noise models [0.0]
離散時間非線形ランダムダイナミクス系におけるシステム同定のための非パラメトリックアプローチを提案する。
後部推論用ギブスサンプリング器を提案し, シミュレーションおよび実時間時系列でその有効性を示した。
論文 参考訳(メタデータ) (2021-04-25T09:49:50Z) - Non-Episodic Learning for Online LQR of Unknown Linear Gaussian System [0.0]
単一の軌道からシステムに関する知識を得るオンライン非分離アルゴリズムを提案する。
識別と制御のほぼ確実に収束する割合を特徴付け、探索と搾取の間の最適なトレードオフを明らかにする。
論文 参考訳(メタデータ) (2021-03-24T15:51:28Z) - Closed-loop Parameter Identification of Linear Dynamical Systems through
the Lens of Feedback Channel Coding Theory [0.0]
本稿では,ガウス過程雑音を伴う線形スカラー系の閉ループ同定の問題について考察する。
学習速度は,対応するAWGNチャネルの容量によって基本的に上界にあることを示す。
フィードバックポリシの最適設計は依然として難しいが、上限が達成される条件を導出する。
論文 参考訳(メタデータ) (2020-03-27T17:30:10Z) - Orthogonal Statistical Learning [49.55515683387805]
人口リスクが未知のニュアンスパラメータに依存するような環境では,統計学習における非漸近的過剰リスク保証を提供する。
人口リスクがNeymanityと呼ばれる条件を満たす場合,メタアルゴリズムによって達成される過剰リスクに対するニュアンス推定誤差の影響は2次であることを示す。
論文 参考訳(メタデータ) (2019-01-25T02:21:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。