論文の概要: Online Optimization with Memory and Competitive Control
- arxiv url: http://arxiv.org/abs/2002.05318v3
- Date: Fri, 8 Jan 2021 06:24:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 13:13:02.782903
- Title: Online Optimization with Memory and Competitive Control
- Title(参考訳): メモリと競合制御によるオンライン最適化
- Authors: Guanya Shi, Yiheng Lin, Soon-Jo Chung, Yisong Yue, Adam Wierman
- Abstract要約: 本稿では,メモリを用いたオンライン最適化問題に対する競合アルゴリズムを提案する。
本稿では,メモリによるオンライン最適化と,対向的障害を伴うオンライン制御の関連性を示す。
- 参考スコア(独自算出の注目度): 43.974996526016305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents competitive algorithms for a novel class of online
optimization problems with memory. We consider a setting where the learner
seeks to minimize the sum of a hitting cost and a switching cost that depends
on the previous $p$ decisions. This setting generalizes Smoothed Online Convex
Optimization. The proposed approach, Optimistic Regularized Online Balanced
Descent, achieves a constant, dimension-free competitive ratio. Further, we
show a connection between online optimization with memory and online control
with adversarial disturbances. This connection, in turn, leads to a new
constant-competitive policy for a rich class of online control problems.
- Abstract(参考訳): 本稿では,メモリを用いた新しいオンライン最適化問題に対する競合アルゴリズムを提案する。
我々は、学習者が、以前の$p$の決定に依存するヒットコストとスイッチングコストの合計を最小化しようとする設定を考える。
この設定はSmoothed Online Convex Optimizationを一般化する。
提案手法であるOptimistic Regularized Online Balanced Descentは、一定の非次元競合比を達成する。
さらに,オンラインのメモリ最適化と,対向的障害を伴うオンライン制御との関連性を示す。
この接続によって、リッチなオンライン制御問題に対して、新たな一定の競合ポリシーが生まれます。
関連論文リスト
- A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Best of Both Worlds in Online Control: Competitive Ratio and Policy
Regret [61.59646565655169]
我々は,最近提案されたオンライン制御アルゴリズムが,両世界のベストを達成していることを示す。
線形力学系が未知の場合には, 準線形後悔対最適競争政策が達成可能であると結論づける。
論文 参考訳(メタデータ) (2022-11-21T07:29:08Z) - Optimal Parameter-free Online Learning with Switching Cost [47.415099037249085]
オンライン学習における自由とは、後ろ向きの最適決定に対するアルゴリズムの適応性を指す。
本稿では,パラメータフリーで要求される楽観的な更新を,スイッチングコストを前提として,そのようなアルゴリズムを設計する。
本稿では,オンライン線形最適化 (OLO) のための簡易かつ強力なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-13T18:44:27Z) - Smoothed Online Convex Optimization Based on Discounted-Normal-Predictor [68.17855675511602]
円滑なオンライン凸最適化(SOCO)のためのオンライン予測戦略について検討する。
提案アルゴリズムは,各区間の切替コストで適応的後悔を最小限に抑えることができることを示す。
論文 参考訳(メタデータ) (2022-05-02T08:48:22Z) - Smoothed Online Combinatorial Optimization Using Imperfect Predictions [27.201074566335222]
本研究では,不完全な予測モデルが利用できる場合のスムーズなオンライン最適化問題について検討する。
有限時間地平線計画に予測を用いることで, 全体の予測不確かさと追加の切り替えコストに依存して, 後悔を招くことを示す。
本アルゴリズムは,合成オンライン分散ストリーミング問題において,他のベースラインと比較して,累積的後悔度が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2022-04-23T02:30:39Z) - Online Optimization with Feedback Delay and Nonlinear Switching Cost [16.975704972827305]
我々は,学習者が$k$-round $textitdelayed feedback$$を入力したオンライン最適化のバリエーションについて検討する。
新たな反復正規化オンラインバランスド Descent (iROBD) アルゴリズムは,O(L2k)$の一定次元自由競争比を持つことを示す。
論文 参考訳(メタデータ) (2021-10-29T21:55:01Z) - Online Learning via Offline Greedy Algorithms: Applications in Market
Design and Optimization [0.0]
我々は局所的エラーに頑健な欲望アルゴリズムを用いて,定数係数近似に適応可能なオフライン問題に焦点を当てた。
このような問題に対して,オフラインロバストなアルゴリズムをオンラインに効率的に変換する汎用フレームワークを提供する。
得られたオンラインアルゴリズムは、完全な情報設定の下で、$O(sqrtT)$ (approximate) の後悔を持つことを示す。
論文 参考訳(メタデータ) (2021-02-18T19:05:26Z) - Non-stationary Online Learning with Memory and Non-stochastic Control [71.14503310914799]
我々は,過去の決定に依拠する損失関数を許容するメモリを用いたオンライン凸最適化(OCO)の問題について検討する。
本稿では,非定常環境に対してロバストなアルゴリズムを設計するための性能指標として,動的ポリシーの後悔を紹介する。
我々は,時間的地平線,非定常度,メモリ長といった面で,最適な動的ポリシーの後悔を確実に享受するメモリ付きOCOの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-07T09:45:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。