論文の概要: Constrained Online Convex Optimization with Memory and Predictions
- arxiv url: http://arxiv.org/abs/2603.21375v1
- Date: Sun, 22 Mar 2026 19:27:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.386202
- Title: Constrained Online Convex Optimization with Memory and Predictions
- Title(参考訳): メモリと予測による制約付きオンライン凸最適化
- Authors: Mohammed Abdullah, George Iosifidis, Salah Eddine Elayoubi, Tijani Chahed,
- Abstract要約: 制約付きオンライン凸最適化(COCO-M)について検討し、損失と制約は学習者による過去の意思決定の限られた窓に依存している。
この設定は、以前研究された制約のないオンライン最適化をメモリフレームワークで拡張し、制約された動的システムの制御や再構成予算によるスケジューリングといった実践的な問題を捉えている。
- 参考スコア(独自算出の注目度): 9.387819018679325
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study Constrained Online Convex Optimization with Memory (COCO-M), where both the loss and the constraints depend on a finite window of past decisions made by the learner. This setting extends the previously studied unconstrained online optimization with memory framework and captures practical problems such as the control of constrained dynamical systems and scheduling with reconfiguration budgets. For this problem, we propose the first algorithms that achieve sublinear regret and sublinear cumulative constraint violation under time-varying constraints, both with and without predictions of future loss and constraint functions. Without predictions, we introduce an adaptive penalty approach that guarantees sublinear regret and constraint violation. When short-horizon and potentially unreliable predictions are available, we reinterpret the problem as online learning with delayed feedback and design an optimistic algorithm whose performance improves as prediction accuracy improves, while remaining robust when predictions are inaccurate. Our results bridge the gap between classical constrained online convex optimization and memory-dependent settings, and provide a versatile learning toolbox with diverse applications.
- Abstract(参考訳): 制約付きオンライン凸最適化(COCO-M)について検討し、損失と制約は学習者による過去の意思決定の限られた窓に依存している。
この設定は、以前研究された制約のないオンライン最適化をメモリフレームワークで拡張し、制約された動的システムの制御や再構成予算によるスケジューリングといった実践的な問題を捉えている。
そこで本研究では,時間的制約の下でのサブ線形後悔とサブ線形累積制約違反を実現するアルゴリズムを提案する。
予測がなければ,サブリニアな後悔と制約違反を保証する適応的なペナルティアプローチを導入する。
予測精度が向上するにつれて性能が向上する楽観的アルゴリズムを設計し、予測が不正確である場合には頑健なまま、短時間のホライゾンと潜在的に信頼できない予測が可能になった場合、問題を遅延フィードバックによるオンライン学習として再解釈する。
本結果は,従来の制約付きオンライン凸最適化とメモリ依存設定のギャップを埋めるものであり,多様なアプリケーションによる汎用学習ツールボックスを提供する。
関連論文リスト
- Online Decision-Focused Learning [74.3205104323777]
意思決定中心学習(DFL)は、意思決定タスクで予測出力が使用されるモデルのトレーニングパラダイムとして、ますます人気が高まっている。
本稿では,目的関数を規則化し,その相違を解消し,非最適関数を克服する方法を検討する。
また、クナップサック実験におけるアルゴリズムの有効性を示し、2つの標準ベンチマークを上回りました。
論文 参考訳(メタデータ) (2025-05-19T10:40:30Z) - Online Conformal Probabilistic Numerics via Adaptive Edge-Cloud Offloading [52.499838151272016]
本研究は, PLS が生成する HPD 集合を, 長期のカバレッジ要件を保証するため, キャリブレーションする手法を提案する。
提案手法は,クラウドからエッジへの散発的なフィードバックを前提としたオンライン共形予測PLS (OCP-PLS) と呼ばれる。
OCP-PLSの有効性は、カバレッジ、予測セットサイズ、クラウド利用のトレードオフに関する洞察をもたらす実験を通じて検証される。
論文 参考訳(メタデータ) (2025-03-18T17:30:26Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Primal-Dual Contextual Bayesian Optimization for Control System Online
Optimization with Time-Average Constraints [21.38692458445459]
本稿では,制約付き閉ループ制御システムのオンライン性能最適化問題について検討する。
動的最適解に対する線形累積後悔を克服する主元-双対文脈ベイズ最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-12T18:37:52Z) - Improved Online Conformal Prediction via Strongly Adaptive Online
Learning [86.4346936885507]
我々は、強い適応的後悔を最小限に抑える新しいオンライン共形予測手法を開発した。
提案手法は,すべての区間において,ほぼ最適に適応的な後悔を同時に達成できることを実証する。
実験により,本手法は実世界のタスクにおける既存の手法よりも,より優れたカバレッジと予測セットが得られることがわかった。
論文 参考訳(メタデータ) (2023-02-15T18:59:30Z) - Introduction to Online Control [31.67032731719622]
オンラインの非確率制御では、コスト関数と仮定された力学モデルからの摂動の両方が敵によって選択される。
目標は、ベンチマーククラスの政策から見て、最高の政策に対して低い後悔を得ることだ。
論文 参考訳(メタデータ) (2022-11-17T16:12:45Z) - Smoothed Online Combinatorial Optimization Using Imperfect Predictions [27.201074566335222]
本研究では,不完全な予測モデルが利用できる場合のスムーズなオンライン最適化問題について検討する。
有限時間地平線計画に予測を用いることで, 全体の予測不確かさと追加の切り替えコストに依存して, 後悔を招くことを示す。
本アルゴリズムは,合成オンライン分散ストリーミング問題において,他のベースラインと比較して,累積的後悔度が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2022-04-23T02:30:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。