論文の概要: Online Convex Optimization with Binary Constraints
- arxiv url: http://arxiv.org/abs/2005.02274v3
- Date: Fri, 19 Feb 2021 21:00:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 14:44:17.560252
- Title: Online Convex Optimization with Binary Constraints
- Title(参考訳): オンライン凸最適化とバイナリ制約
- Authors: Antoine Lesage-Landry, Joshua A. Taylor, Duncan S. Callaway
- Abstract要約: 2値決定変数と凸損失関数を用いたオンライン最適化について検討する。
我々は、新しいアルゴリズム、バイナリオンライン勾配降下(bOGD)を設計し、その期待された動的後悔を束縛する。
需要応答に基づく複数のシミュレーションでbOGDの性能を検証した。
- 参考スコア(独自算出の注目度): 0.04170934882758551
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider online optimization with binary decision variables and convex
loss functions. We design a new algorithm, binary online gradient descent
(bOGD) and bound its expected dynamic regret. We provide a regret bound that
holds for any time horizon and a specialized bound for finite time horizons.
First, we present the regret as the sum of the relaxed, continuous round
optimum tracking error and the rounding error of our update in which the former
asymptomatically decreases with time under certain conditions. Then, we derive
a finite-time bound that is sublinear in time and linear in the cumulative
variation of the relaxed, continuous round optima. We apply bOGD to demand
response with thermostatically controlled loads, in which binary constraints
model discrete on/off settings. We also model uncertainty and varying load
availability, which depend on temperature deadbands, lockout of cooling units
and manual overrides. We test the performance of bOGD in several simulations
based on demand response. The simulations corroborate that the use of
randomization in bOGD does not significantly degrade performance while making
the problem more tractable.
- Abstract(参考訳): 2値決定変数と凸損失関数によるオンライン最適化を検討する。
我々は,新しいアルゴリズムであるbinary online gradient descent (bogd) を設計し,その期待する動的後悔を限定した。
我々は、任意の時間水平線と有限時間水平線のための特別な境界を保持する後悔のバウンドを提供する。
まず, 連続するラウンド最適追尾誤差の緩和と, 前者の無症状が一定条件下で時間とともに減少する更新の丸め誤差の合計として, 後悔を述べる。
そして、緩和された連続円オプティマの累積変分において、時間的にサブ線形で線型な有限時間境界を導出する。
我々は,二分制約がオン/オフ設定を個別にモデル化するサーモスタティック制御負荷の要求応答に適用する。
また、温度デッドバンド、冷却ユニットのロックアウト、手動オーバーライドに依存する不確実性と負荷の変動をモデル化する。
需要応答に基づく複数のシミュレーションでbOGDの性能を検証した。
シミュレーションは、bogdにおけるランダム化の使用は、問題をより扱いやすいものにしながら、性能を著しく低下させるものではないことを裏付ける。
関連論文リスト
- Trajectory Flow Matching with Applications to Clinical Time Series Modeling [77.58277281319253]
Trajectory Flow Matching (TFM) は、シミュレーションのない方法でニューラルSDEを訓練し、ダイナミックスを通してバックプロパゲーションをバイパスする。
絶対的性能と不確実性予測の観点から,3つの臨床時系列データセットの性能向上を実証した。
論文 参考訳(メタデータ) (2024-10-28T15:54:50Z) - Stochastic Approximation with Delayed Updates: Finite-Time Rates under Markovian Sampling [73.5602474095954]
マルコフサンプリングの遅延更新による近似スキームの非漸近的性能について検討した。
我々の理論的な発見は、幅広いアルゴリズムの遅延の有限時間効果に光を当てた。
論文 参考訳(メタデータ) (2024-02-19T03:08:02Z) - On tracking varying bounds when forecasting bounded time series [0.0]
我々は、有界なランダム変数が時間とともに変化する未観測のバウンダリを持つ新しいフレームワークを考える。
本稿では,オンラインの有界確率推定を行うために,ログライクな推定手法を提案する。
論文 参考訳(メタデータ) (2023-06-23T10:44:49Z) - Online Dynamic Submodular Optimization [0.0]
オンラインバイナリ最適化のための証明可能な性能を持つ新しいアルゴリズムを提案する。
高速な需要応答とリアルタイム分散ネットワーク再構成という2つのパワーシステムアプリケーションでアルゴリズムを数値的にテストする。
論文 参考訳(メタデータ) (2023-06-19T10:37:15Z) - Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル
GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。
本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T15:32:59Z) - Accelerated First-Order Optimization under Nonlinear Constraints [73.2273449996098]
我々は、制約付き最適化のための一階アルゴリズムと非滑らかなシステムの間で、新しい一階アルゴリズムのクラスを設計する。
これらのアルゴリズムの重要な性質は、制約がスパース変数の代わりに速度で表されることである。
論文 参考訳(メタデータ) (2023-02-01T08:50:48Z) - Online Convex Optimization with Stochastic Constraints: Zero Constraint
Violation and Bandit Feedback [0.0]
本稿では,O(sqrtT)$期待後悔とゼロ制約違反を保証できるドリフト・プラス・ペナルティアルゴリズムの変種を提案する。
我々のアルゴリズムは、バニラドリフト・プラス・ペナルティ法とは対照的に、時間地平線の長さが$T$である。
論文 参考訳(メタデータ) (2023-01-26T18:04:26Z) - Adaptivity and Non-stationarity: Problem-dependent Dynamic Regret for Online Convex Optimization [70.4342220499858]
本稿では,スムーズさを生かし,問題依存量による動的後悔のT$への依存を補う新しいオンラインアルゴリズムを提案する。
この結果が本質的な難易度に適応しているのは, 既往の結果よりも厳密であり, 最悪の場合, 同一レートの保護が可能であるからである。
論文 参考訳(メタデータ) (2021-12-29T02:42:59Z) - Delay-Tolerant Constrained OCO with Application to Network Resource
Allocation [44.67787270821051]
マルチスロットフィードバック遅延によるオンライン凸最適化(OCO)を検討します。
エージェントは、時間変動凸損失関数の蓄積を最小限に抑えるために、一連のオンライン決定を行う。
情報フィードバックと意思決定の更新の非同期性に取り組むために,二重正規化による新たな制約ペナルティを用いた遅延耐性制約OCOを提案する。
論文 参考訳(メタデータ) (2021-05-09T19:32:33Z) - Dynamic Regret of Convex and Smooth Functions [93.71361250701075]
非定常環境におけるオンライン凸最適化について検討する。
パフォーマンス指標として動的後悔を選択します。
本研究では, 滑らかさを活かして, 動的後悔をさらに高めることが可能であることを示す。
論文 参考訳(メタデータ) (2020-07-07T14:10:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。